NR
From Centrum Komputerów Dużej Mocy, ICM Uniwersytet Warszawski
| NR w ICM | |
|---|---|
| Produkt: | Baza |
| Producent: | NCBI |
| Licencja: | darmowa do celów akademickich |
| Zainstalowany na: | halo, burza |
| Wersja: | 1.0 |
| Email: | lukas@icm.edu.pl |
| Lista oprogramowania | |
Utrzymywana przez NCBI baza białek pochodzących z wielu źródeł, o ujednoliconej numeracji (GeneIdentification number (gi)). Baza jest aktualizowana co tydzień. Lokalna kopia bazy danych jest przygotowywana do przeszukiwania pakietem PSI-BLAST oraz pisanymi przez urzytkowników programami operującymi na plikach płaskich. Dodatkow w ramach redukcji dublujących się danych, redukcji przeszukawań do trafień istotnie różnych baza jest grupowana po identyczności sekwencji na poziomach 90% i 70%.
Lokalizacja
*/opt/seqdb
Pliki
*nr.fa - oryginalny plik z całą bazą danych, *nr_90.fa - białka pogrupowane na poziomie 90% identyczności sekwencji, *nr_90.fa.clstr - imformacje o zawartości grup, *nr_70.fa - białka pogrupowane na poziomie 70% identyczności sekwencji, *nr_70.fa.clstr - imformacje o zawartości grup.
Aktualizacje
Bazy są aktualizowane w poniedziałki rano.
