Views

NR

From Centrum Komputerów Dużej Mocy, ICM Uniwersytet Warszawski

Jump to: navigation, search
NR w ICM
Produkt: Baza
Producent: NCBI
Licencja: darmowa do celów akademickich
Zainstalowany na: halo, burza
Wersja: 1.0
Email: lukas@icm.edu.pl
Lista oprogramowania

Utrzymywana przez NCBI baza białek pochodzących z wielu źródeł, o ujednoliconej numeracji (GeneIdentification number (gi)). Baza jest aktualizowana co tydzień. Lokalna kopia bazy danych jest przygotowywana do przeszukiwania pakietem PSI-BLAST oraz pisanymi przez urzytkowników programami operującymi na plikach płaskich. Dodatkow w ramach redukcji dublujących się danych, redukcji przeszukawań do trafień istotnie różnych baza jest grupowana po identyczności sekwencji na poziomach 90% i 70%.

Lokalizacja

   */opt/seqdb


Pliki

   *nr.fa - oryginalny plik z całą bazą danych,
   *nr_90.fa - białka pogrupowane na poziomie 90% identyczności sekwencji,
   *nr_90.fa.clstr - imformacje o zawartości grup,
   *nr_70.fa - białka pogrupowane na poziomie 70% identyczności sekwencji,
   *nr_70.fa.clstr - imformacje o zawartości grup.

Aktualizacje

Bazy są aktualizowane w poniedziałki rano.