[go: up one dir, main page]

Vés al contingut

Format FASTA

De la Viquipèdia, l'enciclopèdia lliure
(S'ha redirigit des de: FASTA format)
Infotaula de format de fitxerFormat FASTA
Tipusformat de fitxer i textual data format (en) Tradueix Modifica el valor a Wikidata
Extensiófasta i fa Modifica el valor a Wikidata
MIMEtext/plain, chemical/seq-aa-fasta i chemical/seq-na-fasta Modifica el valor a Wikidata
DesenvolupadorDavid J. Lipman i William Raymond Pearson (en) Tradueix Modifica el valor a Wikidata
Versió inicial1985 Modifica el valor a Wikidata
Més informació
Wiki del format de fitxerFASTA_and_FASTQ Modifica el valor a Wikidata

En bioinformàtica, el format FASTA és un format de fitxer en text per a la representació de seqüències tant nucleotídiques com peptídiques, en què els nucleòtids i els aminoàcids es representen usant un codi d'una sola lletra. Aquest format[1] també permet que les seqüències estiguin encapçalades pel nom de la seqüència o comentaris. El format FASTA es va originar pel paquet de software FASTA, però avui en dia és un estàndard en el camp de la bioinformàtica.

La simplicitat del format FASTA fa que sigui fàcil manipular les seqüències usant eines de processament de text i llenguatges script com ara Python, Ruby o Perl.


Una seqüència en format FASTA comença amb una capçalera de descripció d'una sola línia amb el símbol '>' al principi. La paraula que en segueix, que no ha de tenir espais, acostuma a ser l'identificador de la seqüència. Per altra banda, l'NCBI defineix un estàndard d'identificadors únics en aquesta capçalera de descripció,[2] que programes com el makeblastdb del BLAST utilitzen per indexar fitxers amb múltiples seqüències.

És habitual que la seqüència biològica que en segueix contingui només vuitanta caràcters per línia.

>gi|31563518|ref|NP_852610.1| microtubule-associated proteins 1A/1B light chain 3A isoform b [Homo sapiens]
MKMRFFSSPCGKAAVDPADRCKEVQQIRDQHPSKIPVIIERYKGEKQLPVLDKTKFLVPDHVNMSELVKI
IRRRLQLNPTQAFFLLVNQHSMVSVSTPIADIYEQEKDEDGFLYMVYASQETFGF

L'extensió de fitxer que conté les seqüències acostuma a ser: .fa, .fasta o variacions similars.

Vegeu també

[modifica]

Enllaços externs

[modifica]

Referències

[modifica]
  1. «Query Input and database selection - NCBI BLAST» (en anglès). [Consulta: 27 febrer 2015].
  2. «FASTA sequence ID format values» (en anglès). [Consulta: 27 febrer 2015].