ALGORITMOS DE COMPARACIÓN DE SECUENCIAS

FastA

El Algoritmo FastA

Bibliografía

Por  Pilar Eugenia Corredor (Bióloga)

Gina Gutiérrez (Lic. en Biología)

El algoritmo FASTA para búsqueda de secuencias se basa en el método desarrollado por Pearson & Lipman. En el procedimiento se analizan parejas de secuencias para aquellos segmentos que presentan las mejores uniones, las uniones significativas se seleccionan con base en un umbral mínimo de similitud (threshold).

Conceptualmente el procedimiento se asimila a la búsqueda de diagonales significativas en un "dot-plot" de dos secuencias, en donde cada coordenada de la secuencia es comparada con sus elementos similares a lo largo de la otra secuencia. En el primer paso, la búsqueda en la base de datos encuentra aquellas secuencias que contienen el mayor número de alineamientos perfectos de secuencias cortas o palabras, con la secuencia query. Los score del alineamiento para toda la secuencia son reevaluados por alineamiento de las secuencias que rodean a las palabras que poseen los valores altos de score, previamente seleccionadas en el primer paso. La velocidad y sensibilidad de la búsqueda están determinadas por la longitud de la palabra usada en el primer paso. Entre más corta se seleccione la palabra inicial, la búsqueda se hace más lenta y sensitiva.

El usuario puede seleccionar la matrix de substitución que usará, así como las penalidades dadas a los gap y la longitud de la palabra, esta última mediante el parámetro ktup. Para proteínas un ktup de 2 puede hacer la búsqueda rápida y generar resultados más sensibles que los obtenidos con BLAST. Para DNA se utilizan palabras más largas, pero generalmente el valor de ktup utilizado es de 6.

Información adicional puede encontrarse en las siguientes direcciones:

http://www2.ebi.ac.uk/fasta3/

ftp://ftp.virginia.edu/pub/fasta

http://barton.ebi.ac.uk/barton/papers/rev97_l/subsection3_7_7.html/

.:: Centro de Bioinformática del Instituto de Biotecnología ::.

| Quienes somos | Documentos | Cursos | Contacto |

Sansom, C. 2000. Database searching with DNA and protein sequences: An introduction. Briefings in Bioinformatics Vol 1(1): 22-32.
Altschul, S.F. 1998. Fundamentals of database searching. Trends Guide of Bioinformatics.
Brenner, S.E. 1998. Practical database searching. Trends Guide of Bioinformatics.