Conceptos que hay que tener claros:
-
¿Qué es un homólogo? ¿Qué diferencia
hay entre "parecido" (similarity) y homología?
-
¿Por qué el parecido en secuencia se pierde antes en la secuencia
de nucleótidos que en la de aminoácidos?
-
¿Qué diferencia hay entre alineamiento global y local? ¿Cuándo
debemos usar uno u otro?
-
¿Por qué comparando pares de secuencias no podemos encontrar
homólogos remotos?
-
¿Qué información sale a la luz cuando hacemos un alineamiento
múltiple?
-
¿Qué es un perfil y por qué permite encontrar homólogos
lejanos?
-
¿Por qué el análisis de secuencias (alineamientos,
búsquedas, predicción de función...) hay que hacerlo
teniendo en cuenta la organización de dominios de las proteínas?
-
¿Por qué a la hora de predecir la función de una proteína
debemos tener en cuenta la clasificación en familias y subfamilias
de los homólogos?
En la práctica debemos saber...
-
Buscar homólogos por métodos sencillos (BLAST) y sofisticados
(PSI-BLAST, hmmpfam).
(teniendo una idea de qué significan los parámetros de
esos programas: matrices de substitución, gap-open, gap-extension,
en qué bases de datos buscar, el e-value...)
-
Hacer un alineamiento múltiple (clustalw, muscle, t-coffee) y ser capaces de visualizarlo
con algún programa como por ejemplo belvu o jalview.
-
Construir un árbol filogenético con métodos de neighbor joining,
máxima verosimilitud y/o métodos bayesianos. Saber determinar si el árbol es
fiable (bootstrapping, contraste de hipótesis, ...)
-
Obtener información de bases de datos como Swiss-Prot y Pfam, por
ejemplo.
-
Analizar la organización de dominios de las proteínas.
-
Dónde podemos encontrar información de interés: COGs,
PFam, InterPro, Swiss-Prot, etcétera.
|