Programa teórico

  1. Introducción a la computación
    • Qué es información. Información en biología.
    • Representación de la información.
    • Algoritmos: qué es un algoritmo?. Tipos de algoritmos.
    • Estructuras de datos.
  2. Introducción al aprendizaje automático
    • Aprender ... aprender qué?
    • Entrenamientos supervisados y no supervisados.
    • Muestras de entrenamiento y prueba
    • Sesgo. Interpretación de resultados
    • Redes neuronales, vecino más cercano, Hidden Markov Models, algoritmos genéticos
  3. Información biológica en formato electrónico
    • Introducción a las bases de datos
    • Colecciones, bases de datos: formatos
    • Acceso a colecciones y bases de datos online
    • Búsquedas avanzadas
  4. Comparación de secuencias de a pares
    • Alineamientos globales y locales. Algoritmos: Smith-Waterman, Needleman-Wunsch.
    • Métodos para el alineamiento de secuencias: dot matrix, dynamic programming.
    • Matrices de scoring
  5. Comparación de secuencias: alineamientos múltiples
    • Alineamiento múltiple de secuencias
    • Métodos: progresivos, iterativos, otros.
    • Alineamientos localizados: profiles, blocks, patterns
    • Búsquedas de secuencias similares en bases de datos: búsquedas con secuencias, con patterns, con profiles o matrices de scoring, con HMMs
  6. ab initio gene prediction (gene finding)
    • Estructura de genes procarióticos y eucarióticos
    • Estrategias de predicción y métodos: neural networks, HMMs, pattern discrimination
    • Ejemplos: Glimmer, Genscan, FGENESH
  7. Análisis y clasificación estructural de proteínas
    • Clasificación de proteínas en base a secuencia. Bases de datos: Pfam, PROSITE, ProDom, SMART, InterPro, COGs.
    • Predicción de estructura secundaria
    • Alineamientos estructurales
    • Clasificación estructural: bases de datos: SCOP, CATH, FSSP
    • Predicción de estructura terciaria. Modelado.
  8. Análisis de genomas
    • Secuencias automáticas y construcción de contigs: phred-phrap-consed
    • Anotación de genomas: métodos y estrategias. Anotación automatizada vs anotación manual.
    • Recursos online: ENSEMBL, NCBI, UCSC, TIGR
    • Chromosome browsers
    • Comparative genome analysis
  9. Final: discusión breve sobre temas no incluídos en el programa
    • Microarrays, proteomics, metabolomics
    • Reconstrucción filogenética
    • Systems biology: tendencias futuras en bioinformática y biología


Programa práctico

  1. Uso avanzado de Entrez
    • Term mapping, truncation, phrase searching
    • descriptores y tags
    • Límites, Indices
    • Búsquedas avanzadas: subject, phrase, range
    • Operadores lógicos: AND, OR, NOT
    • Uso de vocabularios controlados: MeSH
  2. Introducción al sistema operativo Unix
    • Qué es Unix
    • Introducción a la línea de comando: stdin, stderr, stdout
    • Comandos básicos para trabajar sobre archivos y directorios
    • Redireccionamiento y pipes
    • Algunos comandos útiles: find, grep, sort, mail
  3. Alineamientos de a pares
    • Dot-plots
    • Calculo de alineamientos globales y locales en papel utilizando los algoritmos de Needleman-Wunsch y Smith-Waterman
    • Comparación de distintos sistemas de scoring sobre el resultado de los alinemientos
  4. Búsqueda de secuencias en bases de datos: BLAST, FASTA
    • Uso de BLAST en la línea de comando: ventajas
    • Preparación de una base de datos local: formatdb
    • Recuperación de secuencias a partir de una base de datos de BLAST: fastacmd
    • BLAST contra una base de datos local: blastall
    • BLAST contra bases de datos remotas (NCBI): blastcl3
  5. EMBOSS: European Molecular Biology Open Software Suite
    • Qué es EMBOSS
    • Manejo de secuencias con EMBOSS: showdb, seqret, infoseq
    • Alineamiento de secuencias: dotplot, needle, water
    • Pattern matching: patmatmotifs
    • Protein fingerprints: pscan
    • Alineamiento multiple de secuencias: emma, prettyplot
    • Profiles: prophecy, prophet
  6. Profile Hidden Markov Models: HMMER
    • Qué es HMMER
    • Construcción de un HMM a partir de un alineamiento múltiple: hmmbuild
    • Búsqueda en una colección de secuencias: hmmsearch
    • Búsqueda en una colección de HMMs: hmmpfam