¡Bienvenidos a la primer entrada del blog del Servicio de Secuenciación y Bioinformática del FISABIO! Estamos muy ilusionados por embarcarnos en esta nueva aventura, a través de este blog queremos daros a conocer noticias interesantes relacionadas con nuestro trabajo. Uno de nuestros mayores compromisos como servicio es ayudar a nuestros usuarias y usuarios a entender y escoger las mejores plataformas para vuestras necesidades de secuenciación, así como a explorar todos los análisis bioinformáticos posibles, dado que ofrecemos tanto análisis estándar como personalizados.
Para darnos a conocer mejor, esta primera entrada al blog será una presentación, por un lado describiremos qué es la secuenciación masiva y por otro os comentaremos las plataformas con las que actualmente contamos en el Servicio.
Básicamente, la secuenciación masiva reúne un conjunto de métodos y protocolos bioquímicos para determinar la secuencia de los cuatro componentes básicos del ADN (la adenina, timina, citosina y guanina) o ARN (adenina, uracilo, citosina y guanina) de un gen, un amplicón, un genoma, y/o de material genético de cualquier ecosistema que sea de nuestro interés. Una de las maravillas de estas metodologías es que nos permiten descifrar la información genética desde una única célula, hasta comunidades muy complejas.
Estas tecnologías tienen muchas aplicaciones, entre las cuales destacamos el ensamblaje de novo de genomas, el ensamblaje asistido basándonos en un genoma de referencia, el genotipado de variantes con base en una referencia, estudios funcionales (transcriptoma), la descripción de comunidades microbiana o de hongos de un ecosistema (metataxonomía), la metagenómica y la metatranscriptómica.
Hasta el momento las tecnologías más utilizadas han sido las llamadas de segunda generación o Next Generation Sequencing, por comparación con la secuenciación Sanger de primera generación. Estas técnicas de segunda generación se caracterizan por producir una gran cantidad de datos de salida en tiempos muy cortos y costes muy contenidos con respecto al método de Sanger. Todo ello conseguido gracias a la paralelización de las reacciones de secuenciación. Su principal defecto hasta el momento ha sido el corto tamaño de los fragmentos que se pueden secuenciar y que la amplificación clonal a la que se someten estos fragmentos previamente a ser secuenciados introduce sesgos considerables. Para evitar estos problemas, se ha desarrollado una tercera generación de secuenciadores con nuevas técnicas mucho más sensibles de detección que evitan la amplificación clonal necesaria en la segunda generación, sumando además la posibilidad de secuenciar fragmentos considerablemente más largos.
A continuación describiremos los secuenciadores disponibles en FISABIO.
Secuenciadores de segunda generación
Contamos con varios secuenciadores de tecnología Illumina, concretamente los modelos MiSeq y NextSeq500. La diferencia entre ambos reside en el tamaño máximo del fragmento a amplificar y en el output máximo de salida de datos, siendo de 2x300pb y un máximo de 15 Gigabases ó 25 millones de lecturas para el MiSeq y de 2x150pb y 120 Gigabases ó 400 millones de lecturas para el NextSeq.
Para una guía completa de todos los protocolos de secuenciación y las aplicaciones que ofrece Illumina tanto para ADN como ARN, podeis entrar al siguiente enlace. Si tenéis algún interés particular, podéis contactarnos para hablar de las especificaciones que necesitéis.
Si bien existen cientos de aplicaciones de métodos de secuenciación y análisis, en nuestro servicio los abordajes con las plataformas de Illumina más comunes son:
- Secuenciación de amplicones. Por ejemplo tanto aplicaciones relacionadas con la biomedicina como con la microbiología estudiando la diversidad de los fragmentos amplificados.
- Secuenciación de genomas completos. Podemos obtener el genoma completo tanto de bacterias y virus como de pequeños eucariotas (levaduras, ...)
- Resecuenciación de genomas completos. Por ejemplo para genotipificar variantes, una herramienta de mucha importancia en la epidemiología molecular.
- Secuenciación de transcriptomas. Nos permite conocer las funciones que se expresan en un momento determinado, o para conocer el conjunto total de RNAs en una muestra.
- Secuenciación de metagenomas. Donde exploramos los genomas bacterianos en una muestra representativa del ambiente.
- Secuenciación de metatranscriptomas. Nos proporciona los perfiles de actividad funcional en muestras complejas.
- Secuenciación de miRNAs, siRNA y otros pequeños RNAs. Especialmente para el estudio de la regulación postranscripcional de la expresión génica.
- Paneles de genes. Útil con genomas conocidos, donde se diseñan paneles para amplificar genes específicos a alta resolución, donde se pueden distinguir fácilmente mutaciones, aún aquellas de baja frecuencia.
Secuenciadores de tercera generación
En FISABIO contamos con dos plataformas de esta generación:
Oxford Nanopore MinION
Es una tecnología basada en la creación de poros artificiales de membrana por los cuales se hace pasar la secuencia del ácido nucleico a secuenciar. La determinación de la secuencia se basa en la medición de los cambios de corriente eléctrica entre las dos caras de la membrana en la que se encuentra inmovilizado el poro. La mayor ventaja de esta tecnología radica en su miniaturización y en su rapidez (produce datos en tiempo real). Esto nos permite dos cosas, por un lado que sea totalmente transportable al tener el tamaño de un pen drive (sólo en algunos de sus modelos) y conectarse directamente a cualquier ordenador por medio de un puerto USB. Y por otro, que sea idóneo para la detección inmediata de organismos patógenos in-situ o en aplicaciones en las cuales el tiempo de respuesta sea un factor vital. Aunque aún presenta valores de calidad de secuencia inferiores a los de otras plataformas, este hecho puede ser solventado mediante su combinación con secuencias procedentes de la tecnología illumina.
Pacific Biosciences PacBio Sequel II
Se basa en la lectura de la fluorescencia emitida durante la síntesis de DNA por parte de una polimerasa inmovilizada al centro de un pocillo microscópico. Los nucleótidos que se van incorporando al ADN molde, según su tipo (A, T, G o C), emiten luz fluorescente de diferentes colores. De esta manera se secuencia una única molécula por pocillo en tiempo real (Single Molecule Real Time, SMRT). Las secuencias que obtenemos del Sequel II tienen una longitud que va desde las 4000 pb, hasta extremos de 500,000 pb, en un tiempo máximo de 90 horas. Los nuevos secuenciadores de PacBio (serie Sequel) ha logrado erradicar el problema de la baja calidad, históricamente típico de los secuenciadores de tercera generación, presentando un nuevo método llamado Hi-Fi en este secuenciador, donde la misma molécula es secuenciada varias veces de manera circular generando un consensus de alta calidad autocorregido (secuenciación CCS).
Las aplicaciones aconsejadas para esta plataforma solapan con las mencionadas previamente para Illumina, con algunas mejoras: la secuenciación de genomas completos puede ser de cualquier tamaño y naturaleza, tanto procariotas como eucariotas. También, se aconseja su uso para la búsqueda de variantes estructurales complejas; la descripción de comunidades microbianas y de hongos en un ecosistema por medio de la secuenciación de los genes ribosomales completos (16S, 18S, incluyendo hasta los operones ribosomales completos), u otros amplicones de interés; la metagenómica y la transcriptómica.
Esperamos que os haya sido de interés esta entrada. Próximamente os presentaremos con detalle los servicios bioinformáticos que ofrecemos, así como notícias sobre nuevas tecnologías y plataformas emergentes, sin olvidarnos de tutoriales prácticos para aquellas y aquellos que querais aprender más bioinformática y analizar vuestras propias secuencias.
Si tenéis alguna duda o comentario, ¡no dudéis en escribirnos! También si tenéis ideas sobre lo que queréis ir leyendo en nuestro blog. Estaremos encantados de escucharos y contestaros.