Laboratorio de Investigación en Esclerosis Lateral Amiotrófica (ELA), Unidad de ELA, Servicio de Neurología, Hospital Universitario 12 de Octubre, Madrid
A pesar de que el diagnóstico de la esclerosis lateral amiotrófica (ELA) sigue siendo eminentemente clínico y que no existe ninguna prueba de laboratorio que mejore en precisión ni rapidez este diagnóstico, sí que es muy útil realizar algunas pruebas tanto para un posible diagnóstico diferencial en la evolución del paciente como para realizar un consejo genético familiar adecuado.
El panorama genético en la enfermedad de la ELA se ha ido ampliando a medida que se han mejorado las técnicas de secuenciación y, a su vez, se ha ligado a otras enfermedades neurodegenerativas como la demencia frontotemporal (DFT).
SOD1
C9orf72SOD1TARDBPFUS(Figura 1)
Es importante indicar que solamente entre el 5 y el 10% de los casos de ELA tienen un componente hereditario (ELAf), mientras que el resto se consideran casos de ELAe.
SOD1SOD1
SOD1
Se han descrito más de 50 mutaciones diferentes, casi todas las variantes son de cambio de aminoácido (missense), mostrando un patrón de herencia autosómico dominante.
La gran mayoría de las mutaciones son sustituciones de aminoácidos, autosómicas dominantes y se encuentran en el exón 15, que codifica el extremo C-terminal de la proteína, y el resto son mutaciones que cambian el marco de lectura (frameshift) o de terminación temprana de la traducción (nonsense).
(Tablas 1 y 2)
En el caso del estudio de la presencia de la ER del hexanucleótido GGGGCC en el intrón 1 del gen C9orf72, se lleva a cabo una triple PCR o repeat-primed PCR. El método de la triple PCR es un sistema rápido y preciso de separar las muestras que portan la expansión patogénica de la repetición (≥ 30 repeticiones) de los que portan el alelo de referencia (≤ 20 repeticiones). Este ensayo de PCR utiliza un cebador flanqueante específico marcado con fluorescencia (P1) junto con un par de cebadores (P2, P3), que comparten una secuencia 5’ común (cola). Los criterios de selección para la secuencia del cebador de anclaje (P2) son que debe contener poca o ninguna complementariedad consigo mismo, no tener complementariedad (GCA)5’, (TGC)5’ o (GGGGCC)5’, y no tener homología con secuencias humanas conocidas. El cebador reverso (P3) tiene la secuencia (GGGGCC)5’ en su extremo 3’ en función de la hebra de la repetición a amplificar (Tabla 3).
Los resultados de las secuencias obtenidas de los pacientes se comparan con las secuencias de referencia proporcionadas por las bases de datos internacionales como Ensembl Genome Browser o el Gen-Bank del National Center for Biotechnology Information (NCBI).
Este protocolo de secuenciación Sanger se aplica para el análisis de los genes tradicionalmente ligados a la ELA y la DFT, como son SOD1, TARDBP, FUS, MAPT, GRN, VCP y SETX. También se utiliza para confirmar las variantes potencialmente patogénicas encontradas por secuenciación masiva (next generation sequencing –NGS–) en los pacientes, así como para comprobar la posible cosegregación de la variante en los casos de los que se disponga de ADN procedente de otros miembros de la familia. Por último, en caso de obtener una baja cobertura para algún exón mediante alguna de las técnicas de secuenciación masiva aplicadas para cualquiera de los pacientes, también se procede de igual manera.
Hasta hace unos años, la primera aproximación de NGS utilizada era la secuenciación masiva dirigida a través del diseño y la puesta a punto de un panel génico que permite una secuenciación costo-efectiva de una batería amplia de genes relacionados con la ELA y la DFT (un ejemplo de los genes elegidos hace unos años se puede ver en la Tabla 4).
Las dos tecnologías más utilizadas en panel génico han sido la tecnología basada en amplicones llamada TruSeq Custom Amplicon® (TSCA, Illumina) y la considerada como gold standard SureSelect® (Agilent). La cobertura media debe ser de 300 X para asegurarnos una cobertura mínima media de 100 X y que tenga una fiabilidad clínica aceptable. Cuando se diseña un panel génico es importante asegurarse de cubrir todas las regiones codificantes de los exones, las regiones UTR (5’ y 3’) y además incluir sitios de flanqueamiento intrónico de 25 pb con el fin de cubrir zonas de corte y empalme del ARN (splicing) adyacentes. Además, también es importante evitar polimorfismos en el diseño de los cebadores.
La plataforma de secuenciación más común para un panel génico es MiSeq® (Illumina), que dispone del software MiSeq Reporter® (Illumina) que puede hacer un primer análisis de los datos crudos de secuenciación.
Actualmente, la aproximación de NGS más utilizada y considerada más costo-efectiva es la secuenciación del exoma, también conocida por sus siglas en inglés WES (whole exome sequencing). En este caso, se trata de la secuenciación de todas las secuencias codificantes del genoma, así como las regiones UTR (5’ y 3’) y regiones de flanqueamiento para asegurar la inclusión de posibles zonas genómicas que contengan sitios de splicing.
softwares
Como datos de calidad de la secuenciación realizada por este método, es necesario comprobar que la calidad de lectura Q30 sea superior a 90 de media, así como comprobar que la cobertura mínima y media cumplen con los criterios de diseño. Pueden existir regiones más propensas a tener una cobertura inferior a la adecuada por la existencia de secuencias muy repetitivas o de secuencias con poliG, C, T o A.
Por último, es muy importante la forma de analizar el archivo que contiene todas las variantes y la información que se puede emplear para seleccionar la existencia de variantes de interés. Se dispone de multitud de herramientas como son los predictores de patogenicidad in silico, los datos de conservación en la escala filogenética de cada residuo, los predictores de variación en la estructura terciaria o cuaternaria de la proteína, la frecuencia poblacional genética y alélica en distintas subpoblaciones mundiales en distintas bases de datos poblacionales, etc.
La definición de todas las características necesarias para que una variante sea realmente interesante debe ser decidida por una persona con criterio y experiencia en el campo, y al conjunto de esta estrategia es a lo que se denomina pipeline.
Un ejemplo de pipeline real:
En los casos en los que se encuentran variantes consideradas patogénicas o probablemente patogénicas, se procede a su validación mediante secuenciación Sanger y, además, en los casos en los que es posible disponer de muestras de otros miembros de la familia, se realiza un análisis de cosegregación.
La ventaja que ofrece la WES sobre el panel génico personalizado es que la cantidad de genes analizados es muy superior, además de la capacidad de reanálisis futuro ante un nuevo descubrimiento genético en la patología. A su vez, es importante indicar que una vez que se ha realizado la secuenciación del exoma completo se puede realizar una “panelización” de este para no incluir hallazgos de variantes accidentales que se salgan de la patología de estudio. Es decir, podemos analizar solamente los genes de interés real, así como genes de enfermedades miméticas o relacionadas. En el caso de un estudio de exoma completo de un paciente con ELA, lo más común es incluir una búsqueda de variantes en todos los genes que también puedan estar presentes en otras demencias, en la enfermedad de Alzheimer, en la enfermedad de Parkinson, en distintos tipos de paraparesias, Charcot-Marie-Tooth y atrofia muscular espinal.
Para que se pueda visualizar de manera más clara la diferencia en el número de genes empleados, se señalan en azul en la Tabla 5 los genes que estaban incluidos en el panel génico.
Por el contrario, el mayor inconveniente de la utilización sistemática de la secuenciación exómica es la aparición de un número muy grande de variantes de significado incierto (variant of uncertain significance –VUS–).