LECCIÓN

3

1

MÓDULO

4

Biomarcadores en la esclerosis lateral amiotrófica: laboratorio
Dr. Daniel Borrego Hernández

Laboratorio de Investigación en Esclerosis Lateral Amiotrófica (ELA), Unidad de ELA, Servicio de Neurología, Hospital Universitario 12 de Octubre, Madrid

1. Estudios de diagnóstico

A pesar de que el diagnóstico de la esclerosis lateral amiotrófica (ELA) sigue siendo eminentemente clínico y que no existe ninguna prueba de laboratorio que mejore en precisión ni rapidez este diagnóstico, sí que es muy útil realizar algunas pruebas tanto para un posible diagnóstico diferencial en la evolución del paciente como para realizar un consejo genético familiar adecuado.

1.1. Genética

El panorama genético en la enfermedad de la ELA se ha ido ampliando a medida que se han mejorado las técnicas de secuenciación y, a su vez, se ha ligado a otras enfermedades neurodegenerativas como la demencia frontotemporal (DFT).

Aunque la identificación de SOD1 como primer gen ligado inicialmente a la ELA familiar fue en 1991 Siddique T, Figlewicz DA, Pericak-Vance MA, Haines JL, Rouleau G, Jeffers AJ, et al. Linkage of a gene causing familial amyotrophic lateral sclerosis to chromosome 21 and evidence of genetic-locus heterogeneity. N Engl J Med. 1991 May 16;324(20):1381-4. Erratum in: N Engl J Med 1991 Aug 15;325(7):524. Erratum in: N Engl J Med 1991 Jul 4;325(1):71. [Pubmed][1]       , el descubrimiento de nuevos genes asociados ha sido paulatino hasta la actualidad.

Los genes más relevantes en la ELA por número de casos implicados son C9orf72, SOD1, TARDBP y FUS. La suma de estos 4 genes representa aproximadamente el 60% de las ELA familiares (ELAf) y el 15% de los casos de ELA esporádica (ELAe), mientras que las mutaciones en otros genes se encuentran en menos o igual al 1% de los pacientes Renton AE, Chiò A, Traynor BJ. State of play in amyotrophic lateral sclerosis genetics. Nat Neurosci. 2014 Jan;17(1):17-23. [Pubmed][2]       Corcia P, Couratier P, Blasco H, Andres CR, Beltran S, Meininger V, Vourc'h P. Genetics of amyotrophic lateral sclerosis. Rev Neurol (Paris). 2017 May;173(5):254-62. [Pubmed][3]        (Figura 1).

Es importante indicar que solamente entre el 5 y el 10% de los casos de ELA tienen un componente hereditario (ELAf), mientras que el resto se consideran casos de ELAe.

  • SOD1. Como se ha comentado anteriormente, el primer gen identificado en esta patología fue SOD1, describiéndose 11 mutaciones en 1993 Rosen DR, Siddique T, Patterson D, Figlewicz DA, Sapp P, Hentati A, et al. Mutations in Cu/Zn superoxide dismutase gene are associated with familial amyotrophic lateral sclerosis. Nature. 1993 Mar 4;362(6415):59-62. Erratum in: Nature. 1993 Jul 22;364(6435):362. [Pubmed][4]       . El gen SOD1 codifica por la superóxido dismutasa de Cu/Zn, una enzima citoplasmática cuya función es la transformación de los radicales superóxido.

En la actualidad se han descrito más de 180 mutaciones en este gen. La mayoría de los cambios afectan a residuos de SOD1 que están altamente conservados filogenéticamente Bewley GC. Nucleic Acids Research. Nucleic Acids Res. 2016;44(1):i–i.[5]       , lo que sugiere que esos sitios son importantes para la función de SOD1.

La mayoría de las mutaciones muestran un patrón de herencia autosómica dominante con alta penetrancia. Una excepción notable es la que representa la variante p.D90A (p.D91A en el actual sistema de numeración), la cual presenta herencia recesiva en la población escandinava pero dominante en el resto del mundo Robberecht W, Aguirre T, Van den Bosch L, Tilkin P, Cassiman JJ, Matthijs G. D90A heterozygosity in the SOD1 gene is associated with familial and apparently sporadic amyotrophic lateral sclerosis. Neurology. 1996 Nov;47(5):1336-9. [Pubmed][6]       . También se han descrito variantes, como la p.G16S, con asociación a formas juveniles Kawamata J, Shimohama S, Takano S, Harada K, Ueda K, Kimura J. Novel G16S (GGC-AGC) mutation in the SOD-1 gene in a patient with apparently sporadic young-onset amyotrophic lateral sclerosis. Hum Mutat. 1997;9(4):356-8. [Pubmed][7]       . La razón de por qué una mutación en SOD1 puede ser selectivamente dañina en neuronas motoras es aún desconocida, dado que este gen está ampliamente expresado y conservado Crapo JD, Oury T, Rabouille C, Slot JW, Chang LY. Copper,zinc superoxide dismutase is primarily a cytosolic protein in human cells. Proc Natl Acad Sci U S A. 1992 Nov 1;89(21):10405-9. [Pubmed][8]       .

  • TARDBP. En 2006, se identificó la proteína TAR de unión a ADN de 43 kDa (TDP-43) como el componente principal en las inclusiones citoplasmáticas ubiquitinadas en la ELA y como la característica neuropatológica más importante de la enfermedad Neumann M, Sampathu DM, Kwong LK, Truax AC, Micsenyi MC, Chou TT, et al. Ubiquitinated TDP-43 in frontotemporal lobar degeneration and amyotrophic lateral sclerosis. Science. 2006 Oct 6;314(5796):130-3. [Pubmed][9]       . Tras este descubrimiento, las mutaciones en el gen TARDBP (que codifica para TDP-43) se relacionaron con casos de ELAf y ELAe Kabashi E, Valdmanis PN, Dion P, Spiegelman D, McConkey BJ, Vande Velde C, et al. TARDBP mutations in individuals with sporadic and familial amyotrophic lateral sclerosis. Nat Genet. 2008 May;40(5):572-4. [Pubmed][10]          Sreedharan J, Blair IP, Tripathi VB, Hu X, Vance C, Rogelj B, et al. TDP-43 mutations in familial and sporadic amyotrophic lateral sclerosis. Science. 2008 Mar 21;319(5870):1668-72. [Pubmed][11]         .

Se han descrito más de 50 mutaciones diferentes, casi todas las variantes son de cambio de aminoácido (missense), mostrando un patrón de herencia autosómico dominante.

  • FUS. Las mutaciones en FUS se identificaron tras un estudio de ligamiento que indicó la región genómica 16q11.2. Posteriormente, gracias al hallazgo de TARDBP como causa genética de la enfermedad, se estudió FUS por las similitudes estructurales de las proteínas por las que codifican estos genes, describiéndose 14 mutaciones en 17 familias de origen británico y americano Kwiatkowski TJ Jr, Bosco DA, Leclerc AL, Tamrazian E, Vanderburg CR, Russ C, et al. Mutations in the FUS/TLS gene on chromosome 16 cause familial amyotrophic lateral sclerosis. Science. 2009 Feb 27;323(5918):1205-8. [Pubmed][12]          Vance C, Rogelj B, Hortobágyi T, De Vos KJ, Nishimura AL, Sreedharan J, et al. Mutations in FUS, an RNA processing protein, cause familial amyotrophic lateral sclerosis type 6. Science. 2009 Feb 27;323(5918):1208-11. [Pubmed][13]         .

La gran mayoría de las mutaciones son sustituciones de aminoácidos, autosómicas dominantes y se encuentran en el exón 15, que codifica el extremo C-terminal de la proteína, y el resto son mutaciones que cambian el marco de lectura (frameshift) o de terminación temprana de la traducción (nonsense).

Las mutaciones de novo de FUS, como es el caso de la p.P525L, también son responsables de una parte de los casos esporádicos y juveniles de ELA Bäumer D, Hilton D, Paine SM, Turner MR, Lowe J, Talbot K, Ansorge O. Juvenile ALS with basophilic inclusions is a FUS proteinopathy with FUS mutations. Neurology. 2010 Aug 17;75(7):611-8. [Pubmed][14]         .

  • C9ORF72. En 2011, la realización de un GWAS (genome-wide association studies) de pacientes fineses con ELA identificó un locus en el cromosoma 9p21, que estaba presente en más del 40% de los casos de ELAf y en aproximadamente el 25% de todos los casos de ELA Van Es MA, Veldink JH, Saris CGJ, Blauw HM, Van Vught PWJ, Birve A, et al. Genome-wide association study identifies 19p13.3 (UNC13A) and 9p21.2 as susceptibility loci for sporadic amyotrophic lateral sclerosis. Nat Genet. 2009 Oct;41(10):1083-7. [Pubmed][15]          Laaksovirta H, Peuralinna T, Schymick JC, Scholz SW, Lai SL, Myllykangas L, et al. Chromosome 9p21 in amyotrophic lateral sclerosis in Finland: a genome-wide association study. Lancet Neurol. 2010 Oct;9(10):978-85. [Pubmed][16]         . Estudios posteriores identificaron el haplotipo finés en otras poblaciones europeas Shatunov A, Mok K, Newhouse S, Weale ME, Smith B, Vance C, et al. Chromosome 9p21 in sporadic amyotrophic lateral sclerosis in the UK and seven other countries: a genome-wide association study. Lancet Neurol. 2010 Oct;9(10):986-94. Erratum in: Lancet Neurol. 2011 Mar;10(3):205. [Pubmed][17]          Morgan S, Shatunov A, Sproviero W, Jones AR, Shoai M, Hughes D, et al. A comprehensive analysis of rare genetic variation in amyotrophic lateral sclerosis in the UK. Brain. 2017 Jun 1;140(6):1611-8. [Pubmed][18]           y determinaron que surgió de una sola mutación fundadora Laaksovirta H, Peuralinna T, Schymick JC, Scholz SW, Lai SL, Myllykangas L, et al. Chromosome 9p21 in amyotrophic lateral sclerosis in Finland: a genome-wide association study. Lancet Neurol. 2010 Oct;9(10):978-85. [Pubmed][16]         . La causa del resultado del GWAS fue identificada como una expansión de una repetición (ER) de hexanucleótidos localizada entre los primeros exones no codificantes (denominados 1a y 1b) Renton AE, Majounie E, Waite A, Simón-Sánchez J, Rollinson S, Gibbs JR, et al. A hexanucleotide repeat expansion in C9ORF72 is the cause of chromosome 9p21-linked ALS-FTD. Neuron. 2011 Oct 20;72(2):257-68. [Pubmed][19]          DeJesús-Hernández M, Mackenzie IR, Boeve BF, Boxer AL, Baker M, Rutherford NJ, et al. Expanded GGGGCC hexanucleotide repeat in noncoding region of C9ORF72 causes chromosome 9p-linked FTD and ALS. Neuron. 2011 Oct 20;72(2):245-56. [Pubmed][20]         .

En estudios posteriores, la frecuencia de la expansión fue evaluada en 17 regiones alrededor del mundo, incluyendo países europeos, diferentes poblaciones étnicas en Estados Unidos, en países asiáticos, Australia, en el Medio Oriente y en las islas del Pacífico Majounie E, Renton AE, Mok K, Dopper EG, Waite A, Rollinson S, et al.; Chromosome 9-ALS/FTD Consortium; French research network on FTLD/FTLD/ALS; ITALSGEN Consortium. Frequency of the C9orf72 hexanucleotide repeat expansion in patients with amyotrophic lateral sclerosis and frontotemporal dementia: a cross-sectional study. Lancet Neurol. 2012 Apr;11(4):323-30. [Pubmed][21]         . Además, todos los pacientes con la expansión también tenían el haplotipo fundador finés rs3849942 Mok K, Traynor BJ, Schymick J, Tienari PJ, Laaksovirta H, Peuralinna T, et al. Chromosome 9 ALS and FTD locus is probably derived from a single founder. Neurobiol Aging. 2012 Jan;33(1):209.e3-8. [Pubmed][22]         . La frecuencia más alta de la mutación es en Finlandia (21%) y sigue un gradiente de norte a sur (Tablas 1 y 2). Se estimó que la mutación ocurrió aproximadamente hace 1.500 años, unas 100 generaciones en Finlandia, 80 en Alemania y 60 en Italia Majounie E, Renton AE, Mok K, Dopper EG, Waite A, Rollinson S, et al.; Chromosome 9-ALS/FTD Consortium; French research network on FTLD/FTLD/ALS; ITALSGEN Consortium. Frequency of the C9orf72 hexanucleotide repeat expansion in patients with amyotrophic lateral sclerosis and frontotemporal dementia: a cross-sectional study. Lancet Neurol. 2012 Apr;11(4):323-30. [Pubmed][21]         .

El número de repeticiones en los individuos sanos suele ser de 2 a 10, habiéndose descrito expansiones de hasta 23 repeticiones en controles sanos, mientras que los pacientes con ELA o DFT asociados a esta variante tienen entre 30 y varios cientos de repeticiones Renton AE, Majounie E, Waite A, Simón-Sánchez J, Rollinson S, Gibbs JR, et al. A hexanucleotide repeat expansion in C9ORF72 is the cause of chromosome 9p21-linked ALS-FTD. Neuron. 2011 Oct 20;72(2):257-68. [Pubmed][19]          DeJesús-Hernández M, Mackenzie IR, Boeve BF, Boxer AL, Baker M, Rutherford NJ, et al. Expanded GGGGCC hexanucleotide repeat in noncoding region of C9ORF72 causes chromosome 9p-linked FTD and ALS. Neuron. 2011 Oct 20;72(2):245-56. [Pubmed][20]         . Sin embargo, se ha identificado un número de repeticiones intermedias, de 20 a 30, tanto en pacientes como en controles Byrne S, Heverin M, Elamin M, Walsh C, Hardiman O. Intermediate repeat expansion length in C9orf72 may be pathological in amyotrophic lateral sclerosis. Amyotroph Lateral Scler Frontotemporal Degener. 2014 Mar;15(1-2):148-50. [Pubmed][23]          Rohrer JD, Isaacs AM, Mizielinska S, Mead S, Lashley T, Wray S, et al. C9orf72 expansions in frontotemporal dementia and amyotrophic lateral sclerosis. Lancet Neurol. 2015 Mar;14(3):291-301. Erratum in: Lancet Neurol. 2015 Apr;14(4):350. [Pubmed][24]           de difícil caracterización sobre todo de cara al consejo genético.

Otros análisis realizados en pacientes de ELA y de DFT (esporádicos y familiares) utilizando la técnica de la triple PCR demostraron que esta ER de hexanucleótidos es la causa más frecuente de ELA y DFT Mahoney CJ, Beck J, Rohrer JD, Lashley T, Mok K, Shakespeare T, et al. Frontotemporal dementia with the C9ORF72 hexanucleotide repeat expansion: clinical, neuroanatomical and neuropathological features. Brain. 2012 Mar;135(Pt 3):736-50. [Pubmed][25]          García-Redondo A, Dols-Icardo O, Rojas-García R, Esteban-Pérez J, Cordero-Vázquez P, Muñoz-Blanco JL, et al. Analysis of the C9orf72 gene in patients with amyotrophic lateral sclerosis in Spain and different populations worldwide. Hum Mutat. 2013 Jan;34(1):79-82. [Pubmed][26]         .

El fenotipo clínico asociado con estas expansiones se caracteriza principalmente por síntomas de DFT y signos de enfermedad de las neuronas motoras. La presentación clínica también se extiende a casos con rasgos de ELA, cuerpos de Lewy diagnosticados inicialmente como ELA o demencia con cuerpos de Lewy, e incluso se ha descrito en una fenocopia de la enfermedad de Huntington Murray ME, DeJesús-Hernández M, Rutherford NJ, Baker M, Duara R, Graff-Radford NR, et al. Clinical and neuropathologic heterogeneity of c9FTD/ALS associated with hexanucleotide repeat expansion in C9ORF72. Acta Neuropathol. 2011 Dec;122(6):673-90. [Pubmed][27]          Hensman Moss DJ, Poulter M, Beck J, Hehir J, Polke JM, Campbell T, et al. C9orf72 expansions are the most common genetic cause of Huntington disease phenocopies. Neurology. 2014 Jan 28;82(4):292-9. Erratum in: Neurology. 2014 May 13;82(19):1753. [Pubmed][28]         .

1.1.1. Triple PCR

En el caso del estudio de la presencia de la ER del hexanucleótido GGGGCC en el intrón 1 del gen C9orf72, se lleva a cabo una triple PCR o repeat-primed PCR. El método de la triple PCR es un sistema rápido y preciso de separar las muestras que portan la expansión patogénica de la repetición (≥ 30 repeticiones) de los que portan el alelo de referencia (≤ 20 repeticiones). Este ensayo de PCR utiliza un cebador flanqueante específico marcado con fluorescencia (P1) junto con un par de cebadores (P2, P3), que comparten una secuencia 5’ común (cola). Los criterios de selección para la secuencia del cebador de anclaje (P2) son que debe contener poca o ninguna complementariedad consigo mismo, no tener complementariedad (GCA)5’, (TGC)5’ o (GGGGCC)5’, y no tener homología con secuencias humanas conocidas. El cebador reverso (P3) tiene la secuencia (GGGGCC)5’ en su extremo 3’ en función de la hebra de la repetición a amplificar (Tabla 3).

1.1.2. Secuenciación Sanger

La metodología realizada para la secuenciación Sanger Sanger F, Nicklen S, Coulson AR. DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A. 1977 Dec;74(12):5463-7. [Pubmed][29]           consta de 7 etapas diferenciadas: a) realización de la PCR del fragmento deseado; b) electroforesis en gel de agarosa para comprobar si la PCR ha sido efectiva específicamente en nuestro fragmento deseado; c) purificación y cuantificación del producto de PCR; d) realización de la reacción de secuenciación; e) precipitación del producto de la reacción de secuenciación; f) electroforesis capilar; y g) análisis del electroferograma.

Los resultados de las secuencias obtenidas de los pacientes se comparan con las secuencias de referencia proporcionadas por las bases de datos internacionales como Ensembl Genome Browser o el Gen-Bank del National Center for Biotechnology Information (NCBI).

Este protocolo de secuenciación Sanger se aplica para el análisis de los genes tradicionalmente ligados a la ELA y la DFT, como son SOD1, TARDBP, FUS, MAPT, GRN, VCP y SETX. También se utiliza para confirmar las variantes potencialmente patogénicas encontradas por secuenciación masiva (next generation sequencing –NGS–) en los pacientes, así como para comprobar la posible cosegregación de la variante en los casos de los que se disponga de ADN procedente de otros miembros de la familia. Por último, en caso de obtener una baja cobertura para algún exón mediante alguna de las técnicas de secuenciación masiva aplicadas para cualquiera de los pacientes, también se procede de igual manera.

1.1.3. NGS

Hasta hace unos años, la primera aproximación de NGS utilizada era la secuenciación masiva dirigida a través del diseño y la puesta a punto de un panel génico que permite una secuenciación costo-efectiva de una batería amplia de genes relacionados con la ELA y la DFT (un ejemplo de los genes elegidos hace unos años se puede ver en la Tabla 4).

Las dos tecnologías más utilizadas en panel génico han sido la tecnología basada en amplicones llamada TruSeq Custom Amplicon® (TSCA, Illumina) y la considerada como gold standard SureSelect® (Agilent). La cobertura media debe ser de 300 X para asegurarnos una cobertura mínima media de 100 X y que tenga una fiabilidad clínica aceptable. Cuando se diseña un panel génico es importante asegurarse de cubrir todas las regiones codificantes de los exones, las regiones UTR (5’ y 3’) y además incluir sitios de flanqueamiento intrónico de 25 pb con el fin de cubrir zonas de corte y empalme del ARN (splicing) adyacentes. Además, también es importante evitar polimorfismos en el diseño de los cebadores.

La plataforma de secuenciación más común para un panel génico es MiSeq® (Illumina), que dispone del software MiSeq Reporter® (Illumina) que puede hacer un primer análisis de los datos crudos de secuenciación.

Actualmente, la aproximación de NGS más utilizada y considerada más costo-efectiva es la secuenciación del exoma, también conocida por sus siglas en inglés WES (whole exome sequencing). En este caso, se trata de la secuenciación de todas las secuencias codificantes del genoma, así como las regiones UTR (5’ y 3’) y regiones de flanqueamiento para asegurar la inclusión de posibles zonas genómicas que contengan sitios de splicing.

Los archivos brutos de secuenciación (FASTQ y BAM) se alinean contra el genoma de referencia humana GRCh38/Hg18 (anteriormente GRCh37/Hg19). Por último, los archivos VCF, que poseen la información de todas las bases que no son iguales a las del genoma de referencia, se anotan mediante distintos softwares como ANNOVAR Wang K, Li M, Hakonarson H. ANNOVAR: functional annotation of genetic variants from high-throughput sequencing data. Nucleic Acids Res. 2010 Sep;38(16):e164. [Pubmed][30]         .

Como datos de calidad de la secuenciación realizada por este método, es necesario comprobar que la calidad de lectura Q30 sea superior a 90 de media, así como comprobar que la cobertura mínima y media cumplen con los criterios de diseño. Pueden existir regiones más propensas a tener una cobertura inferior a la adecuada por la existencia de secuencias muy repetitivas o de secuencias con poliG, C, T o A.

Por último, es muy importante la forma de analizar el archivo que contiene todas las variantes y la información que se puede emplear para seleccionar la existencia de variantes de interés. Se dispone de multitud de herramientas como son los predictores de patogenicidad in silico, los datos de conservación en la escala filogenética de cada residuo, los predictores de variación en la estructura terciaria o cuaternaria de la proteína, la frecuencia poblacional genética y alélica en distintas subpoblaciones mundiales en distintas bases de datos poblacionales, etc.

La definición de todas las características necesarias para que una variante sea realmente interesante debe ser decidida por una persona con criterio y experiencia en el campo, y al conjunto de esta estrategia es a lo que se denomina pipeline.

Un ejemplo de pipeline real:

  • Eliminar variantes con MAF < 0,01 en las bases de datos GnomAD, 1000Genomes y ExAC.
  • Priorizar variantes en las regiones codificantes y de corte y empalme.
  • Eliminar variantes sinónimas que no afectan al corte y empalme.
  • Predicción in silico (PolyPhen2, SIFT, MutationTaster, M-CAP, CADD).
  • Evaluar el fenotipo y el modo de herencia en los casos familiares.

En los casos en los que se encuentran variantes consideradas patogénicas o probablemente patogénicas, se procede a su validación mediante secuenciación Sanger y, además, en los casos en los que es posible disponer de muestras de otros miembros de la familia, se realiza un análisis de cosegregación.

La ventaja que ofrece la WES sobre el panel génico personalizado es que la cantidad de genes analizados es muy superior, además de la capacidad de reanálisis futuro ante un nuevo descubrimiento genético en la patología. A su vez, es importante indicar que una vez que se ha realizado la secuenciación del exoma completo se puede realizar una “panelización” de este para no incluir hallazgos de variantes accidentales que se salgan de la patología de estudio. Es decir, podemos analizar solamente los genes de interés real, así como genes de enfermedades miméticas o relacionadas. En el caso de un estudio de exoma completo de un paciente con ELA, lo más común es incluir una búsqueda de variantes en todos los genes que también puedan estar presentes en otras demencias, en la enfermedad de Alzheimer, en la enfermedad de Parkinson, en distintos tipos de paraparesias, Charcot-Marie-Tooth y atrofia muscular espinal.

Para que se pueda visualizar de manera más clara la diferencia en el número de genes empleados, se señalan en azul en la Tabla 5 los genes que estaban incluidos en el panel génico.

Por el contrario, el mayor inconveniente de la utilización sistemática de la secuenciación exómica es la aparición de un número muy grande de variantes de significado incierto (variant of uncertain significance –VUS–).