46 Variaciones en el número de copias

Es frecuente escuchar que los seres humanos somos genéticamente idénticos en un 99,9%. La secuenciación del genoma humano reveló que, mientras que el genoma contiene 3.000 millones de pares de bases de ADN, sólo unos 3 millones (el 0,1%) varían en su secuencia. Estas modificaciones de una sola letra son los polimorfismos de nucleótido único (SNP, single nucleotide polymorphisms). Parece que una pequeña variación genética debe recorrer un largo camino.

En realidad, los SNP no son el único elemento de variación en los genomas. Los genes completos y los fragmentos de genes también pueden presentar duplicación, deleción, inversión e inserción en el genoma. En 2006 se observó que este nuevo tipo de variaciones era extremadamente frecuente, y que tiene tanta relación con la biología y la salud como las variaciones de tipo convencional.

Las variaciones en el número de copias, o variaciones estructurales, demuestran que la diferencia genética promedio entre dos personas no es del 0,1%, un cálculo en función de las variaciones de los SNP, sino tres veces superior, del 0,3% o más, y puede explicar en parte las razones por las que un número tan escaso de SNP puede dar lugar a una diversidad humana tan amplia. Este descubrimiento ha obligado a reconsiderar la forma con la que el ADN hace que todos nosotros, y también nuestra especie, seamos únicos.

Duplicaciones y deleciones El modelo estándar de la genética señala que todos heredamos dos copias de la secuencia genética, una de cada progenitor. Sin embargo, un equipo de investigación dirigido por Matthew Hurles, del Wellcome Trust Sanger Institute, y por Charles Lee, de Harvard Medical School, ha demostrado, al estudiar con detalle los genomas de 270 personas que participaron en el Proyecto HapMap (lo vimos en el capítulo 19), que el paradigma de la copia doble no es universal en absoluto.

En aproximadamente el 12% del genoma, había grandes porciones de ADN (cuyo tamaño oscilaba entre 10.000 y 5 millones de pares de bases) que se repetían ocasionalmente o que podían incluso no existir. Aunque la mayor parte de las personas posee dos copias de estas secuencias, algunos individuos sólo tienen una y otros no tienen ninguna, al tiempo que también hay personas con varias copias (hasta cinco o diez en algunos casos). Además, las secuencias de ADN también se pueden insertar en localizaciones diferentes de las habituales, o bien estar invertidas (se leen al revés). El genoma muestra variaciones considerables en su estructura y también en su orden de lectura.

Algunos segmentos del ADN humano muestran en ocasiones duplicación o deleción, como ocurre con la copia extra del cromosoma 21 que causa el síndrome de Down. Sin embargo, estas modificaciones se consideraban raras y de consecuencias graves. Ahora sabemos que las variaciones de este tipo son frecuentes: más, de hecho, que las correspondientes a los SNP convencionales.

Investigación acerca de la variación en el número de copias

En la primera oleada de estudios de asociación en todo el genoma, las nuevas y potentes herramientas para localizar genes que codifican la aparición de enfermedades (introducidas en el capítulo 19) se aplicaron solamente a los SNP. El convencimiento de que las variaciones en el número de copias tienen una importancia al menos similar está cambiando el enfoque de la investigación. En abril de 2008, el Wellcome Trust anunció una inversión de 30 millones de libras esterlinas para financiar la segunda fase de su exitoso Case Control Consortium, con el objetivo de investigar 24 nuevas enfermedades. En esta ocasión, la investigación irá más allá de los SNP mediante el uso de chips genéticos para detectar también variantes en el número de copias.

A veces, este tipo de variaciones estructurales tiene un carácter trivial; en lo que se refiere a los SNP, algunas modificaciones no introducen ninguna diferencia respecto a la función genética. Sin embargo, también pueden estar relacionadas con alteraciones de la fisiología o con modificaciones en la susceptibilidad a las enfermedades, y también podrían explicar las diferencias entre las especies. Si consideramos las variaciones en el número de copias, sólo compartimos el 96-97% de nuestro ADN con los chimpancés, y no el 99% estimado si consideramos únicamente el orden de lectura.

Número de copias y enfermedad Las implicaciones más interesantes de la variación en el número de copias se relacionan con sus consecuencias en la enfermedad. Ahora que los científicos son conscientes de que vale la pena considerar las variaciones en el número de copias, están empezando a desvelarse todo tipo de asociaciones entre la salud individual y los fenómenos de deleción, duplicación, inserción e inversión del ADN.

Parece que las personas con un elevado número de copias del gen CCL3L1 tienen una susceptibilidad menor a la infección por el VIH. A pesar de que no sabemos con precisión cuáles son las razones, una de las hipótesis propuestas es la de que las copias extra estimulan la producción de una proteína significativa para la resistencia al VIH. Todo ello abre nuevos enfoques de estrategias para tratar el virus y prevenir su diseminación.

Un nuevo territorio genético

El Proyecto Genoma Humano no pudo completar un mapa exhaustivo de nuestro código genético. Simplemente ofreció una secuencia promedio que representa un punto de referencia para que los científicos comparen el ADN de los distintos individuos y especies. Los estudios actuales sobre la variación en el número de copias están revelando la existencia de segmentos completos de ADN que no aparecen en el genoma básico de referencia, pero que, no obstante, son razonablemente habituales. En un estudio realizado en 2008 en el que se analizaron con detalle los genomas de ocho personas se localizaron no menos de 525 nuevas secuencias que aparecían insertadas ocasionalmente en el código. Probablemente haya muchas más que todavía no han sido descubiertas.

Otras variaciones son las correspondientes a los genes FCGR3B, en las que un número escaso de ellos predispone al lupus, una enfermedad autoinmunitaria; por otra parte, las variaciones por repetición en el gen que codifica el receptor del factor de crecimiento epidérmico (EGFR, epidermal growth factor receptor) son frecuentes en los pacientes que sufren carcinoma pulmonar no microcítico. Los individuos originarios del sureste asiático poseen con frecuencia múltiples copias de otro gen que ofrece cierto grado de protección frente a la malaria. En el estudio de las variaciones estructurales de los genes que se expresan en el cerebro, se han observado posibles asociaciones con 17 enfermedades del sistema nervioso, incluyendo las de Parkinson y Alzheimer.

Las variaciones en el número de copias también ofrecen información respecto a los orígenes genéticos de la esquizofrenia y el autismo. En los estudios que se han llevado a cabo con gemelos y con grupos familiares, ambas enfermedades muestran una transmisión hereditaria notable, aunque la búsqueda de las variantes genéticas y las mutaciones responsables ha tenido poco éxito. En otros estudios, muchos de ellos dirigidos por Jonathan Sebat, se ha observado que están a menudo implicadas las variaciones en el número de copias, sobre todo en los casos esporádicos que se observan en personas que carecen de antecedentes familiares de estas enfermedades.

«Las variaciones en el número de copias son, con diferencia, la causa más frecuente de autismo que hoy día podemos identificar.»

Arthur Beaudet, Baylor College of Medicine

Las deleciones y las duplicaciones en ciertos «puntos calientes» del genoma son mucho más frecuentes entre los niños que sufren enfermedades del espectro autista que en la población general. Muchos de estos pacientes presentan variaciones que sus progenitores, libres de enfermedad, no tienen. En lo relativo a la esquizofrenia, el grupo de Sebat ha observado variaciones infrecuentes en el número de copias en un 15% de los individuos que desarrollan la enfermedad mental durante la edad adulta, y en el 20% de quienes presentan los primeros síntomas durante la adolescencia, en comparación con el 5% de los controles sanos. Muchas de las modificaciones en el número de copias que influyen en ambas enfermedades pueden ser específicas para los portadores, lo que explicaría la gran dificultad para establecer sus causas genéticas.

Estos descubrimientos están modificando la contemplación científica de la diversidad genética. Tal como ha señalado Hurles: «La variación que habían observado antes los investigadores era simplemente la punta del iceberg; la mayor parte de la variación estaba oculta».

Cronología:

1941: Descubrimiento de que los genes producen proteínas

1953: Identificación de la estructura del ADN

1961: Descubrimiento de los tripletes que constituyen el código genético

2001: Bocetos iniciales del genoma humano

2006: Descubrimiento de la gran magnitud de las variaciones en el número de copias

La idea en síntesis: los genes presentan variaciones en su estructura y también en su orden de lectura