45 «ADN basura»
El genoma humano contiene 3.000 millones de pares de bases, que son las letras del ADN en las que está escrito el código de la vida. Sin embargo, para la escritura de nuestros aproximadamente 21.500 genes, sólo se utiliza una proporción mínima de esas letras, no más del 2%. El resto, que parece no desempeñar ninguna función, ha sido denominado coloquialmente «ADN basura».
La existencia de grandes segmentos de ADN sin un objetivo concreto representaría una especie de rompecabezas evolutivo. La copia del ADN requiere energía, y si las grandes cantidades de «ADN basura» de todos los organismos fueran realmente inútiles, no deberían haber sobrevivido a las exigencias de la selección natural. El hecho de que esto no haya ocurrido sugiere que el «ADN basura» puede ser importante.
Un nuevo dato respecto a su significación vino de la mano del Proyecto Genoma Humano, en el que se demostró que el número de genes que codificaban proteínas era muy inferior al de 100.000 estimado anteriormente. El número real de genes parecía demasiado pequeño como para explicar todas las diferencias entre los seres humanos y los demás organismos, lo que indicaba que el genoma debía ser algo más que la suma de sus genes. Más allá de los genes aparecía el «ADN basura», que los genetistas están empezando a estudiar bajo una nueva perspectiva.
¿Qué hay en el «ADN basura»? Una parte destacada pertenece originalmente a virus que fueron incorporando sus propios códigos genéticos en nuestro genoma, con objeto de reproducirse. En la actualidad, se considera que los retrovirus endógenos humanos constituyen aproximadamente el 8% del «ADN basura» total: representa una parte superior a la correspondiente a los propios genes humanos.
El legado vírico también se puede encontrar en los «retrotransposones». Estos segmentos repetitivos de ADN pueden copiarse a sí mismos una y otra vez en el genoma humano, utilizando para ello una enzima denominada transcriptasa inversa. La clase más abundante la constituyen los «elementos nucleares intercalados largos» (LINE, long interspersed nuclear elements) que, según las estimaciones actuales, representan casi el 21% del ADN humano. Los retrotransposones más cortos, de los cuales los más abundantes son lo de la familia Alu, integran una parte incluso mayor del genoma; hay elementos todavía más pequeños, entre los que se incluyen las repeticiones en tándem cortas, que se utilizan para el estudio de la huella genética del ADN.
Otros tipos de ADN sin capacidad de codificación son los intrones, que separan los segmentos de los genes con capacidad de codificación de proteínas (los exones), así como los centrómeros y telómeros, que aparecen en la parte media y los extremos, respectivamente, de los cromosomas. También están los seudogenes, que corresponden a los restos ya muy deteriorados de genes que fueron importantes para nuestros ancestros pero que se han desestructurado debido a las mutaciones. En el genoma humano hay cientos de estos fósiles genéticos (véase el recuadro de la página siguiente).
¿Cuál es su función? El ADN es «egoísta» y se replica a sí mismo, con independencia de la utilidad que tenga para el organismo que lo alberga. Sin embargo, para que la selección natural acepte esta situación, parte del ADN debe desempeñar alguna función. Una evidencia adicional de su función biológica la constituyen las más de 500 regiones de «ADN basura» que muestran un elevado grado de conservación entre las distintas especies. Posiblemente, estos segmentos de ADN se han preservado debido a que realizan alguna tarea vital, de modo que las mutaciones en ellos serían catastróficas.
Una de las hipótesis relativas a la función del «ADN basura» es la protección de los genes. Si el genoma no contuviera nada más que elementos que codifican proteínas, muchos de ellos quedarían desestructurados y acabarían careciendo de significado a consecuencia de los errores en la recombinación. El ADN sin capacidad de codificación podría representar un sistema de amortiguación que redujera la probabilidad de alteraciones en los genes que desempeñan funciones clave. Otra posibilidad es que el «ADN basura» forme un reservorio a partir del cual pueden aparecer nuevos genes. Cuando se produce el cruzamiento de los cromosomas, algunos fragmentos pequeños del «ADN basura» podrían fracasar en la configuración de nuevas combinaciones útiles. Esto haría que fuera almacenada por la posibilidad de que sea útil en el futuro.
Genes fósiles
Parte de nuestro «ADN basura» está constituido por «seudogenes», secuencias de ADN que en otras épocas eran genes activos pero que en la actualidad han perdido su capacidad para la producción de proteínas y que carecen de utilidad. Son realmente fósiles genéticos que nos hablan de la historia de la evolución con la misma fidelidad con la que lo hacen los huesos fósiles.
Cuando aparecen mutaciones en genes importantes, éstos suelen ser eliminados a través de la selección natural, ya que colocan en desventaja a los individuos que los poseen. Sin embargo, cuando un gen mutado codifica una proteína que ya no es necesaria para una especie, la desventaja no existe. Los animales que viven bajo la superficie de la tierra, como los topos, no van a experimentar ninguna desventaja si aparece una mutación que anula un gen relacionado con la visión. Dado que la mutación aparece de manera aleatoria, pero con una tasa constante, estos genes prescindibles van a sufrir, con el paso del tiempo, un deterioro inevitable; sin embargo, las versiones extintas permanecerán conservadas en el genoma.
Un buen ejemplo en el ser humano es la familia de genes Vr1, implicada en la detección de los olores. Los ratones poseen más de 160 genes Vr1 funcionales, mientras que las personas sólo disponemos de cinco. Los genes Vr1 anulados no han desaparecido del genoma humano, sino que han quedado fosilizados como una prueba de nuestro patrimonio evolutivo compartido con los ratones.
No obstante, en la actualidad sabemos que una parte importante de nuestro «ADN basura» lleva a cabo tareas especializadas y significativas. Parece que una parte notable de este ADN está implicada en la regulación de la actividad de los genes y en la elaboración de los mensajes que indican a las partes del genoma con capacidad de codificación cuándo y cómo deben intervenir, y también cuándo tienen que permanecer inactivas.
La prueba más contundente la ha obtenido el consorcio ENCODE (Encyclopedia of DNA Elements). Esta iniciativa de carácter internacional que fue creada para el estudio de las funciones del genoma completo está elaborando una «lista de partes» del ADN con actividad biológica en el organismo. En sus análisis preliminares, publicados en 2007, se han estudiado con detalle 30 millones de pares de bases, es decir, el 1% del total.
«Ha dejado de ser el genoma ordenado que creíamos poseer. Ahora habría que tener mucho valor para llamar “basura” al ADN sin capacidad de codificación de proteínas.»
John Greally, Albert Einstein College of Medicine
Los descubrimientos han sido extraordinarios. Mientras que el porcentaje de nuestro genoma constituido por genes es de alrededor del 2%, al menos el 9% de éste se transcribe en ARN, lo que indica que una parte importante posee actividad biológica. Sólo una pequeña proporción de este ARN transcrito es el ARN mensajero que transporta las instrucciones para la producción de proteínas. El «ADN basura» genera diversos tipos de ARN, como veremos en el capítulo 48. A su vez, estas moléculas modifican la expresión de los genes y las proteínas con el objetivo de refinar el metabolismo humano.
Tanto en los segmentos del genoma que no codifican proteínas como en los propios genes, se han observado cambios de letras únicas en el ADN que influyen en el riesgo de aparición de enfermedades. Por ejemplo, una mutación infrecuente en el gen MC4R causa obesidad infantil; sin embargo, las personas que poseen las versiones normales de este gen también muestran una susceptibilidad mayor al aumento de peso cuando heredan una variante común en el «ADN basura» adyacente. Esta variante parece estar situada en una región que regula el gen MC4R, modificando su actividad.
Los cambios en el ADN que carece de capacidad de codificación también podrían explicar las diferencias entre las especies. Aproximadamente el 99% de los genes humanos y de los chimpancés son idénticos, comparado con sólo el 96% de todo el ADN. Dado que la diversidad en el «ADN basura» es mucho mayor, es posible que en él estén localizados los rasgos específicamente humanos, como la inteligencia y el lenguaje. El concepto de que los genes codificadores de proteínas representan el único contenido significativo del genoma es manifiestamente erróneo.
Cronología:
1941: Descubrimiento de que los genes producen las proteínas
1953: Identificación de la estructura del ADN
1961: Descubrimiento del código genético en tripletes
1984: Desarrollo de la huella molecular genética
2001: Los primeros bocetos del genoma humano revelan, sorprendentemente, un número muy escaso de genes
2007: El consorcio ENCODE demuestra que se transcribe el 9% del genoma
La idea en síntesis: el «ADN basura» no es tal cosa