LOS TRÍOS
Hasta aquí he eludido formular la pregunta clave en este asunto de la síntesis de proteínas, a saber: ¿Cómo se pasa del ácido nucleico a la proteína? En realidad a estas alturas, la pregunta puede reducirse a estos términos: ¿Cómo se pasa de un determinado ARN mensajero a una determinada cadena polipéptida?
A primera vista, el formidable obstáculo a que antes nos referíamos parece oscurecer también la solución de este problema. La molécula de ácido nucleico es una «frase» compuesta por cuatro «palabras» diferentes, los nucleótidos. La molécula de proteína es otra «frase» compuesta por veintidós «palabras», los aminoácidos. ¿Cómo es posible que la información suministrada por cuatro elementos baste para explicar lo que han de hacer veintidós?
En realidad, esta dificultad que en un principio preocupó a muchos, no es tal dificultad. El que nos la planteemos siquiera se debe a que estamos acostumbrados a los códigos en los que cada letra representa a otra letra como en los criptogramas que publican algunos periódicos. Por ejemplo, en un criptograma que representara una palabra con las letras inmediatamente siguientes a las suyas, la palabra PROTEÍNA se escribiría QSPUFJOB.
Y, no obstante, los códigos más usuales no se rigen por este principio. Por ejemplo, el idioma inglés consta de 26 letras, que son suficientes para formar las más de 450.000 palabras que figuran en el Tercer Nuevo Diccionario Internacional Webster (íntegro). Los diez símbolos utilizados para construir los números (nueve dígitos y el cero) bastan para formar una infinidad de combinaciones. Es más, bastarían dos símbolos, 1 y 0, para el mismo fin y así ocurre en las computadoras.
Para que ello sea posible, basta únicamente convenir en utilizar los símbolos, ya sean éstos las letras del alfabeto o las cifras, en grupos.
Sólo hay 26 letras, sí, pero existen 26 X 26 ó 676 combinaciones de dos letras, 26 X 26 X 26 ó 17.576 combinaciones de tres letras y así sucesivamente. Del mismo modo, sólo podemos formar nueve números de una cifra; pero de dos hay ya 90, de tres, 900, etc.
Por lo tanto, al pasar de los nucleótidos a los aminoácidos, debemos descartar la noción de que la relación se establezca entre unidades y tomar los nucleótidos en grupos. En el ARN mensajero (o en el ADN del gen) hay sólo 4 nucleótidos diferentes; pero existen 4 X 4 = 16 combinaciones dinucleótidas («parejas») y 4 X 4 X 4 = 64 combinaciones trinucleótidas «tríos»). Todas ellas se indican en la figura 51, en la que los cuatro nucleótidos se representan por su inicial: ácido uridílico, U; ácido citidílico, C; ácido adenilico, A Y ácido guanílico, G.
Ello plantea inmediatamente un nuevo problema. Hay pocos dinucleótidos para los 22 aminoácidos y sobran trinucleótidos. No podemos operar con déficit, de manera que no hay más remedio que pasar, por lo menos, a los tríos.
Ahora bien, no parece lógico que podamos utilizar unos cuantos dinucleótidos y unos cuantos trinucleótidos, los suficientes para llegar a veintidós (o al número de aminoácidos que nos propongamos). La dificultad es que nadie ha podido hallar la forma para hacer que la proteína «diga» que una combinación, por ejemplo, AC, corresponde a «pareja» y cuando forma parte de un trío digamos ACG.
Si vamos más allá de la fase del trío y pasamos al cuarteto, la situación empeora, ya que existen 4 X 4 X 4 X 4= 256 combinaciones diferentes de cuatro nucleótidos. Por lo tanto, será mejor seguir, si se puede, con los tríos.
De todos modos, se ha procurado reducir el numero de posibles tríos, para evitar el despilfarro que supondría asignar 64 tríos a 22 aminoácidos. Supongamos, por ejemplo, que la cadena nucleótida pudiera leerse como una serie de tríos superpuestos, como indica la figura 52. Estos tríos superpuestos (que generalmente siguen un patrón más complicado) podrían ser designados de manera que el número de trinucleótidos posibles quedara reducido a una veintena.
Sin embargo, en el código de elementos superpuestos de la figura 52 se aprecia que uno de cada dos nucleótidos forma parte de dos tríos. El primer U, por ejemplo, es el último elemento de GCU, pero es también el primero de UCA. Luego, hay una adenina que es el último elemento de UCA y el primero de AGA.
Ello supone una grave limitación. En un código de elementos superpuestos como el de la figura 52 el trío GCU tiene que ir seguido de un trío que empiece por U, como UCA. No puede ir seguido de AGA, por ejemplo. Ahora bien, si GCU corresponde al aminoácido 1 y AGA al aminoácido 2, ello significa que, si el código de elementos superpuestos es correcto, el aminoácido 2 nunca puede seguir al aminoácido 1.
Esta limitación afecta a todo código de superposición. Este tipo de código, cualquiera que sea su disposición, forzosamente ha de limitar las combinaciones de los aminoácidos; en él siempre habrán secuencias «prohibidas».
Sin embargo, lo que ya sabemos acerca de las secuencias de los aminoácidos en las proteínas (véase p. 38-39) nos indica que no hay en ellas combinaciones prohibidas. Es posible cualquier combinación de dos aminoácidos, de tres, etc.
Por consiguiente, los elementos del código no deben superponerse, es decir, tienen que presentarse en estricta yuxtaposición, como se indica en la figura 53. Aquí los tríos pueden presentarse en cualquier secuencia, al igual que los aminoácidos.
Como suele ocurrir, por muy convincente que sea un razonamiento teórico, siempre es preferible respaldarlo, con la práctica. En 1961, el propio Crick y sus colaboradores aportaron las pruebas necesarias. Utilizaron una molécula de ácido nucleico codificada para provocar la síntesis de una proteína determinada y luego le agregaron un nucleótido. Tal proteína no pudo seguir sintetizándose. Le añadieron un segundo nucleótido, Nada. Se le añadió un tercer nucleótido y, finalmente, se restableció la función de la molécula. Esto puede interpretarse como se indica en la figura 54, que apoya firmemente la teoría de los tríos yuxtapuestos.
De todos modos, ello nos deja todavía con 64 tríos para 22 aminoácidos. Nos quedan dos salidas. Quizá 32 tríos sean «formularios en blanco» y, por lo tanto, puedan ser pasados por alto en la codificación general. O quizá dos o incluso tres tríos diferentes correspondan a un mismo aminoácido. Como veremos, los experimentos realizados apoyan inequívocamente la segunda alternativa.
De un código en el que dos o más combinaciones de símbolos corresponden a una misma cosa se dice que es «degenerado». Por lo tanto, el código genético pertenece a esta clase.
En resumen:
1. El código genético consiste en combinaciones trinucleótidas o tríos que discurren a todo lo largo de la cadena polinucleótida cada uno de los cuales representa un aminoácido específico.
2. El código genético no tiene elementos superpuestos.
3. El código genético es degenerado.
Además, los bioquímicos tienen la casi certeza de que:
4. El código genético es universal; es decir, el mismo código rige para todos los organismos desde el pino sequoia más alto hasta el más pequeño de los virus.
La más clara prueba de este último extremo es que existen numerosos virus que pueden infestar unas células determinadas, utilizado cada uno su propio ARN mensajero para producir proteínas partiendo de los ribosomas, enzimas y demás equipo químico de las células. Al parecer, la célula «entiende» el lenguaje de los distintos virus. Y en las pruebas realizadas en el laboratorio, aun mezclando el ARN mensajero de una especie con el equipo celular de otra, se ha «entendido» su lenguaje. Y se han formado proteínas.
UTILIZACIÓN DEL ARN MENSAJERO
Ahora podemos imaginar al ARN mensajero cubriendo un ribosoma y dirigiendo la síntesis de una cadena polipéptida determinada a través de una secuencia de tríos. Pero ¿cómo se hace eso? Está muy bien decir que un trío determinado «corresponde» a tal aminoácido; pero ¿qué induce a los aminoácidos a alinearse por el orden de los tríos?
A finales de la década de los 50 empezó a perfilarse la respuesta, gracias, principalmente, al trabajo del bioquímico norteamericano Mahlon B. Hoagland. En 1955, Hoagland descubrió que, antes de incorporarse a la cadena polipéptida, los aminoácidos se agregan a un ácido adenílico. Esta combinación es especialmente rica en energía y su resultado puede considerarse como un «aminoácido activado».
Hoagland descubrió después la presencia en las células de fragmentos de ARN relativamente pequeños, tan pequeños que podían disolverse libremente en el fluido de la célula. En consecuencia, los llamó ARN soluble, aunque, por razones que explicaré en breve son más conocidos por el nombre de ARN de transferencia.
Resulta que existen numerosas variedades de ARN de transferencia y que cada una de ellas se adhiere a la parte de ácido adenilico de algún aminoácido activado. Lo que es más, cada una se adhiere a un aminoácido activado determinado y no a otro. Lo que después ocurre parece evidente.
Supongamos que una variedad determinada de ARN de transferencia se adhiere a la bistidina activada y sólo a ella. El ARN de transferencia transfiere (de ahí su nombre) la bistidina activada al ARN mensajero, pero no a un punto cualquiera de éste sino sólo a un punto determinado.
Al parecer, el ARN transferente tiene un punto de enganche que consiste en un trío determinado, trío que sólo se enganchará en el punto del ARN mensajero en la que se encuentre el trío complementario. En otras palabras, si el ARN de transferencia de la bistidina tiene un punto de enganche AUG sólo se unirá a un trío UAC del ARN mensajero. De este modo, el trío UAC del ARN mensajero queda unido a una histidina —y sólo a una bistidina— a través del ARN transferente. Dondequiera que en el ARN mensajero exista UAC habrá una bistidina y así es cómo puede decirse que en el código genético la histidina «corresponde» al UAC.
Ello fue confirmado por un experimento realizado en 1962. Se utilizó una molécula de ARN de transferencia que normalmente se adhiere al aminoácido cisteína. La técnica empleada consistió en cambiar la cisterna por el aminoácido similar alanina, después de que se combinara con el ARN de transferencia. A pesar de ello, el ARN de transferencia con la alanina adherida la llevó al punto en el que generalmente se encuentra la cisterna. Esto demostró que la unión entre el ARN de transferencia y el ARN mensajero no dependía del aminoácido, que había sido sustituido, sino sólo de las purinas y pirimidinas de las dos variedades de ácido nucleico, que no se habían cambiado.
Cuando todos los ARN de transferencia están colocados en la cadena polinucleótida del ARN mensajero, los aminoácidos cuelgan hacia abajo, muy próximos y situados por un orden dictado por la secuencia de los tríos del ARN mensajero (obtenido, a su vez, del ADN y el gen). Una vez los aminoácidos están situados cerca y ordenados, los distintos procesos enzimáticos pueden provocar sin dificultad una reacción que los combine formando una cadena polinucleótida determinada. En 1961, Howard M. Dintzis, del Instituto de Tecnología de Massachusetts, trabajando con aminoácidos marcados con átomos radiactivos, desarrolló unos experimentos en los que consiguió detectar la aparición de radiactividad en proteínas y demostró que los ARN de transferencia enganchaban sus aminoácidos a la cadena del ARN mensajero desde un extremo al otro; por orden, como un hilo de cuentas.
Esto excluía toda posibilidad de confusión. Supongamos que tenemos la secuencia AUUUCGCUAG. Los distintos tríos a que puede dar lugar (si pudiéramos empezar por cualquier punto) serían: AUU, UUC, UCG, CGC, GCU, CUA, Y UAG. ¿Cuál de estos siete tríos utilizarían los ARN de transferencia si pudieran agarrarse a cualquier punto? Si un ARN de transferencia apunta a UUC y otro, a UCG, en el caso de que ambos tríos estén parte superpuestos, el resultado será la anarquía.
Por el contrario, un ARN de transferencia se une a AUU.
A continuación, otro se une a CGC. Después, un tercero se une a UAG y los cuatro tríos posibles restantes, simplemente no se usan. Dintzis demostró también que todos los aminoácidos de una molecula de hemoglobina pueden situarse y unirse entre sí en cuestión de 90 segundos, El proceso completo se ha reproducido en el laboratorio usando fragmentos de células en lugar de células intactas. En 1961, en el Centro Médico de la Universidad de Nueva York, Jerard Hurwitz construyó un sistema que contenía ADN; nucleótidos y las enzimas correspondientes y consiguió fabricar ARN mensajero en probeta.
Aquel mismo año, G. David Novelli, de los laboratorios Nacionales de Oak Ridge, empleó no sólo ADN y nucleótidos sino también ribosomas y aminoácidos. Con ello, además de fabricar ARN mensajero, consiguió que éste recubriera los ribosomas y actuara de modelo para la formación de una enzima especial llamada betagalactosidasa.
DICCIONARIO DE LOS TRÍOS
Aún queda por resolver la cuestión de la clave del código propiamente dicha: ¿Qué trío corresponde a cada aminoácido?
El primer gran paso en esta dirección se dio en 1961, fruto del que fue sin duda el logro más importante realizado desde que ocho años antes, se propusiera el modelo Watson-Crick. Este avance fue resultado de un experimento efectuado por Marshall W. Nirenberg y J. Heinrich Matthaei en los Institutos Nacionales de la Salud.
Ambos comprendían que, para descubrir la clave, era necesario empezar por plantearse la situación más simple: la de un ácido nucleico compuesto por una cadena de una sola variedad de nucleótido. Ochoa había demostrado ya cómo podía fabricarse esta cadena, con ayuda de la enzima adecuada, a fin de producir y utilizar con facilidad ácido poliuridílico, por ejemplo.
Por consiguiente, Nirenberg y Matthaei agregaron ácido poliuridílico a un sistema que contenía los diferentes aminoácidos, enzimas, ribosomas y demás componentes necesarios para la síntesis de las proteínas. De esta mezcla salió una proteína tan simple como el ARN que tenían al principio. Si el ácido nucleico era todo ácido uridílico, la proteína era todo fenilalanina.
Esto era importante. El ácido uridílico podía representarse así: UUUUUUUUUU… Naturalmente, el único trío que puede existir en esta cadena es UUU. El único aminoácido empleado en la fabricación de la cadena polipéptida fue la fenilalanina, aunque en el sistema estaban presentes y disponibles todos los distintos aminoácidos.
La conclusión que puede sacarse de ello es la de que el trío UUU es equivalente al aminoácido fenilalanina.
Se había dado el primer paso hacia el desciframiento del código genético. La primera entrada del «diccionario de los tríos», fue: «UUU = fenilalanina».
Inmediatamente empezó a prepararse el paso siguiente. Siguiendo la pauta marcada, entraron en actividad varios grupos de investigación. Supongamos que un polinucleótido es fabricado enzimáticamente a partir de una solución de ácido uridílico a la que se ha agregado una pequeña cantidad de ácido adenílico. La cadena consistirá casi enteramente en U, con alguna que otra A intercalada, por ejemplo: UUUUUUUUUUAUUUUUUUUAU UUUUUAUUU…
Tal cadena estaría formada por los tríos siguientes: UUU, UUU, UUU, AUU, UUU, UUU, UAU, UUU, UUA, UUU… Los tríos siguen siendo principalmente UUU, pero de vez en cuando aparece un AUU, UAU o UVA (que son los únicos que pueden formarse con dos U y una A).
Por supuesto la proteína formada por este ácido poliuridílico «impuro» resultó ser en su mayor parte fenilalanina, aunque con ocasionales «intrusiones» de otros aminoácidos.
Se han detectado tres de estos «intrusos»: leucina, isoleucina y tirosina. Al parecer, uno de los tres tríos AUU, UAU Y UVA corresponde a la leucina, el otro a la isoleucina y el otro a la tirosina. Aunque, hasta estos momentos, aún no ha podido averiguarse el orden de relación exacto.
Todo lo más que podemos hacer es poner UUA entre paréntesis (UUA) para indicar los tres tríos diferentes que pueden formarse con dos U y una A, sin intentar especificar el orden. Así, nuestro diccionario diría: «(UUA) = leucina, isoleucina o tirosina».
Si a la solución primitiva de ácido uridílico, se agrega un poco de ácido citidilico o guanilico en lugar de ácido adenílico, se forman polinucleótidos que contienen tríos que son (UUC) y (UUG). También aquí los paréntesis indican que no se especifica el orden exacto de los tres nucleótidos. En estos dos últimos casos, aún puede detectarse leucina en la proteína producida que sigue siendo en su mayor parte fenilalanina. Esto sólo puede significar que (UUA), (UUG) y (UUC) pueden todos traducirse por leucina, ejemplo de lo que llamamos «degeneración» del código.
Si a la solución de ácido uridílico, ya «impura», se agrega otra pequeña cantidad de ácido adenílico, para que el polinucleótido final contenga unas cuantas aes más entre la profusión de úes, seguirá siendo poco probable que dos aes estén juntas.
Si, por casualidad, ocurre así, el polinucleótido puede contener tríos tales como: AAU, AUA ó UAA. Éstas son las únicas tres posibilidades que permiten dos aes y una U y podemos simbolizarlas con (UAA).
A medida que aumenta la cantidad de ácido adenílico, aumenta también el número de tríos (UUA), desde luego, pero los tríos (UAA) aumentarán a mayor velocidad. Al principio, los tríos (UUA) sólo se darán en la cantidad suficiente para permitir que sus aminoácidos sean detectados. Pero, a medida que aumenten los tríos (UAA) empezarán a aparecer nuevos aminoácidos, los cuales deberán atribuirse específicamente a uno u otro de los tres tríos de (UAA). Se produce una situación similar si se agrega una cantidad cada vez mayor de ácido citidílico o ácido guanílico. Entonces podrá encontrarse aminoácidos correspondientes a los tríos (UGG) y (UCC).
¿Qué ocurriría si se agregaran simultáneamente, y en cantidad progresivamente mayor ácido adenilico y ácido guanilico? En un principio, sólo (UUA) y (UUG) están presentes en una cantidad suficiente para que puedan detectarse sus aminoácidos. Pero luego empieza aumentar la frecuencia de los distintos tríos representados por (UAG) —de los que no hay menos de seis— y pueden aparecer y serles atribuidos nuevos aminoácidos. En el momento en el que escribo, las relaciones descubiertas entre tríos y aminoácidos son las relaciones que indico en la figura 55.
Los tríos representados en la figura 55 son sólo 37 de los 64 posibles.
Los restantes 27 son los que no contienen U; por ejemplo:
AGG, CCA, AAA, etcétera.
Los bioquímicos confían en que, a no tardar, a cada trío (con su orden y contenido definidos) podrá atribuirse su correspondiente aminoácido, el diccionario de los tríos estará completo y el código genético habrá sido descifrado. Por ejemplo, hacia finales de 1962 Ochoa había obtenido ya ciertas pruebas de que el trío de la tirosina es AUU, por este orden y el de la cisteína, GUU, por este orden.