¿Qué es?
De forma similar a cualquier soporte de almacenamiento de datos, esta información se encuentra registrada en forma de un código en el DNA.
El DNA consiste en dos largas cadenas unidas en forma de doble hélice con un esqueleto químico compuesto por secuencias de cuatro bloques que se repiten, denominados bases y cuyo nombres son Adenina, Guanina, Citosina y Timina. Podemos asimilar la aparición de cada una de estas bases en la secuencia del DNA a una letra dentro del código genético, abreviadas como A, G, C y T. Y podemos tomar estas cuatro letras, como las que componen las palabras del lenguaje celular.
El DNA es una molécula muy estable y muy grande. Esto es una ventaja para preservar la información contenida, pero no lo hace funcional para comunicarla al resto de la célula ya que el DNA queda confinado en el núcleo de la célula. Para transmitir la información contenida en el DNA, las células realizan una copia de esta información, ya fragmentada, a otra molécula análoga con ligeras modificaciones químicas, el RNA mensajero (mRNA por sus siglas en inglés). En el MRNA. la Timina (T) se sustituye por una molécula muy similar, el Uracilo (U). Por lo que sus letras pasan a ser A, G, C y U. Más pequeño y con una sola cadena, el RNA mensajero es capaz de navegar por la célula a órganos específicos en los que se ejecutan las instrucciones contenidas en esa información transmitida: los ribosomas. Estas instrucciones no son otras que las necesarias para la creación de proteínas y los ribosomas son capaces de interpretarla y fabricar estas proteínas.
•
Las proteínas al igual que el DNA son largas cadenas que se componen de bloques químicos repetidos denominados aminoácidos (en este caso hay 20). Dentro del DNA y del RNA existen combinaciones de 3 bases agrupadas que informan a ribosoma del aminoácido específico que debe agregar a la cadena de una proteína, de forma equivalente a una palabra.
Así, por ejemplo, si el código genético leído tiene la secuencia UGC, el ribosoma agregará a la proteína una unidad del aminoácido cisteína, pero si se lee un grupo CGA, se agregará una arginina. Otros grupos de bases indicarán cuando comienza y cuando finaliza la secuencia de la proteína.
El hecho de que entendamos este código de transmisión de la información en los seres vivos, junto al avanzado conocimiento de la físico-química de estas moléculas, lo hace un proceso muy susceptible de ser analizado con herramientas informáticas para buscar aplicaciones. Una de ellas es el crear pequeñas moléculas de estructuras similares al DNA y el RNA, los denominados oligonucleótidos, que con ese mismo lenguaje celular son capaces de interferir o dar instrucciones a las células de forma controlada para que se comporten de una determinada manera. Pese a ser una tarea compleja, hoy en día, el uso de tecnologías de la información, la aplicación algoritmos avanzados y la irrupción de la inteligencia artificial ofrecen herramientas increíblemente eficaces para el diseño de estas moléculas, buscado desde el inicio el diseño de fármacos más seguros y efectivos.