Proyecto Genoma Humano
El Proyecto Genoma Humano (1990-2003) ha sido uno de los desafíos cientfficos más grandes desarrollados en la historia. Fue un esfuerzo de colaboración internacional cuyo principal objetivo fue secuenciar y mapear el genoma humano.
El Proyecto Genoma Humano fue desarrollado por un consorcio internacional llamado Organización del Genoma Humano (HUGO), el que secuenció el ADN de un grupo anónimo de donantes que representaban a distintos grupos étnicos. Luego, en 1998 una iniciativa privada desarrollada por la empresa Celera Genomics inició la secuenciación del genoma de cinco etnias diferentes. En enero del año 2001, ambos grupos publicaron simultáneamente el primer borrador de la secuencia correspondiente al 90% de genoma humano, y en abril del año 2003, se publicó la secuencia final. Una vez finalizada la secuenciación del genoma humano, la tecnología desarrollada ha sido aprovechada para secuenciar el genoma de distintas especies, desde bacterias hasta mamíferos. Ya han sido secuenciados más de 500 genomas completos, y varios cientos de otros genomas están en proceso. La mayorfa de los genomas secuenciados son de bacterias, debido a que poseen menor tamaño y es más fácil completarlos. Otras especies de mamíferos cuyos proyecto genoma están más o menos finalizados son el ratón (Mus musculus), la rata (Rattus norvegicus), el chimpancé (Pan troglodites) y la vaca (Bos taurus).
Información contenida en el genoma humano
El análisis de la secuencia del genoma ha arrojado resultados sorprendentes. El primero de ellos es que el número total de genes presentes en nuestro genoma (30.000) es inferior a lo que se esperaba. Las estimaciones preliminares pronosticaban que existían al menos 100.000 genes en nuestras células.
Otro resultado está relacionado con las secuencias codificantes (exones). Un gen humano contiene, en promedio, 8 a 9 exones cada uno, con una secuencia de 1.350 pares de bases, aunque ambos valores presentan una enorme diversidad entre los distintos genes. Considerando el número total de genes y el tamaño promedio de las secuencias codificantes, se estima que menos del 2% de nuestro genoma corresponde a secuencias que codifican proteínas.
También se reveló que la densidad de genes varía en los distintos cromosomas, siendo el cromosoma 19 el más denso, con 30 genes/millón de pares de bases, y el cromosoma 13 el menos denso, con solamente 5 genes/millón de pares de bases.
Otra observación interesante es que alrededor del 50% del genoma corresponde a distintas secuencias repetitivas que no contienen genes, algunas de las cuales pueden movilizarse a otras partes del genoma.
Existen además diversas familias de genes que presentan una alta similitud de secuencias entre sí y que se han generado durante la evolución por duplicación génica. Algunos ejemplos destacables son los cientos de genes que codifican para los receptores que permiten percibir distintos olores y las proteínas que forman parte de la hemoglobina.
Finalmente, se registraron variaciones en la secuencia del ADN que cambian un nucleótido por otro distinto. Estas variantes se conocen como SNP (polimorfismos de un solo nucleótido o Single Nucleotide Polymorphisms). Por ejemplo, la secuencia CCTATA cambia una citosina (C) por una timina (T), generando la secuencia CITATA. Si una de estas variaciones está presente en al menos en un 1% de la población se considera que es un SNP. Los SNP constituyen alrededor del 90% de todas las variaciones genómicas humanas, y existe un SNP cada 100 a 300 bases a lo largo del genoma humano, lo que equivale a 10 millones de SNP en total. Dos tercios de los SNP corresponden a la sustitución de una C por una T. Estas variaciones en la secuencia del ADN son las más importantes en la determinación de las diferencias fenotípicas entre los individuos, y probablemente están involucradas en el desarrollo de enfermedades hereditarias.
Aunque la secuenciación del genoma ya se completó, el análisis de las secuencias y de la expresión de los genes es una tarea que continuará por muchos años más.