Ilustrados comunidad mundial educativa
Inicio | Escribenos
User: Pass: Recordar ó (Registrate!)

| !Publicar Articulo¡

El Genoma humano

Resumen: Proyecto de diversidad del genoma humano. Identificación de los genes asociados a fenotipos. La era postgenómica: la próxima revolución de la biología. ¿Por qué cartografiar y secuenciar genomas?.(V)
2,859 visitas
Rating: 0
Tell a Friend
Autor: Maria A. Alcalá O y Otros Autores

  1. Objetivos
  2. Introducción
  3. Desarrollo
  4. Justificación del proyecto
  5. Secuenciación
  6. Proyecto de diversidad del genoma humano
  7. Identificación de los genes asociados a fenotipos
  8. La era postgenómica: la próxima revolución de la biología
  9. Conclusión
  10. Bibliografía
  11. Anexos

OBJETIVO GENERAL

Dar a conocer el Genoma Humano como el descubrimiento más importante para lahumanidad.

OBJETIVOS ESPECIFICOS

1) Conocer y dar a conocer los avances en medicina que los experimentos delos genomas consigue día a día.

2) Encontrar la respuesta a porque el Genoma nos ayudaría a explicar muchasenfermedades.

3) Conocer la forma en la cual los experimentos del Genoma Humano encontraríalas soluciones y curas a los diferentes males que acechan nuestra humanidad.

4) Conocer como ha sido la evolución del Genoma Humano a lo largo del tiempohasta el día de hoy.

INTRODUCCIÓN

ORIGEN Y JUSTIFICACIÓN DEL PROYECTO

El PGH es el primer gran esfuerzo coordinadointernacionalmente en la historia de la Biología. Se propone determinar lasecuencia completa (más de 3000 .106 pares de bases) del genomahumano, localizando con exactitud (cartografía) los 100.000 genesaproximadamente y el resto del material hereditario de nuestra especie,responsables de las instrucciones gen éticas de lo que somos desde el punto devista biológico. Realmente, lo que llamamos Proyecto Genoma es el término genéricocon el que designamos una serie de diversas iniciativas para conocer al máximodetalle los genomas no sólo de humanos, sino de una serie de organismos modelode todos los dominios de la vida, todo lo cual se espera que dé un impulsoformidable en el conocimiento de los procesos biológicos (desde la escalamolecular hasta la evolutiva) y de la fisiología y patología de los sereshumanos, y que se traducirá en multitud de aplicaciones técnicas y comercialesen ámbitos como el diagnóstico y terapia de enfermedades, biotecnologías,instrumental, computación, robótica, etc.

Hacia mediados de la década de los años 80 la metodología del ADNrecombinante y sus técnicas asociadas (vectores de clonación, enzimas derestricción, transformación artificial de células procariotas y eucariotas,bibliotecas de genes, sondas moleculares, secuenciación, genética inversa,PCR, etc.) habían alcanzado una madurez suficiente como para que se plantearala pertinencia y viabilidad de un proyecto coordinado de caracterizacióndetallada (hasta nivel de secuencia de nucleótidos) del genoma humano y degenomas de una serie de organismos modelo.

¿Por qué cartografiar y secuenciar genomas?

La biología pretende dar respuestas lo más completas y detalladas posiblesde los fenómenos vitales. Al ser el ADN la molécula universal de la herencia,y constituir la base gen ética de la vida, la tendencia natural ha sidoterminar buscando explicaciones al nivel de ADN. Este conocimiento molecularpuede dar la clave de muchos fenómenos que hoy entendemos a niveles menosprofundos ya descritos por otras ciencias biológicas (fisiología, biologíacelular, bioquímica, etc.).

Ha llegado un momento en que se plantea que abordar el estudio detallado delos genomas de los organismos es mucho menos costoso, y más interesanteintelectualmente, logrando el conocimiento detallado de la secuencia. Pero losProyectos Genoma no son más que un punto de arranque para nuevosdescubrimientos en las ciencias biomédicas. Con los datos de secuencias habráque trabajar para dar respuestas a cuestiones de expresión de genes, deregulación gen ética, de interacción de las células con sus entornos, etc.

La secuenciación de genomas de plantas y animales domésticos conducirá anuevos avances en la mejora agronómica y ganadera.

Para comprender la evolución será cada vez más esencial el disponer dedatos de secuencias. La bioinformática permite comparar genes y genomascompletos, lo que junto con otros datos biológicos y paleontológicos, estádando nuevas claves de la evolución de la vida.

La principal justificación del PGH de cara a la sociedad es la promesa deavances importantes en Medicina. Aunque el estudio de las enfermedades enhumanos se ha venido haciendo mayoritariamente en ausencia de su comprensióngen ética, la disponibilidad de técnicas poderosas anima a emprender lasecuenciación sistemática, lo que suministrará un formidable impulso sobretodo para las enfermedades poligénicas y multifactoriales. Una de lasconsecuencias más inmediatas del PGH (y que ya experimentamos desde hace unos años)es la de disponer de sondas y marcadores moleculares para el diagnóstico deenfermedades gen éticas, de cáncer y de enfermedades infecciosas. A plazosmayores. se espera que a su vez la investigación genómica permita diseñarnuevas generaciones de fármacos, que sean más específicos y que tiendan atratar las causas y no sólo los síntomas. La terapia gen ética, aunque aúnen sus balbucientes inicios, puede aportar soluciones a enfermedades, no sólohereditarias, sino cáncer y enfermedades infecciosas.

Uno de los principales objetivos es desarrollar a corto plazo tecnologías devanguardia. Es decir, una de las principales justificaciones del PGH es lanecesidad de impulsar poderosas infraestructuras tecnológicas que deben deproporcionar a las instituciones, empresas y países implicados un lugar deprivilegio en la investigación biomédica y en multitud de aplicacionesindustriales (diagnósticos, terapias, instrumental de laboratorio, robótica,hardware, software, etc.).

Origen del Proyecto Genoma

Aunque antes de los años 80 ya se había realizado la secuenciación degenes sueltos de muchos organismos, así como de "genomas" deentidades subcelulares (algunos virus y plásmidos), y aunque"flotaba" en el entorno de algunos grupos de investigación la idea decomprender los genomas de algunos microorganismos, la concreción institucionaldel PGH comenzó en los EEUU en 1986 cuando el Ministerio de Energía (DOE), enun congreso en Santa Fe (NM) planteó dedicar una buena partida presupuestaria asecuenciar el genoma humano, como medio para afrontar sistemáticamente laevaluación del efecto de las radiaciones sobre el material hereditario. El añosiguiente, tras un congreso de biólogos en el Laboratorio de Cold SpringHarbor, se unió a la idea el Instituto Nacional de la Salud (NIH), otroorganismo público con más experiencia en biología (pero no tanta como el DOEen la coordinación de grandes proyectos de investigación). El posterior debatepúblico tuvo la habilidad de captar la imaginación de los responsables políticos,y ofrecer el atractivo de que no sólo el PGH era el gran emblema tecnocientíficode finales de siglo (como lo había sido el Proyecto Apolo en los años 60),sino que uno de sus fines explícitos era desarrollar tecnologías de vanguardiay conocimiento directamente aplicable (no sólo en el campo de la biotecnología)que asegurarían la primacía tecnológica y comercial del país en el sigloXXI. En 1988 se publicaron informes de la Oficina de Evaluación Tecnológicadel Congreso (OTA) y del Consejo Nacional de Investigación (NRC), quesupusieron espaldarazos esenciales para dar luz verde a la Iniciativa. Ese mismoaño se establece la Organización del Genoma Humano (HUGO), como entidaddestinada a la coordinación internacional, a evitar duplicaciones de esfuerzos,ya diseminar el conocimiento. El comienzo oficioso del PGH corresponde a 1990, yse calcula que terminará el 2005. Sus objetivos eran elaborar en una primeraetapa mapas gen éticos y físicos con suficiente resolución, mientras se poníana punto técnicas más eficientes de secuenciación, de modo que en la fasefinal se pudiera abordar la secuenciación de todo el genoma humano. Entre losobjetivos se cuentan igualmente la caracterización y secuenciación deorganismos modelo, y la creación de infraestructura tecnológica, entre la quedestacan nuevas herramientas de hardware y software destinadas a automatizartareas, a procesar la enorme cantidad de datos que se esperan, ya extraer la máximainformación biológica y médicamente significativa.

Aunque en un principio se calculó que el PGH .americano costaría unos 3000millones de dólares y duraría 15 años, tanto el coste como los plazos hantenido que ser estimados a la baja, debido a innovaciones tecnológicas queabaratan y acortan la investigación. Los fondos federales estadounidensesdedicados hasta ahora (1998) al PGH ascienden a 1.9 mil millones de dólares(casi 300.000 millones de pesetas).

En 1993 los fondos públicos para el PGH fueron 170 millones de dólares,mientras que la industria gastó 80 millones. Conforme pasa el tiempo, lainversión privada se está haciendo más importante, e incluso amenaza conadelantarse a los proyectos financiados con fondos públicos. Recientemente(mayo de 1998), la empresa TIGR anunció la creación de un proyecto conjuntocon Perkin-Elmer (fabricante de secuenciadores automáticos) que podríaconducir a terminar por su cuenta la secuencia humana aun coste equivalente a ladécima parte del proyecto público y con unos plazos más breves.

Para hacerse una idea de las ventajas del PGH con relación a otros ámbitostradicionales de investigación médica, se pueden dar algunas cifras:

El aislamiento por clonación posicional del gen de la fibrosis quísticacostó $ 30 millones. Se calcula que, de haber tenido un buen mapa como losactuales, hubiera costado solamente $ 200.000.

El desarrollar un nuevo medicamento cuesta como mínimo 50 millones de dólares.

El gasto sanitario total estadounidense es de 600 mil millones de dólares.

EI NIH está gastando un 2-3% de su presupuesto al PGH.

DESARROLLO

Introducción a los Proyectos Genoma

Lo que a finales de 1989 era un proyecto que algunos tachaban de loco, por locaro, superfluo y utópico que parecía, es ahora una realidad deseada yaceptada por todos, que se terminará probablemente antes de lo esperado (2005)y que costará mucho menos de lo previsto. Veamos algunos hitos en el avance delPGH:

En 1987 se construyeron mapas genéticos de ligamiento usando polimorfismosde tipo RFLP, con una resolución aún baja: 10-15 cM.

El primer mapa genético de ligamiento del Génethon (1992), que ya recurrióa microsatélites, supuso una revolución inmediata en el análisis deligamiento de las enfermedades con base genética. Su resolución media ya erade 5 cM.

La tercera versión del Génethon se publicó en 1996, y ya contenía unos5000 marcadores microsatélites, separados los consecutivos una media de 0.7 cM(aprox. 700 kb), lo cual ya supera el nivel de detalle especificado en uno delos objetivos para el primer lustro del PGH.

En los últimos años se ha avanzado más en los mapas físicos. Enseptiembre de 1995 Nature publicó un Directorio del Genoma Humano queincluía un mapa de contigs de YACs que cubría 75% del genoma. Hudson et alpublicaron un mapa físico preliminar del 94% del genoma, abarcado por unos15.000 marcadores.

Un problema con los YACs es su elevado quimerismo. por lo que hay quecomplementar los mapas de contigs. Es lo que hizo el Whitehead Institute afinales de 1995, con la publicación en Science del mapa basado en STSque incorpora datos de híbridos de radiación (RH).

El PGH pretendía balizar el genoma humano con unas 30.000 STSs repartidas demodo más o menos uniforme, de modo que cada par de STSs contiguas estánseparadas por una medía de 100.000 pb. Este objetivo acaba de cumplirse, y señalael punto de partida para la fase final del Proyecto, ya que a partir de aquí lasecuenciación queda expedita de forma ordenada y significativa, y los datospueden ser correlacionados con el mapa genético.

Una consecuencia casi inmediata de estos avances en cartografía es que lalocalización, aislamiento (por la llamada clonación del candidato posicional)y caracterización de genes concretos relacionados con enfermedades se acelera ysimplifica, haciendo que el coste presupuestario se abarate notablemente encomparación con los esfuerzos tradicionales en que cada laboratorio luchaba porseparado durante largos años para lograr clonar algún gen de interés.

Una vez completadas las dos primeras fases del PGH (mapas físicos y gen éticosde suficiente resolución), el presente año de 1997 va a marcar el asentamientode la fase clave del PGH, ya que la madurez de los mapas obtenidos hasta ahora ylos avances y bajos costes en las tecnologías de secuenciación y procesamientode datos suponen que se pueda dar luz verde a la obtención masiva de secuenciasde forma sistemática y organizada. Las secuencias van siendo puestas de modo prácticamenteinmediato a disposición de la comunidad investigadora por medio de varias basesde datos entrelazadas dentro de Internet. Se espera que la secuenciavirtualmente completa del genoma humano, está disponible antes del 2005 (sehabla del año 2002).

El ritmo de acumulación de secuencias de ADN es vertiginoso, y ya se doblacada pocos meses. Actualmente se estima que ya se ha secuenciado casi un 2% degenoma humano, pero este dato no debe engañar: con las técnicas y ritmosactuales, en los próximos años se obtendrá una tasa de 500 Mb por año.

Los costes de secuenciación siguen bajando. En algunos laboratorios cada parde bases de secuencia definitiva está en 30 centavos de dólar; y se espera quepronto baje a 10 centavos.

Ahora. el reto de la fase final del PGH es obtener secuencias del modo más rápido.barato y preciso. Para ello, se están diseñando métodos de alto rendimiento, lomás automatizados posibles.

JUSTIFICACIÓN DEL PROYECTO

Tras las propuestas iniciales, que partieron del ministerio de energía delos EEUU (DOE), al que enseguida siguieron los Institutos Nacionales de la Salud(NIH), quedó claro que este magno proyecto no podía consistir en lasecuenciación pura y dura, sino que habría de constar de varias etapasencadenadas, comenzando por la elaboración de mapas gen éticos y físicos deresolución cada vez mayor. Además, la secuenciación habría de centrarse enprincipio en las zonas de ADN más interesantes a priori, como las regiones génicascodificadoras, dejando para una etapa ulterior el análisis del enorme contenidode ADN repetitivo de distintas clases que existe en el genoma. Simultáneamentehabía que ir desarrollando toda una infraestructura de técnicas instrumentalesy de análisis de la información generada (programas informáticos potentespara gestionar las secuencias y extraer sentido biológico de ellas, nuevosalgoritmos, redes de ordenadores interconectados, bases de datos entrelazados,etc.).

Cartografías genómicas

El PGH hace uso de dos tipos de cartografía para caracterizar el genoma,aunque en última instancia los mapas emanados de los distintos métodos han deser correlacionados e integrados: cartografía genética de ligamiento, ycartografía física.

Cartografía genética de ligamiento

La cartografía genética se basa en el cálculo de la frecuencia a la que secoheredan formas alternativas (alelos) de dos loci genéticos que están ligadosformando parte de un mismo cromosoma. Hasta el advenimiento de las técnicasmoleculares, los mapas genéticos de ligamiento en humanos eran bastanterudimentarios, ya que en su elaboración no puede intervenir (por obvios motivoséticos) la experimentación de laboratorio que se usa en animales, y porque losdatos habían de basarse casi exclusivamente en la comparación de fenotiposnormales y los mutantes correspondientes a determinadas enfermedades genéticas,y en el recurso a análisis de familias, a ser posible con registros de variasgeneraciones y con gran número de individuos.

La revolución de la cartografía genética de ligamiento sobrevino cuando afinales de los años 70 se recurre al análisis molecular de zonas de ADN nocodificadoras y que son muy polimórficas: existen varios tipos de secuencias(algunas de ellas de naturaleza repetitiva, como los VNTR, los microsatélites,etc.), dispersos por el genoma, cada uno de ellos con varios alelos en el ámbitopoblacional. Entre las ventajas de los microsatélites se cuentan: contenidoinformativo muy alto, con lo que los análisis estadísticos mejoran enfiabilidad; distribución abundante y relativamente uniforme por todo el genoma;y que se pueden ensayar fácilmente mediante PCR. Además, estos loci genéticossirven en genética clínica como marcadores útiles para localizar genesrelacionados con enfermedades. Los polimorfismos moleculares han permitido queen la actualidad el PGH haya generado detallados mapas gen éticos del genomahumano aun nivel de resolución en torno a 1 centimorgan (cM) o incluso menos.Esto ya se logró en 1994, un año antes de lo previsto, y en buena parte conresoluciones mejores (0.7 cM).

Cartografía física e integración de los mapas

Los mapas físicos tienen como objetivo especificar distancias físicasmensurables en pares de bases (pb) o alguno de sus múltiplos. Obviamente, elmapa físico de mayor detalle es la propia secuencia del genoma. Pero antes dellegar a obtenerla, hay que elaborar mapas físicos partiendo de resolucionesbajas y avanzando hacia las resoluciones cada vez mayores. En cierta manera, losmapas físicos de menor resolución son los propios cariotipos: la visualizaciónmicroscópica de la dotación cromosómica haploide humana teñida con colorantede Giemsa nos muestra un patrón alternante de bandas claras y oscuras, en elque cada banda tiene una media de unos 7 millones de pares de bases. Si bien losmétodos citogenéticos tienen sus limitaciones, no hay que olvidar queactualmente existen novedosas herramientas de citogenética molecular (como lassondas fluorescentes in situ o FISH, la "pintura decromosomas", etc.) que permiten un mayor detalle y que, unidas a otras técnicasaumentan el arsenal de enfoques para el estudio de los genomas, de su dinámicay de sus alteraciones.

Los mapas físicos de mayor resolución se suelen elaborar a partir degenotecas (bibliotecas de genes) en las que el genoma a estudiar se encuentrafragmentado en multitud de trozos aleatorios y desordenados, cada uno de ellosclonado por separado en un vector adecuado: plásmido, cósmido, cromosomasartificiales de levadura (YAC), cromosomas artificiales de bacteria (BAC), etc..La idea para elaborar los mapas físicos es en cierto modo similar a la deensamblar un rompecabezas: consiste en ordenar los fragmentos del genoma a basede buscar grupos de fragmentos que tienen alguna zona en común, es decir, irhallando conjuntos de pares de fragmentos parcialmente solapados. Ello conduceal concepto de contig: un contig (o cóntigo, como algún autor españolha traducido) es un conjunto de fragmentos de un genoma que se han clonado porseparado, pero que son contiguos y que están parcialmente solapados. Losactuales mapas físicos han de recurrir pues al ensamblaje de esos fragmentosdentro de un contig, y ulteriormente, los distintos contigs correspondientes almismo grupo de ligamiento han de ser ensamblados entre sí: el objetivo final(ideal) sería obtener un gran contig por cada cromosoma, que describieradetalladamente la posición y distancia física (en bases) de y entre distintosmarcadores (representados, p. ej. , por dianas para enzimas de restricción).

La cartografía de contigs se puede realizar buscando la "huelladactilar" común a distintos clones de una genoteca de ADN humano. Dichahuella puede consistir en un patrón compartido de dianas de enzimas derestricción (que se puede indagar ayudándose de algoritmos y programascomputacionales adecuados). Las estrategias más recientes hacen uso de ADNhumano en forma de unos 20.000 trozos independientes clonados en los llamadoscromosomas artificiales de levadura (YAC, de sus iniciales inglesas), y buscandola "huella dactilar común" entre clones a base de la detección dedeterminadas secuencias repetitivas. Todo el procedimiento está altamenteautomatizado, como en el famoso laboratorio francés del Génethon, provisto devarios robots especializados en procesar y analizar las muestras.

El último gran hito en cuanto a metodología de mapas físicos ha sido eldesarrollo de una especie de "marcadores físicos universales", fácilmentegenerables, que permiten que los datos obtenidos en un laboratorio sean rápidamentecompartidos y asumidos por toda la comunidad investigadora: se trata de losllamados "lugares etiquetados por su secuencia" (STS en inglés).Consisten en trechos cortos de ADN (de entre 100 y 1000 pb) cuya secuenciaexacta se conoce y se sabe que es única en todo el genoma. Su facilidad de usoy su aceptación como "lenguaje común" estriba en que una vez que uninvestigador descubre una STS, cualquier otro puede obtenerla por sí mismo (nisiquiera hace falta el envío físico de muestras), simplemente fabricando invitro los cebadores correspondientes a sus extremos y amplificando la STSpor reacción en cadena de la polimerasa (PCR). Los STS definen puntos concretosúnicos del mapa físico, y constituyen magníficos "mojones" obalizas fácilmente detectables.

Uno de los objetivos iniciales del PGH era la obtención de mapas físicoscon unas 30.000 balizas repartidas de modo más o menos uniforme, de modo quecada dos marcadores consecutivos estén separados una media de 100 kb. Esteobjetivo se acaba de cumplir, en buena parte debido al empleo de los STS, quepermiten elaborar mapas de contigs según el contenido de STS de los clonessolapados. Estos mapas de STS permiten la integración de los mapas gen éticosy físicos, hacen accesible la fase de secuenciación y facilitan la clonaciónde genes implicados en enfermedades mediante la llamada estrategia del candidatoposicional.

Una vez que se construyen los mapas, hay que refinarlos y purgarlos deposibles errores. Los errores suelen tener dos fuentes principales: algunosclones YACs son en realidad híbridos o quimeras producidas por artefactosdurante el proceso de elaboración de la genoteca, y por lo tanto su mapa norefleja el orden genómico auténtico; y por otro lado, los programas deensamblado de los mapas no son fiables al 100%. De ahí la importancia deconfirmar normalizar los datos mediante estrategias aceptadas por todos losinvestigadores.

Dentro del PGH se está abordando un enfoque paralelo y complementarioconsistente en secuenciar los denominados EST (lugares etiquetados expresables).Se parte de muestras de ARN mensajero aisladas de los distintos tipos de célulasy tejidos del cuerpo humano, se realiza por transcripción inversa (conreversotranscriptasa) copias de ADN, y se procede a su secuenciación. Ellorinde versiones no genómicas, desprovistas de las porciones intrónicas, de losdistintos genes que se expresan en los diferentes tejidos. Los datos obtenidosse integran en "mapas funcionales" que muestran el patrón de expresióndiferencial según su localización anatomo-histológica.

SECUENCIACIÓN

Métodos básicos de secuenciación

  • Método químico de Maxam y Gilbert (actualmente poco usado).
  • Método enzimático de Sanger (terminación de cadena, o de los didesoxinucleótidos, ddNTP)
  • Secuenciación automática según el método de Sanger

Cada ddNTP se marca con un colorante fluorescente diferente.Ello permite hacer la electroforesis en el mismo callejón del gel. Las bandasde ADN son detectadas por su fluorescencia según pasan delante del detector. Siel detector lo hacemos mover en horizontal, podrá leer varias secuenciacionesal mismo tiempo. Los datos pasan aun sistema computerizado.

Nuevos métodos de secuenciación

Microscopías de efecto túnel (STM) y de fuerza atómica (AFM)

Microscopía de barrido (scanning) de efecto túnel (STM). Una finasonda se mantiene muy cerca del objeto (en este caso ADN), por medio de unsistema de control basado en la detección de una minúscula corriente inducidapor el efecto túnel entre la punta de la sonda y el ADN. Una técnica muyparecida es la microscopía de fuerza atómica (AFM), en la que el control sedebe a la medida de las fuerzas de van der Waals entre la sonda y la muestra. Encualquiera de los dos casos, la punta se mueve a lo largo del objeto, de modoque sus desplazamientos en vertical se miden y se registran, generando unaimagen de la superficie del objeto. Aunque se han obtenido imágenes delesqueleto azúcar-fosfato de ADN de cadena sencilla y de cadena doble, está porver si se pueden "ver" las bases nitrogenadas. Si es así, la técnicapodría secuenciar del orden de 1 Mb cada día.

Secuenciación por hibridación: chip de hibridación

Secuenciación por hibridación en chips con oligonucleótidos. Se basa ensintetizar distintas sondas de oligonucleótidos, y unirlas en disposicionesordenadas (arrays) a una fina pastilla de nylon o vidrio. Este chip seprueba frente aun ADN marcado fiuorescentemente, de modo que el patrón ycantidad de fluorescencia suministra información sobre la secuencia del ADN encuestión. La última generación de este enfoque es la combinación de técnicasfolitográficas (como la de los chips de silicio para computadores) con síntesisquímica en fase sólida, que logra chips con ordenaciones de decenas e inclusocentenares de miles de oligos distintos, que pueden usarse para identificarsecuencias marcadas fluorescentemente en cuestión de minutos, por medio de unmicroscopio confocal de fluorescencia totalmente automatizado, que registra losdatos.

A modo de estudio piloto sobre sus posibilidades, la empresa Affimetrix halogrado re-secuenciar por este método las 16 kb de AQN mitocondrial humano, conun dispositivo formado por 135.000 oligonucleótidos. Con la tecnología actualse puede llegar a sintetizar en un día 400.000 oligos de 20 bases cada uno,dispuestos en un chip de 1 ,6 cm2. Pero el objetivo final es lograrun chip con los 4 millones de sondas necesarias para secuenciar todo el genomahumano en una sola hibridación (!).

Estrategias de secuenciación

Secuenciación genómica clásica

Hasta hace muy poco, la secuenciación genómica dependía de la previadisponibilidad de mapas físicos detallados, para que los fragmentossecuenciados puedan ser ensamblados correctamente. Necesita manejar una grancantidad de datos (a título de ejemplo, para generar 1 kb de secuencia final,hay que secuenciar 10 kb en total), y no es totalmente automatizable.

Resumamos brevemente (recapitulando algo de lo dicho para los mapas) cuál esla estrategia habitual para secuenciar genomas:

El ADN genómico se corta aleatoriamente en fragmentos, que se separan endistintas clases de tamaños, y se insertan en distintos tipos de vectores, cadauno con una capacidad media diferente (por ejemplo, los YACs portan insertosentre 100 y 2000 kb, los cósmidos unas 40 kb).

Se preparan mapas físicos de baja resolución a base de clones solapados deinsertos de YACs.

Se preparan mapas físicos de alta resolución, preparados para lasecuenciación, por medio de la subclonación en cósmidos de fragmentosaleatorios de insertos de YACs.

Finalmente, se escoge un conjunto de clones de cósmidos con solapamientos mínimos,sus insertos se rompen aleatoriamente y se subclonan en vectores para lasecuenciación (derivados del fago M13, plásmidos de la serie pUC, etc.).

Por cada cósmido hay que secuenciar unos 800 clones de fago M13, con un tamañomedio de inserto de 400 pb, y la secuencia de 40 kb del inserto del cósmidooriginal se ensambla computacionalmente. Este enfoque de secuenciaciónaleatoria (shotgun) obliga a secuenciar muchas veces (unas 8 o 10) elmismo segmento de secuencia, lo que tiene la ventaja de que asegura una mayorfiabilidad de los datos obtenidos. Sin embargo, como ya dijimos, presenta variosinconvenientes: hay que disponer previamente de buenos mapas; los YACs soninestables y muchos de ellos son quimeras, artefactos de clonación que noreflejan el orden genómico (identificarlos y descartarlos es una tarea quelleva tiempo y esfuerzo); y como ya sabemos, esta metodología no se puedeautomatizar totalmente.

Un tema importante es tener tasas de errores lo más bajas posibles: delorden de 0.02-0.2%.

Secuenciación de ADN complementario (ADNc)

No es una alternativa, sino un complemento ala secuenciación genómica. Noes el gen lo que estamos secuenciando, sino la "retrocopia" de su ARNmobtenida por reversotranscripción, desprovisto de intrones y secuenciasreguladoras no traducidas.

Si bien la secuenciación de ADNc no nos da información de la estructura delgen, sí nos la puede dar sobre su expresión: en qué tejidos se expresa, bajoqué condiciones, etc., lo que permite iniciar mapas funcionales del genomahumano.

Nuevas estrategias de secuenciación genómica

Recientemente (véase Venter et al., 1996) se ha propuesto una estrategia desecuenciación genómica que no depende de previos mapas físicos, y que enlugar de YACs emplea otro tipo de vectores, los cromosomas artificiales debacteria (BACs), que aunque permiten insertos de entre 100 y 350 kb, tienen lagran ventaja de aceptar insertos genómicos con gran fidelidad (sin quimerismosni apenas reordenaciones del material insertado). La estrategia consiste en losiguiente:

Se crea una genoteca humana de BACs, con un tamaño medio de 150 kb, y unaredundancia de 15 veces, de modo que consta de unos 300.000 clones. Los clonesde la genoteca se reparten en pocillos de placas de microtitulación.

Se secuencian unas 500 bases en cada uno de los dos extremos del inserto decada clon. Esto significa que las 600.000 secuencias de los extremos de losclones están repartidas a razón de una cada 5 kb de genoma, y constituyen el10% de la secuencia genómica.

A estas secuencias se las denomina STCs, acrónimo inglés de"conectores" etiquetados por su secuencia", ya que permiten quepor término medio cada clon BAC pueda ser conectado con otros 30 (un inserto típicode 150 kb dividido por 5 kb, estará representado en otros 30 BACs). Lassecuencias de las STCs se pondrían enseguida en Internet, a disposición de lacomunidad investigadora.

Se toma la "huella dactilar" de cada clon BAC, con una enzima derestricción .

Un clon BAC que actúa de semilla se secuencia por cualquier método, y secompara con la base de datos de STCs para identificar los clones solapados.

Se secuencian los dos clones BAC que muestren consistencia interna entre lashuellas dactilares y solapamiento mínimo en ambos extremos con respecto al BACsemilla.

El proceso se va reiterando a ambos lados del BAC semilla (lo que podríamosllamar "paseo genómico con BACs").

De esta manera, el genoma humano completo se podría secuenciar con sólo20.000 clones BAC.

Aunque la estrategia es muy atractiva por su aparente rapidez y menor costo(se estima que en dos años 30 secuenciadores de última generación podríanobtener esas 600.000 STCs, con un desembolso de menos de 10 millones de dólares),tiene varios inconvenientes, entre ellos el que obliga a mantener uno o varioscentros depositarios de las placas con los clones BACs, y al envío de clonesentre laboratorios. Dado que el PGH ha funcionado muy bien hasta ahora de mododescentralizado, es posible que haya reticencias en grupos que vean amenazada laactual cuasi-democracia investigadora. (No se puede olvidar quién hace lapropuesta: el director de uno de los centros privados más "agresivos"en investigación genómica).

El papel de la informática en los proyectos genoma

La informática ha sido uno de los objetivos esenciales del PGH, debido a lagigantesca cantidad de datos que hay que recoger, analizar, comparar,interpretar y distribuir. La informática aplicada a la biología presenta dossubdisciplinas (véase Benton, 1996): la bioinformática en sentido estricto,que se puede definir como el trabajo de investigación y desarrollo que senecesita como infraestructura de información de la actual biología; y labiología computacional, que es la investigación dependiente de computacióndedicada a entender cuestiones biológicas básicas. El término bioinformática,en sentido lato, comprende estos dos grandes aspectos. Estamos ante un nuevocampo interdisciplinario, en la interfase entre ciencias de la computación,matemáticas y biología.

Las cuestiones de gestión de datos que plantea el PGH suponen un auténtico"revulsivo" para la informática. Aunque para algunas de las tareas sepuede recurrir a enfoques tradicionales, con sólo aumentar la escala delprocesamiento, para otros problemas se necesitan arquitecturas y programasinformáticos totalmente diferentes.

Adquisición informatizada de datos biológicos

La adquisición de datos experimentales por métodos digitales estáespoleando a la industria a diseñar y fabricar aparatos cada vez mássofisticados, que mejoran y aceleran la parte más rutinaria de la investigación.Para ello los aparatos incorporan sistemas computerizados de análisis ytratamiento de imagen visible. Piénsese en los secuenciadores automáticos deADN o en la tecnología del chip de ADN.

El ensamblaje automático de mapas y secuencias es otra tarea que planteanumerosos e interesantes problemas a las ciencias de la computación, que han dehacer uso de nuevos algoritmos y estrategias en las que tener en cuenta losposibles errores.

Predicción de secuencias codificadoras, dominios funcionales y otras zonasinteresantes del genoma: Aunque disponemos de programas a tal efecto (GRAIL,FASTA, etc.), se requieren nuevos algoritmos capaces de predecir patronesespeciales de secuencia dentro de genomas completos. Se están ensayandoaproximaciones derivadas de las redes neurales (neuromiméticas).

Construcción de árboles filogenéticos: En principio se viene realizando abase de comparar determinados genes entre pares de organismos, mediantealgoritmos de alineamiento de secuencia, pero habrá que mejorar los métodos,incluyendo una adecuada evaluación del grado de fiabilidad de los árboles.

Bases de datos gen éticos y moleculares

La gigantesca cantidad de datos generados en los proyectos genoma obliga aabandonar la "Galaxia Gutenberg" a la hora de publicar los datos: sudifusión se hace por medios electrónicos, depositándolos en bases de datos públicos.El ritmo de acumulación de datos es vertiginoso, y actualmente se duplican enmenos de un año. Los biólogos del siglo XXI usarán esas bases de datos comoun recurso indispensable de su trabajo cotidiano. En la actualidad funcionanprincipalmente dos tipos de bases de datos genómicos:

El Consorcio Internacional de Bases de Datos de Secuencias está formado porGenBank, el Banco de datos de ADN de Japón (DDBJ) y el del EMBL. Alberga losdatos de secuencias. Las tres bases comparten y complementan la información. EnEspaña existe un nodo de EMBL residente en el Centro Nacional de Biotecnología(CNB) de Madrid.

Genome Data Base (GDB) se estableció para albergar los datos de mapas yrelacionados (sondas, marcadores, etc.).

Actualmente la base de datos bibliográfica MEDLINE (mantenida por la NMLestadounidense) está vinculada con las bases de datos genéticos y desecuencias. Por ejemplo, se puede hacer una búsqueda desde MEDLINE con palabrasclave de una enfermedad, lo que da acceso a OMIM (Herecia mendeliana on-line),con referencias bibliográficas, y de ahí se puede saltar a los mapas genéticos,físicos y las secuencias, si están disponibles.

En 1993, un taller recomendó profundizar en la coordinación entre losdistintos bancos informatizados. Las diferencias en la estructura de las basesde datos y en su nomenclatura hacen que un investigador que trabaje con un gen ouna proteína de una especie tenga difícil acceder a la información de geneshomólogos de otras especies. Los expertos en bioinformática están tratando dedesarrollar estándares y nombres comunes, y de establecer vínculos entreellos, de modo que cuando los investigadores busquen información en una base dedatos, automáticamente la encuentren vinculada con otras bases depositarias deotros datos. Internet y los lenguajes informáticos dedicados al WWW puedenvenir a ayudar, al hacer fácil crear vínculos entre bases de datos diferentesha abierto el camino ala diseminación del enfoque basado en "federacionesde pequeñas bases de datos". Basta definir hipervínculos activos(hipertexto) para vincular datos relevantes entre distintas bases. Pero parahacer frente al diluvio de datos tales hipervínculos tendrán que ser creadosautomáticamente por el software de la base de datos. Ello obliga a ponerse deacuerdo sobre la nomenclatura y los formatos compatibles. El famoso lenguajeJava, creado para Internet, parece que puede desarrollarse en una buenaherramienta para entrecruzar de modo inteligente todas las bases de datos biológicos.

Diagnóstico molecular: detección de mutaciones

El avance en el PGH y en los mapas y secuencias ya disponibles impulsan lanecesidad de disponer de técnicas capaces de rastrear ADN en busca demutaciones asociadas con enfermedades humanas. En los próximos años se habráidentificado la mayor parte de los genes implicados en importantes enfermedadeshumanas. En las bases de datos se están introduciendo informaciones sobremutaciones y sus implicaciones clínicas. Uno de los retos de la medicina seráhacer uso de esa información para mejorar el diagnóstico y prognosis de lasenfermedades.

Para detectar mutaciones en sitios previamente determinados se han diseñadouna serie de métodos:

Hibridación de oligonucleótidos específicos de alelos.

Amplificación específica de alelos (con o sin PCR, o con reacción encadena de la ligasa, LCR)

Procedimientos que crean o destruyen sitios de restricción.

La detección de mutaciones en lugares sin especificar o cuando no se disponede información de secuencia es una tarea muy ardua, aunque se han desarrolladoalgunas estrategias (rastreo de malos emparejamientos en el genoma).

Sin embargo, lo más frecuente es la situación en que se trata deidentificar mutaciones en múltiples sitios potenciales dentro de segmentos deADN de los que se conoce la secuencia normal.

Se han diseñado técnicas de tipo "multiplex" que permiten la búsquedade diversos tipos de mutantes en un determinado gen.

De modo ideal, el procedimiento tendría que ser fiable, rápido, barato, yproporcionar información exacta sobre la posición y naturaleza de la mutación,así como requerir poco esfuerzo, ser automatizable y no usar reactivospeligrosos. Ninguno de los métodos actuales cumple este criterio. Lasecuenciación sería el método definitivo, pero sigue requiriendo muchotrabajo, y los métodos automatizados de alto rendimiento son caros. De todosmodos, debido a que hay mucho interés y dinero puesto en el empeño, se puedecasi garantizar que veremos importantes avances en breve.

Por ejemplo, se está desarrollando un sistema que no usa electroforesis engel (una de las fases más tediosas), llamado espectrometría de masas por láserde desorción/ionización asistida por matriz

La división Applied Biosystems de Perkin Elmer ha diseñado un análisis dehasta 32 mutaciones diferentes de un gen por amplificación simultánea de hasta15 segmentos de ADN, seguida por ligado multiplex de oligonucleótidos específicosde alelos.

La misma empresa ha creado un ensayo de micro-PCR que puede realizar 24ensayos de 2ml cada uno en un chip, y cuyos resultados se pueden leer en tiemporeal por medio de la estrategia de TaqMan.

Otro de los avances más prometedores son los "chips" de oligonucleótidos:ordenaciones de diferentes oligos unidos a soportes semisólidos. AON marcadofluorescentemente puede entonces hibridarse a los oligos del chip, de modo queel patrón de hibridación se puede analizar por scaning de fluorescencia. Comose conoce la secuencia y posición de cada oligo en el chip, se puede determinarla posición y posiblemente la naturaleza de cada mutación.

Este enfoque de microchips con oligos ha sido llevado a un avance importantepor la empresa Affimetrix: usando técnicas fotolitográficas similares a lasque emplea la fabricación de chips de silicio, se han podido obtener chips con64.000 diferentes sondas de oligonucleótidos unidos a superficies planas decristal. En 15 minutos el dispositivo puede detectar la hibridación desecuencias diana marcadas fluorescentemente a oligos del chip.

Otro caso notable de nuevas perspectivas que se pueden abrir con el diagnósticomolecular es el Proyecto de Anatomía Genómica del Cáncer que pretenderealizar un catálogo de todos los genes expresados en los distintos tipos de célulastumorales. Se trata del último ejemplo de matrimonio entre ciencia genómica einformática, con consecuencias trascendentales en el ámbito clínico. losinvestigadores quieren determinar cómo cambia la expresión génica conformeprogresa el cáncer y comprender cómo surgen los tumores. Se espera que sepueda obtener un índice genético de los tumores, de modo que el clínico no sólodependa de anatomía patológica convencional (microscopía), sino que el diagnóstico,pronóstico y tratamiento de sus pacientes se pueda asentar en un conocimiento másadecuado a base de la expresión génica y de las proteínas, la idea de que sepuedan identificar todos los genes alterados en un cáncer determinado es muyatractiva. Debería realmente suministrar información para clasificar tumores eidentificar dianas para la terapia.

"Las tres culturas" de la biología genómica

En la biomedicina de la era genómica y postgenómica se requiere, como seestá viendo, un alto grado de interdisciplinariedad e integración entredistintos profesionales. Es lo que Benton (1996) ha llamado -parafraseando aC.P. Snow- el problema de las tres culturas: los biólogos querrán que losinformáticos les suministren soluciones a sus problemas de gestión de datos,los matemáticos y expertos en computación andarán detrás de problemasintelectualmente llamativos, y los ingenieros pedirán a los dos gruposanteriores que les suministren especificaciones bien concretadas para que ellospuedan desarrollar su trabajo. Los distintos expertos habrán de acostumbrarse aemplear vocabularios y lenguajes comunes ya entender (sin minusvalorar) losproblemas de los demás. En numerosas universidades empiezan a impartirse enseñanzas(de pregrado o postgrado) de bioinformática y biocomputación. En muchos casosse trata de que los estudiantes o profesionales de especialidades tradicionalescompleten su formación con la parte con la que no están familiarizados.

Por lo que respecta a los biólogos, habrán de trabajar en entornostremendamente ricos en información, manejarán con soltura las bases de datos,y extraerán conocimiento biológicamente significativo. Los nuevos datosobligarán a elaborar nuevas hipótesis en muchos ámbitos de las ciencias de lavida, que sugerirán nuevos tipos de experimentos, estableciéndose unaretroalimentación fructífera entre la biología in silico y latradicional biología in vtvo e in vitro. Las Ciencias Biológicasdarán un salto no sólo cuantitativo, sino que probablemente entraremos en unnuevo paradigma de investigación, en el que contemplaremos los fenómenosvitales no sólo desde un punto de vista molecular, sino de integración entresus diversos niveles de complejidad.

PROYECTO DE DIVERSIDAD DEL GENOMA HUMANO

Lucca Cavalli-Sforza, un prestigioso genético especializado en estudio depoblaciones humanas, está impulsando la idea de realizar una investigacióndestinada a comprender la variación genética humana ya reconstruir la historiade las poblaciones humanas en los últimos 100.000 años de nuestra especie.Este Proyecto de Diversidad del Genoma Humano (PDGH) implicaría una diversidadde disciplinas (genética, arqueología, lingüística, antropología, etc.)para dar cuenta de la evolución reciente de la humanidad, reconstruir lasgrandes migraciones de grupos, la distribución de las poblaciones y culturas,etc. Una de las estrategias consistirá en la toma de muestras de ADN de unaserie de poblaciones y etnias, con ulterior estudio comparativo de polimorfismosmoleculares. Se pretende estudiar muestras correspondientes al 10% de las 5000poblaciones lingüísticas diferenciadas que existen, con el objeto de ver siexisten correlaciones (y en su caso, cómo se han producido) entre la diseminacióncultural y la genética. Según sus impulsores, el PDGH daría una rica visiónde la variedad de recursos gen éticos de nuestra especie, y junto con los datosdel PGH convencional, facilitaría la comprensión del fundamento genético dela susceptibilidad o resistencia a distintas enfermedades, incluidas lasinfecciosas, comprender mejor el papel de la selección y el de la deriva gen ética.

Algunos colectivos y medios de comunicación han lanzado acusaciones de"racismo" contra este Proyecto, pero para Cavalli-Sforza nada está máslejos de sus propósitos. De hecho, piensa que con él se va a llamar la atenciónlas reclamaciones de ciertas tribus para que se les ayude a sobrevivir yconservar sus culturas. Ningún genético serio actual (y menos una autoridad enla materia como Cavalli-Sforza) mantiene la idea de que la especie humana estéseparada en razas, ni mucho menos que de los datos gen éticos se puedan derivarplanes políticos. Un comité ad hoc de la UNESCO está emitiendoinformes para que el PDGH se amolde a una serie de criterios éticos y sociales.Los principales temas que se están evaluando son:

  • Consentimiento informado a los individuos y poblaciones implicados. El PDGH contiene, según los miembros del comité de la UNESCO, algunas de las medidas más detalladas y sofisticadas que se hayan propuesto nunca para obtener ese consentimiento informado.
  • Comercialización de los posibles resultados de la investigación: la UNESCO recomienda que este tema forme parte de las cláusulas del consentimiento informado y de acuerdos de cooperación. Es decir, se prevé que parte de los beneficios económicos reviertan en las comunidades indígenas. Sin embargo, este tema de la "prospección genética" (biooprospección) requiere aún mucha discusión para ser clarificado. El tema de las posibles patentes sobre genes útiles que se pudieran encontrar es delicado. La opinión personal de Cavalli- Sforza es que no se permitan, o en todo caso, que sus beneficios reviertan ala población donadora que permitió la identificación del gen.
  • La financiación debería ser pública y de entidades sin ánimo de lucro. No se debe aceptar la financiación de empresas, para evitar todo posible conflicto de intereses.

Eugenesia y racismo. El racismo es una actitud mental, no unaconsecuencia de ningún dato biológico. Hay que tomar medidas para evitar quenadie saque conclusiones sociales y políticas de meros datos de polimorfismosgen éticos en las poblaciones humanas.

En la oposición contra el PDGH ha influido algún lamentable caso de"bioprospección" (no relacionado con el Proyecto), que ha servido demunición a ciertos grupos ecologistas y de apoyo a tribus. Por ejemplo el RAFI(Fundación Internacional para el Avance de las comunidades Rurales) hadesplegado una campaña para divulgar "los peligros de PDGH", pidiendoque no se lleve a cabo. Los miembros de RAFI llamaron la atención del hecho dela concesión de patente sobre unas células resistentes al virus HTLV-1derivadas de la tribu Hagahai de Papúa-Nueva Guinea.

Hay empresas farmacéuticas que están realizando "bioprospección"en poblaciones aisladas, las cuales presentan la ventaja de que su menorpolimorfismo gen ético puede ayudar a encontrar la explicación sobre base deresistencias o sensibilidades a ciertas enfermedades. Por ejemplo, se estáintentado identificar genes de sensibilidad al asma en una pequeña poblaciónaltamente endogámica de la isla de Tristan da Cunha

Genoma modelos

Como ya apuntábamos anteriormente, habría que hablar más bien de ProyectosGenoma (en plural), ya que en paralelo al estudio del genoma humano están encurso la caracterización y secuenciación de genomas de organismos modelo, cuyacomparación entre sí y con el acervo genético humano tendrán dos notablesefectos:

Acelerarán notablemente la obtención de importantes datos sobre laorganización, función y evolución del ADN a lo largo de toda la escalafilogenética. Se espera que la comparación de genomas completos de los tresgrandes dominios de la vida (arqueas, bacterias y eucariotas) nos suministraráclaves para comprender más de 3000 millones de años de evolución. La biología(que como decía Dobzhanski, no tiene sentido si no es a la luz de la evolucíón)profundizará aún más su interés filogenético.

Ayudarán a determinar la función de numerosos genes (incluyendo humanos).Habrá numerosas aplicaciones médicas.

Servirán para emprender nuevos enfoques dentro de la Biotecnología y laBiología industrial.

Hasta el momento se dispone de la secuencia completa de al menos unrepresentante de cada uno de los tres grandes dominios de seres vivos, y estánen marcha o en proyecto unos 30 proyectos. (Para los proyectos de bacterias,véase la web del TIGR).

Eubacterias. Las siguientes eubacterias están totalmente secuenciadas:

 

 

 

Mycoplasma genitalium

0.58

http://www.tigr.org

Mycoplasma pneumoniae

0.82

http://www.zmbh.uniheidelberg.de/M_pneumoniae

Borrelia burgdorferi (+ Plasmidos)

0.91 (+32)

http://www.tigr.org

Aquiles aeolicus

1.55

 

Helicobacter pylori

1.67

http://www.tigr.org

Haemophilus influenzae

1.83

http://www.tigr.org

Synechocystis

3.57

http://www.kazusa.or.jp/cyano/cyano.html

Bacillus subtilis

4.21

http://www.pasteur.fr/Bio/SubtilList.html

Mycobacterium tuberculosis

4.4

http://www.sanger.ac.uk

Escherichia coli

4.67

http://www.genetics.wisc.edu:80

 

Arqueas (arqueobacterias): Los genomas concluidos son los deMethanococcus jannaschii y Archaeoglobus fulgidus, ambos obtenidos por el TIGR,y el de M. Thermoautotrophicum. Muy avanzados están los de dos arqueobacteriashipertermofílicas (Pyrobaculum aerophilum, Pyrococcus furiosus).

 

 

 

Mehanococcus jannaschil

1.67

http://www.tigr.org

M Thermoautotrophicum

1.75

http://www.genomecorp.com/htdocs/sequences

Archaeoglobus fulgidus

2.18

http://www.tigr.org

 

El TIGR de Craig Venter está secuenciando decenas demicroorganismos tanto procariotas como eucariotas, muchos de ellos conimportancia clínica o industrial (entre las eubacterias: Enterococcus feacalis,Legionella pneumophila, Mycobacterium tuberculosis, Neisseria meningitidis,Salmonella typhimurium, Vibrio cholerae, Deinococcus radiodurans, etc.). Elcreciente número de secuencias bacterianas facilitará muchos estudios básicos,y por lo que respecta a las patógenas, permitirá aclarar sus mecanismos depatogenicidad y virulencia, 10 que podrá sugerir a su vez nuevos tratamientos.

Hacia el inicio del siglo XXI se estima que dispondremos de las secuencias demás de 100 microorganismos. Como siempre, el problema será cómo vamos adigerir esa información (y quién se va a beneficiar de ella, pero esta es otrahistoria que tratamos en otro sitio). Aparte de los tradicionales (perorenovados) métodos de biología in silico, siempre hay que volver allaboratorio a comprobar hipótesis experimentalmente y recabar nuevos datos.Para ello se están diseñando nuevas estrategias. Por ejemplo, la llamada GEMS(selección multiplex manilada genómicamente), que consiste en medir simúltáneamentelos efectos sobre la supervivencia de una serie de delecciones en fase en muchosgenes, y bajo diferentes condiciones ambientales; de esta manera, se puederastrear el patrón de pérdida o selección de mutantes concretos..

Eucariotas

En 1996 se terminó la secuencia de la levadura de panadería (Saccharomycescerevisiae), y ahora se va a emprender el de otra levadura muy diferente(Schyzosaccharomyces pombe). El proyecto genoma de levadura, que ha costado unos30 millones de dólares, ha sido un logro esencialmente europeo, con AndréGoffeau (Universidad Católica de Lovaina) como coordinador. Se evitó a todacosta la duplicación de esfuerzo, "repartiéndose" los cromosomas oregiones entre países y laboratorios. La Unión Europea secuenció el 55%, elCentro Sanger (UK), 17%, la Universidad Washington en St. Louis, 15%,Universidad de Stanford, 7%, Universidad McGi11 (Canadá), el 4%, y unlaboratorio japonés (RIKEN), el 2%.

El genoma del nematodo Caenorhabditis elegans se terminará de secuenciar en1998, con una intervención esencial del Centro Sanger.

El de la mosca del vinagre (Drosophila melanogaster) está muy avanzado

Dentro de los mamíferos está en curso igualmente la cartografía ysecuenciación del genoma del ratón.

Y no hay que olvidar que la biología Vegetal está muy interesada a su vezen descifrar los genomas de especies modelo tanto monocotiledóneas (arroz, maíz)como dicotiledóneas (de estas últimas, el modelo más avanzado es el deArabidopsis thaliana).

IDENTIFICACION DE LOS GENES ASOCIADOS AFENOTIPOS

Genes de rasgos mendelianos

Clonación funcional

Cuando se tiene información bioquímica sobre un rasgo monogénico, esposible en principio diseñar alguna estrategia para seleccionar el gencorrespondiente de la genoteca, lo que se ha llamado clonación funcional. Estees el caso del factor VIII de coagulación.

Clonación posicional

La clonación funcional no siempre es posible. Cuando, como ocurre con lagran mayoría de enfermedades genéticas, se desconoce la base bioquímica delrasgo, hay que recurrir a otras estrategias, a menudo laboriosas. Como ejemplo,la clonación posicional de genes de enfermedades: consiste en ir estrechando elcerco al gen a partir de su localización cromosómica (genética inversa). Laclonación posicional era una estrategia ya empleada antes del PGH:

     

  1. Se parte de una colección de pedigrís en la que se ve la cosegregación del rasgo mutante respecto a múltiples marcadores gen éticos polimórficos. En humanos, lo ideal es que la separación entre marcadores no sea mayor de 1 cM. Luego, por paseo o salto cromosómico, se va uno acercando al gen.

     

     

  2. Identificación del gen mediante una serie de técnicas

     

    • Zoo-blots
    • Islas de CpG sin metilar
    • Selección de ADNc
    • Atrapamiento de exones

Ejemplos de genes aislados por clonación posicional:

    • Fibrosis quístíca
    • Distrofia muscular de Duchenne
    • Neurofibromatosis tipo 1
    • Alzheimer familiar
    • Cloroidemia.

Análisis de genes candidatos

Se han aislado muchos genes por clonación posicional, pero la mayoría deellos sobre la base de mutaciones de delección, translocación oamplificaciones de trinucleótidos. La clonación posicional a partir demutaciones puntuales es más ardua, y suele requerir muchos marcadores cercanosal gen y una cartografía fina de desequilibrio de ligamiento. Por ello, serecurre a otra estrategia: enfoque del candidato posicional: se usa informacióndisponible sobre función y posición en el mapa de genes previamente aislados,información que puede proceder de otros proyectos genoma o de ESTs/ADNc.

Por ejemplo, una EST aleatoriamente aislada y homóloga con una glicerol-quinasa de S. subti¡is se cartografió en la región Xp21 humana. Trasobtener un ADNc más largo, se vio ese era el correspondiente al gen en cuestión.

  • Gen de la retinitis pigmentosa.
  • Síndrome de Marfan.
  • Cardiomiopatía hipertrófica familiar
  • Atrofia muscular espinal y bulbar.
  • Síndrome de Waandenburg
  • Esclerosis lateral amiotrófica.

Este tipo de estrategia se hará cada vez más importanteconforme avance el PGH. En el futuro, cuando se asigne un nuevo rasgo a unanueva posición específica del mapa, será posible interrogar a las bases dedatos genómicas, y obtener para esa porción genómica una lista de los otrosgenes asignados a esa región. Las características de los genes se compararánentonces con las características del rasgo para encontrar el candidato másverosímil.

En resumidas cuentas, el PGH va a simplificar y abaratar la búsqueda degenes relativos a enfermedades mediante estrategias de clonación posicional.

  • Predicción y análisis de genes mediante bioinformática
  • Conforme avanza el PGH, se hace cada vez más importante la predicción de genes por medio de bioinformática: Algunos métodos:
  • Predicción de genes a partir de secuencias mediante programas como el GRAIL.
  • Búsquedas de similitudes (BLAST, FASTA).
  • Comparación con secuencias de organismos modelo.
  • ESTs.
  • Perfiles de secuencia y modelos de Markov ocultos.

La bioinformática tiene ante sí un formidable reto, dado el diluvio dedatos que está cayendo en las bases de datos. Habrá que desarrollar nuevos ypotentes algoritmos, y de aplicar buenas estrategias de ingeniería y gestiónde la información, capaces de sacar provecho a los datos e integrarlos paradarles sentido biológico, según los programas de investigación que cadacentro o grupo se plantee.

Estudio de rasgos complejos y cuantitativos

Los rasgos complejos (poligénicos) se pueden clasificar como rasgosdiscretos (medidos según un resultado específico: diabetes, infarto demiocardio) o como rasgos cuantitativos (medidos por una variable continua). Sonestos rasgos los que plantean más problemas a la hora de adscribirlos a losgenes correspondientes, pero ya hay varias estrategias para estudiarlos.

Identificación de loci de rasgos cuantitativos (QTls)

Sólo se ha vuelto posible con la llegada de los RFLPs. Las estrategiasconsisten en cruzar dos razas puras que difieran sustancialmente en un rasgocuantitativo.

La progenie segregante se analiza tanto para el rasgo como para una serie demarcadores. Se emplea en animales y plantas domésticos.

Análisis de rasgos complejos en humanos

Uno de los mayores retos del PGH será identificar y caracterizar los genesresponsables de rasgos complejos, incluyendo las enfermedades poligénicas ymultifactoriales. Los rasgos poligénicos son difíciles de estudiar en humanos,y evidentemente no se puede recurrir a estudios de cruces controlados como enlos animales y plantas.

Cosegregación en estudios familiares

Se parte de familias con individuos afectados. Los genes de la enfermedad sepueden identificar por cosegregación con marcadores genéticos (p. ej.,microsatélites) estrechamente ligados, que mostrarán identidad pordescendencia en los individuos afectados. Este enfoque se está volviendo más cómodoy rápido gracias a las técnicas de genotipado rápido basado enfluorescencia, que permiten rastrear el genoma completo en poco tiempo. Medianteeste tipo de estrategia se han logrado varios éxitos:

Genes responsables de mayor o menor susceptibilidad a enfermedadesinfecciosas, como la malaria. Además, ello abre nuevas vías al desarrollo devacunas.

Genes de susceptibilidad a diabetes tipo 1 y tipo 2: algunos han resultadoser genes del complejo HLA-DR. También la porción 5' del mismo gen de lainsulina, y otros genes a caracterizar.

Genes relacionados con susceptibilidad a osteoporosis: polimorfismos en genesde receptores de vitamina D. ¿Una puerta abierta al diagnóstico y prevenciónde la osteoporosis postmenopáusica?

A principios de 1997 se creó en Baltimore el Centro de Investigación sobreEnfermedades Hereditarias (CIDR), por acuerdo entre los NIH y la UniversidadJohn Hopkins, y que se dedicará especialmente al genotipado de enfermedadescomplejas (diabetes, enfermedades neuropsiquiátricas, esclerosis múltiples,etc). Este centro está dotado de tecnologías informáticas y biológicas de últimageneración, y realizará genotipado de entre 2 y 4 millones de marcadores cadaaño. Pondrá aprueba nuevas tecnologías como genotipado basado en chips de ADNy en espectroscopía de masas.

Métodos de rastreo de genomas

Sería ideal contar con métodos capaces de rastrear genomas completos enbusca de secuencias relacionadas con un determinado rasgo complejo. Citemosalgunos intentos:

Rastreo genómico de malos emparejamientos (GMS).

Rastreo por rotura enzimática de malos emparejamientos (EMC) con resolvasasde fagos.

LA ERA POSTGENÓMICA: LA PRÓXIMA REVOLUCIÓN DELA BIOLOGíA

Desde el punto de vista de la práctica de la biología básica, el proyectogenoma está acentuando un par de tendencias que ya se dejaban sentir en los últimosaños: por un lado la necesidad de formar nuevos tipos de biólogos capaces detender puentes entre varias disciplinas, que se muevan con comodidad en unentorno de ordenadores, autopistas de información y gigantescas bases de datose imágenes; y por otro lado, la reorganización de los laboratorios einstitutos de investigación, donde interaccionen especialistas en diversos ámbitosde las Ciencias de la Vida, matemáticos, informáticos, químicos, etc.

No hay que olvidar que lo que entendemos por Proyecto Genoma consiste enprincipio en la obtención de información estructural más o menos en bruto,pero lo realmente importante empieza después (en realidad, simultáneamente):dar sentido biológico, tanto funcional como evolutivo a tal cúmulo deinformación, es decir, extraer auténtico conocimiento. La "orgía dedatos" que se nos viene encima habrá de ser "digerida"adecuadamente, impulsando nuevos avances a base de sugerir nuevos enfoques,nuevos experimentos, renovadas hipótesis de trabajo, todo ello retroalimentándoseen un "circulo virtuoso" que abrirá las puertas de una nueva era enlas Ciencias Biológicas. Se habla por ello de una "Era Postgenómica",en la que se irán integrando los conocimientos acumulados en diversos"Atlas" del ser humano y de otros seres vivos, en los que se podráninterrelacionar de modo funcionalmente significativo diversos niveles decomprensión de la materia viva: génico, genómico, regulación, biologíacelular, fisiología, evolución, etc. El impacto real de todo ello no se puedeprever, pero no cabe duda que el PGH sienta las bases de un salto cualitativo ycuantitativo en nuestra visión del mundo vivo.

En la era post-genómica habrá muchas tareas por hacer (véase p. ej.Lander, 1996):

Identificación de las variantes alélicas más comunes de los genes humanos.Se trata de formar una especie de catálogo con las variantes alélicas másfrecuentes (denominadas isotipos) de los genes humanos. Se calcula que paraencontrarlas bastará re-secuenciar las regiones codificadoras de unos 100individuos tomados al azar, y ello se podría llevar a cabo rápidamente con latécnica del chip de ADN. Correlacionando esas variantes con la incidencia deenfermedades, se podrá dar un salto adelante para identificar genes desusceptibilidad a numerosas enfermedades (y esto, sin recurrir a los clásicos ycomplejos estudios con "sagas familiares"). Se abre un campo inmenso alo que podríamos llamar estudios epidemiológicos a base de genética depoblaciones, con la ayuda de las herramientas genómicas.

Avances en los estudios evolutivos por comparación de genomas completos dediversos organismos. Tendremos a nuestro alcance la comprensión de multitud deaspectos insospechados de los más de 3000 millones de años de evolución. Seaclararán filogenias completas, se estudiarán familias de genes y proteínas,viendo cómo sus miembros varían y adquieren nuevas funciones en distintoslinajes; se aclararán mecanismos genéticos evolutivos, etc.

Estudios de "transcriptoma", es decir, entender cómo, cuándo ypor qué se activan o se silencian distintos juegos de genes, en función deltipo celular, del tiempo, de los estímulos, etc. La comprensión de loscircuitos de regulación según la fase de desarrollo del organismo y el órgano/tejidoes uno de los retos de la fase post-genómica en la que ya estamos. Losproyectos genoma de ciertos organismos modelo (levadura, Caenorhabditis, moscadel vinagre, incluso ratón) prevén la obtención de miles de mutantes, de modoque virtualmente se disponga de razas inactivadas para cada gen concreto (razasnoqueadas genéticamente, K.O.); de ese modo se podrán comprobar los fenotiposresultantes, a distintos niveles, permitiendo aclarar la función genética.Igualmente se pueden emplear técnicas de disrupción transitoria de la funcióngenética (como los oligonucleótidos antisentido y las ribozimas) para estudiarla expresión de genes no susceptibles de analizar mediante la transgénesisinactivadora en línea germinal.

Un ejemplo de este tipo de estudios está en un trabajo aparecidorecientemente (9 de abril de 1998) en "Nature" (vol. 392, pp.608-611). En él, miembro de la empresa Lexicon Genetics describen la aplicaciónde un método de mutagénesis en células madre embrionarias (ES) de ratón, quepermite obtener miles de mutantes "marcados" con una etiqueta genética,de modo que luego se puede identificar el gen alterado y estudiar su función.

Estudios de "proteoma": seguimiento de la expresión al nivel detraducción y post-traducción en cada tipo celular, y en función de nuevo dela fase de desarrollo y de las señales recibidas por la célula. Uno de losretos es automatizar y hacer más sencilla la técnica de geles bidimensionales,y a ser posible fusionarla con alguna técnica espectroscópica paracaracterizar los cientos o miles de proteínas de cada muestra, e incluso lasinteracciones entre proteínas.

Un atisbo de lo que puede ser esta era post-genómica del PGH la tenemos yacon la levadura, una vez finalizada la secuenciación de su genoma:

Tras la finalización del proyecto genoma de levadura

Generación de mutantes de delección específicos: Es perfectamente factibleemprender la delección sistemática de todos y cada uno de los 6000 genes. Paraello se ha diseñado una de disrupción génica dirigida por PCR y que aprovechala eficiencia y precisión del sistema de recombinación mitótica delorganismo. El método permite la sustitución de cualquier gen de la levadura,incluyendo las razas industriales. Se pretende obtener una biblioteca de 6000razas de delección, una por cada ORF o gen, y en la que cada cepa estarámarcada con un ologonucleótido, a modo de código de barras molecularidentificador.

Análisis fenotípico cuantitativo: análisis de control metabólico (MCA) dearriba a abajo

El transcriptoma El transcriptoma es el conjunto de genes expresados,junto con su nivel de transcripción, bajo un conjunto dado de condiciones. Seestán poniendo a prueba varias estrategias:

Un enfoque que se está ensayando es el análisis en serie de la expresión génica(SAGE). Se trataría de determinar las condiciones fisiológicas y fases dedesarrollo en las que genes y grupos de genes concretos se expresan, y derelacionar estos patrones de expresión con los de los genes cuyas funciones seconocen bien.

Otros enfoques distintos son el despliegue diferencial (differential display)y las tecnologías de hibridación en formación ordenada (hybridation-array).Esta ofrece buenas esperanzas de lograr un análisis a gran escala con buenosrendimientos. Recuérdese lo dicho sobre los microchips de oligonucleótidos.

Lo que es cierto es que el análisis clásico tipo Northern no sirve paraesto. Se espera que incluso termine recurriéndose al uso de paneles solapadosde oligonucleótidose en hibridación en formación para la correlación entretranscritos individuales y las ORF correspondientes.

También aquí será importante agrupar los genes en unidades funcionalmenterelacionadas, que es de esperar contengan genes de función ya conocida.

El proteoma Se trata del conjunto de proteínas que se encuentran en unacélula bajo unas condiciones determinadas. El proteoma de levadura se estáestudiando mediante electroforesis bidimensional, usando espectrografía demasas para identificar las proteínas contenidas en las manchas del gel. Seráimportante caracterizar proteínas de complejos proteicos, que suministraríanun importante correlato bioquímico de los datos in vivo.

Análisis funcionales de todo el genoma, recurriendo a novedosas tecnologíasgenéticas y bioinformáticas, incluyendo los chips de ADN.

En general, los análisis genómicos globales funcionales suministran unaclasificación funcional más que una comprensión detallada de cada gen. Paraesto último habrá que volver a los estudios de corte más clásico, sobregenes o grupos de genes.

Como dice Fred Sherman, uno de los líderes del Proyecto genoma de Levadura,tener la secuencia del genoma no es muy diferente a tener uno de los grandes catálogosde productos bioquímicos comerciales que tanto usan los biotecnólogos. Cadalaboratorio dispone de ese catálago, pero cada uno usa un conjunto limitado desus recursos, en función del tipo de investigación y del problema biológicoque quiera abordar. Disponer del atlas del genoma y de las herramientas deestudio de rasgos complejos impulsará la biología del siglo XXI de un modo queno podemos sospechar aún.

Avances en la medicina

El PGH influirá poderosamente en la Biomedicina de los próximos lustros:permitirá avanzar en el conocimiento de la base de muchas enfermedades(Medicina Molecular), y abrirá perspectivas nuevas en el diagnótico, pronósticoy tratamiento, aunque esto último, necesitado de mucha investigación de tipopost- genómico, vendrá con más retraso.

Comprensión de la base molecular de las enfermedades

Uso de los modelos de ratones transgénicos

Los ratones se pueden manipular en línea germinal e inactivar de mododirigido genes. De esta forma se han logrado modelos de numerosas enfermedadeshumanas, sobre todo las que afectan al sistema inmune y al desarrolloembrionario. Actualmente existen unas 1000 razas de ratones K.O. (noqueados), yobtener cada una de ellas cuesta una media de $ 100.000 y unos 10 meses dedesarrollo.

En 1997 el Instituto Merck de Investigación Genómica anució que iba afinanciar con $ 8 millones a la empresa Lexicon Genetics para crear 150 nuevasrazas de ratones K.O. usando una nueva tecnología desarrollada por esa compañía.La Merck pretende que las razas de ratón creadas en el proyecto quedendisponibles para los investigadores aun precio nominal. La estrategia de Lexiconconsiste en insertar un pequeño trozo de ADN aleatoriamente en células madreembrionarias. El ADN insertado inactiva la función del gen donde se inserta, yjunto con algunas secuencias adyacentes transcribibles del ratón, suministra unsitio-etiqueta único. Luego se recupera esa etiqueta, de modo que se puedeaveriguar la identidad del gen inactivado.

Durante los próximos 3 años, Lexicon pondrá a trabajar robots de altorendimiento para generar unos 500.000 clones mutantes de células madreembrionarias de ratón, cantidad suficiente para que cada gen quede marcado einactivado una media de 5 veces. Las células clonadas se guardan en nitrógenolíquido. Para final de este año se espera disponer ya de 50.000 clones.Cualquier investigador con un gen clonado o secuenciado podrá consultar la basede datos OmniBank para localizar los clones que lleven una insercióninactivadora en el gen en que trabajan. Las células de ese clon o clones sedescongelan y se usan para crear el correspondiente ratón transgénco K.O., del.- que se estudiará el fenotipo a nivel anatomo-histológico, fisiológico,etc. (Volvemos a remitir al lector al artículo publicado en "Nature"(vol 392: 608-611 [1998])con un ejemplo de cómo esta empresa está aplicandoeste método prometedor.

CONCLUSION

Desde el momento que se decidió introducir fragmentos de (ADN) en el Genomade un individuo que de un modo arrojo saldos positivos para los investigadores ysu función en vivo.

El interés y preocupación de los investigadores empezó a aumentar ytranscender hacia otros sectores de la sociedad en el decenio de 1980, al tenerconciencia de la viabilidad y factibilidad de modificar genéticamente las células.

Entendiendo la importancia del Genoma Humano debemos tomar en cuenta de cualpueden ser sus consecuencias en el ámbito social, éticas, jurídicas, etc.

Los primeros resultados ya han estimulado un debate sobre si conviene o nopatentar para uso comercial, las secuencias de Genes Humanos y de poner lainformación sobre Genética Humana a disposición, así como corregir defectosGenéticos de forma que podría transmitirse de generación en generación, perohay que destacar la relevancia que tiene el proyecto Genoma Humano en cuanto aque traería conocimientos y abriría nuevas puertas ala ciencia del mañana,pero será necesario delimitar los procesos de estudio según el derecho aladignidad humana.

En fin podemos decir que la realización de la investigación del GenomaHumano, permite asumir muchas consideraciones, entre las cuales podemos nombrara manera de conclusión:

_Las investigaciones acerca del Genoma suponen un aporte importante en tornoal, futuro genético del hombre.

_El aporte de las deducciones realizadas a partir del estudio de la cadena deADN permitirán mejorar la calidad de vida del hombre desde la perspectiva de lasalud.

_Los estudios acerca del Genoma suponen una relación de carácter científicotecnológico.

_Los estudios en tomo al Genoma supondrán la curación de enfermedades quehan estado afectando al hombre( cáncer, HIV) así como herejías genéticas.

_Permitirá mejorar la estructura física del hombre.

_Permitirá la escogencia de nuevos elementos y perfiles para el hombre delfuturo.

BIBLIOGRAFIA

-Enciclopedia Encarta 98

-Trabajo practico de Genoma, de Juan Andrés Toselli en wwwv.monografias.com

-Declaraciones de la asociación medica Mundial sobre el proyecto GenomaHumano, en www.uma.net/s/policy/17-5-1_5.html.

-Aplicaciones de la Ingeniería Genética en www.geocitees.com/genetica2000.

-El Genoma Humano del Dr. Francisco Lenadro Loicano en www.alfinal.com

-Biología I. Editorial Santillana

-Química II. Editorial Santillana.

-Diario la nación en www.lanacion.com.ar, Febrero-Agosto 2002

-Clarín Digital en www.clarin.com .ar , Febrero-Agosto 2002

ANEXOS

 

 

 

Realizado por:

Maria A. Alcalá O.

Rondón, Marvelis.

Urbano, Yamilka

yamilkilla22@yahoo.es

PTO. LA CRUZ,

Articulos relacionados:
Normas de Procedimiento en Hemocultivos
Resumen:
En consideración de que el síndrome séptico constituye una grave emergencia médica, la prontitud y certeza en el diagnóstico etiológico de una septicemia, es una responsa...
Grasas
Resumen:
Hidrólisis. Propiedades de las grasas. Origen y destino de los glicéridos en el organismo. Otros lípidos. Fitosterinas. Acidos saturados. Acidos no saturados.(V)
Taxonomía
Resumen:
Necesidad de una clasificación. ¿Que es una especie?. Designación de una especie. Clasificación jerarquica. El enigma del panda gigante. Filogenia. Metodolgias alternariv...
Ecología alimenticia de los pelágicos menores del Golfo de California, México
Resumen:
Los pelágicos menores son peces marinos que forman grandes cardúmenes, tienen una distribución cosmopolita y constituyen los principales recursos pesqueros en todo el mun...
Los microbios y la minería
Resumen:
Resumen de las conferencias presentadas por el Biólogo José Jesús Guerrero Rojas en e/ Segundo Congreso Nacional de Minería, realizado en Trujillo ,del 16 al 19 de Agosto de 1998.
Copyright © 2011 ilustrados.com, Monografias, tesis, bibliografias, educacion. Tofos los temas y publicaciones son propiedad de sus respectivos autores ©