Información

Utilidad práctica de los genes responsables de la biosíntesis de un compuesto útil en una planta


Suponiendo que una planta leñosa tiene naturalmente un compuesto valioso, digamos una especie de esterol. Durante un análisis de RNA-seq, se identificaron en la planta casi todos los genes implicados en la ruta de biosíntesis de este esterol. Me preguntaba cuáles son los beneficios de este hallazgo. Si este estudio se realizó en una bacteria u hongo en lugar de una planta, la importancia de este hallazgo es más clara, al menos para mí, ya que estos organismos simples pueden ser la fábrica de compuestos valiosos mediante tecnología de ingeniería genética. Pero, ¿qué pasa con una planta leñosa que no se puede manipular y cultivar a granel?


Básicamente, dio la respuesta en su pregunta. Al identificar las vías biosintéticas necesarias para crear el compuesto en la planta, su huésped natural, esos genes pueden luego clonarse y transferirse a un sistema de expresión como bacterias, levaduras u otras células vegetales como Arabidopsis thaliana para generar cantidades mayores del compuesto de interés de lo que sería posible cosechar y procesar la planta original en sí.


Herramientas de edición de genes y genomas para la reproducción de fenotipos deseables en plantas ornamentales

Revisamos los principales genes que subyacen a los rasgos comerciales en las especies de flores cortadas y discutimos críticamente la posibilidad de aplicar enfoques de edición del genoma para producir variaciones y fenotipos novedosos.

Abstracto

Promover la floración y la longevidad de las flores, así como crear novedad en la estructura, la gama de colores y las fragancias de las flores, son los principales objetivos del fitomejoramiento de plantas ornamentales. Las novedosas técnicas de edición del genoma añaden nuevas posibilidades para estudiar la función de los genes y generar nuevas variedades. La implementación de tales técnicas, sin embargo, se basa en información detallada sobre la estructura y función de los genomas y genes. Además, se requieren protocolos mejorados para la entrega eficiente de reactivos de edición. En esta revisión se analizan los resultados recientes de la aplicación de técnicas de edición del genoma a cultivos ornamentales de élite. Se examinan las tecnologías habilitadoras y los recursos genómicos en relación con la implementación de tales enfoques. La disponibilidad de las principales secuencias de genes, los rasgos comerciales subyacentes y los protocolos de transformación in vitro se proporcionan para las flores cortadas más vendidas del mundo, a saber, rosa, lirio, crisantemo, lisianthus, tulipán, gerbera, fresia, alstroemeria, clavel e hortensia. Se describen los resultados obtenidos hasta ahora y se discuten sus implicaciones para la mejora de la floración, arquitectura floral, color, aroma y vida útil.

Material complementario electrónico

La versión en línea de este artículo (10.1007 / s00299-020-02632-x) contiene material complementario, que está disponible para usuarios autorizados.


Los 6 mejores ejemplos de plantas transgénicas | Genética

Los siguientes puntos destacan los seis ejemplos principales de plantas transgénicas. Los ejemplos son: 1. & # 8220High Lisine & # 8221 Maíz 2. Fijación de nitrógeno mejorada 3. Plantas tolerantes a herbicidas 4. Variedades resistentes a insectos 5. Esterilidad masculina 6. Plantas transgénicas como biorreactores (agricultura molecular).

Ejemplo # 1. & # 8220 Alta lisina & # 8221 Maíz:

Las proteínas almacenadas en las semillas de las plantas funcionan como reservas de aminoácidos que se utilizan durante la germinación de las semillas y el crecimiento previo a la emergencia de las plántulas jóvenes. Las proteínas de almacenamiento de semillas de plantas también proporcionan la principal fuente de proteínas en las dietas de la mayoría de los seres humanos y animales superiores herbívoros.

En todo el mundo, se estima que las semillas de legumbres y cereales proporcionan a los seres humanos el 70 por ciento de sus necesidades dietéticas. Desafortunadamente, las principales proteínas de almacenamiento de semillas de cereales, llamadas prolaminas (zeínas en el maíz o maíz), carecen virtualmente del aminoácido lisina.

Dado que las prolaminas representan aproximadamente la mitad del contenido total de proteínas de las semillas de cereales, las dietas basadas principalmente en cereales serán deficientes en lisina (un aminoácido esencial). En el caso del maíz, las proteínas de la semilla también son deficientes en triptófano (otro aminoácido esencial) y, en menor medida, en metionina (un aminoácido esencial).

Debido a la importancia de las semillas de cereales como alimentos para humanos y animales, los fitomejoradores han intentado durante varias décadas desarrollar variedades con mayor contenido de lisina, triptófano y metionina.

En com, mutantes como opaco-2, azucarado-1 y harinoso-2 tienen mayores cantidades de lisina y / o metionina en semillas, pero estas cepas mutantes tienen granos blandos indeseables y producen rendimientos más bajos. Todas estas cepas mutantes & # 8220 de alta lisina & # 8221 son el resultado de mutaciones que alteran las proporciones relativas de diferentes proteínas de almacenamiento de semillas.

En general, reducen el contenido de prolamina (zeína) de modo que otras proteínas de la semilla representan una proporción mayor del total de proteínas de la semilla. Esto, a su vez, aumenta las cantidades relativas de lisina y / o metionina en las semillas.

Se han clonado y secuenciado varios genes de zeínas que codifican maíz. Con esta información en la mano, los investigadores han sugerido que podría ser posible producir & # 8220 alta lisina & # 8221 maíz por ingeniería genética. Dado que las zeínas no tienen funciones enzimáticas conocidas, se podrían modificar los genes de la zeína mediante mutagénesis sin infligir ningún efecto deletéreo sobre la función o funciones.

Específicamente, se podría usar mutagénesis específica de sitio para introducir más codones de lisina en secuencias de zeína. Entonces, estas secuencias codificantes de zeína de & # 8220 alta lisina & # 8221 podrían unirse a promotores fuertes como el promotor CaMV35S y reintroducirse en plantas de maíz mediante transformación mediante electroporación o pistola de microyectiles.

Sin embargo, una posible dificultad en la ingeniería & # 8220 alta lisina & # 8221 com por este método es que las proteínas de zeína modificadas podrían no empaquetarse correctamente en las estructuras de almacenamiento de semillas.

Las proteínas zeína se sintetizan en el retículo endoplásmico rugoso y se agregan dentro de esta estructura membranosa en densos depósitos llamados cuerpos proteicos. Se cree que la formación de cuerpos proteicos implica interacciones hidrófobas y polares débiles entre los monómeros de zeína.

Si es así, los aminoácidos cargados como la lisina podrían interferir con el empaquetamiento adecuado de las zeínas durante la formación del cuerpo proteico. En 1988, B.A. Larkin y sus colegas han introducido un nuevo codón de lisina y triptófano en un ADNc de zeína mediante mutagénesis específica de sitio dirigida por oligonucleótidos.

Cuando las transcripciones de BNA de estos cDNA modificados se tradujeron eficazmente y se encontró que los productos de zeína & # 8220 de alta lisina & # 8221 se autoagregaban en estructuras densas similares a las presentes durante la formación del cuerpo polar en el maíz. Estos resultados ofrecen incentivos de que & # 8220high lisine & # 8221 com podría de hecho producirse mediante ingeniería genética.

Ejemplo # 2. Fijación de nitrógeno mejorada:

Las plantas solo pueden utilizar nitrógeno que se ha incorporado a compuestos químicos como amoníaco, urea o nitratos. Ninguna planta verde es capaz de extraer nitrógeno diatómico (N2) moléculas directamente de la atmósfera. Aunque las plantas utilizan sólo una pequeña fracción de la reserva total de nitrógeno, dependen de un suministro continuo de nitrógeno en forma utilizable (más a menudo llamado & # 8220 nitrógeno fijo & # 8221).

Se requiere la fijación continua de nitrógeno atmosférico porque el nitrógeno fijado en el suelo se agota constantemente por lixiviación, por utilización para el crecimiento de plantas y microorganismos y por bacterias desnitrificantes que convierten el nitrógeno fijo en N2. Como resultado, cada año se gastan millones de dólares / rupias en fertilizantes nitrogenados para obtener rendimientos óptimos de cultivos importantes como el maíz y los cereales.

La fijación biológica de nitrógeno es la alternativa al uso del nitrógeno fijado industrialmente que se proporciona en los fertilizantes. Varias especies de bacterias y algas inferiores son capaces de convertir N2 a formas fijas de nitrógeno que pueden ser utilizadas por las plantas.

Dado que la compra de fertilizantes nitrogenados representa uno de los mayores gastos en los que se incurre con los métodos de producción agrícola actuales, se ha realizado un esfuerzo importante y se sigue dedicando al desarrollo de métodos mejorados de fijación biológica de nitrógeno.

Ciertas bacterias del suelo de vida libre, como Azotobacter vinelandii y Klebsiella pneumoniae, convierten directamente el nitrógeno atmosférico en amoníaco. Estas bacterias son una fuente importante de nitrógeno fijo y, además, han demostrado ser sujetos de gran valor para los estudios sobre el mecanismo de fijación del nitrógeno.

En Klebsiella, hay 17 genes nif (fijación de nitrógeno) organizados en siete operones. La complejidad de la maquinaria metabólica de fijación de nitrógeno en estas bacterias tiene implicaciones importantes para cualquiera que pueda aspirar a diseñar plantas fijadoras de nitrógeno.

La situación de la fijación de nitrógeno es muy diferente a la de la tolerancia a herbicidas. Una cosa es construir un solo gen quimérico y transferir ese gen a las plantas, pero es mucho más difícil diseñar 17 genes quiméricos diferentes, transferirlos todos a la misma planta receptora y coordinar su expresión en la planta de manera que que todos los componentes de la compleja maquinaria enzimática fijadora de nitrógeno se sintetizan en cantidades adecuadas y en las células apropiadas de la planta.

En la actualidad, la posibilidad de diseñar plantas fijadoras de nitrógeno es en gran parte una fantasía, pero recuerde que viajar a la luna era pura ciencia ficción no hace muchos años.

Algunos datos sobre la fijación de nitrógeno:

El fenómeno de fijación de nitrógeno atmosférico por medios biológicos se conoce como diazotrofia o fijación biológica de nitrógeno y estos procariotas como diazótrofos o fijadores de nitrógeno. Por primera vez, Beijerinck (1888) aisló Rhizobium a partir de nódulos de raíces de plantas leguminosas. A partir de entonces, S. Winogradsky descubrió una bacteria fijadora de nitrógeno de vida libre, Clostridium pasteurianum.

Luego, se descubrió una gran cantidad de fijadores de nitrógeno de diferentes fuentes y asociaciones. Por ejemplo, Frankia de nódulos de no leguminosas (por ejemplo, aliso, Casuarina, etc.), Nostoc de líquenes, Anabaena de hojas de Azolla y raíces coralloides de Cycas. Los diazótrofos pueden ser de vida libre o en forma simbiótica.

Los heterocistos son los sitios de fijación de nitrógeno en algunas cianobacterias, por ejemplo, Anabaena, Nostoc, etc. Los heterocistos se forman en ausencia de nitrógeno combinado utilizable, como el amoníaco, porque inhibe la diferenciación de heterocistos y N2-enzima fijadora, la nitrogenasa. Los heterocistos carecen del fotosistema II que genera oxígeno, del bifosfato de ribulosa y pueden bloquear las biliproteínas fotosintéticas.

La clorofila-a está presente en heterocistos. La pared del heterociste contiene O2 glicolípidos de unión que, junto con el consumo respiratorio, mantienen las condiciones anaeróbicas (es decir, atmósfera muy reducida) necesarias para N2 fijación. Por el contrario, las células vegetativas adyacentes a los heterocistos, tanto el fotosistema I como el II están presentes, por lo tanto, estas células tienen lugar la evolución de oxígeno.

Otras cianobacterias que carecen de heterocistos también realizan fijación de N2, por ejemplo, Oscillatoria (ver Dubey 2006).

Otra fuente muy importante de nitrógeno fijado biológicamente es la relación simbiótica entre bacterias del género Rhizobium y plantas de la familia Leguminosae (alfalfa, tréboles, soja, maní, guisantes, etc.).

Esta fijación simbiótica de nitrógeno ocurre en nódulos radiculares altamente diferenciados que se desarrollan cuando la bacteria Rhizobium interactúa con las raíces de las leguminosas. La formación de nódulos depende de la información genética tanto de las plantas como de la bacteria. La nitrogenasa que cataliza N2 la reducción está codificada por el genoma bacteriano, pero el nitrógeno fijado se utiliza para el crecimiento tanto de bacterias como de plantas hospedadoras.

Una vez que se conozcan los mecanismos responsables de establecer esta relación simbiótica y de la formación de nódulos, y se hayan identificado los genes que controlan estos procesos, podría ser posible utilizar la ingeniería genética para modificar plantas no leguminosas (por ejemplo, maíz, arroz y trigo, de modo que participen en relaciones simbióticas similares con las bacterias fijadoras de nitrógeno.

Sin embargo, una vez más, esta será sin duda una tarea desafiante porque el control genético de la formación de nódulos es claramente complejo. No obstante, se están realizando experimentos con el objetivo de modificar las bacterias para mejorar su capacidad de fijación de nitrógeno y ampliar su rango de hospedadores para incluir especies de plantas adicionales.

Ejemplo # 3. Plantas tolerantes a herbicidas:

El desarrollo de variedades tolerantes a herbicidas de plantas de importancia agronómica como el maíz, la soja y las cereas promete tener un gran impacto en la agricultura, tanto en la economía como en las prácticas de producción. Las malas hierbas compiten con los cultivos por los nutrientes del suelo y de manera rutinaria provocan pérdidas significativas en el rendimiento.

La agricultura moderna utiliza herbicidas para controlar las malas hierbas y minimizar las pérdidas. Desafortunadamente, los herbicidas disponibles rara vez brindan el grado de especificaciones que se desea, y la mayoría de los herbicidas controlarán solo ciertas clases y no otras.

Los herbicidas de amplio espectro pueden proporcionar un buen control de malezas, pero al hacerlo, también suelen tener efectos perjudiciales sobre el crecimiento de las plantas de cultivo. Como resultado, los científicos ahora están considerando enfoques alternativos para el control de malezas.

El más prometedor de los enfoques alternativos es el desarrollo de variedades de plantas tolerantes a herbicidas para su uso con herbicidas de amplio espectro o totalmente inespecíficos. Obviamente, el valor económico potencial de las variedades de plantas tolerantes a herbicidas es significativo.

Los herbicidas son compuestos químicos simples que matan o inhiben el crecimiento de plantas sin efectos nocivos para los animales. Los herbicidas suelen inhibir los procesos que son exclusivos de las plantas, por ejemplo, la fotosíntesis.

Con mayor frecuencia, los herbicidas actúan como inhibidores de reacciones enzimáticas esenciales. Por lo tanto, cualquier cosa que disminuya el nivel de inhibición proporcionará una mayor tolerancia a los herbicidas.

Las dos fuentes más comunes de tolerancia a herbicidas son:

(1) Sobreproducción de la enzima diana y

(2) Mutaciones que dan como resultado enzimas que son menos sensibles al inhibidor (generalmente debido a una menor afinidad de la enzima por el inhibidor).

Parece probable que la estrategia más exitosa para desarrollar plantas tolerantes a herbicidas sea combinar ambas fuentes de tolerancia, es decir, diseñar plantas que produzcan en exceso enzimas mutantes tolerantes a herbicidas. Podemos considerar, aquí, el ejemplo del glifosato.

El glifosato es uno de los herbicidas de amplio espectro más potentes que se conocen y se comercializa con el nombre comercial Roundup El glifosato actúa inhibiendo la enzima 5-enolpiruvilshikimato 3-fosfato sintasa (EPSP sintasa), un compuesto esencial en la biosíntesis de los aminoácidos aromáticos tirosina , fenilalanina y triptófano.

Estos aminoácidos aromáticos son componentes esenciales en las dietas de los animales superiores ya que las enzimas que catalizan la biosíntesis de estos aminoácidos no están presentes en los animales superiores. Por lo tanto, dado que los animales superiores contienen EPSP sintasa, el glifosato no tiene efectos tóxicos en los sistemas animales. En este sentido, el glifosato es un herbicida ideal.

El glifosato de herbicida inhibe las EPSP sintasas de microorganismos así como las de plantas. Al seleccionar el crecimiento en presencia de concentraciones de glifosato que inhiben el crecimiento de bacterias de tipo salvaje, los investigadores han podido aislar mutantes tolerantes al glifosato de Salmonella typhimurium, Aerobacter aerogenes y Escherichia coli.

En las bacterias, la EPSP sintasa está codificada por el gen aroA. Cuando los genes aroA bacterianos mutantes recibieron promotores de plantas y señales de poliadenilación (genes quiméricos productores) y se introdujeron en las plantas, las plantas transgénicas mostraron una mayor tolerancia al glifosato (herbicida).

En las plantas, la síntesis de aminoácidos aromáticos tiene lugar en los cloroplastos, pero los genes que codifican las enzimas biosintéticas como la EPSP sintasa son genes nucleares. Los productos de traducción contienen un péptido de tránsito que dirige la proteína a los cloroplastos.

Este péptido de tránsito se escinde luego proteolíticamente al entrar en los cloroplastos para producir la enzima activa. Los experimentos han demostrado ahora que el péptido de tránsito de petunia dirigirá el producto del gen aroA de E. coli a los cloroplastos de tabaco y producirá tolerancia al glifosato en las líneas celulares receptoras.

Ejemplo # 4. Variedades resistentes a insectos y enfermedades:

Varios microorganismos y ciertas plantas nativas producen proteínas que son tóxicas para patógenos vegetales específicos, tanto patógenos microbianos como insectos que se alimentan de plantas. Uno de los objetivos de la ingeniería genética vegetal es transferir los genes que codifican estas toxinas proteicas a plantas de importancia agronómica con la esperanza de que la expresión de los genes de la toxina en estas plantas proporcione un control biológico Enfermedad-insecto de al menos algunas enfermedades de las plantas y plagas de insectos.

Actualmente, las plantas resistentes a las enfermedades de las plantas y las plagas de insectos se controlan casi exclusivamente mediante el uso de bactericidas, fungicidas e insecticidas químicos de amplio espectro. Sin embargo, existen motivos de preocupación por el daño potencial a los ecosistemas y la contaminación de las aguas subterráneas que podría resultar del uso generalizado de estos productos químicos en cultivos agrícolas. Por lo tanto, los científicos están buscando métodos alternativos para controlar estos patógenos.

El ejemplo más conocido del uso de productos genéticos naturales para controlar las plagas de las plantas son las toxinas de insectos de Bacillus thuringiensis. Cada uno de los genes de toxina de B. thuringiensis codifica una proteína grande que se agrega para formar cristales de proteína en las esporas y estos cristales de proteína son altamente tóxicos para ciertos insectos.

Algunos de los insectos que mueren a causa de estas toxinas proteicas son plagas de plantas de gran importancia económica. Diferentes subespecies de B. thuringiensis producen toxinas que matan a diferentes insectos. Por ejemplo, la toxina producida por B. thuringiensis subespecie kurstaki mata las larvas de lepidópteros como el gusano cuerno del tabaco.

Se ha aislado el gen que codifica esta toxina y se ha demostrado que sintetiza una toxina funcional en E. coli. Un gen quimérico con la estructura del promotor CaMV35S / B. Se construyó la secuencia codificante de la toxina kurstaki de la subespecie thuringiensis / secuencia de terminación Ti nos 3 & # 8242.

Este gen quimérico se colocó en un vector Ti, y las células del disco de la hoja de tomate se transformaron mediante cultivo conjunto con A.tumefaciens que albergaba la construcción del gen quimérico del vector Ti modificado por ingeniería. Se regeneraron plantas de tomate transgénicas y se demostró que expresaban el gen quimérico. La toxicidad del producto génico sintetizado en las plantas transgénicas se ensayó permitiendo que las larvas del gusano cuerno del tabaco se alimentaran de las plantas transgénicas y de las plantas de control.

Todas las larvas aplicadas a las plantas transgénicas murieron a los pocos días. Las larvas aplicadas a las plantas de control permanecieron sanas y finalmente consumieron las plantas enteras. Estos resultados apoyan la viabilidad de utilizar la ingeniería genética para producir tomate transgénico. Variedades de plantas resistentes a patógenos.

La tecnología transgénica proporciona un método alternativo e innovador para mejorar el manejo del control de plagas que son ecológicos, efectivos, sostenibles y beneficiosos en términos de rendimiento. Los primeros genes disponibles para la ingeniería genética de plantas de cultivo para la resistencia a plagas fueron los genes cry (conocidos popularmente como genes Bt) de la bacteria Bacillus thuringiensis. Estos genes son específicos de un grupo particular de plagas de insectos y no son dañinos para otros insectos útiles como mariposas, gusanos de seda y abejas.

Se han desarrollado cultivos transgénicos (por ejemplo, algodón, arroz, maíz, papa, tomate, berenjena, coliflores, repollo, etc.) con genes Bt y dicha variedad transgenética ha demostrado ser eficaz para controlar plagas de insectos y se ha afirmado en todo el mundo que ha llevado a un aumento significativo en el rendimiento junto con una reducción drástica en el uso de pesticidas.

El ejemplo más notable es el algodón Bt (que contiene el gen cry / Ac) que es resistente a una plaga de insectos notoria (Helicoperpa armigera). El algodón Bt se adoptó para el cultivo masivo en la India en el año 2002.

Ejemplo # 5. Esterilidad masculina:

Las plantas masculinas estériles son muy importantes para evitar la polinización innecesaria y para eliminar el proceso de emasculación durante la producción de plantas híbridas. Estas plantas masculinas estériles se crean mediante la introducción de un gen que codifica una enzima (barnasa), que es una enzima hidrolizante de ARN, que inhibe la formación de polen. Este gen se expresa específicamente en las células tapetales de la antera usando el promotor específico de tapetal TA29 para restringir su actividad solo a las células involucradas en la producción de polen.

Ejemplo # 6. Plantas transgénicas como biorreactores (agricultura molecular):

Las plantas son fábricas químicas asombrosas y baratas que solo necesitan agua, minerales, luz solar y dióxido de carbono para producir miles de tipos de moléculas químicas (ver Dubey 2006). Con los genes adecuados, las plantas pueden actuar como biorreactores de nuevos compuestos como aminoácidos, proteínas, vitaminas, plásticos, productos farmacéuticos (péptidos y proteínas), fármacos y enzimas para las industrias alimentarias, etc.

Por tanto, las plantas transgénicas se pueden utilizar para los siguientes propósitos:

En la sección 58.2, bajo el título & # 8216High-lysine com & # 8217, hemos descrito cómo los cereales ricos en ciertos aminoácidos esenciales como la lisina, la metionina y el triptófano pueden desarrollarse mediante ingeniería genética. Asimismo, la profesora Inge Potrykus y el Dr. Peter Beyer están modificando el arroz en arroz dorado.

Esto se hace para que el potencial de vitamina A se mantenga incluso después de retirar las cáscaras, un procedimiento adoptado para permitir el almacenamiento ya que las cáscaras se vuelven rancias. Este cambio puede mejorar la salud de millones de personas en todo el mundo.

(ii) Proteínas diagnósticas y terapéuticas:

Las plantas transgénicas también pueden producir una variedad de proteínas utilizadas en el diagnóstico para detectar enfermedades humanas y terapias para curar enfermedades humanas y animales a gran escala y a bajo costo. Los anticuerpos monoclonales, las proteínas del plasma sanguíneo, las hormonas peptídicas y las citoquininas se están produciendo en plantas transgénicas y sus partes como el tabaco (en las hojas), la papa (en los tubérculos), la caña de azúcar (en los tallos) y el maíz (en el endospermo de las semillas).

Las plantas de cultivo ofrecen biorreactores rentables para expresar antígenos que pueden usarse como vacunas comestibles. Los genes que codifican proteínas antigénicas pueden aislarse de los patógenos y expresarse en plantas y tales plantas transgénicas o sus tejidos que producen antígenos pueden ingerirse para inmunización (vacunas comestibles).

La expresión de dichas proteínas antigénicas en cultivos como el banano y el tomate es útil para la inmunización de seres humanos, ya que ambas frutas se pueden comer crudas. Tales vacunas comestibles de plantas transgénicas tienen las siguientes ventajas: disminución de sus problemas de almacenamiento, fácil sistema de administración por alimentación y bajo costo en comparación con las vacunas recombinantes producidas por bacterias.

(iv) Plásticos biodegradables:

Las plantas transgénicas se pueden utilizar como fábricas para producir polihidroxibutirato (PHB, plásticos biodegradables). Las plantas de Arabidopsis modificadas genéticamente produjeron glóbulos de PHB exclusivamente en sus cloroplastos sin afectar el crecimiento y desarrollo de las plantas. La producción a gran escala de PHB se puede lograr fácilmente en plantas de árboles como el populus, donde el PHB se puede extraer de las hojas.


Figura 1

Figura 1. Biosíntesis de neoantimicinas. (A) El grupo de genes biosintéticos de neoantimicina BGC en Streptomyces orinoci NRRL B-3379. Las ubicaciones de Cósmido 69 y 813 están indicadas por líneas horizontales, y un doble hash vertical indica que el inserto de cósmido alberga ADN adicional que cae fuera de los límites de este esquema. (B) La ruta biosintética propuesta para las neoantimicinas. La variación estructural surge de la promiscuidad natural de los módulos NRPS 3 y 6, así como de la formilación de la unidad de arranque. A, adenilación T, tiolación C, condensación KR, cetoreductasa KS, cetosintasa AT, aciltransferasa MT, metiltransferasa ACP, proteína transportadora de acilo TE, tioesterasa.


Contenido

La definición más amplia de producto natural es todo lo que es producido por la vida, [4] [13] e incluye materiales bióticos (por ejemplo, madera, seda), materiales de base biológica (por ejemplo, bioplásticos, almidón de maíz), fluidos corporales (por ejemplo, leche , exudados de plantas) y otros materiales naturales (por ejemplo, suelo, carbón). Una definición más restrictiva de un producto natural es un compuesto orgánico que es sintetizado por un organismo vivo. [7] El resto de este artículo se limita a esta definición más estrecha. [ cita necesaria ]

Los productos naturales pueden clasificarse según su función biológica, vía biosintética o fuente. Una estimación del número de moléculas de productos naturales es de unas 326.000. [14]

Siguiendo la propuesta original de Albrecht Kossel en 1891, [15] los productos naturales a menudo se dividen en dos clases principales, los metabolitos primarios y secundarios. [16] [17] Los metabolitos primarios tienen una función intrínseca que es esencial para la supervivencia del organismo que los produce. En cambio, los metabolitos secundarios tienen una función extrínseca que afecta principalmente a otros organismos. Los metabolitos secundarios no son esenciales para la supervivencia, pero aumentan la competitividad del organismo dentro de su entorno. Debido a su capacidad para modular las vías bioquímicas y de transducción de señales, algunos metabolitos secundarios tienen propiedades medicinales útiles. [ cita necesaria ]

Los productos naturales, especialmente dentro del campo de la química orgánica, a menudo se definen como metabolitos primarios y secundarios. Una definición más restrictiva que limita los productos naturales a metabolitos secundarios se usa comúnmente en los campos de la química médica y la farmacognosia. [13]

Metabolitos primarios Editar

Los metabolitos primarios, tal como los define Kossel, son componentes de las vías metabólicas básicas necesarias para la vida. Están asociados con funciones celulares esenciales como la asimilación de nutrientes, la producción de energía y el crecimiento / desarrollo. Tienen una amplia distribución de especies que abarcan muchos phyla y, con frecuencia, más de un reino. Los metabolitos primarios incluyen carbohidratos, lípidos, aminoácidos y ácidos nucleicos [16] [17] que son los componentes básicos de la vida. [18]

Los metabolitos primarios que participan en la producción de energía incluyen enzimas respiratorias y fotosintéticas. Las enzimas, a su vez, están compuestas de aminoácidos y, a menudo, cofactores no peptídicos que son esenciales para la función enzimática. [19] La estructura básica de las células y de los organismos también se compone de metabolitos primarios. Estos incluyen membranas celulares (por ejemplo, fosfolípidos), paredes celulares (por ejemplo, peptidoglicano, quitina) y citoesqueletos (proteínas). [20]

Los cofactores enzimáticos del metabolito primario incluyen miembros de la familia de la vitamina B. La vitamina B1 como difosfato de tiamina es una coenzima para la piruvato deshidrogenasa, la 2-oxoglutarato deshidrogenasa y la transcetolasa, todas las cuales están involucradas en el metabolismo de los carbohidratos. La vitamina B2 (riboflavina) es un componente de FMN y FAD que son necesarios para muchas reacciones redox. La vitamina B3 (ácido nicotínico o niacina), sintetizada a partir del triptófano, es un componente de las coenzimas NAD + y NADP + que a su vez son necesarias para el transporte de electrones en el ciclo de Krebs, la fosforilación oxidativa y muchas otras reacciones redox. La vitamina B5 (ácido pantoténico) es un componente de la coenzima A, un componente básico del metabolismo de carbohidratos y aminoácidos, así como la biosíntesis de ácidos grasos y policétidos. La vitamina B6 (piridoxol, piridoxal y piridoxamina) como piridoxal 5′-fosfato es un cofactor de muchas enzimas, especialmente las transaminasas, que intervienen en el metabolismo de los aminoácidos. La vitamina B12 (cobalaminas) contiene un anillo de corrina similar en estructura a la porfirina y es una coenzima esencial para el catabolismo de los ácidos grasos, así como para la biosíntesis de metionina. [21]: Capítulo 2

El ADN y el ARN que almacenan y transmiten información genética están compuestos por metabolitos primarios de ácidos nucleicos. [19]

Los primeros mensajeros son moléculas de señalización que controlan el metabolismo o la diferenciación celular. Estas moléculas de señalización incluyen hormonas y factores de crecimiento que a su vez están compuestos por péptidos, aminas biogénicas, hormonas esteroides, auxinas, giberelinas etc. Estos primeros mensajeros interactúan con receptores celulares que están compuestos por proteínas. Los receptores celulares, a su vez, activan segundos mensajeros que se utilizan para transmitir el mensaje extracelular a los objetivos intracelulares. Estas moléculas de señalización incluyen los metabolitos primarios nucleótidos cíclicos, diacilglicerol, etc. [22]

Metabolitos secundarios Editar

Los metabolitos secundarios, a diferencia de los primarios, son prescindibles y no son absolutamente necesarios para la supervivencia. Además, los metabolitos secundarios suelen tener una distribución de especies estrecha. [ cita necesaria ]

Los metabolitos secundarios tienen una amplia gama de funciones. Estos incluyen feromonas que actúan como moléculas de señalización social con otros individuos de la misma especie, moléculas de comunicación que atraen y activan organismos simbióticos, agentes que solubilizan y transportan nutrientes (sideróforos, etc.) y armas competitivas (repelentes, venenos, toxinas, etc.) que se utilizan contra competidores, presas y depredadores. [23] Para muchos otros metabolitos secundarios, se desconoce la función. Una hipótesis es que confieren una ventaja competitiva al organismo que los produce. [24] Una visión alternativa es que, en analogía con el sistema inmunológico, estos metabolitos secundarios no tienen una función específica, pero tener la maquinaria en su lugar para producir estas estructuras químicas diversas es importante y, por lo tanto, se producen y seleccionan algunos metabolitos secundarios. [25]

Las clases estructurales generales de metabolitos secundarios incluyen alcaloides, fenilpropanoides, policétidos y terpenoides. [7]

Las rutas biosintéticas que conducen a las principales clases de productos naturales se describen a continuación. [13] [21]: Capítulo 2

    o gluconeogénesis → monosacáridos → polisacáridos (celulosa, quitina, glucógeno, etc.)
  • Vía del acetato → ácidos grasos y policétidos → aminoácidos aromáticos y vía fenilpropanoides y metiletritritol fosfato → terpenoides y esteroides
  • Aminoácidos → alcaloides

Carbohidratos Editar

Los carbohidratos son una fuente de energía esencial para la mayoría de las formas de vida. Además, los polisacáridos formados a partir de carbohidratos más simples son componentes estructurales importantes de muchos organismos, como las paredes celulares de bacterias y plantas. [ cita necesaria ]

Los carbohidratos son productos de la fotosíntesis de las plantas y la gluconeogénesis animal. La fotosíntesis produce inicialmente 3-fosfogliceraldehído, un átomo de tres carbonos que contiene azúcar (una triosa). [21]: Capítulo 8 Esta triosa, a su vez, puede convertirse en glucosa (un átomo de seis carbonos que contiene azúcar) o una variedad de pentosas (cinco átomos de carbono que contienen azúcares) a través del ciclo de Calvin. En los animales, los tres precursores de carbono lactato o glicerol se pueden convertir en piruvato que a su vez se puede convertir en carbohidratos en el hígado. [ cita necesaria ]

Acidos grasos y policétidos Editar

A través del proceso de glucólisis, los azúcares se descomponen en acetil-CoA. En una reacción catalizada enzimáticamente dependiente de ATP, la acetil-CoA se carboxila para formar malonil-CoA. Acetil-CoA y malonil-CoA se someten a una condensación de Claisen con pérdida de dióxido de carbono para formar acetoacetil-CoA. Las reacciones de condensación adicionales producen cadenas de poli-β-ceto de peso molecular sucesivamente más alto que luego se convierten en otros policétidos. [21]: Capítulo 3 La clase de policétidos de productos naturales tiene diversas estructuras y funciones e incluye prostaglandinas y antibióticos macrólidos. [ cita necesaria ]

Una molécula de acetil-CoA (la "unidad de inicio") y varias moléculas de malonil-CoA (las "unidades de extensión") son condensadas por la ácido graso sintasa para producir ácidos grasos. [21]: Capítulo 3 Los ácidos grasos son componentes esenciales de las bicapas lipídicas que forman las membranas celulares y las reservas de energía grasa en los animales. [ cita necesaria ]

Los productos naturales se pueden extraer de las células, tejidos y secreciones de microorganismos, plantas y animales. [26] [27] Un extracto crudo (no fraccionado) de cualquiera de estas fuentes contendrá una variedad de compuestos químicos estructuralmente diversos y, a menudo, novedosos. La diversidad química en la naturaleza se basa en la diversidad biológica, por lo que los investigadores recolectan muestras de todo el mundo para analizar y evaluar en pantallas de descubrimiento de fármacos o bioensayos. Este esfuerzo por buscar productos naturales biológicamente activos se conoce como bioprospección. [26] [27]

La farmacognosia proporciona las herramientas para detectar, aislar e identificar productos naturales bioactivos que podrían desarrollarse para uso medicinal. Cuando un "principio activo" se aísla de una medicina tradicional u otro material biológico, esto se conoce como "acierto". Luego, se realiza un trabajo científico y legal posterior para validar el resultado (por ejemplo, aclaración del mecanismo de acción, confirmación de que no hay conflicto de propiedad intelectual). A esto le sigue la etapa hit to lead del descubrimiento de fármacos, en la que se producen derivados del compuesto activo en un intento por mejorar su potencia y seguridad. [28] [29] De esta manera y otras relacionadas, las medicinas modernas se pueden desarrollar directamente a partir de fuentes naturales. [ cita necesaria ]

Aunque las medicinas tradicionales y otros materiales biológicos se consideran una excelente fuente de compuestos novedosos, la extracción y el aislamiento de estos compuestos puede ser un proceso lento, costoso e ineficaz. Por lo tanto, para la fabricación a gran escala, se pueden hacer intentos para producir el nuevo compuesto por síntesis total o semisíntesis. [30] Dado que los productos naturales son generalmente metabolitos secundarios con estructuras químicas complejas, su total / semisíntesis no siempre es comercialmente viable. En estos casos, se pueden hacer esfuerzos para diseñar análogos más simples con potencia y seguridad comparables que sean susceptibles de total / semisíntesis. [31]

Procariota Editar

Bacterias Editar

El descubrimiento fortuito y el posterior éxito clínico de la penicilina impulsaron una búsqueda a gran escala de otros microorganismos ambientales que pudieran producir productos naturales antiinfecciosos. Se recolectaron muestras de suelo y agua de todo el mundo, lo que condujo al descubrimiento de la estreptomicina (derivada de Streptomyces griseus) y la comprensión de que las bacterias, no solo los hongos, representan una fuente importante de productos naturales farmacológicamente activos. [33] Esto, a su vez, condujo al desarrollo de un impresionante arsenal de agentes antibacterianos y antifúngicos que incluyen anfotericina B, cloranfenicol, daptomicina y tetraciclina (de Streptomyces spp.), [34] las polimixinas (de Paenibacillus polymyxa), [35] y las rifamicinas (de Amycolatopsis rifamycinica). [36]

Aunque la mayoría de los fármacos derivados de bacterias se emplean como antiinfecciosos, algunos han encontrado uso en otros campos de la medicina. Toxina botulínica (de Clostridium botulinum) y bleomicina (de Streptomyces verticillus) son dos ejemplos. La botulina, la neurotoxina responsable del botulismo, se puede inyectar en músculos específicos (como los que controlan el párpado) para prevenir los espasmos musculares. [32] Además, el glicopéptido bleomicina se usa para el tratamiento de varios cánceres, incluido el linfoma de Hodgkin, el cáncer de cabeza y cuello y el cáncer de testículo. [37] Las tendencias más recientes en el campo incluyen la elaboración de perfiles metabólicos y el aislamiento de productos naturales de nuevas especies bacterianas presentes en entornos poco explorados. Los ejemplos incluyen simbiontes o endófitos de ambientes tropicales, [38] bacterias subterráneas que se encuentran a gran profundidad a través de la minería / perforación, [39] [40] y bacterias marinas. [41]

Archaea Editar

Debido a que muchas Archaea se han adaptado a la vida en ambientes extremos como regiones polares, manantiales termales, manantiales ácidos, manantiales alcalinos, lagos salados y la alta presión del agua del océano profundo, poseen enzimas que son funcionales en condiciones bastante inusuales. Estas enzimas son de uso potencial en las industrias alimentaria, química y farmacéutica, donde los procesos biotecnológicos frecuentemente involucran altas temperaturas, extremos de pH, altas concentraciones de sal y / o alta presión. Los ejemplos de enzimas identificadas hasta la fecha incluyen amilasas, pululanasas, ciclodextrina glicosiltransferasas, celulasas, xilanasas, quitinasas, proteasas, alcohol deshidrogenasa y esterasas. [42] Las arqueas también representan una fuente de compuestos químicos novedosos, por ejemplo, éteres de isoprenilglicerol 1 y 2 de Thermococcus S557 y Methanocaldococcus jannaschii, respectivamente. [43]

Eucariota Editar

Hongos Editar

Varios medicamentos antiinfecciosos se han derivado de hongos, incluidas la penicilina y las cefalosporinas (medicamentos antibacterianos de Penicillium chrysogenum y Cephalosporium acremonium, respectivamente) [33] y griseofulvina (un fármaco antifúngico de Penicillium griseofulvum). [44] Otros metabolitos fúngicos de utilidad medicinal incluyen la lovastatina (de Pleurotus ostreatus), que se convirtió en el líder de una serie de medicamentos que reducen los niveles de colesterol, ciclosporina (de Tolypocladium inflatum), que se utiliza para suprimir la respuesta inmunitaria después de operaciones de trasplante de órganos, y ergometrina (de Claviceps spp.), que actúa como vasoconstrictor y se utiliza para prevenir el sangrado después del parto. [21]: Capítulo 6 Asperlicina (de Aspergillus alliaceus) es otro ejemplo. La asperlicina es un antagonista novedoso de la colecistoquinina, un neurotransmisor que se cree que está involucrado en los ataques de pánico y que podría usarse para tratar la ansiedad. [ cita necesaria ]

Plantas Editar

Las plantas son una fuente importante de compuestos químicos (fitoquímicos) complejos y de gran diversidad estructural; esta diversidad estructural se atribuye en parte a la selección natural de organismos que producen compuestos potentes para disuadir la herbivoría (elementos disuasorios de la alimentación). [46] Las principales clases de fitoquímicos incluyen fenoles, polifenoles, taninos, terpenos y alcaloides. [47] Aunque la cantidad de plantas que se han estudiado extensamente es relativamente pequeña, ya se han identificado muchos productos naturales farmacológicamente activos. Los ejemplos clínicamente útiles incluyen los agentes anticancerígenos paclitaxel y mepesuccinato de omacetaxina (de Taxus brevifolia y Cephalotaxus harringtonii, respectivamente), [48] el agente antipalúdico artemisinina (de Artemisia annua), [49] y el inhibidor de la acetilcolinesterasa galantamina (de Galanthus spp.), utilizado para tratar la enfermedad de Alzheimer. [50] Otras drogas derivadas de plantas, utilizadas con fines medicinales y / o recreativos incluyen morfina, cocaína, quinina, tubocurarina, muscarina y nicotina. [21]: Capítulo 6

Animales Editar

Los animales también representan una fuente de productos naturales bioactivos. En particular, los animales venenosos como serpientes, arañas, escorpiones, orugas, abejas, avispas, ciempiés, hormigas, sapos y ranas han atraído mucha atención. Esto se debe a que los componentes del veneno (péptidos, enzimas, nucleótidos, lípidos, aminas biogénicas, etc.) a menudo tienen interacciones muy específicas con un objetivo macromolecular en el cuerpo (por ejemplo, α-bungarotoxina de cobras). [52] [53] Al igual que con los disuasivos de la alimentación de las plantas, esta actividad biológica se atribuye a la selección natural, los organismos capaces de matar o paralizar a sus presas y / o defenderse de los depredadores tienen más probabilidades de sobrevivir y reproducirse. [53]

Debido a estas interacciones químico-objetivo específicas, los componentes del veneno han demostrado ser herramientas importantes para estudiar receptores, canales iónicos y enzimas. En algunos casos, también han servido como líderes en el desarrollo de nuevos fármacos. Por ejemplo, teprótido, un péptido aislado del veneno de la víbora brasileña Bothrops jararaca, fue líder en el desarrollo de los agentes antihipertensivos cilazapril y captopril. [53] Además, echistatin, un desintegrín del veneno de la víbora escamosa. Echis carinatus fue un líder en el desarrollo del fármaco antiplaquetario tirofiban. [54]

Además de los animales terrestres y anfibios descritos anteriormente, se han examinado muchos animales marinos en busca de productos naturales farmacológicamente activos, con corales, esponjas, tunicados, caracoles marinos y briozoos que producen sustancias químicas con interesantes actividades analgésicas, antivirales y anticancerígenas. [55] Dos ejemplos desarrollados para uso clínico incluyen ω-conotoxina (del caracol marino Conus magus) [56] [51] y ecteinascidina 743 (del tunicado Ecteinascidia turbinata). [57] El primero, ω-conotoxina, se usa para aliviar el dolor severo y crónico, [51] [56] mientras que el segundo, la ecteinascidina 743 se usa para tratar el sarcoma de tejido blando metastásico. [58] Otros productos naturales derivados de animales marinos y que se están investigando como posibles terapias incluyen los agentes antitumorales discodermolida (de la esponja Discodermia disoluta), [59] eleuterobina (del coral Erythropodium caribaeorum), y las briostatinas (del briozoo Bugula neritina). [59]

Los productos naturales a veces tienen actividad farmacológica que puede ser de beneficio terapéutico en el tratamiento de enfermedades. [60] [61] [62] Además, se pueden preparar análogos sintéticos de productos naturales con mayor potencia y seguridad y, por lo tanto, los productos naturales se utilizan a menudo como puntos de partida para el descubrimiento de fármacos. Los componentes de productos naturales han inspirado numerosos esfuerzos de descubrimiento de fármacos que finalmente obtuvieron la aprobación como nuevos fármacos [63] [64]

Medicina tradicional Editar

Los pueblos indígenas y las civilizaciones antiguas experimentaron con varias partes de plantas y animales para determinar qué efecto podrían tener. [45] A través de ensayo y error en casos aislados, los curanderos tradicionales o chamanes encontraron algunas fuentes para proporcionar un efecto terapéutico, lo que representa el conocimiento de una droga cruda que se transmitió de generación en generación en prácticas como la medicina tradicional china y el Ayurveda. [45] [65] Los extractos de algunos productos naturales llevaron al descubrimiento moderno de sus componentes activos y, finalmente, al desarrollo de nuevos fármacos. [45] [66]

Medicamentos modernos derivados de productos naturales Editar

Una gran cantidad de medicamentos recetados actualmente se han derivado directamente o se han inspirado en productos naturales. [1] [67]

Algunos de los medicamentos basados ​​en productos naturales más antiguos son los analgésicos. Se sabe desde la antigüedad que la corteza del sauce tiene propiedades analgésicas. Esto se debe a la presencia del producto natural salicina que, a su vez, puede hidrolizarse en ácido salicílico. Un derivado sintético del ácido acetilsalicílico mejor conocido como aspirina es un analgésico ampliamente utilizado. Su mecanismo de acción es la inhibición de la enzima ciclooxigenasa (COX). [68] Otro ejemplo notable es el opio que se extrae del látex de Papaver somnífero (una planta de amapola en flor). El componente narcótico más potente del opio es el alcaloide morfina, que actúa como agonista del receptor de opioides. [69] Un ejemplo más reciente es el analgésico ziconotida, bloqueador de los canales de calcio de tipo N, que se basa en una toxina de caracol de cono de péptido cíclico (ω-conotoxina MVIIA) de la especie Conus magus. [70]

Un número importante de antiinfecciosos se basan en productos naturales. [27] El primer antibiótico descubierto, la penicilina, se aisló del moho. Penicillium. La penicilina y los betalactámicos relacionados actúan inhibiendo la enzima transpeptidasa DD que necesitan las bacterias para reticular el peptidoglicano y formar la pared celular. [71]

Varios medicamentos de productos naturales se dirigen a la tubulina, que es un componente del citoesqueleto. Estos incluyen el inhibidor de polimerización de tubulina colchicina aislado de la Colchicum autumnale (planta con flores de azafrán de otoño), que se utiliza para tratar la gota. [72] La colchicina se biosintetiza a partir de los aminoácidos fenilalanina y triptófano. El paclitaxel, por el contrario, es un estabilizador de polimerización de tubulina y se utiliza como fármaco quimioterapéutico. El paclitaxel se basa en el taxol, producto natural terpenoide, que se aísla de Taxus brevifolia (el tejo del pacífico). [73]

Una clase de fármacos ampliamente utilizados para reducir el colesterol son los inhibidores de la HMG-CoA reductasa, por ejemplo, la atorvastatina. Estos se desarrollaron a partir de mevastatina, un policétido producido por el hongo. Penicillium citrinum. [74] Por último, se utilizan varios medicamentos de productos naturales para tratar la hipertensión y la insuficiencia cardíaca congestiva. Estos incluyen el inhibidor de la enzima convertidora de angiotensina captopril. Captopril se basa en el factor potenciador de bradicinina peptídica aislado del veneno de la víbora de punta de flecha brasileña (Bothrops jararaca). [75]

Factores limitantes y habilitadores Editar

Numerosos desafíos limitan el uso de productos naturales para el descubrimiento de fármacos, lo que resulta en la preferencia del siglo XXI por parte de las compañías farmacéuticas de dedicar esfuerzos de descubrimiento a la detección de alto rendimiento de compuestos sintéticos puros con plazos más cortos para el refinamiento. [12] Las fuentes de productos naturales a menudo no son fiables para acceder y suministrar, tienen una alta probabilidad de duplicación, crean intrínsecamente preocupaciones de propiedad intelectual sobre la protección de patentes, varían en composición debido a la temporada de abastecimiento o el medio ambiente y son susceptibles de aumentar las tasas de extinción. [12]

El recurso biológico para el descubrimiento de fármacos a partir de productos naturales sigue siendo abundante, con pequeños porcentajes de microorganismos, especies de plantas e insectos evaluados para determinar su bioactividad. [12] En enormes cantidades, las bacterias y los microorganismos marinos permanecen sin examinar. [76] [77] A partir de 2008, se propuso el campo de la metagenómica para examinar los genes y su función en los microbios del suelo, [77] [78] pero la mayoría de las empresas farmacéuticas no han explotado este recurso por completo, eligiendo en su lugar desarrollar "diversidad- síntesis orientada ”a partir de bibliotecas de fármacos conocidos o fuentes naturales de compuestos de plomo con mayor potencial de bioactividad. [12]

Todos los productos naturales comienzan como mezclas con otros compuestos de origen natural, a menudo mezclas muy complejas, a partir de las cuales se debe aislar y purificar el producto de interés. los aislamiento de un producto natural se refiere, dependiendo del contexto, ya sea al aislamiento de cantidades suficientes de materia química pura para elucidación de la estructura química, química de derivatización / degradación, pruebas biológicas y otras necesidades de investigación (generalmente miligramos a gramos, pero históricamente, a menudo más) , [ cita necesaria ] o al aislamiento de "cantidades analíticas" de la sustancia de interés, donde la atención se centra en la identificación y cuantificación de la sustancia (por ejemplo, en tejido o fluido biológico), y donde la cantidad aislada depende del método analítico aplicado (pero es generalmente siempre submicrogramos en escala). [80] [ página necesaria ] La facilidad con la que se puede aislar y purificar el agente activo depende de la estructura, estabilidad y cantidad del producto natural. Los métodos de aislamiento aplicados para lograr estas dos escalas distintas de producto son igualmente distintos, pero generalmente implican extracción, precipitación, adsorciones, cromatografía y, a veces, cristalizaciones. En ambos casos, la sustancia aislada se purifica para homogeneidad química, es decir, los métodos de separación y analíticos combinados específicos, como los métodos de LC-MS, se eligen para que sean "ortogonales", logrando sus separaciones en función de distintos modos de interacción entre la sustancia y la matriz de aislamiento, con el objetivo de ser la detección repetida de una sola especie presente en la muestra pura putativa. El aislamiento temprano es seguido casi inevitablemente por determinación de estructura, especialmente si se asocia una actividad farmacológica importante con el producto natural purificado. [ cita necesaria ]

La determinación de la estructura se refiere a los métodos aplicados para determinar la estructura química de un producto natural puro y aislado, un proceso que involucra una variedad de métodos químicos y físicos que han cambiado notablemente a lo largo de la historia de la investigación de productos naturales en los primeros días, estos se enfocaron en la transformación química. de sustancias desconocidas en sustancias conocidas, y medición de propiedades físicas como el punto de fusión y el punto de ebullición, y métodos relacionados para determinar el peso molecular. [ cita necesaria ] En la era moderna, los métodos se centran en la espectrometría de masas y los métodos de resonancia magnética nuclear, a menudo multidimensionales y, cuando es posible, la cristalografía de moléculas pequeñas. [ cita necesaria ] Por ejemplo, la estructura química de la penicilina fue determinada por Dorothy Crowfoot Hodgkin en 1945, trabajo por el que más tarde recibió el Premio Nobel de Química (1964). [81]

Muchos productos naturales tienen estructuras muy complejas. La complejidad percibida de un producto natural es una cuestión cualitativa, que consiste en la consideración de su masa molecular, las disposiciones particulares de las subestructuras (grupos funcionales, anillos, etc.) entre sí, el número y la densidad de esos grupos funcionales, la estabilidad. de esos grupos y de la molécula en su conjunto, el número y tipo de elementos estereoquímicos, las propiedades físicas de la molécula y sus intermediarios (que influyen en la facilidad de su manipulación y purificación), todo ello visto en el contexto de la novedad de la estructura y si los esfuerzos sintéticos relacionados anteriores han tenido éxito (ver más abajo para más detalles). [ cita necesaria ] Algunos productos naturales, especialmente los menos complejos, se preparan fácil y rentablemente mediante síntesis química completa a partir de ingredientes químicos más simples y fácilmente disponibles, un proceso denominado síntesis total (especialmente cuando el proceso no implica pasos mediados por agentes biológicos). No todos los productos naturales son susceptibles de síntesis total, rentables o no. En particular, los más complejos a menudo no lo son. Muchos son accesibles, pero las rutas requeridas son simplemente demasiado caras para permitir la síntesis en cualquier escala práctica o industrial. Sin embargo, para estar disponibles para estudios posteriores, todos los productos naturales deben ceder al aislamiento y la purificación. Esto puede ser suficiente si el aislamiento proporciona cantidades adecuadas del producto natural para el propósito previsto (por ejemplo, como medicamento para aliviar una enfermedad). Se demostró que los fármacos como la penicilina, la morfina y el paclitaxel se adquieren de forma asequible a las escalas comerciales necesarias únicamente mediante procedimientos de aislamiento (sin ninguna contribución química sintética significativa). [ cita necesaria ] Sin embargo, en otros casos, los agentes necesarios no están disponibles sin manipulaciones químicas sintéticas. [ cita necesaria ]

Semisíntesis editar

El proceso de aislar un producto natural de su fuente puede ser costoso en términos de tiempo comprometido y gasto material, y puede desafiar la disponibilidad del recurso natural del que se depende (o tener consecuencias ecológicas para el recurso). Por ejemplo, se ha estimado que la corteza de un tejo entero (Taxus brevifolia) tendría que recolectarse para extraer suficiente paclitaxel para una sola dosis de terapia. [82] Además, el número de análogos estructurales que se pueden obtener para el análisis de estructura-actividad (SAR) simplemente a través de la recolección (si más de un análogo estructural está presente) está limitado por la biología que trabaja en el organismo y, por lo tanto, fuera de los criterios del experimentalista. control. [ cita necesaria ]

En los casos en que el objetivo final es más difícil de conseguir, o limita la SAR, a veces es posible obtener un precursor biosintético o análogo de etapa intermedia a tardía a partir del cual se puede preparar el objetivo final. Esto se denomina semisíntesis o síntesis parcial. Con este enfoque, el intermedio biosintético relacionado se recolecta y luego se convierte en el producto final mediante procedimientos convencionales de síntesis química. [ cita necesaria ]

Esta estrategia puede tener dos ventajas. En primer lugar, el intermedio puede extraerse más fácilmente y con mayor rendimiento que el producto final deseado. Un ejemplo de esto es el paclitaxel, que se puede fabricar extrayendo 10-desacetilbacatina III de T. brevifolia agujas y luego llevar a cabo una síntesis de cuatro pasos. [ cita necesaria ] En segundo lugar, la ruta diseñada entre el material de partida semisintético y el producto final puede permitir la síntesis de análogos del producto final. Las penicilinas semisintéticas de nueva generación son una ilustración del beneficio de este enfoque. [ cita necesaria ]

Síntesis total Editar

En general, la síntesis total de productos naturales es una actividad de investigación no comercial, dirigida a una comprensión más profunda de la síntesis de marcos de productos naturales particulares y al desarrollo de nuevos métodos sintéticos fundamentales. Aun así, tiene una enorme importancia comercial y social. Al proporcionar objetivos sintéticos desafiantes, por ejemplo, ha jugado un papel central en el desarrollo del campo de la química orgánica. [86] [87] Antes del desarrollo de los métodos de química analítica en el siglo XX, las estructuras de los productos naturales se afirmaban mediante síntesis total (la llamada "prueba de estructura por síntesis"). [88] Los primeros esfuerzos en la síntesis de productos naturales se dirigieron a sustancias complejas como la cobalamina (vitamina B12), cofactor esencial en el metabolismo celular. [84] [85]

Simetría Editar

El examen de productos naturales dimerizados y trimerizados ha demostrado que a menudo está presente un elemento de simetría bilateral. La simetría bilateral se refiere a una molécula o sistema que contiene una C2, Cs, o C2v identidad del grupo de puntos. C2 la simetría tiende a ser mucho más abundante que otros tipos de simetría bilateral. Este hallazgo arroja luz sobre cómo estos compuestos podrían crearse mecánicamente, además de proporcionar información sobre las propiedades termodinámicas que hacen que estos compuestos sean más favorables. Los cálculos teóricos de densidad funcional (DFT), Hartree Fock y semiempíricos también muestran cierta preferencia por la dimerización en productos naturales debido a la evolución de más energía por enlace que el trímero o tetrámero equivalente. Se propone que esto se debe a un impedimento estérico en el núcleo de la molécula, ya que la mayoría de los productos naturales se dimerizan y trimerizan en forma de cabeza a cabeza en lugar de cabeza a cola. [89]

Química Editar

La química de productos naturales es un área distinta de la investigación química que fue importante en el desarrollo y la historia de la química. El aislamiento e identificación de productos naturales ha sido importante para obtener sustancias para la investigación preclínica temprana del descubrimiento de fármacos, para comprender la medicina tradicional y la etnofarmacología, y para encontrar áreas farmacológicamente útiles del espacio químico. [92] Para lograr esto, se han realizado muchos avances tecnológicos, como la evolución de la tecnología asociada con las separaciones químicas y el desarrollo de métodos modernos en la determinación de la estructura química como la RMN. Además, los productos naturales se elaboran mediante síntesis orgánica, para confirmar su estructura, o para dar acceso a mayores cantidades de productos naturales de interés. En este proceso, se ha revisado la estructura de algunos productos naturales, [93] [94] [95] y el desafío de sintetizar productos naturales ha llevado al desarrollo de nueva metodología sintética, estrategia sintética y tácticas. [96] En este sentido, los productos naturales juegan un papel central en la formación de nuevos químicos orgánicos sintéticos y son una motivación principal en el desarrollo de nuevas variantes de reacciones químicas antiguas (por ejemplo, la reacción aldólica de Evans), así como la descubrimiento de reacciones químicas completamente nuevas (por ejemplo, la cis-hidroxilación de Woodward, la epoxidación de Sharpless y las reacciones de acoplamiento cruzado de Suzuki-Miyaura). [97]

Bioquímica Editar

Es de interés la biosíntesis de productos naturales. El conocimiento de la biosíntesis permite mejorar las rutas hacia productos naturales valiosos. Este conocimiento se puede utilizar para acceder a mayores cantidades de productos naturales con una actividad biológica interesante y permitir la producción de productos naturales de utilidad medicinal, como los alcaloides, de manera más eficiente y económica. [98]

Fundamentos de la química de productos orgánicos y naturales Editar

El concepto de productos naturales se remonta a principios del siglo XIX, cuando se sentaron las bases de la química orgánica. La química orgánica se consideraba en ese momento como la química de las sustancias que componen las plantas y los animales. Era una forma de química relativamente compleja y contrastaba con la química inorgánica, cuyos principios habían sido establecidos en 1789 por el francés Antoine Lavoisier en su obra. Traité Élémentaire de Chimie. [99]

Aislamiento Editar

Lavoisier demostró a finales del siglo XVIII que las sustancias orgánicas constaban de un número limitado de elementos: principalmente carbono e hidrógeno y complementados con oxígeno y nitrógeno. Rápidamente se centró en el aislamiento de estas sustancias, a menudo porque tenían una actividad farmacológica interesante. Las plantas eran la principal fuente de dichos compuestos, especialmente alcaloides y glucósidos. Se sabía desde hace mucho tiempo que el opio, una mezcla pegajosa de alcaloides (incluidas codeína, morfina, noscapina, tebaína y papaverina) de la adormidera (Papaver somniferum), poseía propiedades narcóticas y al mismo tiempo que alteraban la mente. En 1805, el químico alemán Friedrich Sertürner ya había aislado la morfina y en la década de 1870 se descubrió que hervir la morfina con anhídrido acético producía una sustancia con un fuerte efecto supresor del dolor: la heroína. [100] En 1815, Eugène Chevreul aisló el colesterol, una sustancia cristalina, de tejido animal que pertenece a la clase de esteroides, y en 1820 se aisló estricnina, un alcaloide. [ cita necesaria ]

Síntesis editar

Un segundo paso importante fue la síntesis de compuestos orgánicos. Mientras que la síntesis de sustancias inorgánicas se conocía desde hacía mucho tiempo, la síntesis de sustancias orgánicas era un obstáculo difícil. En 1827, el químico sueco Jöns Jacob Berzelius sostuvo que se necesitaba una fuerza de la naturaleza indispensable para la síntesis de compuestos orgánicos, llamada fuerza vital o fuerza vital. Esta idea filosófica, el vitalismo, hasta bien entrado el siglo XIX tuvo muchos partidarios, incluso después de la introducción de la teoría atómica. La idea del vitalismo encajaba especialmente con las creencias de la medicina, las prácticas curativas más tradicionales creían que la enfermedad era el resultado de algún desequilibrio en las energías vitales que distingue la vida de la no vida. Un primer intento de romper la idea del vitalismo en la ciencia se realizó en 1828, cuando el químico alemán Friedrich Wöhler logró sintetizar urea, un producto natural que se encuentra en la orina, calentando cianato de amonio, una sustancia inorgánica: [101]

Esta reacción mostró que no había necesidad de una fuerza vital para preparar sustancias orgánicas. Esta idea, sin embargo, fue recibida inicialmente con un alto grado de escepticismo, y solo 20 años después, con la síntesis de ácido acético a partir de carbono por Adolph Wilhelm Hermann Kolbe, la idea fue aceptada. Desde entonces, la química orgánica se ha convertido en un área de investigación independiente dedicada al estudio de compuestos que contienen carbono, ya que ese elemento en común se detectó en una variedad de sustancias derivadas de la naturaleza. Un factor importante en la caracterización de los materiales orgánicos se basó en sus propiedades físicas (como el punto de fusión, el punto de ebullición, la solubilidad, la cristalinidad o el color). [ cita necesaria ]

Teorías estructurales Editar

Un tercer paso fue la elucidación de la estructura de las sustancias orgánicas: aunque la composición elemental de las sustancias orgánicas puras (independientemente de si eran de origen natural o sintético) podía determinarse con bastante precisión, la estructura molecular seguía siendo un problema. El impulso de hacer una elucidación estructural resultó de una disputa entre Friedrich Wöhler y Justus von Liebig, quienes estudiaron una sal de plata de la misma composición pero con propiedades diferentes. Wöhler estudió el cianato de plata, una sustancia inofensiva, mientras que von Liebig investigó el fulminato de plata, una sal con propiedades explosivas. [102] El análisis elemental muestra que ambas sales contienen cantidades iguales de plata, carbono, oxígeno y nitrógeno. Según las ideas entonces imperantes, ambas sustancias deberían poseer las mismas propiedades, pero no fue así. Esta aparente contradicción fue resuelta más tarde por la teoría de los isómeros de Berzelius, según la cual no solo el número y el tipo de elementos son importantes para las propiedades y la reactividad química, sino también la posición de los átomos dentro de un compuesto. Esta fue una causa directa del desarrollo de las teorías de la estructura, como la teoría radical de Jean-Baptiste Dumas y la teoría de la sustitución de Auguste Laurent. [103] [ se necesita una mejor fuente ] Sin embargo, tomó hasta 1858 antes de que August Kekulé formulara una teoría de la estructura definida. Postuló que el carbono es tetravalente y se puede unir a sí mismo para formar cadenas de carbono como se encuentran en los productos naturales. [104] [ se necesita una mejor fuente ]

Expandiendo el concepto Editar

El concepto de producto natural, que inicialmente se basaba en compuestos orgánicos que podían aislarse de las plantas, fue ampliado para incluir material animal a mediados del siglo XIX por el alemán Justus von Liebig. Hermann Emil Fischer en 1884, centró su atención en el estudio de los carbohidratos y las purinas, trabajo por el que fue galardonado con el Premio Nobel en 1902. También logró fabricar sintéticamente en el laboratorio una variedad de carbohidratos, entre ellos glucosa y manosa. Después del descubrimiento de la penicilina por Alexander Fleming en 1928, se agregaron hongos y otros microorganismos al arsenal de fuentes de productos naturales. [100]

Hitos Editar

En la década de 1930, se conocían varias clases importantes de productos naturales. Entre los hitos importantes se incluyen: [ según quien? ]


Completando la historia

Dos artículos independientes publicados recientemente de los grupos Schmidt [5] y Jaspars [6] combinan ahora el aislamiento de una vía con la producción de una molécula pequeña. Las patelamidas y las moléculas relacionadas (Figura 1b) se aislaron de las ascidias (cordados que se alimentan por filtración, marinos en forma de saco) debido a la pronunciada actividad anticancerígena de estos compuestos en ensayos biológicos. Es casi seguro que los compuestos se originan a partir de ocho aminoácidos (para la patelamida A, la secuencia es Ile-Ser-Val-Cys-Ile-Thr-Val-Cys o una permutación cíclica de la misma, véase la Figura 1b). Las ascidias, que producen una serie de péptidos cíclicos y derivados de péptidos cíclicos con actividad biológica potencialmente útil, albergan simbiontes cianobacterianos obligados, especies en el Procloron género, que podría producir algunos o posiblemente todos los compuestos aislados de ascidias.

El laboratorio de Schmidt [5] originalmente siguió un enfoque similar al utilizado por Piel et al. [10-12] (Figura 2a). Procloron cianobacterias fueron aisladas de su huésped ascidiana (Rótula de Lissoclinum) y se utiliza para preparar ADN genómico. Los aislamientos consistieron principalmente (& gt 95%) en Procloron didemni a juzgar por microscopía óptica. Una búsqueda de secuencias de proteínas predichas para ejemplos del dominio de adenilación no ribosómico, un dominio repetitivo y altamente conservado que se encuentra en las enzimas de la línea de ensamblaje biosintético de péptidos no ribosomales, arrojó solo un gen candidato y un análisis adicional de su secuencia indicó que la proteína codificada era poco probable que funcionara en la biosíntesis de patelamida. Si las patelamidas no son producidas por una línea de ensamblaje de péptidos no ribosomales, deben ser elaboradas por síntesis ribosómica de un péptido precursor seguido de fusión de cadenas laterales con la cadena principal para formar pequeños anillos de cinco miembros y uniendo los dos extremos para formar un gran anillo (Figura 1b).

Los dos enfoques discutidos en este artículo para identificar la vía biosintética de la rótula y expresarla en una bacteria huésped alternativa. (a) Schmidt et al. [5] utilizaron un enfoque de secuenciación completa del genoma, seguido de análisis de secuencia para identificar la vía biosintética, clonación de la vía en un huésped heterólogo y aislamiento de la molécula pequeña. (B) Jaspars et al. [6] utilizaron la clonación rápida del ADN genómico seguida de la selección de la biblioteca de clones resultante para la producción de patelamida. Estos pasos podrían, en principio, seguirse mediante la secuenciación de la vía, un paso no informado por Jaspars y colegas [6].

Encontrar una línea de ensamblaje de péptidos no ribosómicos es relativamente sencillo, ya que se sabe mucho sobre ellos, pero encontrar una vía biosintética ribosómica (o posiblemente alguna otra) es mucho más desafiante. La totalidad P. didemni El genoma fue secuenciado por el Instituto de Investigación Genómica con una cobertura triple, y un grupo de genes que podría, en principio, producir patelamida A a través de la traducción ribosómica se identificó mediante la búsqueda de ocho posibles péptidos cuya ciclación y posterior alteración podrían generar patelamida A (Figura 2a ). Se identificó una única secuencia codificante (coronilla, que codifica un péptido precursor de 77 aminoácidos), y la misma secuencia también codifica los ocho residuos necesarios para formar la patelamida C, que invariablemente se encuentra con la patelamida A. Genes para toda la vía (patA-G) rodeó el coronilla gene. En un experimento decisivo, la vía se expresó heterólogamente en Escherichia coli, y las patelamidas A y C se aislaron del medio de cultivo, por lo que no hay duda de que se ha identificado la ruta correcta. Ahora que se conocen los genes de la vía biosintética, se pueden analizar el momento y el mecanismo de los distintos pasos.

Mientras que Schmidt y sus colegas [5] se basaron en la secuenciación del genoma completo, el laboratorio de Jaspars [6] utilizó la clonación de escopeta y la expresión heteróloga, un enfoque que se había utilizado anteriormente para identificar nuevas moléculas pequeñas biológicamente activas de bacterias cultivadas y no cultivadas [13-17 ]. Una biblioteca genómica de ADN de cianobacterias aislada de la misma ascidia utilizada por Schmidt y colegas (L. rótula) pero desde una ubicación diferente se utilizó para construir una biblioteca de cromosomas artificiales bacterianos (BAC) en E. coli (Figura 2b). Los intentos de identificar clones que contienen genes de péptido-sintasa no ribosómicos usando hibridaciones Southern no revelaron nada útil, por lo que la biblioteca fue interrogada directamente para la producción de patelamidas usando cromatografía líquida acoplada con espectrometría de masas (LC-MS). Finalmente, se identificó un solo transformante que producía patelamida D (Figura 2b). Debido a que el artículo de Jaspars y colegas [6] se publicó rápidamente para ser más o menos contemporáneo con el informe de Schmidt et al. [5], no hay información de secuencia disponible.

Los dos enfoques diferentes, secuenciación completa del genoma [5] y clonación de escopeta [6], han dado lugar a resultados aproximadamente equivalentes y han demostrado claramente que las patelamidas son producidas por un simbionte cianobacteriano a través de una vía que ahora puede estudiarse en profundidad. ¿Cuáles son las implicaciones para los productos naturales en general y qué podemos esperar en el futuro? Una lección obvia es que los enfoques basados ​​en el ADN se han convertido en herramientas poderosas para encontrar rutas biosintéticas, tanto para el análisis detallado de sus detalles mecánicos como para la producción de compuestos naturales que de otro modo serían difíciles de obtener. Podemos esperar con confianza ver una gran cantidad de trabajo similar en el futuro. Un cambio más sutil podría ser una reorientación de la investigación de productos naturales, una disciplina que aún conserva vestigios de la exploración y la filosofía natural del siglo XIX, hacia una disciplina centrada en los genes. Finalmente, el desafío de utilizar los mismos enfoques [5, 6, 10-12] para descubrir nuevos productos naturales ahora se puede enfrentar con mayor confianza.


Fondo

Aquilaria sinensis es un árbol de hoja perenne tropical ampliamente distribuido en las provincias de Fujian, Guangdong, Guangxi y Hainan en China y otros países como Vietnam, India, Indonesia, Malasia y Tailandia [1]. En condiciones de estrés, como infectados por hongos o heridos por el viento, los rayos y los picaduras de insectos, el duramen impregnado de resina se está formando lentamente en el tronco y las ramas de los árboles. A. sinensis [2-4]. Estos duramen resinosos se denominan comercialmente madera de agar que se ha utilizado durante mucho tiempo como agente antiemético, digestivo y sedante en la medicina tradicional, y también como incienso y perfume peculiar [1]. Sin embargo, la producción de madera de agar siempre lleva décadas en procesos naturales, y la producción natural Aquilaria los bosques han sido seriamente destruidos en todos los países debido al alto valor y la gran demanda de madera de agar. Por lo tanto, A. sinensis ha sido incluido en el Apéndice II de la Convención sobre el Comercio Interno de Especies Amenazadas de Fauna y Flora Silvestres [5]. Bajo estas circunstancias, Aquilaria Se cultivaron árboles para la producción de madera de agar de importancia farmacéutica y valor comercial utilizando métodos artificiales como quema-cincel-taladro, poda del tronco e inoculación de hongos [3]. Sin embargo, la producción de madera de agar con métodos artificiales todavía lleva mucho tiempo y los productos son siempre de baja calidad.

Investigaciones anteriores revelaron que las cromonas 2- (2-feniletil) son los componentes principales de la madera de argar [6-9]. Se han informado más de 100 congéneres de 2- (2-feniletil) cromonas [10], y muchas de las 2- (2-feniletil) cromonas tienen actividades potencialmente farmacológicas que incluyen actividad neuroprotectora, actividad citotóxica, actividad antibacteriana, Dolor actividad inhibidora, antiinflamatoria y antioxidante [7, 11-14]. Sin embargo, la biosíntesis y regulación de 2- (2-feniletil) cromonas sigue siendo completamente desconocida.

Las plantas productoras de madera de agar son especies maderables que tardan mucho en crecer y la parte resinosa se forma dentro de la madera. Hace que los estudios con plantas frescas sean difíciles e incómodos. Por lo tanto, el establecimiento de callos y cultivos en suspensión celular de A. sinensis con una alta producción de 2- (2-feniletil) cromonas, los principales componentes de la madera de agar, sería sin duda útil para los estudios sobre el mecanismo de formación de la madera de agar [15, 16]. Se ha informado que el ácido salicílico y los extractos crudos de hongos podrían provocar la producción de 2- (2-feniletil) cromonas en los callos y cultivos en suspensión celular de A. sinensis [15, 16]. Recientemente, nos estamos centrando en explorar el mecanismo de formación de la madera de agar, por lo que el establecimiento de un método eficaz que pueda utilizarse para inducir la producción de 2- (2-feniletil) cromonas en los callos y la suspensión celular es de vital importancia. Sorprendentemente, en primer lugar encontramos que el estrés por salinidad inducía la producción de cromonas 2- (2-feniletil) estructuralmente diversas en A. sinensis callos y células en suspensión, lo que sugiere que las 2- (2 feniletil) cromonas podrían ser responsables de las respuestas al estrés salino. La identificación de estas 2- (2-feniletil) cromonas producidas en callos tratados con sal y células en suspensión sería útil para futuras investigaciones sobre las funciones biológicas de las 2- (2-feniletil) cromonas en las respuestas al estrés y el mecanismo de formación de madera de agar.

Por otro lado, las plantas integran vías de señales complejas que pueden interrelacionarse y divergir en varios pasos en respuesta al estrés salino [17]. El estrés por alta salinidad induce la biosíntesis de hormonas para regular la expresión de genes y metabolitos específicos, incluida la hormona más importante que responde al estrés, el ácido abscísico (ABA) [18]. El estrés salino causa déficit de agua y estrés osmótico, enriqueciendo la producción de ABA en brotes y raíces [19, 20]. La acumulación de ABA puede aliviar la influencia inhibidora del estrés por salinidad en la fotosíntesis y el crecimiento [21]. Algunas otras fitohormonas, como el ácido salicílico (SA) y los brasinoesteroides (BR), también participan en las respuestas de las plantas al estrés abiótico [22, 23]. Recientemente se ha informado de la intercomunicación entre las vías de señalización de Ca 2+ y las cascadas de proteína quinasa activada por mitógenos (MAPK) en las respuestas al estrés salino [24-26]. Además, los árboles de sal inducen nuevas clases de miembros de la familia de factores de transcripción virales para la transducción de señales, incluidas las familias bZIP, WRKY, AP2 / ERF y NAC que facilitan los niveles de expresión de varios genes que eventualmente influyen en la tolerancia de las plantas al estrés por sal [27-31 ]. Investigaciones anteriores indicaron que la expresión transcripcional de los genes bZIP se enriqueció en la variedad de trigo sensible a la sal bajo estrés salino, pero disminuyó en el cultivo tolerante a la sal [28]. En Arabidopsis, el estrés salino indujo la expresión de At WRKY8 que se une directamente con el promotor de RD29A [29]. Los miembros de la familia Ap2 / ERF del arroz desempeñan un papel importante en la respuesta al estrés por salinidad [30]. La sobreexpresión de un miembro de la familia de factores de transcripción NAC en arroz y trigo confiere tolerancia a la sal [31]. Aunque los enfoques genéticos y progresivos tradicionales pueden proporcionar información valiosa sobre las respuestas al estrés por sal, las limitaciones técnicas pueden impedir que se realicen más investigaciones. Los análisis de transcriptomas de todo el genoma han mejorado drásticamente la eficiencia del descubrimiento de genes relacionados con el estrés salino [26, 32]. En Arabidopsis, se observó que más del 20% del transcriptoma regulaba bajo estrés de salinidad mediante el análisis del transcriptoma [32]. Sin embargo, hasta ahora no se ha establecido un consenso sistemático sobre las clases específicas de genes correspondientes a eventos de señalización particulares en respuesta al estrés salino. La identificación y caracterización de los factores clave para las vías de señalización de la respuesta al estrés salino será significativa para comprender mejor el mecanismo de las respuestas al estrés y la biosíntesis de metabolitos secundarios específicos.

En este documento, se demostró que el NaCl es un inductor ideal para inducir la producción de 2- (2-feniletil) cromonas en A. sinensis calli. Utilizando LC-MS-IT-TOF, se identificaron 41 feniletilcromonas a partir de tratados con NaCl. A. sinensis calli. Con el fin de dilucidar los posibles mecanismos de las respuestas al estrés salino de A. sinensis, la secuenciación del transcriptoma se realizó utilizando la tecnología de secuenciación de Illumina, y los datos se analizaron para identificar las transcripciones expresadas diferencial y específicamente de genes regulados por sales. Al mismo tiempo, se caracterizaron las nuevas clases de genes sensibles a NaCl relevantes para la transducción de señales en respuesta al estrés salino. Los resultados proporcionaron información valiosa para futuros estudios sobre el mecanismo de la transducción de señalización del estrés salino y la formación de madera de agar.


Genética de rasgos. Semillas Pioneer Chile Ltda. Coyancura 2241, Piso 3, Providencia, Santiago, CHILE.
correo electrónico: [email protected]

Los avances tecnológicos recientes han ampliado sustancialmente nuestra capacidad para analizar y comprender los genomas de las plantas y reducir la brecha existente entre el genotipo y el fenotipo. El campo de la genómica en rápida evolución permite a los científicos analizar miles de genes en paralelo, comprender la arquitectura genética de los genomas de las plantas y también aislar los genes responsables de las mutaciones. Además, ahora se pueden secuenciar genomas completos. Esta revisión aborda estos problemas y también analiza las formas de extraer el significado biológico de los datos de ADN. Aunque los problemas genómicos se abordan desde la perspectiva de las plantas, esta revisión proporciona información sobre los análisis genómicos de otros organismos.

Términos clave: genómica, Arabidopsis thaliana, Oryza sativa, fitomejoramiento, descubrimiento de genes

Hasta hace muy poco, el análisis molecular de plantas a menudo se centraba en el nivel de un solo gen.Los avances tecnológicos recientes han cambiado este paradigma, permitiendo el análisis de organismos en términos de organización, expresión e interacción del genoma. El estudio de la forma en que los genes y la información genética se organizan dentro del genoma, los métodos de recopilación y análisis de esta información y cómo esta organización determina su funcionalidad biológica se conoce como genómica. Los enfoques genómicos están impregnando todos los aspectos de la biología vegetal y, dado que se basan en información codificada por ADN, amplían los análisis moleculares de un nivel único a un nivel de múltiples especies. La genómica vegetal está invirtiendo el paradigma anterior de identificar genes detrás de las funciones biológicas y, en cambio, se centra en encontrar funciones biológicas detrás de los genes. También reduce la brecha entre el fenotipo y el genotipo y ayuda a comprender no solo el efecto aislado de un gen, sino también la forma en que su contexto genético y las redes genéticas con las que interactúa pueden modular su actividad. Esta revisión está organizada en dos secciones principales. La primera se ocupa de la comprensión actual de los genomas vegetales, su estructura genética a nivel inter e intraespecies y cómo se secuencian los genomas completos, y la segunda sección aborda algunos enfoques utilizados para lograr el objetivo final de la genómica: encontrar el Importancia biológica y funcional de la secuencia de ADN.

1 LA ESTRUCTURA GENÉTICA DE LOS GENOMAS VEGETALES

Los genomas vegetales se describen mejor en términos de tamaño del genoma, contenido genético, extensión de secuencias repetitivas y eventos de poliploidía / duplicación. Aunque las plantas también poseen genomas mitocondriales y de cloroplasto, su genoma nuclear es el más grande y complejo. Existe una amplia variación en el tamaño del genoma nuclear (Tabla I) sin un significado funcional obvio de tal variación (Rafalski, 2002).

Los genomas vegetales contienen varias secuencias repetitivas y retrotransposones similares a retrovirus que contienen repeticiones terminales largas y otros retroelementos, como elementos nucleares intercalados largos y elementos nucleares intercalados cortos (Kumar y Bennetzen 1999). Las inserciones de retroelementos contribuyen a la gran diferencia de tamaño entre los segmentos colineales del genoma en diferentes especies de plantas y al 50% o más de diferencia en el tamaño total del genoma entre especies con genomas relativamente grandes, como el maíz. Contribuyen con un porcentaje más pequeño del tamaño del genoma en plantas con genomas más pequeños como Arabidopsis (La Iniciativa del Genoma de Arabidopsis, 2000). Si se tienen en cuenta otras secuencias repetitivas, el genoma del maíz se compone de más del 70% de secuencias repetitivas y de un 5% de regiones que codifican proteínas (Meyers et al., 2001).

Está ampliamente aceptado que el 70-80% de las plantas con flores son el producto de al menos un evento de poliploidización (Barnes, 2002). Muchas especies de plantas económicamente importantes, como el maíz, el trigo, la patata y la avena, son poliploides antiguos o más recientes, que comprenden más de uno y, en casos como el trigo, tres genomas homólogos diferentes dentro de una sola especie. Los segmentos duplicados también representan una fracción significativa del genoma del arroz. Aproximadamente el 60% de los Arabidopsis el genoma está presente en 24 segmentos duplicados, cada uno de más de 100 kilobases (kb) de tamaño (Bevan et al., 2001). La poliploidía ancestral contribuye a crear variación genética a través de la duplicación y el silenciamiento de genes. La duplicación del genoma y la subsecuente divergencia es un importante generador de diversidad de proteínas en las plantas.

1.1 Especies de plantas modelo

Organismos modelo (Drosophila melanogaster, Caenorhabditis elegans, Saccharomyces cerevisiae) proporcionan conocimientos genéticos y moleculares sobre la biología de especies más complejas. Dado que los genomas de la mayoría de las especies de plantas son demasiado grandes o demasiado complejos para ser analizados por completo, la comunidad científica vegetal ha adoptado organismos modelo. Comparten características como ser diploides y apropiados para el análisis genético, ser susceptibles de transformación genética, tener un genoma (relativamente) pequeño y un ciclo de crecimiento corto, tener herramientas y recursos comúnmente disponibles y ser el foco de investigación de una gran comunidad científica. . Aunque el advenimiento de las técnicas de cultivo de tejidos fomentó el uso de tabaco y petunia, las especies que ahora se utilizan como organismos modelo para plantas mono y dicotiledóneas son el arroz (Oryza sativa) y Arabidopsis (Arabidopsis thaliana) respectivamente.

Arabidopsis, una pequeña planta de Cruciferae sin uso agrícola, produce semilla en solo 6 semanas desde la siembra, tiene un pequeño genoma de 120 Megabases (Mb) y solo cinco cromosomas. Existen amplias herramientas disponibles para su análisis genómico, secuencia de genoma completo, colecciones de etiquetas de secuencia expresada (EST), mutantes caracterizados y grandes poblaciones mutagenizadas con elementos de inserción (transposones o el ADN-T de Agrobacterium). Arabidopsis se puede transformar genéticamente a gran escala con Agrobacterium tumefaciens y biolística. Otras herramientas disponibles para esta planta modelo son mapas físicos y genéticos saturados.

diferente a Arabidopsis, el arroz es uno de los cereales más importantes del mundo. Cada año se producen más de 500 millones de toneladas de arroz y es el alimento básico de más de la mitad de la población mundial. Hay dos subespecies principales de arroz. Rosal japonés se cultiva principalmente en Japón, mientras que indica se cultiva en China y otras regiones de Asia y el Pacífico. Rice también tiene mapas genéticos muy saturados, mapas físicos, secuencias del genoma completo, así como colecciones EST combinadas de diferentes tejidos y etapas de desarrollo. Tiene 12 cromosomas, un tamaño de genoma de 420 Mb y como Arabidopsis, se puede transformar a través de la biolística y A. tumefaciens. Aún no se dispone de sistemas eficientes de marcado de transposones para la eliminación de genes y la detección de genes para la mutagénesis por saturación en el arroz, aunque se han informado algunos éxitos recientes.

El desarrollo de marcadores moleculares ha permitido la construcción de mapas genéticos completos para la mayoría de las especies de plantas económicamente importantes. Detectan la variación genética directamente a nivel del ADN. Hay una gran variedad de sistemas de marcadores moleculares disponibles, pero su descripción está más allá del alcance de este artículo. Un mapa genético representa el orden de los marcadores moleculares a lo largo de los cromosomas, así como las distancias genéticas, generalmente expresadas como centiMorgans (cM), que existen entre marcadores moleculares adyacentes. Se han creado mapas genéticos en plantas a partir de muchas poblaciones experimentales, pero los más utilizados son F2, retrocruces y líneas endogámicas recombinantes. Aunque su desarrollo es más largo, las líneas endogámicas recombinantes ofrecen una resolución genética más alta y ventajas prácticas. Una vez que se ha creado una población cartográfica, solo se necesitan unos meses para producir un mapa genético con una resolución de 10 cM (Figura 2a). Los mapas genéticos contribuyen a comprender cómo se organizan los genomas de las plantas y, una vez disponibles, facilitan el desarrollo de aplicaciones prácticas en el fitomejoramiento, como la identificación de loci de rasgos cuantitativos y la selección asistida por marcadores. La mayoría de los rasgos de plantas económicamente importantes, como la altura de la planta de rendimiento y los componentes de calidad, exhiben una distribución continua en lugar de clases discretas y se consideran rasgos cuantitativos. Estos rasgos están controlados por varios loci, cada uno de pequeño efecto y diferentes combinaciones de alelos en estos loci pueden dar diferentes fenotipos.

El análisis cuantitativo de loci de rasgos se refiere a la identificación de regiones genómicas asociadas con la expresión fenotípica de un rasgo dado. Una vez que se conoce la ubicación de tales regiones genómicas, se pueden ensamblar en genotipos de diseño, es decir, individuos que portan fragmentos cromosómicos asociados con la expresión de un fenotipo dado. La característica más importante de la selección asistida por marcadores es que una vez que se ha detectado un marcador molecular genéticamente vinculado a la expresión de un alelo fenotípicamente interesante, se puede realizar una selección indirecta de dicho alelo basada en la detección del marcador molecular, ya que poco o nada se producirá una recombinación genética entre ellos. Por tanto, la presencia del marcador molecular siempre estará asociada a la presencia del alelo de interés.

Los mapas genéticos también son un recurso importante para el aislamiento de genes de plantas, ya que una vez que se establece la posición genética de cualquier mutación, es posible intentar su aislamiento mediante clonación posicional (Campos-de Quiroz et al., 2000). Además, los mapas genéticos ayudan a establecer el grado de colinealidad y duplicación del genoma entre diferentes especies.

Aunque los mapas genéticos proporcionan puntos de referencia muy necesarios a lo largo de los cromosomas, todavía están demasiado separados para proporcionar un punto de entrada a los genes, ya que incluso en plantas modelo, la proporción de kilobases porcentiMorgan (kb / cM) es grande, de 120 a 250 kb / cM. en Arabidopsis y entre 500 y 1.500 kb / cM en maíz. Por lo tanto, un intervalo de 1 cm puede albergar

30 a 100 o incluso más genes. Los mapas físicos cubren esas brechas, representando el fragmento de ADN completo que abarca la ubicación genética de los marcadores moleculares adyacentes.

Los mapas físicos se pueden definir como un conjunto de clones de insertos grandes con una superposición mínima que abarca un cromosoma dado. Los mapas físicos de primera generación en plantas se basaron en YAC (cromosomas artificiales de levadura). Problemas de estabilidad y quimera, sin embargo, dictaron el desarrollo de copia baja, E. coli-vectores mantenidos como los cromosomas artificiales bacterianos (BAC) y los cromosomas artificiales derivados de P1. Aunque los vectores BAC son relativamente pequeños (el peso molecular del vector BAC pBeloBAC11 es de 7,4 kb, por ejemplo), llevan insertos de entre 80 y 200 kb en promedio y poseen características tradicionales de selección de plásmidos, como un gen de resistencia a antibióticos y un sitio de policlonación dentro de un gen indicador. permitiendo la inactivación insercional. Los clones BAC son más fáciles de manipular que los clones basados ​​en levadura. Una vez que se prepara una biblioteca BAC, los clones se ensamblan en contigs utilizando tecnologías de huellas dactilares de ADN fluorescente y probabilidades de coincidencia. Los mapas físicos y genéticos se pueden alinear, trayendo consigo la continuidad de un fenotipo a otro. Además, proporcionan la plataforma en la que se basan los enfoques de secuenciación clon por clon. La Figura 2b muestra la relación entre mapas genéticos y físicos y su alineación. Los mapas físicos proporcionan el puente necesario entre la resolución lograda por los mapas genéticos y la necesaria para aislar genes mediante la clonación posicional.

1.3 Colinealidad del genoma / evolución del genoma

Una característica notable de la genómica vegetal es su capacidad para reunir más de una especie para su análisis. El mapeo comparativo del genoma de especies de plantas relacionadas ha demostrado que la organización de los genes está altamente conservada durante la evolución de los miembros de familias taxonómicas. Esto ha llevado a la identificación de la colinealidad del genoma entre los cultivos modelo bien secuenciados y sus especies relacionadas (p. Ej. Arabidopsis para dicotiledóneas y arroz para monocotiledóneas). La colinealidad anula las diferencias en el número de cromosomas y el tamaño del genoma y puede definirse como la conservación del orden de los genes dentro de un segmento cromosómico entre diferentes especies. Un concepto relacionado es sintenia, que se refiere a la presencia de dos o más loci en el mismo cromosoma, independientemente de que estén genéticamente vinculados o no.

Se han observado relaciones colineales entre especies de cereales (maíz, trigo, arroz, cebada), legumbres (frijoles, guisantes y soja), pinos y Crucíferas especies (canola, brócoli, repollo, Arabidopsis thaliana). Recientemente, los primeros estudios a nivel de genes han demostrado que la microcolinealidad de los genes es reordenamientos y deleciones a pequeña escala menos conservados que complican la microcolinealidad entre especies estrechamente relacionadas. Por ejemplo, aunque una secuencia genómica de sorgo de 78 kb alrededor del locus adh1 y su fragmento genómico homólogo de maíz mostró una microcolinealidad considerable y el hecho de que comparten nueve genes en perfecto orden y dirección transcripcional, cinco genes adicionales no compartidos residen en esta región genómica (Tikhonov et al., 1999).

Comparando secuencias de soja y Arabidopsis demostró homología parcial entre dos cromosomas de soja y una sección de 25 cM del cromosoma 2 de Arabidopsis (Lee y col., 2001). Aunque tales relaciones deben evaluarse caso por caso, reflejan el valor Arabidopsis y otras especies modelo se ofrecen a especies económicamente importantes.

También se ha establecido la colinealidad entre el arroz y la mayoría de las especies de cereales, lo que permite el uso del arroz para el análisis genético y el descubrimiento de genes en especies genéticamente más complejas, como el trigo y la cebada (Shimamoto y Kyozuka, 2002). Una comparación de las secuencias de ADN del arroz y la cebada de las regiones sinténicas entre el cromosoma 5H de la cebada y el cromosoma 3 del arroz reveló la presencia de cuatro regiones conservadas, que contienen cuatro genes predichos. La estructura genética general se conservó en gran medida entre el arroz y la cebada (Dubcovsky et al., 2001). Una comparación similar entre maíz y arroz, basada en 340 kb alrededor de loci adh1 y adh2, mostró cinco genes colineales entre las dos especies, así como una posible translocación en adh1. Los genes del arroz similares a los genes resistentes a enfermedades conocidas no mostraron hibridación cruzada con el ADN genómico del maíz, lo que sugiere una divergencia de secuencia o su ausencia en el maíz (Tarchini et al., 2000). Incluso hay informes de colinealidad a través de la división mono-dicotiledónea que involucra Arabidopsis y cereales que divergieron hace 200 millones de años (Mayer et al., 2001) La explotación de la colinealidad ayuda a establecer vínculos genéticos entre especies y también ayuda a extrapolar la información de especies con genomas más simples (es decir, arroz) a especies genéticamente complejas. especies (maíz, trigo). Además, refleja el poder de la genómica para integrar información genética entre especies.

1.4 Secuenciación del genoma completo

Los mapas genéticos y físicos a nivel entre especies o entre especies representan una capa clave de información genómica. Sin embargo, los datos de secuencia representan el nivel máximo de información genética. Tres avances importantes han permitido la secuenciación de genomas completos: 1) El desarrollo de métodos de secuenciación de ADN basados ​​en fluorescencia que proporcionan al menos 500 bases por lectura 2) La automatización de varios procesos como la selección y formación de subclones bacterianos, la purificación de ADN de individuos subclones y carga de muestras entre otros y 3) El desarrollo de software y hardware capaz de manejar cantidades masivas (gigabytes) de puntos de datos.

Hay dos enfoques principales para la secuenciación a gran escala (Figura 1). En las estrategias de clon por clon (Figura 1a), las bibliotecas de insertos grandes, como las basadas en clones BAC, se utilizan como plantillas de secuenciación, y los insertos se organizan en contigs utilizando diversos métodos de huellas dactilares para establecer rutas de mosaico mínimas. Conectores etiquetados de secuencia extraídos de clones de insertos grandes, así como FISH (Fluorescent en el lugar Hibridación) y mapeo óptico se utilizan para extender contigs y cerrar brechas (Marra et al., 1997). Los clones BAC de contigs listos para la secuencia se fragmentan luego en bibliotecas de escopeta basadas en plásmidos o vectores M13 con tamaños de inserto de

1 a 3 kb. El uso de más de un sistema de vectores reduce los problemas de sesgo de clonación. Los esfuerzos de secuenciación se adaptan al grado de cobertura requerido. Por ejemplo, para una cobertura de 5 veces, y asumiendo 500 pares de bases (pb) por lectura de secuenciador, se secuencian 800 clones para cubrir un clon BAC de 80 kb. Las secuencias terminadas son las obtenidas a

Cobertura de 8 a 10 veces y proporciona una precisión de & gt99,99%, mientras que las secuencias de borrador de trabajo se logran a una

Cobertura de 3-5 veces. Sin embargo, es importante tener en cuenta que incluso las secuencias de borradores de trabajo proporcionan una enorme cantidad de información, e incluso los enfoques de escopeta se basan en cierta medida en la información clon por clon.

Figura 1. Secuenciación del genoma completo a-. Enfoque clon por clon b-. Enfoque de escopeta

Figura 2. Mapas utilizados en genética vegetal. a: Mapas genéticos y físicos de un cromosoma hipotético. Las líneas horizontales en el mapa genético representan loci a los que se dirige un marcador molecular. Las líneas verticales representan clones BAC superpuestos. b: Alineación de mapas genéticos y físicos utilizando la secuencia de extremos BAC (líneas discontinuas), tecnologías ecológicamente racionales (línea discontinua) y marcadores moleculares (*).

Una vez concluida la secuenciación, los datos de ADN se utilizan para reensamblar los clones BAC. Para lograr dicho ensamblaje se utilizan programas de llamada de base que asignan puntajes de calidad a cada base de lectura, como Phred (Ewing et al., 1998), programas de ensamblaje de secuencias como Phrap (Gordon et al., 1998) y herramientas de visualización gráfica. A continuación, se produce el acabado de la secuencia, que se puede realizar en parte de forma manual o con un software de acabado como Autofinish (Gordon et al., 2001).

La anotación, o el proceso de identificación de los codones de inicio y finalización y la posición de los intrones que permite la predicción de la función biológica a partir de la secuencia de ADN, pasa por tres pasos principales. La primera es utilizar buscadores de genes como Xgrail (Uberbacher y Mural, 1991) u otros basados ​​en modelos de Markov ocultos generalizados, como GeneMark.hmm (Lukashin y Borodovsky, 1998) y GenScan (Burge y Karlin, 1997), específicamente desarrollados para reconocer Arabidopsis genes. En el segundo paso, las secuencias se alinean con las bases de datos de proteínas y EST y, finalmente, se asignan funciones putativas a cada secuencia de genes. Los procesos de anotación exitosos a menudo combinan diferentes programas e inspecciones manuales.

En enfoques de escopeta (Figura 1b), que se han utilizado con éxito para secuenciar muchos microorganismos y D. melanogaster, se preparan pequeñas bibliotecas de insertos, y los insertos seleccionados al azar se secuencian hasta que

Se alcanza una cobertura de 5 veces o más. Luego se ensamblan las secuencias, se identifican y cierran las brechas y, finalmente, se realiza la anotación. La secuenciación de escopeta no depende de la disponibilidad de rutas de mosaico mínimas y, por lo tanto, reduce el costo y el esfuerzo necesarios para obtener secuencias del genoma completo. Sin embargo, requieren una enorme cantidad de poder computacional para ensamblar una gran cantidad de secuencias aleatorias en una pequeña cantidad de contigs. Además, la calidad final de los genomas grandes que se han secuenciado como una escopeta puede no ser tan alta como la que se puede lograr utilizando el enfoque clon por clon. Debido al alto contenido de secuencias repetitivas largas y altamente conservadas, incluidos los retrotransposones, la secuenciación rápida de genomas de plantas puede plantear desafíos especiales.

los Arabidopsis El genoma fue el primero en estar completamente secuenciado. El ecotipo elegido fue Columbia. En 1996, grupos de secuenciación en EE. UU., Japón y Europa establecieron el Arabidopsis Iniciativa del genoma (AGI) y establezca técnicas y recursos comunes, estándares de precisión, niveles de análisis y una política de divulgación pública común para la información de secuencia. Dado que la secuenciación de escopeta no estaba disponible en sus inicios, la secuenciación de Arabidopsis siguió un enfoque más convencional (The Arabidopsis Genome Initiative, 2000).

Hay dos lecciones notables que aprender de la Arabidopsis esfuerzo de secuenciación. Primero, no hay alternativa para establecer asociaciones incluso entre grupos en competencia al abordar grandes proyectos genómicos debido a la complejidad, el gasto y la infraestructura requeridos. Por ejemplo, la efectividad del consorcio AGI resultó en la finalización y liberación de la Arabidopsis secuencia en 2000, cuatro años antes de lo previsto. En segundo lugar, aproximadamente un tercio de los genes supuestamente identificados en Arabidopsis codifican productos que carecen de similitud significativa con proteínas de función conocida en otros organismos. Además, solo el 9% de sus genes se han caracterizado experimentalmente. Estas cifras reflejan el poder de los enfoques genómicos y la gran cantidad de información que nos brindan. El complemento genético de Arabidopsis se muestra en la Tabla II.

En arroz, el IRGSP (Proyecto Internacional de Secuenciación del Genoma del Arroz) comenzó en 1997 e incluye miembros de países en desarrollo además de socios europeos y estadounidenses. Se basa en el cultivar Nipponbare, y su enfoque es similar al utilizado en Arabidopsis. Por lo tanto, la primera tarea fue establecer un contig BAC listo para la secuencia del genoma del arroz, seguido del ensamblaje de software de las secuencias de ADN, la anotación computacional y manual y la liberación final de la secuencia terminada. La fecha límite prevista para la publicación de los datos completos de la secuencia es 2003.

Syngenta y un grupo chino pusieron a disposición recientemente las secuencias de japonica y indica arroz, respectivamente (Goff et al., 2002 Yu et al., 2002), y ambos se basaron en enfoques de escopeta. Los gradientes en el contenido de guanina / citosina y el uso de codones para genes de arroz crearon problemas inesperados en el proceso de anotación de genes, y el software de búsqueda de genes FgeneSH fue el más eficaz en arroz (Yu et al., 2002). El número de genes predichos en el arroz varía de 32.000 a 55.000, según los criterios utilizados para reconocer un gen (Goff et al., 2002 Yu et al., 2002). Independientemente de la cifra real, es interesante observar que tales cifras son similares o mayores que el complemento de genes humanos (32.000-39.100 genes Green y Chakravarti, 2001). La sugerencia de Yu et al. (2002) de que la diversidad de proteínas en las plantas se genera principalmente a través de la duplicación de genes explicaría el número comparativamente grande de genes predichos en el arroz.

Sin embargo, el número real de genes existentes en Arabidopsis, arroz, o cualquier otra especie secuenciada queda por establecer a través de experimentos genómicos funcionales que establezcan el significado biológico de las secuencias de ADN, ya que la predicción de genes a través de comparaciones de homología y herramientas de software es una & quot; conjetura mejor informada & quot; estadística más que un proceso de base biológica. La disponibilidad de colecciones extensas de EST, que ahora existen en varias especies de plantas, incluido el maíz (Rafalski et al., 1998) y la soja (Cahoon et al., 1999), reduce la dependencia del proceso de anotación de las predicciones genéticas computacionales.

2. EXTRACCIÓN DE SIGNIFICADO BIOLÓGICO DE
SECUENCIAS DE ADN

Los temas discutidos hasta ahora se relacionan con cómo se puede extraer información del ADN en diferentes niveles de complejidad (mapas genéticos o físicos, colinealidad, secuenciación del genoma completo). Sin embargo, esta información no representa el final de la genómica, sino el punto de partida para asignar un significado biológico a genes putativos sin fenotipo conocido. El campo de la genómica que aborda la función de los genes descubiertos mediante esfuerzos de secuenciación se denomina genómica funcional. Dado que se espera que los genes que codifican rasgos sean funcionales en todas las especies, la mayor parte de la información así recopilada será útil para abordar problemas de mejora de plantas o procesos biológicos.

2.1 tecnologías ecológicamente racionales (etiquetas de secuencia expresada)

Las instalaciones de secuenciación a gran escala permiten el desarrollo de tecnologías ecológicamente racionales, también conocidas como secuencias de un solo paso de ADNc aleatorios. Las tecnologías ecológicamente racionales se derivan del extremo 3 'de las transcripciones y se espera que contengan secuencias que incluyan regiones no traducidas (UTR) 3' y que se extiendan hacia el extremo 5 ', alcanzando así los exones. Su longitud promedio en especies de plantas es

La Figura 3 presenta el diagrama de flujo típico de un proyecto EST. Aunque las tecnologías ecológicamente racionales generadas a partir de extremos 5 'mejoran la probabilidad de abarcar marcos de lectura abiertos, la disponibilidad de datos de 3' UTR es importante para segregar miembros de familias de genes y seleccionar clones para estudios de perfiles transcripcionales. Permiten la catalogación de muchos genes sin el esfuerzo que implican las iniciativas de secuenciación completa del genoma. Dado que muchos genes tienen patrones de expresión temporal específicos de tejido, para recolectar ADNc de la mayoría de los genes expresados ​​es necesario preparar bibliotecas de ADNc de varios tejidos diferentes y también de tejidos desafiados con diversos factores bióticos y abióticos. El valor de utilizar bibliotecas normalizadas como una plataforma de descubrimiento de EST no se puede exagerar.

Las búsquedas de homología con genes conocidos de otras especies permiten la asignación de funciones biológicas putativas a las tecnologías ecológicamente racionales. El uso de tecnologías ecológicamente racionales también permite la identificación de genes que codifican proteínas funcionalmente desconocidas. Una comparación de las bases de datos EST de diferentes especies y tejidos revela la diversidad en las secuencias de codificación entre plantas y una perspectiva global sobre las similitudes en los genes para tejidos o condiciones específicas.

Aunque las tecnologías ecológicamente racionales son herramientas útiles en el descubrimiento de genes, las que pertenecen a familias multigénicas no son fácilmente distinguibles y las transcripciones raras tienen una pequeña probabilidad de estar representadas en las colecciones de tecnologías ecológicamente racionales. Existe una amplia colección de tecnologías ecológicamente racionales públicas de varios organismos en la base de datos dbEST, una división de GenBank. La Tabla III presenta un registro actualizado (septiembre de 2002) de tecnologías ecológicamente racionales derivadas de plantas disponibles en dbEST.

Las tecnologías ecológicamente racionales también son importantes para establecer mapas de expresión / transcripción, ya que su ubicación en un mapa genético proporciona la ubicación precisa de los genes. Esto nos ayuda a comprender cómo los genes que pertenecen a una vía o una familia de genes determinada se distribuyen en el genoma. Además, proporcionan anclas mediante las cuales se pueden alinear mapas físicos y genéticos (Figura 2b).

La investigación que se centra en mejorar la calidad nutricional de los productos vegetales refleja el valor de los programas EST en el descubrimiento de genes vegetales. Una EST de Arabidopsis permitió el aislamiento del gen pag-hidroxifenilpiruvato dioxigenasa en Synechocystis PCC6803. Esta enzima permite el primer paso comprometido en la síntesis de plastoquinonas y tocoferoles en plantas y, posteriormente, otros pasos de la síntesis de vitamina E. Esto condujo al desarrollo de transgénicos Arabidopsis plantas con niveles elevados de vitamina E en aceite. (Shintani y DellaPenna, 1998).

Para especies distintas del arroz o Arabidopsis, la secuenciación EST a gran escala proporciona una manera excelente y rentable de obtener información valiosa sobre genes transcritos (Mayer y Mewes, 2001). Las tecnologías ecológicamente racionales son una herramienta de descubrimiento de genes muy eficaz, y aproximadamente el 60% de los supuestamente identificados Arabidopsis los genes se han etiquetado con tecnologías ecológicamente racionales (Tabla II). Además, han proporcionado la plataforma necesaria para los experimentos de elaboración de perfiles transcripcionales. Los programas de secuenciación EST, por lo tanto, proporcionan una poderosa ventaja en enfoques genómicos en plantas.

Figura 3. Gráfico esquemático de un programa de descubrimiento de EST

El análisis genético tradicional tiene como objetivo identificar las secuencias de ADN asociadas con un fenotipo determinado. La genética inversa determina la función de un gen para el que se conoce la secuencia, generando y analizando el fenotipo del correspondiente mutante knockout (Maes et al., 1999). A diferencia de la levadura, en la que la alteración genética está disponible mediante recombinación homóloga, el marcado con transposón y ADN-T son los mejores métodos disponibles para desarrollar poblaciones de plantas mutagenizadas adecuadas para estudios de genética inversa (Pereira, 2000). Hay varias poblaciones mutagenizadas en Arabidopsis adecuado para estudios de genética inversa. Un consorcio europeo está desarrollando sistemas heterólogos para arroz basados ​​en el elemento Ac del maíz (Greco, 2001). También existen poblaciones patentadas como el Sistema de Utilidad de Rasgos para Maíz (TUSC) de Pioneer Hi-Bred International, mutagenizado con el elemento Mu de alta copia (Multani et al., 1998). El uso de elementos de alta copia hace posible el uso de poblaciones más pequeñas para garantizar que se encuentren mutantes marcados para la mayoría de los genes.

Hay dos posibilidades principales para identificar genes marcados en los sitios de inserción. Para genes desconocidos, las secuencias que flanquean la inserción pueden obtenerse mediante la reacción en cadena de la polimerasa inversa (PCR) (Ochman et al., 1988) o la PCR entrelazada asimétrica térmica (Liu y Whitier, 1995), mientras que para las inserciones en genes de secuencia conocida, Es posible amplificar y clonar la secuencia de interés mediante PCR utilizando cebadores específicos de gen y específicos de inserción. Dado que en el último caso es común analizar miles de plantas, el cribado basado en PCR se organiza en grupos tridimensionales que permiten la identificación inequívoca de los individuos marcados. Están disponibles grandes bases de datos de sitios de inserción caracterizados que facilitarán aún más el uso de elementos de inserción para aislar genes útiles (Tissier et al., 1999).

Aunque se han aislado varios genes mediante enfoques genéticos inversos, dos factores principales han limitado su aplicación más amplia. Primero, muchos genes son funcionalmente redundantes, ya que incluso especies con genomas simples como Arabidopsis portan duplicaciones extensas y, en segundo lugar, las mutaciones en muchos genes pueden ser muy pleiotrópicas, lo que puede enmascarar el papel de un gen en una vía específica (Springer, 2000). No obstante, se considera que la genética inversa es un componente importante de la caja de herramientas de la genómica funcional y desempeña un papel importante en la asignación de funciones biológicas a genes descubiertos mediante programas de secuenciación a gran escala. El marcado de transposones proporciona una excelente alternativa para aislar genes marcados que exhiben una herencia relativamente simple.

Las trampas de genes se refieren a otra aplicación de transposones que responde a secuencias reguladoras en el sitio de inserción. Dependiendo de las secuencias diseñadas, se pueden clasificar como trampas informadoras, trampas potenciadoras o trampas genéticas. Dado que se basan en la expresión del gen informador, no se requieren fenotipos mutantes y han sido valiosos para aislar secuencias específicas de tejidos y células (Springer, 2000).

2.3 Perfiles transcripcionales

Si bien la biología molecular generalmente analiza uno o varios genes simultáneamente, los desarrollos recientes permiten el análisis paralelo de miles de genes. Esta área de la genómica implica el estudio de patrones de expresión génica en una amplia gama de respuestas celulares, fenotipos y condiciones. El perfil de expresión de una etapa de desarrollo o condición inducida puede identificar genes y vías reguladas coordinadamente y sus funciones. Esto produce una comprensión más profunda de la biología subyacente (Quackenbush, 2001).

Hay varios sistemas disponibles para analizar la expresión paralela de muchos genes, tales como macroarrays (Desprez et al., 1998), microarrays (Schena et al., 1995) y Serial Analysis of Gene Expression (SAGE) (Velculescu et al., 1995). ), que consiste en identificar etiquetas de secuencia corta a partir de transcripciones individuales, su concatenación, secuenciación y posterior cuantificación digital. SAGE proporciona niveles de expresión para muchas transcripciones en diferentes etapas de desarrollo.

Hay sistemas de perfiles transcripcionales abiertos y cerrados. Las tecnologías abiertas examinan una gran cantidad de transcripciones y analizan sus niveles entre diferentes muestras, pero se desconoce la identidad de los genes involucrados. a priori. Un ejemplo de tal sistema es la tecnología GeneCalling (Bruce et al., 2000). Otro sistema abierto lo proporciona Massively Parallel Sequence Signatures (MPSS), donde se utilizan microperlas para construir bibliotecas de plantillas de ADN y crear cientos de miles de firmas de genes (Brenner et al., 2000).

Los sistemas cerrados, en cambio, analizan genes que han sido previamente caracterizados. Incluyen la mayoría de los diversos sistemas de microarrays disponibles, y se basan en la hibridación específica de muestras marcadas para separar espacialmente los ácidos nucleicos inmovilizados, lo que permite la cuantificación paralela de muchos ARNm específicos. Es importante seleccionar el sistema al inicio de cualquier estudio de perfil transcripcional y seguir con él.

El enfoque aquí está en los microarrays. En los experimentos de micromatrices, las muestras de ADN correspondientes a miles de genes de interés se inmovilizan en una superficie sólida, como portaobjetos de vidrio en una matriz regular. Las secuencias inmovilizadas se denominan habitualmente sondas. Las muestras de ARN (o sus derivados de ADNc) de una muestra biológica en estudio se hibridan con la matriz y se denominan diana. El etiquetado con tintes fluorescentes con diferentes características de excitación y emisión permite la hibridación simultánea de dos dianas contrastantes en una sola matriz (Aharoni y Vorst, 2001). Las micromatrices pueden basarse en oligonucleótidos o moléculas de ADNc, y sus características básicas se presentan en la Tabla IV.

Las aplicaciones de microarrays se clasifican ampliamente como estudios de expresión específicos de expresión y de todo el genoma. En estudios de expresión específicos, se utilizan como una herramienta de genómica funcional para abordar la importancia biológica de los genes descubiertos a través de la secuenciación a gran escala, así como un medio para comprender las redes genéticas que explican los procesos biológicos o las vías bioquímicas. El valor de utilizar microarrays para identificar nuevos genes de respuesta se ha demostrado mediante el estudio de los patrones de expresión génica durante el desarrollo del embrión de maíz (Lee et al., 2002), la respuesta a la sequía y el estrés por frío (Seki et al., 2001), herbivoría ( Arimura et al., 2000) y tratamientos con nitratos (Wang et al., 2000).

Al abordar una vía o proceso biológico específico, es útil incluir genes más allá de los de aparente interés, ya que los microarrays sobreespecíficos no podrían abordar las interacciones genéticas con otros procesos biológicos. Este principio reveló relaciones previamente inesperadas entre los niveles bajos de fosfato del suelo y la aclimatación al frío en Arabidopsis (Date prisa y col., 2000). Los genes obtenidos del análisis transcripcional de las respuestas de las plantas al estrés son de particular relevancia para los enfoques transgénicos, según lo revisaron minuciosamente Dunwell et al. (2001).

Las matrices de todo el genoma están diseñadas principalmente para organismos modelo como Arabidopsis o arroz, ya que hay muchos genes disponibles para seleccionar, ya sea como clones o como secuencias genómicas anotadas para especies modelo. También están disponibles para especies como el maíz que tienen extensas colecciones de EST. Esta tecnología habilitadora es un resultado directo e inmediato de proyectos de secuenciación a gran escala. Se espera que los microarrays que cubren la mayoría de los genes de Arabidopsis estén disponibles en 2003. Los perfiles de expresión de todo el genoma son la herramienta definitiva para integrar todos los genes existentes en un organismo en una serie de experimentos. También ayudan a dilucidar la expresión coordinada de diferentes redes genéticas y documentan cómo los cambios en una afectarían a otras. Se espera que estos enfoques de todo el genoma sean particularmente útiles para identificar nuevas secuencias reguladoras e interruptores maestros que afecten a redes genéticas distintas pero aparentemente no relacionadas.

Las tecnologías de elaboración de perfiles transcripcionales desempeñan un papel central en la predicción de la función de los genes, ya que la comparación de secuencias por sí sola es insuficiente para inferir la función. También ayudan a detectar fenómenos como el desplazamiento de genes (genes no homólogos que codifican proteínas que cumplen la misma función) y el reclutamiento de genes (genes con secuencias idénticas que codifican funciones completamente diferentes) (Noordewier y Warren, 2001).

A diferencia de los animales, las plantas no pueden moverse y han desarrollado mecanismos exquisitos para hacer frente a las condiciones ambientales cambiantes y los desafíos bióticos, ya que estos afectan directa o indirectamente a la mayoría de los procesos biológicos que ocurren en las plantas. Por lo tanto, una proporción significativa de la información recopilada por procesos de perfil de transcripción específicos y de todo el genoma debería tener aplicaciones prácticas y facilitar el desarrollo de plantas más resistentes a los estímulos bióticos y abióticos.

Esta descripción general no puede estar completa sin abordar algunos errores potenciales que los investigadores interesados ​​en microarrays deben conocer. La tecnología de microarrays es todavía un enfoque joven y muy complejo con muchas variables involucradas. Las secuencias para un experimento dado deben seleccionarse cuidadosamente en términos de cobertura, redundancia, calidad de anotación y costo. Con microarrays comerciales, el investigador tiene poco o ningún control sobre el contenido de secuencia de la matriz y solo puede confiar en la anotación del fabricante. La hibridación cruzada entre miembros de la familia y formas de empalme alternativas puede ser engañosa, aunque el uso de secuencias 3 'UTR y uniones exón-intrón puede aliviar esto. También es necesario estandarizar cuidadosamente las condiciones experimentales (Aharoni y Vorst, 2001).

Una vez que se han recopilado los datos, es necesario normalizarlos comparándolos con los estándares internos ("genes de mantenimiento") o mediante la adición de ARNm extraño. Los datos de cada gen se informan generalmente como una proporción de expresión o su logaritmo (Hess et al., 2001). El análisis estadístico de la información recopilada con microarrays es quizás el paso más complejo y a menudo descuidado que aún se está desarrollando. Cuando se comparan los datos de expresión de diferentes experimentos, el objetivo es identificar genes con patrones de expresión similares. Existen enfoques no supervisados ​​en los que no se dispone de conocimiento sobre cómo se organizan los genes evaluados, por ejemplo, algoritmos de agrupamiento, análisis de componentes principales y k-significa agrupamiento. Estos sistemas pueden agrupar genes sobre la base de su separación en el espacio de expresión. También existen métodos basados ​​en redes neuronales, como los mapas autoorganizados (SOM). Los métodos supervisados, por otro lado, se basan en información previa sobre los genes estudiados. La máquina de vectores de soporte, por ejemplo, utiliza un conjunto de entrenamiento en el que los genes que se sabe que están relacionados, por ejemplo, la función, se proporcionan como ejemplos positivos y los genes que se sabe que no pertenecen a esa clase son ejemplos negativos. Por lo tanto, SVM aprende a distinguir entre miembros de la clase y no miembros sobre la base de datos de expresión (Quackenbush, 2001).

La gran cantidad de información generada a partir de experimentos de microarrays se gestiona mejor con sistemas de gestión de información de laboratorio que manejan el envío de muestras, el procesamiento de muestras, el seguimiento de muestras, la recuperación de datos, la clasificación, la visualización y el análisis estadístico. Finkelstein y col.(2002) han reunido un conjunto útil de pasos críticos a seguir cuando se realizan experimentos de microarrays: selección de sondas diseño físico de la adquisición de datos del arreglo, diseño de extracción y normalización y control del experimento a través de anotaciones estandarizadas y métodos empleados en el análisis de datos.

La enorme cantidad de información generada con los experimentos de microarrays es muy atractiva para muchos investigadores, pero no debería disuadir a uno del diseño experimental riguroso y el desarrollo de hipótesis. Las observaciones de los datos de expresión pueden ayudar a generar hipótesis, pero puede ser necesaria una experimentación adicional, por ejemplo, mapeo genético o transgénesis, para validar estas hipótesis.

La comprensión actual de la biología vegetal está limitada por nuestra comprensión de la función de los genes en el contexto de la biología del organismo completo. Incluso en Arabidopsis, solo una fracción de sus genes se ha caracterizado desde un punto de vista molecular. Este paradigma está siendo desafiado por una gran cantidad de enfoques genómicos disponibles para los investigadores que permiten la identificación de genes putativos y la validación de su funcionalidad biológica a través de enfoques funcionales. Además, usada en combinación con la genética, la genómica agrega otro nivel de comprensión a la biología vegetal a través del análisis integrado de diferentes especies.

La gran cantidad de genes que maneja simultáneamente la genómica establece un nuevo paradigma en biología vegetal, ya que permite la integración genética de diversos procesos, tejidos y organismos. Se espera que una proporción significativa de esa información se transfiera a los programas de mejoramiento de las plantas y contribuya así a satisfacer las crecientes necesidades alimentarias del mundo.

La genómica vegetal revolucionará el estudio de las bases moleculares de la biología vegetal. El enfoque tradicional basado en hipótesis se transformará gradualmente en un enfoque de recopilación de datos imparcial a nivel de tejido / organismo seguido de análisis bioinformáticos.

Por último, la genómica es el enfoque interdisciplinario definitivo, ya que cubre todo el espectro, desde la secuenciación del ADN hasta la investigación de campo. Solo a través del esfuerzo integrado de la genética, la biología, la bioinformática, la biología molecular, la ingeniería, la microbiología y campos relacionados, los amplios beneficios de la genómica para la humanidad se harán realidad.

Me gustaría agradecer a los Dres. Gregory Edmeades (Pioneer Hi-Bred International), Antoni Rafalski (Dupont Crop Genetics-Genomics) y dos revisores anónimos por sus comentarios sobre este manuscrito.

AHARONI A, VORST O (2001) Microarrays de ADN para genómica funcional de plantas. Plant Mol Biol 48: 99-118 [& # 160Links & # 160]

ARIMURA G, TASHIRO K, KUHARA S, NISHIOKA T, OZAWA R, TAKABAYASHI, J (2000) Respuestas génicas en hojas de frijol inducidas por herbivoría y volátiles inducidos por herbívoros. Biochem Biophys Res Commun 277: 305-310 [& # 160Links & # 160]

BARNES S (2002) Comparando Arabidopsis con otras plantas con flores. Curr Op Plant Biology 5: 128-133 [& # 160Links & # 160]

BEVAN M, MAYER K, WHITE O, EISEN JA, PREUSS D, BUREAU T, SALZBERG S, MEWES H-W (2001) Secuencia y análisis del genoma de Arabidopsis. Curr Op Plant Biol 4: 105-110 [& # 160Links & # 160]

BRENNER S, JOHNSON M, BRIDGHAM J, GOLDA G, LLOYD DH, JOHNSON D, LUO SJ, MCCURDY S, FOY M, EWAN M, ROTH R, GEORGE D, ELETR S, ALBRECHT G, VERMAAS E, WILLIAMS SR, MOON K , BURCHAM T, PALLAS M, DUBRIDGE RB, KIRCHNER J, FEARON K, MAO J, CORCORAN K (2000) Análisis de expresión génica mediante secuenciación masiva de firmas paralelas (MPSS) en matrices de microperlas. Nature Biotech 18: 630-634 [& # 160Links & # 160]

BRUCE W, FOLKERTS O, GARNAAT C, CRASTA O, ROTH B, BOWEN B (2000) Perfil de expresión de los genes de la vía de los flavonoides del maíz controlados por factores de transcripción inducibles por estradiol CRC y P. Plant Cell 12: 65-79 [& # 160Links & # 160]

BURGE C, KARLIN S (1997) Predicción de estructuras genéticas completas en el ADN genómico humano. J Mol Biol 268: 78-94 [& # 160Links & # 160]

CAHOON E, CARLSON T, RIPP K, SCHWEIGER B, COOK G, HALL S, KINEY AJ (1999) Origen biosintético de los dobles enlaces conjugados: Producción de componentes de ácidos grasos de aceites secantes de alto valor en embriones de soja transgénica. Proc Natl Acad Sci USA 96: 12935-12940 [& # 160Links & # 160]

CAMPOS DE QUIROZ H, MAGRATH R, MCCALLUM D, KROYMANN J, SCNABELRAUCH D, MITCHELL-OLDS T, MITHEN R (2000) Elongación de cetoácidos y biosíntesis de glucosinolatos en Arabidopsis thaliana. Theor Appl Genet 101: 429-437. [& # 160Links & # 160]

DESPREZ T, AMSELEM J, CABOCHE M, HOFTE H (1998) Expresión génica diferencial en Arabidopsis monitorizada utilizando matrices de ADNc. Planta J 14: 643-652 [& # 160Links & # 160]

DUBCOVSKY J, RAMAKRISHNA W, SANMIGUEL P, BUSSO C, YAN L, SHILOFF B, BENNETZEN JL (2001) Análisis de secuencia comparativo de cromosomas artificiales bacterianos de cebada y arroz colineales. Plant Physiol 125: 1342-1353 [& # 160Links & # 160]

DUNWELL JM, MOYA-LEON M A, HERRERA R (2001) Análisis de transcriptomas y mejora de cultivos: (Una revisión). Biol Res 34 (3-4): 153-164 [& # 160Links & # 160]

EWING B, HILLIER L, WENDL MC, GREEN P (1998) Llamada base de trazas de secuenciador automático usando phred. I. Evaluación de la precisión. Genome Res 8: 175-185 [& # 160Links & # 160]

FINKELSTEIN D, EWING R, GOLLUB J, STERKY F, CHERRY M, SOMERVILLE S (2002) Análisis de calidad de datos de microarrays: lecciones del proyecto AFGC. Plant Mol Biol 48: 119-131 [& # 160Links & # 160]

GOFF S, RICKE D, LAN TH, PRESTING G, WANG R, DUNN M, GLAZEBROOK J, SESSIONS A, OELLER P, VARMA H, HADLEY D, HUTCHISON D, MARTIN C, KATAGIRI F, LANGE B, MOUGHAMER T, XIA Y , BUDWORTH P, ZHONG J, MIGUEL T, PASZKOWSKI U, ZHANG S, COLBERT M, SUN M, CHEN L, COOPER B, PARK S, WOOD T, MAO L, QUAIL P, WING R, DEAN R, YU Y, ZHARKIKH A, SHEN R, SAHASRABUDHE S, THOMAS A, CANNINGS R, GUTIN A, PRUSS D, REID J, TAVTIGIAN S, MITCHELL J, ELDREDGE G, SCHOLL T, MILLER RM, BHATNAGAR S, ADEY N, RUBANO T, TUSNEEM N, ROBINSON R, FELDHAUS J, MACALMA T, OLIPHANT A, BRIGGS S (2002) Una secuencia preliminar del genoma del arroz (Oryza sativa L ssp japonica). Ciencia 296: 92-100 [& # 160Links & # 160]

GORDON D, ABAIJAN C, GREEN P (1998) Consed: una herramienta gráfica para el acabado de secuencias. Genome Res 8: 195-202 [& # 160Links & # 160]

GORDON D, DESMARAIS C, GREEN P (2001) Acabado automatizado con Autofinish. Genome Res 11: 614-625 [& # 160Links & # 160]

GRECO R, OUWERKERK PBF, SALLAUD C, KOHLI A, COLOMBO L, PUIGDOMENECH P, GUIDERDONI E, CHRISTOU P, HOGE JHC, PEREIRA A (2001) Mutagénesis por inserción de transposones en la planta de arroz Physiol 125: 1175-1177 [& # 160Links & # 160 ]

GREEN E, CHAKRAVARTI A (2001) The Human Genome Sequence Expedition: Views from the & igraveBase Camp. & Icirc Genome Res 11: 645 -651 [& # 160Links & # 160]

HESS KR, ZHANG W, BAGGERLY KA, STIVERS DN, COOMBESRL KR (2001) Microarrays: manejo del diluvio de datos, extracción de información confiable. T Biotech 19: 463-467 [& # 160Links & # 160]

HURRY V, STRAND A, FURBANK R, STITT M (2000) El papel del fosfato inorgánico en el desarrollo de la tolerancia al congelamiento y la aclimatación de la fotosíntesis a bajas temperaturas es revelado por los mutantes pho de Arabidopsis thaliana. Plant J 24: 383-396 [& # 160Links & # 160]

KUMAR A, BENNETZEN JL (1999) Retrotransposones de plantas. Ann Rev Genet 33: 479-532 [& # 160Links & # 160]

LEE J-M, WILLIAMS ME, TINGEY SV, RAFALSKI A (2002) Perfiles de matriz de ADN de cambios en la expresión génica durante el desarrollo del embrión de maíz. Funct Integr Genomics 2: 13-27 [& # 160Links & # 160]

LEE JM, GRANT D, VALLEJOS CE, SHOEMAKER RC (2001) Organización del genoma en dicotiledóneas II Arabidopsis como una especie de puenteo y para resolver eventos de evolución del genoma entre leguminosas. Theor Appl Genet 103: 765-773 [& # 160Links & # 160]

LEE JM, WILLIAMS ME, TINGEY SV, RAFALSKI JA (2002) Perfiles de matriz de ADN de cambios en la expresión génica durante el desarrollo del embrión de maíz. Funct Integr Genomics 2: 13-27 [& # 160Links & # 160]

LIU Y, WHITTIER, R (1995) PCR entrelazada asimétrica térmica: amplificación y secuenciación automatizables de los fragmentos del extremo del inserto de los clones P1 y YAC para la marcha de los cromosomas. Genomics 25: 674-681 [& # 160Links & # 160]

LUKASHIN AV, BORODOVSKY M (1998) GeneMarkhmm: nuevas soluciones para la búsqueda de genes. Ácidos nucleicos Res 26: 1107-1115 [& # 160Links & # 160]

MAES T, DE KEUKELEIRE P, GERATS T (1999) Tagnología vegetal. T Plant Sci 4: 90-96 [& # 160Links & # 160]

MARRA M, KUCABA T, DIETRICH N, GREEN E, BROWNSTEIN, WILSON RK, MCDONALD K, HILLIER L, MCPHERSON J, WATERSTON RH (1997) Análisis de huellas dactilares de alto rendimiento de clones de inserto grande. Genome Res 7: 1072-1084 [& # 160Links & # 160]

MAYER K, MEWES H (2001) ¿Cómo podemos entregar los genomas de plantas grandes? Estrategias y perspectivas. Curr Op Plant Biol 5: 173-177 [& # 160Links & # 160]

MAYER K, MURPHY G, TARCHINI R, WAMBUTT R, VOLCKAERT G, POHL T, D & UumlSTERH & OumlFT A, STIEKEMA W, ENTIAN KD, TERRYN N, LEMCKE K, HAASE D, HALL C, VAN DODEWEERD AM, BEVAN TESW SINGEY S MW, BANCROFT I (2001) Conservación de la microestructura entre una región secuenciada del genoma del arroz, múltiples segmentos del genoma de Arabidopsis thaliana. Genome Res 11: 1167-1174 [& # 160Links & # 160]

MEYERS B, TINGEY SV, MORGANTE M (2001) Abundancia, distribución y actividad transcripcional de elementos repetitivos en el genoma del maíz. Genome Res 11: 1660-1676 [& # 160Links & # 160]

MULTANI D, MEELEY RB, PATERSON AH, GREY J, BRIGGS SP, JOHAL GS (1998) Microevolución de patógenos vegetales: base molecular del origen de una enfermedad fúngica en el maíz. Proc Natl Acad Sci USA 95: 1686-1691 [& # 160Links & # 160]

NOORDEWIER, MO, WARREN PV (2001) Microarreglos de expresión génica, la integración del conocimiento biológico T Biotech 19: 412-415 [& # 160Links & # 160]

OCHMAN H, GERBER A, HART D (1988) Una aplicación genética de una reacción en cadena de la polimerasa inversa. Genética 120: 621-623 [& # 160Links & # 160]

PEREIRA A (2000) Una perspectiva transgénica sobre la genómica funcional de las plantas. Transgenic Res 9: 245-260 [& # 160Links & # 160]

QUACKENBUSH J (2001) Análisis computacional de datos de microarrays Nature Rev Genetics 2: 418-427 [& # 160Links & # 160]

RAFALSKI AJ (2002) Genómica vegetal: estado actual y perspectiva de desarrollos futuros. Sesiones informativas sobre genómica fundamental y proteómica 1: 1-15 [& # 160Links & # 160]

RAFALSKI AJ, HANAFEY M, MIAO GH, CHING A, DOLAN M, TINGEY S (1998) Nuevos enfoques experimentales y computacionales para el análisis de la expresión génica. Acta Bioch Polonica 45: 929-934 [& # 160Links & # 160]

SCHENA M, SHALON D, DAVIS RW, BROWN P (1995) Monitoreo cuantitativo de los patrones de expresión génica con un microarray de ADN complementario. Science 270: 467-470 [& # 160Links & # 160]

SEKI M, NARUSAKA M, ABE H, KASUGA M, YAMAGUCHI-SHINOZAKI K, CARNINCI P, HAYASHIZAKI Y, SHINOZAKI K (2001) Monitoreo del patrón de expresión de 1300 genes de Arabidopsis bajo sequía, estrés frío mediante el uso de un microarray de ADNc de longitud completa. Plant Cell 13: 61-72 [& # 160Links & # 160]

SHIMAMOTO K, KYOZUKA J (2002) El arroz como modelo para la genómica comparativa de plantas. Annu Rev Plant Biol 53: 399-419 [& # 160Links & # 160]

SHINTANI D, DELLAPENNA D (1998) Elevación del contenido de vitamina E de las plantas mediante ingeniería metabólica. Science 282: 2098-2100 [& # 160Links & # 160]

SPRINGER PS (2000) Trampas genéticas: herramientas para el desarrollo vegetal y la genómica. Plant Cell 12: 1007-1020 [& # 160Links & # 160]

TARCHINI R, BIDDLE P, WINEL, R, TINGEY S, RAFALSKI A (2000) La secuencia completa de 340 kb de ADN alrededor de la región Adh1-Adh2 del arroz revela una colinealidad interrumpida con el cromosoma 4 del maíz. Plant Cell 12: 381-391 [& # 160Links & # 160]

LA INICIATIVA DEL GENOMA ARABIDOPSIS (2000) Análisis de la secuencia del genoma de la planta con flores Arabidopsis thaliana. Nature 408: 796-815 [& # 160Links & # 160]

TIKHONOV A, SANMIGUEL P, NAKAJIMANINA Y, GORENSTEIN M, BENNETZEN JL, AVRAMOVA Z (1999) Colinealidad y sus excepciones en regiones adh ortólogas de maíz y sorgo. Proc Natl Acad Sci USA 96: 7409-7414 [& # 160Links & # 160]

TISSIER AF, MARILLONNET S, KLIMYUK V, PATEL K, TORRES MA, MURPHY G, JONES JD (1999) Múltiples inserciones defectuosas independientes de transposones supresor-mutador en Arabidopsis: una herramienta para la genómica funcional. Plant Cell 11: 1841-1852 [& # 160Links & # 160]

UBERBACHER EC, MURAL RJ (1991) Localización de regiones codificantes de proteínas en secuencias de ADN humano mediante un enfoque de redes neuronales de sensores múltiples. Proc Natl Acad Sci USA 88: 11261-11265 [& # 160Links & # 160]

VELCULESCU V, ZHANG L, VOGELSTEIN B, KINZLER K (1995) Análisis en serie de la expresión génica. Science 270: 484-487 [& # 160Links & # 160]

WANG R, GUEGLER K, LABRIE SAMUEL T, CRAWFORD NM (2000) El análisis genómico de una respuesta a un nutriente en Arabidopsis revela diversos patrones de expresión y nuevos genes reguladores metabólicos y potenciales inducidos por nitrato. Plant Cell 12: 1491-1509 [& # 160Links & # 160]

YU J, HU S, WANG J, WONG LI, LIU B, DENG Y, DAI L, ZHOU Y, ZHANG X, CAO M, LIU J, SUN J, TANG J, CHEN Y, HUANG X, LIN W, YE C , PINZA W, CONG L, GENG J, HAN Y, LI L, LI W, HU G, HUANG X, LI X, LI J, LIU Z, LI L, LIU J, QI Q, LIU J, LI L, LI T, WANG X, LU H, WU T, ZHU M, NI P, HAN H, WEI D, REN X, FENG X, CUI P, LI X, WANG H, XU X, ZHAI W, XU Z, ZHANG J, HE S, ZHANG J, XU J, ZHANG K, ZHENG X, DONG J, ZENG W, TAO L, YE J, TAN J, REN X, CHEN X, HE J, LIU D, TIAN W, TIAN C, XIA H , BAO Q, LI G, GAO H, CAO T, WANG J, ZHAO W, LI P, CHEN W, WANG X, ZHANG Y, HU J, WANG J, LIU S, YANG J, ZHANG G, XIONG Y, LI Z, MAO L, ZHOU C, ZHU Z, CHEN R, HAO B, ZHENG W, CHEN S, GUO W, LI G, LIU S, TAO M, WANG J, ZHU L, YUAN L, YANG H (2002) A borrador de secuencia del genoma del arroz (Oryza sativa L ssp indica). Ciencia 296: 79-91 [& # 160Links & # 160]

Recibido: 26 de julio de 2002. En forma revisada: 23 de septiembre de 2002. Aceptado: 1 de octubre de 2002

/> Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons


DISCUSIÓN

El desarrollo de la tecnología CRISPR en sistemas de plantas modelo no genéticos proporcionará información sin precedentes sobre nuestra comprensión de la biodiversidad, la adaptación y la evolución. En los animales, la tecnología CRISPR está creando una nueva ola de nuevos organismos modelo y también está facilitando oportunidades de investigación únicas, incluidos estudios de camuflajes y comportamientos sociales inusuales (Reardon, 2019). Aquí nos centramos en aplicaciones en dos grupos de plantas no modelo, Tragopogon y Amborella. Tragopogon pertenece a Asteraceae (familia del girasol) y representa un modelo para la investigación sobre poliploidía. Analizamos las posibles aplicaciones de CRISPR para comprender la diversidad fenotípica en Asteraceae y las consecuencias genéticas de la poliploidía. Luego describimos estudios CRISPR prospectivos en la planta con flores filogenéticamente fundamental Amborella, la hermana de todas las demás angiospermas vivientes.

Función genética y diversidad fenotípica en Asteraceae

Las asteraceae son la familia más grande o la segunda más grande de plantas con flores (

25.000 especies Judd et al., 2016) e incluyen numerosos cultivos, ornamentales, plantas medicinales y malas hierbas nocivas. La familia es increíblemente diversa desde el punto de vista morfológico, y las especies de la familia se encuentran en diversos hábitats con una adaptación fisiológica subyacente muy variable (Fig. 7). Además, la familia es bien conocida por su inflorescencia de capitulum única.

Estas diversas características hacen de Asteraceae una excelente opción para una amplia gama de estudios genéticos funcionales realizados por grupos de usuarios potenciales que representan tanto la investigación básica como la aplicada. Por ejemplo, la genética funcional de la morfología de la inflorescencia podría explorarse en detalle mediante el análisis de genes candidatos que controlan las características de la morfología floral y del capítulo. La exploración de genes involucrados en la simetría floral también podría lograrse a través de un sistema CRISPR manejable para especies de Asteraceae (por ejemplo, Tragopogon). Las características morfológicas y fisiológicas asociadas con la maleza podrían explorarse con más detalle, incluido el vigor de la planta y la tasa de desarrollo, las tasas de germinación de las semillas, el tamaño y la dispersión de las semillas y la tolerancia a la sequía. Además, como la familia es bien conocida por su química (Heywood et al., 1977), la base genética de la producción de metabolitos secundarios (por ejemplo, lactonas sesquiterpénicas y látex) se puede estudiar con tecnología CRISPR. La genética funcional de los sépalos únicos de la familia de los girasoles, denominados pappus, se puede investigar con un sistema y herramientas manejables. Por ejemplo, ¿qué genes funcionan en el control de la morfología del pappus? ¿Se puede modificar la forma del pappus? La autoincompatibilidad también se puede explorar en Asteraceae utilizando el sistema CRISPR: se podría examinar la base genética de la autocompatibilidad y se podrían producir formas de plantas tanto autoincompatibles como autocompatibles.

Consecuencias genéticas de la poliploidía

Dentro de Tragopogon, la disponibilidad de un sistema CRISPR viable facilitará el examen de la función genética inmediatamente después de la poliploidía (duplicación del genoma completo [WGD]). Por ejemplo, la hipótesis del equilibrio de genes (p. Ej., Birchler y Veitia, 2007) sugiere que después de WGD, los genes reguladores pueden retenerse por duplicado para preservar las relaciones estequiométricas dependientes de la dosis, mientras que los genes no reguladores pueden mostrar patrones de fraccionamiento (pérdida de uno o el otro homeólogo de los padres). Qué homeólogo parental se retiene finalmente puede estar determinado por sus conexiones con otros genes en una red, aunque esta hipótesis requiere más estudio. Pero, ¿qué pasaría en términos de función y fenotipo si una copia del gen parental diploide fuera sustituida por la otra copia a través de la edición CRISPR? ¿Esta sustitución alteraría la función y el desarrollo normales de los genes? Del mismo modo, ¿cuál es el efecto de la expresión duplicada para un gen que expresa una sola copia o, a la inversa, el efecto de un solo homeólogo en lugar de la expresión duplicada?

Un sistema CRISPR optimizado también proporcionaría una plataforma fácil de usar para que los investigadores aborden diversas cuestiones de la función genética y las relaciones genotipo-fenotipo después de WGD. La poliploidía a menudo se asocia con un aumento en el tamaño de diversos rasgos de la planta, un resultado conocido como efecto gigas. Por ejemplo, Tragopogon los poliploides son mucho más grandes y más robustos que sus padres diploides, producen más inflorescencias, flores y semillas y también compiten con sus padres (Novak et al., 1991). Por lo tanto, los poliploides son sistemas excelentes para el estudio del aumento de tamaño, vigor y rasgos morfológicos y fisiológicos asociados con el hábito de las malezas. Además de las aplicaciones de CRISPR mencionadas anteriormente a los estudios de WGD, existen muchas otras oportunidades de investigación posibles, incluida la dominancia del subgenoma (Bird et al., 2018), el fraccionamiento sesgado y las interacciones citoinucleares.

Función genética y origen de la flor: Aplicaciones en Amborella

El modelo ABCE (Cuadro 1) de identidad de órganos florales representa un gran avance en la genética del desarrollo (Coen y Meyerowitz, 1991 Pelaz et al., 2000 Pinyopich et al., 2003 Ditta et al., 2004). El modelo explica cómo los patrones interactivos de expresión genética controlan la formación de los principales órganos florales: sépalos, pétalos, estambres y carpelos. Sin embargo, un modelo ABCE estricto se aplica principalmente a los eudicots. En muchas angiospermas basales y magnólidos, los órganos florales no están bien diferenciados. Por ejemplo, Amborella, la hermana de todas las demás angiospermas vivientes, y muchas otras no eudicots no tienen sépalos y pétalos distintos, sino que tienen tépalos. Los órganos florales más externos son verdosos y parecidos a brácteas, y estos se transforman gradualmente en órganos coloridos con forma de pétalos. Del mismo modo, los estambres de Amborella y algunas otras angiospermas basales y magnólidos tienen forma de pétalos. En lugar de patrones claramente diferenciados de expresión génica en órganos florales como se encuentra en Arabidopsis y la mayoría de los otros eudicots, Amborella y otras angiospermas basales muestran una transición gradual en la expresión génica a través del meristemo floral (por ejemplo, Buzgo et al., 2004 Kim et al., 2005a, 2005b Chanderbali et al., 2009). Este patrón de expresión superpuesta de genes ABC se ha denominado modelo de bordes desvanecidos (Buzgo et al., 2004 Soltis et al., 2007 Chanderbali et al., 2009).

Si se dispusiera de un sistema de edición de genes CRISPR, el papel de varios genes de identidad de órganos florales podría examinarse rigurosamente en Amborella, así como en otras angiospermas basales (Nymphaeales y Austrobaileyales) y magnoliids. Por ejemplo, ¿cuál es la morfología floral resultante si genes críticos de identidad de órganos florales como AP3, Pi, y SEP se eliminan individualmente? Sin embargo, el desarrollo de un sistema de transformación de plantas de novo, incluida la selección y regeneración de explantes, para Amborella así como para muchos modelos no genéticos es un desafío. Además, como Amborella es una planta leñosa perenne, se necesitarán varios años para que una línea transgénica alcance la madurez y florezca, lo que sería otro obstáculo importante para estos estudios (ver Elección de especies de plantas, más arriba). Sin embargo, la floración temprana Amborella podría generarse mediante mutagénesis dirigida utilizando tecnología CRISPR (como la mutagénesis de CEN-como genes en Actinidia Varkonyi-Gasic et al., 2019). Este enfoque podría proporcionar las plantas necesarias para aplicar CRISPR al estudio de los rasgos de floración en este género filogenéticamente fundamental.


MÉTODOS Y RESULTADOS

Diseño de sonda de enriquecimiento dirigido

Se desarrolló un enfoque para el diseño de la sonda Hyb-Seq (Tabla 1) en Asclepias utilizando un conjunto de borrador de la A. syriaca genoma nuclear (Weitemier et al., datos no publicados), que se ensambló utilizando datos de extremos emparejados de Illumina de bibliotecas con tamaños de inserto de 200 y 450 pb y un tamaño de k-mer de 79 en ABySS v. 1.3.2 (Simpson et al. ., 2009) con lecturas de origen plastidial o mitocondrial eliminadas antes del ensamblaje. Un transcriptoma de A. syriaca El tejido de hojas y yemas (Straub et al., datos no publicados) se ensambló de novo usando Trinity RNA-Seq v. r20131110 (Grabherr et al., 2011) y se refinó usando transcripts_to_best_scoring_ORFs.pl (incluido con Trinity). El diseño de la sonda se basó en datos del borrador del genoma, que se combinó con datos de ensamblaje del transcriptoma para apuntar a los exones de cientos de loci de baja copia. Los contigs del borrador del genoma nuclear se compararon con los que compartían una identidad de secuencia del 99% del transcriptoma utilizando el programa BLAT v. 32 × 1 (Kent, 2002). BLAT se adapta a grandes lagunas en las coincidencias entre las secuencias diana y de consulta, y es adecuado para hacer coincidir la secuencia de transcripciones de solo exón con la secuencia genómica que contiene el intrón, lo que permite identificar las ubicaciones de los límites potenciales de intrón / exón. Además, en un esfuerzo por evitar que los loci presentes en múltiples copias dentro del genoma sean dirigidos, solo se conservaron aquellas transcripciones con una sola coincidencia contra el genoma. Para evitar que las sondas enriquezcan múltiples loci similares, se eliminó cualquier objetivo que compartiera una similitud de secuencia ≥90% utilizando CD-HIT-EST v. 4.5.4 (Li y Godzik, 2006). Los restantes contigs del transcriptoma se filtraron para retener solo los que contenían exones ≥120 pb con un total de al menos 960 pb. El límite inferior era necesario para proporcionar secuencias suficientemente largas para el diseño de la sonda (= 120 pb), y el límite superior se eligió para excluir los loci cortos con menos probabilidades de incluir sitios filogenéticamente informativos. De los loci que pasaron el filtrado, todos los que coinciden (70% de identidad de secuencia sobre el 30% de su longitud) un ortólogo putativo previamente caracterizado de Apocynaceae (etiquetas de secuencia expresadas [ESTs] de Catharanthus roseus (L.) G. Don Murata et al., 2006), los asterides (COSII Wu et al., 2006), o cuatro angiospermas no asteridas (Duarte et al., 2010) fueron retenidos (1335 exones en 350 loci). Se agregaron loci adicionales que pasaron el filtrado al conjunto de loci diana hasta que la longitud total de las sondas diana se acercó al mínimo requerido para la síntesis de oligonucleótidos (2050 exones en 418 loci). El conjunto de sondas final también contenía sondas destinadas a generar datos para otros proyectos (157 genes de desarrollo floral y relacionados con la defensa y 4000 polimorfismos de un solo nucleótido [SNP]), que solo se incluyeron aquí cuando fue necesario para los cálculos de la eficiencia de hibridación y la longitud del ensamblaje. Tenga en cuenta que se debe tener cuidado durante el proceso de diseño de la sonda para evitar dirigirse a secuencias orgánulares junto con secuencias nucleares, porque el enriquecimiento de las dianas orgánulos será proporcional a su presencia en las extracciones de ADN genómico utilizadas para preparar bibliotecas de secuenciación y puede exceder en gran medida las dianas nucleares (ver Apéndice S1).

Pasos Descripción Programa principal o guión personalizado
Diseño de sonda
Fósforo Encuentre secuencias de genoma y transcriptoma con 99% de identidad. BLAT a
Filtrar Conserva golpes individuales de duración considerable. Parte de Building_exon_probes.sh b
Grupo Eliminar isoformas y loci que comparten & gt90% de identidad. CD-HIT-EST c, grab_singleton_clusters.py b
Filtrar Conserve los loci con exones largos que se sumen a la longitud deseada. blat_block_analyzer.py b
Grupo Elimina los exones que comparten & gt90% de identidad. CD-HIT-EST c, grab_singleton_clusters.py b
Procesamiento de lectura corta y análisis de datos
Leer procesamiento Recorte de adaptadores, filtrado de calidad Trimmomatic d
Ensamblaje de exón Reconstruya una secuencia para cada muestra, para cada exón. YASRA e, Alignreads f
Identificar contigs ensamblados Si se desconoce la identidad del contig, identifique a qué exón (es) de destino corresponde. BLAT a
Alineación de secuencia I: cotejar exones Agrupar exones ortólogos en las muestras. ensamblados_exones_a_fasta.py b
Alineación de secuencia II: Realice la alineación Alinear bases homólogas dentro de cada exón. MAFFT g
Concatenar exones Para cada locus, concatenar los exones alineados. catfasta2phyml.pl h
Construcción de árboles genéticos Para cada locus, estime el árbol genético de máxima verosimilitud. RAxML i
Construcción de árboles de especies Estime el árbol de especies a partir de árboles genéticos independientes en un marco coalescente. MP-EST j
  • a Kent (2002).
  • b Los nuevos scripts escritos para este protocolo, un conjunto de datos de ejemplo y cualquier actualización futura están disponibles en https://github.com/listonlab/.
  • c Li y Godzik (2006).
  • d Bolger y col. (2014).
  • e Ratan (2009).
  • f Straub y col. (2011).
  • g Katoh y Toh (2008).
  • h Nylander (2011).
  • i Stamatakis (2006).
  • j Liu y col. (2010).

Preparación de la biblioteca de Illumina y Hyb-Seq

Se extrajo ADN de 10 especies de Asclepias, Calotropis procera (Aiton) W. T. Aiton, y Matelea cynanchoides (Engelm. & A. Gray) Woodson (Apéndice 1) utilizando un protocolo de bromuro de cetiltrimetilamonio modificado (CTAB) (Doyle y Doyle, 1987), DNeasy (QIAGEN, Valencia, California, EE. UU.), FastDNA (MP Bio, Santa Ana, California, EE. UU.) O kits Wizard (Promega Corporation, Madison, Wisconsin, EE. UU.). La mayoría de las bibliotecas indexadas de Illumina se prepararon como describen Straub et al. (2012). Dos excepciones fueron A. criptoceras S. Watson (preparado con un código de barras de ADN NEXTflex Bioo Scientific, Austin, Texas, EE. UU.) Y M. cynanchoides (Kit de preparación de bibliotecas TruSeq Illumina, San Diego, California, EE. UU.). A continuación, las bibliotecas se agruparon en 11 o 12 plexos con proporciones aproximadamente equimolares (algunas muestras incluidas en las agrupaciones no se incluyeron en el estudio actual). La hibridación en solución con cebos de ARN biotinilado MYbaits (MYcroarray, Ann Arbor, Michigan, EE. UU.) Y el enriquecimiento siguieron a Tennessen et al. (2013) con aproximadamente 350-480 ng de ADN de entrada por grupo y 12 en lugar de 15 ciclos de enriquecimiento por PCR para disminuir la producción de duplicados de PCR. Estas bibliotecas enriquecidas con objetivos se secuenciaron en un Illumina MiSeq en la Universidad de Ciencias de la Salud de Oregón (química de la versión 2) para obtener lecturas de 2 × 251 pb o en la Universidad Estatal de Oregón (química de la versión 3) para obtener lecturas de 2 × 76 pb. Los datos brutos de Illumina se enviaron al Archivo de lectura de secuencia del Centro Nacional de Información Biotecnológica (NCBI) (SRP043058).

Canalizaciones de análisis de datos

Los datos sin procesar se filtraron para las secuencias de adaptadores ya sea por los centros de secuenciación, utilizando Trimmomatic v. 0,20 o 0,30 (Bolger et al., 2014), o utilizando scripts personalizados. Los códigos de barras de secuencia interna se deconvolucionaron utilizando bc_sort_pe.pl (Knaus, 2012). Las lecturas se filtraron por calidad utilizando Trimmomatic para eliminar las bases en los extremos de lectura con calidades inferiores a Q20, para recortar el resto de la lectura cuando la calidad promedio en una ventana de 5 pb era & ltQ20 y para eliminar lecturas de menos de 36 pb después del recorte. Para A. criptoceras, solo los extremos de lectura se recortaron a Q20. Las lecturas duplicadas se eliminaron utilizando FASTX-Toolkit (Gordon, 2010). Para el ensamblaje de objetivos, en Alignreads v. 2.25 se implementó un enfoque guiado por referencia que utiliza una pseudo-referencia que consta de exones específicos separados por 200 N (Straub et al., 2011). Se utilizó BLAT para identificar contigs en el ensamblaje final con similitud de secuencia con los exones objetivo. Un script personalizado extrajo la secuencia ensamblada más larga correspondiente a cada exón y construyó matrices para la alineación de secuencias múltiples, mientras agregaba N a la matriz si faltaba un exón para una especie en particular. Los exones se alinearon utilizando la configuración predeterminada en MAFFT v. 6.864b (Katoh y Toh, 2008). Después de la alineación, los exones del mismo gen se unieron usando catfasta2phyml.pl. Las secuencias de la zona de salpicadura no se incluyeron en este análisis. A continuación, se utilizaron las mismas agrupaciones de lectura para el ensamblaje guiado por referencia de secuencias de alta copia, los cistrones del plastoma y del ADN ribosómico nuclear (nrDNA) (18S-5.8S-26S), utilizando Alignreads. Las referencias utilizadas para cada especie se generaron a través del análisis de datos desnatados del genoma recopilados previamente de las mismas bibliotecas utilizadas para este estudio (Straub et al., 2012 Straub et al., Datos no publicados). Referencias de otro A. criptoceras Se utilizaron individuos para esa especie y las lecturas se recuperaron utilizando el ajuste Trimmomatic descrito anteriormente. los M. biflora (Raf.) Woodson plastome (GenBank: KF539850.1) y el C. procera La secuencia de nrDNA sirvió como referencia para M. cynanchoides. Se utilizó MAFFT para la alineación. El Apéndice S2 proporciona detalles adicionales sobre análisis bioinformáticos.

Análisis de secuencias ensambladas

La longitud total de la secuencia ensamblada, el número de exones y genes seleccionados como objetivo ensamblados, la cantidad de secuencia flanqueante ensamblada a partir de la zona de salpicadura, el porcentaje de plastoma y la secuencia de cistrón del ADNr ensamblado a partir de las lecturas fuera del objetivo en función de las longitudes de las secuencias de referencia y el porcentaje divergencia de la A. syriaca Se calcularon las secuencias de exones para cada especie. Los datos de Hyb-Seq también se analizaron utilizando el pipeline phyluce v. 1.4 (Faircloth et al., 2012 Faircloth, 2014) utilizado por Mandel et al. (2014), utilizando tanto la opción de ensamblaje nativo de novo como los contigs producidos por el ensamblaje guiado por referencia en Alignreads como datos de entrada (consulte el Apéndice S3 para conocer los métodos detallados). Para demostrar la utilidad de los datos para la filogenómica, los análisis de Asclepias y agrupar Calotropis se realizaron para genes nucleares individualmente (excluyendo siete genes con terminales con todos los datos faltantes), una concatenación de todos los genes nucleares y plastomas completos utilizando RAxML v. 7.3.0 (Stamatakis, 2006) con un modelo GTR + Γ de sustitución de nucleótidos. Se realizaron 100 y 1000 réplicas de bootstrap rápido para análisis nucleares y de plastidios, respectivamente. Antes del análisis, la matriz de plastoma se editó siguiendo a Straub et al. (2012). Los árboles de genes nucleares RAxML se utilizaron luego para análisis filogenómicos de todos los loci objetivo con muestreo de taxón completo (norte = 761) utilizando el enfoque de árbol de especies MP-EST con evaluación bootstrap del apoyo de clados implementado a través del servidor web STRAW (Shaw et al., 2013). Las secuencias de exones nucleares objetivo, las matrices de datos y los árboles se enviaron a Figshare (http://dx.doi.org/10.6084/m9.figshare.1024614). Consulte los Apéndices S1 y S2 para obtener una descripción detallada del protocolo desde el diseño de la sonda hasta el análisis de datos.

Resultados de Hyb-Seq

Identificamos 768 genes supuestamente de copia única (3385 exones, ca. 1,6 Mbp) que cumplían los criterios de longitud suficiente y divergencia de todos los demás genes del genoma. De estos genes, 136 genes estaban entre las secuencias COSII asteridas y 42 estaban entre los genes conservados en cuatro genomas de angiospermas, solo 12 de 155 posibles genes superpuestos fueron compartidos por ambos conjuntos conservados. El enriquecimiento, la secuenciación y el ensamblaje de los genes supuestamente de copia única dirigidos fue exitoso en Asclepias y Apocynaceae relacionadas con al menos ensamblaje parcial de un promedio de 92,6% de exones y 99,7% de genes y una longitud de ensamblaje promedio total para todos los genes en el conjunto de sondas de ca. 2,2 Mbp de 1,7 Mbp de exones diana (incluidos los genes de defensa y desarrollo floral Tabla 2). Los números de lectura más bajos (debido a la agrupación desigual de bibliotecas) dieron como resultado una captura de destino reducida y eficiencia de ensamblaje en A. eriocarpa Benth. y A. involucrata Engelm. ex Torr. (Tabla 2), mientras que una combinación de menor número de lectura y divergencia de secuencia (promedio 4.5%) entre Matelea y las sondas probablemente sean responsables de su éxito algo menor (Fig. 1 Tabla 2). Por el contrario, la captura de destino en Calotropis (promedio de 3.2% de divergencia de A. syriaca) era similar a Asclepias (Tabla 2). Dado que las sondas deberían funcionar bien hasta un 10% de divergencia de secuencia, este conjunto de sondas probablemente sea útil para el enriquecimiento de los genes diana en Asclepiadoideae (Fig. 1). Extendiendo la comparación a los parientes más lejanos Catharanthus roseus (Gongora-Castillo et al., 2012), el análisis BLAT revela una divergencia promedio del 12% entre A. syriaca exones y transcripciones ortólogas (Fig. 1). Este resultado predice que se podría obtener una cantidad menor, pero no insignificante, de datos de secuencia del resto de Apocynaceae. La modificación de las condiciones de hibridación podría aumentar aún más el éxito de especies más divergentes (Li et al., 2013). Además de los loci nucleares objetivo, el ensamblaje guiado por referencia de las lecturas fuera del objetivo produjo secuencias de cistrón de ADNr y plastoma completas o casi completas (Tabla 2).

Especies Lee un Lecturas filtradas por calidad Lecturas únicas, acertadas y filtradas por calidad (%) b, c Longitud de montaje (Mbp) b Longitud del conjunto de la zona de salpicaduras (Mbp) b Exones de genes de copia única ensamblados d Genes de copia única ensamblados d % De divergencia de sondas de genes de copia única e % De datos que faltan en la matriz % De finalización del plastoma % De finalización del cistrón de ADNr
Asclepias criptoceras 1,174,294 1,149,278 746,909 (65.0) 3.2 1.6 3349 768 0.9 7.4 99.7 100
Asclepias engelmanniana 1,943,370 1,804,956 523,477 (29.0) 2.7 1.0 3359 767 0.8 3.6 97.8 98.3
Asclepias eriocarpa 393,048 384,595 72,200 (18.8) 1.1 0.5 2260 762 0.9 69.0 81.9 94.4
Asclepias flava 1,457,860 1,301,608 397,798 (30.6) 2.2 0.8 3313 768 1.5 14.7 98.4 100
Asclepias humistrata 918,608 843,463 234,502 (27.8) 2.0 0.8 3163 768 1.0 27.1 93.1 97.0
Asclepias involucrata 664,820 645,580 139,407 (21.6) 1.7 0.7 2978 768 0.9 41.8 90.5 99.4
Asclepias masonii 1,097,532 971,606 270,123 (27.8) 2.1 0.9 3275 768 1.4 30.6 99.1 100
Asclepias nyctaginifolia 2,482,686 2,295,691 558,822 (24.3) 2.4 0.8 3369 768 0.9 2.1 96.0 100
Asclepias scheryi 1,345,732 1,295,739 384,451 (29.7) 2.4 0.8 3314 768 1.0 4.9 98.7 100
Asclepias tomentosa 1,248,940 1,111,909 310,020 (27.9) 2.1 0.8 3208 768 0.9 26.7 95.2 99.7
Calotropis procera 1,172,456 1,135,014 380,155 (33.5) 2.6 1.0 3287 768 3.2 5.0 96.0 100
Matelea cynanchoides 418,590 388,064 208,835 (53.8) 1.7 0.4 2718 757 4.5 n / A 99.4 100
Promedio 1,190,419 1,110,625 352,225 (32.5) 2.2 0.8 3133 767 1.5 21.2 95.5 99.1
  • a La mayoría de las muestras se secuenciaron en una única serie de MiSeq (química de 11 plex 2 × 251 pb versión 2) A. criptoceras y M. cynanchoides, que se secuenciaron en diferentes ejecuciones de MiSeq (química de la versión 2 de 12 plex 2 × 251 pb y química de la versión 3 de 15 plex 2 × 76 pb, respectivamente).
  • b Estos valores se calcularon utilizando todo el conjunto de sondas, incluido el gen de copia única, los genes de defensa y de desarrollo floral y los SNP.
  • c Estas estimaciones son más bajas que la verdadera eficiencia general debido al filtrado de calidad y la eliminación de lecturas duplicadas. Excepto por A. criptoceras y M. cynanchoides, las bibliotecas se crearon con códigos de barras internos, lo que aparentemente contribuyó a una llamada de base subóptima y puntuaciones de calidad más bajas, lo que condujo a una aparente eficiencia de captura de objetivos subóptima.
  • d Estas estimaciones se basan en una identidad de secuencia mínima del 90% con A. syriaca sondas, y por lo tanto son conservadores, especialmente para C. procera y M. cynanchoides, que se espera que tengan una mayor divergencia de secuencia.
  • e Estas estimaciones se basan en una identidad de secuencia mínima del 75% con A. syriaca sondas.

Histograma de divergencia de la secuencia del exón entre las especies utilizadas para el diseño de la sonda, Asclepias siriaca, y otras cuatro especies: la especie más divergente de Asclepias, A. flava otro miembro de Asclepiadinae (Asclepiadeae: Asclepiadoideae), Calotropis procera un miembro de Gonolobinae (Asclepiadeae: Asclepiadoideae), Matelea cynanchoides y un miembro de una subfamilia diferente, Catharanthus roseus (Rauvolfioideae). Tenga en cuenta que se permitió una divergencia de secuencia máxima del 75% para BLAT y que era menos probable que se observaran exones con & gt10% de divergencia en Calotropis y Matelea porque era menos probable que se enriquecieran con las sondas, mientras que Catharanthus los datos procedían de secuencias de transcriptomas de múltiples tejidos y no estaban sujetos a sesgo de enriquecimiento de la diana.

El proceso de análisis de datos presentado aquí dio como resultado un conjunto de datos con pocos genes faltantes para cada especie. En contraste, la tubería de phyluce recuperó comparativamente pocos loci para el análisis filogenómico (Tabla 3). Phyluce fue diseñado para el análisis de datos UCE, y su adopción para el análisis de genes de copia única donde se han dirigido múltiples exones es inapropiada porque los exones a menudo se ensamblan en contigs separados y phyluce ve múltiples contigs que coinciden con un locus específico como una indicación de paralogía. (ver Apéndice S3 para mayor discusión). El uso del ensamblaje guiado por referencia en la tubería que se presenta aquí, en lugar del enfoque de novo de phyluce, también da como resultado una mayor cantidad de recuperación de datos para su uso en análisis filogenómicos (Tabla 3).

Especies Hyb-Seq phyluce phyluce con contigs de Alignreads
Asclepias criptoceras 768 16 145
Asclepias engelmanniana 767 69 201
Asclepias eriocarpa 762 10 23
Asclepias flava 768 28 109
Asclepias humistrata 768 27 62
Asclepias involucrata 768 3 24
Asclepias masonii 768 8 38
Asclepias nyctaginifolia 768 13 198
Asclepias scheryi 768 69 186
Asclepias tomentosa 768 21 54
Calotropis procera 768 84 203
Matelea cynanchoides 757 51 98
Promedio 767 33 112

Filogenómica

El porcentaje de sitios variables dentro de 768 alineaciones de secuencia osciló entre el 1,8% y el 12,5%, con una media del 5,9% (Apéndice S4). La matriz de datos concatenados fue 1,604,805 pb, con 104,717 sitios variables, 10,210 de los cuales fueron informativos de parsimonia. El análisis filogenómico de los árboles de genes de máxima verosimilitud para los 761 genes supuestamente de copia única que contienen información para los 12 taxones dio como resultado una topología de árbol de especies en la que la mayoría de los nodos recibieron un alto apoyo de arranque, y que difería del árbol de especies de concatenación en la ubicación de A. eriocarpa (Fig. 2, izquierda). Este resultado resalta la importancia de utilizar métodos y enfoques de árboles de especies para evaluar el apoyo de clados que tengan en cuenta la discordancia entre árboles genéticos, porque los enfoques de concatenación pueden resultar en inferencias de relaciones evolutivas fuertemente respaldadas, pero engañosas (Kubatko y Degnan, 2007 Salichos y Rokas, 2013). El análisis de máxima verosimilitud de los plastomas dio como resultado una filogenia resuelta y bien sustentada con una topología en conflicto con la del árbol de la especie, especialmente entre las especies templadas de América del Norte (Fig. 2, derecha). Se ha demostrado que las relaciones en este clado estimadas a partir de secuencias de plástidos no codificantes están en desacuerdo con las expectativas basadas en la morfología (Fishbein et al., 2011).

Comparación de la especie árbol de Asclepias basado en 761 loci supuestamente de copia única y toda la filogenia del plastoma. El árbol MP-EST se muestra a la izquierda, y la diferencia entre esta topología y la recuperada a través de un análisis del conjunto de datos de genes nucleares concatenados se indica mediante la flecha roja. Las líneas continuas conectan cada especie con su ubicación en la filogenia del plastoma (derecha). Los valores cerca de las ramas son valores de soporte de arranque (* = 100%). Los colores reflejan los clados plástidos de Fishbein et al. (2011): Norteamérica templada (verde), no colocada (naranja), tierras altas de México (violeta), serie Incarnatae sensu Fishbein (rosa), Desierto de Sonora (azul) y exógena (negro).


Ver el vídeo: D2R1Ν. Κουφός. Εκπαίδευση θεωρητική και πρακτική στη χρήση του άκαμπτου βρογχοσκοπίου (Enero 2022).