Información

Extracción de metatranscriptómica


Estoy intentando realizar un análisis metatranscriptómico de una sala limpia. Se sabe que la entrada de ADN es bastante baja (<1 pg). A pesar de esto, todavía quiero intentar probarlo. Creo que sería mejor realizar pruebas de extracción de antemano donde se manipulan ciertos parámetros. Luego puedo determinar a partir de estos ensayos de extracción qué valores para qué parámetros son los mejores.

Como ejemplo, estoy leyendo un artículo revisado por pares llamado "Validación de bibliotecas de ADN de entrada de picogramos y femtogramas para metagenómica a microescala" donde utilizaron el kit de preparación de bibliotecas de ADN Illumina Nextera XT en muestras de baja biomasa. Dos de los parámetros que manipularon fueron:

1) Números de ciclo de PCR (valores = 12, 14, 16, 18, 20) 2) dilución ATM (valores = sin diluir, 1: 5, 1:10, 1:20, 1:50)

Espero utilizar el mismo tipo de ensayos de extracción para determinar qué combinación de valores de estos dos parámetros es la mejor para una sala limpia. Mi primera pregunta es: ¿Cómo puedo determinar qué combinación es la mejor (ya que hay 25 combinaciones)? Tengo dos ideas (pero estoy abierto a otras):

1) Verifique la cantidad de ARN derivado 2) Verifique alguna métrica de calidad en el ARN

Como espero hacer tripletes de cada una de las 25 combinaciones, tendré 75 muestras. Espero no tener que hacer una secuenciación, ya que requiere mucho tiempo y posiblemente sea costoso para elegir la mejor combinación. ¿Hay alguna forma de elegir qué combinación funciona mejor sin tener que secuenciar?

Mi segunda pregunta es: ¿Hay otros parámetros en este flujo de trabajo que también pueda probar si no obtengo resultados decentes en estas salas blancas de baja biomasa?

(Como puede ver, no tengo mucha experiencia directa en biología molecular, así que siéntase libre de corregir o cuestionar cualquiera de mis publicaciones y / o "simplificar" su respuesta). ¡Gracias por compartir consejos (para cualquiera de las preguntas)!


  1. Considere hacer triplicados de solo 4 combinaciones de ciclo / dilución: bajo + bajo, bajo + alto, alto + bajo, alto + alto. Más simple.

  2. Lo más importante: demuestre que puede extraer ADN de una sala limpia. Si extrae de una sala limpia real y no obtiene ningún resultado del PCR, tal vez sea porque no pudo recolectar nada o tal vez no había nada allí. Idea: rocíe una cantidad conocida de ADN en una habitación que servirá como su sala limpia falsa. Luego haz tu protocolo de extracción. Puede probar los parámetros de ciclo / dilución con la extracción de sala limpia simulada y optimizar esas variables para cuando recolecte de una sala limpia "salvaje" real que no dopó con ADN.


La metatranscriptómica como herramienta para identificar especies y subespecies de hongos en comunidades mixtas: una prueba de concepto en condiciones de laboratorio

La secuenciación de alto rendimiento (HTS) permite la generación de grandes cantidades de datos de la secuencia del genoma a un costo razonable. Los organismos en comunidades microbianas mixtas ahora se pueden secuenciar e identificar de una manera independiente del cultivo, generalmente utilizando la secuenciación de amplicones de un código de barras de ADN. Bulk RNA-seq (metatranscriptómica) tiene varias ventajas sobre la secuenciación de amplicones basada en ADN: es menos susceptible a los sesgos de amplificación, captura solo organismos vivos y permite utilizar un conjunto más grande de genes para la identificación taxonómica. Utilizando un modelo de comunidad simulada que comprende 17 aislados de hongos, evaluamos si los metatranscriptómicos pueden identificar con precisión especies y subespecies de hongos en comunidades mixtas. En general, se clasificó el 72,9% de las transcripciones de ARN, de las cuales la gran mayoría (99,5%) se identificaron correctamente a nivel de especie. De las 15 especies secuenciadas, 13 se recuperaron e identificaron correctamente. También detectamos variación en el nivel de cepa dentro del Cryptococcus complejos de especies: 99,3% de las transcripciones asignadas a Cryptococcus se clasificaron como una de las cuatro cepas utilizadas en la comunidad simulada. Los contaminantes de laboratorio y / o las clasificaciones erróneas fueron diversos, pero representaron solo el 0.44% de las transcripciones. Por lo tanto, estos resultados muestran que es posible obtener una identificación fúngica precisa a nivel de especie y cepa a partir de los datos del metatranscriptoma siempre que los taxones identificados en baja abundancia se descarten para evitar falsos positivos derivados de la contaminación o clasificaciones erróneas. Este estudio destaca tanto las ventajas como los desafíos actuales en la aplicación de la metatranscriptómica en la micología clínica y los estudios ecológicos.


Artículo de Investigación Original

Yuhong Huang 1, 2, 3 & # x02020, Zhuolin Yi 2,3 & # x02020, Yanling Jin 2,3, Mengjun Huang 2,3, Kaize He 2,3, Dayu Liu 1, Huibo Luo 4, Dong Zhao 5, Hui He 6, Yang Fang 2,3 * y Hai Zhao 1,2,3 *
  • 1 Laboratorio clave de aplicaciones de procesamiento de carne de la provincia de Sichuan, Facultad de Farmacia e Ingeniería Biológica, Universidad de Chengdu, Chengdu, China
  • 2 Laboratorio clave de microbiología ambiental de la provincia de Sichuan, Instituto de Biología de Chengdu, Academia de Ciencias de China, Chengdu, China
  • 3 Laboratorio clave de microbiología ambiental y aplicada, Academia de Ciencias de China, Chengdu, China
  • 4 Biotecnología de fabricación de licores y aplicación de un laboratorio clave de la provincia de Sichuan, Facultad de bioingeniería, Universidad de Ciencias e Ingeniería de Sichuan, Zigong, China
  • 5 Grupo Wuliangye, Yibin, China
  • 6 Departamento de Ingeniería de Fabricación de Licores, Moutai College, Renhuai, China

El licor chino es uno de los licores destilados más conocidos del mundo y es la categoría de licores más grande por ventas. La tecnología de fermentación de estado sólido única y tradicional utilizada para producir licor chino ha estado en uso continuo durante varios miles de años. La comunidad microbiana diversa y dinámica en un iniciador de licor es el principal contribuyente a la elaboración de licor. Sin embargo, se sabe poco sobre la distribución ecológica y la importancia funcional de estos miembros de la comunidad. En este estudio, se utilizó la metatranscriptómica para explorar de manera integral a los miembros activos de la comunidad microbiana y las transcripciones clave con funciones importantes en el proceso de producción del iniciador de licor. Se descubrió que los hongos son los miembros de la comunidad más abundantes y activos. Se identificaron un total de 932 enzimas activas en carbohidratos, incluidas las proteínas de la familia 9 y 10 de actividad auxiliar altamente expresadas, a 62 ° C en condiciones aeróbicas. Se identificaron algunas enzimas termoestables potenciales a 50, 62 y 25 ° C (etapa madura). Se detectó un contenido aumentado y enzimas clave sobreexpresadas involucradas en la glucólisis y el metabolismo del almidón, piruvato y etanol a 50 y 62 ° C. Las enzimas clave del ciclo del citrato fueron reguladas al alza a 62 & # x000B0C, y sus abundantes derivados son cruciales para la generación de sabor. Aquí, se estudiaron el metabolismo y las enzimas funcionales de las comunidades microbianas activas en el iniciador de licor NF, lo que podría allanar el camino para iniciar mejoras en la calidad del licor y descubrir microbios que producen nuevas enzimas o productos de alto valor agregado.


Carga de datos

Hands_on Hands-on: carga de datos

  1. Cree un nuevo historial para este tutorial y asígnele un nombre propio

Consejo: crear un nuevo historial

  1. Haga clic en el icono de engranaje de galaxia (Opciones de historial) en la parte superior del panel de historial
  2. Seleccione la opcion Crear nuevo del menú

Consejo: cambiar el nombre de un historial

  1. Haga clic en Historia sin nombre (o el nombre actual del historial) (Haga clic para cambiar el nombre del historial) en la parte superior de su panel de historial
  2. Escriba el nuevo nombre
  3. Presione Entrar

Importar Herramienta: upload1 T1A_forward y T1A_reverse desde Zenodo o desde la biblioteca de datos (pregunte a su instructor)

Sugerencia: Importación a través de enlaces

  • Copiar la ubicación del enlace
  • Abra Galaxy Upload Manager (galaxy -upload en la parte superior derecha del panel de herramientas)

  • Seleccione Pegar / recuperar datos
  • Pega el enlace en el campo de texto.

  • prensa Comienzo

  • Cerrar la ventana

  • De forma predeterminada, Galaxy usa la URL como nombre, así que cambie el nombre de los archivos con un nombre más útil.

Sugerencia: importar datos de una biblioteca de datos

  • Entrar en Datos compartidos (panel superior) luego Bibliotecas de datos

  • Encuentra la carpeta correcta (pregúntale a tu instructor)

  • Seleccione los archivos deseados
  • Clickea en el A la historia botón cerca de la parte superior y seleccione como conjuntos de datos desde el menú desplegable
  • En la ventana emergente, seleccione el historial al que desea importar los archivos (o cree uno nuevo)
  • Haga clic en Importar

Por defecto, Galaxy toma el enlace como nombre, así que cámbieles el nombre.

Rebautizar galaxy: dibuje los archivos en T1A_forward y T1A_reverse

Consejo: cambiar el nombre de un conjunto de datos

  • Haga clic en el lápiz de galaxias icono de lápiz para que el conjunto de datos edite sus atributos
  • En el panel central, cambie el Nombre campo
  • Haga clic en el Ahorrar botón

Compruebe que el tipo de datos sea fastqsanger (p. Ej. no fastq). Si no es así, cambie el tipo de datos a fastqsanger.

Consejo: cambiar el tipo de datos

  • Haga clic en el lápiz de galaxias icono de lápiz para que el conjunto de datos edite sus atributos
  • En el panel central, haga clic en galaxy -chart-select-data Tipos de datos pestaña en la parte superior
  • Seleccione fastqsanger
  • Haga clic en el Cambiar el tipo de datos botón

Metatranscriptómica: un enfoque para recuperar genes eucariotas novedosos de entornos contaminados y relacionados

La metatranscriptómica, un subconjunto de la metagenómica, proporciona información valiosa sobre el perfil completo de expresión génica de comunidades microbianas complejas de un ecosistema. Los estudios metagenómicos se centran principalmente en el contenido genómico y la identificación de microbios presentes dentro de una comunidad, mientras que la metatranscriptómica proporciona la diversidad de genes activos dentro de dicha comunidad, su perfil de expresión y cómo estos niveles cambian debido al cambio en las condiciones ambientales. La metatranscriptómica se ha aplicado a diferentes tipos de entornos, desde el estudio de los microbiomas humanos, hasta los que se encuentran en plantas, animales, suelos y sistemas acuáticos. La metatranscriptómica, basada en la utilización de ARNm aislado de muestras ambientales, es un enfoque adecuado para extraer el acervo de genes eucariotas en busca de genes de relevancia biotecnológica. Además, es imperativo desarrollar diferentes pipelines bioinformáticos para analizar los datos obtenidos del análisis metatranscriptómico. En la presente revisión, resumimos la metatranscriptómica aplicada a los ambientes del suelo para estudiar la diversidad funcional, y discutimos los enfoques para aislar los genes involucrados en la degradación de la materia orgánica y proporcionar tolerancia a los metales tóxicos, el papel de la metatranscriptómica en la investigación de microbiomas, varias líneas de bioinformática utilizadas en análisis de datos y desafíos técnicos para obtener una visión biológicamente significativa de este enfoque.

Esta es una vista previa del contenido de la suscripción, acceda a través de su institución.


Una sólida tecnología metatranscriptómica para estudios a escala poblacional de la dieta, el microbioma intestinal y la salud humana

Es necesaria una lectura funcional del microbioma intestinal para permitir un control preciso de las funciones del microbioma intestinal, que respaldan la salud humana y previenen o minimizan una amplia gama de enfermedades crónicas. El análisis metatranscriptómico de las heces ofrece una visión funcional integral del microbioma intestinal, pero a pesar de su utilidad, rara vez se ha utilizado en estudios clínicos debido a su complejidad, costo y desafíos bioinformáticos. Este método también ha recibido críticas debido a la posible variabilidad intramuestra, cambios rápidos y degradación del ARN. Aquí, describimos un método metatranscriptómico de heces robusto y automatizado, llamado Viomega, que fue desarrollado específicamente para estudios a escala poblacional. Viomega incluye recolección de muestras, preservación de muestras a temperatura ambiente, extracción de ARN total, eliminación física de ARN ribosomales (ARNr), preparación de bibliotecas direccionales de Illumina, secuenciación de Illumina, clasificación taxonómica basada en una base de datos de & gt110,000 genomas microbianos y expresión de genes microbianos cuantitativos análisis utilizando una base de datos de

100 millones de genes microbianos. Aplicamos este método a 10,000 muestras de heces humanas y realizamos varios estudios a pequeña escala para demostrar la estabilidad y consistencia de la muestra. En resumen, Viomega es una plataforma de tecnología metatranscriptómica de heces de muestra a resultado precisa, automatizada y de bajo costo, de alto rendimiento para estudios a gran escala y una amplia gama de aplicaciones.

1. Introducción

El intestino humano contiene una gran cantidad de microorganismos comensales que realizan una amplia variedad de funciones metabólicas. Los metabolitos producidos por estos microorganismos pueden tener efectos profundos en la fisiología humana, con vínculos directos con el estado de salud y enfermedad [1-4]. La disbiosis intestinal probablemente contribuya al desarrollo y progresión de muchas enfermedades y trastornos, como enfermedades cardiovasculares, hipertensión, obesidad, diabetes y enfermedades autoinmunes [5-9]. También hay una fuerte evidencia de que los microorganismos intestinales interactúan directamente con el sistema nervioso, estableciendo el eje intestino-cerebro [10]. Se ha demostrado que el eje intestino-cerebro modula el desarrollo de enfermedades neurodegenerativas como la enfermedad de Alzheimer, el trastorno del espectro autista (TEA) y la enfermedad de Parkinson [11-14].

El microbioma intestinal juega un papel fundamental en la homeostasis fisiológica, lo que da como resultado una mayor investigación científica sobre el alcance del papel del microbioma intestinal en la salud y la enfermedad humanas. Los seres humanos han coevolucionado con el microbioma y se han vuelto dependientes de su producción bioquímica, como ciertas vitaminas y ácidos grasos de cadena corta [15, 16]. El microbioma intestinal también puede producir bioquímicos nocivos que se han visto implicados en varios estados patológicos [15]. Para comprender completamente las relaciones entre el microbioma intestinal y el estado de salud humana, se deben identificar y cuantificar las funciones bioquímicas de los microorganismos. Se han utilizado varios métodos basados ​​en secuenciación de próxima generación para analizar el microbioma intestinal, cada uno con claras ventajas y desventajas. El método más simple, menos costoso y más común es la secuenciación del gen ARNr 16S [17], que secuencia una pequeña porción del gen ARN ribosómico 16S procariota altamente conservado [18]. Este método puede proporcionar una resolución taxonómica a nivel de género [19, 20], pero no mide las funciones bioquímicas de los microorganismos [18] ni distingue los organismos vivos de los muertos. Además, la secuenciación tradicional del ARNr 16S excluye algunas bacterias, la mayoría de las arqueas y todos los organismos y virus eucariotas [21], lo que da como resultado una visión limitada del ecosistema del microbioma intestinal.

La secuenciación metagenómica (ADN de escopeta) proporciona una resolución a nivel de cepa de todos los microorganismos basados ​​en ADN [18] (no detecta virus de ARN ni bacteriófagos de ARN). Sin embargo, solo puede identificar el potencial funciones bioquímicas del microbioma y no pueden identificar ni cuantificar las vías bioquímicas activas. Esta es una desventaja para el estudio de estados patológicos relacionados con la disbiosis, como la enfermedad inflamatoria intestinal (EII), que ha demostrado tener una disparidad entre las vías de potencial metagenómico y las vías bioquímicas reales expresadas en poblaciones de enfermedad y control [22].

El análisis metatranscriptómico (metatranscriptómica, secuenciación de ARN y ARNseq) ofrece información sobre las actividades bioquímicas del microbioma intestinal mediante la cuantificación de los niveles de expresión de genes microbianos activos, lo que permite la evaluación de las actividades de las vías, al tiempo que proporciona una resolución taxonómica a nivel de cepa para todos los metabólicamente activos. organismos y virus [23, 24]. Hasta la fecha, los análisis metatranscriptómicos de muestras de heces han sido limitados debido al costo y la complejidad de los métodos de laboratorio y bioinformáticos [25]. Al eliminar el ARNr menos informativo, se pueden generar datos del transcriptoma más valiosos con menos profundidad de secuenciación [24, 26], lo que reduce los costos de secuenciación por muestra.

Se ha desarrollado una tecnología automatizada para el análisis metatranscriptómico de muestras clínicas humanas, denominada Viomega. En este estudio, se aplicó Viomega a 10,000 muestras de heces humanas para obtener una mejor comprensión de las taxonomías a nivel de cepa y las funciones microbianas. Se realizaron varios estudios a pequeña escala para cuantificar la estabilidad metatranscriptómica en el colon inferior y medir la variabilidad intramuestra de los análisis metatranscriptómicos.

2. Materiales y métodos

2.1. Participantes del estudio, ética y recogida y transporte de muestras

Para este estudio, Viome utilizó datos de 10,000 participantes. Todos los participantes del estudio dieron su consentimiento para participar en el estudio, y todos los procedimientos del estudio fueron aprobados por una Junta de Revisión Institucional (IRB) acreditada por el gobierno federal. Los participantes fueron reclutados de cualquier edad, sexo y grupo étnico.

Cada participante del estudio recolectó muestras de heces utilizando el kit Gut Intelligence de Viome en sus propias residencias. El kit incluía un tubo de recolección de muestras con una cuchara integrada, un conservante de ARN patentado y perlas de vidrio estériles. Se recogió una muestra de heces del tamaño de un guisante y se colocó dentro del tubo y se agitó vigorosamente para homogeneizar la muestra, exponiéndola al conservante de ARN. Luego, la muestra se envió a temperatura ambiente mediante un servicio de mensajería común a los laboratorios Viome para su análisis. Los tiempos de envío oscilaron entre uno y doce días. Cada participante completó un cuestionario con información general sobre el estilo de vida y la salud.

2.2. Análisis metatranscriptómico de muestras de heces

Para el análisis metatranscriptómico de 10,000 muestras de heces, se utilizó una plataforma automatizada patentada de muestra a resultado llamada Viomega. Las muestras de heces se lisaron usando perlas en un desnaturalizante químico fuerte y luego se colocaron en un manipulador de líquidos automatizado, que realizó todos los métodos de laboratorio posteriores. Las muestras se procesaron en lotes en una microplaca de 96 pocillos, cada lote constaba de noventa y cuatro muestras de heces humanas, un control de proceso negativo (NPC, agua) y un control de proceso positivo (PPC, ARN sintético personalizado). El ARN se extrajo mediante un método patentado. Brevemente, se usaron perlas recubiertas de sílice y una serie de lavados para purificar el ARN después de la lisis y se eluyó el ARN en agua. El ADN se degradó usando ADNasa sin ARNasa.

La mayoría de los ARN ribosomales procarióticos (ARNr: 16S y 23S) se eliminaron utilizando un método de hibridación sustractivo personalizado. Se añadieron sondas de ADN biotinilado con secuencias complementarias a los ARNr al ARN total, se calentó y enfrió la mezcla y se eliminaron los complejos sonda-ARNr utilizando perlas magnéticas de estreptavidina. Los ARN restantes se convirtieron en bibliotecas de secuenciación direccional con adaptadores únicos de código de barras dual y reactivos ultrapuros. Las bibliotecas se combinaron y se controló la calidad con dsDNA Qubit (Thermo Fisher Scientific) y Fragment Analyzer (Advanced Analytical). Los grupos de bibliotecas se secuenciaron en instrumentos Illumina NextSeq o NovaSeq utilizando kits de 300 ciclos.

El módulo de bioinformática de Viomega opera en Amazon Web Services e incluye control de calidad, elaboración de perfiles taxonómicos y análisis funcional. Las herramientas de control de calidad recortan y filtran las lecturas sin procesar y cuantifican las cantidades de diafonía de muestra a muestra y la contaminación de fondo por taxones microbianos. Viomega genera asignaciones de taxonomía basadas en lectura mediante un proceso de varios pasos. Las lecturas de secuenciación están alineadas con una base de datos patentada de firmas genómicas precalculadas en tres niveles taxonómicos: cepa, especie y género. Las firmas únicas se calculan a partir de genomas completos eliminando subsecuencias cortas de una longitud definida,

(- meros), compartidos entre más de un genoma y manteniendo únicos - meros que componen la firma [27]. La base de datos de taxonomía de Viomega se generó a partir de una gran base de datos RefSeq que contiene más de 110.000 genomas microbianos. Después de que se generaron las asignaciones taxonómicas iniciales, los posibles falsos positivos se eliminaron utilizando el algoritmo Auto-Blast que utiliza una base de datos de organismos aún más grande.

La identidad y la actividad relativa de los genes microbianos y las funciones enzimáticas en las muestras de heces se evaluaron mediante un algoritmo patentado. En un nivel alto, esto implica un enfoque de varios niveles para alinear las lecturas de la muestra con la biblioteca de genes del catálogo integrado de genes (IGC) [28] para identificar primero y luego cuantificar los genes en la muestra. Los genes informativos (es decir, no ARNr) se cuantificaron en unidades de transcripciones por millón (TPM) para permitir comparaciones entre muestras. Utilizando la Enciclopedia de genes y genomas de Kyoto (KEGG) [29] mapeo de anotación de genes IGC a ortologías KEGG (KOs), las funciones enzimáticas y la actividad se cuantificaron en estas muestras como el TPM agregado. El mapeo KEGG también permite módulos funcionales y análisis de rutas.

2.3. Estudios a pequeña escala

Para la validación de la lisis de la muestra en la tubería Viomega, se cultivaron los siguientes organismos en caldo nutritivo a 37 ° C y 450 rpm en un minichaker de incubación VWR: Bacillus subtilis Cepa de Marburg (ATCC 6051-U), Corynebacterium stationis cepa NCTC 2399 (ATCC 6872), Citrobacter freundii cepa ATCC 13316, NCTC 9750 (ATCC 8090), y Serratia liquefaciens cepa CDC 1284-57 ATCC 12926 (ATCC 27592). Además, los siguientes organismos se cultivaron en caldo de hongos de levadura a 37 ° C y 450 rpm en un minicomotor de incubación VWR: Saccharomyces cerevisiae cepa S288C (ATCC 204508) y Candida dubliniensis cepa CBS 7987 (ATCC MYA-646).

Para ilustrar la precisión de la clasificación taxonómica a nivel de especie de la tecnología Viomega, se utilizó el producto 10 Strain Even Mix Whole Cell Material (ATCC® MSA-2003 ™). Según lo indicado por el fabricante, este producto se compone de una mezcla uniforme de los siguientes organismos: Bacillus cereus (ATCC 10987), Bifidobacterium adolescentis (ATCC 15703), Clostridium beijerinckii (ATCC 35702), Deinococcus radiodurans (ATCC BAA816), Enterococcus faecalis (ATCC 47077), Escherichia coli (ATCC 700926), Lactobacillus gasseri (ATCC 33323), Rhodobacter sphaeroides (ATCC 17029), Staphylococcus epidermidis (ATCC 12228) y Streptococcus mutans (ATCC 700610).

3. Resultados y discusión

3.1. Validación de la tecnología Viomega
3.1.1. Lisis de la muestra

La lisis desigual de la muestra puede introducir errores importantes en cualquier método, ya que la composición de la muestra puede variar ampliamente en términos de microorganismos fáciles de lisar (virus y bacterias Gram (-)) y bacterias Gram (+) difíciles o muy difíciles de lisar y levadura. Viomega utiliza una combinación de lisis de muestras químicas (desnaturalizantes) y físicas (batido de perlas), que ha demostrado tener la mejor eficiencia. Para probar este método, se cultivaron dos cepas de bacterias Gram (-), dos cepas de bacterias Gram (+) y dos cepas de levadura hasta un rango de densidad óptica de 0,4-0,8 AU. Cantidades iguales de cada organismo por triplicado luego se sometieron a lisis de muestras químicas y físicas, y se extrajo el ARN total de cada muestra. Los rendimientos de ARN obtenidos fueron consistentes y no muestran sesgos contra bacterias Gram (+) o levaduras (rendimiento promedio:


El análisis metatranscriptómico de raíces ectomicorrízicas revela genes asociados con PAGiloderma–PAGen nosotros simbiosis: metodologías mejoradas para evaluar la expresión génica en el lugar

Los hongos ectomicorrízicos (EM) forman asociaciones simbióticas con las raíces de las plantas que regulan el intercambio de nutrientes entre las plantas del bosque y el suelo. Los enfoques de la metagenómica ambiental que emplean la secuenciación de próxima generación son muy prometedores para el estudio de las simbiosis EM; sin embargo, los estudios metatranscriptómicos se han visto limitados por las dificultades inherentes asociadas con el aislamiento y la secuenciación del ARN de las micorrizas. Aquí aplicamos un método optimizado para la extracción combinada de ADN / ARN utilizando racimos de raíces de pino y hongos EM recolectados en el campo, junto con protocolos para la identificación taxonómica del ARN ribosómico expresado y la inferencia de la función EM basada en metatranscriptómica de plantas y hongos. Usamos porciones transcritas de genes de ARN ribosómico para identificar varios taxones de hongos transcripcionalmente dominantes asociados con el pino piñonero, incluyendo Amphinema, Russula y PAGiloderma spp. Un taxón, PAGiloderma croceum, tiene un genoma disponible públicamente que nos permitió identificar patrones de contenido genético y abundancia de transcripciones. Más de 1500 expresados ​​en abundancia PAGiloderma Se detectaron genes de raíces micorrízicas, incluidos genes para el metabolismo de las proteínas, la señalización celular, el transporte de electrones, la síntesis de terpenos y otras actividades extracelulares. A diferencia de, PAGiloderma El gen que codifica un transportador de amoníaco mostró la mayor abundancia de transcripciones en muestras de suelo. Nuestra metodología destaca el potencial de la metatranscriptómica para identificar genes asociados con la simbiosis y la función del ecosistema utilizando muestras recolectadas en el campo.

Figura S1. Ubicación de los sitios de recolección.

Figura S2. Secuencias parciales de ARN ribosómico de subunidades grandes (región D2, ∼ 180 pb) para los taxones de hongos más dominantes detectados en grupos de raíces micorrízicas (Fig. 3).

Figura S3. Colocación filogenética de secuencias de ARN LSU durante tres Piloderma spp. basado en la región D2 de subunidad grande ribosómica. Las secuencias se alinearon con las secuencias de referencia identificadas taxonómicamente de Piloderma spp. de GenBank con ClustalW análisis filogenéticos realizados utilizando el criterio de parsimonia en PAUP 3.0. El árbol de arranque ("arranque rápido" con 300 réplicas) muestra la ubicación de tres Piloderma spp.

Figura S4. Secuencias de nucleótidos y péptidos de Piloderma efectores: (A) PiCr1, (B) PiBas, (C) PiSs1 y (D) PiEsp. Las supuestas secuencias señal se muestran en la secuencia del péptido (en negrita y subrayada). En (A), la disposición simétrica de los residuos de cisteína (C) se muestra en negrita.

Figura S5. Los diagramas de cinta mostraron las estructuras terciarias predichas para (A) PiCr, (B) PiBas, (C) PiSs1 y (D) PiEsp. Se mostraron la hélice (rosa) y las estructuras laminares (amarillo). Los terminales N y C están etiquetados. Las estructuras terciarias de proteínas se predijeron utilizando I-TASSER v 3.0 (Zhang 2008 Roy et al., 2010 Roy et al., 2012). La puntuación C es una puntuación de confianza para estimar la calidad de los modelos predichos por I-TASSER. Se calcula en función de la importancia de las alineaciones de la plantilla de roscado y los parámetros de convergencia de las simulaciones del ensamblaje de la estructura. La puntuación C está en el rango de –5 a 2, donde una puntuación C de valor más alto significa un modelo con una confianza alta.

Figura S6. Imágenes parciales de visualización para lecturas de muestras de raíces mapeadas con Bowtie a una referencia de ARNr 28S (gi300394395, Piloderma fallax) utilizando Integrative Genomics Viewer 2.2 × (Thorvaldsdóttir et al. 2013). Se encontraron menos secuencias variables en la región variable (D1 y D2) en comparación con las regiones conservadas de 28S. El cuadro rojo indica la región (∼ 180 pb) donde se extrajeron las lecturas para la identificación de taxones de hongos en este estudio. Las barras mapeadas en azul indican que el tamaño del inserto inferido en el gen de referencia es más pequeño de lo esperado dado el tamaño real del inserto. El rojo es el tamaño del inserto inferido en el gen de referencia es mayor de lo esperado dado el tamaño real del inserto.

Figura S7. Secuencia de aminoácidos prevista de PiAMT.

Cuadro S1. Comparación de métodos de extracción de ARN para raíces de pino (ME) y agujas.

Cuadro S2. Lectura y porcentaje de lectura asociado con transcripciones de hongos, bacterias y pinos en grupos de raíces EM detectados por Illumina HiSeq.

Cuadro S3. Composición taxonómica de los grupos de raíces EM basados ​​en (A) secuencias de amplicones de ADN ITS (B) secuencias de ARN ITS transcritas y (C) ARN ribosómico (región LSU D2). (A – C) Se muestran los recuentos absolutos (recuentos de lectura) y el valor relativo (% de lecturas).

Cuadro S4. Alta expresión de grupos de genes de Piloderma en muestras de suelo y raíces.

Se seleccionaron las familias de genes con% lee & gt0.02 en al menos una muestra. La Tabla S4A mostró el número de lecturas de familias de genes individuales obtenidas de muestras de raíz y suelo. La Tabla S4B mostró la lista ID de proteína Piloderma de la base de datos PilCr1 para cada grupo de genes.

Cuadro S5. Expresión relativa de Pinus taeda genes de racimos de raíces micorrízicas. Se aplicó el paquete Deseq 1.14.0 (Anders y Huber, 2010) para normalizar las lecturas asignadas a Pinus taeda Base de datos EST (límite de Deseq & gt 100). Simon Anders y Wolfgang Huber (2010): análisis de expresión diferencial para datos de recuento de secuencias. Biología del genoma 11: R106.

Tenga en cuenta: El editor no es responsable del contenido o la funcionalidad de la información de apoyo proporcionada por los autores. Cualquier consulta (que no sea contenido faltante) debe dirigirse al autor correspondiente del artículo.


Agradecimientos

Los autores agradecen sinceramente a los Dres. C. Li y C. Fitzsimmons por proporcionar todos los registros fenotípicos de novillos de carne. Muchas gracias a X. Sun y F. Cox por su ayuda en la construcción de la biblioteca de secuenciación y aislamiento de ADN / ARN. Agradecemos a todos los miembros del grupo del Dr. L. L. Guan por su ayuda en el muestreo.

Fondos

Este trabajo fue apoyado financieramente por la Agencia de Carne y Ganadería de Alberta (Edmonton, Canadá) con los números de subvención 2013R029R y 2015P008R. Además, FL y LLG también recibieron el apoyo de la beca para estudiantes de posgrado Alberta Innovates-Technology Futures y la beca NSERC Discovery, respectivamente. CJC fue financiado por el Consejo de Investigación de Biotecnología y Ciencias Biológicas, Reino Unido (BBSRC) números de subvención: BB / E / W / 10964A01 y BBS / OS / GC / 000011B. TCAH fue financiado a través del fondo de Nueva Zelanda para Asociaciones Globales en Investigación de Emisiones Ganaderas (GPLER).

Disponibilidad de datos y materiales

El metagenoma del rumen, el metatranscriptoma basado en ARN total y las secuencias de metatranscritpoma enriquecidas con ARN se depositaron en NCBI Sequence Read Archive (SRA) con el número de acceso PRJNA448333.


Resultados

Composición comunitaria de supergrupos protistas

En total, se obtuvieron 32 808 transcripciones de ARNr de SSU de protistas de 12 metatranscriptomas del suelo (Tabla 1). En todos los casos, las réplicas biológicas de cada sitio arrojaron una composición comunitaria muy similar (Figura 1) y se agruparon en un análisis de conglomerados (Figura 2). Los cinco supergrupos protistas según Adl et al. (2012) se encontraron en cada sitio (Tabla 1 Figura 1). El grupo SAR, formado por los supergrupos anteriormente independientes Stramenopiles, Alveolata y Rhizaria, dominó las comunidades activas en todos los sitios, siendo las secuencias de Rhizaria las más numerosas. Observamos una clara dicotomía en la composición de la comunidad protista (Figura 2) con predominio de Alveolata en suelos de turba con su alta humedad y alto contenido de materia orgánica, versus predominio de Rhizaria y Amoebozoa en suelos de pastizales y bosques, incluida la hojarasca (Figura 1).

Composición comunitaria de supergrupos protistas en los suelos investigados. Para obtener información detallada sobre los parámetros del suelo, consulte la Tabla 1.

Análisis de agrupamiento del método de grupos de pares no ponderados (UPGMA) para evaluar las diferencias entre las comunidades protistas del suelo. Para obtener información detallada sobre las características del suelo y las abreviaturas, consulte la Tabla 1.

Las Rhizaria estaban compuestas casi exclusivamente por Cercozoa (Figura 3a) con predominio de los ARNr de los pequeños flagelados pertenecientes a la clase Filosa-Sarcomonadea (anteriormente combinados en Cercomonadida) y Cercozoa flagelados y ameboides de la clase Filosa-Imbricatea (anteriormente Silicofilosea). . Los ARNr de SSU de foraminíferos se presentaron en abundancias relativamente constantes, aunque bajas, en todas las muestras (Figura 3a), excepto en el sitio de turberas 'Knutsen', donde fueron más abundantes y comprendieron el 22% de todos los Cercozoos. Los ARNr de SSU alveolados fueron bastante variables entre las muestras y predominaron en los suelos de turba (Figura 1), siendo el filo Ciliophora y sus principales órdenes Spirotrichea, Colpodea y Oligohymenophorea los más abundantes, mientras que la Apicomplexa exclusivamente parasitaria todavía representaba hasta el 11% de todos los Alveolata ( Figura 3b). El tercer grupo en SAR, Stramenopiles, fue menos abundante, con Oomycetes representando los stramenopiles dominantes en suelos forestales (Figura 3c), mientras que abundantes transcripciones de Bacillariophyta fotosintéticas fueron características en los suelos de turberas anegadas. Los ARNr de Chrysophyceaen SSU se encontraron abundantemente en suelos de pastizales y basura, al igual que las transcripciones de Bicosoecida. El supergrupo Amoebozoa representó hasta el 30% de los ARNr de SSU, con mayor abundancia en las muestras de suelo de pastizales y bosques (Figura 1 y Cuadro 1). Los otros supergrupos protistas, es decir, Excavata, Archaeplastida y Opisthokonta (excluyendo hongos y animales) fueron generalmente menos abundantes (Figura 1 y Tabla 1, ver Tabla complementaria 1 para más información).

Composición de la comunidad dentro del supergrupo SAR que muestra de forma independiente la composición de la comunidad dentro de los clados individuales de SAR, es decir, Rhizaria (a), Alveolata (B) y Stramenopiles (C). Shown are means of biological replicates. Labels and sites as described in Table 1 and Figures 1 and 2.

SSU rRNA transcripts of protist clades highly represented in cultivation-based approaches were analysed to evaluate whether these clades were also recovered in our metatranscriptomes. Among the clades targeted were flagellates of the supergroups SAR (Glissonomadida and Cercomonadida (Sarcomonadea Rhizaria), Chrysophyceae and Bicosoecida (Stramenopiles) and Excavata (Bodonidae and Euglenida), as well as amoebae in the supergroup Excavata (Heterolobosea). All clades were found at each location, with cercomonads being highly abundant in grassland and forest habitats. Glissomonads were abundant especially in grasslands (5% of all protists). Bodonids were also common (1.9% of all protists) whereas euglenids, chrysophytes, bicosoecids and heteroloboseans comprised only about 1% of all protist transcripts (Supplementary Table 1). Exhaustive analyses of the most abundant clades of amoebae are presented in the next section.

Community composition of amoebozoa

The supergroup Amoebozoa was of particular interest, as no comprehensive molecular taxonomic analysis of this protist supergroup in soil exists to date because of PCR-primer biases (Baldwin et al., 2013 Bates et al., 2013). For this purpose, we constructed a high-resolution reference database and taxonomy of Amoebozoa (see Table 2 and Materials and Methods for details). Using this taxonomic assignment approach, the rather short SSU rRNA sequence reads could reliably be classified at least to the order, often even to the genus level. Amoebozoa were highly diverse at each sampling site, with rRNAs assigned to four classes, that is, Tubulinea, Discosea, Variosea and Mycetozoa with major orders Euamoebida, Leptomyxida, Arcellinida and Centramoebida (Smirnov et al., 2011) (Figure 4). The community composition within Amoebozoa differed significantly between sites. For instance, sequences assigned to the dominant class Tubulinea made up between 27.4% and 69.2% in Solvatn peat and forest soils, respectively, and were inversely related to Discosea with 41.6–12.7% in Solvatn peat and forest soils. Similar to the patterns observed at the class level, the proportional distribution within classes differed between sites. Among Tubulinea, the dominant order Euamoebida reached highest relative abundances in grasslands and forest mineral soils, while testate amoebae of the order Arcellinida became more abundant in organic rich substrates of litter and peat soils, and Leptomyxida were characteristic of forest habitats. The remaining tubulinean orders Echinamoebida and Nolandida were generally rare. Among the class Discosea, SSU rRNAs assigned to the subclass Longamoebia were almost entirely (96.1%) composed of the order Centramoebida. Sequences of the discosean subclass Flabellinia were generally less abundant (7.0% oas) and mostly derived from the order Vannellida (50.1% of flabellinian SSU rRNAs). Sequences assigned to the subphylum Conosa could only reliably be assigned to the class level, as taxonomy and the phylogenetic affiliations, especially of protists in the class Variosea, are still largely unresolved (Adl et al., 2012). Variosea was the dominant conosan class in grassland, forest and the Solvatn peat soil, while Mycetozoa were more abundant in forest litter and Knutsen peat soil (Figure 4).

Community composition within the supergroup Amoebozoa in the investigated soils. Shown are means of biological replicates. Labels and sites as described in Table 1 and Figures 1 and 2.

Widespread were amoebozoan SSU rRNA sequences with high sequence identity to potential parasites. At all sites occurred diverse sequences related to facultative human pathogens of the genus Acanthamoeba ( ⩾ 97% sequence identity 1.1–4.4% oas) while sequences most closely resembling Balamuthia were discovered in low relative abundance (0.1–0.5% oas) in all except the grassland soils. Transcripts related to groups of non-Amoebozoan parasitic taxa were also found, such as sequences most closely resembling the human pathogen Naegleria fowleri (Heterolobosea in the supergroup Excavata ⩾ 97% sequence identity) in all four arctic peat samples. Further, opisthokonta Ichthyosporea (mainly animal parasites) were ubiquitously found (0.4–3.3% oas Supplementary Table 1) as well as predominantly plant-parasitic plasmodiophorans (up to 0.8% oas).

Widespread presence of foraminifera and choanoflagellida in soils

SSU rRNA transcripts of the typically marine groups Foraminifera and Choanoflagellida revealed their general presence and activity in all samples (Figure 5), and for the first time, allowed to estimate the relative abundance of these taxa in soils. They comprised between 0.1% and 3.5% of all protist SSU rRNAs.

SSU rRNA transcript abundance±s.d. of Foraminifera and Choanoflagellida in the soil metatranscriptomes. Labels and sites as described in Figure 2 and Table 1.

To enable better taxonomic assignment and phylogenetic placement of these enigmatic soil protist groups we, assembled larger SSU rRNA sequences from the short 454 reads. Three assembled SSU rRNA contigs of Foraminifera (742–890 bp length) were quite similar ( ⩾ 91%) to sequences obtained in a recent focused PCR-based molecular survey targeting soil Foraminifera (Lejzerowicz et al., 2010), but showed substantial sequence dissimilarity to described species (maximum SSU rRNA sequence identity of ≤76%). Several unassembled SSU rRNA sequences, however, closely matched sequences typically obtained from freshwater and marine environments, such as the genera Astrammina, Bathysiphon, Allogromia and diverse uncultured species (Supplementary Table 2).

Many Choanoflagellida-affiliated SSU rRNA sequences closely matched (with ⩾ 99% maximum identity) published sequences of uncultivated choanoflagellates (for example, with GenBank accession numbers HQ219439 (freshwater), EF024012 (soil), JF706236 and GQ330606 (peat soil)) while others reached similarities of >95% with uncultivated choanoflagellate sequences among typical freshwater and marine genera, such as Monosiga, Codonosiga, Salpingoeca, and more rarely with Lagenoeca, Stephanoeca, Didymoeca, Diaphanoeca, Desmarella y Acanthoeca. Five assembled long SSU rRNAs (763–1163 bp) had high sequence similarities of 96–99% to uncultivated freshwater choanoflagellates (Figure 6), but the closest hit to a formally described species was <92%.

Maximum likelihood tree of Choanoflagellida placing assembled long SSU rRNA contigs (red) with sequences of described and uncultivated choanoflagellates. Seventy-one sequences with 1232 unambiguously aligned positions were used the tree is unrooted values higher than 50 for maximum likelihood analyses (left) and 0.50 for Bayesian analyses (right) shown. Black circles indicate full support.


Información del autor

Afiliaciones

Canadian Center for Computational Genomics, McGill University and Genome Quebec Innovation Center, Montréal, H3A 1A4, Canada

Department of Human Genetics, McGill University, Montreal, H3A 1B1, Canada

Institut de recherche en biologie végétale, University of Montreal, Montreal, QC, H1X 2B2, Canada

F. E. Pitre, J. Marleau, M. St-Arnaud, M. Labrecque, S. Joly & N. J. B. Brereton

Montreal Botanical Garden, Montreal, QC, H1X 2B2, Canada

F. E. Pitre, M. St-Arnaud, M. Labrecque & S. Joly

Aquatic and Crop Resource Development (ACRD), National Research Council Canada, Montréal, QC, H4P 2R2, Canada

Department of Agri-food and Environmental Science, University of Florence, Viale delle Idee, Sesto Fiorentino, FI, Italy

Institut National de la Recherche Scientifique, Centre INRS–Institut Armand-Frappier, Laval, QC, Canada

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

Contribuciones

EY, MSA, SJ, ML and FP conceived and designed the study. JM, WGN and AP performed the plant growth trials, sample and sequencing preparation. EG and NJBB analysed the data and drafted the manuscript. All authors commented on and approved the final manuscript.


Ver el vídeo: Extracción de una muela rota (Enero 2022).