Información

¿Cómo determinar el flujo real en el modelo metabólico humano de una línea celular?


El problema a resolver es determinar cuáles son los valores de flujo para las diferentes reacciones en el modelo metabólico humano.

Por lo que tengo entendido, una buena forma de hacerlo sería utilizar datos de expresión genética para calcular un flujo, pero no estoy seguro de que sea una buena idea o incluso si es posible. No estoy muy seguro de cuál es el proceso correcto para hacer esto.

¡Gracias por cualquier ayuda o sugerencia!


No soy un experto en el campo, pero cuantificar la expresión genética no es un problema simple, aunque es una posibilidad.

Una solución que sé que se utilizará es el uso de marcadores radiactivos. Consulte, por ejemplo, esta revisión y, en particular, la sección "El transbordador de lactato de célula a célula", que podría proporcionar algunas ideas.

Esto puede incluir trazadores radiactivos (como lactato [14C]), trazadores no radiactivos (con [13C] o [2H]), "mediciones de intercambio neto" (no sé realmente qué significa esto aquí, tal vez el tipo de cálculos de intercambio que presentan aquí) y biopsias musculares (entonces es posible medir la concentración de metabolitos por reacción enzimática o espectrofotometría, por ejemplo).


Resumen: Pruebe una de las extensiones de FBA que tiene en cuenta la regulación genética, pero tenga en cuenta las limitaciones. Consulte a continuación para obtener referencias.

Respuesta larga:

Hay dos enfoques para estimar los flujos metabólicos internos: el (principalmente) experimental y el (principalmente) computacional. Digo principalmente, porque incluso para el enfoque experimental, se necesita hacer una gran cantidad de cálculos, y para el enfoque computacional, se deben consultar los estudios experimentales para establecer parámetros de modelo realistas.

La determinación experimental de los flujos metabólicos internos se ha centrado en el análisis del flujo metabólico de 13C (13C-MFA) realizado a través de experimentos de marcado de carbono, como se mencionó anteriormente. El 13C-MFA es complicado y costoso, por lo que hay una relativa falta de datos experimentales, y la mayoría de los experimentos cubren solo unos pocos flujos en comparación con el número de reacciones posibles, generalmente varios miles en modelos metabólicos a escala genómica. En 13C-MFA, la mayoría de los experimentos estiman los flujos en un modelo mucho más pequeño (por ejemplo, el metabolismo del carbono central), evitando o ignorando otras reacciones posibles, y el conjunto de flujos que se estiman varía entre experimentos.

Los modelos que se utilizan en enfoques computacionales para el análisis de flujo suelen ser más grandes que los modelos utilizados en los experimentos de 13C-MFA y, por lo tanto, generalmente no es posible determinar todos los flujos a partir de datos experimentales únicamente. Por lo tanto, se utiliza principalmente un enfoque llamado modelado basado en restricciones (COBRA). La suposición básica de la mayoría de los métodos actuales de análisis de flujo, tanto experimentales como computacionales, es que las concentraciones de metabolitos están en estado estacionario. Matemáticamente, esto se puede describir mediante la ecuación

$ S overrightarrow v = 0 $

donde $ S $ es un matriz estequiométrica relacionar los metabolitos y todas las reacciones posibles (básicamente una descripción compacta del modelo metabólico), y $ overrightarrow v $ es el vector de flujo que contiene todos los valores de flujo. Además del requisito de estado estable, las restricciones se aplican típicamente a las tasas de absorción y excreción de varios metabolitos, limitándolos a valores biológicamente realistas. También se pueden aplicar otros requisitos, como los requisitos para el consumo de mantenimiento de ATP.

Debido a que normalmente hay muchos patrones de flujo posibles que obedecen a las restricciones anteriores, se necesita un principio para seleccionar una solución biológicamente realista del espacio de soluciones de patrones de flujo factibles. Suponiendo que las células optimizan sus patrones metabólicos de alguna manera, diferentes funciones objetivas se utilizan que intentan capturar el comportamiento metabólico de las células. Una vez que se elige una función objetivo, se puede buscar en el conjunto de posibles soluciones el patrón de flujo que da el valor objetivo más alto en función del vector de flujo. Dado que el objetivo es lineal (simplemente una suma ponderada de flujos), se puede encontrar rápidamente una solución óptima. En general, pueden existir muchas soluciones óptimas diferentes para una función objetivo determinada. El método de aplicar una función objetivo a un modelo metabólico restringido en estado estacionario se llama Análisis de equilibrio de flujo (FBA).

El objetivo más básico y popular es la maximización de la producción de biomasa. Si bien es útil para determinar las tasas de crecimiento máximas, Es poco probable que este objetivo sea realista cuando se aplica a células humanas. La FBA y los métodos relacionados son generalmente adecuados para determinar los límites de rendimiento para puntos finales únicos, como la tasa de crecimiento o la producción de un único metabolito, pero no son capaces de determinar con precisión todos los flujos metabólicos internos. El hecho de que pueden existir muchas soluciones óptimas para una única función objetivo es importante a este respecto.

Como 13C-MFA y FBA se basan en el mismo concepto de equilibrio de metabolitos, pueden verse como diferentes extremos del mismo espectro, desde puramente experimental a puramente computacional, con 13C-MFA restringido FBA (donde los resultados de 13C-MFA se utilizan para restringir los posibles flujos en un modelo antes de optimizar una función objetivo, o minimizar la diferencia entre los flujos experimentales y la solución FBA, sujeto a restricciones adicionales) en el medio.

Para obtener una introducción al análisis de equilibrio de flujo, consulte Orth, Thiele & Palsson: "¿Qué es el análisis de balance de flujo?" Biotecnología de la naturaleza 28 245-48 2010.

Para realizar el análisis de equilibrio de flujo, se encuentran disponibles varios paquetes de software. Uno de los más utilizados es COBRA Toolbox para Matlab. También se está desarrollando una versión para Python llamada CobraPy. Ambos están disponibles en http://opencobra.sourceforge.net/openCOBRA/Welcome.html

Tenga en cuenta que la mayoría de los datos de expresión génica solo muestran cambios relativos en la expresión entre dos condiciones. Por tanto, la mayoría de los métodos se basan en la comparación de dos condiciones diferentes. Más recientemente, la secuenciación de ARN (RNAseq) también puede usarse para obtener medidas más directas de los niveles de expresión génica. Se han publicado muchas extensiones y variaciones de FBA que tienen en cuenta la expresión génica. Algunos de estos son FBA regulatorio (rFBA, Covert & Palsson: Revista de química biológica, 2002277, 28058-28064), Ajuste metabólico por expresión diferencial (MADE, Jensen & Papin: Bioinformática. 15 de febrero de 2011; 27 (4): 541-7 ) e iMAT (Schlomi et al: Bioinformática (2010) 26 (24): 3140-3142.). Para obtener un método más reciente, gx-FBA (expresión génica-FBA), consulte * Navid & Almaas, BMC Systems Biology 2012, 6: 150).

Es posible que también desee leer este artículo que trata sobre la construcción de modelos metabólicos específicos de tejido: Reconstrucción computacional de modelos metabólicos específicos de tejido: aplicación al metabolismo hepático humano. Mol Syst Biol. 7 de septiembre de 2010; 6: 401. doi: 10.1038 / msb.2010.56.

El problema con el uso de FBA y métodos relacionados para estimar los flujos internos es que la validación de los resultados es difícil debido a la mencionada falta de datos experimentales. Escribí un informe de proyecto sobre el tema durante el último año de mi maestría, que incluye una descripción básica del 13C-MFA. Se puede leer en http://www.slideshare.net/jarlemag/rapport-31295058


No puede usar la expresión genética para estimar flujos. Las razones son las siguientes. La expresión génica determina los niveles de ARNm que, a su vez, determinan los niveles de enzimas. Sin embargo, la relación entre la expresión génica y el nivel de enzima no es lineal. Sin embargo, su mayor problema es que los flujos son propiedades dependientes del sistema y no dependen de una sola enzima. Un flujo es, en principio, una función de todas las propiedades cinéticas de cada enzima en la vía. La única forma de obtener los flujos es mediante medición directa o utilizando modelos FBA o cinéticos.


Inhibidores de succinato deshidrogenasa: en silico análisis de flujo y en vivo Las investigaciones de metabolómica no muestran consecuencias metabólicas graves para ratas y humanos.

El modelado metabólico muestra la robustez del metabolismo de los mamíferos hacia la inhibición de SDH.

metabolómica plasmática in vivo realizada con los fungicidas boscalid & amp fluxapyroxad SDHI.

en silico la comparación no mostró diferencias para ratas y humanos con respecto a la inhibición de SDH.

Exposición a SDHI: sin acumulación de succinato / lactato en ratas, no se espera en humanos.


Inferir flujo metabólico en la investigación del cáncer

El metabolismo celular es un sistema dinámico en el que los nutrientes metabólicos se consumen y catabolizan constantemente para generar energía (Fig. 1a). La proliferación de células cancerosas activa aún más las vías anabólicas para producir precursores metabólicos para sintetizar macromoléculas, incluidos ADN, ARN, proteínas y lípidos [1, 2]. Esto se facilita a través de una compleja red metabólica que consta de miles de reacciones bioquímicas [3, 4]. La dinámica del metabolismo se puede describir en términos de la tasa de reacciones metabólicas, típicamente referidas como flujo metabólico (que denota la tasa de transformación de un sustrato en metabolitos del producto en unidades de moles por unidad de tiempo por célula). Un objetivo principal de la investigación metabólica del cáncer es comprender cómo los tumores reconectan el flujo metabólico para satisfacer las demandas energéticas y biosintéticas [5, 6]. La comprensión de las alteraciones específicas del tumor en el flujo metabólico facilita la identificación de la dependencia inducida de enzimas específicas cuya inhibición farmacológica se dirige selectivamente a las células cancerosas [7].

El flujo metabólico describe la dinámica del metabolismo celular. a Los nutrientes metabólicos se consumen y metabolizan constantemente para generar energía y sintetizar biomasa para apoyar la replicación celular. B Los flujos metabólicos proporcionan una visión directa del fenotipo metabólico celular que no es fácilmente evidente con las tecnologías "ómicas" ampliamente accesibles.

Una complicación importante en la investigación metabólica del cáncer es que, a diferencia de la concentración de ARNm, proteínas y metabolitos, el flujo metabólico, que refleja el fenotipo metabólico celular, no es una cantidad directamente medible (Fig. 1b). Sin embargo, se puede inferir mediante una combinación de técnicas experimentales y computacionales.

El método más directo para interrogar el flujo metabólico intracelular en las células cancerosas es el rastreo de isótopos [8, 9, 10]. Esto funciona alimentando las células cancerosas con nutrientes marcados isotópicamente y midiendo el patrón de marcaje isotópico de los metabolitos mediante espectrometría de masas o resonancia magnética nuclear (RMN). Aquí discutimos la aplicación común de este enfoque en las células cancerosas cultivadas en cultivo, aunque también se utiliza para estudios in vivo [11, 12]. El patrón de marcaje isotópico de los metabolitos es indicativo de la contribución relativa de diferentes vías a su biosíntesis. Si bien una inspección manual de las distribuciones de isótopos de metabolitos medidos facilita la evaluación cualitativa de las actividades metabólicas, la interpretación computacional a través del análisis de flujo metabólico 13C (13C-MFA) permite además la inferencia cuantitativa de flujos.

Otro enfoque de inferencia de flujo comúnmente utilizado es el análisis y reconstrucción basados ​​en restricciones (COBRA), que permite la evaluación del flujo a través de redes metabólicas a escala genómica. COBRA se ha utilizado tradicionalmente para modelar el metabolismo microbiano con fines biotecnológicos y de bioingeniería [13, 14, 15]. Reconstrucciones más recientes de modelos de redes metabólicas humanas a escala del genoma permitieron aplicar este enfoque para el modelado a gran escala de tejidos normales y diversas enfermedades humanas, incluido el cáncer [3, 16, 17, 18, 19]. COBRA predice los flujos en estado estable metabólico teniendo en cuenta las consideraciones fisicoquímicas, específicamente el equilibrio de masa estequiométrico, que requiere que las tasas de producción y consumo total de metabolitos sean iguales en condiciones de estado estable. Una característica importante de COBRA es su capacidad para predecir el flujo y el recableado metabólico mediante la incorporación de varios conjuntos de datos "ómicos", como la transcriptómica, la proteómica y la metabolómica. Esto permite la predicción de flujo para grandes colecciones de líneas celulares y tumores a través de conjuntos de datos genómicos y metabolómicos funcionales existentes, incluidos TCGA [20], NCI60 [21], CCLE [22,23,24] y Connectivity Map [25].

Aquí, proporcionamos una breve descripción general de cómo funcionan COBRA y 13C-MFA (los lectores pueden consultar revisiones completas sobre COBRA [26] y 13C-MFA [27] para obtener más información técnica), el uso reciente de estos enfoques en estudios de investigación sobre el cáncer, y las limitaciones y desafíos abiertos con cada enfoque de inferencia de flujo.


Métodos

El marco matemático necesario para mapear la cantidad de fármaco en la respuesta de crecimiento colectivo del M. tuberculosis La bacteria requirió que conectemos la cinética de inhibición enzimática, el modelado de redes metabólicas y los modelos de crecimiento de la población bacteriana. Si estos componentes pudieran modelarse y verificarse mediante datos experimentales, podríamos crear un sistema computacional para predecir cuantitativamente cómo los inhibidores metabólicos afectan el crecimiento bacteriano. A continuación, presentamos el marco que nos permitió generar y reproducir las curvas de dosis-respuesta de dos inhibidores metabólicos generados a partir de dos estudios experimentales independientes.

El marco matemático proporciona la conexión entre a) cómo un inhibidor en particular afecta los flujos de una o más reacciones metabólicas [Modelo de inhibición] (las reacciones afectadas se denominan reacciones diana), b) cómo el cambio en el flujo de metabolitos o el flujo de las reacciones objetivo disminuye la tasa de crecimiento del organismo [Red metabólica] y, finalmente, c) cómo la tasa de crecimiento reducida da como resultado una concentración de células bacterianas más baja efectiva [Modelo de crecimiento poblacional]. La Figura 1 muestra esquemáticamente estos tres componentes y cómo se conectan y dependen entre sí. Con los modelos especificados y conectados como se describe en la Figura 1, el procedimiento computacional solo depende de la concentración de inhibidor y el sustrato inicial y las concentraciones de células en el medio bajo el cual se cultivó el organismo para calcular la concentración de células bacterianas posterior. Los detalles que especifican el funcionamiento interno de cada modelo se dan a continuación.

Una vista esquemática del marco para simular el efecto de un inhibidor sobre el crecimiento bacteriano.. Dada la concentración de inhibidor [I], el modelo de inhibición describe cómo el inhibidor afecta el flujo de reacción de la reacción que se inhibe (es decir, la reacción objetivo). Estos efectos se modelan mediante restricciones explícitas sobre el flujo de reacción objetivo. Usando estas restricciones y las restricciones en la tasa de absorción del sustrato, analizamos la Red Metabólica para inferir la tasa de crecimiento de la biomasa. μ y tasa de absorción del sustrato v C. Usando el Modelo de Crecimiento de la Población, relacionamos la tasa de crecimiento de la biomasa μ y tasa de absorción del sustrato v Ca la concentración celular [X]. Acoplamos dinámicamente la tasa de crecimiento de la biomasa y la concentración disminuida de sustrato para desarrollar un modelo dependiente del tiempo que infiere dinámicamente la concentración celular después de la introducción de un inhibidor. Una vez que se especificaron estos componentes del modelo, junto con el sustrato inicial [C0] y celda [X0] concentraciones en el medio de crecimiento, los cálculos realizados dentro de este marco solo requirieron una entrada en forma de una concentración específica de inhibidor [I] para predecir el crecimiento celular.

Modelo de inhibición

los modelo de inhibición se define por la cinética de inhibición de la enzima que gobierna los reactivos y productos de una reacción metabólica particular (es decir, la reacción diana) y relaciona la forma en que la concentración de inhibidor [I] modifica o agrega restricción al flujo de la reacción objetivo. La forma matemática del modelo de inhibición depende de la cinética enzimática particular asociada con el inhibidor específico y la reacción metabólica afectada por el inhibidor. Matemáticamente, el modelo de inhibición relaciona una concentración de inhibidor [I] a la relación de flujo de metabolitos resultante en presencia y ausencia del inhibidor. También se pueden considerar los inhibidores que afectan a más de una reacción.

Red metabólica

los red metabólica se utiliza para calcular de forma autoconsistente la tasa global de crecimiento de la biomasa μ, tasas de absorción de sustrato v C, y los flujos de todas las reacciones metabólicas. Está acoplado al modelo de inhibición y el modelo de crecimiento poblacional. los modelo de inhibición impone restricciones al flujo de las reacciones objetivo en la red metabólica que afecta la tasa de crecimiento de la biomasa total, y la modelo de crecimiento poblacional agrega restricciones a la tasa de absorción de sustrato de la red desde el medio. El efecto de las deleciones de enzimas (mutantes de deleción) sobre el crecimiento puede incorporarse en el modelo de red metabólica mediante la eliminación de las reacciones particulares catalizadas por las enzimas especificadas [22, 54].

La red metabólica desarrollada por Jamshidi y Palsson [42] para M. tuberculosis, iNJ 661, es capaz de reproducir cuantitativamente las tasas de crecimiento observadas en varias condiciones diferentes. Usamos esta red, con algunas modificaciones, como base para nuestro trabajo (ver Archivo Adicional 1: Sección S1) y verificamos que las modificaciones no afectaron la tasa de crecimiento de M. tuberculosis, como se informó originalmente [42].

La tasa de crecimiento de la biomasa, las tasas de absorción del sustrato y los flujos de reacción se obtuvieron directamente de la red metabólica mediante la aplicación de FBA [26]. Mediante el uso de un método de programación lineal, FBA puede maximizar la tasa de crecimiento de la biomasa sujeta al equilibrio de masa en estado estacionario de todos los metabolitos intracelulares y las restricciones estequiométricas definidas por las reacciones. La maximización de la tasa de crecimiento de la biomasa se basa en el supuesto de que las bacterias maximizan su crecimiento durante la etapa exponencial y las condiciones de la etapa estacionaria temprana. Estudios previos han demostrado que esta suposición genera resultados compatibles con experimentos en tales condiciones [25, 30]. Las restricciones adicionales que se pueden modelar en la FBA incluyen la especificación de reacciones reversibles e irreversibles, así como los límites impuestos a la absorción del sustrato y las velocidades de reacción objetivo. Aquí, Logística de Amazon se realizó con COBRA Toolbox [55]. También utilizamos COBRA Toolbox para minimizar los flujos de reacción mientras se mantiene la tasa máxima de crecimiento de biomasa calculada. Este procedimiento nos permitió obtener un conjunto único de flujos mínimos correspondientes al flujo más parsimonioso de metabolitos a través de la red [56-58]. Estos flujos se utilizaron luego para restringir las velocidades de reacción objetivo.

Modelo de crecimiento poblacional

Dada la tasa de crecimiento de la biomasa μ y las tasas de absorción del sustrato v Cdefinido por la red metabólica, el modelo de crecimiento poblacional proporciona un mecanismo para calcular la celda [X] y sustrato [C] concentraciones en el medio especificado. Este modelo considera los cambios en las concentraciones de sustrato a lo largo del tiempo, lo que podría usarse para monitorear cómo se usan preferentemente las diferentes fuentes de carbono en el proceso metabólico [30].

Matemáticamente, el modelo de crecimiento de la población vincula la tasa de crecimiento de la biomasa μ a la concentración celular real [X] de las bacterias en función del tiempo t. Este proceso debe considerar el agotamiento temporal del sustrato limitante. C en el medio a medida que crecen las células, que depende de la tasa de absorción del sustrato v Cpor las células. Debido a que cuanto más crecen las células, más consumen el sustrato limitante, representamos este acoplamiento a través de las siguientes dos ODE:

donde los corchetes [.] indican la concentración de "." y [C] representa la concentración del sustrato limitante C en el medio. El factor 24 simplemente convierte el tiempo t de horas a días, ya que las unidades de μ y v Cse expresan, respectivamente, en h -1 y mmol / (h · gDW), es decir, mmol por hora por gramo de peso seco de M. tuberculosis. La ecuación 1 no incluyó una tasa de muerte celular porque simulamos el crecimiento bacteriano durante la etapa exponencial y las condiciones de la etapa estacionaria temprana, donde el crecimiento celular juega un papel más dominante que la muerte celular. Estudios anteriores en condiciones de crecimiento similares, que tampoco incluían explícitamente un término de tasa de mortalidad, obtuvieron resultados de simulación que coincidían con los datos experimentales [25, 30].

La tasa de crecimiento de la biomasa μ y la tasa de absorción del sustrato limitante v Cse determinan, para un momento determinado, mediante la realización de una FBA de la red metabólica para una concentración de inhibidor determinada [I] y una restricción de límite superior en la tasa de absorción de sustrato limitante. Introdujimos formalmente una notación para indicar la tasa de crecimiento μ y la tasa de adopción v Csalidas de un FBA de una red metabólica para un conjunto dado de condiciones de entrada [I] y como:

Empleamos el modelo cinético de Michaelis-Menten [25] para estimar el límite superior de la tasa de absorción del sustrato:

dónde V metrodenota la tasa inicial máxima de absorción de sustrato y K metrorepresenta la constante de velocidad de Michaelis-Menten. Además, vinculamos la lectura experimental, en este caso la densidad óptica (sobredosis) bajo luz de longitud de onda de 600 nm [46, 53], a la concentración celular [X] por:

donde K denota una constante de proporcionalidad. Otras lecturas experimentales pueden contabilizarse de manera similar.

Análisis de sensibilidad de los valores de los parámetros

La presencia de una serie de parámetros en nuestro marco matemático justificó un análisis de sensibilidad sobre cómo los valores de los parámetros asignados afectaron los resultados computacionales finales. Usamos dos métricas diferentes para determinar la sensibilidad de los parámetros. En el primer análisis, medimos la variación en los resultados estableciendo por separado cada uno de los valores de los parámetros en límites inferiores y superiores razonables [10], en este caso, ± 50% de los valores de los parámetros elegidos. En el segundo análisis, calculamos el coeficiente de sensibilidad para cada uno de los parámetros. Este coeficiente proporciona una medida de la dependencia entre los resultados calculados y el parámetro correspondiente. Si sobredosis representa la concentración celular expresada como densidad óptica bajo luz de longitud de onda de 600 nm y pag representa el parámetro analizado para la sensibilidad, el coeficiente de sensibilidad se define de la siguiente manera [59, 60]:

Otros observables, diferentes de sobredosis, se puede sustituir en la ecuación. 6. Calcular numéricamente el coeficiente de sensibilidad de un parámetro pag, partimos de ∂pag = +0.5pag y repitió el proceso reduciendo ∂pag y calcular el coeficiente de sensibilidad hasta converger, es decir, hasta valores sucesivos de ∂pag rindió lo mismo. Luego repetimos el proceso a partir de ∂pag = -0.5pag hasta la convergencia. En el cálculo realizado aquí, ambos procesos convergieron al mismo valor numérico.

Para abordar los diferentes tipos de parámetros en nuestro marco, clasificamos los parámetros modelados en cuatro grupos: grupo I incluyó parámetros obtenidos de la literatura, grupo II incluidos los determinados mediante la coincidencia de datos experimentales, grupo III incluidos los que se supone que se derivan de otros parámetros, y grupo IV incluía aquellos que, por definición, se determinaban directamente una vez definidos los demás parámetros. Durante el análisis de sensibilidad de los parámetros en grupos I, II, y III, calculamos curvas de dosis-respuesta mientras aumentamos y disminuimos cada parámetro en un 50% (excepto aquellos cuyos valores no pueden exceder uno) y coeficientes de sensibilidad que abarcan tres órdenes de magnitud en la concentración de inhibidor. Aunque los parámetros en grupo III se asumió que se derivan de los parámetros en grupos I y II, durante el análisis de sensibilidad para los dos primeros grupos, mantuvimos los valores de los parámetros en grupo III reparado. Además, debido a que los parámetros en grupo IV dependían de otros parámetros y sus valores cambiaron a medida que realizamos análisis de sensibilidad en estos parámetros independientes, no realizamos análisis para este grupo.


Especificación del entorno

Para utilizar un GEM para la predicción de fenotipos esperados, o para la simulación de procesos dinámicos, se debe definir la composición química del medio ambiente (Tabla 2). Establecer la lista de moléculas ambientalmente disponibles es sencillo en experimentos de laboratorio simples, en los que se utilizan medios definidos con composición química conocida. En este contexto, bases de datos como Media DB [62] o KOMODO [63] han catalogado un gran número de medios definidos, lo que facilita enormemente el modelado metabólico. Sin embargo, muchos experimentos de laboratorio se realizan en medios indefinidos que contienen ingredientes como el "extracto de levadura" que no se pueden enumerar y cuantificar fácilmente. En la naturaleza, los microbios a menudo existen en entornos muy complejos donde los aportes químicos al sistema no están definidos, varían con el tiempo y son alterados por otros microbios en el medio ambiente. Además, no es suficiente conocer la lista de compuestos presentes en el medio de cultivo, sino que también se debe saber a qué velocidades el organismo puede consumir los compuestos para establecer adecuadamente los límites de las reacciones de absorción del modelo metabólico. En principio, la composición del ambiente se puede determinar mediante técnicas experimentales como la exo-metabolómica, donde las mediciones de metabolitos en el ambiente extracelular se utilizan para inferir las tasas de captación y secreción celular [64,65,66,67,68]. Este enfoque puede proporcionar información valiosa para reducir la incertidumbre en la especificación del entorno. Sin embargo, estos datos vienen con su propia incertidumbre que debe abordarse con cuidado [69]. Todos estos factores dan lugar a una amplia gama de incertidumbres que surgen en la especificación del entorno para el análisis de redes metabólicas [70].

Los GEM brindan la oportunidad de abordar la incertidumbre asociada con entornos complejos. Los algoritmos de análisis GEM, como FBA, son computacionalmente eficientes y, por lo tanto, pueden ejecutarse en un gran conjunto de entornos para cuantificar la sensibilidad de los flujos simulados a la composición de nutrientes. Varios estudios han cuantificado esta sensibilidad mediante la identificación de aspectos de las predicciones GEM que se ven fuertemente afectados o robustos a la variación en la composición ambiental [71,72,73,74,75,76,77]. La descripción de esta sensibilidad o robustez proporciona una imagen más clara de cómo la incertidumbre en la especificación del entorno puede o no propagarse a predicciones específicas de GEM. Al principio, se desarrolló un análisis del plano de fase del fenotipo para mostrar el impacto en la tasa de crecimiento óptima de variar los flujos de dos recursos limitantes [71, 72]. Más allá de los pares de recursos, se pueden muestrear aleatoriamente grandes conjuntos de nutrientes para evaluar la variabilidad de todos los flujos intracelulares. Por ejemplo, Almaas et al. mostró, usando un bien curado Escherichia coli GEM, que la distribución general de los flujos metabólicos es robusta a la composición ambiental, sin embargo, los flujos específicos varían, y la mayoría de las variaciones discretas ocurren en una “columna vertebral de alto flujo” conectada de reacciones [73]. El trabajo posterior destacó la importancia evolutiva de un núcleo activo de reacciones que transportan flujo en todos los entornos [74]. Reed y Palsson demostraron además que las reacciones con flujos correlacionados entre entornos son indicativos de la estructura reguladora de la transcripción [75]. Estos estudios apuntan a la naturaleza no trivial de la sensibilidad de las predicciones GEM a las especificaciones ambientales. Más allá del contexto de organismos individuales, el análisis GEM se ha utilizado para demostrar que la variación del entorno puede alterar la naturaleza de las interacciones metabólicas entre organismos microbianos [78] y que determinadas variables ambientales, como la presencia de oxígeno, pueden tener un impacto significativo en los tipos de interacción que surgen [79]. Los entornos variables pueden afectar el metabolismo celular desde los flujos de reacción individuales hasta el nivel de interacciones microbianas. Por lo tanto, en aplicaciones donde el entorno es incierto, se necesitan enfoques de conjunto o probabilísticos para capturar completamente los fenotipos potenciales.

Un enfoque más reciente, inspirado en el concepto de física estadística de percolación en red, utiliza un muestreo aleatorio de composiciones de nutrientes para cuantificar qué metabolitos pueden ser producidos consistentemente por una red metabólica dada en muchos ambientes [80]. Este enfoque introdujo un marco probabilístico para representar los metabolitos de entrada de una red metabólica, lo que podría facilitar aún más el muestreo aleatorio de conjuntos ambientales en métodos futuros. Si bien la implementación actual de este marco muestra todos los metabolitos ambientales con la misma probabilidad, se podrían prever enfoques futuros que representen las incertidumbres ambientales con mayor precisión mediante el uso de distribuciones sesgadas que incorporen cualquier conocimiento disponible. Este enfoque llenaría la brecha existente entre asumir un solo ambiente conocido y muestrear ambientes al azar de manera uniforme. Además, el muestreo ambiental podría usarse para variar el flujo (en FBA) o las concentraciones (en FBA dinámico) de diferentes componentes ambientales, además de su presencia y ausencia, para evaluar el impacto de estas cantidades en las propiedades de la red metabólica.

La especificación del entorno para el análisis GEM podría mejorarse aún más utilizando métodos de "ecología inversa" que tienen como objetivo inferir el entorno nativo a partir de la estructura de la red metabólica, ya sea a través de la optimización basada en restricciones [81,82,83] o mediante la definición de metabolitos "semilla". que se necesitan como entradas para una red metabólica y, por lo tanto, es más probable que se encuentren en el entorno natural de ese organismo [84, 85]. Dado que estos métodos utilizan la estructura de la red metabólica para informar la especificación del entorno, deben aplicarse con cuidado ya que la incertidumbre en la red puede propagarse a la especificación del entorno.


Discusión

Metabolismo en AGE1.HN

El metabolismo y los cambios metabólicos de la nueva línea celular humana AGE1.HN se analizaron cuantitativamente en este estudio utilizando análisis de flujo metabólico resuelto en el tiempo y análisis de flujo metabólico estacionario en diferentes fases durante el cultivo por lotes. Nuestros resultados indican que la absorción de piruvato durante la fase 1 en combinación con altos niveles de otros sustratos resultó en un fenotipo metabólico ineficiente caracterizado por un metabolismo de desbordamiento que conduce a la formación de productos de desecho. En la fase 2, el metabolismo estaba cambiando a un estado más eficiente caracterizado por bajas tasas de absorción de sustrato y sin formación de lactato. Los datos indican que una disminución en los niveles de sustrato que ocurre durante el cultivo resultó en una desaceleración de la glucólisis durante la fase 1. Experimentos adicionales usando diferentes concentraciones de piruvato en el medio apoyan la conclusión de que existe un fuerte vínculo entre el piruvato en el medio y la producción de lactato en AGE1.HN (los datos se presentarán en otro lugar). Otra posibilidad sería que las células pudieran secretar lactato solo hasta que se alcance una cierta concentración y luego detenga la producción. Sin embargo, en otros experimentos que se realizaron usando altas concentraciones iniciales de lactato (alrededor de 8 mM) se observó que las células producían casi la misma cantidad de lactato que en los experimentos donde la concentración inicial de lactato era 0. Esto indica que el agotamiento de piruvato parece disminuir. ser un factor importante para el cese de la producción de lactato. Este fenotipo particular no se ha observado hasta ahora en otras células de mamíferos [22, 23, 26, 41].

Durante el crecimiento exponencial de las células de mamíferos en niveles de sustrato no limitantes, se informó de una utilización ineficaz del sustrato para varias otras líneas de células de mamíferos [22, 23, 28, 42]. Por lo general, solo una pequeña cantidad de piruvato intracelular ingresa al ciclo de TCA en estas condiciones, lo que se considera muy desfavorable. Increasing flux through pyruvate dehydrogenase represents an optimization target for the cultivation of many mammalian cells, but the mechanisms and molecular reasons are still poorly understood [43, 44]. In a recent study on HEK-293, cells pyruvate dehydrogenase activity was reported to be around 22% of glycolytic activity [42]. Very low or even no activity of the pyruvate dehydrogenase complex was reported in other studies on different mammalian cells [23, 45]. In AGE1.HN cells, this was observed only during the first phase. During phases 2 and 3, pyruvate dehydrogenase activity was high. In MDCK cells it was found that an addition of pyruvate in a glutamine depleted medium resulted even in an increase in the flux from pyruvate into the TCA cycle [23]. In AGE1.HN, it seems that available pyruvate has an opposite effect triggering the conversion of pyruvate to lactate. High uptake rates of glucose and pyruvate as observed in phase 1 might lead to an increase of the intracellular pyruvate pool triggering overflow metabolism into lactate/alanine eventually resulting in an increased secretion of these waste metabolites. This might be changed by increasing reactions connecting TCA cycle and glycolysis, e.g., by stimulating pyruvate dehydrogenase and pyruvate carboxylase fluxes [46, 47]. However, the success of this strategy can not be predicted a priori. Increase of fluxes into the TCA cycle must be accompanied by an increase in oxidative phosphorylation activity which might not always be possible. Another strategy that is working in the opposite direction would be decreasing the substrate uptake rates, e.g., by knock down of transporters [48] or decreasing the lactate production, e.g., by knock down of lactate dehydrogenase [40].

Comparison of selected metabolic fluxes in AGE1.HN with those in other cells

Selected metabolic fluxes in AGE1.HN that were calculated by the stationary method for different phases are compared to fluxes published for other mammalian cells (Table 2). Glucose uptake and lactate production rates were generally lower in AGE1.HN than in other cells. Pyruvate represents an extracellular metabolite that was often neglected in other studies [26, 28]. However, as shown in this study and in MDCK cells [23, 49] or CHO cells [50], it is a very interesting metabolite that can induce huge changes in the metabolism. In AGE1.HN cells pyruvate uptake rate was by far lower than in MDCK cells that were grown in high pyruvate medium (Table 2, M2). However, the ratio of pyruvate uptake per glucose uptake was similar. The second phase in AGE1.HN showed a very efficient metabolism concerning substrate usage as already discussed before. The cells were proliferating without lactate production. Pyruvate dehydrogenase (PDH) activity was high. In all other cell lines, high lactate production was observed during the phases that were analyzed by MFA except for CHO cells in presence of galactose after glucose depletion. In order to reach higher cell densities in cultivations of AGE.HN, the second phase could be prolonged by feeding of glutamine. PDH activity in AGE1.HN was low in phase 1 and high in phases 2 and 3. A similar situation was observed in CHO cells [26] which exhibited low PDH activity and overflow metabolism during growth on glucose. After glucose depletion, these cells were consuming lactate in the presence of galactose having high PDH activity. No PDH activity was reported for MDCK cells in glutamine containing medium. In medium without glutamine and high pyruvate concentration low PDH activity was found in these cells. The absolute flux through PDH was highest in continuously cultured hybridoma cells [28], but the metabolism was by far not as efficient as in phase 2 of AGE1.HN since there was high glucose consumption and waste product formation. Absolute glutamate dehydrogenase (GDH) activity of AGE1.HN during phases 1 and 2 was lower than in other cell lines, but the relative activity compared to the glucose uptake rate was quite similar in MDCK and CHO cultures. Upper and lower TCA cycle activity in phases 2 and 3 was similar to the activity in CHO cells with glucose medium (S1 in Table 2) and in MDCK cells (M2 in Table 2) cultured without glutamine. For hybridoma cells, higher TCA cycle activity was reported.

The main differences between the metabolic phases of AGE1.HN are summarized in Fig. 7. The results indicate further targets for improving the metabolic phenotype of these cells to reach higher cell densities as well as to obtain a more efficient utilization of the nutrients. The high overflow metabolism in the beginning of the cultivation with channeling of pyruvate to lactate could be decreased. This could be accomplished by genetic engineering, e.g., deletion of lactate dehydrogenase [51] or introduction of pyruvate carboxylase [46], further medium optimization, e.g., reduced concentrations of pyruvate, or application of new feeding strategies [50]. The observed metabolism in phase 2 indicates the potential of this cell line to grow very efficiently having minimum formation of waste products and minimum energy spilling [52]. Therefore, it seems promising to change environmental conditions, i.e., media, substrate feeding as well as enzyme expression such as to approach the efficient metabolic state of phase 2 during a process. Studies on enzyme expression and detailed labelling experiments in combination with 13 C metabolic flux analysis would provide additional hints for the best way to further improve the cell line.

Summary of metabolic shifts during batch cultivation of AGE1.HN

Time resolved versus stationary flux analysis

The applied dynamic method is well suited to analyze and monitor metabolic shifts during the cultivation. Cell growth, cell size, extracellular as well as intracellular fluxes of mammalian cells in a cell culture process are highly dynamic which is caused by environmental changes. Therefore, the presented method that is considering the dynamics of all included metabolites and biomass is best suited to understand and finally model the process. Stationary metabolic flux analysis that was applied extensively in the past [23, 53] is only suited to describe the mean metabolism during a certain phase which is a significant disadvantage since changes during the phase considered are neglected [54]. However, if the pseudo steady state assumption during a phase is justified, it can give a useful overview of its average metabolism [55]. The information obtained by flux balance analysis can be validated [56] or further enriched by specific labelling information [57] to resolve reversible, cyclic or parallel fluxes as for example pentose phosphate pathway split [58, 59].


Información de soporte

S1 Higo

A) The electron micrographs of SARS-CoV-2 (Credit: NIAID-RML) B) Number of spike proteins calculated from intensity measurements of the micrograph along the circumference of the virus.

S2 Higo

The processed final model is used for differential flux analysis.

S3 Higo

The uptake rates were varied and a point optimization program was used to calculate the specific growth rate. The fitness change is reported as the ratio of specific growth rate under perturbation to the specific growth rate under normal uptake rate. All the uptake rates were negative.

S4 Higo

The coefficients of biomass precursors were varied by 널% taken one at a time and the specific growth rate was calculated by FBA.

S1 Dataset

The sheets in the dataset comprises of stepwise calculation of SARS-CoV-2 amino acid composition, nucleotide composition, carbohydrate and lipid composition. The last sheet comprises of the final viral biomass equation.

S2 Dataset

The description of each dataset within S2 Dataset are given in the first sheet.

S1 Text


1. INTRODUCCIÓN

From its inception, classical biology has relied on reductionist principles. However, the actual nature of the cell, in which all components interact, demanded switching the previous paradigm to a holistic molecular approach, extending the scope of the analysis. These are the foundations that motivated the development of systems biology in the second half of the twentieth century. In particular, systems biology aims at studying the biological processes in terms of the cellular components and their interactions from a holistic molecular perspective ( Kitano, 2002 ).

Some of these components interact in the cellular metabolism, which comprises those biochemical reactions consuming and producing the smallest compounds of the cell, typically named metabolites. These reactions are close to be in thermodynamic equilibrium, requiring the presence of catalytic agents so as to achieve the appropriate rate of activity to sustain life. In most metabolic reactions, a set of proteins named enzymes act as catalysts. The conversion rate of the metabolic reactions is termed metabolic fluxes.

Metabolic reactions are organized into distinct functional modules, forming the so-called metabolic pathways. Some of these pathways have been experimentally reported and manually included in different databases ( Kanehisa et al. , 2012 Keseler et al. , 2011 ), as well as in biochemistry books ( Nelson and Cox, 2000 ), e.g. glycolysis, TCA cycle. However, metabolic pathways are not independent entities for example, the same enzyme or metabolite may appear in different pathways. For this reason, a most general analysis of metabolism requires the simultaneous consideration of different metabolic pathways. In the most extreme scenario, when all the known metabolic pathways are considered, the resulting set of enzymes and metabolites is referred to as genome-scale metabolic networks (GSMNs). The outbreak of different high-throughput experimental techniques has allowed us to increase the accuracy and size of GSMNs, in terms of metabolites, reactions and gene regulation. Currently, GSMNs for several organisms are publicly available through different online repositories ( Schellenberger et al. , 2010 ).

The inherent complexity of GSMNs does not make it possible to perform a manual analysis per se. Different computational strategies have been developed ( Planes and Beasley, 2008 ). Among them, a number of theoretical frameworks have been proposed to extend the concept of metabolic pathways from a network-oriented perspective ( de Figueiredo et al. , 2009 Pey et al. , 2011 , 2013 ). One of the most important pathway concepts is that of Elementary Flux Mode (EFM) ( Schuster et al. , 2000). EFMs are a minimum set of enzymes necessary to accomplish mass-balance and thermodynamic (irreversibility) conditions ( Schuster et al. , 2000). Although the mass-balance and thermodynamic constraints are directly imposed by means of two linear constraints, the condition that guarantees that only a minimum number of reactions is active, referred to as the non-decomposability condition (NDC), is more difficult and demands further mathematical considerations.

Efficient algebraic frameworks can be found in the literature for calculating the whole set of EFMs of a given metabolic network. These methods are based on an iterative process that has to be completed so as to guarantee that the obtained solutions are EFMs. However, the number of EFMs increases exponentially with the number of reactions constituting the network ( Acuña et al. , 2010). Consequently, applying these methodologies to GSMNs goes beyond their scope. Because it is not possible to calculate all the EFMs in GSMNs, different mathematical frameworks were later developed to provide a particular subset of them ( de Figueiredo et al. , 2009 Machado et al. , 2012 Rezola et al. , 2013 ), most of them based on Mixed Integer Linear Programming (MILP).

These optimization methods typically enumerate EFMs in an increasing number of reactions and have been proved effective for a number of applications ( Rezola et al. , 2013 , 2014 ). However, they allow us to add only one biological constraint in the search procedure, e.g. computing the 100 shortest EFMs producing L-lysine, as stated by de Figueiredo et al. (2009). This limitation is due to NDC. In other words, currently in the literature, there is no general methodology for taking into account more than one biological constraint in the EFM computation without violating NDC.

In this work, we present a novel approach based on MILP that is able to calculate a subset of EFMs fulfilling additional constraints. The framework is illustrated with a toy example and validated with two networks ( Rezola et al. , 2011 Schuster et al. , 2000 ), where all EFMs can be obtained. Subsequently, the scalability of our approach is confirmed by calculating a subset of EFMs in the genome-scale metabolic network of Saccharomyces cerevisiae ( Heavner et al. , 2012). Here, we investigated EFMs simultaneously consuming glucose and producing ethanol, guaranteeing that a minimum yield is achieved. We also validated the performance of this new approach when more than two constraints are imposed, particularly by calculating 100 EFMs activating a random set of five reactions.


The study of metabolic pathways

There are two main reasons for studying a metabolic pathway: (1) to describe, in quantitative terms, the chemical changes catalyzed by the component enzymes of the route and (2) to describe the various intracellular controls that govern the rate at which the pathway functions.

Studies with whole organisms or organs can provide information that one substance is converted to another and that this process is localized in a certain tissue for example, experiments can show that urea, the chief nitrogen-containing end product of protein metabolism in mammals, is formed exclusively in the liver. They cannot reveal, however, the details of the enzymatic steps involved. Clues to the identity of the products involved, and to the possible chemical changes effected by component enzymes, can be provided in any of four ways involving studies with either whole organisms or tissues.

First, under stress or the imbalances associated with diseases, certain metabolites may accumulate to a greater extent than normal. Thus, during the stress of intense exercise, lactic acid appears in the blood, while glycogen, the form in which carbohydrate is stored in muscle, disappears. Such observations do not, however, prove that lactic acid is a normal intermediate of glycogen catabolism rather, they show only that compounds capable of yielding lactic acid are likely to be normal intermediates. Indeed, in the example, lactic acid is formed in response to abnormal circumstances and is not directly formed in the pathways of carbohydrate catabolism.

Second, the administration of metabolic poisons may lead to the accumulation of specific metabolites. If fluoroacetic acid or fluorocitric acid is ingested by animals, for example, citric acid accumulates in the liver. This correctly suggests that fluorocitric acid administered as such, or formed from fluoroacetic acid via the tricarboxylic acid (TCA) cycle, inhibits an enzyme of citrate oxidation.

Third, the fate of any nutrient—indeed, often the fate of a particular chemical group or atom in a nutrient—can be followed with relative ease by administering the nutrient labeled with an isotope. Isotopes are forms of an element that are chemically indistinguishable from each other but differ in physical properties.

The use of a nonradioactive isotope of nitrogen in the 1930s first revealed the dynamic state of body constituents. It had previously been believed that the proteins of tissues are stable once formed, disappearing only with the death of the cell. By feeding amino acids labeled with isotopic nitrogen to rats, it was discovered that the isotope was incorporated into many of the amino acids found in proteins of the liver and the gut, even though the total protein content of these tissues did not change. This suggested that the proteins of these tissues exist in a dynamic steady state, in which relatively high rates of synthesis are counterbalanced by equal rates of degradation. Thus, although the average liver cell has a life-span of several months, half of its proteins are synthesized and degraded every five to six days. On the other hand, the proteins of the muscle or the brain, tissues that (unlike the gut or liver) need not adjust to changes in the chemical composition of their milieu, do not turn over as rapidly. The high rates of turnover observed in liver and gut tissues indicate that the coarse controls, exerted through the onset and cessation of synthesis of pacemaker enzymes, do occur in animal cells.

Finally, genetically altered organisms ( mutants) fail to synthesize certain enzymes in an active form. Such defects, if not lethal, result in the accumulation and excretion of the substrate of the defective enzyme in normal organisms, the substrate would not accumulate, because it would be acted upon by the enzyme. The significance of this observation was first realized in the early 20th century when the phrase “inborn errors of metabolism” was used to describe hereditary conditions in which a variety of amino acids and other metabolites are excreted in the urine. In microorganisms, in which it is relatively easy to cause genetic mutations and to select specific mutants, this technique has been very useful. In addition to their utility in the unraveling of metabolic pathways, the use of mutants in the early 1940s led to the postulation of the one gene-one enzyme hypothesis by the Nobel Prize winners George W. Beadle and Edward L. Tatum their discoveries opened the field of biochemical genetics and first revealed the nature of the fine controls of metabolism.

Because detailed information about the mechanisms of component enzymatic steps in any metabolic pathway cannot be obtained from studies with whole organisms or tissues, various techniques have been developed for studying these processes—e.g., sliced tissues, and homogenates and cell-free extracts, which are produced by physical disruption of the cells and the removal of cell walls and other debris. The sliced-tissue technique was successfully used by the Nobel Prize winner Sir Hans Krebs in his pioneer studies in the early 1930s on the mechanism of urea formation in the liver. Measurements were made of the stimulating effects of small quantities of amino acids on both the rate of oxygen uptake and the amount of oxygen taken up the amino acids were added to liver slices bathed in a nutrient medium. Such measurements revealed the cyclic nature of the process specific amino acids acted as catalysts, stimulating respiration to an extent greater than expected from the quantities added. This was because the added material had been re-formed in the course of the cycle (vea abajo Disposal of nitrogen).

Homogenates of tissue are useful in studying metabolic processes because permeability barriers that may prevent ready access of external materials to cell components are destroyed. The tissue is usually minced, blended, or otherwise disrupted in a medium that is suitably buffered to maintain the normal acid–base balance of the tissue, and contains the ions required for many life processes, chiefly sodium, potassium, and magnesium. The tissue is either used directly—as was done by Krebs in elucidating, in 1937, the TCA cycle from studies of the respiration of minced pigeon breast muscle—or fractionated (i.e., broken down) further. If the latter procedure is followed, homogenization is often carried out in a medium containing a high concentration of the sugar sucrose, which provides a milieu favourable for maintaining the integrity of cellular components. The components are recovered by careful spinning in a centrifuge, at a series of increasing speeds. It is thus possible to obtain fractions containing predominantly one type of organelle: nuclei (and some unbroken cells) mitochondria, lysosomes, and microbodies microsomes (i.e., ribosomes and endoplasmic reticulum fragments) and—after prolonged centrifugation at forces in excess of 100,000 times gravity—a clear liquid that represents the soluble fraction of the cytoplasm. The fractions thus obtained can be further purified and tested for their capacity to carry out a given metabolic step or steps. This procedure was used to show that isolated mitochondria catalyze the oxidation reactions of the TCA cycle and that these organelles also contain the enzymes of fatty acid oxidation. Similarly, isolated ribosomes are used to study the pathway and mechanism of protein synthesis.

The final step in elucidating a reaction in a metabolic pathway includes isolation of the enzyme involved. The rate of the reaction and the factors that control the activity of the enzyme are then measured.

It should be emphasized that biochemists realize that studies on isolated and highly purified systems, such as those briefly described above, can do no more than approximate biological reality. The identification of the fine and coarse controls of a metabolic pathway, and (when appropriate) other influences on that pathway, must ultimately involve the study of the pathway in the whole cell or organism. Although some techniques have proved adequate for relating findings in the test tube to the situation in living organisms, study of the more complex metabolic processes, such as those involved in differentiation and development, may require the elaboration of new experimental approaches.


Información del autor

Afiliaciones

Bio-X Institutes, Key laboratory for the Genetics of Developmental and Neuropsychiatric Disorders (Ministry of Education), Shanghai Jiao Tong University, Shanghai, 200030, People’s Republic of China

Fangzhou Shen, Hang Zhang & Zhuo Wang

Key Laboratory of Synthetic Biology, CAS Center for Excellence in Molecular Plant Sciences, Institute of Plant Physiology and Ecology, Shanghai Institutes for Biological Sciences, Chinese Academy of Sciences, Shanghai, 200032, People’s Republic of China

School of Life Sciences and Biotechnology, Shanghai Jiao Tong University, Shanghai, 200240, People’s Republic of China

Luoxi Shi, Hang Zhang, Yangmin Chen & Zhuo Wang

Division of Biostatistics, School of Public Health, University of Minnesota, Minneapolis, 55455, USA

The Key Laboratory of Plant Molecular Physiology, Institute of Botany, Chinese Academy of Sciences, Beijing, 100093, People’s Republic of China