Información

Simulaciones numéricas hacia adelante versus hacia atrás en genética de poblaciones

Simulaciones numéricas hacia adelante versus hacia atrás en genética de poblaciones



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Mi pregunta está muy relacionada con esta publicación.

Hay una serie de plataformas existentes para realizar simulaciones numéricas basadas en individuos en genética de poblaciones. Aquí se puede encontrar una lista casi exhaustiva de dichas plataformas.

Algunos programas (como NEMO o SFS_CODE, por ejemplo) realizan simulaciones hacia adelante, mientras que otros (como SIMCOAL2, por ejemplo) realizan simulaciones hacia atrás (coalescencia).

Pido una comparación general entre esos dos métodos.

  • ¿Es uno más rápido que el otro? ¿Por qué? (Intuitivamente, esperaría que las simulaciones hacia atrás fueran más rápidas).
  • ¿La simulación hacia atrás permite simular la selección, la recombinación, la tasa de mutación específica de género, la demografía compleja, etc.?
  • ¿Por qué / cuándo se usaría un modelo de simulación hacia atrás / adelante en lugar del otro tipo de modelo?

Todas tus intuiciones parecen correctas. La simulación coalescente debería ser más rápida, porque no se hace un seguimiento de todo el historial de la población durante todas las t generaciones como se hace en la simulación directa. Más bien, a medida que trabaja hacia atrás en el tiempo, está rastreando una población cada vez más pequeña. Y con las simulaciones coalescentes probablemente sea muy difícil incorporar la gama completa de procesos evolutivos, mientras que hacerlo es más o menos trivial con las simulaciones avanzadas.

Un artículo de 2008 de Carvajal-Rodríguez revisa algunos de los temas con más detalle que tengo aquí.


William Basener y John Sanford han respondido aquí a mi publicación sobre si R.A. El Teorema fundamental de la selección natural de Fisher es fundamental para trabajar en la genética poblacional teórica de la interacción entre la mutación y la selección natural. (Esta respuesta de Basener y Sanford también se publica aquí).

Habían publicado un artículo en Journal of Mathematical Biology en el que argumentaban que el FTNS era la base de todo el trabajo posterior sobre la genética de poblaciones teóricas de la selección natural, que el FTNS ignoraba las mutaciones y que necesitaba ser corregido. Luego agregaron términos para los efectos de la mutación a una versión limitada de FTNS, que fue publicada por Crow y Kimura (1970). Informaron resultados de simulación numérica utilizando ese modelo, que mostró que la selección natural no puede
evitar que la mayoría de las mutaciones deletéreas se fijen en la población.

Mi respuesta mostró que la teoría matemática básica de la genética poblacional de mutaciones deletéreas no dependía del Teorema Fundamental
of Natural Selection, pero había sido publicado antes, por William Ernest Castle (1903), H.T.J. Norton (1915), R.A. Fisher (1922, 1929), J.B.S. Haldane (1927) y Sewall Wright (1928, 1929). El FTNS fue un resultado interesante, pero no fue en absoluto crítico para el trabajo posterior sobre mutaciones y selección.

En esta réplica, trataré dos cuestiones: (1) ¿Es el FTNS el fundamento del tratamiento matemático de la mutación y la selección natural en las poblaciones, y (2) ¿R.A. Fisher extrajo del FTNS la conclusión de que la selección natural condujo a una aptitud media cada vez mayor. Mostraré que la respuesta a ambos es & # 8220no & # 8221.

Cotizaciones de Basener y Sanford & # 8217s

En su respuesta, Basener y Sanford presentan una gran cantidad de citas de genetistas de poblaciones y biólogos evolutivos, incluido yo mismo. Estas citas se presentan para demostrar la importancia de R.A. Fisher para la biología evolutiva y la importancia de su libro de 1930. Tienen razón sobre ambos.

Pero esas no son las preguntas correctas.

Arlin Stolzfus, en un comentario sobre ese hilo, resumió la situación de manera admirablemente sucinta, diciendo en parte:

La cuestión no es si Fisher fue influyente, o si el libro de 1930 de Fisher fue influyente, sino si FTNS es en realidad algún tipo de fundación. Es decir, ¿varias conclusiones clave del pensamiento evolutivo dependen de FTNS, ya sea directamente o mediante otros desarrollos teóricos que dependen de FTNS?

En lugar de abordar esa pregunta directamente, Basener y Sanford intentan establecer una respuesta positiva mediante citas. Pero las citas no dicen las cosas correctas y no están citando a las personas adecuadas. Casi todas las citas son sobre Fisher o su libro de 1930 o su trabajo de 1920, sin especificar FTNS.

En mi publicación anterior, cité los artículos sustanciales que establecieron la teoría de cómo la selección natural afecta las frecuencias génicas de los alelos mutantes deletéreos.

Comprobemos esto observando la presentación de las matemáticas de la mutación frente a la selección en algunos de los principales textos teóricos sobre genética de poblaciones. He examinado los principales textos de CC Li (1954), Douglas Falconer (1960), JF Crow y M. Kimura (1970), LL Cavalli-Sforza y ​​WF Bodmer (1971) y Warren Ewens (1969, 1981, 2006). . Muchos no hacen citas específicas sobre quién hizo el trabajo fundamental sobre las matemáticas de la mutación y la selección. Aquellos que citan a alguien, citan los trabajos de Haldane (1927 en adelante) y C. H. Danforth (1923). Por supuesto, al ser publicado antes del libro de Fisher de 1930, ninguno de estos artículos citó el Teorema fundamental de la selección natural como base del trabajo teórico sobre la genética de la selección natural.

Basener tiene una respuesta a estas citas. En un comentario (aquí) en la discusión después de su publicación, dice que

Creo que Joe F leyó mal nuestro artículo cuando dicen que argumentamos que el FTNS & # 8220 es la base de toda la teoría posterior en genética de poblaciones & # 8221. Si algo en nuestro periódico parecía decir eso, no fue intencional.

Bueno, está bien, tiene razón en un punto. Decir que & # 8220 es la base de toda la teoría posterior & # 8221 en genética de poblaciones no es lo que hicieron. Lo que Basener y Sanford realmente argumentaron en su artículo fue que el FTNS es la base de toda la teoría posterior. que involucra la selección natural.

¿Cuál es la evidencia de que dijeron eso? ¿Podría ser que esté leyendo mal las declaraciones o que no sean intencionales? Bueno, aquí hay algunas citas de su artículo de Journal of Mathematical Biology:

Su libro, La teoría genética de la selección natural, estableció por primera vez la conexión entre la genética y la selección natural. Dentro de ese libro pionero, Fisher presentó su famoso teorema fundamental de la selección natural.

En el corazón de la concepción de Fisher estaba su famoso teorema fundamental de la selección natural (Teorema de Fisher).

Su teorema fundamental de la selección natural fue un enorme paso adelante, ya que por primera vez vinculó la selección natural con la genética mendeliana, lo que allanó el camino para el desarrollo del campo de la genética de poblaciones.

y que en su libro de 1930

Fisher relacionó conceptualmente la selección natural con la genética mendeliana, lo que no se había hecho hasta ese momento.

¿Fue una mala interpretación para mí interpretarlos como afirmaciones de que la genética de poblaciones teóricas de la selección natural no se había realizado antes del libro de Fisher de 1930? ¿Puede repetirse una afirmación que sea insistentemente & # 8220 involuntaria & # 8221?

Estas declaraciones también fueron interpretadas por
David Coppege, en su sitio Creation Evolution Headlines donde Coppege dice que

Fisher fue el primero en reconciliar el aparente conflicto entre las ideas de Darwin y las observaciones experimentales de Mendel. Fisher logró esto mostrando matemáticamente cómo la selección natural podría mejorar la aptitud mediante la selección de unidades genéticas deseables (alelos beneficiosos) y al mismo tiempo seleccionando contra unidades genéticas indeseables (alelos deletéreos).

Por lo tanto, si leí mal las declaraciones de Basener y Sanford, también lo hizo Coppege.


1. INTRODUCCIÓN

El cáncer es una enfermedad genética causada por mutaciones en genes de susceptibilidad al cáncer, incluidos oncogenes, genes supresores de tumores y genes de inestabilidad genética (ver p. Ej. et al., 2004 para una revisión). Las mutaciones que activan los oncogenes pueden conferir una ventaja selectiva a la célula cuando uno de los dos alelos está mutado, pero normalmente implican cambios de aminoácidos específicos en residuos específicos de la proteína. Las mutaciones que inactivan ambos alelos de un gen supresor de tumores también conducen a beneficios de aptitud para la célula, y tales mutaciones no tienen que ser específicas, ya que muchas mutaciones en un gen pueden alterar su función normal (Forbes et al., 2010). La inestabilidad genética se refiere a una diversidad de cambios en el genoma en los niveles de nucleótidos o cromosómicos. La primera es causada por mutaciones en las vías de reparación del ADN e implica sustituciones, inserciones o deleciones de uno o unos pocos nucleótidos. Esto último incluye ganancias o pérdidas de cromosomas completos, así como inversiones, deleciones, duplicaciones y translocaciones de grandes segmentos cromosómicos. Las mutaciones en los genes de inestabilidad genética pueden provocar un aumento de las tasas de mutación en la célula, lo que da lugar al denominado "fenotipo mutante" (Lengauer et al., 1998). Por ejemplo, las mutaciones de p53 pueden afectar la detección y la respuesta al daño del ADN. Muchos cánceres tienen un fenotipo mutante que resulta de mutaciones en genes implicados en la reparación de errores de apareamiento del ADN.

En la actualidad, se acepta generalmente que el paso que limita la velocidad en el proceso de carcinogénesis es la acumulación de nuevas mutaciones. Tanto las ventajas de aptitud física como el aumento de las tasas de mutación pueden acortar significativamente el tiempo de espera hasta el número requerido de mutaciones. La importancia relativa de la selección seguida de la expansión clonal frente a las tasas de mutación elevadas es algo controvertida. Tomlinson et al. (1996) argumentan, basándose en una simulación por computadora, que las mutaciones ventajosas y la expansión clonal fueron suficientes para iniciar el tumor sin aumentar las tasas de mutación. Sin embargo, si se necesitan más de dos mutaciones en genes supresores de tumores para la carcinogénesis, el aumento de las tasas de mutación parece ser un factor importante.

El número de mutaciones necesarias para la tumorigénesis depende del tipo de cáncer. Armitage y Doll (1954) utilizaron datos de incidencia de cáncer específicos por edad para estimar el número de mutaciones necesarias para desarrollar cáncer de colon en aproximadamente 6. Knudson (1971) dedujo de un análisis de la incidencia de retinoblastoma en niños que el cáncer es causado por mutaciones en los dos alelos de un gen (que luego se identificó como RB1, el primer gen supresor de tumores), uno de los cuales puede estar en la línea germinal y ser heredado. Calabrese et al. (2005) analizaron datos de 1022 cánceres colorrectales de nueve hospitales en Finlandia y estimaron que se requieren de cinco a seis mutaciones oncogénicas para cánceres hereditarios o siete u ocho mutaciones para cánceres esporádicos. En contraste con los primeros estudios que sugerían que un puñado de mutaciones eran suficientes para causar cáncer, los esfuerzos recientes que utilizan tecnologías de secuenciación de próxima generación para identificar mutaciones en genes que codifican proteínas en tipos de tumores comunes han identificado en general muchos más genes (Sjöblom et al., 2006, Madera et al., 2007, Jones et al.De 2008, Parsons et al., 2008). Por ejemplo, Sjöblom et al. (2006) analizaron & gt 13 000 genes que codifican proteínas en tumores de mama y colorrectales, y encontraron que los tumores individuales acumulan un promedio de ∼90 mutaciones. Solo un pequeño subconjunto de esas mutaciones pueden ser "impulsoras", que ofrecen a la célula una ventaja selectiva y son responsables de la carcinogénesis, mientras que las otras son "pasajeros", que no proporcionan beneficios de aptitud física a la célula, sino que hacen autostop hasta la fijación por casualidad. Sjöblom et al. (2006) estimaron que se pueden requerir hasta 14 mutaciones para iniciar el cáncer de colon y hasta 20 pueden estar involucradas en el cáncer de mama (ver Wood et al., 2007 para un análisis actualizado).

Los primeros trabajos de Armitage y Doll (1954) y Knudson (1971) han dado lugar a un gran cuerpo de trabajo teórico, que utiliza modelos de genética de poblaciones para describir la mutación, la deriva y la selección y para estudiar el tiempo de espera hasta la acumulación de metro mutaciones. Yo era un et al. (2004) estudiaron un modelo de dos etapas para una población de células que evolucionaban según el modelo de Moran. Suponiendo que la primera mutación es neutra o perjudicial mientras que la segunda mutación es ventajosa, estudiaron un escenario interesante llamado túnel estocástico, en el que una población fijada para células sin mutación puede alcanzar la fijación para la segunda mutación sin llegar nunca a la fijación por el primera mutación. Schweinsberg (2008) y Durrett et al. (2009) derivaron las distribuciones asintóticas del tiempo de espera hasta metro mutaciones. Debido a la complejidad del problema, asumieron una neutralidad selectiva y una tasa de mutación constante. Se realizaron simulaciones numéricas para confirmar los resultados analíticos, pero solo para poblaciones pequeñas (10 3 ∼ 10 4). Beerenwinkel et al. (2007) estudiaron el tiempo de espera hasta metro mutaciones bajo el modelo de Wright-Fisher con grandes tamaños de población (10 6 ∼ 10 9). Con la simulación numérica, pudieron mostrar cómo el tamaño variable de la población, la tasa de mutación y la selección afectan el tiempo de espera.

Como lo señaló Beerenwinkel et al. (2007), el modelo de Moran es más natural que el modelo de Wright-Fisher para describir la evolución de las células somáticas. Sin embargo, la simulación con el modelo de Moran es cara, incluso más cara que con el modelo de Wright-Fisher. Los grandes tamaños de población y las pequeñas tasas de mutación significan que hay que simular muchas transiciones, que cambian la composición de la población solo ligeramente. En este artículo, desarrollamos un algoritmo aproximado para simular el tiempo de espera hasta metro mutaciones bajo el modelo de Moran. Exploramos la similitud del modelo de iniciación del cáncer con un sistema de reacción química y desarrollamos algoritmos de simulación que se han estudiado en ese contexto.

El proceso evolutivo de mutación, deriva y selección bajo el modelo de Moran se describe mediante una cadena de Markov de velocidad variable, al igual que un sistema de reacción química. El proceso se puede simular utilizando algoritmos estándar generando tiempos de espera exponenciales hasta el próximo evento y luego decidiendo qué evento ha sucedido. Este es el llamado algoritmo de Gillespie (Gillespie, 1977, 2007). Sin embargo, con un gran tamaño de población, la simulación con este algoritmo exacto es prohibitivamente lenta. Se propuso el algoritmo de salto τ (Gillespie, 2001 Li, 2007) para acelerar la simulación saltando sobre un intervalo de tiempo τ en el que se espera que los cambios en el estado y las velocidades de la cadena sean pequeños. Sin embargo, esta aproximación de grano grueso no funciona bien para nuestro problema, debido a la existencia de tipos de células cuyos tamaños de población pueden ser pequeños.

Aquí desarrollamos un algoritmo híbrido que puede simular de manera eficiente los procesos evolutivos de grandes poblaciones. Usamos el algoritmo exacto para simular transiciones que involucran poblaciones pequeñas, que pueden introducir cambios sustanciales en las tasas, y un algoritmo de salto τ de grano grueso para simular transiciones dentro de cada población grande, donde es poco probable que las transiciones causen grandes cambios en el estado y la tarifas de eventos. Probamos nuestro nuevo algoritmo híbrido contra la simulación exacta en poblaciones pequeñas y contra resultados asintóticos en poblaciones grandes. Los resultados sugieren que el algoritmo híbrido es confiable y computacionalmente eficiente. El algoritmo de simulación rápida puede ser útil para estudiar modelos de carcinogénesis realistas que permiten que diferentes tipos de células tengan diferentes finuras y diferentes tasas de mutación.


Modelado y simulación de sistemas de regulación genética: revisión de la literatura

Para comprender el funcionamiento de los organismos a nivel molecular, necesitamos saber qué genes se expresan, cuándo y dónde en el organismo, y en qué medida. La regulación de la expresión génica se logra mediante sistemas reguladores genéticos estructurados por redes de interacciones entre ADN, ARN, proteínas y moléculas pequeñas. Como la mayoría de las redes de regulación genética de interés involucran muchos componentes conectados a través de circuitos de retroalimentación positiva y negativa entrelazados, es difícil obtener una comprensión intuitiva de su dinámica. Como consecuencia, serán indispensables métodos formales y herramientas informáticas para el modelado y simulación de redes reguladoras genéticas. Este artículo revisa los formalismos que se han empleado en biología matemática y bioinformática para describir sistemas reguladores genéticos, en particular gráficos dirigidos, redes bayesianas, redes booleanas y sus generalizaciones, ecuaciones diferenciales ordinarias y parciales, ecuaciones diferenciales cualitativas, ecuaciones estocásticas y basadas en reglas. formalismos. Además, el artículo analiza cómo se han utilizado estos formalismos en la simulación del comportamiento de los sistemas reguladores reales.


Conclusiones

Los neandertales son autoapomórficos en términos craneales, incluidos los tejidos duros nasales (7), aunque esta condición, junto con la estocasticidad que define la divergencia MH-neandertal (4) (Tabla 1), no impidió que la mucosa nasal reconstruida se desempeñara bien en condiciones simuladas de frío y seco. En consecuencia, la estabilización de la selección en todo el complejo craneofacial puede verse como una limitación para un cambio nasal más rápido durante la evolución de nuestro clado. La excepción a este patrón parece estar en la forma nasal de los grupos periárticos que parecen lograr ambas condiciones: la nariz NEA se desempeña mejor en climas fríos y secos, y la eliminación de las poblaciones de cara aplanada (Inuit) de los análisis evolutivos a su vez. Patrones de covarianza compatibles con la evolución estocástica. En otras palabras, una actuación nasal adecuada para vivir en ambientes fríos y secos puede verse como un caso de adaptación convergente que involucra tanto a las poblaciones del Ártico MH como a los neandertales. Esto refuerza la noción de que el rostro humano es un fenotipo complejo, donde los patrones de integración y modularidad operan en diferentes capas del mapa genotipo-fenotipo (33, 34), incluida la variación genética, de desarrollo y de plasticidad fenotípica que impulsa la evolución y la adaptación a entornos nuevos. .


Simulaciones numéricas hacia adelante y hacia atrás en genética de poblaciones - Biología

Información del papel

Información de la revista

Revista Estadounidense de Matemáticas y Estadística

p-ISSN: 2162-948X e-ISSN: 2162-8475

Modelización del efecto de la detección y el tratamiento sobre la transmisión de la infección por VIH / SIDA en una población

Ratera Safiel 1 , Estomih S. Massawe 1 , Daniel Oluwole Makinde 2

1 Departamento de Matemáticas, Universidad de Dar es Salaam, P. O. Box 35062, Dar es Salaam, Tanzania

2 Instituto de Investigación Avanzada en Modelado y Computación Matemáticos, Universidad Tecnológica de Cape-Peninsula, Apartado Postal 1906, Bellville 7535, Sudáfrica

Correspondencia a: Estomih S. Massawe, Departamento de Matemáticas, Universidad de Dar es Salaam, P. O. Box 35062, Dar es Salaam, Tanzania.

Correo electrónico:

Copyright © 2012 Publicaciones científicas y académicas. Reservados todos los derechos.

Este artículo examina el efecto de la detección y el tratamiento sobre la transmisión de la infección por VIH / SIDA en una población. Se propone y analiza cualitativamente un modelo matemático no lineal para el problema utilizando la teoría de estabilidad de las ecuaciones diferenciales. El número de reproducción efectiva del sistema de modelo normalizado (3) se obtuvo utilizando el método del operador de próxima generación. Los resultados muestran que el equilibrio libre de enfermedad es localmente estable mediante el uso de los criterios de Routh Hurwitz en el parámetro umbral menor que la unidad e inestable en el parámetro umbral mayor que la unidad. Globalmente, el equilibrio libre de enfermedad no es estable debido a la existencia de una bifurcación hacia adelante en el parámetro umbral igual a la unidad. Usando el método de Lyapunov, el equilibrio endémico es globalmente estable bajo ciertas condiciones. Sin embargo, el análisis muestra que el cribado de infecciosos del VIH que no son conscientes y el tratamiento de los infecciosos por VIH detectados tienen el efecto de reducir la transmisión de la enfermedad. La simulación numérica del modelo se implementa para investigar la sensibilidad de ciertos parámetros clave en el cribado voluntario y el tratamiento de los infecciosos cribados y las víctimas del SIDA en toda regla.

Palabras clave: VIH / SIDA, detección del VIH, tratamiento del VIH con ARV, estabilidad del equilibrio, número de reproducción, índice de sensibilidad


Materiales y métodos

Tasas de medición de reacción directa: ATP + AMP → 2ADP

Las tasas de producción de ADP para mutantes de AK se midieron utilizando un ensayo acoplado de punto final (Saint Girons et al, 1987 Glaser et al, 1992 Counago et al, 2008). La mezcla de ensayo contenía tampón (tampón fosfato 25 mM pH 7,2, MgCl 5 mM2, KCl 65 mM), AMP 1,4 mM y diversas concentraciones de ATP (5, 10, 25, 50, 100, 250, 500 y 1000 μM). La reacción se inició mediante la adición de AK hasta una concentración final de 5 nM. El volumen de reacción final fue de 1,0 ml en un tubo de polietileno. Las mezclas de reacción se incubaron en un baño de agua a 55, 60, 62,5, 65, 67,5 y 70ºC durante 5 min antes de la adición de AK. Las reacciones se apagaron 20, 40 y 60 s después del inicio mediante la adición rápida de 300 μl de la mezcla a 100 μl de 1,0 mM de P 1, P 5 -di (adenosina-5 ') pentafosfato (Ap5A).

Las muestras se mantuvieron en hielo hasta que se pudo medir la cantidad de ADP. El ADP se cuantificó mediante un ensayo secundario en el que se añadieron cinco unidades de piruvato quinasa, dinucleótido de β-nicotinamida adenina (NADH) 0,3 mM y piruvato de fosfoenol (PEP) 0,5 mM a la reacción inactivada. Se midió la absorbancia a 340 nm antes y después de la adición de cinco unidades de lactato deshidrogenasa. La conversión de NADH en NAD + se usó como una medida del ADP producido por AK a diversas temperaturas, concentraciones de sustrato y duraciones de reacción. La pendiente de [ADP] frente al tiempo para estos tres puntos de tiempo se utilizó como la tasa de formación de producto, v, en el punto medio del tiempo. Todas las mediciones se realizaron por triplicado.

Parcelas de v versus [ATP] se ajustaron a la Ecuación (1) usando Prism (GraphPad, La Jolla, CA) con t= 40 s para el término exponencial que describe la desnaturalización irreversible. Valores calculados para KUNF a cada temperatura respectiva para cada mutante se utilizaron como constantes en el ajuste y kirrev se compartió en todas las temperaturas para cada mutante individual para restringir los ajustes. AMP, ADP, ATP, Ap5Se adquirieron A, NADH, PEP, piruvato quinasa y lactato deshidrogenasa de Sigma-Aldrich (St Louis, MO).

Calorimetría diferencial de barrido

Las mediciones se realizaron utilizando un microcalorímetro de barrido diferencial VP-DSC (MicroCal, LLC, Northampton, MA) a una velocidad de barrido de 90 ° C h –1. Los datos podrían modelarse bien como una aparente transición de dos estados en las condiciones del experimento de DSC. Para probar esta aproximación, se realizó un estudio de la concentración y las propiedades dependientes de la velocidad de barrido del tipo salvaje y todos los mutantes (información complementaria). La concentración de proteína fue 40 μM en HEPES 10 mM pH 7.0. Antes de las mediciones, la muestra y el tampón se desgasificaron durante 10 min a temperatura ambiente. Se mantuvo una presión de 2 atm en las celdas durante los ciclos de calentamiento para evitar la desgasificación. De cada exploración se restó una exploración de fondo recogida con el tampón en ambas células. Los datos se analizaron con el software Origin 7.0 (MicroCal) para obtener la temperatura de transición (Tmetro), la entalpía calorimétrica del despliegue térmico (ΔH), la capacidad calorífica cambia en el TmetroCpag) y el cambio de energía libre de Gibbs (ΔGRAMOUNF) a cada temperatura T.

Simulación numérica con MATLAB

Se utilizó la integración numérica para calcular el tamaño de la población en el momento t+1 según el tamaño de la población en ese momento t, la tasa de mutación y una tasa de crecimiento (0⩽r⩽1) especificado por la actividad de la enzima AK calculada a partir de una función continua para la actividad, Ecuación (2). La solución numérica requiere entradas de las frecuencias iniciales de cada alelo y la velocidad a la que se forman los alelos de dos sustituciones a partir de la cepa progenitora (AKBSUB Q199R) (Ecuación (6)). Se utilizó una tasa de mutación de 5E-10 como tasa de siembra para cada doble mutación que implica una transición de base simple, con la excepción de AKBSUB Mutación Q199R / Q16L, que implica una transversión y se le asignó una tasa de una décima parte de este valor. Las tasas de mutación se mantuvieron constantes durante el transcurso de la simulación. La actividad enzimática se modeló entre 55 y 70 ° C para cada enzima, y ​​esta actividad se convirtió en una tasa de crecimiento relativa como se describe en la Ecuación (7). Si la actividad fue superior o igual al umbral, la tasa de crecimiento fue 1. Sin embargo, si la actividad cayó por debajo del umbral, la tasa de crecimiento fue igual a la fracción de la actividad dividida por el valor umbral. La solución numérica se calculó para 1500 generaciones, con cada 100 generaciones correspondientes a un intervalo de temperatura de 1 ° C en el experimento.

Determinación de tasas de crecimiento dependientes de la temperatura.

G. stearothermophilus cepa NUB3621-R y cepas recombinantes que expresan B. subtilis adk con Q199R o Q199R / Q16L se sembraron en LB modificado (mLB) con rifampicina (5 μg ml -1) y cloranfenicol (7 μg ml -1) durante la noche a 55 ° C. Se utilizaron colonias individuales para inocular 10 ml de mLB con rifampicina a 55 ° C durante aproximadamente 3 h con agitación a 225 r.p.m. (Abdominales600≈0,5). Se utilizó un total de 50 μl del cultivo de 3 h para inocular 50 ml de mLB y se incubó a la temperatura deseada. El crecimiento se controló como cambios en la densidad óptica. Las curvas de crecimiento se determinaron ajustando una función exponencial. Todos los medios LB se modificaron con la adición de nitrilotriacetato 1,05 mM, MgSO 0,59 mM4, CaCl 0,91 mM2y FeSO 0,04 mM4.


Resultados y discusión

Simulación del comportamiento del operón tet

El primer conjunto de simulaciones explora el estado estable del sistema. Según las observaciones experimentales, en estado estacionario y en ausencia de Tc, no hay TetA intracelular y la cantidad de TetR intracelular es pequeña. Este es un atributo conveniente del tet operón. Las pocas proteínas TetR requieren sólo un pequeño número de moléculas de Tc para inducir la expresión génica [56]. Además, la TetA no debería producirse en ausencia de Tc porque grandes cantidades de TetA pueden provocar la muerte celular [57]. TetA es una proteína de membrana que bombea Tc fuera de la célula mientras bombea protones desde el periplasma hacia el citoplasma. Si TetA está presente, incluso en ausencia de Tc, el transporte de protones a través de la membrana puede provocar el colapso del potencial de membrana y la muerte celular.

Para investigar el estado estable del sistema, realizamos un conjunto de simulaciones en las que ni TetA ni TetR existen inicialmente en la celda. Por lo tanto, se permite que tenga lugar la expresión génica produciendo TetR que inhibe la expresión génica, llevando así el sistema al estado estable (a nivel de población). Los resultados tanto para el comportamiento promedio del sistema como para el comportamiento de una sola célula se muestran en la Figura 2. Con respecto al comportamiento promedio de TetR y TetR2 (Figuras 2a, 2c), alcanzan un máximo de aproximadamente 5 y 2 moléculas por célula. respectivamente y aproximadamente después de 3 horas alcanzan el estado estable. En estado estacionario, hay aproximadamente 2 moléculas de TetR y 1 molécula de TetR2 en la célula. Para TetA (Figura 2e), observamos una producción inicial promedio de 113 moléculas, mientras que después de 4 horas prácticamente no queda TetA en ninguna célula debido a la dilución. El pulso inicial es el resultado de ninguna represión inicial por parte de TetR.

Cantidades de proteína TetR, TetR2 y TetA en estado estacionario. Promedio (Figuras 2a, 2c, 2e) y unicelular (Figuras 2b, 2d, 2f) de moléculas de TetR, TetR2 y TetA en estado estacionario. Inicialmente, se permite que tenga lugar la expresión génica. Como resultado, aumenta la cantidad de proteínas en la célula. Una vez que se produce TetR, reprime la expresión génica, lo que permite que el sistema alcance un estado estable a nivel de población.

Es importante notar que existe una diferencia entre la cantidad promedio de TetA y TetR. Esto se debe a que el promotor de la teta gen es aproximadamente nueve veces más fuerte que el combinado tetR promotores [19]. Esto implica que el teta la expresión génica es muy alta en comparación con la tetR gen cuando ambos genes se expresan. Además, debe tenerse en cuenta que algunas de las proteínas TetR están unidas a nsDNA así como a Tc, lo que reduce la cantidad de TetR libre.

Curiosamente, al observar el comportamiento de una sola célula (Figuras 2b, 2d) observamos grandes fluctuaciones en el número de moléculas TetR y TetR2. Según las Figuras 2b y 2d, las fluctuaciones de TetR y TetR2 alcanzan un máximo de 22 y 15 moléculas respectivamente. En estado estacionario, la cantidad máxima de TetR y TetR2 observada en las 1000 células es de 31 y 38 moléculas respectivamente (datos no mostrados). Cabe mencionar que aunque el número promedio de TetR y TetR2 es pequeño (2 y 1 respectivamente), existen células que incorporan moléculas de TetR2 cuya cantidad fluctúa alrededor de valores altos. Sin embargo, estas células son solo unas pocas y, por lo tanto, la cantidad promedio de TetR y TetR2 se mantiene pequeña. Aparentemente, en este caso, el comportamiento promedio de la celda no es representativo del comportamiento de una sola celda y esto requiere el uso de algoritmos estocásticos. Si hubiéramos utilizado un enfoque determinista, no se podrían establecer las fluctuaciones en el comportamiento de TetR2.

En cuanto a la TetA, en el caso de una sola célula (Figura 2f), observamos que se alcanza un máximo de 239 moléculas. Posteriormente, el número de moléculas de TetA se vuelve cero después de 3,5 horas. En estado estacionario, el número máximo de moléculas de TetA observadas en las 1000 células es 348 (datos no mostrados). Debe subrayarse que las células con altas cantidades de TetA intracelular en estado estacionario no pueden sobrevivir debido al colapso de la membrana.

Es importante destacar que estos resultados concuerdan con las observaciones experimentales, en el sentido de que no solo el número de moléculas de TetA intracelulares es cero en estado estacionario [16, 57], sino también de que solo hay una pequeña cantidad de TetR libre [56]. Por tanto, hemos establecido las condiciones de estado estacionario de TetR y TetA en la celda.

Nuestro siguiente paso es probar el comportamiento del sistema cuando se administra un pulso de Tc a la célula. Se realizó un conjunto de simulaciones variando el número de moléculas de Tc administradas al E. coli células. Más específicamente, comenzamos con el sistema en estado estacionario y después de 5 horas, se administra un pulso de una amplia gama de moléculas de Tc (10,20,50,100,200,400,600,800,1,000) a cada célula. La administración de diferentes cantidades de Tc da como resultado la producción de diferentes cantidades de TetA. Los resultados se muestran en la Figura 3.

Número medio de moléculas de TetA para diferentes números de moléculas de Tc administradas. Inicialmente, no hay TetA en la célula porque no hay Tc intracelular. En un tiempo igual a 5 horas, se administra un pulso de diferentes cantidades de Tc a cada célula induciendo así la expresión génica. Entonces, aumenta la cantidad de TetA intracelular. El aumento de la cantidad de Tc administrado da como resultado una producción más rápida de una mayor concentración de TetA.

Centrándonos en la cantidad de TetA a las 5 horas, notamos que cuanto mayor es la cantidad de Tc administrada, más rápida es la respuesta del sistema. Esto es de acuerdo con el hecho de que el tet El operón es un sistema bien regulado que responde rápidamente a la adición de Tc. Además, observamos una correlación casi lineal entre la Tc administrada y la cantidad de TetA intracelular. Antes se había observado una dependencia aproximadamente lineal entre TetA y la cantidad de Tc administrada no tóxica [58]. Dado que en nuestro caso la cantidad de Tc administrada no es tóxica, este resultado está de acuerdo con los resultados de Korpela et al. It is worth stressing that after the removal of Tc from the cell, the system returns again to its original steady state. The time that the system needs to reach the steady state depends on the number of TetA molecules. The higher the number of TetA molecules, the longer it takes for the system to reach the basal state.

Another important fact is that even with the administration of a small Tc amount (10 molecules), the gene expression is turned on automatically in order for the Tc to be removed before causing cell death. This is in line with experimental observations which suggests that induction takes place even with very low, non-toxic Tc concentrations [14, 16, 18, 31, 59].

In addition to investigating TetA levels in response to Tc treatment, we also investigate TetR levels at these different Tc concentrations. The average number of intracellular free (unbound) TetR2 molecules practically remains constant regardless of the number of administered Tc molecules. This is an interesting result, especially when contrasted to the TetA behavior. This trend is shown in Figure 4.

Average number of TetR2 molecules for different number of administered Tc molecules. At the beginning, there is about 1 TetR2 molecule in the cell. At time equal to 5 hours, a pulse of various Tc amounts is administered to each cell and thus gene expression is induced. Then, the amount of the free (unbound) TetR2 decreases, because these proteins are occupied by Tc, and thereafter increases upon expression of tetR. Increasing amount of administered Tc results in higher decrease in TetR2 amount and longer required time for going back to steady state.

As illustrated in Figure 4, the average number of TetR2 molecules decreases slightly when Tc is administered to the cells. This decrease is caused by the binding of Tc to the free TetR2 molecules. However, shortly after the decrease on the TetR2 amount, an increase to the TetR2 amount is observed which comes from the induction of the system which in turn causes the production of many TetR2 molecules. After this increase in the TetR2 amount, the system finally reverts to its steady state. Figure 4 indicates that the higher the amount of administered Tc, the larger the decrease of the TetR2 amount and the longer the time that the system needs to go back to its steady state.

The dynamics of the intracellular Tc when different Tc amounts are administered to the cell are also explored. Figure 5 shows the average intracellular Tc amount for the 9 different cases. As expected, the average number of intracellular Tc molecules increases with the number of administered Tc molecules.

Average number of intracellular Tc molecules for different number of administered Tc molecules. Originally, there is no intracellular Tc. At time equal to 5 hours, a pulse of several Tc amounts is administered to each cell thereby inducing gene expression. Then, the amount of free (unbound) intracellular Tc increases and quickly decreases since it binds to TetR2 and is removed by TetA.

In Figure 6 we show the maximum value of the mean and the variation (minimal and maximal values among the population) of the number of TetA (Figure 6a,) and intracellular Tc (Figure 6b) molecules for different amounts of administered Tc. As evident in Figure 6a, the maximum TetA amount produced by each cell upon Tc administration varies significantly. It is important to notice that even though the maximum average value of the TetA amount in the cell is non-zero for all the 9 cases, in the first 4 cases (10,20,50,100 administered Tc molecules) there are cells that produce no TetA protein upon Tc administration. These cells would probably not survive from the Tc administration since expression of the resistance protein was not activated and consequently Tc was not removed.

Maximum average value and variation of the number of intracellular Tc and TetA molecules for different number of administered Tc molecules. Maximum average value (black color) and variation (minimal and maximal values among the population) (red color) of the number of TetA (Figure 6a) and intracellular Tc (Figure 6b) molecules for different number of administered Tc molecules. The variation of both the number of TetA and intracellular Tc molecules is high.

Analyzing Figure 6b, the variation of the number of intracellular Tc molecules seems to be smaller than the variation of the TetA molecules. Furthermore, we note that the higher the number of administered Tc molecules, the higher the variation of the intracellular Tc molecules. It is important to remark that cells whose intracellular Tc amounts lie in the higher regions is less probable to survive while cells with small intracellular Tc amounts is most probable to circumvent the attack of Tc to their transcriptional machinery.

In experimental conditions, E. coli usually experience prolonged exposure to Tc. Thus, motivated by the need to understand the behavior of the tet operon when in a solution with the antibiotic Tc, we performed a set of simulations where Tc is constantly administered to the cells. The system is initially at steady state. Then, after 5 hours, 500 Tc molecules are administered continuously. This is tantamount to having a constant concentration of external Tc equal to 8.3·10 -11 METRO under the following assumptions: 1) the volume of the cells is negligible compared to the volume of the solution, 2) the total Tc amount is ultimately uptaken by the cells, 3) the number of cells in the solution is 10 8 /mL. The average behavior of the system (Figures 7a, 7c, 7e) as well as the behavior of a single cell (Figures 7b, 7d, 7f) are illustrated in Figure 7.

Amounts of Tc, TetR2 and TetA when 500 Tc molecules are continuously administered. Average (Figures 7a, 7c, 7e) and single cell (Figures 7b, 7d, 7f) number of molecules of intracellular Tc, TetR2, and TetA when 500 Tc molecules are continuously administered to each cell. Initially, the system is at steady state at the population level. At time equal to 5 hours, 500 Tc molecules are continuously administered to each cell. At steady state, the intracellular TetA amount is high whereas the intracellular TetR2 and Tc amounts are small.

Figure 7a shows that when Tc is added to the media, the average intracellular Tc amount reaches a maximum of 114 molecules within the first hour. Subsequently, the system reaches a steady state, at the population level, where there are 9 intracellular Tc molecules. Concerning the average amount of TetR2 (Figure 7c), it decreases almost to the zero value when Tc is administered to the cells. This decrease caused by the binding of Tc to TetR2 which leads to occupation of the free TetR2 molecules. After the induction of the system and consequently the expression of the tetR gene, more TetR2 molecules are produced and eventually the average TetR2 amount goes back to its steady state. The average number of TetA molecules (Figure 7e) increases dramatically reaching a maximum of 540 molecules. Afterwards, the system reaches a steady state at the population level where 540 TetA molecules exist in the cell.

Notably, even with a constant high amount of external Tc, the tet operon does not allow high levels of internal Tc. This is attributed to the production of high TetA amounts which remove Tc from the cell, thus boosting the performance of the tet operón. It should be kept in mind that the intracellular Tc amount is also decreased because of the degradation and the cell division in which the number of Tc molecules is halved every 30 ± 4 minutes. Overall, with constant Tc administration, TetA expression reaches steady state at the population level. At this state, the TetA levels become constant and the intracellular Tc levels are significantly lower than the extracellular ones.

As far as the single cell behavior is concerned, it appears to be similar to the average behavior. Regarding the Tc amount in the single cell (Figure 7b), again after the Tc administration we observe a peak value of approximately 117 molecules. Subsequently, the Tc amount decreases and finally fluctuates around the value of about 9 molecules. Overall, the Tc amount at steady state varies from 0 to 36 molecules among the cells (data not shown). As observed previously (Figure 2), the TetR2 amount of the single cells appears to fluctuate. This amount among the 1,000 cells lies in the area of 0 and 40 molecules (data not shown). Similarly to the average behavior, the single cell behavior with respect to TetA molecules shows an initial increase after Tc administration. This increase results in fluctuations around the value of 500 TetA molecules. At steady state, the TetA amount observed within the single cells varies between 197 and 1,399 molecules (data not shown).

As discussed previously, only a small portion (approximately 5%) of the total mRNA from the tetR gene is transcribed from the tetPR 1promoter [40]. The remaining originates from the tetPR 2promotor. In order to explore the functionality of the tetPR 1promoter, we performed a set of simulations in which no tetPR 1exists in the system. Initially, the system is at steady state and consequently there is neither Tc nor TetA in the cell. At time equal to 5 hours, 400 Tc molecules are administered to the wild type cells as well as to the cells which lack the promoter tetPR 1. The trends of the two systems are provided in Figure 8.

Comparison of the wild type tet operon with the operon lacking the promoter tetP R1. Average number of Tc (Figure 8a), TetR (Figure 8b), TetR2 (Figure 8c) and TetA (Figure 8d) molecules of the wild type (wt) tet operon as well as of the tet operon which lacks the promoter tetPR 1. At time of 5 hours, a pulse of 400 Tc molecules is administered to each cell. The behavior of the system appears to be the same with and without the promoter tetPR 1.

Importantly, the results of the simulation of the wild type system are the same with the results of the system which lacks the promoter tetPR 1. The number of the intracellular Tc molecules is the same (Figure 8a) in the two systems. In addition, the lack of tetPR 1desde el tet operon does not appear to affect the amount of the regulatory molecules, TetR, TetR2 and TetA (Figures 8b, 8c, 8d). We further observed that the total behavior of the system is retained even when the tet operon includes no tetPR 1promotor (datos no mostrados). This indicates that this promoter is not essential in E. coli. It supports the existing hypothesis that this promoter is involved in the tet operon because of its functional importance in other bacteria which carry the tet operon [40]. This promoter could also have previously played a role in E. coli, but it may remain only as a genetic artifact.

Análisis de sensibilidad

los tet operon is an excellent biological switch [14]. The key features that define its outstanding functionality include high TetA expression in the presence of Tc combined with no appreciable expression leakiness in the absence of Tc. These salient characteristics are attributed to the high affinity of Tc for the repressor TetR2 and the high affinity of TetR2 for the operator sites, tetO1 y tetO2. Even though these parameters and the associated processes are not rate limiting steps, they do contribute to the fine tuning of this biological switch.

In order to explore the importance of these features, we performed a sensitivity analysis of our model to examine how the different values of the specific tet operon parameters influence its behavior. In this set of simulations, a pulse of a wide range (20,50,100,200,400,600, 800,1,000) of Tc molecules is administered to each E. coli celda. With this range, we can investigate the sensitivity of the tet operon even when minimal amounts of Tc are administered. We can also understand the changes in the behavior of this operon upon increasing the amount of administered Tc.

Affinity of Tc for TetR2

First, the importance of Tc's affinity for TetR2 is investigated. As discussed previously, once Tc diffuses into the cell, it binds to TetR2 with high binding strength (K eq ≃ 3·10 9 METRO -1 ) [20]. This causes rapid induction of the system, and consequently the expression of tetR y tetA. In order to check how this binding strength influences the total behavior of the system, a set of simulations was conducted in which the affinity of Tc for TetR and TetR2 spans two orders of magnitude lower and higher than the nominal value. This could be achieved experimentally by making amino acid substitutions or deletions on TetR2 [60], thereby affecting the affinity of Tc for TetR2. In our analysis, this is realized by changing the kinetic constants that correspond to this affinity (k10, k12, k14, k16, k20, k22) 10 and 100 times.

Results of the simulations are depicted in Figure 9. They illustrate the maximum value of the average intracellular TetA (Figure 9a) and Tc (Figure 9b) amount when a pulse of various Tc amounts is administered to each cell. The various TetA levels are the result of the range of administered Tc molecules and of different Tc affinities for TetR2.

Impact of changing the affinity of Tc for TetR2 on Tc and TetA amounts. Average maximum number of TetA (Figure 9a) and Tc (Figure 9b) molecules for a range of administered Tc in the wild type (wt) system, as well as in systems where the affinity of Tc for TetR2 is 10 and 100 times lower and 10 and 100 times higher than the nominal value. Decreasing affinity of Tc for TetR2 results in low TetA and high Tc amounts present in the cell.

As depicted in Figure 9, the system is sensitive to changes in the affinity of Tc for TetR2. The average maximum number of TetA molecules that are produced in the presence of Tc increases as the wild type affinity of Tc for TetR2 increases (Figure 9a). As expected, this has an effect on the maximum number of intracellular Tc molecules. This effect is shown in Figure 6b where the average maximum number of intracellular Tc molecules decreases as the wild type affinity of Tc for TetR2 increases. This can be ascribed to the fact that when the affinity of Tc for TetR2 increases, the formation rate of the complex TetR2:Tc2 increases, thereby accelerating gene induction. Therefore, more TetA molecules are generated. As a consequence, Tc is excluded faster from the cell, making intracellular Tc level lower. On the other hand, a decrease in the wild type affinity of Tc for TetR2 leads to a decrease in the intracellular TetA amount (Figure 9a). This decrease in turn elicits a drastic increase on the intracellular Tc amounts (Figure 9b).

It should be kept in mind that the lower the intracellular Tc amount, the higher the probability for the cell to survive. This implies that an increase in the affinity of Tc for TetR2, could help the E. coli para sobrevivir. On the other hand, a decrease in the affinity of Tc for TetR2 could lead to the faster death of E. coli.

Figure 9 indicates that the larger the amount of administered Tc, the larger the differences in the amount of intracellular Tc between the 5 cases (cases with different affinities). Thus, if large Tc amounts are administered, then such changes in the affinity of Tc for TetR2 will cause significantly large differences in the intracellular Tc amount among these 5 cases. Again, this implies that a decrease in the affinity of Tc for TetR2 could result in high intracellular Tc amounts causing cell death.

Another interesting observation is that a large decrease (wt × 0.01) in the affinity of Tc for TetR2, makes the tet operon less sensitive to external Tc. In this case, higher Tc amounts must be administered to induce gene expression. In particular, the number of administered Tc molecules must be 200 or higher before expression of tetA is turned on (Figure 9a). This is also evident when the affinity is 10 times smaller than the wild type. Then, more than 20 Tc molecules must be administered for tetA expression to take place. On the other hand, in the other three cases (wt, wt × 10, wt × 100), gene expression is activated even with the administration of only 20 Tc molecules. This phenomenon is observed because the higher the affinity of Tc for TetR2, the easier and faster the binding of Tc to TetR2, and consequently the gene induction.

For small numbers of administered Tc molecules (20,50,100 molecules), the difference between the 5 cases is not large concerning the maximum average intracellular Tc amount (Figure 9b). However, regarding TetA (Figure 9a), the difference between the 5 cases is large even for small numbers of administered Tc molecules. The high TetA amounts combined with low intracellular Tc amounts could have harmful effects for the cell since high excess of TetA in the cell could lead to cell membrane collapse. Furthermore, when the affinity is larger than the nominal value (wt × 10, wt × 100), little difference in the intracellular Tc amount is noticed. On the other hand, a substantial difference in the intracellular Tc amount is observed in the cases where the affinity is smaller than the nominal value (wt × 0.1, wt × 0.01). This implies that the system is more sensitive to a decrease in the affinity of Tc for TetR2 than to an increase. This probably stems from the fact that the affinity of Tc for TetR2 is already high and not rate limiting, thus higher values do not cause dramatic changes. Furthermore, this indicates that the wild type network affinity is optimal since it is as high as possible to reduce Tc while not increasing TetA significantly.

Lastly, it is worth stressing that our changes in the affinity of Tc for TetR and TetR2 do not affect the average number of TetR and TetR2 molecules when Tc is administered (data not shown). The intracellular amount of these two molecules remains practically the same even upon applying the aforementioned changes.

Affinity of TetR2 for the operator sites

Here, we explore the significance of the high binding strength (K eq ≃ 10 12 METRO -1 ) [31] of TetR2 to the operator sites, tetO1 y tetO2. This feature enables the repressor to bind quickly and tightly to the operator sites in the absence of Tc, making this operon a thoroughly tuned biological switch. The importance of this feature is investigated through a set of simulations in which the binding strength of the repressor for the operators is 10, 50 and 100 times lower than the wild type value. This could be experimentally achieved by either introducing amino acid changes on the TetR protein or mutating the operator sites [61]. In our simulations, this is attained by decreasing all the corresponding kinetic parameters (k3, k5, k19, k25, k64, k65, k66, k67) 10, 50 and 100 times. We decrease the rate that TetR2 binds to the operators when it is either free (k3, k5, k64, k65) or bound on Tc (k19, k25, k66, k67), causing a decrease to the binding strength. In contrast to the previous case, in which the affinity of Tc for the repressor is investigated, we only consider a decrease and not an increase to the binding affinity. The binding affinity value is already very high and a possible increase would not be experimentally meaningful due to diffusion limitations. The results of the simulations are shown in Figure 10 and they represent the average maximum TetA and Tc amounts in the cells.

Impact of changing the affinity of TetR2 for the operators on Tc and TetA amounts. Average maximum number of TetA (Figure 10a) and Tc (Figure 10b) molecules for a range of administered Tc in the wild type (wt) system, as well as in systems where the affinity of TetR2 for the operators is 10, 50 and 100 times lower than the nominal value. Decreased affinity of TetR2 for the operator sites leads to high TetA and low Tc amounts in the cell.

According to the results, the fidelity of the tet operon appears to be susceptible to changes in the affinity of TetR2 for the operators. A decrease in the affinity of TetR2 for the operators results in an increase in the amount of generated TetA (Figure 10a). Thus, lower affinities give rise to higher TetA production. Higher TetA amount leads to faster Tc removal from the cell thereby leading to lower intracellular Tc amounts (Figure 10b). The decreased amount of intracellular Tc is beneficial for the cell. However, the decrease in the affinity of TetR2 for the operators results also in an increase in the TetA, TetR and TetR2 amount at steady state. Esto hace que el tet operon to loose its unique function. In other words, the trade off in having Tc removed fast from the cell is the high intracellular TetA, TetR and TetR2 amounts at steady state.

As remarked previously, tet operon is a unique biological switch [14]. This is attributed to the optimal design of high affinity levels which accommodates 1) small number of TetR2 molecules at steady state, which allows gene induction to occur with minimal Tc amounts, and 2) tight repression of tetA gene, which does not allow the production of TetA in the absence of Tc. Therefore, at steady state, the intracellular TetR and TetR2 amount is small (with average values 2 and 1 molecules respectively) and the TetA amount is zero. However, here we observe that when the affinity of TetR2 for the operator sites decreases, the amount of TetA, TetR and TetR2 increases. In particular, when the affinity is 10, 50 and 100 times lower than the wild type value, the number of intracellular TetA molecules at steady state is 3, 7, and 10 respectively (data not shown). The lower the affinity of TetR2 for the operator sites, the higher the TetA amount at steady state. Thus, the decrease in the affinity of TetR2 for the operators results in non-zero TetA amounts at steady state. This in turn could cause cell death because TetA, in the absence of Tc, is toxic for the cell [57].

Additionally, when the affinity of TetR2 for the operators is 10, 50 and 100 times lower than the nominal value, the average number of intracellular TetR and TetR2 molecules is 3, 4, 5 and 2, 3, 5 respectively (data not shown). Given that the TetR and TetR2 amount in each single cell experiences large fluctuations, the higher the mean value, the higher the fluctuations in the TetR and TetR2 amount. Furthermore, the higher the intracellular TetR and TetR2 amount, the higher the required Tc amount for inducing gene expression. This happens because the administered Tc is occupied by the free TetR and TetR2 molecules and therefore cannot bind to the TetR2 bound on the operators to activate expression. Therefore, the large intracellular TetR and TetR2 amounts require large Tc amounts to induce gene expression thereby eliminating the functionality of the tet operón. Thus, the aforestated changes in the amount of TetR, TetR2 and TetA at steady state are detrimental to the E. coli. This confirms that tet operon is a very well tuned system and possible changes in its crucial parameters could be harmful for the E. coli.

It is noticeable that the differences in Tc and TetA amounts that are caused by changing the affinity of Tc for TetR2 are larger than the differences that are caused by modifying the affinity of TetR2 for the operator sites. Esto indica que el tet operon is more sensitive to changes in the affinity of Tc for TetR2 than in the affinity of TetR2 for the operators.


Introducción

Hematopoiesis is a highly complex process that controls the proliferation, differentiation and maturation of hematopoietic stem cells (HSCs) (Ng & Alexander, 2017). It has been widely accepted that genetic regulatory networks control the developmental processes of various types of blood cells (Cedar & Bergman, 2011). Although the regulatory mechanisms have been studied over a century, there are still many challenging questions regarding the cell fate determination in hematopoiesis (Ottersbach et al., 2010). Thus, it is imperative to unravel the regulatory mechanisms for the study of hematopoiesis.

In adult mammals, hematopoiesis occurs mostly in the bone marrow (Birbrair & Frenette, 2016). HSCs have the feature of self-renewal and multipotent as well as the ability to differentiate into multipotent progenitors (MPPs). Then, MPPs will differentiate into two main lineages of blood cells, namely the myeloid lineage which starts at common myeloid progenitors (CMPs) and the lymphoid lineage which starts at common lymphoid progenitors (CLPs). In addition, the myeloid lineage has two distinct progenitors, namely megakaryocyte-erythroid progenitors (MEPs) and granulocyte-macrophage progenitors (GMPs). MEPs can differentiate into megakaryocytes and erythrocytes, and GMPs can give rise to mast cells, macrophages and granulocytes. Lymphoid lineage cells include T lymphocytes (T-cells), B lymphocytes (B-cells) and natural killer cells (NK-cells) (Orkin & Zon, 2008). In this work, we focus on the fate determination of HSCs in the myeloid lineage for the choice between erythrocytes and neutrophils.

During the developmental process, a number of transcriptional factors (TFs) act as regulators to control the fate determination of HSCs (Aggarwal et al., 2012). Among them, the genetic complex Gata1-Gata2-PU.1 is a very important module for the cell-fate choice of CMPs between erythrocytes or neutrophils (Friedman, 2007 Liew et al., 2006 Ling et al., 2004). In particular, the Gata1-PU.1 complex forms a double negative feedback module, in which each gene inhibits the expression of the other (Friedman, 2007). Recently it has been elucidated that the fate determination of HSCs was defined not only by the ratio of Gata1 and PU.1 (Hoppe et al., 2016), but also by a third party during the regulation. Por ejemplo, FOG-1 is a significant third party to regulate the Gata1-PU.1 module (Chang et al., 2002 Mancini et al., 2012). Erythropoietin receptor (EpoR) signaling also acts the essential role in regulating the Gata1-PU.1 Module (Zhao et al., 2006). Although the regulatory mechanisms of the Gata1-Gata2-PU.1 complex in hematopoiesis are relatively well studied, the connection of this triad complex with other significant genes as well as the role of these genes in hematopoiesis are mostly unclear (Liew et al., 2006).

Mathematical modeling is an important method for inferring the detailed regulatory mechanisms. In 1910, Archibald Hill proposed a classical non-linear ordinary differential equation (ODE or Hill equation) model to describe the sigmoidal oxygen binding curve of hemoglobin (Hill, 1910). Since then, the Hill equation has been applied to explore the mechanisms in a wide range of genetic regulatory networks and biological systems. For example, the genetic toggle switching was achieved by the models with Hill equations (Gardner, Cantor & Collins, 2000). In addition, the Hill equation was employed to formalize the mechanisms of cell fate determination (Xiong & Ferrell, 2003 Laslo et al., 2006 Huang et al., 2007). Recently, the Hill equation was also used to discover a regulatory network of 52 genes with the uniform activation and repression strengthes (Li & Wang, 2013). Another widely used approach is the Shea–Ackers formalism for studying the thermodynamics of regulatory networks (Shea & Ackers, 1985). We developed a mathematical model based on the Shea–Ackers formalism to study the regulations of the Gata1-Gata2-PU.1 complex (Tian & Smith-Miles, 2014). A stochastic model was also proposed to explore the function of noise in regulating the fate determination of HSCs. Simulations suggested that fluctuations of protein numbers may lead the HSC to different developmental pathways. In recent years substantial process has been made to design various types of mathematical models for describing the regulatory mechanisms of gene networks, including stochastic differential equations, stochastic kinetic systems, qualitative differential equations, Michaelis–Menten formalism, S-system and power-law formalism (de Jong, 2002 Liu & Wang, 2008 Wang & Tian, 2010 Maetschke et al., 2013 Woods et al., 2016 Olariu & Peterson, 2018 Yang et al., 2018 Yang & Bao, 2019). In particular, a number of mathematical models have been designed to realize the stable states of gene expression levels in the differentiation of HSCs (Chang et al., 2006 Huang et al., 2007 Chickarmane, Enver & Peterson, 2009 Olariu & Peterson, 2018). However, the majority of these models only considered the functions of each gene independently, namely variable XI for the expression level of gene I in the model is in the form of ∑ i a i x i . Nonetheless, this type of models fails to represent the co-operation functions of genes together. There is a lack of investigations for the effect of possible protein heterodimers and/or synergistic effect in genetic regulations, namely variables XI in the model are also in the form of ∑ i , j b i j x i x j . Most recently, single-cell studies have been conducted to explore the hematopoietic system. Compared with the analysis of bulk cells, the advantage of single-cell analysis is the ability to understand the heterogeneity within the cell population (Guo et al., 2010 Ye, Huang & Guo, 2017). With the development of single-cell analysis, researchers have raised more novel computational and statistical methods to explore the regulatory mechanism of hematopoiesis. For example, the partial correlation method, Boolean model and ODE model were employed to construct the genetic regulatory networks from the single-cell expression profiles (Hamey et al., 2017 Wei et al., 2017). In addition, a deep learning method was applied to unravel the fate decision in hematopoiesis (Athanasiadis et al., 2017).

Recently, we proposed a general approach that combines both top-down and bottom-up approaches to reconstruct the genetic regulatory networks of the fate choice between erythrocytes and neutrophils (Wu, Cui & Tian, 2018). The key issue in this work includes a large number of unknown parameters and a high computational cost to add potential regulations. For the issue of parameter number, a linear ODE model may have the least number of unknown parameters among the models for all possible regulations between genes. However, since the linear model is limited to describe the linear relationship, it is not appropriate to use the linear model to study systems with complex non-linear dynamics. Although the non-linearity has been addressed by the reverse-engineering methods with the cost of more unknown parameters (Chickarmane & Peterson, 2008 Crombach et al., 2012 Meister et al., 2013 Li & Wang, 2013 Wang et al., 2016), the issue of protein heterodimers and/or synergistic effect between genes has not been discussed in the majority of literature at all. This work is designed to address these issues by proposing a novel approach for reconstructing genetic regulatory networks. The first innovation of this approach is the new non-linear ODE model as the bottom-up approach to study the effect of protein heterodimers and/or synergistic effect explicitly. The second innovation of this work is the proposed Extended Forward Search Algorithm as the top-down approach to infer the structure of networks in our newly proposed non-linear model. The proposed approach thus is able to not only reduce the complex structure of genetic regulatory networks but also improve the inference efficiency substantially because the number of parameters in the mathematical model is decreased. We examined the capability of our proposed method by studying the genetic regulatory networks for the fate determination of HSCs.


Discusión

The population density of wild Acropora yongei was 0.0006–0.029 colonies/m 2 in this study area in the low- and high-density populations, respectively. The density in artificial spawning hotspots was 10.6 colonies/m 2 , more than 365 times higher than in wild populations. The average linear distances between corals were 3.6 m in the high-coverage site and 20.7 m in the low-coverage site. Fertilizable distances of marine sessile organisms differ depending on species: 50 cm in ascidians (Grosberg 1991 ) and 10 m in the scleractinian coral, Seriatopora hystrix (Warner et al. 2016 ). Because all Acropora species are broadcast spawners, which make bundles of eggs and sperm to carry gametes to the surface, the fertilizable distance may be longer than for other species. However, a sperm concentration of 10 6 –10 7 /mL was required to achieve a high fertilization rate (>80%) based on laboratory experiments (Omori et al. 2001 Nozawa et al. 2015 ). Moreover, the expected fertilizable distance is less than 2 m even in Acropora corals, because the sperm concentration rapidly dilutes after the bundle is broken (Iwao et al., unpublished data Okinawa Prefecture Government 2017 ). This was estimated by numerical simulation using a sperm diffusion coefficient, and the fertilizable area (>10 5 /mL sperm concentration area) could be kept more than 20 minutes when nine colonies distributed at 2-m intervals spawned simultaneously. Of course, bundles could disperse more than 2 m from the parental colony. However, most bundles were broken within a few minutes after rising to the surface in open water (G. Suzuki 2017, Ishigaki, Japan, personal observation), although they can maintain their form over 30 minutes in aquarium. That is, this mass spawning system of Acropora corals could ensure reproductive success under high population density conditions. Considering these results, wild A. yongei corals at the low-coverage site may have a low probability of fertilization.

In addition, genetic analyses detected clonal colonies from wild populations within 7 m of one another at the low-density site and 1.7 m at the high-density site. Although clonal richness was low, this suggests that asexual reproduction in A. yongei in study area occurs naturally via fragmentation due to physical disturbances caused by typhoons or wave action. Considering that the congeneric Acropora tenuis does not appear to propagate by fragmentation in this study area (Zayasu et al. 2016 ), this may reflect the structure of arborescent species, such as skeletal strength, and the rate of fragment reattachment.

Estimated FES in both wild and artificial populations was as expected under HWE, even though the artificial population represented fertilization with gametes from 15 colonies. This suggests that 15 colonies are sufficient to produce adequate genetic diversity, at least for the next generation.

Previously, there have been assertions that arborescent Acropora corals reproduce using many asexual recruits derived from fragmentation (Fong & Lirman 1995 Nakamura & Nakamori 2006 ). However, this study showed that 90% of wild arborescent corals in the study site were sexually recruited. Also in the Atlantic, the threatened coral species Acropora cervicornis has been thought to rely on asexual fragmentation, but experiments have shown that fragmentation may not be a significant source of recruits (Vollmer & Palumbi 2007 Mercado-Molina et al. 2014 ). Clearly, larval recruitment by sexual reproduction is important to maintain population densities even in arborescent corals. In addition, sexually produced seedlings could enhance local genetic variability within a short period (Baird et al. 2009 ).

Based on these results, we estimated the larval supply capability of both wild and artificial A. yongei poblaciones. In these wild populations, an area of more than 365 m 2 is required so as to permit cross-fertilization of 10 colonies, while only 1 m 2 is necessary in the artificial population. En Acropora corals, crosses between gametes from six or more colonies provide the highest fertilization rate (Iwao et al. 2014 ). The fertilization rate is decreased in wild populations mainly by sperm dilution (<50%, G. Suzuki, unpublished data) and by incompatibility between clonal colonies, while it can be kept at high levels in artificial populations. In addition, a larval collecting device called a “larval cradle” (Okada et al., unpublished data) can be used in the artificial population, which allows us to achieve nearly 100% fertilization in open water by enclosing gametes within a cylindrical plankton net. Moreover, larval survival during the swimming stage is very low in wild populations due to predation (approximately 50% within 10 days after spawning) (Connolly & Baird 2010 ), whereas a larval cradle can maintain more than 90% survival in artificial populations. Based on these estimates, the larval supply capability per unit area of artificial population is at least 1,400 times higher than that of wild populations, even at high-coverage sites. We can design very compact artificial populations with even higher fertilization capacity by optimally arranging sexually produced seedlings. Such artificial spawning hotspots can potentially supply massive numbers of coral larvae sustainably with little or no maintenance cost. For example, 100 m 2 of the hotspot could supply as many larvae as those from the wild population of over 14 ha annually. That is, it would be easier to establish 100 m 2 of artificial hotspot only once than to transplant the large number of fragments to several hectares of damaged reef every year.