Información

¿Cómo podemos encontrar los sitios específicos en los que se unen las proteínas de unión al ADN?


Sabemos que algunas proteínas de unión al ADN son específicas de un sitio, es decir, reconocen y se unen a una secuencia de nucleótidos específica. Mi pregunta es ¿cómo podemos saber con precisión a qué sitios se enlazan? ¿Es la secuencia de aminoácidos de la proteína? ¿O es el factor de repetitividad en caso de que se unan a múltiples ubicaciones en el cromosoma?


Intentaré responder a la pregunta del título: ¿cómo podemos saber los sitios donde se unen las proteínas de unión al ADN? Explicaré dos métodos experimentales para identificar sitios de unión en el ADN.

  1. Huella DNase
  2. ChIP-seq (Chromatin Immuno-PAGreciprocidad con seqinfluir)

Huella DNase

Podemos localizar proteínas unidas al ADN por su capacidad para proteger el ADN de alguna degradación. DNasa I escinde el ADN en un casi-de forma aleatoria y es inhibida por proteínas que cubren ('protegen') la columna vertebral del ADN.

Para localizar un sitio que está protegido de la escisión de DNasa I, necesitamos tomar algo de ADN genómico y tratarlo. Necesitamos longitudes cortas y separadas de ADN para examinar; podemos obtenerlas a partir del ADN genómico mediante la amplificación por PCR de diferentes tramos. Necesitamos etiquetar estos amplicones solo en un extremo, la radiación beta es una buena opción de etiqueta.

Tomar un amplicón marcado y exponerlo a la DNasa I durante un período corto, no lo suficiente para una digestión completa, produce ADN escindido de todas las longitudes posibles, que parece una "escalera" después de la separación por electroforesis en gel. El tiempo de digestión debe ser corto, de modo que muchos ADN solo se escinden una vez, para tener una escalera completa. Repetir esta digestión con su proteína interesante presente da una escalera con un segmento faltante. Esto se debe a que su proteína protege una parte del ADN de la escisión.

Puntos importantes: el ADN está etiquetado solo en un extremo. Por lo tanto, solo vemos la pieza final de la etiqueta del ADN después de la escisión: si el ADN se etiqueta en 5 'y se escinde por la mitad, solo vemos las mitades 5'. Gracias a esto, podemos estimar la posición del sitio de unión: si nuestro ADN es de 100 pb y nuestra escalera tiene longitudes de 0 a 70 pb, una brecha, luego más de 85 a 100 pb, entonces nuestro sitio de unión está en algún lugar dentro de 70-85 pb del final etiquetado. Podemos secuenciar el fragmento de ADN y leer la secuencia de nucleótidos 70-85.

ChIP-seq

Este es un método desarrollado más recientemente, que es más adecuado para estudiar dónde se une una proteína en todo el genoma o en todo un cromosoma. Requiere un anticuerpo que se una específicamente a su proteína interesante.

En primer lugar, se toma una "instantánea" de la unión global proteína-ADN irradiando las células con luz ultravioleta, lo que provoca enlaces cruzados covalentes entre el ADN y las proteínas de unión. La cromatina (ADN con proteínas asociadas) se aísla de las células y se corta en fragmentos más pequeños; los enlaces cruzados conservan nuestra "instantánea" de proteínas y pequeñas longitudes de su ADN unido.

Esta mezcla se incuba con un anticuerpo (inmovilizado en perlas) que se une a nuestra proteína de interés. Podemos separar las perlas cubiertas de anticuerpos y, por lo tanto, nuestra proteína junto con ellas.

Finalmente, podemos secuenciar los fragmentos de ADN capturados de esta manera. Es como "pescar secuencias de unión". El resultado final es una distribución de dónde se unió nuestra proteína a través del genoma en el momento de nuestra instantánea.

Idealmente, los fragmentos de ADN deberían ser lo suficientemente largos para colocarlos de forma única en el genoma. Existen métodos avanzados de secuenciación y PCR que separan los fragmentos de ADN en "burbujas" en una emulsión que contiene una molécula de ADN cada una. De esta manera, podemos secuenciar todas las variantes que están presentes y contando el número de secuencias ('lecturas') de cada tipo, tenemos una medida de la abundancia de cada secuencia. Esta abundancia se interpreta como la ocupación de la proteína en diferentes sitios de unión.

Los estudios de la unión del ADN en todo el genoma nos han demostrado que las proteínas se distribuyen por todo el genoma. Tienen sitios de unión preferidos, pero también tienen cierta afinidad por sitios similares y pasan parte de su tiempo ligados a partes no funcionales del genoma.

Especialmente en los mamíferos, un sitio de unión 'verdadero' no solo (y no siempre) se determina por tener la secuencia de afinidad más alta, sino también por estar agrupado con sitios de unión para otros cofactores. Esto se debe a que, en los mamíferos, las proteínas a menudo se unen al ADN, no solas, sino como partes de grandes complejos que pueden interactuar con los nucleosomas y que permiten la regulación de la transcripción o cualquier otra cosa.

Mi pregunta es ¿cómo podemos saber con precisión a qué sitios se enlazan? ¿Es la secuencia de aminoácidos de la proteína? ¿O es el factor de repetitividad en caso de que se unan a múltiples ubicaciones en el cromosoma?

Entonces, podemos decir en qué secuencias (y en qué lugar del genoma, incluso con qué ocupación relativa) las proteínas se unirán al ADN mediante experimentos. Podría intentar adivinar dónde se unen a partir de su estructura, pero la forma en que lo decimos con precisión es mediante el experimento.

La secuencia de aminoácidos de una proteína determina en última instancia su estructura plegada, y hay muchos motivos o dominios de unión al ADN que aparecen en muchas proteínas diferentes. Algunos motivos se unen al esqueleto del ADN independientemente de la secuencia de bases, otros se unen a secuencias específicas.

Tomemos como ejemplo los dedos de zinc. La clase más conocida de dedos de zinc básicamente inserta una hélice alfa en el surco principal de la doble hélice del ADN, donde ciertos aminoácidos en el lado apropiado de la hélice alfa hacen contacto con las bases de nucleótidos. Estos contactos pueden ser enlaces de hidrógeno o contacto de van-der-Waals. (Por ejemplo, la histidina y la serina tienden a formar enlaces de hidrógeno con la guanina; la fenilalanina se `` acumula en anillos '' entre As y Ts; y la treonina entra en contacto con el grupo metilo de la timina).

Los dedos de zinc a menudo se encuentran en matrices en proteínas, como podría haber sugerido por "factor de repetición". Es decir, un solo dedo puede reconocer una secuencia específica de 3 o 4 pb, que no es muy única. Una proteína generalmente tendrá 3 o más dedos sostenidos con un espaciado regular, de modo que esta cadena de motivos: ZFa-ZFa-ZFb podría reconocer la secuencia de ADN: GCTAxxxGCTAxxxCCAA, que es un sitio mucho más único (esto es imaginario).

Entonces, sí, la secuencia de proteínas y (por lo tanto) la estructura determina a qué sitios se puede unir una proteína (puede imaginar una distribución de afinidad por las secuencias, habrá una secuencia de 'pico'), pero nuevamente algunas proteínas se unen a la columna vertebral del ADN de manera no específica, y en los mamíferos, a menudo no se unen solos sino dentro de complejos.

Las personas han estudiado la unión proteína-ADN mediante la ingeniería de sus propias matrices de dedos de zinc o TALEN, y también mediante la ingeniería de sus propios sitios de unión de ADN, a través de un proceso de "evolución artificial": seleccionar los aglutinantes más fuertes, mutarlos y repetirlos. Este tipo de estudios podrían generar una especie de "código de enlace" óptimo.


Cómo los factores de transcripción exploran el genoma

Los factores de transcripción son proteínas que regulan la transcripción de genes, que es el primer paso para producir una proteína. La forma en que funcionan los factores de transcripción es buscando en todo el genoma y uniéndose a regiones específicas que regulan los genes, activándolos o desactivándolos. Se sabe que los factores de transcripción no solo se unen a secuencias específicas de ADN, sino que también se unen de manera no específica a cualquier tramo de ADN.

Esta asociación no específica puede aumentar drásticamente la capacidad de los factores de transcripción para encontrar sus sitios objetivo específicos al permitirles deslizarse a lo largo del ADN. Sin embargo, no entendemos cómo los más de 1.500 factores de transcripción humanos varían en su eficiencia para escanear el genoma masivo, localizar y unir sitios específicos.

Ahora, el laboratorio de David Suter en el Instituto de Bioingeniería de la EPFL ha encontrado una manera de predecir la eficiencia con la que diferentes factores de transcripción escanean el genoma en células vivas. Los científicos estudiaron 501 factores de transcripción en el ratón al observar cómo se unen a los cromosomas "mitóticos", una propiedad que se ha relacionado con la capacidad de los factores de transcripción para asociarse con el ADN de una manera no específica.

Utilizando experimentos de fotoblanqueo e imágenes de una sola molécula, los científicos descubrieron que los movimientos de los factores de transcripción en el núcleo y la eficiencia con la que encuentran sus sitios de unión pueden predecirse mediante la unión del cromosoma mitótico.

Al combinar estos experimentos con el mapeo de factores de transcripción en todo el genoma, encontraron que los diferentes factores de transcripción varían en tres órdenes de magnitud en su capacidad para encontrar sus sitios. Por tanto, los factores de transcripción con fuertes propiedades de unión al ADN inespecíficas se asocian con los cromosomas mitóticos, se mueven lentamente en el núcleo y son particularmente eficientes para encontrar las secuencias específicas que necesitan para unirse para regular la expresión génica.

“Los factores de transcripción difieren en gran medida en su capacidad para escanear el genoma para encontrar sus sitios de unión específicos, y estas diferencias se pueden predecir simplemente observando cuánto se unen a los cromosomas mitóticos”, dice David Suter. "Los factores de transcripción que son los más eficientes en la búsqueda del genoma podrían impulsar cambios amplios en los patrones de expresión génica incluso cuando se expresan en concentraciones bajas y, por lo tanto, pueden ser particularmente importantes para los procesos de decisión del destino celular".

Otros colaboradores

Fundación Teofilo Rossi di Montelera e di Premuda, un donante generoso asesorado por CARIGEST SA, Fundación Alemana de Investigación, Consejo Europeo de Investigación (Horizonte 2020), Facultad de Medicina Molecular DFG de la Universidad de Ulm

Mahé Raccaud, Elias T. Friman, Andrea B. Alber, Harsha Agarwal, Cédric Deluz, Timo Kuhn, J. Christof M. Gebhardt, David M. Suter. La unión del cromosoma mitótico predice las propiedades del factor de transcripción en la interfase. Nature Communications 30 de enero de 2019. DOI: 10.1038 / s41467-019-08417-5.


Se han identificado secuencias de ARN implicadas en la regulación de la expresión génica.

El genoma humano contiene alrededor de 20.000 genes que codifican proteínas, pero las partes codificantes de nuestros genes representan solo alrededor del 2 por ciento de todo el genoma. Durante las últimas dos décadas, los científicos han estado tratando de averiguar qué está haciendo el otro 98 por ciento.

Un consorcio de investigación conocido como ENCODE (Enciclopedia de elementos de ADN) ha logrado un progreso significativo hacia ese objetivo, identificando muchas ubicaciones del genoma que se unen a proteínas reguladoras, lo que ayuda a controlar qué genes se activan o desactivan. En un nuevo estudio que también forma parte de ENCODE, los investigadores han identificado muchos sitios adicionales que codifican moléculas de ARN que probablemente influyan en la expresión génica.

Estas secuencias de ARN no se traducen en proteínas, sino que actúan de diversas formas para controlar la cantidad de proteína que se produce a partir de genes que codifican proteínas. El equipo de investigación, que incluye a científicos del MIT y varias otras instituciones, hizo uso de proteínas de unión a ARN para ayudarlos a localizar y asignar posibles funciones a decenas de miles de secuencias del genoma.

"Este es el primer análisis genómico funcional a gran escala de proteínas de unión a ARN con múltiples técnicas diferentes", dice Christopher Burge, profesor de biología del MIT. "Con las tecnologías para estudiar las proteínas de unión al ARN acercándose ahora al nivel de las que han estado disponibles para estudiar las proteínas de unión al ADN, esperamos llevar la función del ARN más plenamente al mundo genómico".

Burge es uno de los autores principales del estudio, junto con Xiang-Dong Fu y Gene Yeo de la Universidad de California en San Diego, Eric Lecuyer de la Universidad de Montreal y Brenton Graveley de UConn Health.

Los autores principales del estudio, que aparece hoy en Naturaleza, son Peter Freese, un reciente doctor en Biología Computacional y de Sistemas del MIT Eric Van Nostrand, Gabriel Pratt y Rui Xiao de UCSD Xiaofeng Wang de la Universidad de Montreal y Xintao Wei de UConn Health.

Regulación de ARN

Gran parte del proyecto ENCODE hasta ahora se ha basado en la detección de secuencias reguladoras de ADN mediante una técnica llamada ChIP-seq. Esta técnica permite a los investigadores identificar sitios de ADN que están unidos a proteínas que se unen al ADN, como los factores de transcripción, lo que ayuda a determinar las funciones de esas secuencias de ADN.

Sin embargo, señala Burge, esta técnica no detectará elementos genómicos que deban copiarse en el ARN antes de involucrarse en la regulación genética. En cambio, el equipo de ARN se basó en una técnica conocida como eCLIP, que utiliza luz ultravioleta para entrecruzar moléculas de ARN con proteínas de unión a ARN (RBP) dentro de las células. Luego, los investigadores aíslan las RBP específicas utilizando anticuerpos y secuencian los ARN a los que estaban unidos.

Las RBP tienen muchas funciones diferentes: algunas son factores de empalme, que ayudan a cortar secciones de ARN mensajero que codifica proteínas, mientras que otras terminan la transcripción, mejoran la traducción de proteínas, descomponen el ARN después de la traducción o guían el ARN a una ubicación específica en la célula. . La determinación de las secuencias de ARN que están unidas a las RBP puede ayudar a revelar información sobre la función de esas moléculas de ARN.

"Los sitios de unión de RBP son elementos funcionales candidatos en el transcriptoma", dice Burge. "Sin embargo, no todos los sitios de unión tienen una función, por lo que es necesario complementar eso con otros tipos de ensayos para evaluar la función".

Los investigadores realizaron eCLIP en aproximadamente 150 RBP e integraron esos resultados con datos de otro conjunto de experimentos en los que eliminaron la expresión de aproximadamente 260 RBP, uno a la vez, en células humanas. Luego midieron los efectos de esta caída en las moléculas de ARN que interactúan con la proteína.

Utilizando una técnica desarrollada por el laboratorio de Burge, los investigadores también pudieron reducir con mayor precisión dónde se unen las RBP al ARN. Esta técnica, conocida como RNA Bind-N-Seq, revela secuencias muy cortas, que a veces contienen motivos estructurales como protuberancias u horquillas, a las que se unen las RBP.

En general, los investigadores pudieron estudiar alrededor de 350 de las 1500 RBP humanas conocidas, utilizando una o más de estas técnicas por proteína. Los factores de empalme de ARN a menudo tienen una actividad diferente dependiendo de dónde se unen en una transcripción, por ejemplo, activando el empalme cuando se unen en un extremo de un intrón y reprimiéndolo cuando se unen en el otro extremo. La combinación de los datos de estas técnicas permitió a los investigadores producir un "atlas" de mapas que describen cómo la actividad de cada RBP depende de su ubicación de unión.

"Por qué se activan en un lugar y reprimen cuando se unen a otro lugar es un rompecabezas de larga data", dice Burge. "Pero tener este conjunto de mapas puede ayudar a los investigadores a descubrir qué características de las proteínas están asociadas con cada patrón de actividad".

Además, el grupo de Lecuyer en la Universidad de Montreal usó proteína verde fluorescente para etiquetar más de 300 RBP y señalar sus ubicaciones dentro de las células, como el núcleo, el citoplasma o las mitocondrias. Esta información de ubicación también puede ayudar a los científicos a aprender más sobre las funciones de cada RBP y el ARN al que se une.

Vinculando el ARN y la enfermedad

Muchos laboratorios de investigación de todo el mundo están utilizando estos datos en un esfuerzo por descubrir vínculos entre algunas de las secuencias de ARN identificadas y enfermedades humanas. Para muchas enfermedades, los investigadores han identificado variantes genéticas llamadas polimorfismos de un solo nucleótido (SNP) que son más comunes en personas con una enfermedad en particular.

"Si ocurren en una región codificadora de proteínas, se pueden predecir los efectos sobre la estructura y función de las proteínas, lo que se hace todo el tiempo. Pero si ocurren en una región no codificante, es más difícil averiguar qué pueden estar haciendo". Dice Burge. "Si golpean una región no codificante que identificamos como que se une a un RBP e interrumpen el motivo del RBP, entonces podríamos predecir que el SNP puede alterar el empalme o la estabilidad del gen".

Burge y sus colegas ahora planean utilizar sus técnicas basadas en ARN para generar datos sobre proteínas de unión a ARN adicionales.

"Este trabajo proporciona un recurso que la comunidad genética humana puede utilizar para ayudar a identificar variantes genéticas que funcionan a nivel de ARN", dice.

La investigación fue financiada por el Proyecto ENCODE del Instituto Nacional de Investigación del Genoma Humano, así como una subvención del Fonds de Recherche de Qu & eacutebec-Sant & eacute.


PROYECTOS SELECCIONADOS

Figura 1. Representación de estructura alámbrica del P22R NTD DNA 9T complejo. Los residuos que entran en contacto con el ADN se resaltan en azul.

En la lectura indirecta, la estabilidad y especificidad de un complejo proteína-ADN está regulada por la secuencia de bases que no están en contacto con la proteína. Estas bases no contactadas pueden inhibir o evitar que el ADN contactado se yuxtaponga correctamente con grupos de proteínas. Las diferencias dependientes de la secuencia de ADN en la estructura y flexibilidad de las bases no contactadas conducen a alteraciones en la fuerza y ​​/ o facilidad para formar contactos proteína-ADN. Los cambios de la geometría limitada por la secuencia de ADN alteran así indirectamente la afinidad y / o especificidad de una proteína por su sitio de unión afín. Por tanto, los efectos indirectos de la secuencia de ADN sobre la formación del complejo proteína-ADN se producen mediante una modulación de la complementariedad estructural entre las moléculas que interactúan.

Si bien está claro que la lectura indirecta de la secuencia de ADN es un componente importante de los mecanismos de reconocimiento de la secuencia de ADN de muchas proteínas, hasta hace poco no estaba claro cómo la secuencia de ADN dirige los cambios en la estructura y / o flexibilidad del ADN. Nuestros estudios actuales indican que la lectura indirecta por el represor de proteínas de unión al ADN está influenciada por interacciones dependientes de la secuencia entre el disolvente y el ADN no unido y / o unido a proteínas. Estos datos también muestran que la manipulación del entorno del disolvente dentro de las células produce efectos específicos sobre la regulación génica.

Por lo tanto, nuestros estudios en curso tienen como objetivo 1) proporcionar un marco termodinámico y estructural para explicar los mecanismos de lectura indirecta dependiente del solvente de la secuencia de ADN, y 2) comprender cómo estas diferencias dependientes de la secuencia y del solvente en la estructura del ADN influyen en la estabilidad y función de los complejos proteína-ADN.

Evolución de exotoxinas codificadas por bacteriófagos
Las paginas que codifican genes de exotoxinas se encuentran ubicuamente como lisógenos en bacterias ambientales, pero no está claro qué ventaja tienen las bacterias para albergar fagos que codifican tales compuestos tóxicos. En el contexto de los seres humanos, estas exotoxinas causan enfermedades que van desde el cólera hasta la difteria y la diarrea enterohemorrágica. Sin embargo, la frecuencia de aparición de los genes que codifican cualquier gen de exotoxina particular en bacteriófagos y / o lisógenos supera con creces el número de huéspedes animales potenciales. Además, estos genes de exotoxina codificados por fagos se encuentran con alta frecuencia en fagos libres y bacterias lisogénicas aisladas de entornos donde las enfermedades humanas correspondientes no son prevalentes. Estas observaciones sugieren que los mamíferos no son los `` objetivos '' originales ni primarios de estas toxinas.Las exotoxinas codificadas por fagos como la toxina Shiga bien estudiada (Stx), matan las células eucariotas atacando características y vías que son comunes a todos eucariotas tanto uni como multicelulares. Por tanto, la evolución de estas toxinas puede haber ocurrido antes de la aparición de organismos multicelulares. Dado que la depredación por depredadores eucariotas (por ejemplo, ciliados y otros protozoos) es una fuente importante de mortalidad bacteriana, estas observaciones sugieren que las exotoxinas pueden haber surgido como parte de una estrategia de defensa antipredadores (antiprotozoarios). Por lo tanto, los humanos pueden ser espectadores inocentes en la batalla evolutiva entre protozoos y sus presas bacterianas.

El entorno en el que viven los microbios es dinámico y cambia como consecuencia de procesos antropogénicos, ambientales y evolutivos. Los cambios rápidos también pueden resultar de las actividades de los propios microbios cuando responden a presiones ecológicas como la depredación. Nuestros datos publicados indican que las exotoxinas codificadas por fagos (p. Ej., Toxina Shiga, toxina diftérica) evolucionaron como defensa contra depredadores bacterívoros. Nuestros datos preliminares indican que la eficacia de la actividad antidepredador de una exotoxina puede gobernar la persistencia ambiental de bacterias y fagos que codifican exotoxina. Al determinar cómo los factores bioquímicos, biológicos celulares y poblacionales impactan en la persistencia de un conjunto evolutivamente diverso de bacterias y fagos que codifican la toxina Shiga en microcosmos naturales y artificiales, estamos intentando 1) identificar cómo se forman las respuestas microbianas a la depredación, y son moldeados por la comunidad microbiana y 2) delinean cómo estas respuestas impactan la supervivencia y el éxito microbianos.


Análisis de espectrometría de masas de interacciones proteicas

Jeffrey M. Perkel
1 de octubre de 2016

RUTA VINCULANTE: Para el arqueón Sulfolobus solfataricusrsquos mini cromosoma de mantenimiento helicasa (SsoMCM), la espectrometría de masas de alta resolución monitorea la tasa de captación de deuterio para la proteína libre en comparación con la proteína unida al ADN. Las diferencias (tonos de azul) se pueden cartografiar de nuevo en la estructura de la proteína para identificar supuestos caminos de unión para el ADN monocatenario (amarillo) en la superficie exterior de la helicasa SsoMCM. La espectrometría MICHAEL TRAKSELIS M ass es hoy en día la tecnología de referencia para la investigación proteómica. La tecnología hace que sea relativamente sencillo identificar y cuantificar proteínas en una variedad de muestras, así como detectar las modificaciones postraduccionales que tan a menudo gobiernan su comportamiento.

Dichos estudios tienden a tratar las proteínas como entidades aisladas, inventariéndolas de manera efectiva en una escala de orgánulos, células o tejidos y extrayendo inferencias de la forma en que esos recuentos cambian según las condiciones. Pero las proteínas rara vez actúan solas.

Las proteínas a menudo se agregan en grandes complejos multiproteicos, para empezar. (Consulte & ldquoCracking.

El Científico preguntaron a los investigadores que han aplicado la espectrometría de masas a una serie de interacciones de este tipo para conocer sus técnicas.

PROTEÍNA-ADN

INVESTIGADOR: Michael Trakselis, profesor asociado, Departamento de Química y Bioquímica, Universidad de Baylor

PROYECTO: Mapeo de interacciones proteína-ADN en la helicasa de mantenimiento de mini cromosomas (MCM) del arqueo Sulfolobus solfataricus (Sso)

ACERCARSE: Las helicasas son enzimas que desenrollan el ADN en forma de anillo a través de las cuales pasa una hebra de ácido nucleico, como un hilo a través de una aguja. Pero, ¿a dónde va el segundo hilo? El equipo de Trakselis originalmente intentó mapear los contactos proteína-ADN en los complejos SsoMCM usando lo que él llama un "enfoque de tipo caza y picoteo": mutando residuos de proteínas específicos uno por uno y monitoreando el impacto. Pero eso fue tedioso, dice. Quería un enfoque global que pudiera escanear toda la secuencia de proteínas simultáneamente.

Su solución: espectrometría de masas de intercambio de hidrógeno-deuterio (HDX). HDX monitorea la accesibilidad de los residuos de proteínas al solvente que los rodea cuantificando los cambios en la capacidad de los aminoácidos para intercambiar protones con su entorno a lo largo del tiempo.

El experimento comienza colocando la proteína y el ADN en agua deuterada. En ausencia de ATP, la falta de energía molecular inmoviliza el complejo. Después de esperar hasta cuatro horas para que se produzca el intercambio, la proteína se digiere en péptidos, que luego se secuencian en un espectrómetro de masas. Las regiones proteicas que están unidas al ADN serán menos accesibles a los disolventes que las que no lo están, una diferencia que está marcada por la presencia o ausencia de un cambio de masa de 1 Da en el enlace peptídico (J Biol Chem, 291: 12467-80, 2016). "Si el ADN se une a un sitio, entonces ese protón de amida ya no se puede intercambiar libremente", explica Trakselis. Al mapear esas ubicaciones en la estructura tridimensional de la proteína, los sitios de interacción se vuelven claros.

Incluso las máquinas de especificación de masa de gama baja pueden detectar fácilmente tales diferencias, asumiendo que la señal es lo suficientemente fuerte. Pero SsoMCM está formado por seis subunidades idénticas dispuestas en un anillo. A lo sumo, dice Trakselis, el ADN interactuaría con uno o dos de ellos. "Necesitábamos un instrumento de alta resolución para superar realmente ese trasfondo de redundancia". Así que solicitó tiempo en uno de los detectores más poderosos del mundo, un espectrómetro de masas de ciclotrón de iones de transformada de Fourier (FT-ICR) de 14,5 Tesla en el Laboratorio Nacional de Alto Campo Magnético de la Universidad Estatal de Florida, que encontró el proyecto lo suficientemente convincente como para aceptar una colaboración.

Con este instrumento, Trakselis pudo sondear más del 98 por ciento de la secuencia de proteínas de una sola vez. Los datos sugieren que la segunda hebra de ADN hace contactos específicos con el exterior del anillo de helicasa, en lugar de simplemente colgar allí como un fideo flexible. "[La helicasa] realmente se está apoderando de ambos hilos", dice, "pero lo está haciendo en dos lugares". Ahora, espera explotar esos datos para desarrollar nuevos modelos de actividad enzimática e identificar objetivos potenciales de terapias contra el cáncer.

UN POCO DE ORBITRAP LO HARÁ YA: Los FT-ICR son excepcionalmente potentes, pero también costosos y difíciles de conseguir. Los más grandes y poderosos se encuentran en instalaciones nacionales dedicadas como el FSU MagLab y el Pacific Northwest National Laboratory. Trakselis dice que solo usó uno debido a los requisitos únicos impuestos por SsoMCM. Otras helicasas, que comprenden seis subunidades diferentes, probablemente podrían resolverse en especificaciones de masa Thermo Fisher Scientific Orbitrap más ampliamente disponibles (pero aún de gama alta), sugiere, ya que sería más fácil distinguir la señal del ruido.

PROTEÍNA-ARN

CAPTURA DE INTERACTOMAS: Dirk Ostareck congeló las interacciones de ARNm-proteína en macrófagos con luz ultravioleta, las capturó en perlas acopladas con oligo (dT), digirió el ARNm y sometió las proteínas a espectrometría de masas. El "interactoma de ARNm" resultante comprendía 402 proteínas, algunas de las cuales probablemente regulan la activación de los macrófagos durante la inflamación. FIGURA BASADA EN A. CASTELLO. WWW.BIOCH.OX.AC.UK/ASPSITE/INDES.ASP?PAGEID=1141

INVESTIGADOR: Dirk Ostareck, Profesor, Jefe de Investigación, Clínica de Cuidados Intensivos Quirúrgicos y Cuidados Intermedios, Hospital Universitario RWTH Aachen, Alemania

PROYECTO: Catalogación de interacciones proteína-ARN durante la activación de macrófagos

ACERCARSE: La activación de los macrófagos conduce a la inflamación y está estrictamente regulada en varios niveles. Entre otras cosas, la unión de proteínas a ARNm clave puede regular la capacidad del macrófago para leer instrucciones genéticas específicas, incluidas las que producen citocinas. Pero, ¿qué proteínas desempeñan ese papel?

Para averiguarlo, Ostareck y su equipo utilizaron la captura del interactoma de ARNm. Descrito por primera vez en 2012 por los colaboradores de Ostareck, Matthias Hentze y Alfredo Castello del Laboratorio Europeo de Biología Molecular, este método implica la reticulación de complejos de proteína-ARN utilizando luz ultravioleta y capturando aquellos complejos que contienen ARNm poliadenilados. Luego, el material capturado se trata con proteinasa (para aislar ARN) o RNasa (para aislar proteínas) y se analiza mediante secuenciación profunda o espectrometría de masas acoplada a cromatografía líquida, respectivamente (Proteómica de células mol, 15:2699-714, 2016).

En estudios anteriores, los investigadores aplicaron este método a líneas celulares como HeLa y HEK 293 aquí, el equipo lo aplicó para controlar y macrófagos murinos inducidos por lipopolisacáridos bacterianos. Identificaron un total de 402 proteínas de unión a ARN, que los autores denominan "interactoma de ARN de macrófagos".

La comparación de este conjunto de datos con otros estudios publicados identificó 32 proteínas que parecen ser específicas de macrófagos, dice Ostareck, 19 de las cuales no tenían un vínculo conocido con el ARN, incluida la enzima P23, una prostaglandina E sintasa. P23 se une fuertemente al ARNm en macrófagos no tratados, pero menos en células activadas. Eso, dice Ostareck, sugiere que la proteína juega un papel en el control de la traducción del ARNm y / o en la regulación de la estabilidad, una hipótesis que su equipo ahora está investigando directamente.

MAPEO DE DOMINIOS Y TRANSCRIPCIONES DE AMP: Hay más de una forma de desollar un complejo proteína-ARN, por supuesto. Mediante la inmunoprecipitación de ARN y la secuenciación profunda, los investigadores pueden identificar los objetivos de proteínas de unión a ARN específicas. Y utilizando una modificación del enfoque del interactoma, llamada RBDmap, pueden mapear los dominios de proteínas específicos que realmente contactan con la transcripción del ARN, una estrategia que Hentze y otros demostraron recientemente en cardiomiocitos (Informes de celda, 16: 1456-69, 2016). "Esta es la siguiente cosa importante", dice Ostareck, "para encontrar tanto los ARNm que están unidos por las proteínas, como especialmente los ARNm que están específicamente regulados". A partir de ahí, dice, puede ser posible interrumpir esta regulación para modular el proceso inflamatorio en sí.

MOLÉCULA PROTEÍNA PEQUEÑA

DONDE EL METABOLISMO SE ENCUENTRA CON LA REGULACIÓN GENÉTICA: Jordan? Meier usó inhibidores unidos a perlas para identificar y cuantificar los KAT celulares. Luego, comparando la afinidad de estas enzimas por la coenzima A (CoA) y la acetil-CoA, pudo determinar cuáles son los objetivos probables de las vías de regulación por retroalimentación. ADAPTADO DE D.C. MONTGOMERY ET AL., J AM CHEM SOC, 138:6388-91, 2016. INVESTIGADOR: Jordan Meier, investigador y jefe de la Sección de Epigenética y Metabolismo, Instituto Nacional del Cáncer, Frederick, Maryland

PROYECTO: Caracterización de la regulación metabólica de lisina acetiltransferasas, proteínas que actúan como reguladores epigenéticos

ACERCARSE: Algunos laboratorios estudian el metabolismo, otros estudian la epigenética Meier estudia ambos. “Nuestro objetivo es esencialmente comprender la biología subyacente que conecta el metabolismo con la señalización epigenética”, dice. Específicamente, ¿cómo influyen los cambios en las concentraciones de metabolitos en la expresión génica?

El ayuno, por ejemplo, conduce a niveles elevados del metabolito de molécula pequeña coenzima A (CoA). CoA es un inhibidor negativo de lisina acetiltransferasas (KAT), una clase de proteínas que alteran la expresión génica al "escribir" marcas epigenéticas en las histonas. "Sin embargo, debido a la falta de métodos para observar [KAT] directamente en los proteomas, los investigadores no saben realmente a qué acetiltransferasas se refiere este mecanismo", dice Meier. Su equipo desarrolló una estrategia de proteómica química para resolver eso (J Am Chem Soc, 138:6388-91, 2016).

En lugar de expresar y probar cada enzima in vitro, el equipo de Meier se fue a pescar. Como cebo, utilizaron lisina-CoA, un inhibidor de KAT que interactúa con el sitio de unión de acetil-CoA de las enzimas. La conjugación de Lys-CoA con perlas diminutas permite que los KAT se enriquezcan a partir de extractos de células eucariotas y se identifiquen mediante la secuenciación de péptidos en un espectrómetro de masas Orbitrap.

Para evaluar la susceptibilidad de esas proteínas a la regulación por retroalimentación de CoA, compararon las afinidades de las enzimas por CoA o acetil-CoA mediante transferencia de Western cuantitativa. Ellos plantearon la hipótesis de que los KAT susceptibles a la inhibición por retroalimentación pueden unirse a la CoA con más fuerza que la acetil-CoA, explica Meier. Una enzima recién descubierta, llamada NAT10, encajaba perfectamente, mostrando un perfil de afinidad indicativo de regulación por retroalimentación. "Esta es realmente una herramienta generadora de hipótesis", dice.

EL DISEÑO DE LA SONDA IMPORTA: Meier dice que la proteómica química proporciona una plataforma que no se limita a los KAT. Pero se requiere un buen diseño de sonda. La lisina-CoA, explica, es solo un punto de partida para la purificación de KAT, ya que captura alrededor de 9 de 30 KAT celulares conocidos. Al modificar esa sonda, los investigadores recuperaron 14 enzimas adicionales. En el caso de los KAT, dice, esa estrategia podría facilitar una nueva estrategia de detección. "¿Podría básicamente usar este enfoque, en el que unir CoA a un péptido que esencialmente representa un objetivo en el que no sabemos qué acetiltransferasa lo modifica, y ahora comenzar a extraer enzimas candidatas que podrían catalizar esa modificación?" El trabajo para responder a esa pregunta está en curso.

PROTEÍNAS-LÍPIDAS

INVESTIGADOR: Arthur Laganowsky, profesor asistente de química, Centro de Enfermedades Infecciosas e Inflamatorias, Universidad Texas A & ampM, Houston

PROYECTO: Detallar las interacciones lípido-proteína

ACERCARSE: Generalmente, las proteínas se digieren en péptidos antes de la espectrometría de masas. Dicho tratamiento simplifica el análisis, pero también elimina cualquier posibilidad de decodificar complejos macromoleculares. (Consulte "Proteómica de ojo de pájaro", El Científico, Julio de 2014.) “Cuando lo mastica, realmente no tiene idea de lo que tiene en el tubo, además de la secuencia de la proteína”, explica Laganowsky.

Una alternativa es la espectrometría de masas nativa, que analiza los complejos de proteínas en sus formas intactas. Laganowsky aprendió esa técnica como posdoctorado en el laboratorio de la Universidad de Oxford de Carol Robinson, quien fue pionera en el campo. Pero tuvo que modificarlo antes de poder aplicarlo aquí, ya que Laganowsky está interesado en comprender las fuerzas moleculares que impulsan las interacciones proteína-lípido. Y esos están influenciados por la temperatura.

Laganowsky y su equipo modificaron un espectrómetro de masas de Waters cuadrupolo-movilidad iónica-tiempo de vuelo para controlar con precisión la temperatura de la fuente de muestra de espectrometría de masas, que normalmente opera a temperatura ambiente, entre 22 y 42 ° C. Luego solubilizaron el canal de amoníaco de E. coli, AmtB, una proteína de membrana integral modelo, en detergente, tituladas en una serie de ligandos de fosfolípidos en un rango de temperaturas y midieron el tamaño del complejo usando espectrometría de masas. A partir de eso, calcularon las propiedades termodinámicas de cada interacción lípido-proteína, descubriendo que diferentes lípidos se unen de formas fundamentalmente diferentes (J Am Chem Soc138: 4346-49, 2016). “Fue bastante sorprendente que pudieras ver estas diferentes firmas”, dice. Y aplicar el mismo enfoque a un mutante AmtB específico alteró esas firmas de manera reveladora. "Cada uno de estos lípidos tiene diferentes respuestas de entropía y entalpía".

MECANIZADO NO REQUERIDO: La personalización de especificaciones masivas suele ser costosa y técnicamente difícil. No es así con el sistema de control de temperatura de Laganowsky. El prototipo original involucraba básicamente un controlador de temperatura, algunos ventiladores de CPU y fuentes de alimentación, cartón y cinta. “Algunos de mis colegas se ríen cuando les digo esto”, admite, “pero es relativamente barato de hacer y no requiere ninguna modificación del instrumento”. Y, agrega, no hay razón para que el mismo enfoque no funcione también para otras clases de macromoléculas.


ESCALADA

El mecanismo revelado en la sección anterior se basa en la creación de nuevos sitios de unión específicos en el límite entre el ADN monocatenario y bicatenario, debido a la descompresión mecánica del ADN en algún momento. t & # x0003d 0. Debido a la búsqueda aleatoria de los SSB ya atado en el ADN, el sitio de unión específico se llena posteriormente después del tiempo característico T, que depende del número norte de proteínas unidas. Sucesivamente, norte es proporcional a la concentración de volumen C de proteínas en las condiciones experimentales estudiadas en el apartado anterior.

Consideremos al principio el caso más simple cuando el norte proteínas idénticas se unen constantemente al ADN de longitud L & # x0003d megabyte, y elegimos la distancia de par de bases a par de bases B & # x02248 3,5 & # x000c5 como unidad de longitud. Un solo TF ocupa unos 10 & # x0201320 pares de bases (las proteínas de unión a ADN monocatenarias son típicamente algo más pequeñas, como 7 pb para gp32), y denotamos la longitud correspondiente por & # x003bb & # x0003d & # x003bcB. Esta imagen corresponde a la situación observada para gp32 que busca una sola molécula de ADN, pero es probable que también se aplique a los TF que se unen al ADN bicatenario en determinadas condiciones.

Para cruzar una distancia L por difusión libre de sesgos, una partícula consume en promedio un tiempo T & # x02243 L 2 /D1d dónde D1d es el coeficiente de difusión correspondiente para el movimiento deslizante unidimensional en el ADN, y el símbolo & # x02243 indica que ignoramos los prefactores constantes. Si nos ocupamos de norte partículas idénticas, en promedio cada una de ellas tiene una longitud de difusión libre de L/norte, de modo que el tiempo de búsqueda característico de cualquier TF para encontrar la secuencia objetivo escalas como

dónde norte0 & # x0003d norte/METRO es el número de concentración de los TF en el ADN, y el índice pretende indicar que este resultado solo puede ser válido para el caso diluido, en el que la longitud ocupada por los TF es mucho menor que la longitud del ADN, norte& # x003bb & # x0226a L. En lo que sigue mostramos que el prefactor en la ecuación. 1 se convierte en & # x003c0/ 2 para la situación unilateral, y & # x003c0/ 8 para la situación de dos caras en el caso de un ADN en anillo. En la Fig.4 mostramos los resultados de T(norte0) de una simulación de partículas que se difunden en una red discreta para varios norte0 en condiciones de volumen excluido, es decir, un sitio de red dado puede estar ocupado por, como máximo, una partícula. La dependencia inversa al cuadrado de T(norte0) como predice la Ec. 1 se cumple muy bien. Nuestra simulación corresponde a una imagen de caminata aleatoria en la que una partícula da, en promedio, un intento de paso hacia la derecha o hacia la izquierda por unidad de tiempo. Si el sitio correspondiente está ocupado, el paso no se realiza. Observamos que tomar la longitud del paso como una unidad de longitud del problema conduce al valor del coeficiente de difusión de una sola partícula de modo que si la aproximación continua funciona correctamente, el producto sería constante e igual a & # x003c0 (compárese con la ecuación 16). Los resultados muestran que la aproximación teórica que conduce al 1 /norte 2 el comportamiento sigue siendo razonable incluso a concentraciones bastante altas, en las que la distancia entre partículas es del orden de las longitudes de los pasos. En la siguiente sección, empleamos una aproximación continua para derivar analíticamente la norte & # x022122 escalado.

Tiempo medio del primer paso T(norte0) de la búsqueda de objetivos en un sistema grande y unilateral (un objetivo ubicado en X & # x0003d 0), en función de la densidad norte0 de excluir a los caminantes que no pueden ocupar el mismo sitio de celosía. La densidad máxima es norte0 & # x0003d 30%. La línea discontinua corresponde al resultado exacto del coeficiente de difusión adimensional de la Ec. 16 obtenido en la aproximación del continuo. Vemos una ligera desviación para densidades mayores.Cada punto de datos corresponde a 10 5 corridas, excepto 10 3 realizaciones para la densidad más baja. Tenga en cuenta las barras de error comparativamente pequeñas.

Para una comparación directa con los datos experimentales, la Fig.5 muestra una forma alternativa de presentar los datos numéricos de la Fig.4, en forma dimensional de la tasa ka en unidades de 1 / s versus la concentración de proteína en volumen C en unidades de M. Para la conversión, usamos la relación norte0 & # x0003d Kns& # x003bcC, con la constante de unión inespecífica Kns & # x0003d 2.5 & # x000d7 10 5 M & # x022121, y el tamaño de encuadernación SSB & # x003bc & # x0003d 7 en unidades de nucleótidos (22,23). Mediante el ajuste logarítmico de mínimos cuadrados a los datos mostrados medidos a 100 mM de sal, obtenemos para la constante de difusión D1d de deslizamiento unidimensional a lo largo del dsDNA el valor D1d & # x0003d 3,3 & # x000d7 10 & # x022129 cm 2 / s, que está muy bien dentro del valor experimental 10 & # x022128 & # x0202610 & # x022129 cm 2 / s para esta concentración de sal informado en Pant et al. (22,23). Esto corrobora la validez de nuestro modelo analítico bastante simple para la búsqueda de destino del & # x0002a trunco. Tenga en cuenta que la situación experimental con dos sitios diana en cada extremo de la molécula de ADN corresponde a la Ec. 22 derivado a continuación.

Tasa de encuadernación dimensional ka en 1 / s en función de la concentración de proteínas C en M, convertido de la Fig. 4 para parámetros correspondientes a sal 100 mM. La constante de difusión unidimensional ajustada para el deslizamiento a lo largo del dsDNA es D1d & # x0003d 3.3 & # x000b7 10 & # x022129 cm 2 / s, ubicado muy bien dentro del valor experimental 10 & # x022128 & # x0202610 & # x022129 cm 2 / s (ver Refs. 22,23).

Expresado en términos de la tasa de ocupación adimensional F & # x0003d norte& # x003bb/L & # x0003d norte& # x003bc/METRO & # x0003d & # x003bcnorte0, la condición de dilución se convierte en F & # x0226a 1. Aunque el caso diluido puede corresponder a situaciones realistas (como el caso del mutante & # x0002a I a las concentraciones de sal que medimos) como se preparó en los experimentos in vitro, la unión inespecífica a altas concentraciones de TF puede muy bien provocan situaciones que ya no pueden considerarse diluidas, en el sentido de que una parte considerable del ADN está ocupada por los TF, que en ningún caso pueden considerarse puntuales. La única diferencia entre este caso y el anterior es que no se consideran las longitudes completas del ADN, sino solo las longitudes reducidas, correspondientes al espacio total que tienen los TF para su movimiento. Esta longitud es Lrojo & # x0003d L & # x02212 norte& # x003bb & # x0003d (METRO & # x02212 norte& # x003bc)B, para que obtengamos

dónde norte0 es la concentración inicial de los TF. En la figura 6, comparamos el caso diluido con la expresión de volumen excluido en la ecuación. 2.

Comportamiento del tiempo medio del primer paso T(norte) en función del número norte de TF unidos a un ADN de longitud 1000B según Eq. 2, para el caso diluido (línea sólida), Tamaño TF & # x003bb & # x0003d B (línea de trazos largos) y & # x003bb & # x0003d 10B (línea de trazos cortos). Los efectos de volumen excluidos reducen el tiempo de búsqueda de destino T(norte).


Capítulo 105 - Química y Sociedad

El ADN es el portador de información genética en los organismos. ¿Qué significa eso? Las moléculas grandes en el organismo pueden tener muchas funciones: pueden proporcionar estructura, actuar como catalizador de reacciones químicas, servir para detectar cambios en su entorno (lo que lleva a respuestas inmunes a invasores extraños y respuestas neuronales a estímulos como la luz, el calor, el sonido, etc.). tacto, etc.) y aportan motilidad. El ADN realmente no hace ninguna de estas cosas. Más bien puede verlo como un sistema de almacenamiento de información. La información debe decodificarse para permitir la construcción de otras moléculas grandes. Las otras moléculas suelen ser proteínas, otra clase de polímeros grandes en el cuerpo. Los cromosomas se encuentran en el núcleo de una célula.

Los cromosomas se encuentran en el núcleo de una célula. El ADN debe duplicarse en un proceso llamado replicación antes de que una célula se divida. La replicación del ADN permite que cada célula hija contenga un complemento completo de cromosomas.

La información real en el ADN de los cromosomas se decodifica en un proceso llamado transcripción mediante la formación de otro ácido nucleico, ácido ribonucleico o ARN. El ARN, elaborado por la enzima ARN polimerasa, es complementario de una hebra del ADN. El ARN se diferencia del ADN en que el ARN contiene un azúcar ribosa, no desoxirribosa, en su columna vertebral. Además, el ARN carece de la base T. En cambio, se reemplaza con la base U, que es complementaria a A (ya que T es complementaria a A en el ADN). El ARN formado actúa como mensajero, que pasa del núcleo al citoplasma de la célula. De hecho, este tipo de ARN a menudo se denomina ARN mensajero, ARNm. Dado que la información de un ácido nucleico (ADN) se convierte en información en forma de otro ácido nucleico (ARN), este proceso se denomina transcripción (dado que el idioma sigue siendo el mismo, como cuando se transcribe un discurso escrito en inglés a escrito en ingles).

La información del ADN, ahora en forma de secuencia de ARN lineal, se decodifica en un proceso llamado traducción, para formar una proteína, otro polímero biológico. El monómero de una proteína se llama aminoácido, un tipo de molécula completamente diferente a un nucleótido. Hay veinte aminoácidos naturales diferentes que se diferencian en uno de los 4 grupos conectados al carbono central. En un aminoácido, el carbono central (alfa) tiene un grupo amina (RNH2), un grupo de ácido carboxílico (RCO2H) y H, y un grupo R adjunto a él. Dado que la información de un ácido nucleico (ARN) se convierte en información en forma de una molécula diferente, una proteína, este proceso se denomina traducción (ya que el idioma de los ácidos nucleicos se cambia al de las proteínas, como cuando se traduce del inglés al chino).

En contraste con la complementariedad del ADN y el ARN (1 base en el ARN complementaria a 1 base en el ADN), no existe una correspondencia 1: 1 entre una base (parte de la unidad monomérica del ARN) en el ARN y el monómero en una proteína. . Después de mucho trabajo, se descubrió que una secuencia lineal contigua de 3 nucleótidos en el ARN es decodificada por la maquinaria molecular del citoplasma con el resultado de que se agrega 1 aminoácido a la proteína en crecimiento. Por lo tanto, un triplete de nucleótidos en el ADN y el ARN tiene la información de 1 aminoácido en una proteína. Que no había una correspondencia 1: 1 entre los nucleótidos en los ácidos nucleicos y los aminoácidos en las proteínas era evidente hace mucho tiempo, ya que solo hay 4 monómeros de ADN diferentes (con A, T, G y C) y 4 monómeros de ARN diferentes (con A , U, G y C), pero hay 20 monómeros de aminoácidos diferentes que componen las proteínas.

Ahora bien, resulta que no toda la información en la secuencia de ADN de un organismo codifica una proteína. De hecho, solo alrededor del 2% de los 3 mil millones de pares de bases parecen transcribirse en ARN que puede traducirse en proteína. La función del resto del ADN es actualmente incierta. ¿Cómo sabe la maquinaria molecular de la célula qué parte del ADN codifica proteínas? Resulta que hay secuencias de ADN únicas al principio y al final de la parte de la secuencia de ADN que codifica una proteína. Avanza por el ADN de un cromosoma y de repente llegas a esas señales, que son reconocidas por la maquinaria celular. Se hace un ARN complementario a partir de esa sección, y luego el ARN complementario se decodifica en una sola proteína. Continúe más abajo en la secuencia de ADN y se encontrará otra secuencia codificante de este tipo, que se puede transcribir en un ARNm, que luego se puede traducir en otra proteína única. En total, hay alrededor de 30.000 secciones de ADN de este tipo en todos los cromosomas que codifican la información de 30.000 proteínas únicas. Estas secciones de codificación únicas de ADN que finalmente se transcriben en ARNm únicos que se traducen en proteínas únicas se denominan genes. Para nuestros propósitos, llegamos a la conclusión de que un gen tiene la información de una proteína. Cada una de las proteínas difiere entre sí tanto en longitud como en la secuencia específica de aminoácidos en la proteína. De hecho, el ADN es el modelo de la célula. Lo que determina las características reales de las células son las proteínas reales que produce la célula.

El ADN no solo debe transcribirse en ADN, sino que la información genética en el ADN debe replicarse antes de que una célula determinada se divida, de modo que las células hijas contengan la misma información genética. En la replicación, el dsDNA se separa y una enzima, la DNA polimerasa, hace copias complementarias de cada hebra. Las dos hebras de dsDNA resultantes se separan en diferentes células hijas durante la división. El proceso en el que el ADN se replica cuando las células se dividen y se transcribe en ARN que se traduce en proteína se denomina Dogma Central de la Biología. (ignore tRNA, rRNA y snRNA en el enlace web anterior)

Como se mencionó anteriormente, cada aminoácido se especifica mediante una combinación particular de tres nucleótidos en el ARN. Las tres bases se denominan codón. El Código Genético consiste en una tabla que muestra qué secuencia de ARN triplete o codón en el ARNm codifica para cuál de los 20 aminoácidos. Uno de los codones no codifica aminoácidos y sirve para detener la síntesis de la proteína a partir de la secuencia de ARNm. El código genético se muestra a continuación:

Determinación de la secuencia de proteínas a partir de una secuencia de ADN.

Para un gen dado, solo una hebra del ADN sirve como molde para la transcripción. A continuación se muestra un ejemplo. La hebra inferior (azul) en este ejemplo es la plantilla hebra, que también se llama menos (-) hebra, o el sentido hebra. Es esta hebra la que sirve como molde para la síntesis de ARNm. La enzima ARN polimerasa sintetiza un ARNm en la dirección 5 'a 3' complementaria a esta hebra molde. La hebra de ADN opuesta (roja) se llama C oding hebra, el sin plantilla hebra, el más (+) hebra, o el antisentido hebra.

La forma más sencilla de encontrar el correspondiente secuencia de ARNm (que se muestra en verde a continuación) es para leer el C oding, sin plantilla, más (+) , o antisentido hebra directamente en la dirección 5 'a 3' sustituyendo U por T. Encuentra el triplete en la hebra codificante, cambia cualquier T por U y lee del Código Genético el aminoácido correspondiente que se incorporaría a la proteína en crecimiento. (Los hilos a continuación están separados en tripletes para facilitar la visualización). A continuación se muestra un ejemplo.

REVISIÓN DE LA BASE FINAL DOGMA CENTRAL DE BIOLOGÍA

A diferencia de los polímeros lineales de ADN y ARN, las proteínas (polímeros lineales de aminoácidos) se pliegan en el espacio 3D para formar estructuras de formas únicas. Cada secuencia de proteína única (de una longitud y secuencia de aminoácidos determinada) se pliega en una forma 3D única. Por tanto, existen unas 30.000 proteínas de diferentes formas en los seres humanos. Las proteínas no solo tienen formas únicas, sino que también tienen rincones, grietas y bolsillos únicos que les permiten unirse a otras moléculas. La unión de otras moléculas a proteínas o ADN inicia o termina la función de la proteína o nucleico, de manera muy similar a un interruptor de encendido / apagado. El siguiente ejemplo muestra diferentes estructuras de proteínas, algunas de las cuales tienen moléculas pequeñas o moléculas grandes (como el ADN) unidas a ellas. Algunos motivos comunes se encuentran dentro de la estructura 3D de la proteína. Incluyen hélices alfa y hojas beta. Estos se mantienen unidos por enlaces H entre el H ligeramente positivo en el N en la estructura de la proteína y un O ligeramente negativo más alejado en la estructura de la proteína. En los modelos de Chime a continuación, use los controles del mouse para rotar la molécula. (También el clic con el botón izquierdo del mouse cambiará el tamaño de la molécula). Haga clic en el comando en el marco de la derecha para cambiar la representación de las proteínas. La vista de dibujos animados permite una forma sencilla de interpretar la estructura general de la cadena principal.

Si la secuencia de ADN en una región codificante cambia, el ARNm resultante también cambiará, lo que conducirá a cambios en la secuencia de la proteína. Estos cambios pueden no tener efecto y ser silenciosos, si el cambio en la proteína no afecta el plegamiento de la proteína o su unión a otra molécula importante. Sin embargo, si los cambios afectan el plegamiento o la región de unión, es posible que la proteína no pueda realizar su función habitual. Las mutaciones que sustituyen los aminoácidos no polares por los polares / cargados (o al revés) tienen la mayor probabilidad de causar cambios significativos en la estructura y / o actividad.

Si la función fuera interrumpir la división celular, el resultado podría llevar a que la célula se vuelva cancerosa. Del mismo modo, si la proteína normal tuvo un papel en hacer que la célula muera después de su período de vida previsto, la célula con la proteína mutante podría no morir y es más probable que se convierta en un tumor. Los escenarios opuestos podrían suceder y llevar a la célula a una muerte prematura.

  • Mutaciones puntuales: por mala suerte y análogos de nucleótidos
  • Mutaciones puntuales: por mutágenos químicos
  • Grandes mutaciones: deleciones, inserciones, duplicaciones e inversiones

Vea el modelo de hemoglobina de células falciformes a continuación, que muestra cómo un cambio de un solo par de bases en el ADN puede cambiar un aminoácido en una proteína con consecuencias letales.

Genes y enfermedades

Activación y represión de la transcripción genética:

  1. ¿Cómo podría reprimirse la expresión génica en ausencia de mercurio?
  2. ¿Cómo se podría activar la expresión genética en presencia de mercurio?

Una de las cuestiones centrales de la biología moderna es qué controla la expresión genética. Como hemos descrito anteriormente, los genes deben activarse en el momento adecuado, en la célula adecuada. En una primera aproximación, todas las células de un organismo contienen el mismo ADN (con la excepción de las células germinales y las inmunitarias). El tipo de célula está determinado por los genes que se expresan en un momento dado. Asimismo, la celda puede cambiar ( diferenciar ) en diferentes tipos de células alterando la expresión de genes. El dogma central de la biología describe cómo los genes se transcriben primero a ARN y luego el ARNm se traduce en una secuencia de proteína correspondiente. A continuación, las proteínas pueden modificarse postraduccionalmente, localizarse en determinados lugares dentro de las células y, en última instancia, degradarse. Si las proteínas funcionales se consideran el producto final de la expresión génica, el control de la expresión génica podría teóricamente ocurrir en cualquiera de estos pasos del proceso.

Sin embargo, la expresión génica se controla principalmente a nivel de transcripción. Esto tiene un gran sentido biológico, ya que sería menos derrochador energéticamente inducir o inhibir la expresión final de una proteína funcional en un paso temprano en el proceso. ¿Cómo se puede regular la expresión génica a nivel transcripcional? Se han documentado muchos ejemplos. El control principal se ejerce típicamente a nivel de la ARN polimerasa. vinculante justo aguas arriba (5 ') de un sitio para el inicio de la transcripción. Otros factores, llamados factores de transcripción (que generalmente son proteínas), se unen a la misma región y promueven la unión de Polimerasa de ARN en su sitio de unión, llamado el promotor. Las proteínas también pueden unirse a sitios en el ADN (operador en procariotas) e inhibir el ensamblaje del complejo de transcripción y, por lo tanto, la transcripción. La regulación de la transcripción genética se convierte entonces en una cuestión de vinculante La Apropiada factores de transcripción y ARN polimerasa a la región apropiada en el sitio de inicio para la transcripción génica. La regulación de la expresión génica por las proteínas puede ser positiva o negativa. La regulación en procariotas suele ser negativa, mientras que en eucariotas es positiva.

La mayoría de los genes eucariotas tienen alrededor de 5 sitios reguladores para unirse a factores de transcripción y ARN polimerasa. En la siguiente figura se muestran ejemplos de estos factores de transcripción.

CARACTERÍSTICAS ESTRUCTURALES DE SITIOS ESPECÍFICOS DE UNIÓN AL ADN

Dado que la ARN polimerasa debe interactuar en el sitio del promotor de todos los genes, es de esperar que todos los genes tengan una secuencia de nucleótidos similar en la región del promotor. Se ha descubierto que esto es cierto tanto para los genes procarióticos (como las bacterias) como para los eucarióticos. Sin embargo, cabría esperar que todos los factores de transcripción no tuvieran secuencias de unión de ADN idénticas. Las secuencias de ADN justo aguas arriba del sitio de inicio del gen que se une a la proteína (ARN polimerasa, factores de transcripción, etc.) se denominan promotores. La siguiente tabla muestra el motivo de secuencia de ADN común llamado Pribnow o TATA caja encontrada en alrededor de -10 pares de bases aguas arriba del sitio de inicio, y otra en -35. Las proteínas se unen a estos sitios y facilitan la unión de la ARN polimerasa, lo que conduce a la transcripción de genes.

Procariota Secuencias promotoras

Además, en los promotores eucariotas, las secuencias más arriba llamadas elementos de respuesta se unen a proteínas específicas (como CREB o proteína de unión al elemento de respuesta de AMP cíclico) para controlar aún más la transcripción de genes.

Elementos de respuesta eucariota (RE) s

Las proteínas pueden interactuar específicamente con el ADN a través de interacciones electrostáticas, de enlace H e hidrófobas. Los pares de bases AT y GC tienen donantes y aceptores de enlaces H disponibles que están expuestos en la arboleda mayor y menor de la hélice del ADN ds, lo que permite interacciones proteína-ADN específicas.

Jmol: Tutorial de ADN simple (consulte los últimos botones de selección para ver los donantes y aceptores de enlaces H en la arboleda principal.

CARACTERÍSTICAS ESTRUCTURALES DE LAS PROTEÍNAS DE UNIÓN AL ADN

  • hélice-vuelta-hélice : se encuentra en proteínas de unión a ADN procariotas. Las figuras muestran dos de tales proteínas, el represor cro del bacteriófago 434 y el represor lambda del bacteriófago lambda. (Los bacteriófagos son virus que infectan a las bacterias). Observe cómo se logra la especificidad, en parte, mediante la formación de enlaces H específicos entre la proteína y la arboleda principal del ADN operador.
  • Represor Lambda / Complejo de ADN
  • Interacciones de enlace H entre el represor l y el ADN
  • dedo de zinc : (eucariotas) Estas proteínas tienen un motivo de secuencia común de
    X3- Cys -X2-4- Cys -X12- Su -X3-4- Su -X4- en el que X es cualquier aminoácido. Zn 2+ está tetraédricamente coordinado con las cadenas laterales Cys e His, que están en una de las dos cadenas beta antiparalelas y una hélice alfa, respectivamente. El dedo de zinc, estabilizado por el zinc, se une al surco principal del ADN.
  • receptores de hormonas esteroides : (eucariotas) A diferencia de la mayoría de las hormonas, que se unen a los receptores de la superficie celular, las hormonas esteroides (derivados del colesterol) atraviesan la membrana celular y se unen a los receptores citoplasmáticos a través de un dominio de unión a hormonas. Esto cambia la forma del receptor que luego se une a un sitio específico en el ADN (elemento de respuesta hormonal) a través de un dominio de unión al ADN. En una estructura análoga al dedo de zinc, Zn 2+ está tetraédricamente coordinado con 4 Cys, en una estructura de tipo globular que se une como un dímero a dos secuencias de ADN idénticas pero invertidas (palíndromo) dentro de la arboleda principal. (Un ejemplo de palíndromo: podía yo antes de ver a Elba).
  • cremalleras de leucina : (eucariotas) Estas proteínas contienen tramos de 35 aminoácidos en los que se encuentra Leu repetidamente a intervalos de 7 aminoácidos. Estas regiones de la proteína forman hélices anfifílicas, con Leu en una cara.Dos de estas proteínas pueden formar un dímero, estabilizado por la unión de estas hélices anfifílicas entre sí, formando una espiral, como en la proteína muscular miosina. Por tanto, la cremallera de leucina representa el dominio de unión a proteínas de la proteína. El dominio de unión al ADN se encuentra en los primeros 30 aminoácidos N-terminales, que son básicos y forman una hélice alfa cuando la proteína se une al ADN. La cremallera de leucina funciona para unir dos proteínas de unión al ADN, lo que permite que las hélices de las bases N-terminales interactúen con la arboleda principal de ADN de una manera específica de base.

FOSFORILACIÓN Y CONTROL DE LA EXPRESIÓN GENÉTICA

Una forma común de controlar la expresión génica es controlando la fosforilación de factores de transcripción por ATP. Esta modificación podría activar o inhibir el factor de transcripción al activar la expresión génica. Los grupos fosfato agregados pueden ser necesarios para interacciones de unión directa que conducen a la transcripción de genes o pueden conducir a un cambio conformacional en el factor de transcripción, que podría activar o inhibir la transcripción de genes. Un ejemplo reciente de este último caso es el control de la actividad del factor de transcripción p53. p53 tiene muchas actividades en la célula, una primaria como supresor del crecimiento de células tumorales. Si una célula se somete a un estrés que resulta en un daño genético (algo evidente que podría llevar a una célula a transformarse en una célula tumoral), esta proteína se convierte en un factor de transcripción activo, dando lugar a la expresión de muchos genes, incluidos los implicados en células programadas. Regulación del ciclo celular y muerte. Ambos efectos podrían inhibir claramente la proliferación celular. Por tanto, p53 es un gen supresor de tumores. p53 generalmente se une a la proteína HDM2 que regula negativamente su actividad conduciendo a su degradación. Las señales de estrés conducen a la activación de proteína quinasas en la célula (como p38, JNK y cdc2), lo que provoca la fosforilación de los aminoácidos serina y trenina en p53 (Ser 33 y 315 y Thr 81). Esto conduce a la unión de la proteni Pin 1, que cambia la forma de p53 y conduce a su activación como factor de transcripción.


¿Cómo se unen las proteínas nucleares a sus objetivos?

FRAP es muy adecuado para analizar la función y el comportamiento de proteínas que ejercen sus funciones en complejos ADN-proteína, ya que el ADN o la cromatina son esencialmente inmóviles durante el tiempo que toma un experimento FRAP típico. Por lo tanto, los tiempos de residencia en el estado inmóvil determinados por experimentos FRAP reflejan la participación del factor investigado en los complejos ADN-proteína. Esto permitió a los investigadores, incluso en los primeros días de la obtención de imágenes de células vivas y el etiquetado de GFP, observar complejos ADN-proteína sorprendentemente breves en la reparación del ADN de lesiones de una sola hebra (Houtsmuller et al. 1999) y el inicio de la transcripción (McNally et al. 2000). Tras estos estudios pioneros, una gran cantidad de informes mostraron una interacción dinámica similar de las proteínas nucleares con el ADN, incluidas las investigaciones sobre la transcripción de genes y el procesamiento del ARN, la reparación del ADN, la replicación del ADN y la estructura de la cromatina (Kruhlak et al. 2000 Leonhardt et al. 2000 Mattern et al.2004 Sporbert et al.2002 Stavreva et al.2004). En la Fig. 3a, se hace una comparación entre las movilidades de una selección de proteínas de estos estudios. En vista de la dificultad de comparar los datos de FRAP obtenidos por diferentes procedimientos y métodos analíticos, como se discutió anteriormente, optamos por presentar el tiempo hasta la recuperación completa estimada a partir de las curvas de FRAP publicadas, ya que pensamos que en muchos casos estos sirven bien como una indicación de los tiempos de residencia reales de las proteínas indicadas en complejos asociados al ADN. Sin embargo, somos conscientes de que este análisis aproximado solo es válido para proteínas con tasas de activación y desactivación efectivas en la parte inferior izquierda de la figura 3b y la esquina izquierda del diamante en la figura 3c. Para proteínas con velocidades de activación y desactivación más altas, los tiempos de residencia en complejos inmóviles serán sustancialmente más cortos (parte superior derecha en la Fig. 3b, esquina derecha en 3c). Tenga en cuenta que este comportamiento de unión muy frecuente y transitorio solo es posible cuando la concentración de sitios de unión es muy alta, ya que las proteínas apenas tienen tiempo para difundirse a distancias más largas entre los eventos de unión, pero no ocurren eventos de unión relativamente largos. Por lo general, estos son escenarios en los que el ADN está constantemente (específicamente) ligado, como los modelos de salto, deslizamiento o salto discutidos anteriormente. Obviamente, el conocimiento previo de la función de la proteína bajo vigilancia puede ayudar a interpretar las curvas FRAP de esta manera. Por ejemplo, XPC, el sensor de daño en la reparación por escisión de nucleótidos, probablemente interactúe con frecuencia y brevemente con el ADN intacto, como se argumentó anteriormente, lo que lleva a tiempos de recuperación prolongados, del orden de decenas de segundos, mucho más largos que el tiempo de unión al ADN específico real. Sin embargo, en las células expuestas a la luz ultravioleta, una parte sustancial de la proteína XPC se une mucho más tiempo al daño del ADN inmóvil, lo que provoca un desplazamiento de la esquina derecha a la izquierda en la Fig. 3c. En este caso, los tiempos de recuperación son del orden de varios minutos (Hoogstraten et al. 2008 Nishi et al. 2009) y pueden usarse para estimar aproximadamente los tiempos de unión al ADN. Además, en varios casos, las proteínas interactúan con estructuras subnucleares como los focos de reparación del ADN, en cuyo caso el tiempo de recuperación final (de los focos blanqueados) también es un buen indicador de los tiempos de unión.

Relación entre el tiempo hasta la recuperación final en experimentos FRAP y el tiempo de residencia en complejos inmóviles. a Tiempo hasta la recuperación completa en experimentos FRAP de una selección de proteínas nucleares involucradas en varias funciones nucleares (diagrama de registro). Tenga en cuenta que los factores de reparación se miden en presencia de daño inducido en el ADN y, en general, muestran tiempos de recuperación más prolongados que los factores de transcripción. B y C Diagramas adaptados de Sprague et al. 2004, que muestra la relación entre la relación de encendido / apagado (ejes y y x respectivamente), fracción inmóvil (codificación de color) y tiempo hasta la recuperación final (lineas solidas) (tenga en cuenta que en ambas curvas, Ksobre define eficaz on-rate, que es independiente de la concentración)

En los casos en los que las proteínas residen durante un período relativamente largo en la fracción inmóvil (ya sea en focos o dispersas por todo el núcleo), como las proteínas de reparación del ADN, el tiempo de unión estimado a partir del tiempo de recuperación aún depende en gran medida del modelo de unión asumido (Figs. 3b y c , 4a). Cuando se asume una cinética de unión simple (donde el equilibrio entre el estado inmóvil y móvil está determinado por la relación de tasas de activación y desactivación), los tiempos de residencia se distribuyen exponencialmente (curva roja en la Fig. 4b). En caso de que las tasas de activación y desactivación efectivas se encuentren en el panel inferior izquierdo de la figura 3b, el tiempo de unión característico es aproximadamente 1/5 del tiempo hasta la recuperación completa. Sin embargo, se puede plantear la hipótesis de un modelo de unión más complejo, donde la estabilidad del complejo aumenta con el tiempo, debido a la entrada de factores estabilizadores, y disminuye cuando se realiza la acción requerida. En este caso, los tiempos de residencia promedio son más de 1/2 o 1/3 del tiempo hasta la recuperación completa (curva azul en la Fig. 4b). Se puede apreciar un modelo de unión más complejo de este tipo si, por ejemplo, se considera un complejo de reparación del ADN en curso. Es concebible que la proteína de detección de daño XPC esté inicialmente unida de una manera menos estable que cuando se estabiliza mediante la unión de factores posteriores (véase la Fig. 2b Mone et al. 2004 Dinant et al. 2009 Nishi et al. 2009). Además, cuando finaliza la reparación, las tasas de eliminación de las proteínas involucradas aumentarán considerablemente, lo que conducirá a su rápida liberación. De manera similar, en la regulación transcripcional, están involucrados muchos tipos de mediadores y complejos de remodelación de la cromatina, que pueden tener un papel en la estabilización de la unión del promotor inicial de los factores fundadores, como los receptores de esteroides (McKenna et al. 1999 Hermanson et al. 2002 Smith y O ' Malley 2004 Heemers y Tindall 2007). Además, se ha sugerido que los complejos de transcripción se desarman activamente por las proteínas chaperonas, en cuyo caso la tasa de desviación efectiva aumenta drásticamente (Elbi et al. 2004). Tales escenarios, donde los factores tempranos experimentan más cambios en la estabilidad de la unión que los factores de unión tardíos, o donde los factores se liberan activamente después de terminar su trabajo, dan lugar a diferentes distribuciones de los tiempos de unión (Fig. 4b), pero curvas FRAP sorprendentemente similares (Fig. .4c).

Modelos de unión a ADN. a los dibujos animados superiores muestra un modelo de enlace simple que da lugar a una distribución exponencial de los tiempos de enlace (curva roja en B). En un modelo más complejo, los factores de unión tempranos tienen diferentes cinéticas de unión (curva azul en B) ya que el complejo se estabiliza cuando se unen factores posteriores, lo que da como resultado una tasa de desviación más baja. B Distribuciones de frecuencia de los tiempos de residencia del complejo (azul) y simple (rojo) modelo de encuadernación. El tiempo medio de enlace en el modelo simple es de 30 sy en el modelo complejo de 50 s. C Curvas FRAP generadas por simulación Monte Carlo del complejo (azul) y simple (rojo) modelo vinculante son muy similares, a pesar de la gran diferencia en los tiempos de residencia promedio

Si bien los estudios anteriores muestran claramente la interacción dinámica entre las proteínas de unión al ADN y la cromatina en general, todavía quedan por discutir una serie de preguntas para las proteínas individuales: ¿Se asocian las proteínas con el ADN diana o con los complejos ADN-proteína hasta que, por ejemplo, , se completa la reparación o se inicia la transcripción, o se quedan más cortos, solo para realizar su propia tarea específica dentro de todo el proceso? ¿Ocurren también eventos vinculantes improductivos y, en caso afirmativo, con qué frecuencia? Además, ¿existe un orden específico o preferido en el que se agrupan los factores? A continuación, discutimos estos temas en detalle.

Los resultados de los estudios de FRAP sobre el daño del ADN de una sola hebra por reparación por escisión de nucleótidos (NER) apuntan a un mecanismo de acción en el que los factores de reparación están presentes en los complejos de ADN y proteína durante el tiempo necesario para reparar una sola lesión y dejan la mancha poco después . Primero, todos los componentes de NER investigados, incluidos ERCC1 / XPF (Houtsmuller et al. 1999), XPB (Hoogstraten et al. 2002), XPA (Rademakers et al. 2003), XPC (Hoogstraten et al. 2008 Nishi et al. 2009). y XPG (Zotter et al. 2006) tienen tiempos de recuperación de fluorescencia similares y relativamente largos del orden de 3 a 5 min, y muestran fracciones inmóviles similares, dependiendo del número de lesiones presentes. En segundo lugar, el tiempo que lleva reparar por completo todas las lesiones monocatenarias inducidas por irradiación UV a 8 J / m 2 predicho sobre la base de estas mediciones de FRAP está de acuerdo con el tiempo de reparación total determinado por la incorporación de nucleótidos marcados en diferentes puntos de tiempo. después de la inducción de daños (Houtsmuller et al. 1999). Una imagen diferente surge de los estudios sobre la dinámica de la reparación de rotura de doble hebra (DSB), donde los tiempos de residencia de los factores individuales en los focos de DSB difieren considerablemente entre sí (por ejemplo, RAD54,

5 min y RAD51, establemente enlazados, ver Fig. 3a), y son en su mayoría mucho más cortos que la vida útil de los focos de DSB individuales, que es del orden de varias horas. Una explicación interesante, pero muy especulativa, de las interacciones muy rápidas observadas de RAD54 está relacionada con su capacidad para hidrolizar ATP de una manera dependiente de DSB (Swagemakers et al. 1998). Si su actividad principal en los focos DSB fuera hidrolizar ATP, es posible que durante cada visita a corto plazo, RAD54 suministre una pequeña cantidad de energía al hidrolizar algunos ATP, lo que impulsa el proceso de reparación en curso. Por el contrario, RAD51, que está asociado de forma muy estable a los focos DSB, puede tener una función de andamiaje. Así, a diferencia de lo que ocurre en NER, en la reparación de DSB, los factores individuales no residen en un foco de DSB durante toda su vida útil, pero en general tienen tiempos de residencia más cortos, que pueden corresponder al tiempo requerido para realizar acciones específicas dentro de todo el proceso de reparación. En la transcripción, la situación es probablemente más compleja, donde diferentes modelos pueden explicar pasos consecutivos, desde la unión inicial por factores reguladores como los receptores y cofactores de esteroides, que pueden actuar de manera similar a los factores NER (ver también más abajo), seguido del ensamblaje de los factores generales maquinaria de transcripción y finalizado con el lanzamiento de la ARN polimerasa II. El complejo de transcripción general puede comportarse de manera más similar al sistema de reparación de DSB, en el sentido de que los tiempos de residencia difieren considerablemente entre factores individuales, donde la proteína de unión a caja TATA TBP como parte de TFIID muestra tiempos de residencia relativamente largos, del orden de decenas de minutos (de Graaf et al. 2010), mientras que los tiempos de residencia de TFIIH son del orden de varios segundos en lugar de minutos (Hoogstraten et al. 2002). Una explicación especulativa de la unión a largo plazo de TBP, puede estar en la observación de que sus tiempos de residencia están influenciados por la presencia o ausencia de coactivadores o represores, donde estos últimos aumentan sus tiempos de unión, sugiriendo un papel regulador para TBP además de su función en la iniciación (de Graaf et al. 2010). Las interacciones muy rápidas de TFIIH en la transcripción contrastan con su comportamiento en la reparación de daños de una sola hebra, donde participa en complejos de reparación durante minutos (Hoogstraten et al. 2002). Curiosamente, no sólo TFIIH, sino que los factores de reparación en general parecen estar asociados de manera más estable con los complejos de reparación que los factores de transcripción con los complejos de iniciación de la transcripción (Fig. 3a). Una explicación atractiva para esto podría ser que el daño del ADN requiere una remoción urgente y está unido de manera estable por complejos de reparación, mientras que la transcripción (regulación) es un proceso continuo, que posiblemente requiera una atención menos estricta. En otras palabras, los factores de reparación hacen mejor su trabajo correctamente, mientras que los factores de transcripción pueden perder una o dos rondas.

Además de estas consideraciones especulativas, cabe señalar también que es muy probable, dada la naturaleza estocástica cada vez más reconocida de todo el comportamiento molecular en la célula, que no todos los eventos de unión observados sean realmente productivos. Se ha informado que se producen interacciones muy transitorias en el rango de los subsegundos a gran escala, junto con eventos de unión más prolongados. Por ejemplo, en la replicación del ADN y en la transcripción regulada por AR, las curvas FRAP experimentales se ajustan mejor a las curvas generadas por las simulaciones por computadora de Monte Carlo de un escenario en el que, además de los eventos de unión relativamente largos, la mayoría de las proteínas se unen transitoriamente al ADN (Xouri et al. al.2007 Tanner et al.2010). Estas interacciones también pueden contribuir a la difusión anómala observada discutida anteriormente y pueden representar eventos de unión específicos, que posiblemente conduzcan al deslizamiento a lo largo del ADN.

El FRAP ha sido fundamental para determinar los tiempos de residencia en los complejos ADN-proteína, pero se han explorado otros enfoques para abordar la cuestión de si los factores individuales se unen en un orden específico o preferido a los complejos en curso. Obviamente, los factores que identifican los objetivos en la cromatina, como los factores reguladores de la transcripción o los sensores de daño del ADN, son aglutinantes tempranos, pero existe menos conocimiento sobre el orden, si lo hay, en el que se unen las actividades posteriores (Dinant et al.2009 Coulon et al.2010) . En la reparación del ADN de las lesiones de una sola hebra, se demostró que en las líneas celulares de pacientes o mutantes, cada una de las cuales carecía de un factor específico, solo un subconjunto de las otras proteínas de reparación se ensamblaría en un punto de daño inducido localmente dentro del núcleo. Estos datos sugieren un orden definido de unión, donde la lesión monocatenaria se detecta primero y luego se estabiliza, desenrolla, corta y resintetiza. En la misma línea, pero explorando un enfoque alternativo en el que utilizaron irradiación ionizante de un volumen limitado en el núcleo, y siguieron el ensamblaje de varias proteínas reparadoras de DSB etiquetadas con GFP, se ha proporcionado una amplia evidencia de que estos factores se ensamblan en un orden específico. (Jazayeri et al. 2006 Essers et al. 2006). Después del daño del ADN inducido por IR, la ATM activada se une a Chk2 de manera muy transitoria, lo que da como resultado la activación y la detención del ciclo celular mediada por Chk2 (Lukas et al. 2003, 2004). Esta unión muy transitoria se contrasta con la unión del complejo Mre11-Rad50-Nbs1 (MRN) en el sitio de daño, que es seguida por la unión consecutiva de RPA, ATR, Chk1 y las proteínas del grupo RAD52 y otras (Jazayeri et al. 2006). Durante la existencia del holocomplejo, los factores involucrados se intercambian dinámicamente entre el complejo y el nucleoplasma, teniendo cada factor su propio tiempo de residencia promedio (Essers et al. 2005).

En una configuración experimentalmente diferente, los experimentos de inmunoprecipitación de cromatina (ChIP) en células sincronizadas en cultivo sugieren un patrón de unión cíclica en la transcripción regulada por hormonas, donde los receptores de estrógeno (RE), los cofactores y finalmente la maquinaria de transcripción general se unen de una manera más o menos definida. orden y liberación poco después del inicio de la transcripción, dejando el gen para una nueva ronda de unión (Metivier et al. 2003). Dado que los ciclos observados eran típicamente del orden de decenas de minutos, estos datos iniciaron la discusión sobre la interpretación de muchos de los experimentos FRAP anteriores sobre receptores nucleares que sugirieron un tiempo de unión mucho más corto del orden de decenas de segundos en lugar de minutos (por ejemplo, McNally et al.2000 Farla et al.2004, 2005 Schaaf y Cidlowski 2003 Rayasam et al.2005 Marcelli et al.2006 Klokk et al.2007 Meijsing et al.2007). Sin embargo, McNally y sus colaboradores proporcionaron una explicación para la aparente inconsistencia de los datos de ChIP y FRAP, quienes demostraron, combinando FRAP y mediciones unicelulares de ARN mensajero, ese intercambio rápido del factor de transcripción ACE1p inducible por cobre de levadura con cada copia. de una serie de endógenos CUP1 se producen promotores, pero que el número de sitios de unión disponibles en la matriz pasa por ciclos en una escala de tiempo más larga del orden de decenas de minutos (Karpova et al. 2008). Esto indica que durante la existencia de un complejo productivo, los componentes individuales pueden intercambiarse continuamente, similar al RAD54 en la reparación de DSB. De hecho, dicho intercambio se ha observado para las histonas, cuyo intercambio aumenta en áreas transcripcionalmente activas, pero también ocurre en otras áreas (Kimura et al. 2002).

La combinación de aceptor fotoblanqueo FRET y FRAP ha proporcionado un enfoque alternativo para investigar el orden de unión. En este método, el aumento y la subsiguiente pérdida de fluorescencia de la fluorescencia del donante de FRET en una pequeña región dentro del núcleo después de fotoblanquear el aceptor de FRET se compara con la recuperación de la fluorescencia del aceptor de FRET (van Royen et al. 2007). La aplicación de este enfoque a los receptores de andrógenos marcados doblemente con el par FRET CFP y YFP en los extremos N y C, reveló que los receptores de andrógenos experimentan un cambio transformacional después de unirse a las regiones reguladoras de genes regulados por andrógenos, y que este cambio descubre los sitios de unión. para los cofactores que les permiten unirse a las mismas regiones solo después de que los AR se hayan unido.

Además de unirse en un orden específico, también se ha demostrado que diferentes factores influyen, es decir, estimulan o inhiben, el comportamiento de unión de los demás. Por ejemplo, el receptor de glucocorticoides y la proteína 1 de la caja de grupo de alta movilidad interactúan cuando se unen a la cromatina y disminuyen la movilidad de los demás (Agresti et al.2005), lo que sugiere un mecanismo vinculante cooperativo. Otro ejemplo de comportamiento de unión cooperativa lo proporciona el análisis detallado del comportamiento dinámico de la histona H1 del enlazador. El análisis FRAP sofisticado de varias variantes de H1 truncadas marcadas con GFP, cada una de las cuales alberga dominios de unión a ADN definidos, reveló dos mecanismos de unión distintos a través de diferentes combinaciones de dominios y un estado de unión intermedio metaestable adicional (Stasevich et al. 2010). Estos tipos de reacciones de unión cooperativas no pueden describirse mediante un modelo de reacción de unión simple, sino que requieren un modelo de eventos de unión secuenciales o incluso modelos más complejos que incluyen la formación del complejo inicial (ver Fig. 4) (Mueller et al. 2010). Lo más probable es que estos eventos de unión complejos conduzcan a una mayor variabilidad en su cinética de unión y, en particular, a una tasa variable.


Las 3R del genoma: leer, escribir y regular

IMAGEN: Los investigadores han mapeado con precisión las ubicaciones de unión de más de 400 proteínas en el genoma de la levadura utilizando ChIP-exo. El método (arriba) utiliza un anticuerpo para "pescar" una proteína específica unida al ADN. ver más

Crédito: Pugh Lab, Cornell and Mahony Lab, Penn State

Un esfuerzo masivo para mapear las ubicaciones de unión precisas de más de 400 tipos diferentes de proteínas en el genoma de la levadura ha producido el mapa más completo y de alta resolución de la arquitectura cromosómica y la regulación genética hasta la fecha. El estudio revela dos arquitecturas reguladoras de genes distintas, ampliando el modelo tradicional de regulación de genes. Los llamados genes constitutivos, aquellos que realizan funciones básicas de `` mantenimiento '' y casi siempre están activos a niveles bajos, requieren solo un conjunto básico de controles regulatorios, mientras que aquellos que son activados por señales ambientales, conocidos como genes inducibles, tienen una arquitectura más especializada. . Este hallazgo en la levadura podría abrir la puerta a una mejor comprensión de la arquitectura reguladora del genoma humano.

Un artículo que describe la investigación de los científicos de Penn State y la Universidad de Cornell aparece el 10 de marzo de 2021 en la revista. Naturaleza.

"Cuando aprendí por primera vez sobre el ADN, me enseñaron a pensar en el genoma como una biblioteca que contiene todos los libros escritos", dijo Matthew J. Rossi, profesor asistente de investigación en Penn State y primer autor del artículo. “El genoma se almacena como parte de un complejo de ADN, ARN y proteínas, llamado 'cromatina'. Las interacciones de las proteínas y el ADN regulan cuándo y dónde se expresan los genes para producir ARN (es decir, leer un libro para aprender o hacer algo específico). Pero lo que siempre me pregunté fue, con toda esa complejidad, cómo se encuentra el libro correcto cuando ¿Lo necesita? Esa es la pregunta que estamos tratando de responder en este estudio ".

La forma en que una célula elige el libro correcto depende de las proteínas reguladoras y su interacción con el ADN en la cromatina, lo que se puede denominar la arquitectura reguladora del genoma. Las células de levadura pueden responder a los cambios en su entorno alterando esta arquitectura reguladora para activar o desactivar diferentes genes. En los organismos multicelulares, como los humanos, la diferencia entre las células musculares, las neuronas y cualquier otro tipo de célula se determina regulando el conjunto de genes que expresan esas células. Por lo tanto, descifrar los mecanismos que controlan esta expresión genética diferencial es vital para comprender las respuestas al medio ambiente, el desarrollo de los organismos y la evolución.

"Las proteínas deben ser reclutadas y ensambladas en genes para que se activen", dijo B. Franklin Pugh, profesor de biología molecular y genética en la Universidad de Cornell y líder del proyecto de investigación que se inició cuando era profesor. en Penn State. "Hemos reunido el mapa más completo y de alta resolución de estas proteínas que muestra las ubicaciones en las que se unen al genoma de la levadura y revela aspectos de cómo interactúan entre sí para regular la expresión génica".

El equipo utilizó una técnica llamada ChIP-exo, una versión de alta resolución de ChIP-seq, para mapear de manera precisa y reproducible las ubicaciones de unión de aproximadamente 400 proteínas diferentes que interactúan con el genoma de la levadura, algunas en algunas ubicaciones y otras en miles de ubicaciones. En ChIP-exo, las proteínas se entrecruzan químicamente con el ADN dentro de las células vivas, bloqueándolas en su posición. Luego, los cromosomas se extraen de las células y se cortan en pedazos más pequeños. Los anticuerpos se utilizan para capturar proteínas específicas y el fragmento de ADN al que están unidos. La ubicación de la interacción proteína-ADN se puede encontrar secuenciando el ADN unido a la proteína y mapeando la secuencia de regreso al genoma.

"En el tradicional ChIP-seq, las piezas de ADN adheridas a las proteínas siguen siendo bastante grandes y de longitud variable, que oscilan entre 100 y 500 pares de bases más allá del sitio de unión de la proteína real", dijo William K.M. Lai, profesor asistente de investigación en la Universidad de Cornell y autor del artículo. "En ChIP-exo, agregamos un paso adicional para recortar el ADN con una enzima llamada exonucleasa. Esto elimina cualquier exceso de ADN que no esté protegido por la proteína reticulada, lo que nos permite obtener una ubicación mucho más precisa para la unión. evento y para visualizar mejor las interacciones entre las proteínas ".

El equipo realizó más de 1200 experimentos ChIP-exo individuales que produjeron miles de millones de puntos de datos individuales. El análisis de los datos masivos aprovechó los grupos de supercomputación de Penn State y requirió el desarrollo de varias herramientas bioinformáticas novedosas, incluido un flujo de trabajo computacional multifacético diseñado para identificar patrones y revelar la organización de proteínas reguladoras en el genoma de la levadura.

El análisis, que es similar a seleccionar tipos repetidos de características en el suelo de cientos de imágenes de satélite, reveló un número sorprendentemente pequeño de conjuntos de proteínas únicos que se utilizan repetidamente en todo el genoma de la levadura.

"La resolución e integridad de los datos nos permitió identificar 21 ensamblajes de proteínas y también identificar la ausencia de señales de control reguladoras específicas en los genes de mantenimiento", dijo Shaun Mahony, profesor asistente de bioquímica y biología molecular en Penn State y autor de la papel. "Los métodos computacionales que hemos desarrollado para analizar estos datos podrían servir como punto de partida para un mayor desarrollo de estudios de regulación genética en organismos más complejos".

El modelo tradicional de regulación de genes involucra proteínas llamadas 'factores de transcripción' que se unen a secuencias de ADN específicas para controlar la expresión de un gen cercano. Sin embargo, los investigadores encontraron que la mayoría de los genes de la levadura no se adhieren a este modelo.

"Nos sorprendió descubrir que los genes internos carecían de una arquitectura de proteína-ADN que permitiera que se unieran factores de transcripción específicos, que es el sello distintivo de los genes inducibles", dijo Pugh. "Estos genes parecen necesitar un conjunto general de proteínas que permitan el acceso al ADN y su transcripción sin mucha necesidad de regulación. Aún está por verse si este patrón se mantiene o no en organismos multicelulares como los humanos. Es un proceso mucho más complejo propuesta, pero como la secuenciación del genoma de la levadura precedió a la secuenciación del genoma humano, estoy seguro de que eventualmente podremos ver la arquitectura reguladora del genoma humano en alta resolución ".

Además de Rossi, Pugh, Lai y Mahony, el equipo de investigación incluye a Prashant K. Kuntala, Naomi Yamada, Nitika Badjatia, Chitvan Mittal, Guray Kuzu, Kylie Bocklund, Nina P. Farrell, Thomas R. Blanda, Joshua D. Mairose , Ann V. Basting, Katelyn S. Mistretta, David J. Rocco, Emily S. Perkinson y Gretta D. Kellogg.

Este trabajo fue apoyado por los Institutos Nacionales de Salud de EE. UU., La Fundación Nacional de Ciencias de EE. UU., El Instituto Penn State para Ciencias Computacionales y de Datos y la Infraestructura Cibernética Avanzada (ROAR) en Penn State.

Descargo de responsabilidad: AAAS y EurekAlert! ¡no somos responsables de la precisión de los comunicados de prensa publicados en EurekAlert! por las instituciones contribuyentes o para el uso de cualquier información a través del sistema EurekAlert.


Velculescu VE, Zhang L, Zhou W, Vogelstein J, Basrai MA, Bassett DE, Hieter P, Vogelstein B, Kinzler KW: Caracterización del transcriptoma de levadura. Celda. 1997, 88: 243-251.

Hertz GZ, Hartzell GW, Stormo GD: Identificación de patrones de consenso en secuencias de ADN no alineadas que se sabe están relacionadas funcionalmente. Comput Appl Biosci. 1990, 6: 81-92.

Lawrence CE, Reilly AA: Un algoritmo de maximización de expectativas (EM) para la identificación y caracterización de sitios comunes en secuencias de biopolímeros no alineados. Proteínas 1990, 7: 41-51.

Waterman MS, Arratia R, Galas DJ: Reconocimiento de patrones en varias secuencias: consenso y alineación. Bull Math Biol. 1984, 46: 515-527.

Wolfertstetter F, Frech K, Herrmann G, Werner T: Identificación de elementos funcionales en secuencias de ácido nucleico no alineadas mediante un nuevo algoritmo de búsqueda de tuplas. Comput Appl Biosci. 1996, 12: 71-80.

van Helden J, Andre B, Collado-Vides J: Extracción de sitios reguladores de la región aguas arriba de genes de levadura mediante análisis computacional de frecuencias de oligonucleótidos. J Mol Biol. 1998, 281: 827-842. 10.1006 / jmbi.1998.1947.

Hughes JD, Estep PW, Tavazoie S, Church GM: Identificación computacional de elementos reguladores cis asociados con grupos de genes relacionados funcionalmente en Saccharomyces cerevisiae. J Mol Biol. 2000, 296: 1205-1214. 10.1006 / jmbi.2000.3519.

Brazma A, Jonassen I, Vilo J, Ukkonen E: Predicción de elementos reguladores de genes en silico a escala genómica. Genome Res. 1998, 8: 1202-1215.

Crowley EM: ​​un método bayesiano para encontrar segmentos reguladores en el ADN. Biopolímeros. 2001, 58: 165-174. 10.1002 / 1097-0282 (200102) 58: 2 & lt165 :: AID-BIP50 & gt3.0.CO2-O.

Huerta AM, Salgado H, Thieffry D, Collado-Vides J: RegulonDB: una base de datos sobre regulación transcripcional en Escherichia coli. Ácidos nucleicos Res. 1998, 26: 55-59. 10.1093 / nar / 26.1.55.

Salgado H, Santos-Zavaleta A, Gama-Castro S, Millan-Zarate D, Diaz-Peredo E, Sanchez-Solano F, Perez-Rueda E, Bonavides-Martinez C, Collado-Vides J: RegulonDB (versión 3.2): transcripcional regulación y operón en Escherichia coli K12. Ácidos nucleicos Res. 2001, 29: 72-74. 10.1093 / nar / 29.1.72.

van Helden J, Rios AF, Collado-Vides J: Descubrimiento de elementos reguladores en secuencias no codificantes mediante el análisis de díadas espaciadas. Ácidos nucleicos Res. 2000, 28: 1808-1818. 10.1093 / nar / 28.8.1808.

Hertz GZ, Stormo GD: Identificación de patrones de proteínas y ADN con alineaciones estadísticamente significativas de múltiples secuencias. Bioinformática. 1999, 15: 563-577. 10.1093 / bioinformatics / 15.7.563.

Gralla JD, Collado-Vides J: Organización y función de los elementos reguladores de la transcripción. En Biología Celular y Molecular: Escherichia coli y Salmonella. Editado por Neidhardt FC, Curtiss III R, Ingraham J, Lin ECC, Low KB, Magasanik B, Reznikoff W, Schaechter M, Umbarger HE, Riley M. Washington, DC: American Society for Microbiology ,. Editado por: Neidhardt FC, Curtiss III R, Ingraham J, Lin ECC, Low KB, Magasanik B, Reznikoff W, Schaechter M, Umbarger HE, Riley M. 1996, Washington, DC: American Society for Microbiology, 1232-1245.

Fernandez De Henestrosa AR, Ogi T, Aoyagi S, Chafin D, Hayes JJ, Ohmori H, Woodgate R: Identificación de genes adicionales que pertenecen al regulón LexA en Escherichia coli. Mol Microbiol. 2000, 35: 1560-1572. 10.1046 / j.1365-2958.2000.01826.x.

Herramientas de análisis de secuencia regulatoria. [http://embnet.cifn.unam.mx/

Blattner FR, Plunkett G, Bloch CA, Perna NT, Burland V, Riley M, Collado-Vides J, Glasner JD, Rode CK, Mayhew GF, et al: La secuencia completa del genoma de Escherichia coli K-12. Ciencias. 1997, 277: 1453-1474. 10.1126 / science.277.5331.1453.

Serres MH, Riley M: MultiFun, un esquema de clasificación multifuncional para Escherichia coli Productos genéticos K-12. Microb Comp Genomics. 2000, 5: 205-222.


Ver el vídeo: Cascadas de proteínas G. Fisiología (Enero 2022).