Información

¿Cómo reemplazar la región intrónica en un plásmido?

¿Cómo reemplazar la región intrónica en un plásmido?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Estoy considerando trabajar con el plásmido pRFHUE-eGFP y me gustaría reemplazar el intrón gpdA (que es la región promotora de eGFP) con un promotor de otro organismo.

¿Cuál sería una buena estrategia para reemplazar el intrón si ya tengo el otro gen en la mano? ¿Cortaría el fragmento entre los sitios de restricción SalI y SmaI y luego insertaría allí el nuevo promotor con proyecciones compatibles?


Su estrategia funcionaría, pero si es posible, sería mejor usar XmaI en lugar de SmaI, ya que este último es una enzima de corte de extremo romo.

Además, su estrategia no reemplazaría a toda la gpdA promotor, si eso es lo que buscas. Es posible que desee consultar su artículo, donde queda claro en la Fig.1 que la región promotora es mucho más larga que la región entre SalI y SmaI:


Muchas bacterias contienen elementos extracromosómicos de ADN llamados plásmidos. Suelen ser moléculas pequeñas (unos pocos 1000 pb), circulares, de doble hebra que se replican independientemente del cromosoma y pueden estar presentes en un elevado número de copias dentro de una célula. En la naturaleza, los plásmidos se pueden transferir entre individuos durante el apareamiento bacteriano y, a veces, incluso se transfieren entre diferentes especies. Los plásmidos son particularmente importantes en medicina porque a menudo portan genes de patogenicidad y resistencia a los medicamentos. En el laboratorio, los plásmidos se pueden insertar en bacterias en un proceso llamado transformación.

Para insertar un fragmento de ADN en un plásmido, tanto el fragmento como el plásmido circular se cortan usando una enzima de restricción que produce extremos compatibles (Figura ( PageIndex <1> )). Dada la gran cantidad de enzimas de restricción que están disponibles actualmente, generalmente no es demasiado difícil encontrar una enzima para la que estén presentes las secuencias de reconocimiento correspondientes tanto en el plásmido como en el fragmento de ADN, particularmente porque la mayoría de los vectores de plásmido utilizados en biología molecular han sido diseñados para contener sitios de reconocimiento para un gran número de endonucleasas de restricción.

Figura ( PageIndex <1> ): Clonación de un fragmento de ADN (rojo) en un vector plasmídico. El vector ya contiene un gen marcador seleccionable (azul) como un gen de resistencia a antibióticos. (Original-Deyholos-CC: AN)

Después de la digestión por restricción, los fragmentos deseados pueden purificarse o seleccionarse adicionalmente antes de mezclarse con ligasa para unirlos. Después de una breve incubación, los plásmidos recién ligados, que contienen el gen de interés, son transformado dentro E. coli. La transformación se logra mezclando el ADN ligado con E. coli células que han sido especialmente preparadas (es decir, hechas competente) para captar ADN. Se pueden producir células competentes mediante la exposición a compuestos como CaCl.2 oa campos eléctricos (electroporación). Debido a que solo una pequeña fracción de las células que se mezclan con el ADN se transformará realmente, una marcador seleccionable, como un gen de resistencia a los antibióticos, también suele estar presente en el plásmido. Después de la transformación (combinando ADN con células competentes), las bacterias se esparcen en una placa de agar bacteriano que contiene un antibiótico apropiado para que solo aquellas células que realmente hayan incorporado el plásmido puedan crecer y formar colonias. A continuación, puede seleccionarse y utilizarse para estudios posteriores.

Los biólogos moleculares utilizan plásmidos como vectores para contener, amplificar, transferir y, a veces, expresar genes de interés que están presentes en el ADN clonado. A menudo, el primer paso en un experimento de biología molecular es clon (es decir, copiar) un gen en un plásmido, luego transformar este plásmido recombinante nuevamente en bacterias para que se puedan hacer copias esencialmente ilimitadas del gen (y el plásmido que lo lleva) a medida que las bacterias se reproducen. Esta es una necesidad práctica para manipulaciones adicionales del ADN, ya que la mayoría de las técnicas de biología molecular no son lo suficientemente sensibles como para trabajar con una sola molécula a la vez. Muchos experimentos de clonación y recombinación molecular son, por tanto, procesos iterativos en los que:

  1. un fragmento de ADN (generalmente aislado por PCR y / o digestión de restricción) se clona en un plásmido cortado con una enzima de restricción compatible
  2. el plásmido recombinante se transforma en bacteria
  3. Se permite que las bacterias se multipliquen, generalmente en cultivo líquido.
  4. una gran cantidad de ADN plasmídico recombinante se aísla del cultivo bacteriano
  5. Se llevan a cabo manipulaciones adicionales (como mutagénesis dirigida al sitio o la introducción de otro fragmento de ADN) en el plásmido recombinante.
  6. el plásmido modificado se transforma nuevamente en bacterias, antes de manipulaciones adicionales, o para expresión

Una aplicación de la clonación molecular: producción de insulina recombinante

La proteína de insulina purificada es fundamental para el tratamiento de la diabetes. Antes de

En 1980, se aisló insulina para uso clínico de cadáveres humanos o de animales sacrificados como cerdos. La insulina de origen humano generalmente tiene mejores propiedades farmacológicas, pero su suministro es limitado y conlleva riesgos de transmisión de enfermedades. Al clonar el gen de la insulina humana y expresarlo en E. coli, se podrían producir grandes cantidades de insulina idéntica a la hormona humana en fermentadores, de manera segura y eficiente. La producción de insulina recombinante también permite la producción de variantes especializadas de la proteína: por ejemplo, cambiando algunos aminoácidos, se pueden producir formas de la hormona de acción más prolongada. La hormona insulina activa contiene dos fragmentos peptídicos de 21 y 30 aminoácidos, respectivamente. Hoy en día, esencialmente toda la insulina se produce a partir de fuentes recombinantes (Figura ( PageIndex <2> )), es decir, genes humanos y sus derivados expresados ​​en bacterias o levaduras.

Figura ( PageIndex <2> ): Un vial de insulina. Tenga en cuenta que la etiqueta indica el origen como & ldquorDNA & rdquo, que significa ADN recombinante (Flickr-DeathByBokeh-CC: AN).


Contenido

Longitud Editar

La UTR 5 'comienza en el sitio de inicio de la transcripción y termina un nucleótido (nt) antes de la secuencia de inicio (generalmente AUG) de la región codificante. En procariotas, la longitud de la 5 ′ UTR tiende a ser de 3 a 10 nucleótidos, mientras que en eucariotas tiende a tener entre 100 y varios miles de nucleótidos. [3] Por ejemplo, el ste11 transcripción en Schizosaccharomyces pombe tiene 2273 nucleótidos 5 ′ UTR [4] mientras que el laca operón en Escherichia coli solo tiene siete nucleótidos en su 5 ′ UTR. [5] Es probable que los diferentes tamaños se deban a la complejidad de la regulación eucariota que tiene la UTR 5 ′, así como al mayor complejo de preiniciación que debe formarse para comenzar la traducción.

El 5 ′ UTR también puede faltar por completo, en el caso de ARNm sin líder. Los ribosomas de los tres dominios de la vida aceptan y traducen dichos ARNm. [6] Estas secuencias se encuentran naturalmente en los tres dominios de la vida. Los seres humanos tienen muchos genes relacionados con la presión bajo un líder de 2 a 3 nucleótidos. Los mamíferos también tienen otros tipos de líderes ultracortos como la secuencia TISU. [7]

Elementos Editar

Los elementos de una UTR 5 'eucariota y procariota difieren enormemente. El 5 ′ UTR procariótico contiene un sitio de unión al ribosoma (RBS), también conocido como la secuencia de Shine-Dalgarno (AGGAGGU), que suele estar de 3 a 10 pares de bases aguas arriba del codón de iniciación. [5] Por el contrario, el 5 ′ UTR eucariota contiene la secuencia consenso de Kozak (ACCAUGG), que contiene el codón de iniciación. [5] El eucariota 5 ′ UTR también contiene cis-Elementos reguladores que actúan denominados marcos de lectura abiertos ascendentes (uORF) y AUG ascendentes (uAUG) y codones de terminación, que tienen un gran impacto en la regulación de la traducción (ver más abajo). A diferencia de los procariotas, las UTR 5 'pueden albergar intrones en eucariotas. Inhumanos,

El 35% de todos los genes albergan intrones dentro de la UTR 5 '. [8]

Estructura secundaria Editar

Como el 5 ′ UTR tiene un alto contenido de GC, a menudo se producen estructuras secundarias dentro de él. Los bucles de horquilla son una de esas estructuras secundarias que se pueden ubicar dentro de la UTR 5 '. Estas estructuras secundarias también afectan la regulación de la traducción. [9]

Procariotas Editar

En las bacterias, el inicio de la traducción ocurre cuando IF-3, junto con la subunidad ribosómica 30S, se unen a la secuencia Shine-Dalgarno (SD) de la UTR 5 ′. [5] Esto luego recluta muchas otras proteínas, como la subunidad ribosómica 50S, que permite que comience la traducción. Cada uno de estos pasos regula el inicio de la traducción.

La iniciación en Archaea se comprende menos. Las secuencias SD son mucho más raras y los factores de iniciación tienen más en común con los eucariotas. No hay homólogo de IF3 bacteriano. [10] Algunos ARNm no tienen líder. [11]

En ambos dominios, los genes sin secuencias de Shine-Dalgarno también se traducen de una manera menos conocida. Un requisito parece ser la falta de estructura secundaria cerca del codón de iniciación. [12]

Eucariotas Editar

Regulación compleja previa al inicio Editar

La regulación de la traducción en eucariotas es más compleja que en procariotas. Inicialmente, el complejo eIF4F se recluta en la tapa 5 ', que a su vez recluta el complejo ribosómico en la UTR 5'. Tanto eIF4E como eIF4G se unen a la UTR 5 ', lo que limita la velocidad a la que puede producirse el inicio de la traducción. Sin embargo, este no es el único paso regulatorio de la traducción que involucra el 5 ′ UTR.

Las proteínas de unión al ARN sirven a veces para evitar que se forme el complejo de preiniciación. Un ejemplo es la regulación de la msl2 gene. La proteína SXL se une a un segmento de intrón ubicado dentro del segmento 5 'UTR del transcrito primario, lo que conduce a la inclusión del intrón después del procesamiento. [13] Esta secuencia permite el reclutamiento de proteínas que se unen simultáneamente a las UTR 5 ′ y 3 ′, sin permitir que las proteínas de traducción se ensamblen. Sin embargo, también se ha observado que SXL también puede reprimir la traducción de ARN que no contienen una cola poli (A), o más generalmente, 3 'UTR.

Regulación de circuito cerrado Editar

Otro regulador importante de la traducción es la interacción entre 3 ′ UTR y 5 ′ UTR.

La estructura de circuito cerrado inhibe la traducción. Esto se ha observado en Xenopus laevis, en el que eIF4E unido a la tapa 5 'interactúa con Maskin unido a CPEB en la UTR 3', creando transcripciones traduccionalmente inactivas. Esta inhibición de la traducción se levanta una vez que se fosforila CPEB, desplazando el sitio de unión de Maskin, lo que permite la polimerización de la cola de PolyA, que puede reclutar la maquinaria de traducción por medio de PABP. [14] Sin embargo, es importante señalar que este mecanismo ha sido objeto de un gran escrutinio. [15]

Regulación de ferritina Editar

Los niveles de hierro en las células se mantienen mediante la regulación de la traducción de muchas proteínas implicadas en el almacenamiento y metabolismo del hierro. El 5 ′ UTR tiene la capacidad de formar una estructura secundaria de bucle en horquilla (conocida como elemento de respuesta al hierro o IRE) que es reconocida por las proteínas reguladoras del hierro (IRP1 e IRP2). En niveles bajos de hierro, el ORF del ARNm diana se bloquea como resultado del impedimento estérico de la unión de IRP1 e IRP2 al IRE. Cuando el hierro es alto, las dos proteínas reguladoras del hierro no se unen con tanta fuerza y ​​permiten que se expresen las proteínas que tienen un papel en el control de la concentración de hierro. Esta función ha ganado cierto interés después de que se reveló que la traducción de la proteína precursora de amiloide puede verse alterada debido a un polimorfismo de un solo nucleótido al IRE que se encuentra en la 5 ′ UTR de su ARNm, lo que conduce a un aumento espontáneo del riesgo de enfermedad de Alzheimer. [dieciséis]

UORF y reiniciación Editar

Otra forma de regulación de la traducción en eucariotas proviene de elementos únicos en la UTR 5 'llamados marcos de lectura abiertos aguas arriba (uORF). Estos elementos son bastante comunes y se encuentran en el 35-49% de todos los genes humanos. [17] Un uORF es una secuencia codificante ubicada en la UTR 5 'ubicada aguas arriba del sitio de inicio de las secuencias codificantes. Estos uORF contienen su propio codón de iniciación, conocido como AUG ascendente (uAUG). Los ribosomas pueden escanear este codón y luego traducirlo para crear un producto, [18] que puede regular la traducción de la secuencia codificante de la proteína principal u otros uORF que pueden existir en la misma transcripción.

La traducción de la proteína dentro del ORF principal después de que se ha traducido una secuencia de uORF se conoce como reiniciación. [19] Se sabe que el proceso de reinicio reduce la traducción de la proteína ORF. El control de la regulación de proteínas está determinado por la distancia entre el uORF y el primer codón en el ORF principal. [19] Se ha encontrado que un uORF aumenta la reiniciación con la mayor distancia entre su uAUG y el codón de inicio del ORF principal, lo que indica que el ribosoma necesita readquirir factores de traducción antes de que pueda llevar a cabo la traducción de la proteína principal. [19] Por ejemplo, ATF4 la regulación se realiza mediante dos uORF más corriente arriba, denominados uORF1 y uORF2, que contienen tres aminoácidos y cincuenta y nueve aminoácidos, respectivamente. La ubicación de uORF2 se superpone con la ATF4 ORF. Durante condiciones normales, el uORF1 se traduce, y luego la traducción de uORF2 ocurre solo después de que se ha vuelto a adquirir eIF2-TC. La traducción del uORF2 requiere que los ribosomas pasen por el ATF4 ORF, cuyo codón de inicio se encuentra dentro de uORF2. Esto conduce a su represión. Sin embargo, durante condiciones de estrés, el ribosoma 40S evitará uORF2 debido a una disminución en la concentración de eIF2-TC, lo que significa que el ribosoma no adquiere uno a tiempo para traducir uORF2. En lugar de, ATF4 se traduce. [19]

Otros mecanismos Editar

Además de la reiniciación, los uORF contribuyen a la iniciación de la traducción en función de:

  • Los nucleótidos de un uORF pueden codificar un codón que conduce a un ARNm altamente estructurado, lo que hace que el ribosoma se detenga. [19]
  • Regulación cis y trans en la traducción de la secuencia codificante de la proteína principal. [19]
  • Interacciones con sitios IRES. [19]

Sitios de entrada de ribosomas internos y virus Editar

Las UTR 5 'virales (así como algunas eucariotas) contienen sitios internos de entrada de ribosomas, que es un método de activación traslacional independiente del casquete. En lugar de construir un complejo en el límite 5 ', el IRES permite la unión directa de los complejos ribosomales a la transcripción para comenzar la traducción. [20] El IRES permite que la transcripción viral se traduzca de manera más eficiente debido a la falta de necesidad de un complejo de preinitación, lo que permite que el virus se replique rápidamente. [5]

Msl-2 transcripción editar

Transcripción del msl-2 La transcripción está regulada por múltiples sitios de unión para mosca. Sxl en el 5 ′ UTR. [1] En particular, estos sitios de poli-uracilo se encuentran cerca de un pequeño intrón que se empalma en los machos, pero se mantiene en las hembras mediante la inhibición del empalme. Esta inhibición de empalme se mantiene mediante Sxl. [1] Cuando está presente, Sxl reprimirá la traducción de msl2 aumentando la traducción de un codón de inicio ubicado en un uORF en la UTR 5 '(ver más arriba para obtener más información sobre uORF). También, Sxl supera a TIA-1 en una región poli (U) y evita el reclutamiento de snRNP (un paso en el empalme alternativo) en el sitio de empalme 5 '. [1]


Resultados

Conjuntos de datos

Para calcular las probabilidades patogénicas de los iSNV, construimos un conjunto de entrenamiento combinando los iSNV patógenos curados manualmente en el HGMD y los iSNV supuestamente neutrales de la fase 3 del Proyecto 1000 Genomas (Fig.1 y archivo adicional 1: Figura S1). Los iSNV neutrales documentados en el conjunto de datos de 1000 genomas se derivaron de datos de secuenciación del genoma de 2500 individuos que carecen de fenotipos clínicos obvios [1]. Para minimizar los falsos negativos en nuestro conjunto de entrenamiento, solo incluimos iSNV con frecuencia de alelos menores (MAF) superior al 10%. Esta selección dio como resultado 2438 iSNV patógenos y 2,104,613 neutrales.

Flujo de trabajo. a Fuentes de datos para la construcción de modelos. Se recolectaron iSNV patógenos y neutrales de HGMD y 1000 Genomes Project, respectivamente. B Para los iSNV se consideraron tres categorías de características, a saber, empalme de ARN, estructura de proteínas y conservación evolutiva. Las fuentes de datos y los números de estas características se enumeran al lado. Para obtener detalles adicionales sobre las fuentes de datos, consulte la sección "Métodos". C Flujo lógico para el desarrollo del modelo de predicción, así como la evaluación del modelo y la validación de resultados.

Dado que la proximidad de un iSNV al sitio de empalme-unión puede afectar el resultado del empalme a través de diferentes mecanismos moleculares, dividimos aún más los iSNV seleccionados en aquellos proximales y distales a los sitios de empalme-unión. Por ejemplo, las variantes próximas a los sitios de unión de empalme (on-ss) pueden interferir directamente con la formación del espliceosoma, mientras que los iSNV distales de los sitios de unión (off-ss) pueden afectar la unión de proteínas de unión a ARN reguladoras (RBP). Los sitios de unión de empalme se definieron como los 13 pb ascendentes para los sitios aceptores 3 'y los 7 pb descendentes para los sitios donantes 5' [42]. En total, hubo 1865 iSNV patógenos on-ss y 573 off-ss y 3386 on-ss y 2,104,613 iSNVs neutrales off-ss. Estos datos revelaron que las variantes patógenas se encontraron con mayor frecuencia en las regiones próximas a los sitios de empalme-unión en comparación con las variantes neutrales (archivo adicional 1: Figura S2). Para evitar el sesgo potencial introducido por las distancias variables de los iSNV desde los sitios de unión, seleccionamos al azar 852 iSNV neutrales fuera de ss del conjunto de datos de 1000 genomas al hacer coincidir la distribución de distancias de las variantes patógenas de HGMD. Esto aseguró conjuntos de datos más equilibrados con distribuciones de distancia similares entre las variantes patógenas y neutrales.

Para cada uno de los conjuntos de datos patógenos y neutrales on-ss y off-ss, seleccionamos al azar dos tercios de los datos para su uso como el conjunto de formación para construir un clasificador de bosque aleatorio (archivo adicional 1: Figura S1). El tercio restante de los datos se utilizó como conjunto de prueba. Para probar aún más el rendimiento del modelo, también extrajimos iSNV patógenos y neutrales de la base de datos ClinVar como un conjunto de prueba independiente [41], que incluyó 121 iSNV patógenos on-ss y 51 off-ss y 167 on-ss y 883 off-ss iSNV neutrales (consulte la sección “Métodos” para obtener más detalles).

Para seleccionar características que discriminen de manera óptima iSNV patógenos y neutrales, clasificamos todas las características en tres categorías: (i) características de empalme, caracterizando cómo los iSNV individuales afectan la regulación de empalme (ii) características estructurales, evaluando cómo la inclusión / exclusión inducida por iSNV de los exones empalmados alternativamente afectan las funciones de las proteínas y (iii) las características de conservación evolutiva, midiendo las puntuaciones de conservación de base de nucleótidos de 99 genomas de vertebrados (Fig. 1).En estas tres categorías, 360 de las 438 características mostraron un poder significativo en la separación de los iSNV en ss patógenos y neutrales, mientras que 194 de las 436 características separaron los iSNV fuera de ss según la prueba de suma de rangos de Wilcoxon con un valor ajustado. pag value & lt 0.05 (Fig.2 y archivo adicional 2: Tabla S1).

Evaluación de funciones. Importancia de la diferencia en las puntuaciones de características entre los iSNV patógenos y neutrales. a on-ss iSNV. B off-ss iSNV. Las características eran de tres categorías: empalme (gris), estructura de proteínas (rojo) y conservación evolutiva (azul). Consulte también Archivo adicional 2: Tabla S1 para obtener más detalles. En la trama, cada punto representa una característica. los X-axis es (el valor absoluto de) la mediana delta de la característica, calculada como la "puntuación media de los iSNV patógenos" menos la "puntuación media de los iSNV neutrales" de la característica particular. Los cálculos de las puntuaciones de las características se describieron en la sección "Métodos". los y-eje es el valor de significación de la diferencia de puntuación basada en la prueba de suma de rangos de Wilcoxon (pag valores ajustados por FDR y transformados por - log10, con un límite de 10 −10 para visualización). Debido a los grandes rangos dinámicos de los valores de las características, las medianas delta se volvieron a escalar al rango [- 1, 1]: X’ = 2 × (X - min (X)) / (máx. (X) - min (X)) − 1

Los iSNV que causan enfermedades afectan el empalme alternativo

Para evaluar el impacto de un iSNV en la regulación del empalme, se consideraron dos medidas: (i) las puntuaciones de unión de empalme asociadas con exones proximales en las direcciones 5 ′ y 3 ′, así como la desviación de la puntuación de unión de la variante de el alelo de referencia, y (ii) la diferencia inducida por iSNV en la afinidad de unión a RBP. La puntuación de empalme-unión se calculó mediante matrices ponderadas de posición (PWM) que miden las características de la secuencia alrededor de los sitios de unión canónica (consulte la sección “Métodos” para obtener más detalles) [42]. Es más probable que las puntuaciones más altas incluyan los exones correspondientes en el ARNm resultante. Nuestros resultados mostraron que los iSNV patógenos se asociaron con mayor frecuencia con puntuaciones más bajas de empalme-unión. La puntuación mediana de la unión de los iSNV patógenos on-ss fue de 7,37 y 7,11 para los sitios donantes y aceptores, respectivamente, en comparación con 7,95 y 7,84 para los iSNV neutrales (ajustada pag valor 0.017 y 1.35 × 10 −7, respectivamente) (Archivo adicional 2: Tabla S1). Para los iSNV patógenos off-ss, la mediana de las puntuaciones de unión fueron 7,63 y 7,95 para los sitios donantes y aceptores, en comparación con 8,13 y 8,54 para los iSNV neutrales off-ss (ajustados pag valor 0.018 y 9.0 × 10 −4, respectivamente) (Archivo adicional 2: Tabla S1). Además de las puntuaciones de unión, se calculó la desviación de la puntuación de unión resultante de cada iSNV on-ss. Los valores de desviación mediana para los iSNV patógenos fueron -2,96 y -2,23 para los sitios donantes y aceptores, respectivamente. La magnitud de estas desviaciones fue significativamente mayor que la de los iSNV neutrales, que fueron 0.034 y - 0.059 para los sitios donantes y aceptores, respectivamente (archivo adicional 1: Figura S3). La prueba de suma de rangos de Wilcoxon ajustada pag los valores para los sitios donantes y aceptores fueron 1,63 × 10 −211 y 1,28 × 10 −143, respectivamente (Archivo adicional 2: Tabla S1 y Archivo adicional 1: Figura S3). Estos resultados indican que los iSNV patógenos están fuertemente asociados con la omisión de exón.

Para evaluar el impacto de un iSNV en la unión de RBP, calculamos tanto la magnitud como la probabilidad de cambios en la puntuación de unión causados ​​por los iSNV para 201 RBP con PWM conocidas. Encontramos que los iSNV patógenos y neutrales mostraron diferencias significativas en la unión de muchas RBP. Generalmente, los iSNV patógenos on-ss y off-ss indujeron grandes cambios en la puntuación de unión en 191 y 176 RBP, respectivamente, en comparación con los respectivos iSNV neutros. Específicamente, 137 RBP mostraron diferencias significativas en las puntuaciones de unión inducidas por iSNV entre variantes patógenas y neutrales on-ss, mientras que 43 RBP mostraron diferencias significativas entre variantes patógenas y neutrales off-ss (prueba de suma de rangos de Wilcoxon ajustada pag value & lt 0.05 Archivo adicional 2: Tabla S1 y Archivo adicional 1: Figura S4). Tomados en conjunto, estos hallazgos proporcionan una fuerte evidencia de que los iSNV patógenos afectan la regulación del empalme y dan como resultado estructuras de ARNm alteradas.

Los iSNV que causan enfermedades están asociados con exones que codifican dominios proteicos funcionalmente importantes.

Para evaluar el impacto de los iSNV en la función de las proteínas, examinamos las características estructurales correspondientes a los posibles exones empalmados alternativamente. Planteamos la hipótesis de que los iSNV patógenos interrumpen el empalme de exones que codifican dominios estructurales de proteínas clave. Capturamos las características estructurales de la proteína para los exones vecinos más cercanos de los iSNV, incluida la puntuación de trastorno intrínseco, la estructura secundaria (por ejemplo, hélice alfa, hoja beta o bobina aleatoria) y áreas de superficie accesibles a solventes (ASA) (archivo adicional 2: Tabla S1 ) [43, 44]. También calculamos el porcentaje de superposición del exón objetivo con dominios proteicos conocidos, así como el número de sitios conocidos de modificación postraduccional dentro del dominio proteico codificado por el exón (Archivo adicional 2: Tabla S1) [45, 46].

Encontramos que los exones cercanos a los iSNV patógenos tenían más probabilidades de codificar dominios de proteínas que tenían puntuaciones de trastorno promedio más bajas y contenían regiones estructuradas más largas, en comparación con los exones proximales a los iSNV neutrales (prueba de suma de rangos de Wilcoxon ajustada pag valor 2,03 × 10 −11 y 0,0497 para iSNV on-ss y off-ss, respectivamente) (Archivo adicional 2: Tabla S1 y Archivo adicional 1: Figura S5). Este resultado indica que los iSNV patógenos tienen una mayor probabilidad de ser proximales a los exones que codifican regiones estructuradas. Además, los exones proximales de los iSNV patógenos tenían puntuaciones ASA promedio significativamente más pequeñas (ajustadas pag valor 2,90 × 10 -13 y 0,0103 para iSNV on-ss y off-ss, respectivamente), lo que indica que es más probable que codifiquen regiones en el núcleo de la proteína en lugar de regiones en la superficie de la proteína. Además, los exones más cercanos a los iSNV patógenos codificaron un porcentaje significativamente mayor de residuos que se superpusieron con dominios proteicos conocidos (ajustados pag valor 1,91 × 10 −16 y 1,98 × 10 −5 para iSNV on-ss y off-ss, respectivamente). Tomados en conjunto, estos resultados muestran que es más probable que los exones próximos a los iSNV patógenos codifiquen regiones proteicas funcionalmente importantes. Por otro lado, nuestro análisis también sugiere que las características estructurales de las proteínas proporcionan información valiosa para priorizar los iSNV que causan enfermedades.

Los iSNV que causan enfermedades se localizan en regiones conservadas

Estudios anteriores demostraron que la conservación evolutiva es una característica importante en la evaluación del potencial causante de enfermedades de las SNV [47, 48]. Para determinar si un iSNV se conservó evolutivamente, calculamos la puntuación de conservación PhyloP 100-way del locus iSNV y la puntuación de conservación media de una región que flanquea cada lado del iSNV candidato por una longitud de 3 pb y 7 pb. Nuestros resultados mostraron que los iSNV patógenos tenían puntuaciones de conservación PhyloP significativamente más altas que los iSNV neutrales (archivo adicional 1: Figura S6). La puntuación mediana de conservación para los loci de iSNV patógenos on-ss fue de 3,08, que fue significativamente más alta que la puntuación de - 0,03 para los iSNV neutrales on-ss (prueba de suma de rangos de Wilcoxon ajustada pag valor & lt 1 × 10 −300). Asimismo, la puntuación media para los loci de iSNV patógenos fuera de ss fue de 0,31, en comparación con - 0,28 para los iSNV neutrales fuera de ss (ajustada pag valor 3,21 × 10 −38). Las grandes puntuaciones PhyloP positivas para los loci de iSNV patógenos sugirieron que evolucionaron mucho más lentamente que los loci neutrales. Las puntuaciones de conservación para las regiones flanqueantes de 3 pb y 7 pb fueron coherentes con las puntuaciones de los loci de iSNV. Para las regiones flanqueantes de 3 pb alrededor de los iSNV patógenos on-ss y off-ss, las medianas respectivas de sus puntuaciones medias de conservación fueron 2,86 y 0,23, en comparación con 0,58 y - 0,07 para los iSNV neutrales (ajustados pag valores 1 × 10 −300 y 5,47 × 10 −23, respectivamente). También se encontraron resultados similares para las regiones flanqueantes de 7 pb. Estos hallazgos indican que los iSNV en loci más conservados tienen más probabilidades de ser patógenos.

Construcción, desempeño y evaluación de modelos RegSNPs-intron

Con base en el empalme, la estructura de la proteína y las características de conservación evolutiva descritas anteriormente (archivo adicional 2: Tabla S1), se construyeron clasificadores forestales aleatorios para iSNV on-ss y off-ss, respectivamente. Los modelos se construyeron sobre el conjunto de entrenamiento (dos tercios del conjunto de datos original) y sus poderes predictivos se evaluaron en el conjunto de validación (un tercio del conjunto de datos original). Los hiperparámetros, como el número de árboles y la profundidad máxima, se optimizaron mediante la búsqueda en cuadrícula con una validación cruzada triple en el conjunto de entrenamiento. Para los iSNV on-ss, el modelo de bosque aleatorio contenía 52 árboles con la profundidad máxima de 13. Para los iSNV off-ss, se construyeron 59 árboles con la profundidad máxima de 20. Los modelos on-ss y off-ss resultantes constituyen RegSNPs-intron.

Según el conjunto de validación (un tercio del conjunto de datos original, no utilizado en el entrenamiento del modelo), el intrón de RegSNP alcanzó un AUROC (área bajo la curva característica operativa del receptor) de 0,96 y un coeficiente de correlación de Matthews (MCC) de 0,79 para on- ss iSNV y superaron tanto a SPANR como a CADD (AUROC 0,77 y 0,81, respectivamente, Fig. 3a). Para los iSNV fuera de ss, el AUROC del intrón de RegSNP fue de 0,84 (MCC 0,52), en comparación con los AUROC de SPANR y CADD de 0,54 y 0,69, respectivamente (Fig. 3d). Aquí, también calculamos el AUPR (área bajo la curva de recuperación de precisión) ya que los números de iSNV patógenos y neutrales podrían estar desequilibrados. Para iSNV on-ss, RegSNPs-intron tuvo un AUPR de 0,94, en comparación con 0,70 y 0,71 para SPANR y CADD, respectivamente (archivo adicional 1: Figura S7A). El AUPR dado por RegSNPs-intron para iSNVs fuera de ss fue 0,77, en comparación con SPANR y CADD AUPR de 0,47 y 0,62, respectivamente (archivo adicional 1: Figura S7C). Nuestros resultados sugieren que la inclusión de características estructurales de proteínas codificadas por los exones proximales, que no son utilizados por SPANR o CADD, aumenta significativamente el rendimiento del intrón RegSNP en la predicción de patogenicidad variante.

Modelo de desempeño, evaluación y análisis. aC On-ss iSNV. a Curvas de características operativas del receptor (ROC) de RegSNPs-intrón (verde sólido), SPANR (azul punteado) y CADD (naranja discontinuo) en el conjunto de validación. B Puntos de corte de probabilidad seleccionados basados ​​en la tasa de falsos positivos (sólido) y la tasa de verdaderos positivos (discontinua). Las dos líneas de puntos indican FPR = 0.05 y 0.1, respectivamente. Los iSNV con FPR & lt 0.05 son Perjudicial, aquellos con 0.05 ≤ FPR & lt 0.1 son Posiblemente dañino, y los iSNV con FPR ≥ 0,1 son Benigno. C ROC de RegSNPs-intron (verde sólido) y SPANR (azul punteado) en el equipo de prueba ClinVar independiente. Se excluyó CADD ya que se utilizó ClinVar en su entrenamiento de modelos. DF ISNV desactivados, igual que aC

Para evaluar más a fondo los poderes predictivos de las características relacionadas con el empalme, la estructura y la conservación, construimos modelos separados basados ​​en características de cada una de estas tres categorías. Para los iSNV on-ss, los AUROC para el empalme, la estructura y las características de conservación fueron 0,92, 0,72 y 0,92, respectivamente, para los iSNV off-ss, los AUROC fueron 0,75, 0,63 y 0,68, respectivamente (Archivo adicional 1: Figura S8) . Estos resultados demuestran que cada categoría de características proporciona información importante en la predicción del modelo y, por lo tanto, la combinación de las tres categorías produce el mayor rendimiento.

Para controlar la tasa de falsos positivos (FPR) de los resultados de la predicción, informamos los iSNV con FPR & lt 0.05 como Perjudicial, iSNV con 0.05 ≤ FPR & lt 0.1 como Posiblemente dañinoy iSNV con FPR ≥ 0,1 como Benigno. El reportado Perjudicial La categoría tenía tasas de verdaderos positivos (TPR) de 0,85 y 0,45 para iSNV on-ss y off-ss, respectivamente, mientras que TPR para el Posiblemente dañino categoría fueron 0,90 y 0,52 para iSNV con y sin ss (Fig. 3b, e).

Evaluación del rendimiento del modelo utilizando un conjunto de prueba independiente

Además, evaluamos el rendimiento del intrón de RegSNP con un conjunto de datos independiente de ClinVar (descrito anteriormente). Todos los iSNV de ClinVar que también se observaron en conjuntos de datos de HGMD o 1000 genomas se excluyeron del conjunto de entrenamiento para evitar el sobreajuste. De acuerdo con los resultados descritos anteriormente, el modelo RegSNPs-intrón mostró un mejor rendimiento en comparación con SPANR. Los AUROC del intrón de RegSNP fueron 0,96 y 0,95 para los iSNV on-ss y off-ss, respectivamente, mientras que los AUROC de SPANR fueron 0,89 y 0,72 para los iSNV on-ss y off-ss, respectivamente (Fig. 3c, f). De manera similar, RegSNPs-intron mostró AUPRs más altos. Las RegSNPs-intron AUPRs fueron 0,92 y 0,66 para iSNV on-ss y off-ss, mientras que las AUPR de SPANR fueron 0,87 y 0,06, respectivamente (archivo adicional 1: Figura S7B y D). No incluimos CADD en la comparación aquí, ya que los datos de ClinVar se utilizaron en su entrenamiento del modelo original [17]. Estos resultados sugieren que RegSNPs-intron exhibe un rendimiento estable y una mayor precisión de predicción en comparación con SPANR en diferentes conjuntos de datos.

La frecuencia alélica se correlacionó inversamente con la probabilidad de causar enfermedad.

Generalmente, la frecuencia de alelos en la población debe reflejar la importancia de la función biológica de una variante [49,50,51,52,53]. Por lo tanto, examinamos la relación entre la frecuencia de los alelos y la probabilidad predicha de causar enfermedad de los iSNV obtenidos del Exome Aggregation Consortium (ExAC) y el Genotype-Tissue Expression Project (GTEx), respectivamente. Nos centramos en las escalas baja (0,0–0,25) y media (0,0–0,50) de frecuencia alélica, donde los iSNV se dividieron en 20 bins. Para cada intervalo, se calculó la probabilidad promedio de causar enfermedad para todos los iSNV. Se observaron correlaciones negativas entre la frecuencia de los alelos y la probabilidad de causar enfermedades en una escala baja o media para los iSNV on-ss y off-ss. Específicamente, para la escala baja, las correlaciones son las siguientes: ExAC R = - 0.832 y GTEx R = - 0,849 para iSNV on-ss y ExAC R = - 0,686 y GTEx R = - 0.313 para iSNV sin SS (Fig. 4a, c). Para la escala media, las correlaciones son las siguientes: ExAC R = - 0,650 y GTEx R = - 0.603 para iSNV en SS y ExAC R = - 0.834 y GTEx R = - 0,844 para iSNV fuera de SS (Fig. 4b, d). Este resultado concuerda con los hallazgos de otros autores de que es menos probable que ocurran variantes con mayor probabilidad de causar enfermedades en la población general [34]. Las distribuciones de las frecuencias de los alelos menores (MAF), en las escalas baja y media, para todos los iSNV de ExAC y GTEx se proporcionan en el archivo adicional 1: Figura S9.

Correlaciones de la probabilidad de causar enfermedad con la frecuencia alélica o el número de iSNV cercanos para el exón. a, B On-ss iSNV. Correlación entre la probabilidad de causar enfermedades y la frecuencia de los alelos. Se dividieron veinte contenedores en función de las frecuencias alélicas de los iSNV recopilados de ExAC y GTEx. los X- y y-los ejes son la frecuencia de alelos promedio y la probabilidad de causar enfermedad predicha para cada grupo. a Frecuencia alélica escalada de 0,00 a 0,25. B Frecuencia alélica escalada de 0,00 a 0,50. C, D ISNV desactivados, igual que a, B. mi Correlación entre la probabilidad de causar enfermedad y el número de iSNVs vecinos al exón. los X-eje es el número de iSNVs vecinos al exón (dentro de los 300 pb desde la unión). Cada valor en el y-eje es la probabilidad promedio (predicha) de causar enfermedad de todos los exones que tienen el número de iSNVs vecinos indicado por el valor correspondiente en el X-eje

Los iSNV que causan enfermedades ocurren cerca de los exones asociados con una alta probabilidad de causar enfermedades.

Además, evaluamos las predicciones de intrones de RegSNP mediante la investigación de la importancia funcional de los exones proximales a los iSNV. Planteamos la hipótesis de que los exones funcionalmente importantes no toleran los iSNV cercanos. Para probar esta hipótesis, extrajimos 75,119 exones que tenían al menos 1 iSNV dentro de ± 300 pb de los límites exón-intrón según los datos de ExAC. Se seleccionó aleatoriamente un iSNV por exón y se predijo la probabilidad de causar la enfermedad utilizando el intrón RegSNP. Se promediaron los valores de probabilidad para todos los exones que tienen el mismo número de iSNVs vecinos (dentro de ± 300 pb desde la unión). Se observó una correlación negativa significativa entre la probabilidad promedio de causar enfermedad y el número de iSNVs vecinos al exón (R = − 0.92, pag valor = 6.26 × 10 −11) (Fig. 4e). El mismo análisis también se realizó en 160.230 exones basados ​​en datos de secuenciación del genoma completo de GTEx. Se observó una correlación negativa similar (R = − 0.78, pag valor = 0,07). Este resultado indica que los iSNV patógenos tienden a aparecer cerca de exones funcionalmente importantes.

Priorizar variantes intrónicas funcionales asociadas con la citotoxicidad inducida por fármacos

Aplicamos RegSNPs-intron para priorizar las variantes intrónicas que están asociadas con la sensibilidad celular a la citotoxicidad inducida por clofarabina. Anteriormente hemos realizado estudios de asociación de genoma completo (GWAS) para el fenotipo de respuesta a clofarabina (AUC para curvas de citotoxicidad inducidas por fármacos) utilizando 90 líneas de células linfoblastoides (LCL) internacionales HapMap de la población CEU [54]. SNVs moderadamente asociados con la citotoxicidad de clofarabina (pag valor ≤ 0,05) se seleccionaron como marcadores de semillas. Los 15.634 iSNV que estaban en desequilibrio de ligamiento (LD) con los marcadores de semillas y estaban ubicados dentro de ± 300 pb de la unión de empalme se usaron en las predicciones. Entre estas variantes candidatas, se predijo que 622 y 84 iSNV serían Perjudicial (FPR ≤ 0.05) y Posiblemente dañino (0.05 & lt FPR ≤ 0.1), respectivamente (706 en total), y se predijo que 14,928 iSNVs serían Benigno (FPR & gt 0,1).

Validación experimental utilizando el ensayo ASSET-seq

Para validar experimentalmente los efectos de los iSNV priorizados en el resultado del empalme, diseñamos un ensayo informador funcional de alto rendimiento llamado ASSET-seq que implica insertar un oligo que contiene un iSNV en un plásmido Exontrap modificado (Fig. 5a) [55]. El impacto en el resultado de empalme del iSNV probado se midió como la diferencia entre las proporciones respectivas de las lecturas de secuenciación que respaldan las transcripciones empalmadas y aberrantes (incluidas las no empalmadas) para los alelos de referencia y alternativos. La diferencia en las proporciones para los dos tipos de resultados de empalme entre los alelos de referencia y alternativos se analizó mediante un modelo de efectos mixtos (consulte la sección "Métodos").

Validación experimental por ASSET-seq. a Diseño de plásmido del ensayo de empalme. El oligo de inserción incluye 11 pb del exón proximal más los primeros 60 pb del intrón que contiene el iSNV de genes individuales (mostrado en naranja), así como el exón del plásmido universal (22 pb, recuadro rojo) y el intrón (línea negra de 19 pb ) segmentos de homología para una inserción perfecta en el vector. El ARN se transcribe en células transfectadas desde la señal 5'-UTR a la poli-A. Se utilizan cebadores de PCR (flechas rojas) para amplificar la transcripción de ARN.El ensayo produce transcripciones empalmadas o no empalmadas (así como otras isoformas aberrantes). Promotor, LTR RSV SD, sitio donante de empalme SA, sitio aceptor de empalme. B Resumen de resultados experimentales en tres líneas celulares. Ref, alelo de referencia Alt, alelo alternativo. El color azul indica un iSNV que induce una disminución significativa en los productos empalmados (FDR ≤ 0.1) el azul claro indica una disminución de los productos empalmados que no es significativa (FDR & gt 0.1). El rojo indica un aumento significativo para los productos empalmados, mientras que el rojo claro indica un aumento insignificante. Los recuadros vacíos son ensayos fallidos que eran no evaluables. Se omitieron los iSNV no evaluables en las tres líneas celulares (20 en total). La tasa de validación (por línea celular) es el porcentaje de ensayos que muestran un resultado significativo en todos los ensayos evaluables. C Ejemplo de una alteración del resultado de empalme inducida por iSNV. El iSNV (rs6538694) suprimió la formación del producto indicador empalmado, como se indica consistentemente en las tres líneas celulares (pag valores ≤ 4,6 × 10 −5). los y-axis es la relación log2 de lecturas perfectamente empalmadas (P) a lecturas aberrantes (NP, no perfectas y sin empalmar). pag Los valores fueron ajustados por FDR contra todos los iSNV probados. D Consistencia de resultados en múltiples líneas celulares. los X-eje es la razón de posibilidades log2 de productos empalmados y aberrantes (con respecto a los alelos de referencia y alternativos) para HeLa, y y- y z- los ejes son las razones de probabilidades log2 para HepG2 y HEK293, respectivamente. Las líneas celulares se compararon por parejas para los iSNV evaluables en ambas líneas celulares. Correlaciones de Pearson: HeLa versus HEK293 = 0,857 (puntos azules, pag valor = 1.02 × 10 −22), HeLa versus HepG2 = 0.959 (puntos rojos, pag valor = 6,66 × 10 −40) y HEK293 frente a HepG2 = 0,894 (puntos verdes, pag valor = 6,65 × 10 −29). Las líneas continuas en azul oscuro, rojo y verde marcan las correlaciones respectivas

Usamos ASSET-seq para probar los efectos de 82 iSNV en los resultados del empalme en 3 líneas celulares humanas diferentes: HeLa, HEK293 y HepG2. Estas líneas celulares, que se originan a partir de tres tipos de tejidos diferentes, se usan comúnmente en estudios de investigación y se usaron para demostrar la variabilidad en la actividad de empalme entre diferentes tejidos. Además, también ejemplifican la reproducibilidad técnica del ensayo, además de permitir futuros estudios que relacionen el análisis de empalme con resultados biológicos moleculares. Las 82 variantes de prueba se eligieron entre los 706 candidatos de intrón de RegSNP priorizados (FPR ≤ 0,1) por estar ubicados en el intrón en el lado 3 'del exón de prueba y dentro de los 60 nt de la unión exón-intrón, según el diseño del ensayo. requisitos (ver detalles en la sección "Métodos"). Al eliminar 20 ensayos fallidos (p. Ej., Resultantes de transfección o falla de PCR), los porcentajes de los 62 iSNV restantes que mostraron un impacto de empalme significativo, es decir, tasas de validación, para las 3 líneas celulares fueron HeLa 64,4%, HEK293 96,6% y HepG2 64,7 % (FDR ≤ 0,1 de acuerdo con el FPR Fig. 5b y archivo adicional 3: Tabla S2). Un ejemplo específico, rs6538694 en el HAL gen, se muestra en la Fig. 5c. En las tres líneas celulares (cinco réplicas cada una), se observó un porcentaje significativamente mayor de productos génicos empalmados para el alelo de referencia en comparación con el alelo alternativo (pag valores ≤ 4,6 × 10 −5). Para el alelo de referencia, el porcentaje medio de lecturas de secuenciación que respaldan el producto del gen empalmado fue del 88,4%, mientras que este porcentaje se redujo al 57,1% para el alelo alternativo. Además, observamos una alta consistencia para los impactos de los iSNV individuales en los resultados del empalme en las múltiples líneas celulares (Fig. 5d).


Reemplazos e inserciones de genes en el arroz mediante el direccionamiento de intrones mediante CRISPR – Cas9

Se han aprovechado las nucleasas específicas de secuencia para crear knockouts de genes dirigidos en varias plantas 1, pero la sustitución de un fragmento e incluso la obtención de inserciones de genes en loci específicos de los genomas de las plantas sigue siendo un desafío serio. Aquí, informamos enfoques eficientes de inserción y reemplazo de genes específicos de sitio mediados por intrones que generan mutaciones utilizando la vía de unión de extremos no homólogos (NHEJ) utilizando las repeticiones palindrómicas cortas agrupadas regularmente interespaciadas (CRISPR) - proteína asociada a CRISPR 9 (Cas9) sistema. Utilizando un par de ARN guía único (ARNsg) dirigidos a intrones adyacentes y una plantilla de ADN donante que incluye el mismo par de sitios de ARNsg, logramos reemplazos de genes en el gen endógeno del arroz 5-enolpiruvilshikimato-3-fosfato sintasa (EPSPS) a una frecuencia del 2,0%. También obtuvimos inserciones de genes dirigidos a una frecuencia del 2,2% utilizando un sgRNA dirigido a un intrón y una plantilla de ADN donante que incluye el mismo sitio de sgRNA. Plantas de arroz que albergan el OsEPSPS El gen con las sustituciones deseadas era resistente al glifosato. Además, los reemplazos e inserciones de genes específicos del sitio se transmitieron fielmente a la siguiente generación. Estos enfoques recientemente desarrollados pueden usarse generalmente para reemplazar fragmentos de genes dirigidos e insertar secuencias de ADN exógenas en sitios genómicos específicos en arroz y otras plantas.

El sistema procariótico CRISPR-Cas9 de tipo II se ha utilizado para generar roturas de doble cadena de ADN (DSB) 2-4 dirigidas, que estimulan la reparación del ADN mediante dos mecanismos principales: unión de extremos no homólogos (NHEJ) y recombinación homóloga 5. NHEJ es el proceso dominante en el que los extremos rotos del ADN simplemente se vuelven a unir 6. Sin embargo, este proceso es propenso a errores, creando pequeñas inserciones y / o deleciones (indeles) en la ruptura, y se ha aprovechado para crear knockouts de genes específicos en múltiples tipos de células y organismos, incluidas las plantas 7,8. La recombinación homóloga es un proceso menos frecuente pero de alta fidelidad, en el que se pueden crear reemplazos e inserciones de genes dirigidos utilizando un ADN de donante homólogo 9,10. Estos cambios han sido de gran valor para los estudios de genómica funcional en plantas y pueden ayudar a crear rasgos agronómicamente valiosos. Sin embargo, la generación de modificaciones precisas, como mutaciones puntuales, reemplazos de genes y genes knock-ins por recombinación homóloga sigue siendo un desafío serio 11. Sólo se ha informado de un puñado de casos en los que los genes de plantas endógenas se modificaron con precisión mediante recombinación homóloga, e incluso el éxito en estos casos se basó generalmente en el uso de esquemas de selección diseñados específicamente 11-19. Existe una necesidad apremiante de métodos simples, universales y eficientes para reemplazar o incorporar fragmentos de ADN a cualquier gen objetivo. Dado que NHEJ es el proceso de reparación dominante y las alteraciones menores de la secuencia intrónica pueden no afectar el empalme alternativo y el nivel de expresión del gen objetivo, elegimos modificar los intrones con Cas9 para generar los mismos resultados que se lograron mediante la recombinación homóloga. Aquí, describimos métodos de selección de intrones que utilizan la vía NHEJ para generar reemplazos e inserciones de genes que crean plantas de arroz resistentes al glifosato.


Discusión

La expresión de proteína recombinante en células de mamífero es a menudo baja e inestable. Se sabe que el nivel de expresión del transgén de un sistema de expresión de mamífero se correlaciona principalmente con el vector de expresión, por lo que el uso de un vector de expresión óptimo es un requisito principal para la expresión de alto nivel del transgén en células de mamífero. El vector de expresión suele estar controlado por elementos reguladores 18-20, que normalmente existen en regiones no codificantes, tales como potenciadores y promotores cadena arriba y elementos de poliadenilación y terminador en regiones cadena abajo de los genes 21-24. Los intrones, como secuencias de ADN no codificantes, tienen la función de regular la expresión génica en eucariotas mediante una variedad de mecanismos, como mejorar la actividad del proceso de la ARN polimerasa II, promover la interacción entre proteínas de corte y empalme y ciertos factores de transcripción, conectando y facilitando múltiples tipos de Mecanismos de procesamiento de ARN y que afectan la exportación de ARNm nuclear, la eficiencia de traducción y la desintegración del ARN 25-27. Debido a que el CMV tiene una alta eficiencia en una amplia gama de tipos de células y se convierte en el promotor más popular para la expresión de proteínas recombinantes 28, su potencia se puede mejorar aún más por la presencia de su intrón aguas abajo 29, 30.

En el presente estudio, comparamos el efecto de cinco elementos intrones colocados en regiones aguas abajo de los genes en los niveles de expresión transgénica en células CHO transfectadas y encontramos que SVI es un elemento intrón fuerte y potente que aumenta la expresión transgénica en células CHO transfectadas. Primero usamos el gen informador eGFP que se usa con frecuencia para evaluar el efecto de regulación del elemento que actúa en cis. El gen eGFP se usó generalmente por primera vez para estudiar el efecto del elemento que actúa en cis sobre la expresión del transgén y luego se estudiaron más a fondo los genes de interés (GOI), como el anticuerpo y otras proteínas. Los estudios anteriores mostraron que el nivel de expresión de GOI era consistente con el gen informador de eGFP 31-33.

Descubrimos que los elementos del intrón SVI pueden producir la mayor eficiencia de transfección. La eficiencia de la transfección está influenciada por el tamaño del vector hasta cierto punto, pero la estructura y configuración del vector tuvo efectos significativos sobre la eficiencia de la transfección. En el presente estudio, el tamaño de los cinco elementos intrónicos usados ​​hCMVI, TPLI, IVSI, SVI y CHEFI fue el siguiente: SVI & lt IVSI & lt TPLI & lt hCMVI & lt CHEFI. Sin embargo, el SVI mostró la mayor eficiencia de transfección, seguido de IVSI, TPLI, hCMVI y CHEFI. Los resultados fueron consistentes con los resultados de algunos otros elementos que actúan en cis 34.

En las transfecciones estables, en comparación con el intrón IVS, los vectores que contienen el intrón SV40 mejoran los niveles de expresión de eGFP en aproximadamente 4,39 veces en la célula CHO, y el efecto de otros intrones fue consistente con los resultados de las transfecciones transitorias. Se ha informado que varios elementos intrones pueden mejorar la expresión transgénica en el sistema de células animales de mamíferos, como el intrón A de hCMV tuvo un efecto positivo en las expresiones génicas en transfecciones transitorias y estables en células de riñón de mono, fibroblasto de prepucio humano, células HeLa, CHO -K1 y HEK 293 celdas 35-37. El primer intrón de EF-1α humano podría mejorar el nivel de expresión génica en las líneas celulares HeLa y CHO. et al. 39. En general, estos informes demostraron que el intrón posicionado corriente arriba del casete de expresión ejercía una expresión génica de alto nivel. Nuestros resultados primero demostraron que SVI puede mejorar la expresión transgénica en células CHO y demostraron que hCMVI y SVI posicionados corriente abajo del casete de expresión pueden mejorar la expresión transgénica. Sin embargo, en este estudio, en comparación con el intrón IVS, el intrón TPL y el intrón1 del gen CHEF1 no mejoraron el transgén, la función de regulación de diferentes intrones es diversa y la razón puede estar relacionada con el tipo de línea celular, vector, promotor y componente de intrones. Por ejemplo, los intrones de TPL y CHEFI contienen muchos más motivos de unión al factor de transcripción (TFB) pero no mejoraron la expresión del transgén cadena abajo del casete de expresión, los hallazgos nos llevaron a proponer que los intrones contienen un mayor número de motivos de TFB que pueden ser adecuados para posicionamiento corriente arriba del casete de expresión. El intrón SV40 contiene solo 99nt y se ha encontrado que aumenta la eficiencia de corte y empalme y transporta ARNm 40-42 mucho más eficiente. En este estudio, el intrón SV40 posicionado aguas abajo del casete de expresión da como resultado la expresión transgénica más alta, este resultado puede ser relativo a la función de empalme críptico, aumentando la longitud de la cola de poli A, aumentando la vida media del ARNm y la tasa de traducción.

Para investigar más a fondo el efecto del intrón fuerte sobre la expresión del gen de interés, evaluamos la expresión de la proteína EPO secretada terapéuticamente, mediada por el intrón SV40 y IVS en condiciones de cultivo de medio sin suero. De acuerdo con la expresión del gen eGFP, el nivel de expresión de EPO en células CHO transfectadas con el vector que contiene el intrón SV40 fue significativamente mayor que el de las células transfectadas con el vector que contiene el intrón IVS.

En conclusión, primero investigamos sistemáticamente el efecto de cinco intrones sobre la expresión del transgén en células CHO transfectadas y descubrimos que el intrón SV40 puede aumentar eficazmente la expresión del transgén, que puede ser un elemento regulador muy útil para la expresión de alto nivel de proteínas recombinantes en células CHO.


DISCUSIÓN

La secuenciación de próxima generación (NGS) y otros datos de muchos estudios publicados en los últimos años han confirmado nuestra observación original de retención del intrón 10 en NXF1 ARNm (Braunschweig et al., 2014 Boutz et al., 2015 Cho et al., 2015). Por tanto, está bien establecido que este NXF1 La isoforma de ARNm se expresa en múltiples líneas celulares, así como en muchos tejidos humanos y de ratón normales. Sin embargo, aunque nuestro trabajo anterior mostró que sNxf1, que se traduce a partir de este ARNm, podría detectarse en líneas celulares cancerosas, la expresión de esta proteína en células y tejidos normales ha permanecido inexplorada, al igual que su función potencial.

Retención del intrón 10 en el NXF1 El ARNm crea un codón de terminación prematura (PTC), lo que lo convierte en un candidato principal para NMD (para una revisión reciente, ver (Kurosaki y Maquat, 2016). Por lo tanto, aunque el ARNm que retiene el intrón 10 puede exportarse al citoplasma debido a la Se podría predecir que los mecanismos de CTE y NMD previenen la expresión estable de proteínas en el citoplasma. A pesar de este dogma predominante, los datos presentados aquí demuestran claramente que sNxf1 se expresa en células y tejidos normales de mamíferos, incluidas varias áreas del cerebro. Sin embargo, aunque El ARNm que retiene el intrón 10 parece estar relativamente altamente expresado en la mayoría de las células, la expresión de proteína estable solo se observa en algunas células. Esto sugiere la posibilidad de mecanismos desconocidos que regulen la traducción y / o la estabilidad de la proteína expresada después de la exportación al citoplasma. .

Nuestros experimentos en secciones de cerebro de rata, utilizando anticuerpos específicos para visualizar sNxf1, demuestran que la proteína se expresa en neuronas neocorticales y en neuronas en múltiples áreas del hipocampo. En las regiones neocorticales, la proteína se localiza en el núcleo y el citoplasma en estructuras que parecen ser gránulos neuronales. Además, la proteína se colocaliza con Stau2SS en gránulos en células neuronales N2a en cultivo, lo que sugiere un posible papel de la proteína en el tráfico de ARN citoplásmico en el cerebro después de la exportación nuclear.

La proteína sNxf1 retiene el dominio de unión al ARN de Nxf1, por lo que se esperaría que pudiera unirse a CTE y otros ARNm, pero carece de los dominios que interactúan con las proteínas del complejo de poro nuclear. Por tanto, por sí solo, no se esperaría que funcionara como un receptor de exportación nucleocitoplasmático. Sin embargo, hemos demostrado que las proteínas Nxf1 pequeñas y grandes pueden dimerizar a través de sus dominios terminales NH2, por lo que planteamos la hipótesis de que un dímero Nxf1 / sNxf1 es la unidad funcional durante la exportación.

Cuando un ARNm informador del VIH con un intrón retenido se exporta al citoplasma con la ayuda de un CTE, la asociación de polirribosomas y la expresión de proteínas aumentan en gran medida por la sobreexpresión de Nxf1 y su cofactor Nxt1 (Jin et al., 2003 Bor et al., 2006). Esto sugiere efectos de Nxf1 / Nxt1 a nivel citoplásmico, más allá del papel de este complejo en la exportación nucleocitoplasmática. En los experimentos presentados aquí, hemos demostrado que la coexpresión de Nxf1 grande y pequeña, sin expresión de Nxt1, también puede promover la asociación y traducción de polirribosomas y que sNxf1 está presente en los polirribosomas. Por tanto, el heterodímero Nxf1 probablemente puede servir para promover tanto la exportación como la expresión citoplásmica de ARNm que contienen un intrón retenido y un CTE (o elemento similar a CTE). Varios otros genes (por ejemplo, ACTN4 y SIRT7) contienen elementos que pueden funcionar como CTE (Bor et al., 2006). Actualmente estamos ampliando la estrategia de trampa de vectores que se utilizó para identificarlos, junto con NGS, para identificar CTE funcionales adicionales y genes que pueden estar regulados de esta manera.

Existe una aceptación cada vez mayor de que los ARNm con intrones retenidos están muy extendidos en las células de mamíferos (Buckley et al., 2011 Yap et al., 2012 Braunschweig et al., 2014 Boutz et al., 2015). Sin embargo, debido a las bien conocidas restricciones de exportación de ARNm con intrones retenidos (Chang y Sharp, 1989 Legrain y Rosbash, 1989 Hammarskjold, 1997), y al hecho de que muchos de estos ARNm contienen PTC que los convierten en dianas de NMD, la expresión de proteínas a menudo no se ha analizado en estudios que informan sobre retención de intrones. Con base en los datos presentados aquí, parece razonable especular que, si los ARNm con intrones retenidos contienen elementos que funcionan como CTE, es posible que no solo se exporten, sino que también es probable que se traduzcan en proteínas, al menos en algunas células. Sin embargo, la medida en que este mecanismo funciona para regular la expresión génica permanece en gran parte inexplorada más allá de los sistemas virales.

Aunque la retención nuclear de ARNm con intrones retenidos se ha estudiado durante muchos años, el mecanismo molecular de retención y los vínculos entre la exportación y la traducción nucleares todavía no se comprenden bien. Se ha propuesto que la escisión de intrones deja una "marca" en el ARN que permite el reclutamiento de Nxf1 y que esto conduce a la formación de un ARNm competente para la exportación (Le Hir et al., 2000 Huang et al., 2004 Muller-McNicoll et al., 2016). Sin embargo, en el NXF1 ARNm que retiene solo el intrón 10, se eliminan múltiples intrones tanto 5 'como 3' de este intrón, dejando múltiples marcas de "unión exón". Sin embargo, este ARNm no se exporta en ausencia de un CTE funcional que reclute Nxf1. Por tanto, debe haber un mecanismo que retenga el ARNm en el núcleo hasta que se hayan eliminado todos los demás intrones. Es posible que todos los intrones con la excepción del intrón 10 se eliminen cotranscripcionalmente (Carrillo Oesterreich et al., 2016), mientras que el intrón 10 se empalma más tarde y más lentamente para crear el empalme completo NXF1 ARNm. Sin embargo, esto no explica por qué, una vez que el ARNm se "libera" de la maquinaria de transcripción, no se exporta a menos que el ARNm contenga un CTE. Hemos informado anteriormente que la proteína de la cesta nuclear Tpr puede estar involucrada en un mecanismo de "corrección de pruebas" para evitar la exportación no regulada de ARNm con intrones retenidos (Coyle et al., 2011), similar al papel propuesto para las proteínas 1 y 2 similares a la miosina de levadura en ciernes (Mlp1 / Mlp2 Galy et al., 2004 Capó et al., 2015 Saroufim et al., 2015). También ha habido informes que sugieren que el dominio no POU que contiene proteína de unión al octámero (Nono / Nrb54) y otras proteínas paraspeckle pueden desempeñar un papel en la retención (Chen y Carmichael, 2009). Sin embargo, es evidente que se necesitan más estudios que aborden este tema.

Recientemente hemos demostrado que el NXF1 El CTE está altamente conservado entre las especies de mamíferos y que un elemento con una notable homología de secuencia primaria y secundaria también se encuentra en el NXF1 gen de los peces teleósteos (Wang et al., 2015). El CTE de pez cebra funciona de manera eficiente para reemplazar Rev / RRE en el contexto de construcciones informadoras del VIH en células 293T humanas, especialmente junto con Nxf1 y Nxt1 de la misma especie. Esto indica que un CTE junto con Nxf1 / Nxt1 es un mecanismo altamente conservado que se ha utilizado a lo largo de la evolución de los vertebrados. Hemos iniciado experimentos en ratones utilizando la tecnología CRISPR-Cas9 para interrumpir específicamente NXF1 CTE funciona mediante la creación de pequeñas eliminaciones en el CTE para que no funcione. Se esperaría que esto permitiera la expresión de la proteína "grande" de Nxf1 en ausencia de sNxf1 y debería arrojar luz sobre las funciones específicas de sNxf1 en el cerebro y otros órganos.

Las células neuronales muestran patrones de empalme alternativos muy complejos y variables (para una revisión reciente, consulte Vuong et al., 2016), y la retención de intrones es común (Buckley et al., 2011). Además, se ha sugerido que la NMD puede modularse negativamente durante la diferenciación neuronal (Bruno et al., 2011). los NXF1 El gen es parte de una familia multigénica de la que se ha demostrado que varios miembros funcionan en las células neuronales. Factor de exportación de ARN nuclear 5 (NXF5) en humanos (llamado factor de exportación de ARN nuclear 7 [NXF7] en roedores) se ha relacionado con la plasticidad sináptica del hipocampo (Callaerts-Vegh et al., 2015), así como el retraso mental (Frints et al., 2003), y las proteínas expresadas a partir de este gen solo están presentes en el cerebro y los testículos (Jun et al., 2001). Hasta la fecha, solo se ha demostrado que estas proteínas están involucradas en el transporte de ARNm citoplasmático. NXF5 se encuentra en el cromosoma X, al igual que el factor de exportación de ARN nuclear 2 (NXF2) y varios otros NXF miembros de la familia (Jun et al., 2001). Nxf2 se expresa altamente en el hipocampo y otras neuronas y funciona en la exportación nucleocitoplasmática (Herold et al., 2000 Sasaki et al., 2005 Tretyakova et al., 2005 Zhang et al., 2007). También se ha informado que esta proteína desestabiliza NXF1 El ARNm y solo niveles bajos de la proteína Nxf1 de "longitud completa" se expresan en las neuronas del hipocampo (Zhang et al., 2007). Un estudio reciente identificó NXF1 Isoforma de ARNm que retiene el intrón 10 en polirribosomas aislados de neuronas del hipocampo de ratón mediante análisis RNASeq (Cho et al., 2015). Estos resultados son consistentes con los datos presentados aquí, que muestran la expresión de la proteína sNxf1 en el hipocampo de rata. Será de claro interés analizar este conjunto de datos en busca de otros ARNm que contengan intrones retenidos y determinar si alguno de estos ARNm contiene CTE funcionales o depende de sNxf1 para su exportación y traducción. Puede ser que la exportación y expresión de proteínas a partir de ARNm con intrones retenidos sea una característica importante de la expresión génica neuronal, y las proteínas Nxf pueden desempeñar funciones importantes en la regulación de esto, contribuyendo en última instancia a la plasticidad neuronal.


Sondas o cebadores que abarcan intrones - (27 / Abr / 2005)

¿Por qué debería seleccionar sondas o cebadores que abarquen intrones cuando diseño para secuencias de cDNA en RT-qPCR?

Al expandir un intrón con sus cebadores / sondas, evita amplificar cualquier ADN genómico contaminante (que contiene intrones).

¿Debo abarcar todo el intrón o solo la unión entre el exón y el intrón? ¿Cómo puedo prevenir la amplificación del ADN genómico ya que tiene muchos intrones y no solo un intrón?

No he realizado ninguna RT-PCR en tiempo real y no sé si los cebadores que abarcan intrones ayudarán porque no va a ver las bandas.

El propósito de que los cebadores abarquen intrones es diferenciar si una banda se amplifica a partir de ADN genómico o ADNc. Si su ARN está contaminado con ADN y los cebadores abarcan uno o más intrones, obtendrá dos bandas con una del ADNc y la otra del ADN. Es mejor dejar que los cebadores abarquen intrones que no sean tan grandes para que pueda obtener la banda extra si hay contaminación. Otra estrategia es dejar que al menos uno de los cebadores puentee una unión exón-exón. Pero prefiero lo primero. Para saber más sobre el diseño de cebadores RT-PCR, consulte este http://www.protocol-online.org/forums/inde. showtopic = 2706

Solo he oído hablar de las uniones exón-intrón, pero me he dado cuenta de que utilizaba las uniones exón-exón. ¿Existe este cruce?


Cómo diseñar una cartilla

Los cebadores de oligonucleótidos son necesarios cuando se realiza una reacción de PCR. Es necesario diseñar cebadores que sean complementarios a la región plantilla del ADN. Se sintetizan químicamente uniendo nucleótidos. Uno debe bloquear selectivamente y desbloquear repetidamente los grupos reactivos en un nucleótido cuando se agrega un nucleótido de uno en uno. La principal propiedad de los cebadores es que deben corresponder a las secuencias de la molécula molde (deben ser complementarias a la cadena molde). Sin embargo, no es necesario que los cebadores se correspondan completamente con la hebra molde; sin embargo, es esencial que el extremo 3 'del cebador corresponda completamente con la hebra de ADN molde para que pueda continuar el alargamiento. Por lo general, se usa una guanina o citosina en el extremo 3 'y el extremo 5' del cebador generalmente tiene tramos de varios nucleótidos. Además, ambos extremos 3 'de los cebadores hibridados deben apuntar uno hacia el otro.

El tamaño de la imprimación también es muy importante. Los cebadores cortos se utilizan principalmente para amplificar un fragmento de ADN pequeño y simple. Por otro lado, se usa un cebador largo para amplificar una muestra de ADN genómico eucariota. Sin embargo, una imprimación no debe ser demasiado larga (> imprimaciones 30-mer) ni demasiado corta. Los cebadores cortos producen un producto de amplificación de ADN impreciso e inespecífico, y los cebadores largos dan como resultado una velocidad de hibridación más lenta. En promedio, el fragmento de ADN que debe amplificarse debe tener un tamaño de entre 1 y 10 kB.

La estructura de la imprimación debe ser relativamente simple y no contener una estructura secundaria interna para evitar el plegado interno. También es necesario evitar la hibridación cebador-cebador que crea dímeros de cebador e interrumpe el proceso de amplificación. Al diseñar, si no está seguro de qué nucleótido colocar en una determinada posición dentro del cebador, se puede incluir más de un nucleótido en esa posición denominada sitio mixto. También se puede usar un inserto molecular basado en nucleótidos (inosina) en lugar de un nucleótido regular para capacidades de emparejamiento más amplias.


Plásmidos: definición, tipos y replicación | Microbiología

En este artículo discutiremos: - 1. Definición de plásmidos 2. Naturaleza física y número de copias de plásmidos 3. Propiedades 4. Incompatibilidad 5. Tipos 6. Replicación 7. Curado de plásmidos 8. Uso de plásmidos como vectores de conos.

Definición de plásmidos:

Además del cromosoma bacteriano (nucleoide), las células bacterianas normalmente contienen elementos genéticos en su citoplasma. Estos elementos genéticos existen y se replican por separado del cromosoma y se denominan plásmidos. La mera existencia de plásmidos en el citoplasma bacteriano fue revelada por Lederberg en 1952 mientras trabajaba en el proceso de conjugación en bacterias.

Lederberg acuñó el término & # 8216plasmid & # 8217 para referirse a los elementos genéticos transmisibles que se transfirieron de una célula bacteriana a otra y determinaron la masculinidad de las bacterias.

Literalmente, ahora se conocen miles de plásmidos, se han aislado más de 300 plásmidos naturales diferentes de cepas de Escherichia coli sola. Además de los plásmidos naturales, se han desarrollado muchos plásmidos modificados artificialmente y se han utilizado como vectores en el proceso de clonación de genes (ingeniería genética).

Naturaleza física y número de copias de plásmidos:

La naturaleza física de los plásmidos es bastante simple. Son pequeñas moléculas de ADN de doble hebra. La mayoría de los plásmidos son circulares, pero también se conocen muchos plásmidos lineales.

Los plásmidos de origen natural varían en tamaño desde aproximadamente 1 kilobase hasta más de 1 megabase, y se considera que un ADN plásmido típico tiene menos del 5% del tamaño del cromosoma bacteriano. La mayor parte del ADN plasmídico aislado de células bacterianas existe en la configuración de superenrollamiento, que es la forma más compacta de ADN que existe dentro de la célula.

El número de copias se refiere al hecho de que diferentes plásmidos ocurren en las células en diferentes números. Algunos plásmidos están presentes en la célula en solo 1-3 copias, mientras que otros pueden estar presentes en más de 100 copias. El número de copias está controlado por genes en el plásmido y por interacciones entre el huésped y el plásmido.

Propiedades de los plásmidos:

(i) Son específicos de una o unas pocas bacterias en particular.

(ii) Se replican independientemente del cromosoma bacteriano.

(iii) Codifican para su propia transferencia.

(iv) Actúan como episomas y se integran reversiblemente en el cromosoma bacteriano.

(v) Pueden recoger y transferir ciertos genes del cromosoma bacteriano,

(vi) Pueden afectar ciertas características de la célula bacteriana,

(vii) Los plásmidos se diferencian de los virus en dos aspectos.

(viii) No causan daño a las células y generalmente son beneficiosos.

(ix) No tienen formas extracelulares y existen dentro de las células simplemente como ADN libre y típicamente circular.

Incompatibilidad de plásmidos:

En algunos casos, una sola célula bacteriana contiene varios tipos diferentes de plásmidos. Borrelia burgdorferi que causa la enfermedad de Lyme, por conveniencia, posee 17 plásmidos circulares y lineales diferentes.

En una condición en la que un plásmido se transfiere a una nueva célula bacteriana que ya posee otro plásmido, se observa comúnmente que el segundo plásmido (transferido) no se acomoda y se pierde durante la replicación posterior.

Esta condición se llama incompatibilidad de plásmidos y se dice que los dos plásmidos son incompatibles. Se han reconocido varios grupos de incompatibilidad de plásmidos en bacterias. Los plásmidos de un grupo de incompatibilidad se excluyen entre sí de la replicación en la célula, pero generalmente coexisten con plásmidos de otros grupos.

Los plásmidos de un grupo de incompatibilidad comparten un mecanismo común de regular su replicación y, por lo tanto, están relacionados entre sí. Por lo tanto, aunque una célula bacteriana puede poseer varios tipos de plásmidos, cada uno es genéticamente distinto.

Tipos de plásmidos:

Varios tipos de plásmidos se encuentran naturalmente en las células bacterianas, y la clasificación más favorecida de tales plásmidos se basa en sus funciones principales codificadas por sus propios genes.

A continuación se muestran los principales tipos de plásmidos reconocidos sobre la base del rasgo característico mencionado anteriormente:

1. Plásmido F (o factor F):

El plásmido F o factor F (& # 8220F & # 8221 significa fertilidad) es el plásmido muy bien caracterizado. Desempeña un papel importante en la conjugación en la bacteria E. coli y fue el primero en ser descrito. Es este plásmido el que confiere & # 8216 masculinidad & # 8217 a las células bacterianas. El término "factor sexual" también se utiliza para referirse al plásmido F debido a esta propiedad. El plásmido F es una molécula de dsDNA circular de 99.159 pares de bases.

El mapa genético del plásmido F se muestra en la figura 5.31. Una región del plásmido contiene genes involucrados en la regulación de la replicación del ADN (genes rep), la otra región contiene elementos transponibles (genes IS3, Tn 1000, IS3 e IS2) involucrados en su capacidad para funcionar como un episoma, y ​​la tercera región grande La región, la región tra, consta de genes tra y posee la capacidad de promover la transferencia de plásmidos durante la conjugación. Ejemplo de plásmido F de E. coli.

Los plásmidos R son el grupo de plásmidos más extendido y mejor estudiado que confieren resistencia (de ahí que se denominen plásmidos resistentes) a los antibióticos y a otros inhibidores del crecimiento.

Los plásmidos R generalmente tienen genes que codifican enzimas capaces de destruir y modificar antibióticos. Por lo general, no están integrados en el cromosoma del hospedador. Algunos plásmidos R poseen un solo gen resistente mientras que otros pueden tener hasta ocho.

El plásmido R 100, por ejemplo, es un plásmido de 94,3 kilopares de bases (Fig. 5.32) que porta genes resistentes para sulfonamidas, estreptomicina y espectinomicina, cloranfenicol, tetraciclina, etc. También porta genes que confieren resistencia al mercurio.

Muchos plásmidos R son conjugados y poseen genes resistentes a los fármacos como elementos transponibles; desempeñan un papel importante en la microbiología médica, ya que su propagación a través de poblaciones naturales puede tener profundas consecuencias en el tratamiento de infecciones bacterianas.

Los plásmidos de virulencia confieren patogénesis a la bacteria huésped. Hacen que la bacteria sea más patógena ya que la bacteria es más capaz de resistir las defensas del huésped o producir toxinas.

Por ejemplo, los plásmidos Ti de Agrobacterium tumefaciens inducen la enfermedad de las agallas de la corona de las plantas angiospérmicas. Las cepas entertoxigénicas de E. coli causan diarrea del viajero debido a un plásmido que codifica una enterotoxina que induce una secreción extensa de agua y sales en el intestino.

Los col-plásmidos portan genes que confieren a la bacteria huésped la capacidad de matar otras bacterias secretando bacteriocinas, un tipo de proteínas. Las bacteriocinas a menudo matan las células creando canales en la membrana plasmática aumentando así su permeabilidad. También pueden degradar el ADN o el ARN o atacar al peptidoglicano y debilitar la pared celular.

Las bacteriocinas actúan solo contra cepas estrechamente relacionadas. El plásmido Col E1 de E. coli codifica la síntesis de bacterioeína llamadas colicinas que matan a otras cepas susceptibles de E. coli. Los plásmidos col de algunas E. coli codifican la síntesis de bacteriocina, a saber, cloacinas que matan las especies de Enterobacter.

Las bacterias del ácido láctico producen la bacteriocina NisinA que inhibe fuertemente el crecimiento de una amplia variedad de bacterias grampositivas y se utiliza como conservante en la industria alimentaria.

5. Plásmidos metabólicos:

Los plásmidos metabólicos (también llamados plásmidos degradativos) poseen genes para codificar enzimas que degradan sustancias inusuales como tolueno (compuestos aromáticos), pesticidas (ácido 2, 4-diclorofenoxiacético) y azúcares (lactosa).

El plásmido TOL (= pWWO) de Pseudomonas putida es un ejemplo. Sin embargo, algunos plásmidos metabólicos que se encuentran en ciertas cepas de Rhizobium inducen la formación de nódulos en leguminosas y llevan a cabo la fijación de nitrógeno atmosférico.

En la tabla 5.2 se ofrece un breve resumen de los tipos importantes de plásmidos bacterianos, sus huéspedes y sus propiedades.

Replicación de plásmidos:

Los plásmidos se replican de forma autónoma porque tienen sus propios orígenes de replicación. Las enzimas involucradas en la replicación de plásmidos son enzimas de células normales, particularmente en el caso de plásmidos pequeños. Sin embargo, algunos plásmidos grandes llevan genes que codifican enzimas que son específicas para la replicación del plásmido.

Los plásmidos poseen relativamente pocos genes, generalmente menos de 30, y los genes están relacionados principalmente con el control del proceso de iniciación de la replicación y con la distribución de los plásmidos replicados entre las células hijas.La información genética contenida en los genes del plásmido no es esencial para el huésped porque la bacteria que carecen de ellos suelen funcionar con normalidad.

Dado que el ADN plasmídico es de pequeño tamaño, todo el proceso de su replicación se lleva a cabo muy rápidamente, quizás en 1/10 o menos del tiempo total del ciclo de división celular.

La mayoría de los plásmidos en bacterias gramnegativas se replican de una manera similar a la replicación del cromosoma bacteriano que implica la iniciación en el sitio de origen de la replicación y la replicación bidireccional alrededor del círculo de ADN dando un intermedio theta (Ө).

Sin embargo, algunos plásmidos de bacterias gramnegativas se replican mediante un método unidireccional. La mayoría de los plásmidos de bacterias grampositivas se replican mediante un mecanismo de círculo rodante similar al utilizado por el fago φx174. La mayoría de los plásmidos lineales se replican por medio de un mecanismo que involucra una proteína unida al extremo 5 & # 8242 de cada hebra de ADN que se usa para cebar la síntesis de ADN.

Curado de plásmidos:

Los plásmidos se pueden eliminar de las células bacterianas y este proceso se denomina curado. El curado puede tener lugar espontáneamente o puede ser inducido por varios tratamientos, que inhiben la replicación del plásmido pero no afectan la replicación del cromosoma bacteriano ni la reproducción celular. Los plásmidos inhibidos se diluyen lentamente de la creciente población bacteriana.

Algunos agentes de tratamiento de curado comúnmente usados ​​son tintes de acridina, radiación ultravioleta (UV) e ionizante, inanición de timina y crecimiento por encima de las temperaturas óptimas. Estos agentes de curación interfieren con la replicación del plásmido que con la replicación del cromosoma bacteriano.

Uso de plásmidos como vectores de clonación:

La importancia de los plásmidos aumentó drásticamente con el advenimiento de la tecnología del ADN recombinante, ya que se convirtieron en los primeros vectores de clonación, e incluso hoy en día son los vectores de clonación más utilizados, especialmente en la clonación de genes en bacterias.

Disfrutan de este estado porque tienen propiedades muy útiles como vectores de clonación que incluyen:

(i) Tamaño pequeño, lo que hace que el plásmido sea fácil de aislar y manipular.

(ii) Origen de replicación independiente, que permite que la replicación del plásmido en la célula proceda independientemente del control cromosómico directo.

(iii) Número de copias múltiples, lo que hace que estén presentes en la célula en varias copias para que la amplificación del ADN plasmídico sea fácil y

(iv) Presencia de marcadores seleccionables, como genes de resistencia a antibióticos, que facilitan la detección y selección de clones que contienen plásmidos.

El vector plasmídico se aísla de la célula bacteriana y en un sitio mediante la enzima de restricción. La escisión convierte el ADN plasmídico circular en una molécula de ADN lineal.

Ahora, los dos extremos abiertos del plásmido lineal se unen a los extremos del ADN extraño para insertarse con la ayuda de la enzima ADN ligasa. Esto regenera un plásmido híbrido circular o quimérico, que se transfiere a una bacteria en la que se replica y perpetúa indefinidamente.

Uno de los plásmidos más utilizados en la clonación de genes en bacterias es el pBR322, que tiene genes de resistencia a ampicilina y tetraciclina y muchos sitios de restricción. Cuando se inserta un ADN extraño en el gen de resistencia a la ampicilina de pBR322, el plásmido ya no puede conferir resistencia a la ampicilina.


Métodos

Cepas de levadura y plásmidos

Todos S. cerevisiae Las cepas de este estudio tienen los siguientes antecedentes genéticos: his3Δ1 :: TEF2-mCherry :: URA3 :: RPS28Ap-YiFP-KAN :: NAT canΔ1 :: STE2pr-Sp_his5 lypΔ1 :: STE3pr-LEU2 leu2Δ0 ura3Δ0.

Se tomaron cepas de Y-intron-FP de Yofe et al [36] y se introdujeron con un gen de resistencia Kan fusionado en el extremo 3 'al YFP. Para reconstituir las mutaciones descubiertas después de la evolución en el laboratorio (cepas de rescate), amplificamos casetes de Y-imut-FP-KAN y los transformó en la cepa Control ancestral, seleccionando con KAN. En particular, todas las cepas también llevan una proteína fluorescente mCherry impulsada por un TEF2 promotor que se utilizó para normalizar la variabilidad de célula a célula para los niveles de expresión de YFP-Kan.

Medios de comunicación

Los cultivos se hicieron crecer a 30 ° C en medio rico (1% de extracto de bacto-levadura, 2% de bacto-peptona y 2% de dextrosa [YPD]).A lo largo de todos los experimentos, se complementó G418 al medio a una concentración de 3 mg / ml, que es 10 veces mayor que el estándar.

Experimentos de evolución

Los experimentos de evolución de laboratorio se llevaron a cabo mediante diluciones seriadas diarias durante 80 días. Las células se cultivaron en 1,2 ml de YPD + G418 a 30 ° C hasta alcanzar la fase estacionaria y luego se diluyeron en un factor de 1: 120 en medio fresco (aproximadamente 7 generaciones por dilución, un total de aproximadamente 560 generaciones).

Medidas de crecimiento de líquidos

Las células se cultivaron en YPD + G418 a 30ºC durante la noche. Al día siguiente, se diluyeron a una DO = 0,05 en YPD + G418, y se tomaron medidas de densidad óptica (600 nm) a intervalos de 30 minutos. Las comparaciones de crecimiento se realizaron usando placas de 96 pocillos y la curva de crecimiento para cada cepa se obtuvo promediando al menos 15 pocillos.

Mediciones de citometría de flujo de los niveles de YFP-Kan

Las células se cultivaron en YPD + G418 a 30ºC durante la noche. Al día siguiente, se diluyeron a una DO = 0,05 en YPD + G418, se colocaron a 30 ° C y se siguieron hasta que alcanzaron la fase de crecimiento logarítmico a una densidad óptica de entre 0,4 y 0,5. Luego, se midieron los niveles de YFP y mCherry para entre 20.000 y 50.000 células para cada cultivo con citometría de flujo. La activación se realizó de acuerdo con dispersiones laterales y directas, y los niveles de YFP se normalizaron con la señal de mCherry para cada celda individualmente.

Mediciones cuantitativas de PCR de la eficiencia del empalme

Los cultivos se hicieron crecer en YPD + G418 a 30 ° C hasta que las células alcanzaron la fase de crecimiento logarítmico a una densidad óptica de aproximadamente 0,4. Luego, el ARN se extrajo usando el kit MasterPure (Epicenter) y se transcribió de forma inversa a ADNc usando cebadores aleatorios. Se añadió un total de 2 μL de cDNA a cada reacción como plantilla para qPCR utilizando el kit maestro Light Cycler 480 SYBR I y el sistema LightCycler 480 (Roche Applied Science), de acuerdo con las instrucciones del fabricante. Para cada cepa, se realizaron qPCR con dos o tres repeticiones biológicas y tres repeticiones técnicas. Se realizó una primera qPCR dirigida a la versión empalmada con transcripción, con un cebador directo que complementa la unión exón-exón y un cebador inverso aguas abajo. Una segunda PCR apuntó a la versión sin empalmar de la transcripción, con un cebador directo que complementa al intrón y el mismo cebador inverso de la primera reacción: Fexón-exón = 5′-CACTACTTTAGGTTATGGTTT-3 ′ Fintrón = 5′-CTTCAATTTACTGAATTTGTATG-3 ′ Rambos = 5′-GTCTTGTAGTTACCGTCA-3 ′.

La eficiencia de empalme se informa como el Cp promedio de la transcripción empalmada menos el Cp promedio de la versión sin empalmar.

Secuenciación profunda de ARNm

Los cultivos se hicieron crecer en YPD + G418 a 30 ° C hasta que las células alcanzaron la fase de crecimiento logarítmico a una densidad óptica de aproximadamente 0,4. A continuación, las células se recogieron mediante centrifugación y se congelaron rápidamente en nitrógeno líquido. El ARN se extrajo usando un protocolo modificado del kit de ARN nucleospin 96 (Machery-Nagel). Específicamente, la lisis celular se realizó en una placa de 96 pocillos profundos agregando a cada pocillo 450 μl de tampón de lisis que contenía sorbitol 1 M, EDTA 100 mM y 0,45 μl de lyticasa (10 UI / μl). La placa se incubó a 30ºC durante 30 minutos para romper las paredes celulares y se centrifugó durante 10 minutos a 3.000 rpm, seguido de la eliminación del sobrenadante. Luego, la extracción continuó como en el protocolo del kit de ARN nucleospin 96, solo usando β-mercaptoetanol en lugar de DTT. Los extractos de ARN seleccionados con poli (A) de tamaño aproximado de 200 bps se transcribieron de forma inversa a ADNc utilizando cebadores poli (T) que se codificaron con barras con un identificador molecular único (UMI). A continuación, se amplificó y secuenció el ADNc con un Illumina HiSeq 2500.

Análisis de secuenciación profunda de ARNm

El procesamiento de los datos de RNA-seq se realizó como se describe en Voichek et al [59]. En breve, las lecturas se alinearon usando Bowtie [60] (parámetros: —best – a – m 2 –strata -5 10) al genoma de S. Cerevisiae (R64 de SGD) con un cromosoma adicional que contiene la secuencia de la construcción YFP-Kan. Para cada secuencia, normalizamos el sesgo de PCR utilizando UMI, como se describe en Kivioja et al. [61]. A continuación, se sumaron las lecturas para cada extremo del gen (400 pb en sentido ascendente a 200 pb en sentido descendente del extremo 3 'del ORF) para estimar el nivel de expresión del gen. Se excluyeron los genes con cobertura inferior a 10 lecturas. Para normalizar las diferencias en la cobertura entre las muestras, dividimos cada expresión génica por el recuento total de lecturas de cada muestra y luego lo multiplicamos por 10 6. Luego, se calculó la relación de expresión entre una colonia evolucionada / de rescate y el antepasado y un registro2 La operación se realizó en esa proporción. Estos valores se utilizaron para comparar los niveles de expresión de grupos de genes (genes ribosómicos, genes de respuesta al estrés general, genes de maquinaria de empalme, genes que contienen intrones) y de los niveles de ARNm de YFP-Kan como se describe en el manuscrito. Al calcular los niveles de expresión de la maquinaria de empalme y los grupos de genes que contienen intrones, los genes de respuesta al estrés general y ribosómico se excluyeron del análisis para evitar el sesgo de la regulación celular debido a cambios en la fisiología y la tasa de crecimiento de las células.

Ingeniería del genoma CRISPR

Protocolo CRISPR para S. cerevisiae se realizó como se describió anteriormente [62]. En breve, las secuencias de gRNA que se dirigen a un locus cerca (& lt50 bps) de la posición de las mutaciones deseadas se clonaron en el vector bRA89 que permite la coexpresión de Cas9 y gRNA. El plásmido CRISPR (1 μg) se cotransformó en células de levadura (20 μL) junto con un casete de reparación de dsDNA con las mutaciones deseadas (500 ng) utilizando el protocolo de transformación de levadura estándar. Las células se sembraron en placas selectivas (YPD + higromicina, 50 mg / ml), las colonias se examinaron con PCR y secuenciación de Sanger para las mutaciones deseadas, las colonias positivas se cultivaron en medios permisivos durante 24 horas para determinar la pérdida del plásmido CRISPR y las copias se almacenaron a -80 ° C.

El casete de reparación tiene una homología de 45 pb en cada extremo, flanqueando la mutación deseada. Debido a que la mutación no modificó la secuencia de PAM, también se introdujeron mutaciones sinónimas adicionales junto con la mutación deseada para detener el corte del locus por el complejo Cas9 + gRNA. Estas mutaciones sinónimas también se introdujeron en el trasfondo genético relevante sin las mutaciones deseadas y se confirmó que no tenían ningún efecto sobre el crecimiento celular o los niveles de expresión de YFP.

Coinmunoprecipitación de ARN

Las células de levadura se cultivaron en YPD a 25 ° C hasta la fase logarítmica y se recogieron mediante centrifugación. Las células se resuspendieron en tampón de ARN-IP de 1 x volumen de sedimento (Tris-HCl 25 mM [pH 7,5], NaCl 150 mM, MgCl 2 mM2, 0,5% [v / v] Triton X-100, PMSF 0,2 mM en isopropanol, DTT 0,5 mM, 40 unidades de inhibidor de RNasa RiboLock [Thermo Fisher Scientific], cóctel de inhibidor de proteasa sin EDTA completo [Roche Diagnostics y Sigma-Aldrich] ) y se lisó con agitación vigorosa tres veces, 20 s, 6 m / s con el FastPrep-24 Instrument (MP Biomedicals) en presencia de 1 × volumen de gránulos de perlas de vidrio. Para la inmunoprecipitación, los lisados ​​aclarados se incubaron con o sin anticuerpo Gbp2 o Npl3 (policlonal de conejo, de fabricación propia) a 4 ° C durante 1 hora, seguido de la adición de 10 μL de perlas de proteína G sefarosa (Amersham Biosciences) y posterior incubación a 4 ° C. C durante 2 horas. También se añadió ADNasa I libre de ARNasa (QIAGEN) para digerir el ADN durante la incubación. Se trató un total de 100 μl del lisado con DNasa I y se incubó a 4 ° C en paralelo. Las perlas se lavaron cinco veces con tampón de ARN-IP. El ARN se aisló de las muestras de lisado y eluido utilizando el reactivo TRIzol (Thermo Fisher Scientific) y se eluyó en 20 μL de ddH tratado con DEPC2O. Antes de la transcripción inversa, las muestras de ARN se trataron con TURBO DNA-gratis Kit (Thermo Fisher Scientific) para eliminar el ADN residual.

Transcripción inversa y qRT-PCR de ARN precipitado

La misma concentración de ARN de todas las muestras se transcribió de forma inversa utilizando el kit de ADNc FastGene Scriptase II (NIPPON Genetics EUROPE) con el cebador de hexámero aleatorio (Thermo Fisher Scientific). Las muestras de PCR se prepararon con qPCRBIO Sygreen Mix Lo-ROX (PCR Biosystems) y la qRT-PCR se realizó utilizando el CFX Connect Real-Time PCR Detection System (Bio-Rad Laboratories) durante 45 ciclos con una temperatura de recocido de 60 ° C. Cebador directo (5′-TTATTCACTGGTGTTGTCCC-3 ′) y cebador inverso (5′-CATGGAACTGGCAATTTACC-3 ′) que se unen específicamente a YFP-Kan fueron usados. Cada reacción de PCR se realizó por triplicado y el valor medio de Cq se usó en análisis adicionales. De cada valor de Cq de eluido, se restó el valor de Cq del lisado correspondiente (ΔCq). El ΔCq de la muestra de control sin anticuerpos se restó del ΔCq de la muestra desplegable (ΔΔCq). La unión del ARN se calculó mediante 2 -ΔΔCq.


Ver el vídeo: Video 6: Aislamiento del plásmido que contiene el gen de interés (Septiembre 2022).


Comentarios:

  1. Malajora

    Bajo el cuento de hadas de un sueño, entrará en tu casa

  2. Seosamh

    Lo siento, pero en mi opinión, estás equivocado. Escríbeme en PM, te habla.

  3. Mijora

    Creo que estas equivocado. Estoy seguro. Puedo defender mi posición. Envíame un correo electrónico a PM.

  4. Dorrin

    Lamento interrumpirte, pero necesito un poco más de información.

  5. Zurg

    Alguien no pudo hacerlo)))



Escribe un mensaje