Información

Software para calcular Fst a partir de datos de secuencia

Software para calcular Fst a partir de datos de secuencia


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Estoy buscando un software para calcular Fst a partir de datos de ADN de 3 loci de individuos de una metapoblación. No tengo ninguna información previa sobre la estructura de la población (no tengo idea del número de subpoblaciones, por ejemplo)

He estado mirando FSTAT pero no se ejecuta en MAC.

¿Tienes alguna alternativa fácil?


Si está familiarizado con R, pruebe el paquete adegenet. Contiene muy buenos tutoriales que explican su uso, incluidos los conceptos básicos de R. Si necesita una interfaz gráfica, instale RStudio, un front-end muy agradable para R. Hay más posibilidades de cómo calcular Fst en R, pero adegenet es uno de los paquetes genéticos más poderosos que existen.


StAMPP: un paquete R para el cálculo de la diferenciación genética y la estructura de poblaciones de niveles de ploidía mixta

El análisis estadístico de poblaciones de ploidía mixta (StAMPP) es un paquete R disponible de forma gratuita para el cálculo de la estructura y diferenciación de la población en función de los datos del genotipo del polimorfismo de un solo nucleótido (SNP) de poblaciones de cualquier nivel de ploidía y / o niveles de ploidía mixta. StAMPP proporciona un avance en paquetes de software similares anteriores, debido a la capacidad de calcular valores de FST por pares junto con intervalos de confianza, la distancia genética de Nei y las matrices de relación genómica a partir de conjuntos de datos de nivel de ploidía mixta. El código del software está diseñado para manejar de manera eficiente el análisis de grandes conjuntos de datos genotípicos que generalmente se generan mediante plataformas de genotipado de alto rendimiento. Los estudios de diferenciación de poblaciones que utilizan StAMPP son ampliamente aplicables a los estudios de ecología molecular y genética de la conservación, así como a la cría de animales y plantas.

Palabras clave: F ST poliploidía de matriz de relación genómica de distancia genética.


Respecto al cálculo de Fst

Tengo una pregunta sobre la diferencia de frecuencia de los alelos y el cálculo de Fst. De hecho, encontré que mi pregunta es muy similar a esta publicación (https://www.biostars.org/p/345692/) en Biostar, así que no puedo replicar aquí, sin embargo, nadie responde la pregunta. ¿Podría compartirme sus comentarios y sugerencias sobre este tema?

Además, tengo un archivo de texto que contiene MAF y el número de varios genotipos (homocigoto de referencia, heterocigoto, homocigoto alternativo y genotipo faltante) para miles de variantes derivadas de la secuenciación del genoma completo de una población humana. ¿Podría decirme cómo puedo calcular Fst para las variantes en este formato? como veo, la mayoría de las herramientas aceptan el formato VCF.

Cual es tu pregunta especifica? Lo que miden las derivadas de Wright & # x27s Fst es una desviación de la distribución aleatoria de alelos entre la población comparada, y los valores crecientes se interpretan como diferenciación genética debido a un efecto Wahlund. Si se usa en comparaciones de poblaciones por pares, puede decirle qué poblaciones tienen una tasa más alta de flujo de genes, en términos relativos. Si tiene datos de secuencia, debería usar phi.st en lugar de f.st. Si solo tiene llamadas de alelos que siguen un modelo de mutación de alelos infinitos, entonces debería usar Nei & # x27s Gst. Si está interesado en la diversidad genética, ninguna de las métricas similares a Fst será de utilidad. Necesitará He (2pq) o probablemente pi (diversidad de nucleótidos). La riqueza alélica (una forma corregida por el tamaño de la muestra del número efectivo de alelos) también podría ser apropiada.

¡Muchas gracias amigo mío por tu linda y completa explicación! Sería genial si pudiéramos tener más discusión. En realidad, tengo un conjunto de variantes relacionadas con una enfermedad compleja (por lo que no sigo ningún modelo de mutación) de la población A. Me gustaría conocer la diferenciación genética de la población A y otras poblaciones (digamos de 1KG) al considerar este conjunto de variantes, por lo que voy a medir Fst por pares, ¿es correcto? También estoy interesado en los valores atípicos Fst, ya que están bajo selección, encontré algunas herramientas para encontrar los valores atípicos estadísticamente significativos, sin embargo, como nunca trabajo en este campo, todavía estoy ciego para elegir la herramienta más adecuada. ¿Podrías amablemente ayudarme también?

Además, mencionaste la riqueza alélica, es agradable. Por ejemplo, puedo evaluar si el número de alelos efectivo se enriquece o se reduce de la población de interés en comparación con otras poblaciones, ¿entiendo correctamente su punto? Perdón por esta pregunta, la riqueza alélica y Fst son dos conceptos diferentes, ¿no?


Estimación de distancias evolutivas

En este tutorial, estimaremos distancias evolutivas para secuencias de 11 especies de Drosophila utilizando varios modelos. Los archivos de datos utilizados en este tutorial se pueden encontrar en la carpeta MEGA / Examples (la ubicación predeterminada para los usuarios de Windows es C: Program Files MEGA Examples. La ubicación predeterminada para los usuarios de Mac es $ HOME / MEGA / Examples, donde $ HOME es el directorio de inicio del usuario).

Estimación de distancias evolutivas utilizando la distancia por pares

En MEGA, puede estimar distancias evolutivas entre secuencias calculando la proporción de diferencias de nucleótidos entre cada par de secuencias.

Abra el archivo de datos "Drosophila_Adh.meg". Si es necesario, consulte el tutorial "Conceptos básicos de MEGA".

Desde la barra de inicio principal de M EGA, seleccione Distancia | Calcule la distancia por pares.

En la ventana Preferencias de análisis, haga clic en el menú desplegable Tipo de sustitución y luego seleccione la opción Nucleótido.

Haga clic en el menú desplegable de Modelo / Método y seleccione el modelo de distancia p. Para este ejemplo, usaremos los valores predeterminados para las opciones restantes. Haga clic en Calcular para comenzar el cálculo.

Aparecerá brevemente un indicador de progreso y luego los resultados del cálculo de la distancia se mostrarán en forma de cuadrícula en una nueva ventana. Deje esta ventana abierta para que podamos comparar los resultados de los siguientes pasos.

Calcular y comparar distancias usando otros modelos / métodos

MEGA admite una amplia colección de modelos para estimar distancias evolutivas. Aquí comparamos las distancias evolutivas calculadas utilizando diferentes modelos.

Repita el Ejemplo 3.1 anterior, pero seleccione el modelo Jukes / Cantor en el menú desplegable Modelo / Método en lugar del modelo de distancia p, dejando todas las demás opciones iguales. Nuevamente, deje la ventana de resultados abierta para comparar.

Repita el análisis, esta vez seleccionando el modelo Tamura-Nei en el menú desplegable Modelo / Método, dejando todas las demás opciones iguales. Nuevamente, deje la ventana de resultados abierta para comparar.

Ahora puede comparar las tres ventanas de resultados abiertas que contienen las distancias estimadas por los diferentes métodos.

Después de haber comparado los resultados, seleccione Archivo | Salga de la opción Visor para cada ventana de resultados. & # 160 No cierre el archivo de datos "Drosophila_Adh.meg".

Calcular la proporción de diferencias de aminoácidos

También puede calcular distancias evolutivas en función de la proporción de diferencias de aminoácidos.

Nota: MEGA traducirá automáticamente las secuencias de nucleótidos en secuencias de aminoácidos utilizando la tabla de códigos genéticos seleccionada. La tabla de códigos genéticos se puede editar con Data | Seleccione Tabla de códigos genéticos en la barra de inicio principal de MEGA.

Desde la ventana principal de MEGA, seleccione Distancia | Calcule las distancias por pares en el menú principal. Esto mostrará la ventana de Preferencias de análisis.

Haga clic en el menú desplegable Tipo de sustitución, seleccione Aminoácido y luego seleccione distancia p en Modelo / Método.

Haga clic en el botón Calcular para aceptar los valores predeterminados para el resto de las opciones y comenzar el cálculo. Aparecerá brevemente un cuadro de diálogo de progreso. Al igual que con la estimación de nucleótidos, se mostrará una ventana del visor de resultados, que muestra las distancias en un formato de cuadrícula.

Una vez que haya inspeccionado los resultados, utilice Archivo | Salir del comando Visor para cerrar el visor de resultados.

Cierre los datos seleccionando el botón Cerrar datos en la barra de tareas principal de MEGA.


Secuencia: número de copias específico del alelo y perfiles de mutación de los datos de secuenciación de tumores

Fondo: La secuenciación profunda del exoma o del genoma completo del ADN del tumor junto con el ADN normal emparejado puede proporcionar una imagen detallada de las mutaciones somáticas que caracterizan al tumor. Sin embargo, el análisis de tales datos de secuencia se puede complicar por la presencia de células normales en la muestra de tumor, por la heterogeneidad intratumoral y por el gran tamaño de los datos brutos. En particular, la determinación de las variaciones del número de copias a partir de los datos de secuenciación del exoma por sí solos ha resultado difícil, por lo tanto, las matrices de polimorfismo de un solo nucleótido (SNP) se han utilizado a menudo para esta tarea. Recientemente, se han descrito algoritmos para estimar perfiles de números de copias absolutos, pero no específicos de alelos, a partir de datos de secuenciación de tumores.

Materiales y métodos: Desarrollamos Sequenza, un paquete de software que utiliza datos de secuenciación de ADN normal de tumor emparejados para estimar la celularidad y ploidía del tumor, y para calcular perfiles de número de copias y perfiles de mutación específicos de alelos. Aplicamos Sequenza, así como dos algoritmos publicados anteriormente, a los datos de la secuencia del exoma de 30 tumores de The Cancer Genome Atlas. Evaluamos el rendimiento de estos algoritmos comparando sus resultados con los generados utilizando matrices SNP emparejadas y procesados ​​por el algoritmo de análisis de tumores de número de copias específico de alelo (ASCAT).

Resultados: La comparación entre Sequenza / exoma y SNP / ASCAT reveló una fuerte correlación en la celularidad (r de Pearson = 0,90) y las estimaciones de ploidía (r = 0,42 o r = 0,94 después de la inspección manual de soluciones alternativas). Este rendimiento fue notablemente superior a los algoritmos publicados anteriormente. Además, en datos artificiales que simulaban mezclas de tumores normales, Sequenza detectó la ploidía correcta en muestras con un contenido de tumor tan bajo como 30%.

Conclusiones: El acuerdo entre Sequenza y los perfiles de número de copias basados ​​en matrices de SNP sugiere que la secuenciación del exoma por sí sola es suficiente no solo para identificar mutaciones a pequeña escala, sino también para estimar la celularidad e inferir aberraciones en el número de copias de ADN.

Palabras clave: cáncer genómica número de copias alteraciones mutaciones software de secuenciación de próxima generación.

© The Author 2014. Publicado por Oxford University Press en nombre de la Sociedad Europea de Oncología Médica.


La columna vertebral de su investigación científica

Aumente la eficiencia del proceso y mejore la colaboración con una organización intuitiva basada en carpetas y una base de datos compartida perfectamente integrada. Arrastre y suelte simple para importar y exportar una gran cantidad de formatos de archivo comunes, incluidos GenBank, SnapGene y FASTQ.

Personalización

Amplíe la funcionalidad de Geneious Prime con nuestra colección de complementos disponibles para ensamblaje, alineación, filogenia y más. Integre con los sistemas existentes y agregue sus propios algoritmos personalizados utilizando una API altamente interoperable.

Automatización

Cree sus propios flujos de trabajo automatizados o utilice flujos de trabajo integrados para aumentar la eficiencia y reducir el error humano. Automatice las búsquedas en bases de datos externas para recibir continuamente la información más reciente sobre genomas, secuencias y estructuras de proteínas.

Innovación

Nos preocupamos mucho por encontrar nuevas formas de hacer ciencia de manera más rápida y eficiente. Nuestro equipo de desarrollo trabaja constantemente durante todo el año para garantizar que Geneious Prime funcione a la perfección y que siempre haya un nuevo lanzamiento a la vuelta de la esquina.


Investigando el virus de la gripe aviar

Calcule las proporciones Ka / Ks para ocho genes en los genomas de los virus H5N1 y H2N3 y realice un análisis filogenético del gen HA del virus H5N1 aislado de pollos en África y Asia. Para el análisis filogenético, reconstruirá un árbol de unión de vecinos y creará una gráfica en 3-D de distancias de secuencia utilizando escalado multidimensional. Finalmente, mapeará las ubicaciones geográficas donde se encontró cada secuencia HA en un mapa regional. Las secuencias utilizadas en este ejemplo se seleccionaron del estudio de caso de la gripe aviar en el sitio web de Computational Genomics [1]. Nota: La sección final de este ejemplo requiere Mapping Toolbox & # 8482.


Software para calcular Fst a partir de datos de secuencia - Biología

Nos complace ofrecer una serie de tutoriales a su propio ritmo sobre análisis genético de poblaciones que emplean cálculos y ejercicios manuales dentro de GenAlEx. Estos se extraen en parte de los talleres de posgrado que hemos ofrecido (de manera conjunta e independiente) en todo el mundo. Haga clic en los enlaces a continuación para descargar los tutoriales de interés. En 2012, se revisaron los Tutoriales 1-6 para actualizarlos con las nuevas funciones de GenAlEx 6.5. Se recomienda encarecidamente a todos los usuarios el nuevo Tutorial de resolución de problemas. Proporciona consejos útiles para resolver algunos de los problemas que pueden impedir la ejecución de algunos conjuntos de datos.

Introducción al análisis genético poblacional basado en frecuencia: puntuación de marcadores genéticos, frecuencia de alelos, heterocigosidad, estadísticas F, distancia genética Nei, índices de diversidad de Shannon y pruebas de chi-cuadrado para el equilibrio de Hardy-Weinberg

Distancia genética y AMOVA: distancia genética haploide, codominante y binaria, AMOVA y estadísticas F

Análisis genético espacial: análisis de coordenadas principales (PCoA), pruebas de Mantel para la correspondencia de la matriz y análisis de autocorrelación espacial

Análisis avanzado basado en frecuencia: probabilidad de perfil de ADN, probabilidad de identidad, probabilidad de exclusión, asignación de población y parentesco

Funciones avanzadas que incluyen importación y exportación de datos: trabajar con secuencias de ADN, importar y procesar datos genotípicos sin procesar, exportar datos de GenAlEx a otro software. El menú Estadísticas y cómo personalizar el menú GenAlEx también se tratan brevemente.

TwoGener: inferencia gamética masculina, distancias gaméticas masculinas, AMOVA gamética

Análisis jerárquico de la diversidad de Shannon

Este tutorial proporciona consejos útiles para solucionar problemas cuando GenAlEx inicialmente no puede ejecutar algunos conjuntos de datos.


Software para calcular Fst a partir de datos de secuencia - Biología

RepeatMasker es un programa que analiza las secuencias de ADN en busca de repeticiones intercaladas y secuencias de ADN de baja complejidad. El resultado del programa es una anotación detallada de las repeticiones que están presentes en la secuencia de consulta, así como una versión modificada de la secuencia de consulta en la que se han enmascarado todas las repeticiones anotadas (predeterminado: reemplazado por Ns). Actualmente, el programa identifica y enmascara más del 56% de la secuencia genómica humana. Las comparaciones de secuencias en RepeatMasker las realiza uno de varios motores de búsqueda populares, incluidos nhmmer, cross_match, ABBlast / WUBlast, RMBlast y Decypher. RepeatMasker hace uso de bibliotecas seleccionadas de repeticiones y actualmente es compatible con Dfam (biblioteca de perfiles HMM derivada de secuencias Repbase) y Repbase, un servicio del Instituto de Investigación de Información Genética.

Si desea mantenerse al día con las noticias y anuncios relacionados con RepeatMasker, puede seguirnos en Twitter: Siga a @RepeatMasker

Lanzamiento de RepeatModeler 2.0.2
Lunes, 3 de mayo de 2021
Hay disponible una nueva versión de RepeatModeler. Esta versión incluye un conjunto de herramientas de curación manual para usar con bibliotecas TE generadas de novo, además de varias correcciones de errores y mejoras.
Lanzamiento de RepeatMasker 4.1.2-p1
Jueves, 1 de abril de 2021
Una nueva versión de parche de RepeatMasker está disponible para descargar. Esta versión corrige un error en 4.1.1 / 4.1.2 con el procesamiento de secuencias Alu en primates. En estas versiones anteriores, las secuencias de Alu se enmascaraban correctamente, sin embargo, no se comparaban automáticamente con la biblioteca de subfamilias de Alu más grande y no recibían una anotación de subfamilia detallada. Consulte la página RepeatMasker para obtener detalles sobre la instalación.
RepeatMasker 4.1.2 lanzado
Viernes, 19 de marzo de 2021
Hay una nueva versión de RepeatMasker disponible para descargar. Esta versión corrige algunos problemas menores con RepeatMasker y sus herramientas auxiliares. Más importante aún, esta versión soluciona un problema con su uso por RepeatModeler que puede causar un rendimiento de clasificación deficiente en las bibliotecas denovo de RepeatModeler. Consulte la página RepeatMasker para obtener detalles sobre la instalación.
RMBlast 2.11.0
Jueves, 11 de marzo de 2021
RMBlast se ha actualizado a la última versión de las herramientas NCBI BLAST + (2.11.0), incluidos los binarios para Mac y Linux de 64 bits. Esta versión introdujo informes de uso de exclusión voluntaria, que hemos modificado en nuestras distribuciones de RMBlast. Consulte la página de RMBlast para obtener más detalles.
RepeatMasker 4.1.1 lanzado
Jueves, 3 de septiembre de 2020
Hay una nueva versión de RepeatMasker disponible para descargar. En esta versión, hemos agregado soporte para Dfam 3.2 y para archivos de biblioteca FamDB (https://github.com/Dfam-consortium/FamDB). FamDB es un formato basado en HDF5 que almacena modelos familiares (HMM y secuencias de consenso), metadatos familiares y un subconjunto de la base de datos de taxonomía NCBI relevante para las familias almacenadas dentro. Además, RepeatMasker incluye la herramienta de utilidad famdb.py que admite una amplia gama de capacidades de consulta y exportación de los datos almacenados en este formato. Consulte la página RepeatMasker para obtener detalles sobre la instalación.
RMBlast 2.10.0
Miércoles, 8 de enero de 2020
RMBlast se ha actualizado a la última versión de las herramientas NCBI Blast + (2.10.0), incluidos los binarios para Mac y Linux de 64 bits. Consulte la página de RMBlast para obtener detalles sobre la instalación.
Lanzamiento de RepeatModeler 2.0
Miércoles 27 de noviembre de 2019
Una nueva versión de RepeatModeler está disponible con soporte para el descubrimiento de LTR basado en estructura usando LtrHarvest y Ltr_retriever. El nuevo flujo de trabajo desarrollado en colaboración con Jullien Flynn, Andrew Clark y Cedric Feschotte, mejora enormemente la calidad de las familias LTR producidas por RepeatModeler. Además de las correcciones de errores, mejoramos la velocidad de la fase de enmascaramiento, refactorizamos el sistema de configuración para que sea más flexible para los administradores de paquetes y generamos contenedores Docker y Singularity para simplificar la instalación. Se ha enviado un manuscrito preliminar a bioRxiv [856591].
RepeatMasker 4.1.0 lanzado
Miércoles, 30 de octubre de 2019
Hay una nueva versión de RepeatMasker disponible para descargar. En esta versión, el sistema de configuración se ha refactorizado para facilitar la distribución de RepeatMasker a través de administradores de paquetes y / o empaquetarlos en contenedores Docker / Singularity. Además, hemos incluido una útil herramienta de Python (RM2Bed.py) desarrollada por el laboratorio de David Ray para manipular / filtrar archivos de anotaciones RM (* .out) y guardar la salida en el formato de archivo BED. Consulte la página RepeatMasker para obtener detalles sobre la instalación.
Corrección de errores de RMBlast 2.9.0-p1
Miércoles, 7 de agosto de 2019
Hemos identificado un error en NCBI BLAST + que ocasionalmente puede causar un bloqueo o alineaciones confusas al ejecutar rmblastn. Hemos publicado un nuevo parche y hemos informado de nuestros hallazgos al NCBI para que pueda solucionarse en sentido ascendente. Consulte la página de RMBlast para obtener detalles sobre la instalación.
Cambios en el servicio de enmascaramiento RepeatMasker
Lunes 20 de Mayo de 2019
A partir del 20 de mayo de 2019, GIRI ha rescindido nuestro acuerdo de trabajo permitiendo que la www.repeatmasker.org sitio web para ofrecer un servicio de repetición de enmascaramiento utilizando la biblioteca RepBase RepeatMasker Edition. En este momento, solo podemos ofrecer enmascaramiento usando la base de datos abierta Dfam, que a partir de 3.0 incluye secuencias de consenso además de modelos de perfil ocultos de Markov para muchas familias de elementos transponibles.Los usuarios que requieran RepBase deberán comprar una licencia comercial o académica de GIRI y ejecutar RepeatMasker localmente. Estamos trabajando para expandir la base de datos de Dfam y lo invitamos a visitar Dfam (http://www.dfam.org) para obtener más información.
RepeatMasker 4.0.9
Martes 9 de abril de 2019
Ya está disponible una nueva versión del paquete RepeatMasker. RepeatMasker ahora funcionará con la nueva base de datos combinada consenso / HMM Dfam (Dfam 3.0) y / o bibliotecas personalizadas proporcionadas por el usuario listas para usar. Dfam es una base de datos abierta de modelos HMM de perfiles de elementos transponibles (TE) y secuencias de consenso. La versión actual (Dfam 3.0) contiene 6.235 familias de TE que abarcan cinco organismos: humano, ratón, pez cebra, mosca de la fruta, nematodo y un número creciente de nuevas especies. Consulte la página RepeatMasker para obtener detalles sobre la instalación.
RMBlast 2.9.0
Viernes, 5 de abril de 2019
RMBlast se ha actualizado a la última versión de las herramientas NCBI Blast + (2.9.0). Esta versión se publica como parche para la fuente NCBI Blast + y como binarios compilados para Mac y Linux de 64 bits. Gracias nuevamente a NCBI por su ayuda con estos esfuerzos. Consulte la página de RMBlast para obtener detalles sobre la instalación.
Presentamos Dfam 3.0
Miércoles 6 de marzo de 2019
El consorcio Dfam se complace en anunciar el lanzamiento de Dfam 3.0. Esta versión representa una transición importante para Dfam de una base de datos de prueba de concepto a un recurso comunitario abierto financiado. Para esta transición es fundamental una importante actualización de infraestructura y tecnología, que permite a Dfam manejar el ritmo cada vez mayor de la secuenciación del genoma y la generación de bibliotecas TE. Igualmente importante, fusionamos Dfam_consensus con Dfam para producir un único recurso para el modelado y la anotación de familias de elementos transponibles. Al hacerlo, Dfam satisface las necesidades de una comunidad de investigación más amplia al tiempo que mantiene un alto estándar para la caracterización familiar (basada en alineaciones de semillas) y la sensibilidad de la anotación TE. Finalmente, y lo más importante, estamos trabajando para hacer de Dfam un recurso impulsado por la comunidad a través del desarrollo de herramientas de curación en línea y la participación directa del usuario. [ Lee mas ].
Para acceder a la base de datos, diríjase a https://dfam.org.
RepeatMasker 4.0.8 y bibliotecas lanzadas
Miércoles 21 de noviembre de 2018
Se han lanzado un nuevo paquete RepeatMasker, Repeat Protein Database y RepBase RepeatMasker-edition. La base de datos de proteínas repetidas creció en más de 7400 entradas e incluye 16,1 millones de aminoácidos que cubren 133 subclases de elementos transponibles. Para obtener más información sobre esta biblioteca, consulte la documentación que acompaña a la biblioteca. Además, hemos actualizado las bibliotecas RepeatMasker para RepBase (Repbase RepeatMasker-edition versión 20180826, RepBase versión 23.08). La actualización incluye más de 4500 nuevas familias de: arroz (1652), la tortuga pintada occidental (472), la rana de garras africana (215), el tabaco de madera (210) y la mosca blanca de la batata (182), entre otros. El nuevo paquete RepeatMasker se puede descargar desde aquí. La nueva edición RepBase RepeatMasker está disponible para descargar en: http://www.girinst.org.
  • Dfam_consensus: hoy lanzamos una nueva versión de la base de datos que contiene varias familias nuevas para el topo dorado africano y una biblioteca para el papamoscas con collar proporcionada por Alexander Suh.
  • Los repositorios de desarrollo de software RepeatMasker, RepeatModeler y Coseg ahora están disponibles en GitHub. Las solicitudes de ayuda ahora se pueden enviar a través del sitio de GitHub además del sitio web de repeatmasker.org.
  • RepeatModeler: hemos estado trabajando arduamente para eliminar varios errores y mejorar la herramienta de importación Dfam_consensus en función de los comentarios que hemos recibido. La última versión es 10.0.11 y puede descargarse de: GitHub o repeatmasker.org
- RepeatMasker utiliza la base de datos Dfam de modelos de markov ocultos de perfiles repetidos y secuencias de consenso para realizar búsquedas.
- RepeatMasker también puede hacer uso de Repbase, que es un servicio del Instituto de Investigación de Información Genética. Repbase es una base de datos de secuencias de consenso de elementos repetitivos.
- Los datos y recursos computacionales para la página Pre-Masked Genomes se proporcionan por cortesía del grupo UCSC Genome Bioinformatics.

Calidad de secuencia de ADN (Phred): proporciona llamada de base, visualización de cromatograma y evaluación y presentación de la región de secuencia de alta calidad para hasta cinco secuencias simultáneamente.

Ensamblaje de secuencia: no necesita su propio programa de ensamblaje contig cuando puede usar:

EGassember: alinea y fusiona los fragmentos de secuencia resultantes de la secuenciación de escopeta o fragmentos de transcripciones de genes (EST) para reconstruir el segmento o gen original (Referencia: A. Masoudi-Nejad et al. 2006. Nucl. Acids Res. 34: W459-462).

CGE Assembler 1.2: ensambla datos de Illumina, 454, SOLid e Ion Torrent (Referencia: Larsen MV, et al. J. Clin. Micobiol.2012. 50(4): 1355-1361).
CGE SPAdes 3.9: reúne datos de Illumina e Ion Torrent (Referencia: S. Nurk et al. Investigación en Biología Molecular Computacional: págs. 158-170).

CAP3 (PBIL, Francia ), (Referencia: Huang, X. & Amp Madan A. 1999. Genome Res. 9: 868-877) y aquí.
Ensamblador CAP EST (Istituto FIRC di Oncologia Molecolare, Italia) - La longitud máxima de secuencia para cada secuencia es 30 kb - Número máximo de secuencias 10 kb

El sitio web de MicroScope (alojado en Genoscope), proporciona un entorno para anotaciones de expertos y genómica comparativa. Proyecto Genoma: anotación y análisis comparativo de secuencias genómicas terminadas o en borrador. Para las secuencias previamente anotadas, solo integran anotaciones de la sección completa del genoma de NCBI RefSeq. Proyecto Metagenome: Anotación y análisis comparativo de secuencias metagenómicas ensambladas. Actualmente, pueden integrar conjuntos de datos por debajo de 20 Mb de contigs por bin.

NanoPipe: se desarrolló teniendo en cuenta las características específicas de las tecnologías de secuenciación MinION, proporcionando parámetros de alineación ajustados en consecuencia. El rango de especies / secuencias objetivo para la alineación no está limitado, y la página de uso descriptivo de NanoPipe ayuda al usuario a tener éxito con el análisis de NanoPipe. Los resultados contienen estadísticas de alineación, secuencia de consenso, datos de polimorfismos y visualización de la alineación. (Referencia: Shabardina V et al. (2019) Gigascience 8 (2). pii: giy169).


COV2HTML: una herramienta de visualización y análisis de datos de secuenciación bacteriana de próxima generación (NGS) para científicos de la vida postgenómica - permite realizar tanto la visualización de cobertura como el análisis de alineaciones NGS realizadas en organismos procariotas (bacterias y fagos). Combina dos procesos: una herramienta que convierte los enormes archivos de cobertura o mapeo NGS en archivos de cobertura específicos ligeros que contienen información sobre elementos genéticos y una interfaz de visualización que permite un análisis de datos en tiempo real con integración opcional de resultados estadísticos. (Referencia: Monot M. et al. 2014. OMICS 18(3): 184-95).

Alineación de secuencia múltiple DCA Divide-and-Conquer ( Universitat Bielefeld, Alemania) - es un programa para producir alineaciones de secuencia múltiple simultáneas rápidas y de alta calidad de secuencias de aminoácidos, ARN o ADN. (Referencia: Brinkmann, G. et al. Programación matemática 79: 71-97, 1997).

PhageTerm: es un paquete de software rápido y fácil de usar que se puede utilizar para determinar las terminaciones de bacteriófagos y el modo de empaquetado a partir de datos NGS fragmentados aleatoriamente. Es parte del paquete Galaxy y se puede encontrar en el directorio & quotNGS: Mapeo & quot. Lo ideal es que desee una respuesta automática. (Referencia: Garneau JR, et al. 2017. Sci Rep. 7(1):8292).

QUAST: una herramienta de evaluación de la calidad para evaluar y comparar conjuntos de genomas. Esta herramienta mejora el software líder de comparación de ensamblajes con nuevas ideas y métricas de calidad. QUAST puede evaluar ensamblajes tanto con un genoma de referencia como sin una referencia. QUAST produce muchos informes, tablas de resumen y gráficos para ayudar a los científicos en su investigación y en sus publicaciones. (Referencia: A. Gurevich et al. 2013. Bioinformática, 29(8): 1072 y ndash1075). nótese bien Este servidor es de abril de 2020, pero hay esperanzas de que vuelva a estar en línea (consulte aquí las descargas de software).

Errores de secuenciación: - Si su secuencia de ADN no coincide con la secuencia de proteínas esperada, puede verificar si hay errores en GeneWise (EMBL-EBI), que compara una secuencia de proteínas con una secuencia de ADN genómico, lo que permite intrones y errores de cambio de marco. Otros programas incluyen:

FrameD (Referencia: T. Schliex y col. 2003. Nucl. Acids Res. 31: 3738-3741)
AMIGene - anotación de genes microbianos (Referencia: Bocs S et al. (2003) Ácidos nucleicos Res. 13(31): 3723-3726).
path :: protein back-translation and alineación: aborda el problema de encontrar homologías de proteínas distantes donde la divergencia es el resultado de mutaciones y sustituciones de marco de lectura. Dadas dos secuencias de proteínas de entrada, el método alinea implícitamente todos los posibles pares de secuencias de ADN que las codifican, mediante la manipulación de representaciones gráficas eficientes para la memoria del conjunto completo de supuestas secuencias de ADN para cada proteína. (Referencia: G & icircrdea M et al. 2010. Algoritmos para biología molecular 5:)

In-silico.com (Dr. Joseba Bikandi y colaboradores, Facultad de Farmacia, Universidad del País Vasco) - permite en silico experimentos que incluyen amplificación teórica por PCR, AFLP-PCR, análisis de restricción y electroforesis en gel de campo pulsado [PFGE] con genomas bacterianos y arcaélicos que se encuentran en la base de datos pública.

Canalización automática de anotación de genomas procarióticos de NCBI. Esto anotará completamente su genoma bacteriano y le proporcionará un archivo de envío de Sequin. nótese bien se está desarrollando un canal de anotación automática de fagos de NCBI.

RAST (Rapid Annotation using Subsystem Technology) es un servicio totalmente automatizado para anotar genomas bacterianos y arqueales. Proporciona anotaciones genómicas de alta calidad para estos genomas en todo el árbol filogenético. Requiere registro. (Referencia: Aziz, RK et al. 2008. BMC Genomics 9:75.).

Herramienta de anotación bacteriana BASys: esta increíble herramienta admite la anotación en profundidad y automatizada de secuencias genómicas bacterianas. Acepta datos de secuencias de ADN sin procesar y una lista opcional de información de identificación de genes (Glimmer) y proporciona una amplia anotación textual y una salida de imágenes con hipervínculos. BASys utiliza los programas & gt30 para determinar 60 subcampos de anotación para cada gen, incluido el nombre del gen / proteína, función GO, función COG, posibles parálogos y ortólogos, peso molecular, punto isoeléctrico, estructura del operón, localización subcelular, péptidos señal, regiones transmembrana, estructura secundaria , Estructura 3D, reacciones y vías. (Referencia: G.H. Van Domselaar y col. 2005. Nucl. Acids Res. 33(Problema del servidor web): W455-W459).

MicroScope - (CEA, Institut de G & eacutenomique - Genoscope, Francia) es una plataforma de análisis de amplificación y anotación del genoma microbiano que proporciona acceso a una amplia gama de herramientas, incluido el análisis COG y la genómica comparativa. (Referencia: Vallenet D et al. (2017) Nucleic Acids Res. 45 (D1): D517-D528). Requiere registro.

MAKER Web Annotation Service (MWAS) es un canal de anotación del genoma fácilmente configurable y accesible desde la web. Su propósito es permitir que los grupos de investigación con cantidades pequeñas o intermedias de secuencia genómica eucariota y procariota (es decir, clones BAC, genomas completos pequeños, datos de secuenciación preliminar, etc.) anoten y analicen sus datos de forma independiente y produzcan resultados que se puedan cargar. en una base de datos del genoma. (Referencia: Holt, C. y Yandell, M. 2011. BMC Bioinformatics 12:491).

MITOS: una canalización está diseñada para proporcionar una anotación de novo consistente y de alta calidad de las secuencias de genomas mitocondriales de Metazoan. Demostramos que los resultados de MITOS coinciden con RefSeq y MitoZoa en términos de cobertura y calidad de las anotaciones. Al mismo tiempo, evitamos sesgos, inconsistencias de nomenclatura y errores tipográficos que se originan en estrategias de curación manual. (Referencia: M. Bernt et al. 2013. Molecular Phylogenetics & amp Evolution 69:313-319).

GenSAS - Genome Ssecuencia Aanotación Server: proporciona un sitio web integral con una única interfaz gráfica para ejecutar múltiples herramientas de anotación estructural y funcional, lo que permite la visualización y la curación manual de las secuencias del genoma. Los usuarios pueden cargar secuencias en su cuenta y ejecutar programas de predicción de genes, búsquedas de homología de proteínas, cartografiar EST, identificar repeticiones, ORF y SSR con ajustes de parámetros personalizados. Cada análisis se muestra en pistas separadas de la interfaz gráfica con pistas editabe personalizadas para seleccionar la anotación final de las características y crear archivos gff3 para cargarlos en navegadores de genoma como GBrowse. Se pueden agregar fácilmente programas adicionales usando este software basado en Drupal.

Viral GRAMOenome ORF Reader (VIGOR): admite predicción y anotación de funciones de alto rendimiento. VIGOR emplea una estrategia extrínseca y cuenta con una sensibilidad y especificidad superior al 98% para los genomas virales de ARN que probamos. Las características específicas del genoma identificadas por VIGOR incluyen cambios de marco, deslizamiento ribosómico, edición de ARN, lectura del codón de parada, genes superpuestos, genes incrustados y sitios de escisión de péptidos maduros. La capacidad de genotipado de la influenza y el rotavirus está integrada en el programa.
(Referencia: S. Wang et al. 2011. BMC Bioinformatics 2010, 11:451)

FLAN (Floridatu UNnotación) es un servidor web del NCBI para la anotación del genoma del virus de la influenza es una herramienta para las secuencias del virus de la influenza A o del virus de la influenza B proporcionadas por el usuario. Puede validar y predecir secuencias de proteínas codificadas por una secuencia de entrada de la gripe. (Referencia: Y. Bao et al. 2007. Problema del servidor web de Nucleic Acids Res.) 35: W280-W284.)

CpGAVAS ( Chloropagúltimo GRAMOenome Aanotación Visualización, Analysis y GenBank Submission Tool): permite la anotación precisa del genoma del cloroplasto, la generación de mapas circulares, la provisión de resultados de análisis útiles del genoma anotado, la creación de archivos que se pueden enviar directamente a GenBank. (Referencia: C. Liu et al. 2012. BMC Genomics 13: 715)

GRAMOenome Aanotación Ttransferir Utility (GATU) anota un genoma basado en un genoma de referencia muy relacionado. Las proteínas / péptidos maduros del genoma de referencia son BLASTed contra el genoma a anotar para encontrar los genes / péptidos maduros en el genoma a anotar (Referencia: T. Tcherepano v et al. 2006. BMC Genomics 7:150.)

BioGPS (Instituto de Investigación Scripps, EE. UU.) - es un portal de anotación de genes de ventanilla única que enfatiza la personalización del usuario y la extensibilidad de la comunidad. Es un portal de anotación de genes personalizable y un recurso completo para aprender sobre la función de genes y proteínas.

BAGEL (Instituto de Ciencias Biomoleculares y Biotecnología de Groningen, Haren, Países Bajos) - determinará a partir de un archivo GenBank existente o no presentado la presencia de bacteriocinas basándose en una base de datos que contiene información de bacteriocinas conocidas y genes adyacentes involucrados en la actividad bacteriocina. Un sitio alternativo para las bacteriocinas es BACTIBASE, que es un depósito de datos de péptidos antimicrobianos naturales de bacteriocina. Ver . LABioicin si está interesado en el tema de las bacterias del ácido láctico (LAB) y sus bacteriocinas.

MICheck (MIgenoma crobiano Chequeer): permite la verificación rápida de conjuntos de genes anotados y cambios de marco en genomas bacterianos previamente publicados, o genomas para los que el usuario tiene un archivo * .gbk. Esta herramienta puede verse como un paso preliminar antes del paso de re-anotación funcional para verificar rápidamente si hay genes faltantes o anotados incorrectamente. Funcionó muy bien con genomas de fagos de 43 a 135 kb. (Referencia: S. Cruveiller et al. 2005. Nucl. Acids Res. 33: W471-W479).

WebGeSTer - Genombre Senlatador para Terminators: mi programa de búsqueda de terminador favorito finalmente está habilitado para la web. Tenga en cuenta que si desea analizar datos de un archivo * .gbk, primero debe utilizar su programa de conversión & quotGenBank2GeSTer & quot. Este programa produce una descripción completa de cada terminador que incluye un diagrama. Este sitio está vinculado a una extensa base de datos de terminadores transcripcionales en el genoma bacteriano (WebGeSTer DB) (Referencia: Mitra A. et al. 2011. Nucl. Acids Res. 39 (Edición de la base de datos): D129-35).

RibEx: Costillaoswitch Explorer: escanea el ADN de lt40kb en busca de genes potenciales (que están vinculados a BLASTP) y varios cientos de elementos reguladores, incluidos los riboswitches. Si hace clic en "buscar atenuadores", encontrará terminadores y antiterminadores. Presenta los genes capculados y permite el análisis BLAST en NCBI (Referencia: C. Abreu-Goodger & amp E. Merino. 2005. Nucl. Acids Res. 33: W690-W692).

tRNAs: tRNAscan-SE - es increíblemente sensible y también proporciona diagramas de estructura secundaria de las moléculas de tRNA (Referencia: Schattner, P. et al. 2005. Nucleic Acids Res. 33: W686-689). Alternativamente, use ARAGORN (Referencia: Laslett, D. & amp Canback. 2004. Investigación de ácidos nucleicos 32:11-16).
Secuencias de prueba.

LTR_Finder: es un programa eficaz para encontrar retrotranspsondo LTR de longitud completa en secuencias del genoma. El tamaño del archivo de entrada ahora está limitado a 50 MB (Referencia: Z. Xu & amp H. Wang. 2007. Nucl. Acids Res.35(Problema del servidor web): W265-W268).
RTAnalyzer: encuentra retrotransposones y detecta firmas de retrotransposición L1 (Referencia: J-F. Lucier et al. 2007. Nucl. Acids Res. 35(Problema del servidor web): W269-W274

MG-RAST (METROetagenoma Rapid Aanotación usando Subsystem Technology) es un servicio totalmente automatizado para anotar muestras de metagenoma. Proporciona la anotación de los fragmentos de secuencia, su clasificación filogenética y una reconstrucción metabólica inicial. El servicio también proporciona medios para comparar clasificaciones filogenéticas y reconstrucciones metabólicas de metagenomas (Referencia: F. Meyer et al. 2008. BMC Bioinformatics 9: 386).

Los siguientes cuatro programas se pueden utilizar para predecir proteínas de fagos:

PVPred (Referencia: Ding H et al (2014) Mol Biosyst 10(8): 2229-2235).
PHPred (Referencia: Ding H (2016) Computers Biol Med 71: 156 y ndash161).
PVP-SVM (Referencia: Manavalan B et al. (2018) Front Microbiol 9: 476).
PVPred-SCM (Referencia: Charoenkwan P et al. (2020) Cells 9 (2) pii: E353.

Origen de la replicación cromosómica:

Ori-Finder y Ori-Finder 2 - son plataformas útiles para la identificación y análisis de los orígenes de replicación (oriCs) en los genomas bacterianos y arqueales, respectivamente. (Referencia: Luo H et al. (2019) Brief Bioinform 20(4): 1114-1124). Tenga en cuenta que estas herramientas se han utilizado para crear DoriC, una base de datos de los orígenes de replicación en genomas procarióticos que incluyen cromosomas y plásmidos. (Referencia: Luo H & amp Gao F (2019) Nucleic Acids Res. 47 (D1): D74-D77).

Uno de los problemas con GenBank es que los científicos no actualizan sus datos de envío ni corrigen errores. En parte, esto se debe a la pereza, pero también al hecho de que GenBank, en la mayoría de los casos, no está dispuesto a aceptar una nueva versión del archivo Sequin. Tbl2asn es un programa de línea de comandos que automatiza la creación de registros de secuencia para enviarlos a GenBank pero, desde mi perspectiva, no es fácil de usar. El único programa en línea es GenBank 2 Sequin, que genera no solo un archivo Sequin (* .sqn), sino también una & quot Tabla de anotaciones & quot (* .tbl) de cinco columnas.Esto, junto con la secuencia de ADN en formato fasta, se puede enviar a GenBank por correo electrónico ([email protected]). En su ausencia, recomiendo el script de perl gbf2tbl.pl disponible para descargar aquí.


PlasmidFinder 1.3: identifica plásmidos en aislados de bacterias secuenciados totales o parciales. El método utiliza BLAST para la identificación de replicones de plásmidos que pertenecen a los principales grupos de incompatibilidad (Inc) de Enterobacterias. Como entrada, el método puede utilizar genomas preensamblados, completos o parciales, y lecturas de secuencias cortas de cuatro plataformas de secuenciación diferentes. Véase también pMLST (Referencia: Carattoli A et al. 2014. Antimicrob. Agents Chemother. 58: 3895-903)

Los PHACTS se pueden utilizar para clasificar rápidamente el estilo de vida de un fago (templado o lítico). Todo lo que se necesita es el proteoma del fago a clasificar y PHACTS predecirá el estilo de vida de ese fago y devolverá un valor de confianza para esa predicción. (Referencia: K. McNair et al. 2012. Bioinformática 28: 614-618).

SpeciesFinder 1.0 (Universidad Técnica Danesa) - predice las especies de bacterias a partir de genomas preensamblados, completos o parciales, y lecturas de secuencia corta. La predicción se basa en el gen ARNr 16S.

CSI Phylogeny 1.1 (Call SNPs & amp Infer Phylogeny): llama a SNP, filtra los SNP, realiza la validación del sitio e infiere una filogenia basada en la alineación concatenada de los SNP de alta calidad *. (Referencia: Kaas, R.S. et al. PLoS ONE 2014 9: e104984.)

KmerFinder 2.0 & ndash predice las especies de bacterias a partir de genomas preensamblados, completos o parciales, y lecturas de secuencia corta. La predicción se basa en el número de k-mers concurrentes (subcadenas de k nucleótidos en los datos de la secuencia de ADN, en este caso 16-meros) entre los genomas de las bacterias de referencia en una base de datos y el genoma proporcionado por el usuario. (Referencia: Hasman H et al. 2013. J Clin Microbiol. 52:139-146)

VIOLIN: Red de información en línea e investigación de vacunas: permite una fácil curación, comparación y análisis de datos de investigación relacionados con vacunas en varios patógenos humanos Se espera que VIOLIN se convierta en una fuente centralizada de información sobre vacunas y proporcione a los investigadores de las ciencias básicas y clínicas datos curados y herramientas bioinformáticas para la investigación y el desarrollo de vacunas. VBLAST: Búsqueda BLAST personalizada para investigación de vacunas que permite varias estrategias de búsqueda contra 77 genomas de 34 patógenos. (Referencia: He, Y. et al. 2014. Nucleic Acids Res. 42 (Problema de la base de datos): D1124-32).

MLST 1.8 (MultiLocus Sequence Typing): actualmente solo funciona con genomas y contigs ensamblados (Referencia: Larsen MV et al. 2012. J. Clin. Micobiol. 50: 1355-1361).

ECFfinder, los factores sigma de la función extracitoplasmática (ECF), el grupo más grande de factores sigma alternativos, representan el tercer mecanismo fundamental de transducción de señales bacterianas, con aproximadamente seis de estos reguladores en promedio por genoma bacteriano. Junto con sus factores anti-sigma afines, representan un diseño altamente modular que facilita principalmente la transducción de señales transmembrana. (Referencia: Staron A et al. (2009) Mol Microbiol 74(3): 557-581).

BacWGSTdb: está diseñado para monitorear la aparición y el brote de patógenos bacterianos importantes. En detalle, tiene dos propósitos particulares: mecanografía y seguimiento de amplificador. El primero se refiere a un genotipado integrado tanto en el tipado de secuencias de múltiples locus tradicionales (MLST) como en el tipado de secuenciación del genoma completo (WGST). Este último se refiere al seguimiento de la fuente (es decir, encontrar aislamientos muy similares) de acuerdo con el resultado de la tipificación y aísla la información almacenada en BacWGSTdb. (Referencia: Z. Ruan 7 Y. Feng, Investigación de ácidos nucleicos.2016 44 (D1): D682-D687).

SISTR: Salmonella Inorte Silico Typing Resource - (Agencia de Salud Pública de Canadá, Laboratorio de Zoonosis de Transmisión Alimentaria) es un recurso bioinformático para interpretar rápidamente datos in silico para múltiples métodos de subtipificación de Salmonella de borradores de conjuntos de genomas bacterianos. Además de realizar la predicción de serovariedades mediante genoserotipado, este recurso integra análisis de tipificación basados ​​en secuencias para: tipificación de secuencias de múltiples locus (MLST), MLST ribosomal (rMLST) y MLST de genoma central (cgMLST). Se recomienda Google Chrome. Firefox también es compatible, pero las visualizaciones SVG dentro de esta aplicación pueden no ser tan receptivas. Internet Explorer no es compatible.

FSFinder2 (FRameshift Signal Finder): el cambio de marco ribosómico programado está involucrado en la expresión de ciertos genes de una amplia gama de organismos como virus, bacterias y eucariotas, incluidos los humanos. En el cambio de marco programado, el ribosoma cambia a un marco alternativo en un sitio específico en respuesta a una señal especial en un ARN mensajero. El cambio de marco programado juega un papel en la morfogénesis de las partículas virales, el control autógeno y las actividades enzimáticas alternativas. El cambio de marco común es un cambio de marco de -1, en el que el ribosoma cambia un solo nucleótido en la dirección ascendente. Los elementos principales del desplazamiento de marco de -1 consisten en un sitio resbaladizo, donde el ribosoma cambia los marcos de lectura, y una estructura de ARN estimulante, como un pseudonudo o un bucle de tallo, ubicado unos pocos nucleótidos corriente abajo. Los cambios de fotogramas +1 son mucho menos comunes que los cambios de fotogramas -1, pero se observan en diversos organismos.

InBase, la base de datos y el registro de Intein - El empalme de proteínas se define como la escisión de una secuencia de proteína interviniente (la INTEIN) de un precursor de proteína y la ligación concomitante de los fragmentos de proteína flanqueantes (EXTEINAS) para formar una proteína huésped de exteína madura y la intein libre (Perler 1994). El empalme de proteínas da como resultado un enlace peptídico nativo entre las exteínas ligadas. Este es un sitio de base de datos que permite el análisis BLAST. (Referencia: Perler, F.B. 2002. Nucleic Acids Res. 30: 383-384).

P2RP (Proteínas reguladoras procarióticas predichas): los usuarios pueden introducir secuencias de ADN genómico o de aminoácidos, y las proteínas predichas allí se escanean para detectar la posesión de dominios de unión al ADN y / o dominios del sistema de dos componentes. Los RP identificados de esta manera se clasifican en familias, anotados sin ambigüedades. (Referencia: Barakat M, et al. 2013. BMC Genomics 14:269).

P2CS (Sistemas procarióticos de 2 componentes) es un recurso completo para el análisis de sistemas procarióticos de dos componentes (TCS). Los TCS se componen de un receptor de histidina quinasa (HK) y un regulador de la respuesta de la pareja (RR) y controlan comportamientos procarióticos importantes. Se puede buscar mediante BLASTP. (Referencia: P. Ortet et al. 2015. Nucl. Acids Res. 43 (D1): D536-D541).

Análisis COG - Clustres de Oortólogo GRAMOGrupos: la base de datos de proteínas del COG se generó comparando proteínas predichas y conocidas en todos los genomas microbianos completamente secuenciados para inferir conjuntos de ortólogos. Cada COG consta de un grupo de proteínas que se encuentran ortólogas en al menos tres linajes y probablemente corresponde a un antiguo dominio conservado (CloVR). Los sitios que ofrecen este análisis incluyen:

WebMGA (Referencia: S. Wu et al. 2011. BMC Genomics 12:444), RAST (Referencia: Aziz RK et al. 2008. BMC Genomics 9:75) y BASys (Bacterial Aanotación SReferencia del sistema: Van Domselaar GH et al. 2005. Nucleic Acids Res. 33(Problema del servidor web): W455-459.) Y JGI IMG (Iintegrado METROicrobiano GRAMOenomes Referencia: Markowitz VM et al. 2014. Nucl. Acids Res. 42: D560-D567. )

Otros sitios:

EggNOG: una base de datos de grupos ortólogos y anotación funcional que deriva nortesupervisado Oortólogo GRAMOgrupos (NOG) de genomas completos, y luego aplica una caracterización integral y un proceso de análisis a las familias de genes resultantes. (Referencia: Powell S et al. 2014. Nucleic Acids Res. 42 (D1): D231-D239

OrthoMCL: es otro algoritmo para agrupar proteínas en grupos de ortólogos en función de su similitud de secuencia. El proceso suele tardar entre 6 y 72 horas (Referencia: Fischer S et al. 2011. Curr Protocols Bioinformatics Capítulo 6: Unidad 6.12.1-19).

KAAS (KHUEVO Automático Aanotación Server) proporciona una anotación funcional de genes mediante comparaciones BLAST o GHOST con la base de datos KEGG GENES curada manualmente. El resultado contiene asignaciones KO (KEGG Orthology) y rutas KEGG generadas automáticamente. (Referencia: Moriya Y et al. 2007. Nucleic Acids Res. 35(Problema del servidor web): W182-185).

ResFinder (buscador de genes de resistencia a los antimicrobianos adquiridos): utiliza BLAST para la identificación de genes de resistencia a los antimicrobianos adquiridos en los datos del genoma completo. Como entrada, el método puede utilizar genomas preensamblados, completos o parciales, y lecturas de secuencias cortas de cuatro plataformas de secuenciación diferentes. Probado con 1411 genes de resistencia diferentes con 100% de identidad. (Referencia: Zankari E et al. 2012. J Antimicrob Chemother. 67:2640-2644)

ARG-ANNOT (Aantibiótico Rresistencia GRAMOene-ANNOTación) es una nueva herramienta que se creó para detectar genes nuevos y putativos de resistencia a antibióticos (AR) en genomas bacterianos. ARG-ANNOT utiliza un programa de explosión local en el software Bio-Edit que permite al usuario analizar secuencias sin interfaz web (Referencia: Gupta, S.K. et al. 2014. Antimicrob Agents Chemother. 58: 212 y ndash220).

TARJETA (La Comnipresente Aantibiótico Rresistencia Database): una colección rigurosamente seleccionada de determinantes de resistencia conocidos y antibióticos asociados, organizada por la Ontología de resistencia a antibióticos (ARO) y los modelos de detección de genes AMR (Referencia: Jia, B. et al. 2017. Investigación de ácidos nucleicos, 45: D566-573).

MEGARes: es una base de datos de resistencia a los antimicrobianos curada a mano y una estructura de anotación que proporciona una base para el desarrollo de clasificadores acíclicos de alto rendimiento y análisis estadístico jerárquico de macrodatos (Referencia: Lakin, S.N .. et al. 2017. Investigación de ácidos nucleicos, 45: D574-D580).

BacMet (Antibacterial biocida y amp Reunióal Resistance Genes Database): una base de datos de genes de resistencia a biocidas y metales con contenido altamente confiable. En BacMet versión 1.1, la base de datos confirmada experimentalmente contiene 704 genes de resistencia, mientras que la base de datos predicha contiene 40,556 genes de resistencia (Referencia: Pal, C. et al. 2014. Nucleic Acids Research, 42: D737-743).

Anotación especializada - CRISPR (repeticiones palindrómicas cortas agrupadas regularmente interespaciadas):

CRISPRfinder: permite la detección fácil de CRISPR en datos producidos localmente y la consulta de CRISPR presentes en la base de datos. También proporciona información sobre la presencia de genes asociados a CRISPR (cas) cuando se han anotado como tales. . (Referencia: I. Grissa et al. 2007. Nucl. Acids Res. 35 (Problema del servidor web): W52-W57).

CRISPRmap: proporciona una visión rápida y detallada de la conservación repetida y la diversidad de sistemas bacterianos y arqueales. Comprende el mayor conjunto de datos de CRISPR hasta la fecha y permite análisis de agrupamiento independientes completos para determinar familias de secuencias conservadas, posibles motivos de estructura para endoribonucleasas y relaciones evolutivas. (Referencia: S.J. Lange et al. 2013. Nucleic Acids Research, 41: 8034-8044).

CRISPI: una base de datos interactiva CRISPR - incluye un repertorio completo de genes asociados asociados a CRISPR (CAS). Una interfaz web fácil de usar con muchas herramientas y funciones gráficas permite a los usuarios extraer resultados, encontrar CRISPR en secuencias personales o calcular similitudes de secuencia con espaciadores (Referencia: Rousseau C et al. 2009. Bioinformatics. 25: 3317 y ndash3318).

CRISPRTarget: predice los objetivos más probables de los ARN CRISPR. Esto se puede utilizar para descubrir dianas en datos genómicos o metagenómicos recién secuenciados. (Referencia: Biswas A et al. 2013. RNA Biol. 10:817-827).

CRISPy-web: es una herramienta web fácil de usar basada en CRISPy para diseñar sgRNA para cualquier genoma microbiano proporcionado por el usuario. CRISPy-web permite a los investigadores seleccionar de forma interactiva una región de su genoma de interés para buscar posibles sgRNA. Después de comprobar las posibles coincidencias fuera del objetivo, las secuencias de sgRNA resultantes se muestran gráficamente y se pueden exportar a archivos de texto. (Referencia: K. Blin et al. 2016. Biotecnología sintética y de sistemas 1 (2): 118-121).

Anotación especializada - determinantes de virulencia: Esto es de particular interés para quienes trabajan con bacteriófagos para terapia.

VirulenceFinder (Universidad Técnica Danesa) & ndash identificación de genes de virulencia. El método utiliza BLAST para la identificación de genes de virulencia conocidos en Escherichia coli. El método se está ampliando para incluir también genes de virulencia para Enterococcus y Staphylococcus aureus. Como entrada, el método puede utilizar genomas preensamblados, completos o parciales, y lecturas de secuencias cortas de cuatro plataformas de secuenciación diferentes.

ClanTox: un clasificador de toxinas animales cortas: predice si cada secuencia es similar a una toxina y proporciona una lista clasificada de candidatos predichos positivamente de acuerdo con la confianza estadística. Para cada proteína, se presenta información adicional que incluye la presencia de un péptido señal, el número de residuos de cisteína y las anotaciones funcionales asociadas. (Referencia: G. Naamati et al. 2009. Nucleic Acids Res. 37 (problema del servidor web): W363 y ndashW368).

t3db, la base de datos de toxinas y objetivos de toxinas: combina datos detallados de toxinas con información completa de objetivos de toxinas. La base de datos contiene actualmente 3.053 toxinas que están vinculadas a 1.670 registros de objetivo de toxinas correspondientes. Cada registro de toxinas (ToxCard) contiene más de 50 campos de datos y contiene información como propiedades químicas y descriptores, valores de toxicidad, interacciones moleculares y celulares e información médica. (Referencia: Lim E et al. 2010. Nucleic Acids Res. 38 (problema de la base de datos): D781-786).

TAfinder 2.0: es una herramienta web para identificar loci de toxina-antitoxina de tipo II en el genoma bacteriano (Referencia: Xie Y et al. (2018) Nucleic Acids Res. 46(D1): D749-D753).

DBETH Database of Bacterial ExoToxins for Humans es una base de datos de secuencias, estructuras, redes de interacción y resultados analíticos para 229 exotoxinas, de 26 géneros bacterianos patógenos humanos diferentes. Todas las toxinas se clasifican en 24 clases de toxinas diferentes. El objetivo de DBETH es proporcionar una base de datos completa de exotoxinas bacterianas patógenas humanas. (Referencia: Chakraborty A et al. 2012. Nucleic Acids Res. 40 (problema de la base de datos): D615-620).

VFDB: es una base de datos integrada y completa de factores de virulencia para patógenos bacterianos (que también incluyen clamidia y micoplasma). (Referencia: L.H. Chen et al. 2012. Nucleic Acids Res. 40 (problema de la base de datos): D641-D645).

PAGADO (Pensilvaniatogenicidad Island DataBase) - Las islas de patogenicidad (PAI) y las islas de resistencia (REI) son clave para la evolución de patógenos y parecen desempeñar funciones complementarias en el proceso de infección bacteriana. Mientras que los PAI promueven el desarrollo de enfermedades, los REI brindan una ventaja de aptitud al hospedador frente a múltiples agentes antimicrobianos. Un programa auxiliar, PAI Finder, identifica regiones similares a PAI o regiones similares a REI en una consulta de múltiples secuencias. (Referencia: S.H Yoon et al. 2015. Nucl. Acids Res. 43 (D1): D624-D630).

IslandViewer: incluye una nueva herramienta interactiva de visualización del genoma, IslandPlot, un factor de virulencia expandido, un gen de resistencia a los antimicrobianos y anotaciones de genes asociados a patógenos, así como homólogos de estos genes en genomas estrechamente relacionados. En particular, los genomas incompletos se aceptan como entrada en IslandViewer 3, aunque instan encarecidamente a los usuarios a usar genomas completos siempre que sea posible. (Referencia: B.K. Dhillon et al. 2015. Nucl. Acids Res. 43 (W1): W104-W108).

Gypsy Database - una base de datos editable abierta sobre la relación evolutiva de virus, elementos genéticos móviles (MGEs Ty3 / Gypsy, Retroviridae, Ty1 / Copia y Bel / Pao LTR retroelementos y los Caulimoviridae pararetrovirus de plantas) y otras repeticiones genómicas. Equipado para búsquedas BLAST y HMM. (Referencia: Llorens, C et al. 2011. Nucl. Acids Res. 39(suplemento 1): D70-D74).

PanDaTox (Sartén Genómico Database para elementos genómicos Toxic to Bacteria) - es una base de datos de genes y regiones intergénicas que no son clonables en E. coli, para ayudar al descubrimiento de nuevos antibióticos y genes funcionales biotecnológicamente beneficiosos. También está diseñado para mejorar la eficiencia de la ingeniería metabólica. Función de búsqueda BLAST incluida. (Referencia: Mitai G & amp Sorek R. 2012. Bioengineered, 3: 218-221.)

PathogenFinder (predice el potencial patógeno) & ndash Basado en genomas completos de 513 bacterias anotadas como no patógenas humanas y 372 bacterias anotadas como patógenos humanos, se ha creado una base de datos de familias de proteínas, que están asociadas principalmente con no patógenos o con patógenos. Esta base de datos se utiliza luego para predecir el potencial patógeno de las bacterias. Como entrada, el método puede utilizar genomas preensamblados, completos o parciales, y lecturas de secuencias cortas de cuatro plataformas de secuenciación diferentes. (Referencia: Cosentino S et al. 2013. PLoS ONE 8: e77302)

VirulentPred: es un método basado en SVM para predecir secuencias de proteínas virulentas bacterianas, que se pueden utilizar para seleccionar proteínas virulentas en proteomas. Junto con las proteínas virulentas verificadas experimentalmente, se ha predicho que varias secuencias de proteínas putativas, no anotadas e hipotéticas son proteínas virulentas de alta puntuación mediante el método de predicción. (Referencia: Garg A & amp Gupta G. 2008. BMC Bioinformatics 9: 62).

El sistema de secreción de tipo III (T3SS) es un mecanismo esencial para la interacción huésped-patógeno en el proceso de infección. Las proteínas secretadas a través de la maquinaria T3SS de muchas bacterias gramnegativas se conocen como efectores T3SS (T3SE). Estos pueden estar localizados subcelularmente en el huésped o ser parte de la punta de la aguja del T3SS que interactúa directamente con la membrana del huésped para llevar otros efectores a la célula diana. T3SEdb representa un esfuerzo de este tipo para reunir una base de datos completa de todos los T3SE supuestos y determinados experimentalmente en un sitio web accesible. La búsqueda BLAST está disponible. (Referencia: Tay DM et al. 2010. BMC Bioinformatics. 11 Supl. 7: S4).

Efectivo (Universidad de Viena, Austria y Universidad Técnica de Munich, Alemania) - La secreción de proteínas bacterianas es el mecanismo de virulencia clave de las bacterias simbióticas y patógenas, por lo que las proteínas efectoras se transportan desde el citosol bacteriano al medio extracelular o directamente a la célula huésped eucariota. El portal Effective proporciona predicciones precalculadas sobre efectores bacterianos en todos los genomas patógenos y simbiónicos disponibles públicamente, así como la posibilidad de que el usuario prediga efectores en los datos de la secuencia de proteínas propias.

SIEVE Server es una herramienta web pública para la predicción de efectores secretados de tipo III. El servidor SIEVE puntúa los efectores secretados potenciales de los genomas de patógenos bacterianos con sistemas de secreción de tipo III utilizando un modelo aprendido de proteínas secretadas conocidas. El servidor SIEVE requiere que solo se analicen las secuencias de proteínas de las proteínas y devuelve una probabilidad conservadora de que cada proteína de entrada sea un efector secretado de tipo III. (Referencia: McDermott JE et al. 2011. Infect Immun. 79:23-32).

T3SE: predicción del efector del sistema de secreción de tipo III (Referencia: L & oumlwer M, & amp Schneider G. 2009. PLoS One. 4:e5917. Errata en: PLoS One. 20094 (7).

Phage_Finder: fue creado para identificar regiones de profago en genomas bacterianos completos. Utilizando un conjunto de datos de prueba de 42 genomas bacterianos cuyos profagos se han identificado manualmente, Phage_Finder encontraron el 91% de las regiones, lo que resultó en un 7% de falsos positivos y un 9% de profagos falsos negativos. Una búsqueda de 302 genomas bacterianos completos predijo 403 regiones de profago putativas, que representan el 2,7% del ADN bacteriano total. El análisis de los 285 sitios de unión putativos reveló que los ARNt son objetivos para la integración con un poco más de frecuencia (33%) que las regiones intergénicas (31%) o intragénicas (28%), mientras que los ARNt se dirigieron al 8% de las regiones. (Referencia: D.E. Fouts. 2006. Nucleic Acids Res. 34: 5839 & ndash5851).

Prophinder: es la herramienta utilizada para detectar profagos en genomas bacterianos. Seleccione un archivo formateado por GenBank.

PHAST (PHAge Sbuscar Tool): está diseñado para identificar, anotar y mostrar gráficamente secuencias de profagos dentro de genomas bacterianos o plásmidos de manera rápida y precisa. Acepta datos de secuencias de ADN sin procesar o datos formateados de GenBank parcialmente anotados y realiza rápidamente una serie de comparaciones de bases de datos, así como pasos de identificación de funciones de fagos y ldquocornerstone para localizar, anotar y mostrar secuencias de profagos y características de profagos. En comparación con otras herramientas de identificación de profagos, PHAST es hasta 40 veces más rápido y hasta un 15% más sensible. También es capaz de procesar y anotar tanto los datos de secuencia de ADN sin procesar como los archivos de Genbank, proporcionar tablas ricamente comentadas sobre características de profagos y "calidad" de profagos y distinguir entre profagos intactos e incompletos. PHAST también genera gráficos interactivos descargables de alta calidad que muestran todos los componentes de profagos identificados en vistas genómicas circulares y lineales.Además, las pruebas indican que PHAST es tan preciso o ligeramente más exacto que todas las herramientas de búsqueda de fagos disponibles, con una sensibilidad del 85,4% y valor predictivo positivo del 94,2%. (Referencia: Zhou, Y. et al. 2011. Nucl. Acids Res. 39(suplemento 2): W347-W352).

PHASTER PHAge Sbuscar Tool mimejorado Release: es una actualización significativa de PHAST para la rápida identificación y anotación de secuencias de profagos dentro de genomas y plásmidos bacterianos. Numerosas mejoras de software y mejoras significativas de hardware han hecho que PHASTER sea más rápido, más eficiente, más atractivo visualmente y mucho más fácil de usar. En particular, PHASTER es ahora 4,3 veces más rápido que PHAST. (Referencia: D. Arndt et al. Nucleic Acids Res.2016 44 (W1):W16-21).

Prophage Hunter: proporciona un servicio web integral para extraer genomas de profagos de genomas bacterianos, evaluar la actividad de los profagos, identificar fagos relacionados filogenéticamente y anotar la función de las proteínas de los fagos. (Referencia: Song W et al. (2019) Nucleic Acids Res 47 (W1): W74 y ndashW80).

IslandViewer: integra dos métodos de predicción GI de composición de secuencias SIGI-HMM e IslandPath-DIMOB, y un único método de predicción GI comparativo IslandPick (Referencia: Langille et al. 2008. BMC Bioinformatics 9: 329).

PAGADO (Pensilvaniatogenicidad Island DataBase) ha hecho un esfuerzo para recolectar PAI conocidos y para detectar las regiones PAI potenciales en los genomas completos procariotas. Las islas de patogenicidad (PAI) son elementos genéticos distintos de patógenos que codifican varios factores de virulencia. (Referencia: Yoon SH et al. 2007. Nucleic Acids Res. 35 (Problema de la base de datos): D395-D400).

MTGIpick puede identificar islas genómicas de un solo genoma, sin información anotada de genomas o conocimiento previo de otros conjuntos de datos. En simulaciones con fragmentos extraños de genomas artificiales y reales, MTGIpick informó resultados sólidos en diferentes experimentos (Referencia: Dai Q et al. (2018) Brief Bioinform 19(3): 361-373).


SyntTax: es un servidor web que vincula a synteny con taxonomía procariota. SyntTax incorpora un árbol taxonómico jerárquico completo que permite el acceso intuitivo a todos los procariotas completamente secuenciados (Archaea y Bacteria). Se pueden elegir organismos únicos o múltiples sobre la base de su linaje seleccionando los nodos de rango correspondientes en el árbol. Este es mi favorito entre los programas de synteny (Referencia: Oberto J. 2013. BMC Bioinformatics. 14:4). Los resultados a continuación se generaron utilizando el factor sigma de choque térmico (RpoH) de Salmonella typhimurium en contra de Pseudomonadales.

Servidor Cinteny para la identificación de Synteny y el análisis del reordenamiento del genoma (A. U. Sinha y J. Meller, Universidad de Cincinnati, EE. UU.) - este servidor se puede usar para encontrar regiones sinténicas en múltiples genomas y medir el grado de reordenamiento del genoma usando la distancia de inversión como medida. Puede crear un proyecto y cargar sus propios datos o trabajar con datos procariotas o eucariotas precargados.

SimpleSynteny: proporciona una canalización para evaluar la sintencia de un conjunto preseleccionado de objetivos genéticos en múltiples genomas de organismos. Se ha hecho hincapié en la facilidad de uso y los usuarios solo deben enviar archivos FASTA para sus genomas y genes de interés. SimpleSynteny luego guía al usuario a través de un proceso iterativo de exploración y personalización de genomas individualmente antes de combinarlos en una figura final de alta resolución. (Referencia: Veltri D et al. 2016. Nucleic Acids Res. 44 (problema del servidor web): W41 y ndashW45).

Portal Synteny: los usuarios del genoma eucariótico pueden (i) construir bloques de synteny entre varias especies mediante el uso de alineaciones predefinidas en la base de datos del navegador del genoma de UCSC, (ii) visualizar y descargar relaciones sinténicas como imágenes de alta calidad, (iii) explorar bloques de synteny con datos genéticos. y (iv) descargar los detalles de los bloques Synteny que se utilizarán como entrada para análisis posteriores basados ​​en Synteny, todo en una interfaz basada en web intuitiva y fácil de usar. (Referencia: Lee J et al. 2016. Nucleic Acids Res 44 (W1): W35 y ndashW40).

AutoGRAPH es un servidor web integrado para análisis genómico comparativo de múltiples especies. Está diseñado para construir y visualizar mapas de sintenia entre dos o tres especies, determinación y visualización de relaciones de macrosinteny y microsinteny entre especies, y para resaltar puntos de ruptura evolutivos.
El servidor web construye mapas de synteny mediante la comparación por pares de órdenes de marcador / anclaje entre un cromosoma de referencia y uno o dos genomas probados. Permite a los usuarios visualizar y caracterizar varias características: segmentos conservados (CS), segmentos conservados ordenados (CSO) y puntos de interrupción. (Referencia: Derrien T et al. 2007. Bioinformática 23:498-499).

Sibelia (Universidad de California San Diego, EE. UU.) - es una herramienta para encontrar bloques de synteny en múltiples genomas microbianos estrechamente relacionados utilizando gráficos iterativos de Bruijn. A diferencia de la mayoría de las otras herramientas, Sibelia puede encontrar bloques sintéticos que se repiten dentro de los genomas, así como bloques compartidos por múltiples genomas. Representa bloques sintéticos en una estructura jerárquica con múltiples capas, cada una de las cuales representa un nivel de granularidad diferente.

Kablammo le ayuda a crear visualizaciones interactivas de los resultados de BLAST desde su navegador web. Encuentre sus alineaciones más interesantes, enumere los parámetros detallados para cada uno y exporte una imagen vectorial lista para publicación. Increíblemente fácil de usar: aquí están los resultados de una comparación BLASTN con Escherichia fagos T1 (consulta) y ADB-2. (Referencia: Wintersinger JA et al. Bioinformática 31:1305-1306).


M1CR0B1AL1Z3R - es una "ventanilla única" para realizar análisis de datos de genómica microbiana a través de una sencilla interfaz gráfica de usuario. Algunas de las características implementadas en M1CR0B1AL1Z3R son: (i) extraer marcos de lectura abiertos putativos y análisis de genómica comparativa del contenido de genes (ii) extraer conjuntos ortólogos y analizar su distribución de tamaño (iii) analizar patrones de presencia-ausencia de genes (iv) reconstruir un gen filogenético árbol basado en el conjunto ortólogo extraído (v) que infiere la variación del contenido de GC entre los linajes. M1CR0B1AL1Z3R facilita la extracción y el análisis de docenas de genomas bacterianos utilizando técnicas avanzadas. (Referencia: Avram O et al. (2019) Nucleic Acids Res. 47 (W1): W88-W92).

GeneOrder 4.0 (D. Seto, Bioinformática y Biología Computacional, Universidad George Mason, EE. UU.) está diseñado para que se pueda utilizar para comparar el orden de los genes entre dos genomas bacterianos (Referencia: Mahadevan P. & amp Seto D. 2010. BMC Research Notes 3:41).
CoreGenes (D. Seto y P. Mahadevan, Bioinformática y Biología Computacional, Universidad George Mason, EE. UU.) - cuenta el número total de genes en común entre los dos genomas comparados muestra el valor porcentual de genes en común con un genoma específico determina los genes únicos contenidos en un par de proteomas. CoreGenes 3.5 es el servidor CoreGenes por lotes. He utilizado ampliamente este conjunto de recursos en la clasificación de virus bacterianos.

Si tiene un archivo gbk para un fago que aún no se ha depositado en GenBank, puede usar estas instrucciones para convertir sus datos al formato CoreGenes para usar aquí.

WebACT: esta es la versión web de ACT (Herramienta de comparación de Artemis), un visor de comparación de secuencias de ADN basado en Artemis (Referencia: 21: 3422 - 3423 Visite la página de la base de datos de EMBL-EBI y seleccione EMBL y & quotStandard Query Form & quot para determinar el número de acceso de EMBL para la secuencia que le interesa.

Panseq (Chad Laing, Agencia de Salud Pública de Canadá) - un grupo de herramientas para el análisis del 'genoma pan' de un grupo de secuencias genómicas. El pangenoma de una especie bacteriana consta de un genoma central y un acervo genético accesorio, el último de los cuales permite que las subpoblaciones del organismo se adapten a entornos específicos. Estos incluyen Novel Region Finder, que encontrará secuencias que son exclusivas de una cepa o grupo de cepas con respecto a otra cepa o grupo de cepas. El análisis pangenómico identifica el pangenoma entre sus secuencias y encuentra SNP en el genoma central y determina la distribución de las regiones genómicas accesorias. El selector de Loci identifica los loci que ofrecen la mejor discriminación entre su conjunto de datos. (Referencia: Laing, C. et al. 2010. BMC Bioinformatics. 11: 461).

PARIGA: permite a los usuarios realizar búsquedas BLAST de todos contra todos en dos conjuntos de secuencias seleccionadas por el usuario. Además, dado que almacena las dos salidas BLAST en una base de datos de objetos serializados en Python, los resultados se pueden filtrar de acuerdo con varios parámetros en tiempo real, sin volver a ejecutar el proceso y evitando esfuerzos de programación adicionales. (Referencia: Orsini M. et al. 2013. PLoS One 8(5):e62224).

EDGAR (mideficiente Dmarco de atabase para comparativo GRAMOenome AAnálisis usando la puntuación BLAST Ratios) - EDGAR está diseñado para realizar automáticamente comparaciones de genomas en un enfoque de alto rendimiento y se puede utilizar para análisis de genoma central, pangenoma y singleton, y construcción de diagramas de Venn. (Referencia: Blom J. et al. 2009. BMC Bioinformatics 10: 154).

OrthoVenn: es un servidor web para la comparación y anotación de todo el genoma de agrupaciones ortólogas en varias especies. Proporciona cobertura de vertebrados, metazoos, protistas, hongos, plantas y bacterias para la comparación de grupos ortólogos y también admite la carga de secuencias de proteínas personalizadas de especies definidas por el usuario. Un diagrama de Venn interactivo, recuentos resumidos y resúmenes funcionales de la disyunción y la intersección de grupos compartidos entre especies se muestran como parte del resultado de OrthoVenn. OrthoVenn también incluye vistas en profundidad de los clústeres utilizando varias herramientas de análisis de secuencia. Además, identifica grupos ortólogos de genes de copia única y permite una búsqueda personalizada de grupos de genes específicos a través de palabras clave o BLAST. (Referencia: Y. Yang et al. 2015. Nucl. Acids Res. 43 (W1): W78-W84). También se encuentra aquí.

BEACON es una herramienta de software que compara las anotaciones de un genoma particular de diferentes métodos de anotación (AM). Utiliza el formato GenBank como entrada y deriva la Anotación Extendida (EA) junto con la lista de anotaciones originales de AM individuales. (Referencia: Kalkatawi M, BMC Genomics.201516(1): 1-8).

Y YO (Amedia norteucleótido Identity) calculadora: estima la identidad de nucleótidos promedio utilizando tanto los mejores resultados (ANI unidireccional) como los mejores resultados recíprocos (ANI bidireccional) entre dos conjuntos de datos genómicos. Normalmente, los valores de ANI entre genomas de la misma especie están por encima del 95% (por ejemplo, Escherichia coli). Los valores por debajo del 75% no son confiables y, en su lugar, se debe utilizar la AAI. Esta herramienta admite genomas completos y en borrador (multi-fasta). (Referencia: Goris J et al. 2007. Int J Syst Evol Microbiol. 57 (Parte 1): 81-91).

Calculadora de identidad de nucleótidos promedio (ANI): su calculadora ANI usa el algoritmo OrthoANIu, una iteración mejorada del algoritmo OrthoANI original, que usa USEARCH en lugar de BLAST (Referencia: Yoon, S. H. et al. (2017). Antonie van Leeuwenhoek. 110:1281 y ndash1286).

VIRIDIC (Virnosotros Intergenómico Dipostura Ccalculadora C. Moraru, Instituto de Química y Biología del Medio Marino, Alemania) - el primer nivel de clasificación de bacteriófagos por ICTV implica calcular la identidad general de la secuencia de ADN entre dos virus. Esta nueva herramienta calcula distancias / similitudes intergenómicas por pares entre genomas de fagos. Para ejecutarlo, cargue un solo archivo fasta con todos los genomas de fagos de interés, cree un proyecto y presione ejecutar. Guarde el ID del proyecto que se mostrará cuando se cree el proyecto. Lo necesitará para acceder a los datos si los cálculos llevan mucho tiempo.

GGDC (GRAMOenome-To-GRAMOenome Distance Calculator): proporciona métodos para inferir distancias del genoma completo que son capaces de imitar la hibridación ADN-ADN (DDH). Los valores calculados con GGDC producen una correlación algo mejor con los valores de DDH de laboratorio húmedo que los enfoques alternativos como & quotANI & quot. Estas funciones de distancia también pueden hacer frente a genomas muy reducidos y regiones de secuencia repetitiva. Algunos de ellos también son muy robustos contra las fracciones faltantes de información genómica (debido a la secuenciación incompleta del genoma). Por lo tanto, este servicio web se puede utilizar para la delineación de especies basada en el genoma. (Referencia: Meier-Kolthoff JP et al. 2013. BMC Bioinformatics 14: 60).

POGO-DB: basado en BLAST de genoma completo computacionalmente intensivo, POGO-DB proporciona varias métricas sobre el genoma por pares: (a) Identidad promedio de aminoácidos de todos los mejores golpes de explosión bidireccionales que cubrieron al menos el 70% de la secuencia y tuvieron 30 % de identidad de secuencia (b) Fluidez genómica que estima la similitud en el contenido de genes entre dos genomas (c) Número de ortólogos compartidos entre dos genomas (según lo definido por dos criterios) (d) Identidad por pares de los genes de ARNr 16S más similares (e) Identidad por pares de 73 genes marcadores adicionales conservados globalmente (que determinamos que existen en al menos el 90% de todos los genomas). (Referencia: Lan Y et al. 2014. Nucl. Acids Res. 42 (D1): D625-D632).

VÍCTOR (Virus Clasificación y Tedificio ree Online Rfuente Leibniz-Institut DSMZ-Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH). Este servicio web compara virus bacterianos y arqueales ("fagos") utilizando sus secuencias de genoma o proteoma. Los resultados incluyen árboles filogenómicos inferidos mediante el método Genome-BLAST Distance Phylogeny (GBDP), con apoyo de ramas, así como sugerencias para la clasificación a nivel de especie, género y familia. (El servicio también se puede aplicar a otros tipos de virus, pero aún no se ha probado a este respecto). Cargue sus archivos FASTA, archivos GenBank y / o ID de acceso a GenBank. (Referencia: JP Meier-Kolthoff & amp M G & oumlker. 2017. Bioinformática 33(21): 3396 y ndash3404).

VIRFAM se dedica al reconocimiento de módulos cabeza-cuello-cola y de genes recombinasas en genomas de fagos. Puede utilizar este servidor para buscar homólogos remotos de familias de proteínas específicas dentro de secuencias de proteínas de bacteriófagos. Entrada: secuencias de proteínas que usted y rsquore su salida de fagos incluye un árbol filogenético con la ubicación de su virus. (Referencia: Lopes A et al. Nucleic Acids Res. (2010) 38(12): 3952-62).

Buscador: es una herramienta de aprendizaje profundo para la identificación sin referencias de secuencias de fagos. Seeker permite la detección rápida de fagos en conjuntos de datos de secuencia y una clara diferenciación de secuencias de fagos de las bacterianas, incluso para fagos con poca similitud de secuencia con familias de fagos establecidas. Validamos exhaustivamente la capacidad del buscador para identificar fagos desconocidos y empleamos al buscador para detectar fagos desconocidos, algunos de los cuales son muy divergentes de las familias de fagos conocidos. (Referencia: Auslander N et al. (2020) doi.org/10.1101/2020.04.04.025783)

VipTree: genera un "árbol proteómico" de secuencias del genoma viral basado en similitudes de secuencia de todo el genoma calculadas por tBLASTx. El concepto de árbol proteómico original (es decir, "el árbol proteómico del fago") fue desarrollado por Rohwer y Edwards, 2002. Un árbol proteómico es un dendrograma que revela relaciones de similitud genómica global entre decenas, cientos y miles de virus. Se ha demostrado que los grupos virales identificados en un árbol proteómico corresponden bien a taxonomías virales establecidas. (Referencia: Nishimura Y et al. (2017) Bioinformática 33: 2379 y ndash2380).

MiGA (Microbial GRAMOenomes Atlas): un servidor web que permite la clasificación de una secuencia genómica de consulta desconocida, completa o parcial, frente a todos los taxones clasificados taxonómicamente con secuencias genómicas disponibles, así como comparaciones con otros genomas relacionados, incluidos los no cultivados, según el nucleótido promedio agregado del genoma. y conceptos de identidad de aminoácidos (ANI / AAI). (Referencia: Rodriguez-R et al (2018) Investigación de ácidos nucleicos 46 (W1): W282-W288).

CGView Server: es una herramienta de genómica comparativa para genomas circulares que permite visualizar la información de las características de la secuencia en el contexto de los resultados del análisis de secuencia. Se suministra una secuencia del genoma al programa en formato FASTA, GenBank, EMBL o sin formato. También se pueden enviar hasta tres secuencias de comparación (o conjuntos de secuencias) en formato FASTA. El servidor CGView utiliza BLAST para comparar la secuencia del genoma con las secuencias de comparación, y luego convierte los resultados y cualquier información de características disponible (de GenBank, EMBL o archivo GFF opcional) o información de análisis (de un archivo GFF opcional) en un archivo de alta resolución. mapa gráfico de calidad que muestra la secuencia completa del genoma, o una vista ampliada de una región de interés. Hay varias opciones disponibles para especificar cómo se realizan las comparaciones BLAST y para controlar cómo se muestran los resultados (Referencia: Grant JR & amp Stothard P. 2008. Nucleic Acids Res. 36 (problema del servidor web): W181-184)

Jena PAGrocariota GRAMOenome Viewer (JPGV): a partir de un archivo plano de GenBank (* .gbk) genera gráficos lineales o circulares que incluyen, si se desea, el contenido de GC, el sesgo de GC, el exceso de purina y el exceso de ceto. También permite el análisis BLAST contra genomas relacionados. Requiere registro gratuito.

GenomeVx: crea mapas editables, con calidad de publicación, de genomas mitocondriales y de cloroplasto y de plásmidos grandes. Estos mapas muestran la ubicación de genes y características cromosómicas, así como una escala de posición. El programa toma como entrada posiciones de características sin procesar o registros de GenBank.En el último caso, las características se extraen y colorean automáticamente, de lo que se ofrece un ejemplo. La salida está en el formato de documento portátil de Adobe (PDF) y se puede editar con programas como Adobe Illustrator (Referencia: G. Conant & amp K. Woolfe. 2008. Bioinformática 24:861-862).

myGenomeBrowser: es un entorno basado en web que proporciona a los biólogos una forma de crear, consultar y compartir sus navegadores de genoma. Esta herramienta, que se basa en JBrowse, está diseñada para brindar a los usuarios más autonomía mientras simplifica y minimiza la intervención de los administradores del sistema. Tienen funciones básicas ampliadas del navegador del genoma para permitir a los usuarios consultar, analizar y compartir sus datos. (Referencia: S. Carrere & amp J. Gouzy. Bioinformatics (2017) 33 (8): 1255-1257).

DNAPlotter: es una aplicación Java interactiva para generar representaciones circulares y lineales de genomas. Haciendo uso de las bibliotecas de Artemis para proporcionar un método fácil de usar para cargar archivos de secuencia (EMBL, GenBank, GFF), así como datos de bases de datos relacionales, filtra las características de interés para mostrarlas en pistas independientes definidas por el usuario. Se puede utilizar para producir imágenes con calidad de publicación para artículos o páginas web (Referencia: Carver, T. et al. 2008. Bioinformatics 25:119-120)

GeneWiz (Centro de Análisis de Secuencias Biológicas, Universidad Técnica Danesa) produce altases genómicas lineales o circulares como la que se muestra a continuación. Tienen nombres listos para la mayoría de las bacterias, pero al cargar datos personalizados en formato GenBank (.gbk), uno puede crear un diagrama propio que muestre las propiedades genéticas y físicas de su genoma.

OrganellarGenomeDRAW: es un conjunto de herramientas de software que permite a los usuarios crear representaciones visuales de alta calidad de secuencias del genoma anotadas tanto circulares como lineales proporcionadas como archivos GenBank o números de acceso. Aunque se aceptan todos los tipos de secuencias de ADN como entrada, el software se ha optimizado específicamente para representar correctamente las características de los genomas orgánulos. Una extensión reciente facilita el trazado de datos cuantitativos de expresión génica, como datos de transcripción o abundancia de proteínas, directamente en el mapa del genoma (Referencia: Lohse M, et al. 2013. Nucleic Acids Res. 41(Problema del servidor web): W575-81).

PlasmaDNA: comenzando con una secuencia de ADN primaria, PlasmaDNA busca sitios de restricción, marcos de lectura abiertos, secuencias de hibridación de cebadores y varios dominios comunes. El usuario puede expandir fácilmente las bases de datos para adaptarse a sus necesidades de clonación más comunes. PlasmaDNA puede gestionar y representar gráficamente múltiples secuencias al mismo tiempo, y mantiene en memoria los salientes al final de las secuencias, si los hay. Esto significa que es posible digerir virtualmente fragmentos, agregar los productos de digestión al proyecto y unir fragmentos con extremos compatibles para generar las nuevas secuencias. Excelente paquete para plásmidos. (Referencia: Angers-Loustau A et al. 2007. BMC Mol Biol. 2007 8:77).

GSDraw (Gene Structure Draw Server) es un servidor web para que la familia de genes dibuje diagramas esquemáticos de estructura genética. Los usuarios pueden enviar secuencias genómicas, CDS y transcripciones. GSDraw usa esta información para obtener la estructura genética, el motivo protien y el árbol filogenético, luego dibuja un diagrama. (Referencia: Wang Y, et al. 2013. Nucleic Acids Res. 41 (Edición de la base de datos): D1159-66).

GECA es una herramienta fácil de usar para representar la organización de exones / intrones de genes y resaltar los cambios en la estructura de genes entre los miembros de una familia de genes. Se basa en la alineación de proteínas, completada con la identificación de intrones comunes en los genes correspondientes utilizando CIWOG. GECA produce una representación gráfica principal que muestra el conjunto alineado resultante de estructuras génicas, donde los exones están a escala. La característica importante y original de GECA es que combina estas estructuras de genes con un despliegue simbólico que destaca la similitud de secuencia entre genes posteriores. Vale la pena señalar que esta combinación de estructura genética con indicaciones de similitudes entre genes relacionados permite una rápida identificación de posibles eventos de ganancia o pérdida de intrones, o apunta a anotaciones estructurales erróneas. La imagen de salida se genera en un formato de gráficos de red portátil que se puede utilizar para publicaciones científicas. (Referencia: Fawal N, et al. 2012. Bioinformática 28:1398-9).

GeneDesign: es un excelente recurso para diseñar genes sintéticos. Incluye herramientas para la optimización de codones y la eliminación de sitios de restricción (Referencia: Richarson, S.M. et al. 2006. Genome Research 16: 550-556)

Orphelia - Orphelia es una herramienta de búsqueda de ORF metagenómico para la predicción de genes que codifican proteínas en secuencias de ADN ambientales cortas con origen filogenético desconocido. Orphelia se basa en un enfoque de aprendizaje automático de dos etapas que fue introducido recientemente por nuestro grupo. Después de la extracción inicial de ORF, se utilizan discriminantes lineales para extraer características de esos ORF. Posteriormente, una red neuronal artificial combina las características y calcula una probabilidad genética para cada ORF en un fragmento. Una estrategia codiciosa calcula una combinación probable de ORF de alta puntuación con una restricción de superposición. (Referencia: K.J. Hoff et al. 2009. Nucl. Acids Res. 37(Problema del servidor web: W101-W105).

WebMGA es un servidor web personalizable para un análisis metagenómico rápido que incluye más de 20 herramientas de uso común para análisis como llamadas ORF, agrupación de secuencias, control de calidad de lecturas sin procesar, eliminación de artefactos de secuenciación y contaminaciones, análisis taxonómico, anotación funcional, etc. Todas las herramientas detrás de WebMGA se implementaron para ejecutarse en paralelo en nuestro clúster de computadoras local. (Referencia: Wu S, et al. 2011. BMC Genomics. 12:444).

El servidor MG-RAST (Metagenomics RAST) es una plataforma de análisis automatizada para metagenomas que proporciona información cuantitativa sobre poblaciones microbianas basada en datos de secuencia. El servidor principalmente proporciona carga, control de calidad, anotación y análisis automatizados para muestras de escopeta metagenómica procariotas. (Referencia: Wilke A, et al. 2016. Nucleic Acids Res. 44 (D1):D590-4).

El servidor web y el programa independiente de MetaBin Comprehensive Taxonomic Assignment of Metagenomic Sequences (Laboratorio de Bioinformática Integrada, RIKEN, Japón) permiten una asignación taxonómica más rápida y precisa de lecturas de secuencias únicas y pareadas de diferentes longitudes (& ge45 pb) obtenidas tanto de Sanger como de la siguiente -plataformas de secuenciación de generaciones. Tiene un tutorial.

AmphoraNet: utiliza 31 genes marcadores bacterianos y 104 genes marcadores de codificación de proteínas arqueales para la filotipificación metagenómica y genómica. La mayoría de estos son genes de copia única, por lo que AmphoraNet es adecuado para estimar la composición taxonómica de las comunidades de bacterias y arqueas a partir de datos de secuenciación de escopeta metagenómica. (Referencia: Kerepesi C, et al. 2014. Gene. 533:538-40).

METAGENassist: permite a los usuarios tomar datos del censo bacteriano de diferentes sitios ambientales o diferentes hosts biológicos, y realizar análisis estadísticos multivariados completos sobre los datos. Estos análisis multivariados se pueden realizar utilizando etiquetas fenotípicas taxonómicas o generadas automáticamente y visualizarse utilizando una variedad de herramientas gráficas de alta calidad. Los datos del censo bacteriano se pueden derivar de los datos del ARNr 16S, la secuenciación de escopeta NextGen o incluso las técnicas clásicas de cultivo microbiano. Incluye un tutorial. (Referencia: Arndt D, et al. 2012. Nucleic Acids Res. 40(Problema del servidor web): W88-95).

Metagenómica en tiempo real (Dr. Robert Edwards, Universidad Estatal de San Diego, EE. UU.) - es la próxima revolución en la anotación de metagenomas: procesamiento y análisis de datos en tiempo real. Finalmente, puede anotar un metagenoma en tiempo real, sin esperas. Puede cargar sus propios datos para su análisis. Aceptan archivos fasta o fastq, y puede proporcionar datos comprimidos zip o gzip.

Metagenómica EBI (EMBL-EBI) - es una tubería automatizada para el análisis y archivo de datos metagenómicos que tiene como objetivo proporcionar información sobre la diversidad filogenética, así como el potencial funcional y metabólico de una muestra. Puede navegar libremente por todos los datos públicos en el repositorio. El servicio identifica secuencias de rRNA, utilizando rRNASelector, y realiza análisis taxonómicos sobre rRNA 16S utilizando Qiime. Las lecturas restantes se envían para el análisis funcional de las secuencias codificantes de proteínas predichas utilizando el recurso de análisis de secuencias de InterPro. InterPro utiliza modelos de diagnóstico para clasificar secuencias en familias y predecir la presencia de dominios y sitios funcionalmente importantes. Al utilizar este recurso, el servicio ofrece una alternativa poderosa y sofisticada a los análisis metagenómicos funcionales basados ​​en BLAST. Los datos enviados al servicio EBI Metagenomics se archivan automáticamente en el European Nucleotide Archive (ENA). Los números de acceso se proporcionan para los datos de secuencia.

Kaiju: es una clasificación taxonómica rápida y sensible para la metagenómica que toma secuencias de nucleótidos en formato comprimido FASTA o FASTQ. Las lecturas se asignan directamente a los taxones utilizando la taxonomía NCBI y una base de datos de referencia de secuencias de proteínas de genomas bacterianos, arqueales y virales. De forma predeterminada, Kaiju utiliza los genomas completos disponibles de NCBI RefSeq o el subconjunto microbiano de la base de datos de proteínas no redundante nr utilizada por NCBI BLAST. Kaiju traduce las lecturas en secuencias de aminoácidos, que luego se buscan en la base de datos mediante una búsqueda hacia atrás modificada en una implementación de memoria eficiente de la transformada de Burrows-Wheeler, que encuentra coincidencias máximas exactas (MEM), lo que opcionalmente permite desajustes en la alineación de proteínas. (Referencia: Menzel P et al.2016. (Nat. Commun. 7:11257)

PhyloPythiaS: es un clasificador basado en composición de secuencias rápido y preciso que utiliza las relaciones jerárquicas entre clados. Las asignaciones taxonómicas con el servidor web se pueden realizar con un modelo genérico o con modelos específicos de muestra que los usuarios pueden especificar y crear. Varios modos de visualización interactiva y múltiples formatos de descarga permiten un análisis rápido y conveniente y el procesamiento posterior de las asignaciones taxonómicas. (Referencia: Patil KR, et al. 2012. PLoS One. 7:e38581).

Metagenoma virtual: un servidor web para reconstruir metagenomas a partir de secuencias de ARNr 16S. un método novedoso para la reconstrucción rápida y eficiente de un metagenoma virtual en comunidades microbianas ambientales sin utilizar secuenciación genómica a gran escala. Demostramos este enfoque utilizando secuencias de genes de ARNr 16S obtenidas a partir de análisis de electroforesis en gel de gradiente desnaturalizante, mapeados en genomas completamente secuenciados, para reconstruir organizaciones virtuales similares a metagenomas. (Referencia: Okuda S, et al. 2012. Nat Commun. 3:1203.)

MetaPhlAn2 (versión 2.0.0): es una herramienta computacional para perfilar la composición de comunidades microbianas (bacterias, arqueas, eucariotas y virus) a partir de datos de secuenciación de escopeta metagenómica con resolución a nivel de especie. También es capaz de identificar cepas específicas y rastrear cepas a través de muestras para todas las especies. Permite asignaciones taxonómicas inequívocas, estimación precisa de la abundancia relativa del organismo y resolución a nivel de especie para bacterias, arqueas, eucariotas y virus. (Referencia: Segata N, et al. 2012. Nature Methods 8: 811 y ndash814).

CoMet-Universe & mdash un servidor web para el análisis comparativo de metagenomas basado en firmas de dominio de proteínas. Comenzando con una carga de sus secuencias de ADN, la tubería CoMet realiza todos los pasos necesarios para un análisis completo del metagenoma, incluida la predicción de genes, la detección de dominios de proteínas utilizando Pfam 27, el perfil metabólico basado en las rutas de KEGG y la estimación de la abundancia de taxones en todos los dominios de la vida y los virus. (Referencia: A & szlighauer KP et al. Int J Mol Sci.2014 15(7):12364-78).

Clasificador 16S: es una herramienta para la clasificación taxonómica rápida y precisa de regiones hipervariables de ARNr 16S en conjuntos de datos metagenómicos. En conjuntos de datos metagenómicos reales, mostró hasta un 99,7% de precisión a nivel de filo y hasta un 99,0% de precisión a nivel de género. (Referencia: N. Chaudhary et al. 2015. PLoS One 10(2): e0116106). También se puede acceder aquí

ADNATLAS (DNA2.0 Inc., EE. UU.) - Un lugar para todas tus secuencias. Importe fácilmente todas sus construcciones, incluidos Genbank, Gene Designer, Excel, Word y casi cualquier formato basado en texto. DNA Atlas analiza inmediatamente sus archivos cargados e infiere si cada secuencia es una característica, construcción, cebador, ADN o aminoácido. Sube funciones y cartillas para verlas anotadas en tus secuencias. Vea instantáneamente construcciones anotadas con nuestra lista seleccionada de más de 1000 características, o agregue la suya propia. Utilice la búsqueda de secuencias basada en BLAST para alinear y comparar rápidamente sus secuencias. Mantenga un registro de sus secuencias, características y cebadores. Clasifíquelos usando etiquetas, desde ubicaciones de congeladores hasta datos de caracterización. (requiere registro).

SuperPhy (Chad Laing y Vic Gannon, Agencia de Salud Pública de Canadá) es una herramienta en línea para la genómica predictiva de Escherichia coli. La plataforma integra las herramientas de análisis y los datos de la secuencia del genoma para todos los disponibles públicamente. E. coli genomas y facilita la carga de nuevas secuencias de genomas de usuarios en entornos públicos o privados. SuperPhy proporciona análisis en tiempo real de miles de secuencias genómicas basadas en metadatos de cepas, incluido el contexto geoespacial y filogenético.

Nombrar su bacteriófago: Esto es de suma importancia para que los miembros de la comunidad de virus bacterianos nombren apropiadamente sus fagos recién aislados. Un buen lugar para comenzar es "Cómo nombrar y clasificar su fago: una guía informal". (Referencia: Adriaenssens E & amp Brister JR. 2017. Virus 9(4). pii: E70) a lo que agregaré los siguientes puntos (a) por favor verifique que el nombre que propone no se haya usado ya y, (b) No nombre su fago Enterobacter ia phage & oslash1234 o Enterobacteria phage 2017 / ABC_567 desde estos nombres son incomparables con la creación de nuevos taxones de especies y géneros por parte del Comité Internacional de Taxonomía de Virus (ICTV). Para saber si su nombre propuesto es único, consulte:

Comprobación del nombre del fago (Stephen T. Abedon, Universidad Estatal de Ohio, EE. UU.) - para ver si su nombre de fago se encuentra actualmente en Google Scholar, Google Books, PubMed o incluso Bacteriophage Names 2000.

Búsqueda de nombre de fago CPT (Centro de Tecnología de Fagos en Texas A & ampM University)


Ver el vídeo: Neutrality tests in DnaSP (Septiembre 2022).


Comentarios:

  1. Pascual

    Considero, que estás equivocado. Escríbeme por PM, nos comunicamos.

  2. Nerg

    los felicito, que palabras necesarias..., una excelente idea

  3. Kazimi

    Disculpe por eso que interfiero... Entiendo esta pregunta. Escribe aquí o en PM.

  4. Ram

    Limpio

  5. Nagul

    Esperé tanto tiempo y ahora - =)

  6. JoJogis

    Estoy seguro de esto, confusión.

  7. Hyrieus

    no tan genial



Escribe un mensaje