Información

¿Qué son los haplogrupos?

¿Qué son los haplogrupos?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

¿Qué significa exactamente el término haplogrupo o haplotipo?

¿Cómo se afirma que las personas que pertenecen a los mismos haplogrupos tienen antepasados ​​comunes?


Entiendo por haplogrupo el grupo de personas que comparten el mismo haplotipo dado para una región del genoma. Un haplotipo es la lectura de la secuencia de ADN de una parte del genoma en una de las dos copias que tienen los organismos diploides. Si comienza a leer la secuencia de ADN para un punto dado en el genoma de una de sus copias y las copias de otra persona, coincidirá hasta un punto en el que haya un cambio. Es más probable tener haplotipos idénticos más largos si las dos personas que se comparan están relacionadas. Cuanto más cercana sea la relación, más largos serán sus haplotipos idénticos. Lo que rompe la identidad del haplotipo son los eventos de recombinación que ocurren en la línea germinal en la generación anterior y las mutaciones que ocurren tanto en la línea germinal como en el soma (el resto de su cuerpo) a lo largo del tiempo.


Haplogrupo humano

A haplogrupo humano es un conjunto de características estudiadas en genética humana y cada vez más útiles para la genealogía.

El término "haplogrupo" cubre toda la biología, pero en esta wiki (y, hasta cierto punto, en Wikipedia, como la mayor parte del artículo de Wikipedia: haplogrupo) generalmente se usa para significar "haplogrupo humano".

La siguiente tabla debe actualizarse, a partir de mayo de 2010. Es posible que, con su introducción, se incorpore mejor en otra página, como el haplogrupo de ADN del cromosoma Y humano, pero si se puede actualizar de manera efectiva, puede que valga la pena mantenerla separada como un resumen rápido. página de referencia con un título específico de Y-DNA, como Tabla de haplogrupos de Y-DNA. La actualización probablemente debería realizarse mediante una comparación cuidadosa con los artículos relevantes de Wikipedia y el sitio web de ISOGG.

Lo siguiente se basa en información que se encontró en el sitio web [1], así como en artículos de Wikipedia, incluida la página que ahora hemos copiado al haplogrupo de ADN del cromosoma Y humano. Proporciona un resumen rápido de los principales haplogrupos masculinos, como se entendió en 2007. Si bien se basa en la presentación de Genetree, se han realizado algunas modificaciones para reorganizar la información de manera más sistemática para mostrar

a) momento de origen, b) lugar de origen, yc) centro de ocurrencia moderna.


¿Qué son los haplogrupos? - biología

Muchos clientes de 23andMe que se comunican con Atención al cliente están confundidos por sus asignaciones de haplogrupo y lo que realmente significan.

Pero conocer su haplogrupo y cómo puede usarlo puede brindarle mucha más claridad sobre su propia ascendencia. Entonces, con el fin de ayudarlo, analizaremos un ejemplo de una asignación de haplogrupo materno y paterno y explicaremos cómo el conocimiento de sus haplogrupos puede ubicarlo en el árbol genealógico humano y conectarlo con su ascendencia.

En este caso, estamos usando a alguien que es asiático, que tiene raíces en el sudeste asiático. Pero su haplogrupo materno, B4'5 y más específicamente el subgrupo B5a1a, se encuentra con mayor frecuencia entre los nativos americanos del suroeste de Estados Unidos y el norte de México.

Migración

¿Qué lo conecta con los nativos americanos?

Aquí es donde comprender un poco los haplogrupos es útil para ubicarlo a usted y a su ascendencia en el contexto más amplio de la historia humana. Cada haplogrupo describe ramas individuales, o grupos de ramas estrechamente relacionados, en el árbol genealógico genético de todos los seres humanos. Todos los miembros de un haplogrupo trazan su ascendencia hasta un solo individuo. En este caso, el individuo comparte su haplogrupo materno con muchos nativos americanos porque hace 12.000 años la gente emigró de Asia a Alaska, cuando los niveles del mar eran más bajos.

U otra forma de verlo es que los descendientes de su antiguo antepasado materno, un antepasado común que comparte con muchos nativos americanos, habían cruzado el Puente Terrestre de Bering para poblar las Américas. Mirando más profundamente en sus resultados, su haplogrupo materno es un subgrupo de B4'5, específicamente B5a1a. Tiene su propia historia donde se separó de B4'5 en el sudeste asiático.

Los patrones de migración recientes han alterado la distribución global de este haplogrupo, pero esa historia antigua está escrita en su ADN y poder leer eso e identificar su haplogrupo materno lo conecta con esa historia. La capacidad de rastrear el haplogrupo materno de una persona hasta ahora (más de 50.000 años en el caso de B4'5) tiene que ver con cómo se transmite a cada uno de nosotros desde nuestra madre, su madre y la madre de su madre. , y así sucesivamente atrás en el tiempo.

Haplogrupos maternos

Los haplogrupos maternos se determinan mediante la definición de variantes en su ADN mitocondrial. Todos heredan sus mitocondrias de sus madres. A diferencia de sus otras piezas de ADN, su ADN mitocondrial es el único tipo de ADN que se encuentra fuera del núcleo. Por esta razón, su ADN mitocondrial no se recombina con otros tipos de ADN. Debido a que sus mitocondrias se heredan directamente de su madre y experimentan muy poca recombinación, compartirá el mismo haplogrupo materno con cualquier familiar con el que comparta una línea materna directa. Por ejemplo, usted, su madre, su hermano, su hermana, su tía materna, su abuela materna, etc., compartirían el mismo haplogrupo materno que usted. Y ese haplogrupo materno se remonta a través de las generaciones a una sola mutación en un lugar y momento específicos.

En el caso que estamos viendo, su haplogrupo materno es uno que comparten muchas personas, no solo de ascendencia china Han, sino también con muchos polinesios, nativos americanos y del sudeste asiático.

Haplogrupos paternos

Ahora que hemos analizado los haplogrupos maternos, podemos centrar nuestra atención en las asignaciones de los haplogrupos paternos. En este caso, la asignación del haplogrupo paterno de la persona es O3a3c1 *.

Se remonta al este de Asia y también es común entre los chinos han, coreanos, filipinos y malasios. La asignación del haplogrupo paterno se determina mediante la definición de variantes en su cromosoma Y. El cromosoma Y es el cromosoma que determina el sexo para los hombres, que los hombres heredan de sus padres. Por lo tanto, a menos que haya heredado un cromosoma Y de su padre, no tendrá una asignación de haplogrupo paterno. (Puede encontrar más información sobre esto aquí). Es por eso que las mujeres verán que esta página no está disponible para ellas dentro de su cuenta 23andMe, pero en un momento explicaremos cómo las mujeres pueden determinar su haplogrupo paterno.

Primero, es útil comprender un poco más sobre el cromosoma Y. El cromosoma Y se recombina con el cromosoma X, pero solo lo hace en los extremos. Entonces, aproximadamente el 95 por ciento del cromosoma Y permanece relativamente intacto a lo largo de las generaciones. Por esta razón, el cromosoma Y es un reflejo de su antigua ascendencia paterna. Por lo tanto, compartiría una asignación de haplogrupo paterno con cualquier pariente masculino con el que compartiera una línea paterna directa.

Una mujer puede inferir su haplogrupo paterno si un pariente masculino de su línea paterna ha sido genotipado por 23andMe. Debido a que tanto el cromosoma Y como el ADN mitocondrial cambian tan poco a lo largo de las generaciones, son muy informativos sobre sus ancestros ancestrales. Pero eso no quiere decir que no cambien en absoluto. De hecho, cada letra y número que ve dentro de su haplogrupo corresponde a un conjunto de mutaciones definitorias en su ADN mitocondrial o en su cromosoma Y. Esto marca un período en el tiempo en el que su haplogrupo se ramificó en una línea distinta. Entonces, por ejemplo, puede marcar cuándo una población emigró por primera vez fuera de África o cuándo otro grupo se aisló geográficamente.

Asignar haplogrupos

23andMe puede rastrear su ascendencia basándose en estas mutaciones, porque ocurrieron en distintas ubicaciones geográficas durante períodos específicos de tiempo. Las asignaciones de haplogrupos incluso se pueden rastrear hasta idiomas específicos. Esa evidencia de ADN a menudo es corroborada por el registro fósil. Nuestros fósiles más antiguos datan de hace 200.000 años y se encontraron en Omo Kibish en Etiopía. Según los registros genéticos y paleontológicos, el Homo sapiens solo comenzó a migrar fuera de África hace 60.000-70.000 años y se trasladó al continente euroasiático.

Algunos de estos migrantes se trasladaron a lo largo de la costa india, llegando primero al sudeste asiático y luego a Australia hace unos 50.000 años. Desde entonces, diferentes eventos migratorios han extendido nuestra especie por los continentes a lo largo de diferentes rutas y caminos. Podemos rastrear patrones migratorios basados ​​en la definición de mutaciones en el ADN mitocondrial y el ADN del cromosoma Y.

En el caso del individuo que estamos viendo en esta publicación, los ancestros antiguos que formaban parte de su haplogrupo materno se encontraban entre un grupo de individuos que estaban en el sudeste asiático, y que algunos de esos individuos finalmente migraron a través del puente terrestre de Bering a poblar las Américas. Algunos se quedaron en el este de Asia y desarrollaron algunas mutaciones definitorias nuevas en su ADN mitocondrial, lo que los convirtió en B5a1a. Es importante tener en cuenta que su ADN mitocondrial y su cromosoma Y representan una porción muy pequeña de su ADN y una pequeña porción de su ascendencia general.

Como la mayoría de los haplogrupos surgieron hace decenas de miles de años, estos fragmentos de ADN generalmente reflejan su ancestralidad muy antigua. Por lo tanto, es posible que dos personas compartan la misma asignación de haplogrupo pero sin ascendencia reciente. Entonces, por ejemplo, si bien puede compartir un haplogrupo paterno con Stephen Colbert, probablemente no comparta ningún antepasado común reciente.

Una gran parte de nuestro ADN se encuentra dentro de su ADN autosómico. Este ADN se recombina con cada generación sucesiva. Por lo tanto, los resultados que analizan su ADN autosómico generalmente reflejan su ascendencia de las últimas cinco a diez generaciones. Por lo tanto, no es raro que la ascendencia que se encuentra dentro de su haplogrupo o su Composición de ascendencia difiera de la suya. Esto no significa que alguna de estas piezas sea incorrecta. Cada uno de ellos simplemente describe una parte diferente de su ascendencia rica y única.


Santos Alonso, Carlos Flores, Vicente Cabrera, Antonio Alonso, Pablo Mart & iacuten, Cristina Albarr & aacuten, Neskuts Izagirre, Concepci & oacuten de la R & uacutea, y Oscar Garc & iacutea. "El lugar de los vascos en el panorama europeo de diversidad del cromosoma Y". Revista europea de genética humana 13:12 (2005): páginas 1293-1302.
Se analizaron los cromosomas Y de 68 varones vascos. Aproximadamente el 86 por ciento de ellos portaban variedades del haplogrupo R1 * (xR1a, R1b3f) -M173, de los cuales la mayoría portaba R1b3 * -M269. Este es un punto en común entre los vascos y otros europeos occidentales. El 7,1 por ciento de los vascos en este estudio (una frecuencia más baja que la que habían encontrado otros científicos) portaban los subclados específicos ibéricos R1b3d-M153 y R1b3f-SRY2627, representando este último el 2,4 por ciento de la muestra. El 1,2 por ciento de los varones vascos son portadores de haplogrupos de origen africano del noroeste, a saber, E3 * -P2 y E3b2-M81.

Ana M. Gonz & aacutelez, Oscar Garc & iacutea, Jos & eacute M. Larruga y Vicente M. Cabrera. "El linaje mitocondrial U8a revela un asentamiento paleolítico en el País Vasco". BMC Genomics 7: 1 (23 de mayo de 2006): 124.
El haplogrupo U8a del ADNmt es raro y antiguo en Europa, y los vascos tienen los subclades más antiguos.

Doron M. Behar, C. Harmant, J. Manry, Mannis van Oven, W. Haak, B. Mart & iacutenez-Cruz, J. Salaberria, B. Oyhar & ccedilabal, F. Bauduer, David Comas, Llu & iacutes Quintana-Murci, and the Genographic Consorcio. "El paradigma vasco: evidencia genética de una continuidad materna en la región franco-cantábrica desde tiempos pre-neolíticos". Revista estadounidense de genética humana 90: 3 (9 de marzo de 2012): páginas 486-493. Publicado por primera vez en línea el 23 de febrero de 2012. Se publicó una errata en el número del 4 de mayo de 2012 (90: 5) en la página 936.
Los investigadores estudiaron los linajes de ADNmt de "908 individuos vascos y no vascos del País Vasco y regiones adyacentes inmediatas", prestando especial atención a las ramas del haplogrupo H. Extractos del Resumen:

4000 años antes del presente (YBP) y estimaron su separación del acervo genético paneuropeo en

8.000 YBP, anterior a la llegada indoeuropea a la región. Nuestros resultados apoyan claramente la hipótesis de una continuidad genética parcial de los vascos contemporáneos con los pobladores anteriores del Paleolítico / Mesolítico de su tierra natal ".

Sergio Cardoso, Miguel A. Alfonso-S & aacutenchez, Laura Valverde, Adrian Odriozola, Ana Maria P & eacuterez-Miranda, Jos & eacute A. Pe & ntildea y Marian M. de Pancorbo. "El legado materno de los vascos del norte de Navarra: nuevos conocimientos sobre la diversidad del ADN mitocondrial de la zona franco-cantábrica". Revista estadounidense de antropología física 145: 3 (julio de 2011): páginas 480-488. Publicado por primera vez en línea el 3 de mayo de 2011.
Probaron a 110 vascos de Navarra en el norte de España para investigar su diversidad de ADN mitocondrial. Se encontró que el 11,8 por ciento de estos vascos portaban el haplogrupo J1c del ADNmt, mientras que el 10,9 por ciento portaba H3. Algunos de los vascos del estudio portaban el haplogrupo H2a5 y se considera autóctono de los vascos. El 15,5 por ciento de los vascos del estudio portaban el haplogrupo U5b, más que los vascos de otros lugares. Una menor proporción de vascos de Navarra porta los haplogrupos HV0 y H1 en comparación con otros ibéricos del norte.

& Oacutescar Garc & iacutea, Santos Alonso, Nicole Huber, Martin Bodner y Walther Parson. "Evaluación filogeográfica de relevancia forense de la variación del mitogenoma en el País Vasco". Forensic Science International: Genetics 46 (mayo de 2020): número de artículo 102260. Disponible por primera vez en línea el 6 de febrero de 2020.
Probaron las secuencias completas de ADNmt de 178 vascos del País Vasco en el norte de España. X2b7 es uno de los muchos haplogrupos que encontraron entre estos vascos. También encontraron algunos linajes de ADNmt que ellos denominan "específicos del vasco".

Chrystelle Richard, Erwan Pennarun, Toomas Kivisild, Kristiina Tambets, Helle-Viivi Tolk, Ene Metspalu, Maere Reidla, Sylviana Chevalier, St & eacutephanie Giraudet, Lovorka Barac-Lauc, Marijana Pericude, Pavao Rudan, Mireille Dorvalic, Claustres Muller, Richard Villems, Andr & eacute Chaventr & eacute y Jean-Paul Moisan. "Una perspectiva del ADNmt de la variación genética francesa". Anales de biología humana 34: 1 (enero-febrero de 2007): páginas 68-79.
Este estudio de ADN mitocondrial de 868 personas de 12 áreas de Francia incluye vascos de la provincia vasca de Lapurdi en Francia. Se encontró que estos vascos franceses tenían diferencias notables en la distribución del ADNmt en comparación con los vascos españoles.

Extractos de la sección Resultados:

"[.] El grupo de ADNmt de los vascos franceses comparte algunas características comunes con el de los vascos españoles, como la alta frecuencia del haplogrupo H. Sin embargo, los vascos franceses exhiben una serie de características distintas, más notablemente expresadas en la prevalencia de haplogrupos vinculado con la difusión neolítica en Europa. [.] "

Extractos del cuerpo del artículo:

"[.] Es algo sorprendente encontrar Hg U4 con una frecuencia relativamente alta (6,2%) y diversidad entre los vascos franceses (ausente en los vascos españoles), porque este subclado de U es principalmente de Europa del Este y Siberia Occidental (Tambets et al. en los vascos españoles (ver Tabla I), y también la presencia del haplotipo Hg J1c con motivo HVS-I 16069-16126-16300. Los derivados de esta rama de Hg J se han encontrado hasta ahora principalmente en poblaciones del Cercano Oriente (Richards et al.2002 Metspalu et al. Contexto europeo (Richards et al. 2000) son más fr frecuente entre los vascos franceses. [. ] Los vascos franceses muestran una frecuencia representativa de Hgs T1 y J que se ha sugerido que se introdujeron en Europa con la llegada de la Figura 4. [. ] Por otro lado, los haplogrupos como U5 y HV0 que son frecuentes en los vascos españoles están ausentes o raros en los vascos franceses, mientras que para el Hg U4 su distribución es la contraria. El patrón observado en el grupo de ADNmt de los vascos franceses de la región de Lapurdi puede explicarse por la deriva genética y el aislamiento cultural en un tamaño de población efectivo a largo plazo relativamente pequeño. Además, también es probable que tanto los vascos franceses como los españoles, aunque comparten una ascendencia lingüística común y probablemente también genética, se hayan visto afectados por mezclas de diferentes fuentes. Mientras tanto, la alta frecuencia general de deficiencias de factores de coagulación autosómicos recesivos en la población vasca francesa (Bauduer et al. 2004) argumenta a favor de la deriva genética que actúa sobre esta población. [. ] Tomados en conjunto, nuestros hallazgos apoyan la noción de que los 'vascos' son una población fuertemente subdividida y respaldan la conclusión de que los vascos franceses y españoles han sido efectivamente aislados unos de otros durante un período lo suficientemente largo como para permitir que la deriva genética aleatoria los diferencie. "

I & ntildeigo Olalde, Swapan Mallick, Nick Patterson, Nadin Rohland, Vanessa Villalba-Mouco, et al. "La historia genómica de la Península Ibérica durante los últimos 8000 años". Ciencias 363: 6432 (15 de marzo de 2019): páginas 1230-1234.
Este importante estudio con decenas de coautores compara el ADN autosómico de cientos de íberos antiguos con los íberos modernos. Aunque los vascos obtuvieron una mezcla significativa de origen estepario de los conquistadores masculinos que llegaron aproximadamente en el año 2000 a. C. y transformó sustancialmente la distribución del ADNmt de los íberos y transformó casi por completo la distribución del cromosoma Y, los vascos no obtuvieron las mezclas posteriores de los norteafricanos y mediterráneos orientales (fenicios y judíos sefardíes) que tienen otros íberos, debido a una genética (así como a cultural y lingüística) dividida entre vascos y otros íberos a partir de la época romana temprana (siglos III-I a.C.), que siguió al final de la Edad del Hierro. Algo que los vascos comparten con otros ibéricos es una gran proporción del haplogrupo Y-DNA R1b-M269. Extractos del Resumen:

Neskuts Izagirre y Concepci & oacuten de la R & uacutea. "Un análisis de ADNmt en antiguas poblaciones vascas: implicaciones para el haplogrupo V como marcador de una gran expansión paleolítica desde el suroeste de Europa". The American Journal of Human Genetics 65: 1 (julio de 1999): páginas 199-207.
Un estudio que compara los vascos españoles antiguos y modernos de distintas regiones del País Vasco.

J. Bertranpetit, J. Sala, F. Calafell, Peter A. Underhill, P. Moral y David Comas. "Variación del ADN mitocondrial humano y origen de los vascos". Annals of Human Genetics (Anales de genética humana) 59: 1 (enero de 1995): páginas 63-81.
Probaron 45 individuos vascos españoles para sus líneas de ADNmt y encontraron 27 subclades de ADNmt diferentes entre ellos.

B. Mart & iacutenez-Crus, C. Harmant, DE Platt, W. Haak, J. Manry, E. Ramos-Luis, DF Soria-Hernanz, F. Bauduer, J. Salaberria, B. Oyhar & ccedilabal, Llu & iacutes Quintana-Murci, David Comas y el Consorcio Genográfico. "Evidencia de estructura genética tribal prerromana en vascos a partir de marcadores heredados uniparentalmente". Biología molecular y evolución 29: 9 (2012): páginas 2211-2222.
Se estudiaron alrededor de 900 personas vascas y no vascas. Se descubrió que los vascos eran similares a otros europeos del suroeste. Extractos del Resumen:

Torsten G & uumlnthera, Cristina Valdiosera, Helena Malmstr & oumlma, Irene Ure & ntildea, Ricardo Rodriguez-Varela, & Oacuteddny Osk Sverrisd & oacutettir, Evangelia A. Daskalaki, Pontus Skoglund, Thiqssen Naidoo, Emma Dunuda M. Svensson, Michael y Iacute. Stor & aring, Eneko Iriarte, Juan Luis Arsuaga, Jos & eacute-Miguel Carretero, Anders G & oumltherstr & oumlm y Mattias Jakobsson. "Los genomas antiguos vinculan a los primeros agricultores de Atapuerca en España con los vascos de hoy en día". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América (PNAS) 12:38 (22 de septiembre de 2015): páginas 11917-11922. Publicado por primera vez en línea el 2 de septiembre de 2015.
Estos científicos utilizaron análisis de ADN autosómico de muestras modernas versus antiguas para concluir que los vascos descienden de una combinación de agricultores neolíticos extranjeros que se mudaron a Iberia y cazadores-recolectores mesolíticos locales (WHG). Sin embargo, durante los últimos milenios, los vascos no tuvieron mezclas adicionales con forasteros como lo hicieron otros iberos.

Laura R. Botigu & eacute, Brenna M. Henn, Simon Gravel, Brian K. Maples, Christopher R. Gignoux, Erik Corona, Gil Atzmon, Edward Burns, Harry Ostrer, Carlos Flores, Jaume Bertranpetit, David Comas y Carlos D. Bustamante. "El flujo de genes del norte de África contribuye a la diversidad genética humana diferencial en el sur de Europa". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América (PNAS) 110: 29 (16 de julio de 2013): páginas 11791-11796.
Este estudio analizó el ADN autosómico de "2.099 individuos en 43 poblaciones" y encontró que los vascos llevan menos mezcla norteafricana (relacionada con los bereberes) en comparación con otros grupos étnicos de España.

F. Bauduer, J. Feingold y D. Lacombe. "Los vascos: revisión de la genética de poblaciones y los trastornos mendelianos". Biología humana 77: 5 (octubre de 2005): páginas 619-637.
Incluye una discusión de las líneas de ADN-Y y ADNmt de los vascos y sus tipos de antígeno leucocitario humano (HLA), basándose en estudios anteriores.

Ana Maria P & eacuterez-Miranda, Miguel A. Alfonso-S & aacutenchez, Jos & eacute A. Pe & ntildea y R. Calder & oacuten. "Polimorfismo HLA-DQA1 en vascos autóctonos de Navarra (España): posición genética en el ámbito europeo y mediterráneo". Antígenos tisulares 61: 6 (junio de 2003): páginas 465-474.
Este estudio de tipos de antígeno leucocitario humano (HLA) encontró el alelo DQA1 * 02 en una alta proporción de vascos de Guipúzcoa y Navarra del Norte. Los investigadores no pudieron confirmar ningún HLA en común entre vascos y norteafricanos. Su conclusión fue que los vascos se habían aislado genéticamente de sus vecinos no vascos, con "bajos niveles de mezcla".

S. Garc & iacutea-Obreg & oacuten, Miguel A. Alfonso-S & aacutenchez, Ana Maria P & eacuterez-Miranda, Marian M. de Pancorbo y Jos & eacute A. Pe & ntildea. "Inserciones polimórficas de Alu y estructura genética de los vascos ibéricos". Revista de genética humana 52: 4 (2007): páginas 317-327. Publicado por primera vez en línea el 3 de febrero de 2007.

Neskuts Izagirre, Santos Alonso y Concepci & oacuten de la R & uacutea. "Análisis de ADN e historia evolutiva de la población vasca: una revisión". Revista de Investigación Antropológica 57: 3 (otoño de 2001): páginas 325-344.


Conclusiones

En conclusión, establecimos y fechamos una filogenia detallada del haplogrupo Q que proporciona nuevos conocimientos sobre la distribución geográfica de sus ramas euroasiática y estadounidense en muestras modernas y antiguas.

Por primera vez, encontramos dos linajes del cromosoma Y distintos que reflejan los dos componentes "ancestrales" principales (ANC-A, ANC-B) previamente caracterizados por estudios genómicos recientes [5, 38, 42]. La diferenciación de estos linajes probablemente ocurrió en el este de Beringia antes de su entrada a América siguiendo dos rutas: la ruta costera (ANC-A, Q-Z780 / Q-M848) y la ruta interna (ANC-B, Q-Y4276). Una vez que entraron en América, estos dos componentes ancestrales probablemente se mezclaron muy temprano en América del Norte, como sugiere el antiguo genoma nuclear de Kennewick que pertenece a ANC-A (Q-M848) pero que lleva un haplogrupo ANC-B mtDNA (X2a).

Además, rastreamos dos expansiones importantes de los linajes ANC-A en Meso y Sudamérica, una alrededor de 15 kya, poco después del primer poblamiento, y otra a 3 kya, siguiendo las mejoras climáticas y las transiciones culturales locales.

Un mayor apoyo a nuestras conclusiones y nuevos conocimientos podría provenir del análisis de los genomas nativos modernos y antiguos que abarcan todo el marco temporal del primer poblamiento de América, incluidas las regiones del continente actualmente subrepresentadas.


Discusión

Aunque se sabe que las mitocondrias juegan un papel crucial en la homeostasis, hay pocos estudios de todo el genoma mitocondrial que consideren la estratificación de la población. Por lo tanto, nuestro estudio exhaustivo del mtDNA debería mejorar el conocimiento genético y biológico sobre las mitocondrias. A través del análisis genético y fenotípico del mtDNA basado en las variantes obtenidas de los datos WGS y GWAS a gran escala de los individuos japoneses, nuestro estudio elucida con éxito la estructura del mtDNA específico de la población y sus asociaciones pleiotrópicas con los rasgos del complejo humano.

Nuestro estudio destaca las siguientes características novedosas. Primero, podríamos definir los espectros de alta resolución de los haplogrupos, que iban de una a nueve letras. Los espectros de frecuencia de los haplogrupos eran específicos de la población japonesa e incluso heterogéneos entre las regiones geográficas dentro de Japón. Esto debería proponer la importancia de la catalogación basada en WGS de los haplogrupos detallados entre diversas poblaciones. En segundo lugar, al aplicar el último método de reducción de dimensionalidad ML no lineal de UMAP, podríamos deconvolucionar las clasificaciones individuales más finas correspondientes a los subhaplogrupos de dígitos altos con tres letras que el método ML lineal tradicional. Este resultado amplía la aplicación del método ML no lineal para extraer nuevas características del genoma humano sin conocimiento previo. En tercer lugar, las variantes de mtDNA tenían características distintas de las de nDNA: (i) sin desintegración de LD dependiente de la distancia, (ii) escasa marcación de variantes comunes y (iii) múltiples haplotipos comunes que abarcan todo el mtDNA. Especialmente, las variantes de ADNmt sin variantes de marcado comunes se observaron principalmente en la región del bucle D, posiblemente debido a la alta tasa de mutación y las mutaciones recurrentes en esta región 22. Teniendo en cuenta que no todas las variantes comunes de mtDNA fueron genotipadas (o etiquetadas) por los microarrays de SNP actuales, estas características proponen la necesidad de catalogar las listas de variantes para etiquetar eficientemente las variaciones de mtDNA en diversas etnias. En cuarto lugar, no encontramos evidencia de asociación de genotipos de ADNmt (o ADNmt) (o mtCN). Aunque se han informado asociaciones mtDNA-nDNA en un experimento con animales y un estudio de expresión génica humana 5,6, sería necesario realizar más investigaciones para dilucidar sus asociaciones a nivel de genotipo.

Finalmente, el PheWAS mitocondrial impulsado por Biobanco reveló abundantes riesgos genéticos de ADNmt en una variedad de rasgos del complejo humano, incluidos los riesgos recientemente identificados sobre la creatina quinasa y un rasgo relacionado con el sistema inmunológico (enfermedad de Graves). Nuestro PheWAS fue capaz de detectar efectos pleiotrópicos de las variantes de ADNmt de baja frecuencia correspondientes al subhaplogrupo específico. Como la mayoría de los haplogrupos eran raros y difíciles de imputar con alta precisión, en nuestro estudio no se realizó un PheWAS basado en haplogrupos. Las variantes detectadas tuvieron tamaños de efecto relativamente moderados en comparación con las mutaciones patógenas raras del mtDNA que causan enfermedades mitocondriales congénitas, lo que sugiere sus roles modificadores en los fenotipos 38. Nuestro estudio demostró una imputación exitosa de las variantes del mtDNA utilizando el WGS a gran escala como panel de referencia. Sin embargo, una parte de las variantes de mtDNA comunes no se imputaron debido a la falta de los SNP de etiqueta genotipada y también sería difícil trazar un mapa fino de las variantes causales cuando la variante de riesgo identificada pertenecía a los haplotipos comunes que abarcan todo el mtDNA. Esfuerzos de mapeo fino de riesgos adicionales, incluido el diseño personalizado de la lista de variantes en los microarrays, trans- Se justificarían las comparaciones étnicas, un estudio de replicación que investigue nuestros hallazgos de PheWAS y ensayos de validación funcional.

En conclusión, a través de la WGS y PheWAS a gran escala del mtDNA, nuestro estudio podría dilucidar de manera integral los paisajes genéticos y fenotípicos del mtDNA en la población japonesa.


1 |. INTRODUCCIÓN

El Sahel es una zona entre el Sahara en el norte y la sabana en el sur. Se extiende por todo el continente africano desde el Océano Atlántico hasta el Mar Rojo, incluidas partes de Senegal, Mauritania, Malí, Burkina Faso, Argelia, Níger, Camerún, Chad, República Centroafricana, República del Sudán, Sudán del Sur, Eritrea. y Etiopía. Como tal, el Sahel alberga una diversidad genética sustancial distribuida entre muchos grupos etnolingüísticos. Estudios genéticos de poblaciones recientes han revelado ancestros distribuidos geográficamente a escala global (Baker, Rotimi, & # x00026 Shriner, 2017 Shriner, Tekola-Ayele, Adeyemo, & # x00026 Rotimi, 2014 Tishkoff et al., 2009). En Chad, se han identificado cinco ascendencias: África occidental, África occidental-central, África oriental, África septentrional y árabe (Tishkoff et al., 2009 Triska et al., 2015). Se ha encontrado que cada una de estas ascendencias se correlaciona con una familia o rama de la lengua principal: ascendencia africana occidental con ascendencia africana centro-occidental mande con ascendencia niger-congo, bantú y no bantú combinada ascendencia africana oriental con ascendencia nilo-sahariana del norte de África con bereber y ascendencia árabe con semita (Baker et al., 2017). Además de las ramas bereber y semítica, la familia de lenguas afroasiáticas incluye las ramas chadic, cushítica, egipcia y omótica. Se han inferido ascendencias separadas para los hablantes de cusita y omótica (Shriner et al., 2014), pero la ascendencia de los hablantes de chadic no está clara. Dos posibilidades son que los hablantes de Chadic tengan una ascendencia distinta o que tengan ascendencia de África oriental y hayan experimentado un cambio de idioma (Tishkoff et al., 2009).

El haplogrupo de ADN Y R-M207 surgió hace 31,9 [29,8, 34,0] kilo años (kya) (Urasin, 2017a), probablemente en Asia Central. Su descendiente R1b1a2-V88 surgió 17.1 [15.3, 19.0] kya (Urasin, 2017b). La presencia de R1b1a2-V88 en muchas poblaciones en todo el Sahel da fe de un caso claro de inmigración euroasiática, pero no está claro cuándo este haplogrupo entró en África y quién lo transportó (Bekada et al., 2013 Bu & # x0010dkov & # x000e1, & # x0010cern & # x000fd, & # x00026 Novelletto, 2013 Cruciani et al., 2010a Cruciani et al., 2010b).

Actualmente, las distribuciones de R1b1a2-V88 y los hablantes de las lenguas chadic muestran una superposición parcial (Bu & # x0010dkov & # x000e1 et al., 2013 Cruciani et al., 2010a), pero se desconoce si existe una asociación histórica causal. Sobre la base de la distribución del haplogrupo L3f3 de ADN mitocondrial, se ha sugerido que los pastores de habla chadica emigraron del noreste o del este de África, con un límite superior del Holoceno temprano (& # x0010cern & # x000fd et al., 2009). Las lenguas chadic se clasifican en la familia afroasiática, pero se disputan las relaciones genealógicas con las otras ramas de la familia afroasiática. Se ha planteado la hipótesis de que la propagación de las lenguas chadic procedió desde el norte del Sahara hacia el sur hacia el lago Chad, siendo el chadic el más estrechamente relacionado con el bereber (Ehret, 2002), o hacia el oeste desde el valle del Nilo hasta Sudán, siendo el chadic el más estrechamente relacionado. a Cushitic (Blench, 1999).

Para arrojar luz sobre estos problemas, integramos datos de genotipos de proyectos de diversidad en Chad, el Sahel, Sudán y Sudán del Sur con una colección previamente seleccionada de 5.966 individuos muestreados de todo el mundo (Baker et al., 2017). Usando una combinación de agrupamiento supervisado y desintegración del desequilibrio de ligamiento, revelamos una historia en capas de migraciones en Chad que abarcan casi 3.000 años. Desenredar estas capas arrojó información sobre el origen y la propagación de R1b y Chadic.


Materiales y métodos

Muestras, secuenciación de mtDNA y afiliación de haplogrupo

Recolectamos un total de 102 muestras sudanesas, 77 etíopes (ambos emigrantes en Dubai) y 148 somalíes (refugiados en Yemen), pertenecientes a personas no relacionadas, que dieron su consentimiento informado apropiado para que sus muestras biológicas se utilizaran para la caracterización del ADNmt. El trabajo cumplió con la Declaración de Principios Éticos de Helsinki (59ª Asamblea General de la Asociación Médica Mundial, Seúl, octubre de 2008) y fue aprobado por el Comité de Ética de la Universidad de Oporto (11 / CEUP / 2011). Secuenciamos los segmentos hipervariables I y II (HVS-I y HVS-II) de todas las muestras sudanesas y etíopes y HVS-I en la población somalí, utilizando un procedimiento descrito anteriormente (Pereira et al. 2000). Esta información se utilizó para asignar muestras a haplogrupos, siguiendo la evidencia filogenética más reciente, informada en el sitio web de Phylotree (van Oven y Kayser 2009). Las secuencias obtenidas se informan en la tabla complementaria S1 y en el material complementario 2, Material complementario en línea.

Seleccionamos para la secuenciación completa del ADNmt un total de 21 muestras sudanesas, 16 etíopes y 20 somalíes elegidas de las secuencias caracterizadas en este trabajo, y 11 de Chad y 2 de Soqotra pertenecientes al haplogrupo L3 de conjuntos de datos publicados anteriormente (Cerný et al. 2007 Cerný, Pereira, et al.2009). Seguimos la metodología y procedimientos de verificación reportados en Pereira et al. (2007), y las mutaciones se puntuaron en relación con la secuencia de referencia de Cambridge revisada (Andrews et al. 1999). Las 70 secuencias completas de ADNmt están depositadas en GenBank (números de acceso JN655773 – JN655842).

Recopilamos una base de datos de HVS-I publicados y linajes L3 completos que se describen en el texto complementario y las tablas complementarias S2 y Datos complementarios, Material complementario en línea.

Análisis estadístico

Para la reconstrucción de la filogenia L3, los análisis preliminares de la red de mediana reducida (Bandelt et al. 1995) llevaron a un orden de ramificación sugerido para los árboles, que luego construimos a mano de manera más parsimoniosa. Usamos el software mtDNA-GeneSyn (Pereira et al. 2009) para convertir archivos.

Para la estimación del TMRCA para clados específicos en la filogenia, usamos el ρ estadística (Forster et al. 1996) y máxima verosimilitud (ML). Nosotros usamos ρ (la divergencia media de la secuencia del haplotipo ancestral inferido del clado en cuestión) con una estimación de la tasa de mutación para la secuencia completa de ADNmt de una sustitución en cada 3.624 años, corrigiendo la selección de purificación utilizando la calculadora proporcionada (Soares et al. 2009) y una tasa de mutación sinónima de una sustitución cada 7.884 años. Estimamos los errores estándar como en Saillard et al. (2000). También obtuvimos estimaciones de ML de las longitudes de las ramas utilizando PAML 3.13 (Yang 1997), asumiendo el modelo de mutación HKY85 con tasas de distribución gamma (aproximadas por una distribución discreta con 32 categorías). Convertimos la distancia mutacional en ML a tiempo usando el mismo reloj genómico completo de ADNmt.

Obtuvimos diagramas de horizonte bayesiano (BSP) (Drummond et al.2005) de BEAST 1.4.6 (Drummond y Rambaut 2007) para las secuencias L3 completas con un reloj molecular relajado (Drummond et al.2006) (lognormal en distribución a través de ramas y no correlacionados entre ellos) y el modelo HKY de sustituciones de nucleótidos con tasas de distribución gamma. Los análisis previos de ML indicaron que HKY es un modelo adecuado y no es necesario utilizar modelos más complejos (Soares et al. 2009). Los BSP estiman el tamaño efectivo de la población a lo largo del tiempo utilizando secuencias aleatorias de una población determinada.

El haplogrupo L3 claramente no equivale a datos de población, pero la señal asociada con este haplogrupo podría señalar procesos demográficos en las poblaciones que lo portan, como se sugirió anteriormente (Atkinson et al. 2009). El propósito principal de este análisis fue proporcionar gráficos BSP basados ​​en los datos de L3, no para realizar una calibración independiente de la filogenia de L3, ya que no discernimos ningún punto de calibración seguro dentro de L3. Con este propósito, realizamos un análisis con el objetivo de aproximar la tasa de mutación a la utilizada en los análisis restantes. Esto se basó en la edad de L3, asignando una distribución normal con una moda de 65 ka y un percentil 95 que variaba entre 60 y 70 ka, con base en las estimaciones de edad obtenidas con ρ y ML. Dado que la tasa de mutación depende del tiempo, proporcionamos estimaciones de edad mínima para algunos de los clados más jóvenes, manteniendo cierto nivel de independencia de los análisis restantes con ρ y ML. Se asumió que algunos de los subclades dentro de L3d1a1, L3e1a, L3e1b, L3e1d, L3e3a, L3e4a, L3f1b1 y L3f1b4 que están presentes en África del Sur (y África Central) llegaron allí debido a migraciones de Bantu (Newman 1995), una noción reforzada por los resultados del análisis fundador (ver más abajo). De esta manera, la edad atribuida a estos clados era de al menos 3,5 ka de edad, ya que el clado debe tener al menos la edad de la expansión bantú, pero podría ser más antiguo si ya tenía cierta diversidad en África central antes del comienzo de la expansión hacia el sur. Para tener esto en cuenta, establecemos una distribución exponencial con una moda de 3,5 ka y un percentil 95 de 8 ka, lo que permite que la edad sea sustancialmente superior a 3,5 ka. BEAST utiliza un enfoque de cadena de Markov Monte Carlo (MCMC) para muestrear las distribuciones posteriores de los parámetros del modelo (tiempos de ramificación en el árbol y tasas de sustitución). Específicamente, ejecutamos 100,000,000 de iteraciones, con muestras extraídas cada 10,000 pasos de MCMC, después de un quemado descartado de 10,000,000 pasos. Verificamos la convergencia a la distribución estacionaria y el muestreo suficiente mediante la inspección de muestras posteriores, y visualizamos BSP con Tracer v1.3. Utilizamos un tiempo de generación de 25 años, como en Fagundes et al. (2008), y obligó a los subhaplogrupos más grandes a ser monofiléticos en el análisis, ya que apuntamos a una estructura de árbol que sea directamente comparable con los análisis restantes.

Usamos la tasa de mutación obtenida en el árbol general L3 para ejecutar análisis para los subhaplogrupos y subregiones. Los análisis de subhaplogrupos nos permitieron distinguir qué clados fueron los principales responsables de los aumentos en los tamaños de población efectivos observados en el análisis global de L3. Los análisis de subregiones nos permiten observar si una región dada contiene la señal para un aumento de población dado en sus secuencias L3 específicas, lo que indica una posible expansión de población dentro de esa región que involucra varios de los subclades. Con el fin de realizar una comparación sistemática y una descripción de los períodos de incremento en el tamaño efectivo de la población del BSP, calculamos una tasa de cambio del tamaño de la población a lo largo del tiempo, y se calculó en relación con los individuos por cada 100 individuos durante un período de 100 años ( consulte la figura complementaria S1, Material complementario en línea para ver un gráfico de la variación de este valor para el BSP de L3 general). Como definición, consideramos la tasa de aumento de al menos 1 individuo por cada 100 individuos en 100 años como un aumento más pronunciado, coincidiendo bien con la visualización de los BSP.

Para visualizar la distribución geográfica de L3 y sus subhaplogrupos, construimos mapas de interpolación utilizando la “Extensión de analista espacial” de ArcView versión 3.2 (www.esri.com/software/arcview/). Usamos la opción de "distancia inversa ponderada" (IDW) con una potencia de dos para la interpolación de la superficie. IDW assumes that each input point has a local influence that decreases with distance. The geographic location used is the center of the distribution area from which the individual samples of each population were collected. The data used are listed in supplementary table S2 , Supplementary Material online.

We employed a founder analysis ( Richards et al. 2000) for the L3 sequences in Africa. It assumes a strict division between source and sink populations and a series of criteria to partly account for homoplasy and back migrations between regions. The distinction between source and sink populations is straightforward for most lineages in Africa, except for some deep-ancestry clades which are present in both Eastern Africa and Central Africa. Some cautionary steps were taken in order to allow for the effect of gene flow in both directions. We performed the following founder analyses:

(1) From Eastern Africa into Central Africa: Eastern Africa was the source of most of the ancient L3 variation, although some subclades (L3b, L3d, and L3e, as we will discuss in Results) most probably emerged in Central Africa, with their presence in Eastern Africa related to migrants from Central Africa and not the other way around so these subclades were not assumed to be founders from Eastern Africa. Instead, two founders (containing the entire L3bd and L3e clades) were accounted for as Eastern African founders into Central Africa. We opted for enlarged definitions of Central Africa (including all of Nigeria) and East Africa (extending from Sudan to Tanzania) for the four founder analyses to minimize potential problems with genetic drift that might arise with selected smaller data sets. In this case, the inclusion of all of Nigeria in Central Africa would only increase the data set of the sink population and is perfectly valid when considering an eastern source.

(2) From Central Africa into Eastern Africa: Central African haplogroups were involved in important expansions in Central Africa, namely the Bantu expansion. In this case, only L3b, L3c, and L3e would provide founders into Eastern Africa. We included a single founder, the L3 root type that emerged and evolved in situ, to account for the remaining L3 variation observed in Eastern Africa. Although only a small fraction of Nigeria was a source for Bantu speakers, the extended boundaries are nevertheless beneficial for its use as a source for Bantu lineages into Eastern Africa (or Southern Africa) since it would either contain lineages that had subsequently moved from the more strictly defined Central Africa, improving the source data set, or contain lineages not involved in these migrations that would not impact on the analysis.

(3) From Central and Eastern Africa into North Africa: We excluded the Sahel from the analysis as this region has had continuous recurrent gene flow both from north and south, dissolving the definition of well-defined populations, and the populations in this area would be difficult to either classify as source or sink population.

(4) From Central and Eastern Africa into Southern Africa: We performed this analysis in two ways, considering two versions of the Southern African data set as the sink population. At least two major routes are thought to have been taken by Bantu speakers spreading into Southern Africa, a “western stream” and an “eastern stream.” The western stream took the expanding Bantu from eastern Nigeria/Cameroon into Angola, South Africa, and Botswana from around 3.5 ka, whereas the eastern stream reached Mozambique and South Africa within the last 2 ka, starting from a core area in the Great Lakes region of Uganda 2.5 ka ( Bandelt et al. 2001 Salas et al. 2002 Phillipson 2005). In the first, we considered the entire Southern African data set, but for the second, we tested for the possibility of a more recent ancestry for populations at the extreme southeastern tip of the continent, which likely received migrants primarily from the eastern stream of the Bantu expansion as well as more recent immigration from Eastern Africa ( Phillipson 2005 Huffman 2007). Here, we therefore only included samples from Mozambique and South Africa.

We reconstructed, haplogroup by haplogroup, HVS-I networks in the range 16,051–16,400 bp of the reference sequence ( Andrews et al. 1999). Data used are indicated in supplementary table S2 , Supplementary Material online. We used an f1 criterion (which dictates that a sequence type is only considered a founder if it presents derived variation in the hypothetical source population) to identify founders, in order to allow for some homoplasy and back migrations ( Richards et al. 2000).

We estimated the age of the migration of each founder using the ρ statistic ( Forster et al. 1996) and an HVS-I mutation rate of one mutation every 16,677 years ( Soares et al. 2009). In order to assess the error in the Bayesian partitioning across the different migration times realistically, we calculated an effective number of samples in each founder. This was obtained by multiplying the number of samples in each founder by a ratio of the variance assuming a starlike network and the variance calculated with the Saillard et al. (2000) method. We scanned the distribution of founder ages for each region defining equally spaced 200-year intervals for each migration from 0 to 100 ka. We performed a second analysis using defined migration times, based on the previous scan in the context of archaeological and climatological evidence. This second analysis allowed us to fractionate the L3 lineages into each migration and to probabilistically detect which lineages moved in each migration.


About us

Welcome to the mitochondrial DNA haplogroup U4 project! Haplogroup U4 (Ulrike) is a small Indo-European haplogroup that is particularly prevalent in Finland and Russia. It is found at low frequencies throughout Europe, North America and Asia. We have project members living in the following countries: Australia, Austria, Bahamas, Belarus, Belgium, Brazil, Bulgaria, Canada, Czech Republic, Denmark, England, Finland, France, Germany, Greece, Hungary, Ireland, Italy, Japan, Lithuania, Macedonia, The Netherlands, New Zealand, Norway, Poland, Romania, Russia, Scotland, South Africa, Spain, Sweden, Switzerland, Turkey, United Arab Emirates, Virgin Islands, West Indies, USA. U4 is divided into four main subclades: U4a, U4b, U4c and U4d. Each subclade has numerous branches.

Description of haplogroup U4 from Wikipedia
Haplogroup U4 has its origin in the Upper Palaeolithic,dating to approximately 25,000 years ago and has been implicated in the expansion of modern humans into Europe occurring before the Last Glacial Maximum. U4 is an ancient mitochondrial haplogroup and is relatively rare in modern populations. U4 is found in Europe with highest concentrations in Scandinavia and the Baltic states and is found in the Sami population of the Scandinavian peninsula (although, U5b has a higher representation).

U4 is also associated with the remnants of ancient European hunting-gatherers preserved in the indigenous populations of Siberia. U4 is found in Nganasans, the indigenous inhabitants of the Taimyr Peninsula, in the Mansi (16.3%), an endangered people, and in the Ket people (28.9%) of the Yenisey River. U4 is also preserved in the Kalash people (current population size 3,700) a unique tribe among the Indo-Aryan peoples of Pakistan where U4 (subclade U4a1) attains its highest frequency of 34%.

Haplogroup U4 is associated with ancient European hunter-gatherers and has been found in 7,200 to 6,000-year-old remains of the Pitted Ware culture in Gotland, Sweden, and in 4,400 to 3,800-year-old remains from the Damsbo site of the Danish Bell-Beaker culture. Remains identified as subclade U4a2 are associated with the Battle Axe culture which flourished 5,200 to 4,300 years ago in eastern and central Europe and encompassed most of continental northern Europe from the Volga River in the east to the Rhine River in the west. Mitochondrial DNA recovered from 3,500 to 3,300-year-old remains at the Bredtoftegård site in Denmark associated with the Nordic Bronze Age include haplogroup U4 with 16179T in its HVR1 indicative of subclade U4c1. (Source: Wikipedia article on haplogroup U. Reproduced under the Creative Commons Licence.)

Description of Ulrike from Bryan Sykes
The clan of Ulrike (German for Mistress of All) is not among the original "Seven Daughters of Eve" clans, but with just under 2% of Europeans among its members, it has a claim to being included among the numerically important clans. Ulrike lived about 18,000 years ago in the cold refuges of the Ukraine at the northern limits of human habitation. Though Ulrike's descendants are nowhere common, the clan is found today mainly in the east and north of Europe with particularly high concentrations in Scandinavia and the Baltic states. (Source: www.oxfordancestors.com/content/view/35/55)

Afiliación
The project is open to everyone who has taken a mitochondrial DNA (mtDNA) test with Family Tree DNA, the Genographic Project or one of the FTDNA partners (e.g., IGENEA, DNA Worldwide), and whose results show that they belong to haplogroup U4 or one of its subclades. There is no fee to join the project, and no additional testing is required.

If you have tested with the Genographic Project you will first need to transfer your results to the Family Tree DNA database. For instructions on transferring your results see this page in the FTDNA Learning Center. Geno 1.0 HVR1 results are included on the U4 project's results page. The Geno 2.0 test and the Geno 2.0 NextGen test scan selected SNPs from across the entire mt genome, but do not sequence the entire hypervariable region - the sections that are used for low-resolution genealogical matches. Geno 2.0 results cannot therefore be displayed on the project's results page and cannot be used for genealogical matching purposes. Nevertheless we are still happy to welcome Geno 2.0 testers to the project though we would encourage you to upgrade and order an mtDNA test from FTDNA in order to participate in the matching database.

If you have tested with any other company you will have to retest with Family Tree DNA if you wish to participate in the U4 Project. This blog post explains more about the various mtDNA tests offered by the different testing companies. The International Society of Genetic Genealogy have a chart on their website showing the differences in the mtDNA tests offered by the various companies which can be seen here.

Please provide details of your most distant known ancestor on your direct maternal line (your mother, your mother's mother, your mother's mother and so on). Click here to see a chart on the ISOGG website which shows the path of mtDNA transmission. There is also a useful animated video on the Learn Genetics website which can be seen by clicking here. You can enter the information via the My Account/Most Distant Ancestors menu on your FTDNA personal page. Please provide the full name, year of birth and location of your most distant known ancestor on your direct maternal line. As we are an international project with members from many different countries please avoid the use of local abbreviations (eg, US state abbreviations, UK Chapman county codes) for clarity.

If you have taken the full mitochondrial sequence (FMS) test (also known as the mega or full genomic sequence (FGS) test) please consider sharing your coding region results with the project administrators so that we can help you with your results. The coding region results are not shown on the project's results page and will not be made public, and by default they are also hidden from the project administrators. The coding region results allow us to check your subclade assignment against the latest version of the mtDNA tree on Phylotree. We can often provide a more detailed classification than that provided by FTDNA. FTDNA is currently using Build 14 of Phylotree. Some U4 subclades in Build 14 are not yet recognised by FTDNA. All U4 project results have been updated to conform with the most recent Phylotree build (Build 16).

To share your coding region results with the project administrators , please log into your FTDNA account, select My Account and click on Results Display Settings. In the section "Show My mtDNA Coding Region Mutations to Administrators of these Projects", make sure that you have indicated "Yes" for the U4 project. For instructions see also the article by Rebekah Canada on Your Privacy and Showing Your mtDNA Coding Region Results.

Instructions for joining the U4 Project in other languages
Currently, we have our "Join Request" in six languages (English, Русский, Deutsch, Français, Español and Italiano). Click here to see these translations.

Intimidad
The privacy of project members is respected at all times. The U4 administrators strictly adhere to the Family Tree DNA Group Project Administrator Terms and Policies and the ISOGG Project Administrator Guidelines. See also the Family Tree DNA Privacy Policy and Terms of Service and the Learning Center pages on DNA Group Projects. For information on adjusting your FTDNA privacy settings see the article in the FTDNA Learning Centre on Privacy and Sharing.

Geographical projects
We encourage all our project members to join the appropriate geographical project wherever possible. A full list of geographical projects can be found in the ISOGG Wiki. There is no limit on the number of projects you can join at Family Tree DNA, but admission to a project is subject to approval by the project administrators.

ISOGG
We encourage all our members to join (it's free!) the International Society of Genetic Genealogy (ISOGG). Further information can be found on the ISOGG website and in the ISOGG Wiki.

Scientific papers of particular relevance to haplogroup U4
Der Sarkissian C, Balanovsky O, Brandt G, Khartanovich V, Buzhilova A, et al. (2013) Ancient DNA Reveals Prehistoric Gene-Flow from Siberia in the Complex Human Population History of North East Europe. PLoS Genetics 9(2): e1003296. (Full article available online.)

Melchior L, Lynnerup N, Siegismund HR, Kivisild T, Dissing J (2010). Genetic Diversity among Ancient Nordic Populations. PLoS ONE 5(7): e11898. (Full article available online.)
Malyarchuk B, Grzybowski T, Derenko M, Perkova M, Vanecek T, Lazur J, Gomolcak P, Tsybovsky I. Mitochondrial DNA phylogeny in Eastern and Western Slavs. Biología molecular y evolución 2008 25(8):1651-1658. (Full article available online.)

Soares P, Acchili A, Semino O, Davies W, Macaulay v, Bandelt h, Torroni A, Richards M (2010). The Archaeogenetics of Europe. Current Biology 23 February 2010 (Vol. 20, Issue 4, pp. R174-R183). The authors provide an age estimate of U4 at 20.8 thousand years based on an analysis of the complete mtDNA genome sequences of 956 West Eurasian samples. They state: "It has been argued that several lineages that are most prominent in eastern Europe, in particular within U4, may be the result of expansions from an eastern refuge, perhaps in the Ukraine." (Full article available online)

Samara Rubinstein, Matthew C. Duuk, Omer Gokcumen, Sergey Zhadanov, Ludmila Osipova, Maggie Cocca, Nishi Mehta, Marina Gubina, Olga Posukh, Theodore G Schurr. Russian Old Believers: genetic consequences of their persecution and exile, as shown by mitochondrial DNA evidence (Report). Biología humana June 01, 2008. (Report available online.)

Kristiina Tambets. Dissertationes Biologicae Universitatis Tartuensis. Towards the understanding of post-glacial spread of human mitochondrial DNA haplogroups in Europe and beyond: a phylogeographic approach. Council of the Institute of Molecular and Cell Biology, University of Tartu, Estonia, 2004. (Thesis available online.)

B. A. Malyarchuk. Differentiation of the Mitochondrial Subhaplogroup U4 in the Populations of Eastern Europe, Ural, and Western Siberia: Implication to the Genetic History of the Uralic Populations. Russian Journal of Genetics November 2004, Volume 40, Number 11. (Abstract and preview available online.)

Olga A. Derbeneva, Elena B. Starikovskaya, Douglas C. Wallace, and Rem I. Sukernik. Traces of Early Eurasians in the Mansi of Northwest Siberia Revealed by Mitochondrial DNA Analysis. Revista estadounidense de genética humana 2002 April 70(4): 1009�. (Full article available online.)

Other scientific papers of interest
Hans-Jürgen Bandelt, Anita Kloss-Brandstätter, Martin B Richards, Yong-Gang Yao and Ian Logan. The case for the continuing use of the revised Cambridge Reference Sequence (rCRS) and the standardization of notation in human mitochondrial DNA studies. Journal of Human Genetics (5 December 2013).

Doron M. Behar, Mannis van Oven, Saharon Rosset et al (2012). A "Copernican" Reassessment of the Human Mitochondrial DNA Tree from its Root. American Journal of Human Genetics , Volume 90, Issue 4, 6 April 2012, pp675�. A number of U4 sequences from Family Tree DNA customers were used in this paper.

Melchior L, Lynnerup N, Siegismund HR, Kivisild T, Dissing J (2010). Genetic Diversity among Ancient Nordic Populations. PLoS ONE 5(7): e11898. An ancient DNA study which found a U4 sample amongst the Neolithic Bell Beaker people along with a later Bronze age U4 sample.

Helena Malmström, M. Thomas P. Gilbert, Mark G. Thomas et al. Ancient DNA Reveals Lack of Continuity between Neolithic Hunter-Gatherers and Contemporary Scandinavians. Biología actual 2009 9(2): 1758-1762. (Abstract only available online.) A discussion can be found on Dienekes' Anthropology Blog. The article is also discussed on the GenomeWeb website. Eight U4 samples were included in the study.

B. Bramanti, M. G. Thomas, W. Haak et al. Genetic Discontinuity Between Local Hunter-Gatherers and Central Europe’s First Farmers. By (3 September 2009) Science [DOI: 10.1126/science.1176869] (Abstract only available online.) The article is reviewed on Dienekes Anthropology Blog. Dienekes comments: "Pre-farming populations seem to have been dominated by mtDNA haplogroup U". He quotes from the paper: "it is intriguing to note that 82% of our 22 hunter-gatherer individuals carried clade U (fourteen U5, two U4, and two unspecified U-types". The two U4 samples were from Bad Duerrenberg, Germany (c. 6850 BC) and Spiginas, Lithuania (c. 6350 BC). The paper states that "U4 types show frequencies between 1% and 5% in most parts of Europe, with Western Europe at the lower end of this range, and northeastern Europe and central Asia showing percentages in excess of 7%".

A. Achilli, C. Rengo, V. Battaglia et al. Saami and Berbers—An Unexpected Mitochondrial DNA Link. The American Journal of Human Genetics, 2005, Volume 76, Issue 5, Pages 883-886. (Full article available online)

O. A. Derbeneva, E. B. Starikovskaya, N. V. Volodko, D. C. Wallace and R. I. Sukernik. Mitochondrial DNA variation in the Kets and Nganasans and its implications for the initial peopling of Northern Eurasia. Russian Journal of Genetics, Vol. 38, No. 11, 2002, pp.1316�. Translated from Genetika, Vol. 38, No. 11, 2002, pp.1554�. (Abstract and preview available online.)

Descargo de responsabilidad
The mtDNA Haplogroup U4 Project is an independent genealogical research study run by volunteer administrators. The project receives no funding, and participants are responsible for the costs of their own tests. The project was organised as a co-operative effort among those who wish to explore genetic testing to advance their knowledge of deep and recent family backgrounds.

Member information and data obtained from the Haplogroup U4 Project must be attributed to the project, administrators, and Family Tree DNA. Please notify administrators when using data for public or private research.