(по данным полного секвенирования Y хромосомы)
Гурьянов Владимир
Наличие гаплогруппы Q в северокавказских популяциях давно зафиксировано в ряде исследований. Так, в статье Balanovsky et al., 2011[1] была опубликована выборка из 1525 образцов, собранных в Чечне, Ингушетии, Дагестане, Северной Осетии и Карачаево-Черкесии, а также на территории Абхазии.
Из указанной выборки к гаплогруппе Q было отнесены 21 образец, в том числе: аварец (DAG-511), кайтаг (DAG06-894), 11 чеченцев (CHECH107a, CHECH-051, CHECH-110a, CHECH-121a, Chech-1238, Chech-1248, Chech-1262, ING-1084, Chech-1232, Chech-1234, Chech-1265), черкес (KCHE-1483), 5 осетин-дигорцев (OSE-042, OSE-582, OSE-594, OSE-591, OSE-016), 2 осетин-иронцев (OSE-469, OSE-146). При этом все образцы были типированы по SNP маркеру (снипу) M242 и отнесены к гаплогруппе Q без детализации по субкладам. Также, в силу специфики сбора генетического материала, в указанной статье отсутствовала информация о самоидентификации доноров на субэтническом уровне (принадлежность к роду, исторически сложившемуся объединению родов).
В качестве еще одного источника данных о гаплогруппе Q среди северокавказских популяций можно также рассматривать диссертационную работу З.И. Боготовой «Изучение генетической структуры популяций кабардинцев и балкарцев»[2], опубликованную в 2009 году. В ней по выборке балкарцев (n=136) определена частота распространения гаплогруппы Q в этой популяции – 3,7%. При этом принадлежность образцов к конкретным субкладам гаплогруппы Q также не производилась. В статьей Джаубермезов и др., 2017[3] вопрос о гаплогруппе Q также не был в фокусе внимания исследователей, хотя авторы зафиксировали ряд интересных обстоятельств: галогруппа Q, «не обнаружена у карачаевцев, среди балкарцев частота распространения Q-M242 (xM120) составляет 6.8%»; «с высокой долей она встречается в восточных субпопуляциях балкарцев: безенгиевцев (13.2%) и малкарцев (7.4%)».
Наше исследование, не претендуя на полноту (в частности, мы сознательно отказались от оценки частоты распространения субклады в популяции и от обзора ситуации по адыгам и народам Дагестана), ставит своей целью введение в научный оборот данных, полученных в ходе полного секвенирования Y хромосомы с применением технологии секвенирования нового поколения (NGS), проводенном на секвенаторе Illumina HiSeq2000 с покрытием 50-80х. Эти данные были дополнены гаплотипами по STR-маркёрам Y-хромосомы.
Исследование охватывало данные участников Карачаево-Балкарского ДНК-проекта[4], Осетинского ДНК-проекта[5] и Чеченского ДНК-проекта[6], которые начав с реализации на платформе FamilyTreeDNA (компании, предоставляющей услуги по генетическому тестированию и интерпретации результатов тестирования) постепенно переросли этот формат и сейчас представляют собой совокупность информации о генетическом разнообразии этих народов, накопленных на различных информационных ресурсах (данные тестирования в FamilyTreeDNA, YSEQ, 23&Me, группы в Facebook, он-лайн форумы).
Эта информация (Приложение 1) органично дополняет данные научных выборок по указанным популяциям, а нередко содержит более точные сведения о типировании и группировке образцов.
Гаплогруппа Q среди балкарцев.
13 участников Карачаево-Балкарского ДНК-проекта (из 416 человек имеющих данные по тестированию Y-хромосомы) принадлежат к гаплогруппе Q и относятся к одному кластеру, что подтверждается анализом STR и SNP маркеров.
Данные проекта подтверждают закономерности описанные в упомянутой выше статье Джаубермезов и др., 2017: отсутствие гаплогруппы Q у карачаевцев, наибольшая концентрация среди безенгиевцев и малкарцев.
Большая часть из указанных участников проекта относится к басиятам - балкарскому княжескому клану (таубии), который политически объединял балкарские княжеские фамилии, а также имел влияние в соседней Дигории. В число родов басият Балкарии входят Абаевы, Боташевы, Кучуковы, Амирхановы, Биевы, Заниюковы (Женоковы), Жанхотовы, Айдабуловы и Шахановы. Интересна история происхождения «басият». Тут есть несколько версий, но все они перекликаются между собой. Мисост Абаев, потомок басиятов в 1911 году в очерке «Балкария»[7] написал «два брата Басиат и Бадилят прибыли на Кавказ из Венгрии (по другому преданию – из Крыма)». В устном творчестве балкарцев и дигорцев Басият и Бадилят всегда упоминаются как братья, что, впрочем, не нашло подтверждения данными анализа ДНК их потомков. При этом наличие общего предка у балкарских басият, напротив, подтверждается генетическим анализом. При этом сходные гаплотипы выявлены в ряде родов, не принадлежащих к потомкам таубиев (Джубоевы, Рахаеевы, Гороевы, Джапуевы, Созаевы, Тиловы, Мусуковы); объяснение этого обстоятельства потребует дополнительных исследований.
Проведённый анализ данных полного сиквенса Y хромосомы позволил идентифицировать балкарских Q (за исключением семьи Шабатуковых) как принадлежащих к субкладе Q-BZ640 (сначала субклада получила название Q-BZ660, но впоследствии, для обеспечения унифицированного наименования в YFullи FTDNAбыла переименована). Путем сопоставления SNP маркеров в двух образцах, прошедших полное секвенирование Y хромосомы, были определены 30 SNP маркеров (Приложение 2, таблица 2.1), характеризующие эту субкладу, а также выделены приватные SNPмаркеры (Приложение 2, таблица 2.2), перспективные для дальнейших исследований.
Позиционирование Q-BZ640 на филогенетическом древе SNP (снипов) Y-хромосомы.
Расчетный возраст субклады Q-L715, являющейся «материнской» по отношению к Q-BZ640, соответствует интервалу от 4 до 6,1 тысяч лет (доверительный интервал 95%)[8]. Параллельная субклада Q-L713 представлена туркменами (Q-YP1677) и венгерскими секлерами (Q-YP789). К субкладе Q-YP789 также относятся двое протестированных в FTDNAпредставителей польской шляхты и татарин из Южного Зауралья. Причем один из потомков шляхтичей и татарин образовали отдельную субкладу Q-BZ1000 (возраст которой находится в интервале 1150-2600 лет).
Таким образом, субклада Q-L713 представлена среди широкого спектра современных популяций, чей этногенез был связан с Великой Степью.
При этом расхождение с предками этих народов у балкарцев произошло еще в бронзовом веке.
Из образцов палеоДНК, которые могли бы проиллюстрировать этногенез Q-BZ640, можно упомянуть три[9]:
- образец RISE493 Sabinka II(карасукская культура) 1500-1400 годы до н.э. (бронзовый век), обнаруженный в могильнике Сабинка IIв Бейском районе Республики Хакассия, относится к Q-L715;
- обнаруженные в могильнике Верх-Уймон (Горный Алтай), отнесенном к гунно-сарматской культуре, сформировавшейся на Алтае к концу III в. до нашей эры, образцы RISE600 Verh-Uimon (железный век, нет точной датировки) принадлежит к субкладе Q-L713; образец RISE601 Verh-Uimon (железный век, нет точной датировки) из того же могильника принадлежит к Q-L715.
Ни у одного из этих образцов нет пересечений по снипам с протестированными в наше время людьми (в том числе с балкарцами). Эти субклады либо пресеклись, либо их современные представители еще не найдены.
Схематически расположение "балкарских Q-BZ640" на филогенетическом дереве можно представить следующим образом:
Q-M242 |
|||||||
Q-L274 |
|||||||
Q-L275 |
|||||||
Q-L472 |
|||||||
Q-L56 |
|||||||
Q-F1096 |
|||||||
Q-F746 |
|||||||
Q-M25 |
|||||||
Q-YP1669 |
|||||||
Q-L712 |
|||||||
Q-YP4385 |
|||||||
Q-L715 |
|||||||
Q-L713 |
|||||||
Q-BZ640 |
Более подробно с актуальной схемой филогенетического дерева в части субклады Q-BZ640 можно ознакомиться на сайте YFull.com
Нижнюю границу возраста формирования самого субклада Q-BZ640 мы можем оценить через расчетное время жизни биологического общего предка (ВБОП или TMRCA). Оно находится в интервале от 500 до 1600 лет, что не противоречит легенде об общем прародителе (Басиате).
Что касается Шабатуковых (Malkar, Kosparti), то несмотря на то, что по STR-маркерам они также относятся к ветви Q-M25 (как и основной кластер балкарских Q, о котором написано выше), но они явно находятся за его пределами. Это же подтверждает тестирование одного из Шабатуковых на SNP-маркер L712 (результат отрицательный). Шабатуковы кластеризируются с двумя участниками Грузинского ДНК-проекта (мегрелом c номером в проекте 258940 и сваном с номером в проекте 253673), но по имеющимся данным пока сложно указать на возможное направление миграции (из Балкарии в Сванетию и далее или наоборот).
Что касается еще одного участника Карачаево-Балкарского проекта, принадлежащего к гаплогруппе Q (Берберов), то комплексный анализ по STRи SNP маркерам позволил установить его принадлежность к субкладе Q-L330. Устная традиция этого рода четко указывает на маршрут миграции родоначальника – из Турции через Карачай.
Других ветвей, принадлежащих к гаплогруппе Qсреди балкарцев и карачаевцев на текущий момент не выявлено. Обращает на себя внимание то, что гаплогруппа Q встречается исключительно среди балкарцев и полностью отсутствует у карачаевцев. Таким образом проявляется «эффект основателя», нашедший свое отражение в устной традиции, легенде о басият.
Гаплогруппа Q среди осетин
В Осетинском ДНК-проекте пять участников (Каражев, Будтуев, Кануков, Мирзаев, Дзугаев) по STR-маркерам входят в тот же кластер, что и балкарские Q-BZ640. Из них ни один не имеет подтвержденной хотя бы устной традицией генеалогической связи с басиятами, хотя двоих (Каражева и Будтуева) предание связывает с баделята. По одному преданию Карадза (предок Каражевых) был одним из сыновей Бадела, а по второму - Карадза был зятем Бадела. Таким образом, возможно, что речь шла о родстве через династические браки, подробности которых не дошли до наших времен. При этом устная традиция считает роды Каражевых и Будтуевых родственными (арвадалта), ведущими свое происхождение от одного общего предка[10].
Еще четверо участников Осетинского ДНК-проекта принадлежат к другим субкладам.
Так, Купеев, в настоящее время идентифицируемый как принадлежащий к ветви Q-L53*, близок к чеченской субкладе Q-Y4055, а возможно и принадлежит к ней. Такой вывод можно сделать на основе анализа STRмаркеров.
Цакоев, Хамицаев и Ханикаев, принадлежат к еще одной ветви Q – Q-L940 с характерным значением одного из STR-маркеров (DYS426=11). Причем Ханикаев, благодаря нахождению его образца в YSEQ (ID YSEQ 4723), был исследован наиболее глубоко. Тестирование отдельных SNP маркеров подтвердило положительные результаты по двум – L932 и SK1995 при отрицательном значении для L941. Субклада Q-SK1995 находится под Q-L932 и параллельна Q-F850/L941. К этой ветви принадлежит один араб из ОАЭ, тестировавшийся в FTDNA и два научных образца: HGDP00226 (пуштун из Пакистана) и HGDP00144 (макрани из Пакистана). Эта информация пока не дает нам строить убедительные гипотезы о времени возможного появления Q-SK1995 на Кавказе, но может стать основой для более глубокого изучения генетической истории этих родов.
Что касается упомянутых ранее образцов, гаплотипы которых были опубликованы в статье Balanovsky et al., 2011, то трое дигорских OSE-594, OSE-582, OSE-042 по предикции, основанной на сопоставлении STR-маркеров принадлежат к субкладу Q-BZ640; двое дигорских OSE-591, OSE-016 – к Q-SK1995. Эти выводы полностью соответствуют выявленным нами закономерностями: 3 из 4 осетинских Q-BZ640, протестированных в FTDNAи YSEQ– дигорцы, трое осетинских Q-SK1995, протестированных в этих компаниях – также дигорцы.
Чеченcкие Q.
Чеченцы, принадлежащие к гаплогруппе Q, оказались локализованы в основном в составе тейпов ГIордалой, Энгеной, ЭгIишбатой, Дишний, относящиеся к тукхуму Нохчмахкхой. Нохчимохк[11]является самым поздним по времени основания союзом чеченских тейповых общин (тукхумом). В него вошли чеченские общины, мигрировавшие на восток современной Чечни из Нашах и Чеберлоя.
Хотя неправильным будет утверждать, что гаплогруппа Q, представлена исключительно в этих тейпах. Несмотря на то, что на текущий момент в рамках Чеченского ДНК-проекта генетическое тестирование прошли 509 человек (из них 26 человек имеет гаплогруппу Q), им охвачены далеко не все тейпы и гары. Тем не менее, весь имеющийся в нашем распоряжении массив данных по STR-маркерам подтверждает принадлежность «чеченских Q» к одной субкладе. Из 26 протестированных человек большинство принадлежит к тейпу ГIордалой (Ирбахий гар, Оккхи гар, Iэжи гар, Басхой гар, Песи гар, Хуци гар, Ойбул гар, Бучи гар), трое – к тейпу Энгеной (Беси гар), двое – к тейпу ЭгIишбатой, двое – к тейпу Дишний (Чиркх гар), по одному – к тейпам Мазархой , Шуоной и ХIиндой.
Таким образом, путем сопоставления SNP маркеров в двух образцах, прошедших полное секвенирование Yхромосомы, были определены 10 снипов (Приложение 3, таблица 3.1), характеризующие «чеченскую подветвь» в гаплогруппе Q: Q-Y4055. В этом же приложении указаны приватные снипы, прошедшие критерии проверки качества, и представляющие интерес для дальнейших исследований (таблица 3.2). Только один из 26 чеченцев, принадлежащих к гаплогруппе Q, относится к другой ветви – Q-BZ640 (Микиев, тейп Цикарой).
В результате ветвь определенная путем сопоставления трех чеченских и двух не чеченских образцов по результатам полного секвенирования Y-хромосомы, получила обозначение обозначение Q-YP4004, и оказалась расположенной под ветвью Q-L53, параллельно Q-L54. Отдельная «чеченская подтветвь» расположена ниже, под ветвью Q-YP4000.
Схематически это можно изобразить следующим образом:
Q-M242 |
||||||||
Q-L274 |
||||||||
Q-L275 |
||||||||
Q-L472 |
||||||||
Q-F1096 |
||||||||
Q-L56 |
||||||||
Q-Y2659 |
||||||||
Q-L53 |
||||||||
Q-L54 |
||||||||
Q-YP4004 |
||||||||
Q-YP4000 |
||||||||
Q-YP4055 |
||||||||
Q-YP3952 |
Более подробно с актуальной схемой филогенетического дерева в части субклады Q-YP4004 можно ознакомиться на сайте YFull.com
Примечание: представленная схема отличается от опубликованной первой версии статьи (в Сборнике статей «Генетическая история народов Евразии» (Труды Евразийского общества генетической генеалогии, выпуск 1, февраль 2016) в связи с формированием новых субклад и переименованием уже выявленных.
Расчет возраста формирования субклады и возраста биологического общего предка (TMRCA) был произведен по методу, изложенному в Adamovetal., 2015[12]. Субклада Q-YP4055 сформировалась около трех тысяч лет назад (доверительный интервал 95%), а возраст общего предка двух протестированных, принадлежащей к «дочерней» субкладе Q-YP3952 составил всего 700 лет (с тем же доверительным интервалом).
На текущий момент субклада Q-YP4055 представлена исключительно чеченцами. Таким образом, субклада Q-YP4055 с высокой вероятностью является автохтонной для Кавказа и ее представители приняли участие в этногенезе чеченского народа на достаточно ранних его этапах.
Что касается, ветвей Q-YP4004 и Q-YP4000, то они представлены соответственно поляком и селькупом. Их ветви отделились от чеченской соответственно 7,6 тысяч и 3 тысячи лет назад (оценка по той же методике). Таким образом, речь идет о миграциях в достаточно широком временном диапазоне (от неолита до энеолита), самая поздняя из которых затронула Кавказ и Центральную Азию.
В настоящее время выявлено значительное количество образцов из Европы и Центральной Азии, имеющих характерное значение SNP-маркеров: L53+ L54-, что дает основание отнести их к Q-YP4004. Детальное изучение этих образцов в перспективе позволит восстановить историю доисторических миграций предков этих людей, которые приняли участие в этногенезе чеченского народа.
Благодарность
Автор выражает отдельную благодарность Пахрудину Арсанову, администратору Чеченского ДНК-проекта; Александру Байматову, ко-администратору Осетинского ДНК-проекта; участникам Карачаево-Балкарского ДНК-проекта, за помощь, оказанную при подготовке и редактировании текста статьи.
Приложение 2.
Таблица 2.1. SNP-маркеры (снипы) субклады Q-BZ640.
Имя SNP |
Позиция |
Anc |
Der |
Имя SNP |
Позиция |
Anc |
Der |
Имя SNP |
Позиция |
Anc |
Der |
||
BZ639 |
6693308 |
A |
G |
BZ652 |
16763286 |
T |
A |
BZ664 |
22834443 |
T |
C |
||
BZ640 |
6762428 |
T |
C |
BZ654 |
17872766 |
G |
C |
BZ665 |
22961466 |
G |
A |
||
BZ641 |
8183501 |
C |
T |
BZ655 |
18030567 |
A |
G |
BZ667 |
23554630 |
A |
C |
||
BZ642 |
8274843 |
C |
A |
BZ656 |
18700177 |
T |
C |
BZ668 |
23810513 |
A |
G |
||
BZ643 |
8640117 |
G |
T |
BZ657 |
21257196 |
C |
T |
BZ669 |
23842578 |
T |
C |
||
BZ644 |
9090333 |
T |
C |
BZ658 |
21332983 |
T |
C |
BZ670 |
8721080 |
T |
G |
||
BZ646 |
13919587 |
T |
C |
BZ660 |
21491395 |
A |
T |
BZ671 |
9809912 |
T |
G |
||
BZ648 |
15026112 |
G |
A |
BZ661 |
21812868 |
C |
A |
BZ674 |
22783853 |
G |
A |
||
BZ649 |
15452115 |
G |
A |
BZ662 |
22096536 |
G |
T |
BZ675 |
23491597 |
C |
T |
||
BZ650 |
15783481 |
G |
A |
BZ663 |
22555035 |
T |
C |
Y21044 |
21485937 |
G |
A |
Таблица 2.2. Образцы I и II(приватные снипы образцов субклады Q-BZ640)
Имя SNP |
Позиция |
Anc |
Der |
Имя SNP |
Позиция |
Anc |
Der |
||||||
BZ2914 |
7190821 |
G |
A |
BZ647 |
14262403 |
T |
C |
||||||
BZ2915 |
9053774 |
G |
T |
BZ651 |
16202156 |
G |
A |
||||||
BZ2921 |
14419539 |
T |
G |
BZ653 |
17409576 |
G |
T |
||||||
BZ2922 |
22776140 |
A |
G |
Приложение 3.
Таблица 3.1. Снипы субклады Q-YP4055 и нижерасположенной субклады Q-YP3952
Имя SNP |
Позиция |
Anc |
Der |
Субклада |
YP4055 |
21693787 |
C |
A |
Q-YP4055 |
YP3952 |
6844645 |
A |
T |
Q-YP3952 |
YP3973 |
14404427 |
T |
A |
Q-YP3952 |
YP3974 |
14409292 |
G |
A |
Q-YP3952 |
YP3975 |
14436284 |
C |
A |
Q-YP3952 |
YP3978 |
15172292 |
T |
C |
Q-YP3952 |
YP4043 |
19228059 |
T |
C |
Q-YP3952 |
YP4058 |
22031664 |
G |
A |
Q-YP3952 |
YP4068 |
23310025 |
T |
A |
Q-YP3952 |
YP4075 |
24461451 |
A |
C |
Q-YP3952 |
Таблица 3.2. Приватные снипы трех образцов, относящихся к субкладе Q-YP4055
Имя SNP |
Позиция |
Anc |
Der |
Субклада |
BZ5193 |
4872099 |
C |
T |
Q-YP4055* |
BZ5194 |
9503978 |
C |
A |
Q-YP4055* |
BZ5195 |
9890520 |
G |
C |
Q-YP4055* |
BZ5196 |
14339680 |
C |
T |
Q-YP4055* |
BZ5197 |
14967286 |
A |
G |
Q-YP4055* |
BZ5198 |
15327759 |
T |
C |
Q-YP4055* |
BZ5199 |
16992454 |
A |
G |
Q-YP4055* |
BZ5200 |
17039830 |
T |
G |
Q-YP4055* |
BZ5201 |
17508970 |
A |
G |
Q-YP4055* |
BZ5202 |
17940102 |
G |
T |
Q-YP4055* |
BZ5203 |
17942115 |
G |
A |
Q-YP4055* |
BZ5204 |
18808499 |
C |
T |
Q-YP4055* |
BZ5205 |
18834135 |
C |
T |
Q-YP4055* |
BZ5206 |
18886883 |
C |
A |
Q-YP4055* |
BZ5207 |
19421310 |
A |
G |
Q-YP4055* |
BZ5208 |
21114061 |
T |
A |
Q-YP4055* |
BZ5209 |
21532815 |
A |
T |
Q-YP4055* |
BZ5210 |
23473051 |
G |
A |
Q-YP4055* |
BZ5211 |
23575386 |
A |
G |
Q-YP4055* |
BZ83 |
8620361 |
C |
T |
Q-YP3952* (I) |
BZ84/CTS8716 |
18160939 |
C |
A |
Q-YP3952* (I) |
BZ85 |
2652151 |
G |
A |
Q-YP3952* (I) |
BZ86 |
6491326 |
C |
A |
Q-YP3952* (II) |
BZ87 |
17327595 |
T |
C |
Q-YP3952* (II) |
BZ88 |
18193802 |
C |
T |
Q-YP3952* (II) |
BZ89 |
21236348 |
G |
T |
Q-YP3952* (II) |
BZ575 |
22076990 |
T |
C |
Q-YP3952* (II) |
BZ576 |
5443893 |
A |
C |
Q-YP3952* (II) |
BZ577 |
6934863 |
C |
A |
Q-YP3952* (II) |
BZ578 |
7357227 |
A |
G |
Q-YP3952* (II) |
BZ579 |
8056151 |
C |
T |
Q-YP3952* (II) |
[1] Balanovsky et al., Parallel Evolution of Genes and Languages in the Caucasus Region// Mol Biol Evol (2011) doi: 10.1093/molbev/msr126
[2] Боготова Залина Ихсановна. Изучение генетической структуры популяций кабардинцев и балкарцев : диссертация ... кандидата биологических наук : 03.00.15 / Боготова Залина Ихсановна; [Место защиты: Ин-т биохимии и генетики Уфим. науч. центра РАН].- Уфа, 2009.- 130 с.: ил. РГБ ОД, 61 10-3/388
[3] М.А. Джаубермезов и др., Генетическая характеристика балкарцев и карачаевцев по данным об изменчивости Y-хромосомы, 2017, «Генетика», Том 53, 2017 г., № 10, DOI: 10.7868/S0016675817100034
[4] Family Tree DNA / Karachay-Balkar DNA
[5] Family Tree DNA / Ossetian DNA
[6] Family Tree DNA / Chechen-Noahcho DNA
[7] Мисост Кучукович Абаев. Исторический очерк. БАЛКАРИЯ. 6 февраля 1911 г. Журнал "Мусульманин",1911 г., Париж №№ 14-17, стр. 586-627. Источник: издание 1992 года, г. Нальчик, "Эльбрус".
[8] Adamov et al., Defining a New Rate Constant for Y-Chromosome SNPs based on Full Sequencing Data, The Russian Journal of Genetic Genealogy (Русскаяверсия), Vol 6, No 2 (2014)/Vol 7, No 1 (2015), pp. 68-89.
[9] Allentoft et al., 2015. Population genomics of Bronze Age Eurasia. Nature 522, 167–172 (11 June 2015), doi:10.1038/nature14507
[10] Сборник фамильных преданий Осетиии / Будтуевы
[11] Леча Ильясов. Нохчимохк – самая восточная область Чечни.
[12] Adamov et al., Defining a New Rate Constant for Y-Chromosome SNPs based on Full Sequencing Data, The Russian Journal of Genetic Genealogy (Русскаяверсия), Vol 6, No 2 (2014)/Vol 7, No 1 (2015), pp. 68-89.