Версия для печати

Гаплогруппа Q на Северном Кавказе

(по данным полного секвенирования Y хромосомы)

Гурьянов Владимир

Наличие гаплогруппы Q в северокавказских популяциях давно зафиксировано в ряде исследований. Так, в статье Balanovsky et al., 2011[1] была опубликована выборка из 1525 образцов, собранных в Чечне, Ингушетии, Дагестане, Северной Осетии и Карачаево-Черкесии, а также на территории Абхазии.

Из указанной выборки к гаплогруппе Q было отнесены 21 образец, в том числе: аварец (DAG-511), кайтаг (DAG06-894), 11 чеченцев (CHECH107a, CHECH-051, CHECH-110a, CHECH-121a, Chech-1238, Chech-1248, Chech-1262, ING-1084, Chech-1232, Chech-1234, Chech-1265), черкес (KCHE-1483), 5 осетин-дигорцев (OSE-042, OSE-582, OSE-594, OSE-591, OSE-016), 2 осетин-иронцев (OSE-469, OSE-146). При этом все образцы были типированы по SNP маркеру (снипу) M242 и отнесены к гаплогруппе Q без детализации по субкладам. Также, в силу специфики сбора генетического материала, в указанной статье отсутствовала информация о самоидентификации доноров на субэтническом уровне (принадлежность к роду, исторически сложившемуся объединению родов).

В качестве еще одного источника данных о гаплогруппе Q среди северокавказских популяций можно также рассматривать диссертационную работу З.И. Боготовой «Изучение генетической структуры популяций кабардинцев и балкарцев»[2], опубликованную в 2009 году. В ней по выборке балкарцев (n=136) определена частота распространения гаплогруппы Q в этой популяции – 3,7%. При этом принадлежность образцов к конкретным субкладам гаплогруппы Q также не производилась. В статьей Джаубермезов и др., 2017[3] вопрос о гаплогруппе Q также не был в фокусе внимания исследователей, хотя авторы зафиксировали ряд интересных обстоятельств: галогруппа Q, «не обнаружена у карачаевцев, среди балкарцев частота распространения Q-M242 (xM120) составляет 6.8%»; «с высокой долей она встречается в восточных субпопуляциях балкарцев: безенгиевцев (13.2%) и малкарцев (7.4%)».

Наше исследование, не претендуя на полноту (в частности, мы сознательно отказались от оценки частоты распространения субклады в популяции и от обзора ситуации по адыгам и народам Дагестана), ставит своей целью введение в научный оборот данных, полученных в ходе полного секвенирования Y хромосомы с применением технологии секвенирования нового поколения (NGS), проводенном на секвенаторе Illumina HiSeq2000 с покрытием 50-80х. Эти данные были дополнены гаплотипами по STR-маркёрам Y-хромосомы.

Исследование охватывало данные участников Карачаево-Балкарского ДНК-проекта[4], Осетинского ДНК-проекта[5] и Чеченского ДНК-проекта[6], которые начав с реализации на платформе FamilyTreeDNA (компании, предоставляющей услуги по генетическому тестированию и интерпретации результатов тестирования) постепенно переросли этот формат и сейчас представляют собой совокупность информации о генетическом разнообразии этих народов, накопленных на различных информационных ресурсах (данные тестирования в FamilyTreeDNA, YSEQ, 23&Me, группы в Facebook, он-лайн форумы).

Эта информация (Приложение 1) органично дополняет данные научных выборок по указанным популяциям, а нередко содержит более точные сведения о типировании и группировке образцов.

Гаплогруппа Q среди балкарцев.

13 участников Карачаево-Балкарского ДНК-проекта (из 416 человек имеющих данные по тестированию Y-хромосомы) принадлежат к гаплогруппе Q и относятся к одному кластеру, что подтверждается анализом STR и SNP маркеров.

Данные проекта подтверждают закономерности описанные в упомянутой выше статье Джаубермезов и др., 2017: отсутствие гаплогруппы Q у карачаевцев, наибольшая концентрация среди безенгиевцев и малкарцев.

Большая часть из указанных участников проекта относится к басиятам - балкарскому княжескому клану (таубии), который политически объединял балкарские княжеские фамилии, а также имел влияние в соседней Дигории. В число родов басият Балкарии входят Абаевы, Боташевы, Кучуковы, Амирхановы, Биевы, Заниюковы (Женоковы), Жанхотовы, Айдабуловы и Шахановы. Интересна история происхождения «басият». Тут есть несколько версий, но все они перекликаются между собой. Мисост Абаев, потомок басиятов в 1911 году в очерке «Балкария»[7] написал «два брата Басиат и Бадилят прибыли на Кавказ из Венгрии (по другому преданию – из Крыма)». В устном творчестве балкарцев и дигорцев Басият и Бадилят всегда упоминаются как братья, что, впрочем, не нашло подтверждения данными анализа ДНК их потомков. При этом наличие общего предка у балкарских басият, напротив, подтверждается генетическим анализом. При этом сходные гаплотипы выявлены в ряде родов, не принадлежащих к потомкам таубиев (Джубоевы, Рахаеевы, Гороевы, Джапуевы, Созаевы, Тиловы, Мусуковы); объяснение этого обстоятельства потребует дополнительных исследований.

Проведённый анализ данных полного сиквенса Y хромосомы позволил идентифицировать балкарских Q (за исключением семьи Шабатуковых) как принадлежащих к субкладе Q-BZ640 (сначала субклада получила название Q-BZ660, но впоследствии, для обеспечения унифицированного наименования в YFullи FTDNAбыла переименована). Путем сопоставления SNP маркеров в двух образцах, прошедших полное секвенирование Y хромосомы, были определены 30 SNP маркеров (Приложение 2, таблица 2.1), характеризующие эту субкладу, а также выделены приватные SNPмаркеры (Приложение 2, таблица 2.2), перспективные для дальнейших исследований.

Позиционирование Q-BZ640 на филогенетическом древе SNP (снипов) Y-хромосомы.

Расчетный возраст субклады Q-L715, являющейся «материнской» по отношению к Q-BZ640, соответствует интервалу от 4 до 6,1 тысяч лет (доверительный интервал 95%)[8]. Параллельная субклада Q-L713 представлена туркменами (Q-YP1677) и венгерскими секлерами (Q-YP789). К субкладе Q-YP789 также относятся двое протестированных в FTDNAпредставителей польской шляхты и татарин из Южного Зауралья. Причем один из потомков шляхтичей и татарин образовали отдельную субкладу Q-BZ1000 (возраст которой находится в интервале 1150-2600 лет).

Таким образом, субклада Q-L713 представлена среди широкого спектра современных популяций, чей этногенез был связан с Великой Степью.

При этом расхождение с предками этих народов у балкарцев произошло еще в бронзовом веке.

Из образцов палеоДНК, которые могли бы проиллюстрировать этногенез Q-BZ640, можно упомянуть три[9]:

  • образец RISE493 Sabinka II(карасукская культура) 1500-1400 годы до н.э. (бронзовый век), обнаруженный в могильнике Сабинка IIв Бейском районе Республики Хакассия, относится к Q-L715;
  • обнаруженные в могильнике Верх-Уймон (Горный Алтай), отнесенном к гунно-сарматской культуре, сформировавшейся на Алтае к концу III в. до нашей эры, образцы RISE600  Verh-Uimon  (железный век, нет точной датировки) принадлежит к субкладе Q-L713; образец RISE601  Verh-Uimon  (железный век, нет точной датировки) из того же могильника принадлежит к Q-L715.

Ни у одного из этих образцов нет пересечений по снипам с протестированными в наше время людьми (в том числе с балкарцами). Эти субклады либо пресеклись, либо их современные представители еще не найдены. 

Схематически расположение "балкарских Q-BZ640" на филогенетическом дереве можно представить следующим образом:

Q-M242

             
 

Q-L274

           
   

Q-L275

         
   

Q-L472

         
     

Q-L56

       
     

Q-F1096

       
       

Q-F746

     
       

Q-M25

     
         

Q-YP1669

   
         

Q-L712

   
           

Q-YP4385

 
           

Q-L715

 
             

Q-L713

             

Q-BZ640


Более подробно с актуальной схемой филогенетического дерева в части субклады Q-BZ640 можно ознакомиться на сайте YFull.com

Нижнюю границу возраста формирования самого субклада Q-BZ640 мы можем оценить через расчетное время жизни биологического общего предка (ВБОП или TMRCA). Оно находится в интервале от 500 до 1600 лет, что не противоречит легенде об общем прародителе (Басиате).

Что касается Шабатуковых (Malkar, Kosparti), то несмотря на то, что по STR-маркерам они также относятся к ветви Q-M25 (как и основной кластер балкарских Q, о котором написано выше), но они явно находятся за его пределами. Это же подтверждает тестирование одного из Шабатуковых на SNP-маркер L712 (результат отрицательный). Шабатуковы кластеризируются с двумя участниками Грузинского ДНК-проекта (мегрелом c номером в проекте 258940 и сваном с номером в проекте 253673), но по имеющимся данным пока сложно указать на возможное направление миграции (из Балкарии в Сванетию и далее или наоборот).

Что касается еще одного участника Карачаево-Балкарского проекта, принадлежащего к гаплогруппе Q (Берберов), то комплексный анализ по STRи SNP маркерам позволил установить его принадлежность к субкладе Q-L330. Устная традиция этого рода четко указывает на маршрут миграции родоначальника – из Турции через Карачай.

Других ветвей, принадлежащих к гаплогруппе Qсреди балкарцев и карачаевцев на текущий момент не выявлено. Обращает на себя внимание то, что гаплогруппа Q встречается исключительно среди балкарцев и полностью отсутствует у карачаевцев. Таким образом проявляется «эффект основателя», нашедший свое отражение в устной традиции, легенде о басият.

Гаплогруппа Q среди осетин

В Осетинском ДНК-проекте пять участников (Каражев, Будтуев, Кануков, Мирзаев, Дзугаев) по STR-маркерам входят в тот же кластер, что и балкарские Q-BZ640. Из них ни один не имеет подтвержденной хотя бы устной традицией генеалогической связи с басиятами, хотя двоих (Каражева и Будтуева) предание связывает с баделята. По одному преданию Карадза (предок Каражевых) был одним из сыновей Бадела, а по второму - Карадза был зятем Бадела. Таким образом, возможно, что речь шла о родстве через династические браки, подробности которых не дошли до наших времен. При этом устная традиция считает роды Каражевых и Будтуевых родственными (арвадалта), ведущими свое происхождение от одного общего предка[10].

Еще четверо участников Осетинского ДНК-проекта принадлежат к другим субкладам.

Так, Купеев, в настоящее время идентифицируемый как принадлежащий к ветви Q-L53*, близок к чеченской субкладе Q-Y4055, а возможно и принадлежит к ней. Такой вывод можно сделать на основе анализа STRмаркеров.

Цакоев, Хамицаев и Ханикаев, принадлежат к еще одной ветви Q – Q-L940 с характерным значением одного из STR-маркеров (DYS426=11). Причем Ханикаев, благодаря нахождению его образца в YSEQ (ID YSEQ 4723), был исследован наиболее глубоко. Тестирование отдельных SNP маркеров подтвердило положительные результаты по двум – L932 и SK1995 при отрицательном значении для L941. Субклада Q-SK1995 находится под Q-L932 и параллельна Q-F850/L941. К этой ветви принадлежит один араб из ОАЭ, тестировавшийся в FTDNA и два научных образца: HGDP00226 (пуштун из Пакистана) и HGDP00144 (макрани из Пакистана). Эта информация пока не дает нам строить убедительные гипотезы о времени возможного появления Q-SK1995 на Кавказе, но может стать основой для более глубокого изучения генетической истории этих родов.

Что касается упомянутых ранее образцов, гаплотипы которых были опубликованы в статье Balanovsky et al., 2011, то трое дигорских OSE-594, OSE-582, OSE-042 по предикции, основанной на сопоставлении STR-маркеров принадлежат к субкладу Q-BZ640; двое дигорских OSE-591, OSE-016 – к Q-SK1995. Эти выводы полностью соответствуют выявленным нами закономерностями: 3 из 4 осетинских Q-BZ640, протестированных в FTDNAи YSEQ– дигорцы, трое осетинских Q-SK1995, протестированных в этих компаниях – также дигорцы.

Чеченcкие Q.

Чеченцы, принадлежащие к гаплогруппе Q, оказались локализованы в основном в составе тейпов ГIордалой, Энгеной, ЭгIишбатой, Дишний, относящиеся к тукхуму Нохчмахкхой. Нохчимохк[11]является самым поздним по времени основания союзом чеченских тейповых общин (тукхумом). В него вошли чеченские общины, мигрировавшие на восток современной Чечни из Нашах и Чеберлоя.

Хотя неправильным будет утверждать, что гаплогруппа Q, представлена исключительно в этих тейпах. Несмотря на то, что на текущий момент в рамках Чеченского ДНК-проекта генетическое тестирование прошли 509 человек (из них 26 человек имеет гаплогруппу Q), им охвачены далеко не все тейпы и гары. Тем не менее, весь имеющийся в нашем распоряжении массив данных по STR-маркерам подтверждает принадлежность «чеченских Q» к одной субкладе. Из 26 протестированных человек большинство принадлежит к тейпу ГIордалой (Ирбахий гар, Оккхи гар, Iэжи гар, Басхой гар, Песи гар, Хуци гар, Ойбул гар, Бучи гар), трое – к тейпу Энгеной (Беси гар), двое – к тейпу ЭгIишбатой, двое – к тейпу Дишний (Чиркх гар), по одному – к тейпам Мазархой , Шуоной и ХIиндой.

Таким образом, путем сопоставления SNP маркеров в двух образцах, прошедших полное секвенирование Yхромосомы, были определены 10 снипов (Приложение 3, таблица 3.1), характеризующие «чеченскую подветвь» в гаплогруппе Q: Q-Y4055. В этом же приложении указаны приватные снипы, прошедшие критерии проверки качества, и представляющие интерес для дальнейших исследований (таблица 3.2). Только один из 26 чеченцев, принадлежащих к гаплогруппе Q, относится к другой ветви – Q-BZ640 (Микиев, тейп Цикарой).

В результате ветвь определенная путем сопоставления трех чеченских и двух не чеченских образцов по результатам полного секвенирования Y-хромосомы, получила обозначение обозначение Q-YP4004, и оказалась расположенной под ветвью Q-L53, параллельно Q-L54. Отдельная «чеченская подтветвь» расположена ниже, под ветвью Q-YP4000.

Схематически это можно изобразить следующим образом:

Q-M242

               
 

Q-L274

             
   

Q-L275

           
   

Q-L472

           
     

Q-F1096

         
     

Q-L56

         
       

Q-Y2659

       
       

Q-L53

       
         

Q-L54

     
         

Q-YP4004

     
           

Q-YP4000

   
             

Q-YP4055

 
               

Q-YP3952


Более подробно с актуальной схемой филогенетического дерева в части субклады Q-YP4004 можно ознакомиться на сайте YFull.com

Примечание: представленная схема отличается от опубликованной первой версии статьи (в Сборнике статей «Генетическая история народов Евразии» (Труды Евразийского общества генетической генеалогии, выпуск 1, февраль 2016) в связи с формированием новых субклад и переименованием уже выявленных.

Расчет возраста формирования субклады и возраста биологического общего предка (TMRCA) был произведен по методу, изложенному в Adamovetal., 2015[12]. Субклада Q-YP4055 сформировалась около трех тысяч лет назад (доверительный интервал 95%), а возраст общего предка двух протестированных, принадлежащей к «дочерней» субкладе Q-YP3952 составил всего 700 лет (с тем же доверительным интервалом).

На текущий момент субклада Q-YP4055 представлена исключительно чеченцами. Таким образом, субклада Q-YP4055 с высокой вероятностью является автохтонной для Кавказа и ее представители приняли участие в этногенезе чеченского народа на достаточно ранних его этапах.

Что касается, ветвей Q-YP4004 и Q-YP4000, то они представлены соответственно поляком и селькупом. Их ветви отделились от чеченской соответственно 7,6 тысяч и 3 тысячи лет назад (оценка по той же методике). Таким образом, речь идет о миграциях в достаточно широком временном диапазоне (от неолита до энеолита), самая поздняя из которых затронула Кавказ и Центральную Азию.

В настоящее время выявлено значительное количество образцов из Европы и Центральной Азии, имеющих характерное значение SNP-маркеров: L53+ L54-, что дает основание отнести их к Q-YP4004. Детальное изучение этих образцов в перспективе позволит восстановить историю доисторических миграций предков этих людей, которые приняли участие в этногенезе чеченского народа.

Благодарность

Автор выражает отдельную благодарность Пахрудину Арсанову, администратору Чеченского ДНК-проекта; Александру Байматову, ко-администратору Осетинского ДНК-проекта; участникам Карачаево-Балкарского ДНК-проекта, за помощь, оказанную при подготовке и редактировании текста статьи.

Приложение 2.

Таблица 2.1. SNP-маркеры (снипы) субклады Q-BZ640.

Имя SNP

Позиция

Anc

Der

 

Имя SNP

Позиция

Anc

Der

 

Имя SNP

Позиция

Anc

Der

BZ639

6693308

A

G

 

BZ652

16763286

T

A

 

BZ664

22834443

T

C

BZ640

6762428

T

C

 

BZ654

17872766

G

C

 

BZ665

22961466

G

A

BZ641

8183501

C

T

 

BZ655

18030567

A

G

 

BZ667

23554630

A

C

BZ642

8274843

C

A

 

BZ656

18700177

T

C

 

BZ668

23810513

A

G

BZ643

8640117

G

T

 

BZ657

21257196

C

T

 

BZ669

23842578

T

C

BZ644

9090333

T

C

 

BZ658

21332983

T

C

 

BZ670

8721080

T

G

BZ646

13919587

T

C

 

BZ660

21491395

A

T

 

BZ671

9809912

T

G

BZ648

15026112

G

A

 

BZ661

21812868

C

A

 

BZ674

22783853

G

A

BZ649

15452115

G

A

 

BZ662

22096536

G

T

 

BZ675

23491597

C

T

BZ650

15783481

G

A

 

BZ663

22555035

T

C

 

Y21044

21485937

G

A


Таблица 2.2. Образцы I и II(приватные снипы образцов субклады Q-BZ640)

Имя SNP

Позиция

Anc

Der

           

Имя SNP

Позиция

Anc

Der

BZ2914

7190821

G

A

           

BZ647

14262403

T

C

BZ2915

9053774

G

T

           

BZ651

16202156

G

A

BZ2921

14419539

T

G

           

BZ653 

17409576

G

T

BZ2922

22776140

A

G

                   


Приложение 3.

Таблица 3.1. Снипы субклады Q-YP4055 и нижерасположенной субклады Q-YP3952

Имя SNP

Позиция

Anc

Der

Субклада

YP4055

21693787

C

A

Q-YP4055

YP3952

6844645

A

T

Q-YP3952

YP3973

14404427

T

A

Q-YP3952

YP3974

14409292

G

A

Q-YP3952

YP3975

14436284

C

A

Q-YP3952

YP3978

15172292

T

C

Q-YP3952

YP4043

19228059

T

C

Q-YP3952

YP4058

22031664

G

A

Q-YP3952

YP4068

23310025

T

A

Q-YP3952

YP4075

24461451

A

C

Q-YP3952


Таблица 3.2. Приватные снипы трех образцов, относящихся к субкладе Q-YP4055

Имя SNP

Позиция

Anc

Der

Субклада

BZ5193

4872099

C

T

Q-YP4055*

BZ5194

9503978

C

A

Q-YP4055*

BZ5195

9890520

G

C

Q-YP4055*

BZ5196

14339680

C

T

Q-YP4055*

BZ5197

14967286

A

G

Q-YP4055*

BZ5198

15327759

T

C

Q-YP4055*

BZ5199

16992454

A

G

Q-YP4055*

BZ5200

17039830

T

G

Q-YP4055*

BZ5201

17508970

A

G

Q-YP4055*

BZ5202

17940102

G

T

Q-YP4055*

BZ5203

17942115

G

A

Q-YP4055*

BZ5204

18808499

C

T

Q-YP4055*

BZ5205

18834135

C

T

Q-YP4055*

BZ5206

18886883

C

A

Q-YP4055*

BZ5207

19421310

A

G

Q-YP4055*

BZ5208

21114061

T

A

Q-YP4055*

BZ5209

21532815

A

T

Q-YP4055*

BZ5210

23473051

G

A

Q-YP4055*

BZ5211

23575386

A

G

Q-YP4055*

BZ83

8620361

C

T

Q-YP3952* (I)

BZ84/CTS8716

18160939

C

A

Q-YP3952* (I)

BZ85

2652151

G

A

Q-YP3952* (I)

BZ86

6491326

C

A

Q-YP3952* (II)

BZ87

17327595

T

C

Q-YP3952* (II)

BZ88

18193802

C

T

Q-YP3952* (II)

BZ89

21236348

G

T

Q-YP3952* (II)

BZ575

22076990

T

C

Q-YP3952* (II)

BZ576

5443893

A

C

Q-YP3952* (II)

BZ577

6934863

C

A

Q-YP3952* (II)

BZ578

7357227

A

G

Q-YP3952* (II)

BZ579

8056151

C

T

Q-YP3952* (II)


[1]
 Balanovsky et al., Parallel Evolution of Genes and Languages in the Caucasus Region// Mol Biol Evol (2011) doi: 10.1093/molbev/msr126

[2] Боготова Залина Ихсановна. Изучение генетической структуры популяций кабардинцев и балкарцев : диссертация ... кандидата биологических наук : 03.00.15 / Боготова Залина Ихсановна; [Место защиты: Ин-т биохимии и генетики Уфим. науч. центра РАН].- Уфа, 2009.- 130 с.: ил. РГБ ОД, 61 10-3/388

[3] М.А. Джаубермезов и др., Генетическая характеристика балкарцев и карачаевцев по данным об изменчивости Y-хромосомы, 2017, «Генетика», Том 53, 2017 г., № 10, DOI: 10.7868/S0016675817100034

[4] Family Tree DNA / Karachay-Balkar DNA

[5] Family Tree DNA / Ossetian DNA

[6] Family Tree DNA / Chechen-Noahcho DNA

[7] Мисост Кучукович Абаев. Исторический очерк. БАЛКАРИЯ. 6 февраля 1911 г. Журнал "Мусульманин",1911 г., Париж №№ 14-17, стр. 586-627. Источник: издание 1992 года, г. Нальчик, "Эльбрус".

[8] Adamov et al., Defining a New Rate Constant for Y-Chromosome SNPs based on Full Sequencing Data, The Russian Journal of Genetic Genealogy (Русскаяверсия), Vol 6, No 2 (2014)/Vol 7, No 1 (2015), pp. 68-89.

[9] Allentoft et al., 2015. Population genomics of Bronze Age Eurasia. Nature 522, 167–172 (11 June 2015), doi:10.1038/nature14507

[10] Сборник фамильных преданий Осетиии / Будтуевы

[11] Леча Ильясов. Нохчимохк – самая восточная область Чечни.

[12] Adamov et al., Defining a New Rate Constant for Y-Chromosome SNPs based on Full Sequencing Data, The Russian Journal of Genetic Genealogy (Русскаяверсия), Vol 6, No 2 (2014)/Vol 7, No 1 (2015), pp. 68-89.