ДНК тесты и генеалогия

Модератор: MCB

Ответить
Сообщение
Автор
Аватара пользователя
avramenko
Сообщения: 195
Зарегистрирован: 10.08.2009
Откуда: Литва, Голландия
Поблагодарили: 16 раз
Контактная информация:

ДНК тесты и генеалогия

#961 avramenko » 30 сен 2009, 00:14

MOCKBA: Тема переживает взрывное развитие - половина новых страниц всего за один год из почти десятилетней истории темы. Тут и технические советы и вопросы, и рассказы об удачах или удивительных открытиях, и обсуждение распродаж ... Поскольку ориентироваться в такой многостраничной ветке стало трудно, я собрал самые важные ссылки в первое сообщение и прикрепил его.

Общая информация о хромосомах, наследовании, и переменчивости ДНК (2009)
Про три типа тестов: аутосомный, Y-хромосомы и ДНК митохондрий (мтДНК) (2010); Подробнее про те же три типа анализов, со ссылками (2012)

Полезные ссылки: какая часть генома наследуется при разных степенях фактического родства (в среднем, а не у ашкеназов)
http://www.isogg.org/wiki/Autosomal_DNA_statistics ; http://dna-explained.com/2013/09/29/why ... my-cousin/
и насколько больше совпадений бывает между ашкеназами

Как меняется с дальностью родства длина совпадающих сегментов (2017)
Как работает "раскраска хромосом" по этническому происхождению ДНК (2017), ( + 2020), почему народы России оказываются за пределами списков этнических ДНК в результатах анализов (2017) и как усовершенствования техники анализа все-таки позволяют "поставить страны Восточной Европы" на карту этнического состава хромосом (2018)

+ Исследования исторической генетики евреев (тема эта развивается быстро с развитием технологий и с ростом охвата населения генетической генеалогией, так что самые старые источники могут оказаться менее точными)
"Впервые сопоставив полные геномы евреев из общин разных стран, ученые установили единство их происхождения, точные сроки, когда эти группы разошлись, и географию их древних миграций." (2014)
Из какого генетического теста сделаны собственно ашкеназы (2018) (+2019) (+2020 )
Насколько схожи другие еврейские народы с ашкеназами и друг с другом (2020)
и более узко-технически: что происходит в ДНК, если праотцы-мигранты берут праматерей из местных (2017)

Аватара пользователя
MCB
Сообщения: 5974
Зарегистрирован: 23.01.2016
Откуда: Америка
Благодарил (а): 2026 раз
Поблагодарили: 2336 раз

ДНК тесты и генеалогия

#962 MCB » 04 май 2019, 06:24

borber писал(а):
04 май 2019, 01:38
Коллеги, зказывал ли кто-нибудь у Dante Labs? Я заказал для нескольких членов семьи, когда у них были скидки, сейчас получил результаты - форматы FASTQ, BAM и VCF. И теперь тупо не могу сообразить, что с этим дальше делать? Гда там искать и где смотреть этнические части, что куда конвертировать? Заранее крайне благодарен за подсказки...
я заказывал. Можно экстрагировать из VCF только СНИПы фтДНК и загрузить, а можно и самому анализировать в сравнении с референтными геномами
Гоникберг (Могилев-Подольский, Ушицкий уезд, и повсюду), Прусс, Черницкий(Городок Витебской), Пальман (Витебск), Богин, Рудерман (Минск), Лапицкий (Копысь, Киев)

borber
Сообщения: 109
Зарегистрирован: 18.11.2017
Откуда: Питер; Аризона
Благодарил (а): 69 раз
Поблагодарили: 40 раз

ДНК тесты и генеалогия

#963 borber » 04 май 2019, 20:30

MOCKBA писал(а):
04 май 2019, 06:24
borber писал(а):
04 май 2019, 01:38
Коллеги, зказывал ли кто-нибудь у Dante Labs? Я заказал для нескольких членов семьи, когда у них были скидки, сейчас получил результаты - форматы FASTQ, BAM и VCF. И теперь тупо не могу сообразить, что с этим дальше делать? Гда там искать и где смотреть этнические части, что куда конвертировать? Заранее крайне благодарен за подсказки...
я заказывал. Можно экстрагировать из VCF только СНИПы фтДНК и загрузить, а можно и самому анализировать в сравнении с референтными геномами
Я прошу прощения, но можно ли чуть подробнее? Как экстрагировать, куда загрузить? Вот скачал я два архива на комп- что дальше? Есть ли где-то инструкция, которой может воспользоваться чайник? На ftdna дают сразу готовый процентный расклад, каким образом можно получить подобный здесь?
Берман, Марон (Свислочь Осиповичский р-н; Глузск), Кацман (Копани, Чаусский р-н), Виткин (Дрануха Чаусский р-н), Харсон (дер.Пичевка Чаусского уезда, она же колония Анненгоф; Бобр), Гурвич, Ерусалимчик(Бобр), Шабашов (Полоцк), Рекант (дер. Шулятино Полоцкого уезда), Эпштейн (гХолм, Новгородской обл., Пустошка Псковской обл.)

Аватара пользователя
MCB
Сообщения: 5974
Зарегистрирован: 23.01.2016
Откуда: Америка
Благодарил (а): 2026 раз
Поблагодарили: 2336 раз

ДНК тесты и генеалогия

#964 MCB » 05 май 2019, 01:29

borber писал(а):
04 май 2019, 20:30
чайник
смотря насколько чайник. VCF file это просто tab delimited table. Программы типа ADMIXTURE, rarecoals, референтные данные с тысячи геномов, с эстонского биоцентра все лежат в открытую.

Но Данте предлагает и услуги типа этнического состава и для чайников попроще. Для этого следует использовать сайт их партнера sequencing.com.

С моей-то колокольни Данте даже на распродаже дороговато, чтобы использовать ее только в режиме чайника. Если у вас несколько членов семьи, то это чистое золото, по моему. Различить по этим данным истинные и ложные совпадения, например. Или если у кого-то найдется редкая, но не исключительно редкая у ашкеназов сибирско- азиатская ДНК, то посмотреть, что это за народ такое дал в наследие. Мне исключительно интересно
Гоникберг (Могилев-Подольский, Ушицкий уезд, и повсюду), Прусс, Черницкий(Городок Витебской), Пальман (Витебск), Богин, Рудерман (Минск), Лапицкий (Копысь, Киев)

Chitakh
Сообщения: 8
Зарегистрирован: 31.07.2017

ДНК тесты и генеалогия

#965 Chitakh » 05 май 2019, 11:08

Приветствую! Хочу поделиться интересным наблюдением. Протестировал почти всю свою семью на Myheritage. Первой была бабушка по маме - 5,5 ашкеназов. Затем были мама - 4,9 ашкеназов, родной брат - 4,8, я - 4,2%! Думаю, как же так? Почему у нас братом почти не отличается от мамы? А недавно получил результаты двоюродной сестры по отцу - 1,8% ашкеназов :) Вот так сюрприз! Теперь жду результаты ее отца и моей бабушки по отцовской линии.

Аватара пользователя
MCB
Сообщения: 5974
Зарегистрирован: 23.01.2016
Откуда: Америка
Благодарил (а): 2026 раз
Поблагодарили: 2336 раз

ДНК тесты и генеалогия

#966 MCB » 06 май 2019, 20:22

Chitakh писал(а):
05 май 2019, 11:08
Приветствую! Хочу поделиться интересным наблюдением. Протестировал почти всю свою семью на Myheritage. Первой была бабушка по маме - 5,5 ашкеназов. Затем были мама - 4,9 ашкеназов, родной брат - 4,8, я - 4,2%! Думаю, как же так? Почему у нас братом почти не отличается от мамы? А недавно получил результаты двоюродной сестры по отцу - 1,8% ашкеназов :) Вот так сюрприз! Теперь жду результаты ее отца и моей бабушки по отцовской линии.
Хотя они и сообщают результаты до одной десятой процента, но точность этих цифр совсем не такая высокая. Они сообщают, какая комбинация ДНК из референтных групп лучше описывает вашу, но в каждой группе ведь люди неодинаковые, а некоторые группы между собой весьма сходны. Это типа как если бы определяли, какой в окраске вашей машины процент желтого и оранжего, сравнивая с референтными группами объектов желтого и оранжевого цвета, которые различались бы по оттенками внутри каждой группы. Если ваша машина реально желтая, так это четко определится, что почти вся краска была желтая, хотя не скажешь с уверенностью, не подмешана ли была еще и оранжевая в малой доле, особенно учитывая, что эталона цвета у нас под рукой нет, а есть набор объектов со схожими, не совсем одинаковыми цветами. А если, допустим, цвета хаки - так и вообще не определить по оттенкам, подмешано ли там несколько процентов желтого или оранжевого...

Генетические данные точнее, чем спектральная шкала, но в конечном счете проблемы те же. Чистого ашкеназа от сефарда или грека отличить получается без труда. Полукровки тоже, как правило, "разбираются на компоненты". Но на уровне процентов 10 или меньше анализ MyHeritage становится ненадежным, и "близкие оттенки" путает безбожно. Вам с вашими греческими предками не резон удивляться, что у разных предков "определяется" маленький процент ашкеназской ДНК, и что цифры скачут вверх и вних безо всякой логики. Хотите поточнее результат для малых процентов - так пользуйтесь анализами лабораторий с более точными алгоритмами (23andMe, Ancestry).
Гоникберг (Могилев-Подольский, Ушицкий уезд, и повсюду), Прусс, Черницкий(Городок Витебской), Пальман (Витебск), Богин, Рудерман (Минск), Лапицкий (Копысь, Киев)

Chitakh
Сообщения: 8
Зарегистрирован: 31.07.2017

ДНК тесты и генеалогия

#967 Chitakh » 07 май 2019, 11:52

MOCKBA писал(а):
06 май 2019, 20:22
Но на уровне процентов 10 или меньше анализ MyHeritage становится ненадежным, и "близкие оттенки" путает безбожно.
У меня пока претензий к точности нет. Я знал, что прапрабабушка моей бабушки была крещеной еврейкой и у бабушки 5,5% нашли. Теперь подожду результаты дяди и бабушки по отцу. У кого-то из них-то точно будет больше, чем 2%. Мне это очень интересно, как исследователю генеалогии своей семьи. По отцу я о еврейских предках ничего не знаю. Хотя линия бабушки по отцу изучена меньше всех.

Никита 23
Сообщения: 29
Зарегистрирован: 14.12.2017
Откуда: Украина
Благодарил (а): 9 раз

ДНК тесты и генеалогия

#968 Никита 23 » 10 май 2019, 13:05

Здравствуйте!

Сделал тест на ФМТДНА своему дяде. Загружаю его резульаты на Май Херитэйж и там пишут, что такой формат у них не поддерживается. Хотя я загружаю именно тот файл который указан для загрузки на МХеритэж. Кто то сталкивался с такой проблемой? Спасибо!

И еще вопрос, тест пробыл в лаборатории 12 дней и прислали ответ, хотя заявлено было ждать ответа около месяца.
В ответе теста показывает 100% европа: 4% Скандинавии, 96% Восток европы.
Нормальный ли это срок для ответа, как по вашему? Потому что вызывает подозрение быстрота ответа и его обобщенность. Ожидали более подробного разложения происхождения по национальностям или может не стоило и ожидать?

Спасибо!
Голдин, Гольдин - Знаменка, Украина. Покровск, Украина.
Федюшин - Знаменка, Украина. Покровск, Украина.

recutita
Сообщения: 540
Зарегистрирован: 22.11.2011
Откуда: Нижний Тагил
Благодарил (а): 49 раз
Поблагодарили: 222 раза

ДНК тесты и генеалогия

#969 recutita » 10 май 2019, 14:28

Мне myheritage тоже так написали, а потом через какое-то время пришло сообщение, что файлы загружены. Подождиье просто

Аватара пользователя
MCB
Сообщения: 5974
Зарегистрирован: 23.01.2016
Откуда: Америка
Благодарил (а): 2026 раз
Поблагодарили: 2336 раз

ДНК тесты и генеалогия

#970 MCB » 10 май 2019, 16:17

Никита 23 писал(а):
10 май 2019, 13:05
В ответе теста показывает 100% европа: 4% Скандинавии, 96% Восток европы.
Нормальный ли это срок для ответа, как по вашему? Потому что вызывает подозрение быстрота ответа и его обобщенность. Ожидали более подробного разложения происхождения по национальностям или может не стоило и ожидать?
Точность и скорость правильные. Почему анализ не может различить славянские народы (или назвать многие другие народы региона), мы уж тут писали. В двух словах, слишком много сходств, слишком мало референтных образцов. Но с уверенностью можно сказать, что у вас нет предков евреев, как и нет предков с Севера России и Среднего Поволжья (а то проявились бы финские и азиатские компоненты). Но могут быть поляки, литовцы, словаки, венгры, а не только одни восточные славяне.

Если в посмотрите в сопутствующие тему-инструкцию, то обратите внимание, что подтвердить отсутствие еврейских предков можно и по спектру совпаденцев. Какие у вас самые распространенные фамилии совпаденцев и в каком числе? Сколько вообще совпаденцев, и какой уровень совпадений на 1-й странице списка?

А насчет закгрузки на майхеритидж ... по большому счету это уже излишне, и так все видно. Но проверьте, какую из трех кнопок скачивания данных вы нажали (должно быть Concatenated).
Гоникберг (Могилев-Подольский, Ушицкий уезд, и повсюду), Прусс, Черницкий(Городок Витебской), Пальман (Витебск), Богин, Рудерман (Минск), Лапицкий (Копысь, Киев)

Никита 23
Сообщения: 29
Зарегистрирован: 14.12.2017
Откуда: Украина
Благодарил (а): 9 раз

ДНК тесты и генеалогия

#971 Никита 23 » 10 май 2019, 18:54

MOCKBA,

Всего: 1098 Совпадений

По фамилиям: 7 Miller 6 Smith 4 Davies

Shared centimograms 108 - с одним человеком
Longest block 21 - с другим
Голдин, Гольдин - Знаменка, Украина. Покровск, Украина.

Федюшин - Знаменка, Украина. Покровск, Украина.

Аватара пользователя
MCB
Сообщения: 5974
Зарегистрирован: 23.01.2016
Откуда: Америка
Благодарил (а): 2026 раз
Поблагодарили: 2336 раз

ДНК тесты и генеалогия

#972 MCB » 10 май 2019, 22:11

Никита 23 писал(а):
10 май 2019, 18:54
MOCKBA,

Всего: 1098 Совпадений

По фамилиям: 7 Miller 6 Smith 4 Davies

Shared centimograms 108 - с одним человеком
Longest block 21 - с другим
нет, и по этому не дотягивает до еврейских прабабушек. Должно быть ближе к 2000 совпадений, включая десятки Коэнов и Кацев. Но я могу вас поздравить. Со 108 сМ это родственники.
Гоникберг (Могилев-Подольский, Ушицкий уезд, и повсюду), Прусс, Черницкий(Городок Витебской), Пальман (Витебск), Богин, Рудерман (Минск), Лапицкий (Копысь, Киев)

Никита 23
Сообщения: 29
Зарегистрирован: 14.12.2017
Откуда: Украина
Благодарил (а): 9 раз

ДНК тесты и генеалогия

#973 Никита 23 » 13 май 2019, 23:44

MOCKBA, ок. Спасибо за ваши разьяснения! Интересно то, что когда я загрузил данные на гед матч, то по совпаденцам, клацая на вторую фамилию в списке, открывается такая же страница и там 1е фамилии все еврейские.
На ФТДНА, тоже встречаются еврейские фамилии в совпаденцах.
Голдин, Гольдин - Знаменка, Украина. Покровск, Украина.

Федюшин - Знаменка, Украина. Покровск, Украина.

Аватара пользователя
MCB
Сообщения: 5974
Зарегистрирован: 23.01.2016
Откуда: Америка
Благодарил (а): 2026 раз
Поблагодарили: 2336 раз

ДНК тесты и генеалогия

#974 MCB » 15 май 2019, 02:33

Никита 23 писал(а):
13 май 2019, 23:44
Интересно то, что когда я загрузил данные на гед матч, то по совпаденцам, клацая на вторую фамилию в списке, открывается такая же страница и там 1е фамилии все еврейские
Конечно, евреи будут встречаться в совпаденцах даже у тех, кто более или менее полностью славянин по ДНК, ведь у евреев-ашкеназов до четверти славянско-восточноевропейской ДНК. Только эта компонента пришла давно, с тех пор довольно тщательно размешалась, поэтому сильных совпадений и длинных сегментов ожидать не приходится. Но, поскольку свою ДНК уже протестировали в международных лабораториях гораздо большее число евреев, чем славян, то совпадений все-таки будет довольно много. Но не десятки тысяч и не по сотне и более сМ, как у обычных евреев.

Ну а дальше понятно - на любого из таких совпаденцев-евреев щелкни мышкой, и увидишь несметное число еврейских совпадений у него или нее.
Гоникберг (Могилев-Подольский, Ушицкий уезд, и повсюду), Прусс, Черницкий(Городок Витебской), Пальман (Витебск), Богин, Рудерман (Минск), Лапицкий (Копысь, Киев)

Pimenov
Сообщения: 3226
Зарегистрирован: 08.07.2015
Откуда: Санкт-Петербург
Благодарил (а): 833 раза
Поблагодарили: 1666 раз
Контактная информация:

ДНК тесты и генеалогия

#975 Pimenov » 17 май 2019, 21:15

Прошу оценить ситуацию без имен и фамилий.

X имеет папу из Гомеля и маму из Невеля-Торопца.
у Х есть совпадение с двоюродными братом и сестрой M и F (с дедушкой из Лудзы, а про бабушку известно только имя, конец 1870-х г.р.)
Для F это бабушка и дедушка по материнской линии, для M --- бабушка и дедушка по отцу.


Совпадение X с F: 10 сегментов суммарной длиной 134сМ, наибольший 43сМ.
Совпадение X с M: 7 сегментов суммарной длины 73сМ, наибольший --- 25сМ.


Мы предполагаем, что совпадение по маме X, учитывая географию и см. ниже.
Дед и бабушка мамы X по материнской линии --- Абрам Бородулин из Торопца (1845 г.р.) и его вторая, про которую ничего неизвестно. Есть информация, что отец мамы X называл свою тещу тетей.
Фотография и имя тещи имеются, больше ничего про ее семью неизвестно.

Все дети Абрама, дожившие до взрослого возраста известны.
У Абрама был сын от первой жены, эмигрировавший в Америку.
Вроде бы он женился на Селии Гальпериной, своей родственнице по матери по матери Нехаме Гальпериной (информация из св-ва о смерти, т.е. ничем не подтвержденная).
Так вот у их внучки совпадение с F:
Largest segment = 31.0 cM

Total Half-Match segments (HIR) = 104.5 cM (2.914 Pct)
Estimated number of generations to MRCA = 3.6

7 shared segments found for this comparison.



у F отец, по-видимому, из Невеля.
Но двоюродный брат M --- племянник его матери.
Мать самого M откуда-то издалека --- с Украины.


------------------------------------------------------------------

Что на основании этих данных можно утверждать?
Можно и давать голову на отсечение, что родство через Абрама Бородулина и его жен.
Следует ли отсюда, что эти жены должны быть близкими родственницами.
Можно ли будет подтвердить родство жен Абрама, если анализ сдаст еще кто-то из его правнуков по первой жене?
Последний раз редактировалось Pimenov 17 май 2019, 22:32, всего редактировалось 1 раз.

Аватара пользователя
MCB
Сообщения: 5974
Зарегистрирован: 23.01.2016
Откуда: Америка
Благодарил (а): 2026 раз
Поблагодарили: 2336 раз

ДНК тесты и генеалогия

#976 MCB » 17 май 2019, 21:35

Pimenov писал(а):
17 май 2019, 21:15
Что на основании этих данных можно утверждать?
По-моему, подтвердить с уверенностью будет сложно. Совпадения достаточно маленькие, и для евреев, у которых есть предки из одного региона типа Невеля, где все со всеми могли быть в множественном родстве - неудивительные. По каждой из предполагаемых линий родство может быть заметно дальше, чем кажется. Пока хоть 200-300 сМ не достигнуто, уверенности, что родство действительно близкое, трудно достигнуть, даже если есть совпадения сразу между несколькими родственниками на двух сторонах.
Гоникберг (Могилев-Подольский, Ушицкий уезд, и повсюду), Прусс, Черницкий(Городок Витебской), Пальман (Витебск), Богин, Рудерман (Минск), Лапицкий (Копысь, Киев)

Pimenov
Сообщения: 3226
Зарегистрирован: 08.07.2015
Откуда: Санкт-Петербург
Благодарил (а): 833 раза
Поблагодарили: 1666 раз
Контактная информация:

ДНК тесты и генеалогия

#977 Pimenov » 17 май 2019, 22:46

MOCKBA писал(а):
17 май 2019, 21:35
Пока хоть 200-300 сМ
А обратное можно ли утверждать:
что бабушка F и M не может быть потерянной дочерью Абрама (мне уточнили, что известны лишь 9 из 11 детей Абрама)?

Тогда у родного двоюродного дяди было бы неправдоподобно маленькое совпадение:
длиннейший сегмент 25cM?

У X с единокровной троюродной сестрой, внучкой эмигрировавшего сына Абрама совпадение 49сМ наидлиннейший сегмент и 253сМ сумма.
Имеет ли смысл детальнее, похромосомно анализировать совпадения на gedmatch?

Аватара пользователя
MCB
Сообщения: 5974
Зарегистрирован: 23.01.2016
Откуда: Америка
Благодарил (а): 2026 раз
Поблагодарили: 2336 раз

ДНК тесты и генеалогия

#978 MCB » 17 май 2019, 23:12

Pimenov писал(а):
17 май 2019, 22:46
обратное можно ли утверждать:
что бабушка F и M не может быть потерянной дочерью Абрама
Если предположить, что Абрам прадед Ф & М, и дед Х, то родство между ними - 1C1R (ну да, двоюрдный дядя) и ожидаемый диапазон совпадений от 140 сМ и выше. Оба совпадения за пределами ожидаемого диапазона, так что отметаем гипотезу. Средняя длина общего фрагмента для 1C1R - 20 сМ, не так ли? (Цепочка в пять человек -> 100/5 = 20 ) Так что по длинам фрагментов не отмести гипотезу, но по общей степени совпадения - можно. Вообще, как я не устаю повторять, скорее всего родство дальше, чем кажется по "умеренным сентиморганам совпадений". Никак не ближе.

Half 2C (с единокровной троюродной сестрой) ожидаемый диапазон совпадений 9-400 сМ. Средний размер общего фрагмента тоже 20 сМ. Так что совпадение в той семье соответствует ожидаемому для такого родства.
Гоникберг (Могилев-Подольский, Ушицкий уезд, и повсюду), Прусс, Черницкий(Городок Витебской), Пальман (Витебск), Богин, Рудерман (Минск), Лапицкий (Копысь, Киев)

Аватара пользователя
MCB
Сообщения: 5974
Зарегистрирован: 23.01.2016
Откуда: Америка
Благодарил (а): 2026 раз
Поблагодарили: 2336 раз

ДНК тесты и генеалогия

#979 MCB » 20 май 2019, 17:55

MOCKBA писал(а):
04 май 2019, 06:24
borber писал(а):
04 май 2019, 01:38
Коллеги, зказывал ли кто-нибудь у Dante Labs? Я заказал для нескольких членов семьи, когда у них были скидки, сейчас получил результаты - форматы FASTQ, BAM и VCF. И теперь тупо не могу сообразить, что с этим дальше делать? Гда там искать и где смотреть этнические части, что куда конвертировать? Заранее крайне благодарен за подсказки...
я заказывал. Можно экстрагировать из VCF только СНИПы фтДНК и загрузить, а можно и самому анализировать в сравнении с референтными геномами
Научился конвертировать VCF файл от Данте в формат familytreeDNA CSV. Трудностей оказалось несколько больше, чем я ожидал ("перевернутые СНИПы" some SNPs are flipped - more in older CSV files, fewer in the more recent ones; полинуклеотидные и трехаллельные варианты - familytreeDNA pretends that all the SNPs are biallelic and literally single-nucleotide; и странные СНИПы в конце файла, изображающие из себя Х-хромосому, но на самом деле располагающиеся на Y-хромосоме, однако дающие слабый сигнал и со схожего участка на Х-хромосоме, что позволяет приблизительно понять, от мужчины ли ДНК или от женщины).

В результате мои CSV файлы - исходный от анализа на familytreeDNA и конвертированный из Dante labs VCF file - отличались примерно по 1% позиций! Причем больше всего очень сильных различий, когда Данте утверждает, что оба аллеля wildtype, а familytreeDNA - что оба аллеля нестандартные. Кто прав? (Почти не было сомнений, что лажает чип familytreeDNA , а секвенирование генома дает правильный результат, но ... если familytreeDNA лажает систематически, из раза в раз, то не окажется ли, что исправив эти ошибки в одном из файлов, мы испортим совпадения с другими, по-прежнему заблуждающимися данными наших совпаденцев?)

Но вот, наконец, пришел результат бесплатной загрузки на MyHeritage. И в первом приближении и этнический состав, и совпадения стали немного лучше по сравнению с исходными данными familytreeDNA, указывая, что не все ошибки чипа - систематические.

Все совпадения с известными ближними родственниками сохранились, причем некоторые прибавили десяток-полтора сентиморганов. В этническом составе главные "не стандартно-европейские компоненты" - ашкеназские, сефардские, среднеазиатские - сохранились с точностью до процента (напомню, что я не утверждаю, что эти малые проценты сефардов и т.п. родственных ашкеназам народов описывают что-либо реальное, а просто я рад, что алгоритм воспроизвелся весьма точно). Зато появился еще один "экзотический компонент", который должен там быть и по моей семейной истории, и по данным других лабораторий - "финны".

PS. Файл от Данте они сами советуют грузить на sequencing.com , чтобы за 10 кровных баксов определить этнические компоненты. Не делайте этого, они не умеют это определять
У вас нет необходимых прав для просмотра вложений в этом сообщении.
Гоникберг (Могилев-Подольский, Ушицкий уезд, и повсюду), Прусс, Черницкий(Городок Витебской), Пальман (Витебск), Богин, Рудерман (Минск), Лапицкий (Копысь, Киев)

borber
Сообщения: 109
Зарегистрирован: 18.11.2017
Откуда: Питер; Аризона
Благодарил (а): 69 раз
Поблагодарили: 40 раз

ДНК тесты и генеалогия

#980 borber » 21 май 2019, 00:55

MOCKBA писал(а):
20 май 2019, 17:55
MOCKBA писал(а):
04 май 2019, 06:24
я заказывал. Можно экстрагировать из VCF только СНИПы фтДНК и загрузить, а можно и самому анализировать в сравнении с референтными геномами
Научился конвертировать VCF файл от Данте в формат familytreeDNA CSV. Трудностей оказалось несколько больше, чем я ожидал ("перевернутые СНИПы" some SNPs are flipped - more in older CSV files, fewer in the more recent ones; полинуклеотидные и трехаллельные варианты - familytreeDNA pretends that all the SNPs are biallelic and literally single-nucleotide; и странные СНИПы в конце файла, изображающие из себя Х-хромосому, но на самом деле располагающиеся на Y-хромосоме, однако дающие слабый сигнал и со схожего участка на Х-хромосоме, что позволяет приблизительно понять, от мужчины ли ДНК или от женщины).

В результате мои CSV файлы - исходный от анализа на familytreeDNA и конвертированный из Dante labs VCF file - отличались примерно по 1% позиций! Причем больше всего очень сильных различий, когда Данте утверждает, что оба аллеля wildtype, а familytreeDNA - что оба аллеля нестандартные. Кто прав? (Почти не было сомнений, что лажает чип familytreeDNA , а секвенирование генома дает правильный результат, но ... если familytreeDNA лажает систематически, из раза в раз, то не окажется ли, что исправив эти ошибки в одном из файлов, мы испортим совпадения с другими, по-прежнему заблуждающимися данными наших совпаденцев?)

Но вот, наконец, пришел результат бесплатной загрузки на MyHeritage. И в первом приближении и этнический состав, и совпадения стали немного лучше по сравнению с исходными данными familytreeDNA, указывая, что не все ошибки чипа - систематические.

Все совпадения с известными ближними родственниками сохранились, причем некоторые прибавили десяток-полтора сентиморганов. В этническом составе главные "не стандартно-европейские компоненты" - ашкеназские, сефардские, среднеазиатские - сохранились с точностью до процента (напомню, что я не утверждаю, что эти малые проценты сефардов и т.п. родственных ашкеназам народов описывают что-либо реальное, а просто я рад, что алгоритм воспроизвелся весьма точно). Зато появился еще один "экзотический компонент", который должен там быть и по моей семейной истории, и по данным других лабораторий - "финны".

PS. Файл от Данте они сами советуют грузить на sequencing.com , чтобы за 10 кровных баксов определить этнические компоненты. Не делайте этого, они не умеют это определять
Возьму на себя смелость от имени сотен и тысяч генетически необразованных "чайников", жертв разных лабораторий, заявить, что это классная работа и вообще шаг в нужном направлении. Появится ли в ближайшем будущем общедоступный софт, позволяюший свободно взаимно конвертировать форматы файлов от любых лабораторий? Тогда все разрозненные базы данных станут доступгы независимо от того, где проводился тест, и наступит счастье и снижение цен.
Берман, Марон (Свислочь Осиповичский р-н; Глузск), Кацман (Копани, Чаусский р-н), Виткин (Дрануха Чаусский р-н), Харсон (дер.Пичевка Чаусского уезда, она же колония Анненгоф; Бобр), Гурвич, Ерусалимчик(Бобр), Шабашов (Полоцк), Рекант (дер. Шулятино Полоцкого уезда), Эпштейн (гХолм, Новгородской обл., Пустошка Псковской обл.)

Аватара пользователя
Simona
Сообщения: 2244
Зарегистрирован: 19.02.2011
Откуда: Литва-Израиль
Благодарил (а): 473 раза
Поблагодарили: 438 раз

ДНК тесты и генеалогия

#981 Simona » 04 июн 2019, 23:48

MOCKBA писал(а):
20 май 2019, 17:55
Зато появился еще один "экзотический компонент", который должен там быть и по моей семейной истории, и по данным других лабораторий - "финны".
в моей семье буквально все поголовно оказались немного финнами, конечно на той же MyHeritage. Интересно почему им этот факт ничуть не мешает.

Ответить

Вернуться в «Генетическая генеалогия»