На ежегодной конференции генетиков в Бостоне руководитель лаборатории биомедицинских исследований института Уайтхеда при Массачусетском технологическом институте Янив Эрлих выступил с сообщением о том, что ему и его коллегам за несколько лет удалось выстроить самое большое в истории генеалогическое древо. Это древо берет свое начало в XV столетии и объединяет 13 миллионов человек, как давно умерших, так и ныне живущих.
Для того, чтобы создать это древо, Эрлих и его сотрудники использовали личные данные более чем 43 миллионов человек, сведения о которых были получены из публичных профилей пользователей генеалогических сайтов. Эти профили в общем виде содержат такие сведения, как даты рождения и смерти, места жительства. Используя специальные компьютерные алгоритмы, исследователи систематизировали эту информацию, а затем преобразовывали ее в итоговые количественные показатели. С целью защиты личных данных имена и фамилии владельцев профилей были исключены из исходных данных.
Смысл исследования заключался, конечно, не в том, чтобы нарисовать сложную и красивую картинку, а чтобы попытаться показать связь генетики с наследственными (родовыми) чертами, присущими тем или иным людям и группам людей. По мнению специалистов, родословные древа могут также нести информацию о демографии, миграциях различных групп населения и, возможно, расширят знания в сфере медицины. Например, благодаря родословным можно проследить изменение частоты какого-либо биологического признака представителей данной семьи и понять, в какой степени этот признак зависит от генетики. Изучая генеалогию, можно также понять, контролируется ли тот или иной признак несколькими ключевыми генами, или же, напротив, большим числом генов, каждый из которых сам по себе играет незначительную роль.
Пока не совсем ясно, как наука может использовать результаты исследования Эрлиха. Специалисты отмечают, что, несмотря на его безусловную значимость, при работе с генеалогическими данными нужно соблюдать осторожность: «изучая гигантские родословные, лучше не доверять им после определенной даты». Данные до 1500 года уже вызывают у исследователей недоверие. Кроме того, вызывает нарекания методика исследования с использованием личных данных граждан без их на то согласия. Сам Эрлих опубликовал недавно статью в журнале Science, где рассказывает о том, как ему удалось выявить конкретных лиц среди анонимных данных ДНК, имеющихся в открытом доступе. Между тем создание подобного рода масштабных баз данных становится все более спорной темой. Согласно результатам опроса, проведенного журналом Economist, около 40% населения высказывают обеспокоенность по поводу использования ДНК законопослушных граждан для каких-либо целей без постановки об этом в известность владельцев.