Эволюционная дистанция — величина, характеризующая генетические различия между двумя организмами. Находится путём сравнения нуклеотидных последовательностей гомологичных генов. Мерой генетических различий считается процент несовпадений нуклеотидов в соответствующих позициях гена[1].
Простейшей величиной, характеризующей эволюционную дистанцию является доля несовпадающих нуклеотидов при попарном сравнении соответствующих позиций в гене. Эта величина называется «попарной дистанцией» (обычно обозначается символом p).
Например, при сравнении следующих двух участков гена
CAGACAGTCA CACACTGCCA
на 10 нуклеотидов приходится три несовпадающих, p = 0,3.
Попарная дистанция недостаточно адекватно описывает эволюционные различия между организмами:
Недостатки попарной дистанции устраняются использованием более сложных формул определения дистанции:
и другие методы.
Метод Джукса-Кантора[2] (англ. Jukes-Cantor Method) представляет собой простейшую попытку исключить из рассмотрения случайные совпадения нуклеотидов, вероятность которых составляет 25 %. Это однопараметрический метод, который в качестве параметра использует долю несовпадающих нуклеотидов (то есть попарную дистанцию p). Дистанция рассчитывается по следующей формуле
Метод предполагает, что все четыре нуклеотида (А, Ц, Т, Г) присутствуют в ДНК в одинаковых пропорциях, а вероятность замены одного нуклеотида на другой одинакова для любой пары нуклеотидов.
Как видно из формулы при p > 0,75 выражение не имеет смысла (отрицательное выражение под знаком логарифма). Это является недостатком метода, так как ситуации с p > 0,75 (более 75 % различающихся нуклеотидов) принципиально не исключены.
Формула была предложена в 1965 году, на заре исследований в области молекулярной биологии преподавателем химического факультета Калифорнийского университета Томасом Джуксом и студентом того же факультета Чарлзом Кантором. В середине 1960-х годов биохимические технологии достигли того уровня, когда стала возможной расшифровка отдельных фрагментов ДНК и аминокислотных последовательностей белков. Это позволило путём сравнения нуклеотидных последовательностей проследить эволюционную близость различных организмов и пути эволюции отдельных видов. Джукс и Кантор входили в число пионеров в деле формализации этого метода, а Кантор стал автором одной из первых компьютерных программ для анализа нуклеотидных последовательностей[3].
В качестве примера применения формулы можно привести фрагменты генов, кодирующих α- и β-гемоглобин человека. Считается, что около 400 млн лет назад оба гена произошли от одного предкового гена[3].
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-гемоглобин) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-гемоглобин)
Сравнение фрагмента обнаруживает 12 различий на 30 нуклеотидов (p = 0,4). Однако простой подсчёт расхождений не учитывает вероятность того, что в некоторых позициях произошли многократные мутации, в том числе приведшие к восстановлению исходного нуклеотида. Формула Джукса-Кантора даёт дистанцию
Таким образом, из формулы следует, что с учётом кратных замен в рассматриваемом фрагменте ДНК произошло 0,572·30=17 мутаций.
Мотоо Кимура предложил метод вычисления дистанции, который получил название «двухпараметрическая дистанция Кимуры» (англ. Kimura 2-parameter distance, K2P). Модель Кимуры предполагает, что различные варианты замены нуклеотидов неравновероятны и рассматривает два типа замен:
Дистанция в модели Кимуры определяется по формуле
где P — доля транзиций, Q — доля трансверсий.
Рассматривая в качестве примера эволюционную дистанцию между фрагментами генов α- и β-гемоглобина, получим:
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-гемоглобин) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-гемоглобин) Q PPQ P QQ QPQ Q Q
В модели Тадзимы — Нея дистанция определяется следующими соотношениями[4]:
где
В качестве примера вычислим дистанцию между фрагментами генов, кодирующих α- и β-гемоглобин человека.
ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-гемоглобин) TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-гемоглобин)
Нуклео- тид | xij | gi | ||
---|---|---|---|---|
A | T | C | ||
A | 10/60 = 0,167 | |||
T | 1/30 = 0,0333 | 13/60 = 0,217 | ||
C | 2/30 = 0,0667 | 3/30 = 0,100 | 15/60 = 0,250 | |
G | 1/30 = 0,0333 | 3/30 = 0,100 | 2/30 = 0,0667 | 22/60 = 0,367 |
В некоторых источниках дистанцией Тадзимы-Нея называется расчёт по более простой формуле
где
Для случая, когда все нуклеотиды встречаются с одинаковой частотой (gi = 0,25), эта формула совпадает с формулой Джукса-Кантора (b = 0,75).
Расчёты по этим формулам дают для того же примера
Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".
Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.
Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .