GC-состав (гуанин-цитозиновый состав, ГЦ-состав)[1] — доля гуанина (G) и цитозина (C) среди всех остатков нуклеотидов рассматриваемой нуклеотидной последовательности. GC-состав может быть определён как для фрагмента молекулы ДНК или РНК, так и для всей молекулы или даже всего генома.
Пара GC соединена тремя водородными связями, тогда как пара AT (аденин — тимин) — двумя. Поэтому ДНК с высоким содержанием GC более устойчива к денатурации в растворе, чем ДНК с низким. Кроме водородных связей, на стабильность вторичной структуры ДНК и РНК влияют гидрофобные или стэкинг-взаимодействия между соседними нуклеотидами, не зависящие от последовательности оснований нуклеиновых кислот[2][3].
При проведении ПЦР GC-состав праймера используется для предсказания температуры плавления этого праймера и температуры отжига. Высокий GC-состав праймера позволяет использовать его при высоких температурах отжига.
Вычисление GC-состава
GC-состав обычно представляется в процентном отношение (доля G+C или доля GC) для одной из цепи ДНК или РНК. Процентный GC-состав вычисляется как[4]
где — суммарное количество гуанинов и цитозинов, а — длина цепи ДНК или РНК в нуклеотидах:
.
можно также представить в виде вырожденного кода как , тогда
Сравнения смещений в нуклеотидном составе для рамки в 2000 нуклеотидов.
Сравнения смещений в нуклеотидном составе для рамки в 100 нуклеотидов.
Вычисление смещений в нуклеотидном составе
GC-состав является частным случаем отклонений[прояснить] (англ.skew) в нуклеотидной последовательности тех или иных нуклеотидных оснований или групп оснований.
Например, отклонение по отношению пуринов (суммы всех гуанинов и аденинов) к длине цепи ДНК или РНК в нуклеотидах (доля G+A или доля GA) можно вычислить в процентном отношении [5]:
где — суммарное количество гуанинов и аденинов, а — длина цепи ДНК или РНК в нуклеотидах:
.
можно также представить в виде вырожденного кода как , тогда
где есть сумма всех цитозинов и тиминов, тогда как есть длина цепи ДНК или РНК в нуклеотидах.
Отклонение по отношению суммы всех гуанинов к сумме всех цитозинов или наоборот (сдвиг по отношению суммы всех цитозинов к сумме всех гуанинов):
Данная величина — GC skew — может быть положительной (если количество гуанина выше количества цитозина), отрицательной (в противном случае) или равна 0 (когда количество гуанина и цитозина одинаково).
Аналогично можно вычислить отклонение по отношению суммы всех аденинов к тиминам или наоборот (суммы всех тиминов к аденинам):
Данная величина — AT skew — будет положительным, если количество аденина выше количества тимина, отрицательным в противном случае, или равна 0, когда суммы аденинов A и тимина T равны.
↑ Madigan, M.T. and Martinko J.M.Brock biology of microorganisms.— 10th.— Pearson-Prentice Hall, 2003.— ISBN 84-205-3679-2.
↑ Maxim I. Pyatkov and Anton N. Pankratov.SBARS: fast creation of dotplots for DNA sequences on different scales using GA-,GC-content// Bioinformatics: 30.— 2014.— № 12.— С. 1765-1766.— DOI:10.1093/bioinformatics/btu095.
Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.
2019-2025 WikiSort.ru - проект по пересортировке и дополнению контента Википедии