Секвенирование РНК — определение первичной структуры молекулы РНК. Под этим может подразумеваться как секвенирование мРНК, так и определение последовательности некодирующих РНК. Современное полногеномное секвенирование РНК (RNA-seq) основано на прямом секвенировании фрагментов кДНК[1].
Технологическая платформа для быстрого широкомасштабного секвенирования была создана в 2005 году фирмами 454 Life Sciences[2] и Illumina (ранее Solexa)[3] и сначала использовалась для секвенирования геномов. Первые работы по секвенированию транскриптомов появились в 2008 году. В числе первых, были секвенированы транскриптом дрожжей[4], арабидопсиса[5] и мыши[6].
В настоящее время РНК-секвенирование осуществляется в основном с использованием трех инструментальных платформ широкомасштабного секвенирования: Illumina, 454 Life Sciences и SOLiD[7].
В отличие от другого широкомасштабного метода анализа транскриптома — экспрессионных микрочипов, РНК-секвенирование позволяет получать данные о сплайс-вариантах транскриптов, редактировании, однонуклеотидных полиморфизмах, а также химерных генах. Кроме того, РНК-секвенирование позволяет получить абсолютную количественную информацию о представленности различных транскриптов в пробе, в отличие от относительных количественных данных микрочипов[8][9].
Процесс создания библиотеки сиквенсов может меняться в зависимости от платформы при высокопроизводительном секвенировании,[10] для каждой платформы было разработано несколько типов комплектов для создания различных типов библиотек РНК, адаптирующие полученные последовательности специфическим требованиям их технологий. Однако в связи с природой анализируемого образца, в рамках каждой технологии есть общие черты. Часто при анализе мРНК целью какого-либо воздействия становится поли-А хвост для того, чтобы удостовериться в разделении кодирующей и некодирующей РНК. Это может быть достигнуто простым отжиганием олиго-Т праймера с этой областью. Сейчас с этой целью часто пользуются магнитными бусами.[11][12] Вебсайт «The Protocol Online»[13] предоставляет список нескольких протоколов, относящихся к выделению мРНК.
Исследования, в которых изучались в том числе участки транскриптома помимо поли-а РНК, показали, что при использовании магнитных бус с поли-Т праймерами, проточной (не содержащей поли-А) РНК можно обнаружить гены некодирующей РНК, которые в противном случае остались бы незамеченными.[11] Так как наибольшая часть суммарной РНК клетки приходится на рибосомальную РНК, для исследования транскриптома разработан метод селективного удаления рибосомальной фракции РНК с помощью зондовой гибридизации, после чего для секвенирования остаются матричные и некодирующие РНК.[14][15]
Далее производят обратную транскрипцию. При этом проблему могут представлять как разнородные 5' концы, возникающие при обратном транскрибировании с использованием случайных праймеров, так и вторичные структуры, влияющие на сайты связывания праймеров,[12] гидролиз РНК до 200—300 нуклеотидов помогает решить обе эти проблемы. Однако для этого метода существуют компромиссные решения, при которых основная часть транскрипта эффективно преобразуется в ДНК, а 5'- и 3'-концы в меньшей степени. В зависимости от цели эксперимента, исследователи могут провести или проигнорировать этот шаг.
После синтеза кДНК, её можно фрагментировать для достижения желаемой длины фрагментов.
Далее проводится глубокое секвенирование кДНК с получением множества коротких прочитанных фрагментов («ридов»). Чем больше общее число ридов, тем точнее результаты секвенирования. На заключительном этапе проводится восстановление структуры транскриптов путём сопоставления полученного набора ридов с геном.[6]
Этапы секвенирования и обработки его результатов проводятся с использованием высокотехнологичного оборудования и сложного программного обеспечения.
При секвенировании РНК, отличной от мРНК, процедура создания библиотеки модифицируется. Клеточная РНК выбирается в соответствии с желаемым интервалом длин. Для коротких РНК, таких как миРНК, РНК выделяется путём отбора по длине. Это может быть достигнуто с помощью электрофореза, специальных магнитных бус или коммерчески разработанных комплектов. После выделения, на 3'- и 5'-концы добавляются линкеры и производится очистка. Далее получают кДНК путём обратной транскрипции.
Так как обратная транскрипция РНК с помощью обратной транскриптазы дает большое число ошибок и артефактов, которые могут препятствовать корректному качественному и количественному анализу транскриптов,[16] компанией Helicos была начата разработка технологии мономолекулярного прямого секвенирования РНК (Direct RNA Sequencing, DRSTM). Этот метод предполагает секвенирование РНК массово-параллельным образом, без получения кДНК, лигирования, амплификации и других процедур, которые могут изменить образец.
Для секвенирования нематричных РНК, не содержащих поли А, применяют две стратегии: синтез кДНК с использованием гексамерных праймеров со случайной последовательностью или лигирование РНК-адаптеров с последующим синтезом кДНК с использованием праймера, комплементарного адаптеру. После получения библиотеки кДНК процесс секвенирования такой же, как и в случае мРНК.
Основная проблема технологии RNA-seq заключается в том, что априори неизвестно, какому транскрипту соответствует прочитанный фрагмент. Особенно сложно решить данную проблему в случае исследования транскриптома высших эукариот с частым альтернативным сплайсингом и присутствием в геноме большого числа паралогов. Существует два подхода для восстановления транскриптов по прочитанным фрагментам: картирование на геном отдельных прочитанных фрагментов[17] или восстановление структуры транскрипта de novo с последующим картированием полноразмерного транскрипта на геном[18]
Метод секвенирования РНК становится основным методом определения того, какие гены и на каком уровне экспрессируются в клетке. С помощью РНК секвенирования можно определять различия в экспрессии генов на различных стадиях развития организма[19] или в разных тканях[20]. Например, разработан метод локализации in situ последовательностей РНК-транскриптов, с помощью флуоресцентного секвенирования (FISSEQ), который позволяет изучать фенотип клеток и регуляцию активности генов непосредственно в биологическом образце (на срезах тканей)[21][22][23]. Также можно определить транскрипция каких генов изменяется при развитии болезней и рака[24]. В связи с удешевлением методов секвенирования нового поколения появилась возможность определять экспрессию генов у любого человека для диагностики заболеваний.
РНК-секвенирование позволяет различить транскрипты с отличием в одном нуклеотиде, поэтому может быть использовано как для выявления экспрессируемых однонуклеотидных полиморфизмов в генах, так и для изучения процесса редактирования РНК[25][26]
Секвенирование РНК — наиболее удобный способ определения мест альтернативного сплайсинга, а также количественного соотношения различных альтернативных форм транскрипта[27][28]. Другие методы не позволяют картировать места альтернативного сплайсинга на всем протяжении генома.
Также как и определение экспрессии генов, определение соотношения альтернативных форм транскриптов можно проводить на различных стадиях развития организма или в разных тканях.
РНК секвенирование применяется также и для обнаружения некодирующих РНК. При этом необходимо решить две важных проблемы: получить и амплифицировать кДНК на матрице некодирующей РНК, которая часто не содержит поли-А; кроме того, необходимо уменьшить количество рРНК в библиотеке. Последние составляют подавляющее количество клеточных некодирующих РНК и очень сильно снижают количество сигналов от других РНК.
Редактирование РНК — процесс пост- или ко- транскрипционной модификации рибонуклеотидов в молекуле РНК. В большинстве случаев редактирование РНК приводит к замене аденозина инозином (по результатам анализа редактома РНК китайского мужчины доля подобных событий составила ~93 %[29]); катализаторами указанных изменений являются белки семейства ADAR. В дальнейшем инозин распознаётся клеточной машинерией (например, рибосомой) как гуанозин, что приводит к возникновению различий между закодированной в геноме информацией и её интерпретацией.
Основным методом выявления внесённых изменений является сравнение последовательности нуклеотидов геномной ДНК и соответствующих участков РНК.
По причине слабого развития методов прямого секвенирования РНК необходимой стадией проведения анализа является постановка реакции обратной транскрипции, продуктом которой является кДНК. При выравнивании геномной ДНК и соответствующей кДНК выявляют возникшие замены. Заметим, что при сопоставлении базы данных EST и геномных последовательностей совокупная доля отличий в нуклеотидной последовательности ДНК и кДНК составляет 1-2 процента[30], причём наибольший вклад в изменения вносят ошибки секвенирования[31].
Важным прогностическим признаком обнаружения сайтов редактирования РНК является наличие эволюционно консервативных нуклеотидных последовательностей в окружении места редактирования[32].
Вследствие значительного прогресса в развитии методов массового параллельного секвенирования стало технически возможным проводить расшифровку полного транскриптома исследуемого организма с целью выявления связанных с редактированием РНК событий. Однако в силу генетического разнообразия наличие различий в определенной позиции между последовательностью РНК и референсным геномом не означает присутствия сайта редактирования в этой позиции — идентификация сайтов редактирования РНК подразумевает секвенирование как геномной ДНК, так и кДНК, выделенных из одного и того же организма. Также необходимо принимать во внимание то, что уровни редактирования РНК различаются в разных тканях организма[31].
Для упрощения процедуры идентификации сайтов редактирования РНК предпринимаются попытки разработать программные пакеты, использующие только транскриптомные данные и не требующие секвенирования геномной ДНК. Возможным решением может послужить программное обеспечение GIREMI (Genome-independent Identification of RNA Editing by Mutual Information), которое способно (согласно литературным данным) детектировать сайты редактирования РНК используя исключительно последовательности транскриптов[33].
РНК-секвенирование широко используется в настоящее время для исследование особенностей транскриптома раковых клеток, в том числе появление химерных транскриптов[34] и раково-специфичных продуктов альтернативного сплайсинга[35].
Гибридизация генов происходит из-за различных структурных модификаций в геноме и может быть связана с раком.[36] Возможность анализировать весь транскриптом образца с помощью секвенирования РНК, делает этот метод привлекательным для поиска подобных частых преобразований при раковой трансформации клеток.[37]
При картировании транскриптомных ридов на референсный геном, большая часть ридов попадает в область экзона, тогда как небольшая, но все ещё значительная их фракция может быть выровнена с известными экзон-экзонными соединениями. Оставшаяся часть невыровненных ридов может быть проанализирована на наличие ридов, выравнивающихся с местами соединения экзонов из разных генов. В таком случае, это будет свидетельством гибридизации генов. Альтернативный вариант заключается в использовании ридов со спаренными концами. При этом у потенциально большой фракции ридов концы выравнятся с разными экзонами, что даст лучшее покрытие участков соединения экзонов из разных генов.
Секвенирование РНК является одним из основных методов исследований, проводимых в рамках проектов ENCODE и modENCODE, направленных на создание базы данных элементов генома человека[38] и основных модельных объектов молекулярной биологии[39][40].
Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".
Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.
Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .