ФАНТОМ (Функциональная Аннотация геномов Млекопитающих) (англ. FANTOM — Functional Annotation of the Mammalian Genome) — международный исследовательский консорциум, основанный доктором Хаяшизаки и его коллегами в 2000 году с целью функционального аннотирования полноразмерных кДНК, которые были собраны в ходе проекта The Mouse Encyclopedia[1] в научном центре RIKEN. С тех пор ФАНТОМ стал самостоятельным и развитым проектом, который затрагивает разные сферы анализа траскриптомов. Объект проекта изменяется от понимания «элементов» — транскриптов, до понимания «системы» — сети регуляции траснскрипции.
The RIKEN Mouse Gene Encyclopaedia Project[1] — систематический подход к определению полного кодирующего потенциала генома мыши, в ходе которого была получения коллекция последовательностей полноразмерных кДНК с последующим картированием соответствующих генов на геноме мыши. Следствием этого проекта стало основание ассоциации ФАНТОМ с целью аннотирования первых 21,076 кДНК. Эта коллекция кДНК стала самой большой для какого-либо организма на тот момент. Анализ этих кДНК расширил уже существующие семейства генов и определил новые.
В ходе первого этапа работы консорциума была разработана эффективная система функциональной аннотации генов, основанная на разработанных de novo правилах и методах. Основные результаты были опубликованы в журнале Nature в 2001 году[2].
Общий вид последовательных стадий можно представить следующим образом:
Раньше одной из самых больших трудностей получения полноразмерных кДНК являлась неэффективность работы ревертазы при синтезе второй цепи. Было показано, что добавление трегалозы значительно увеличивает термостабильность и активность фермента[3]. Это открытие позволило проводить ревертазные реакции при 60 °C вместо 42°С, как раньше. При температуре 60 °C вторичная структура РНК из образца подплавляется и участок на 5'-конце мРНК становится доступным для транскрипции.
Метод разработан для селекции только полноразмерных кДНК. Сначала, кэп, который есть на 5'-конце всех эукариотических мРНК биотинилируется. Затем происходит обратная транскрипция, и оцРНК подвергается деградации. Если траскрипция кДНК прервалась, то после расщепления одноцепочечных участков биотин на их 5'-конце будет отсутствовать. Оставшиеся полноразмерные кДНК с биотинилированным кэпом «вылавливаются» стрептавидиновыми бусинами. Затем в щелочной среде цепи ДНК элюируются и производится достраивание второй цепи ДНК.
Проблема того, что короткие мРНК более вероятно будут проклонированы, чем более длинные, была решена разработкой нового вектора, подходящего для клонирования кДНК размером 6kb~20kb, — λFlcIII-L. Этот вектор был усовершенствован (фоновое лигирование снижено практически до нуля) и назван λFlcIV. Именно он использовался для клонирования.
Так как 50~60 % всей РНК клетки соответствуют генам «домашнего хозяйства», то для оценки относительно низкой экспрессии РНК необходимо нормализовать библиотеки частоте встречаемости конкретных кДНК.
После первого съезда консорциума ФАНТОМ, группа из RIKEN продолжила создание мышиных полноразмерных кДНК. В ходе второй фазы были определены последовательности и созданы функциональные аннотации для этого набора из 60,770 полноразмерных кДНК мыши. Это стало первым всемирным проектом по стандартизации полноразмерных кДНК млекопитающих.
Проект ФАНТОМ2 состоял из трех частей:
Собрание было проведено 15-19 октября 2001 г. Обсуждались стратегии и правила аннотации для более эффективного аннотирования с использованием информации о профилях экспрессии, картирования и данных о белок-белковых взаимодействиях, а также традиционного выравнивания последовательностей. Так же обсуждалась организация MATRICS — онлайн аннотация последовательностей из RIKEN (Mouse Annotation Teleconference for RIKEN cDNA sequences).
MATRICS (Mouse Annotation Teleconference for RIken CDNA Sequences) — телеконференция, в ходе которой кураторы аннотировали последовательности кДНК из RIKEN через Интернет, используя систему ФАНТОМ. Эта система предумастривает использование многих онлайн ресурсов.
После удаленного аннотирования в ходе MATRICS была проведена встреча (29.04 — 04.05 2002) для обсуждения результатов и биологически интересных находок.
По результатам была опубликована статья в журнале Nature в 2002 году[8].
Аналогично двум другим этапам были проведены встречи до начала работы (Tanabata Meeting : July 05 — 08, RIKEN, GSC, Japan) и после окончания работы проекта (Harvest Meeting : September 10 — 15, RIKEN, Japan).
Изменилась стратегия аннотации. Основные данные для анализа все так же библиотека полноразмерных мышиных кДНК, а так же данные CAGE и GSC (genome signature cloning).
Применение новой технологии CAGE показало, что более, чем 63 % генома (а не как раньше считалось ~1.5 % белок-кодирующих экзонов) транскрибируется с образованием РНК. Так же было обнаружено более 23,000 некодирующих РНК (non-coding RNAs, ncRNAs) и что >73 % транскриптов способны к смысловой и антисмысловой транскрипции.
Публикации по работе данного этапа можно найти в специальном выпуске журнала Science «RNA special issue»[9][10]
Так же был начат анализ кДНК и профилей экспрессии человека.
Для работы четвертой фазы проекта динамические паттерны экспрессии мРНК, микроРНК и активности промоторов были измерены для дифференцирующихся клеток миелоидной лейкемии человека.
Во время работы этого этапа использовалась технология deepCAGE для мониторинга динамики использования сайтов старта транскрипции (TSS) в ходе клеточной дифференциации. Уровни экспрессии с каждого промотора и предсказания сайтов связывания транскрипционных факторов использовались для дальнейшего построения модели транскрипционной сети регуляции[11]. Таким образом, становится возможным предсказывать регуляторные границы (EDGES) между транскрипционным фактором и целевым промотором, и взвешивать правдоподобие того, что данный транскрипционный фактор действительно регулирует транскрипцию с данного промотора. На основе этих данных разработана EDGE EXPRESS DB, в которой можно найти сеть регуляции одного или нескольких генов интереса.
Так же были созданы геномные браузеры для человека и мыши для графического отображения важных мест в геноме, таких как промоторы, экзоны, H3K9 ацетилирование, места посадки транскрипционных факторов.
Эта стадия проекта, полностью основанная на опыте предыдущих стадий, продолжается по настоящее время с целью поиска общих правил клеточной дифференциации. Создается карта основных человеческих промоторов и относительная модель транскрипционной сети регуляции каждого клеточного состояния. Для этого используется deepCAGE секвенирование РНК, выделенных из всех основных органов человека и более 200 раковых клеточных линий, а также 30 динамик клеточной дифференциации, динамики развития мыши и более 200 первичных клеточных типов.
Были прокартированы наборы транскриптов, транскрипционных факторов, промоторов и энхансеров, активных в большинстве первичных клеток млекопитающих и части раковых клеточных линий[12][13].
Примерно 30 публикаций этой фазы проекта описывают такие разные результаты, как первичные клетки, семейства генов, полногеномные исследования и новые биоинформатические инструменты.
Сравнительный анализ экспрессии РНК в разных типах клеток показал, что когда клетка дифференцируется, первичная активация этого процесса случается в энхансерных участках ДНК[14].
Интерактивные базы данных (interactive viewer, data exporter) и все файлы за время работы всех стадий проекта находятся в свободном доступе в общей FANTOM database.
Все полноразмерные кДНК клоны доступны в Dnaform, Invitrogen, RZPD и Gene Service.
Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".
Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.
Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .