WikiSort.ru - Не сортированное

ПОИСК ПО САЙТУ | о проекте

Визуализация данных секвенирования РНК —  способ визуального представления данных, полученных с помощью РНК-секвенирования (RNA-seq) в наглядной форме, с помощью которого можно увидеть картирование полученных чтений на геном, анализировать уровень экспрессии гена и установить возможный альтернативный сплайсинг. Существует достаточно больше множество программ, позволяющих осуществить визуализацию.

РНК-секвенирование (RNA-seq)

РНК-секвенирование (RNA-seq) - технология, позволяющая определять последовательности молекул РНК, причём как кодирующих мРНК, так и некодирующих РНК. В основе метода лежит использование технологии секвенирования нового поколения NGS, которая позволяют устанавливать фрагменты кДНК, в которую предварительно переводят РНК [1]. С разработкой методов NGS, позволяющих существенно увеличить производительность процедуры, стало возможным проще производить анализ транскриптома, в том числе и транскриптома отдельной клетки, искать изменения в экспрессии генов, изучать альтернативный сплайсинг и производить поиск однонуклеотидных полиморфизмов, что было ранее невозможно при применении более старого способа с использованием ДНК-микрочипов[2][3]. Помимо мРНК применение данной технологии позволяет также исследовать миРНК, тРНК и рРНК[4].

Визуализация данных РНК-секвенирования

Данные, получаемые в результате секвенирования РНК, очень велики, они могут достигать гига- и терабайтов. Для того, чтобы любой желающий мог визуализировать данные, выложенные в открытом доступе или полученные в своей лаборатории, и существуют программы-визуализаторы. Она нужна прежде всего из-за того, что все методы использования данных РНК-секвенирования предполагают, что покрытие транскрипта чтениями более-менее равномерное или зависит от нескольких факторов (таких как mappability, GC-содержание), однако это не всегда так, визуализация же позволяет увидеть неровное покрытие. Помимо этого, использование данных программ позволяют подготавливать изображения для статей. Программы-визуализаторы позволяют визуализировать:

  • Позиции картирования чтений
  • Нуклеотиды в чтениях и нуклеотиды в референсной последовательности
  • Количество чтений на данном участке (покрытие)
  • Какие чтения ложатся на места соединения экзонов

Визуализация данных РНК-секвенирования также упрощать процесс анализа качества данных, уровня дифференциальной экспрессии генов и поиск альтернативного сплайсинга.

Программы для визуализации данных РНК-секвенирования

Integrative Genomics Viewer (IGV)

Программа Integrative Genomics Viewer (IGV) была разработана в Broad Institute и её описание было опубликовано в журналах Nature Biotechnology и Briefings in Bioinformatics [5][6]. Эта программа, которую начали разрабатывать в 2007 году для проекта The Cancer Genome Atlas, представляет собой мощный инструмент не только для визуализации данных РНК-секвенирования, но и для просмотра других данных секвенирования нового поколения, а также данных, полученных с помощью секвенирования на чипах. Авторы программы позиционируют её как продукт, обладающий большим спектром возможностей по сравнению с Tablet, BamView, Savant и Artemis. Помимо использования данного пакета на компьютерах с операционными системами Windows, Mac и Linux, возможно использование на iPad. На сайте можно скачать программу, а также там есть достаточно подробная инструкция по работе с программой и часто задаваемые вопросы.

Использовать данную программу можно как при необходимости анализировать данные, полученные из открытых источников, так и анализе собственных данных. Так как основная проблема работы с геномными данными это их размер, был использован подход, основанный на предварительной обработке данных в различных масштабах. Была разработана пирамидальная структура данных (так называемая data tiling), позволяющий тратить минимум памяти. Для IGV был разработан специальный файловый формат TDF (tiled data format). Помимо этого поддерживаюися неиндексированные форматы такие как GFF, BED и WIG, индексированные форматы ткаие как BAM и Goby, а также форматы файлов с различным разрешением: TDF, bigWig и bigBed.

Навигация по геному устроена по аналогии с картами Google. До загрузки данных необходитмо загрузить референсный геном, который можно ли выбрать либо из представленных самим IGV, либо импортировать из других данных. В зависимости от масштаба IGV будет отображать различные параметры такие как покрытие, выравнивание и т.д. Для анализа данных выравниваний используется цветовая кодировка, а также уровень прозрачности, что позволяет удобным образом выявлять однонуклеотидные полиморфизы. Помимо этого существуют инструменты для идентификации повторов, вставок/делеций и т.д. Предусмотрена возможность взаимодействия с Matlab и программами Microsoft Office.

Sashimi plots

Скриншот работы SashimiPlot, запущенной через IGV.
Скриншот работы SashimiPlot, запущенной через IGV.

Sashimi plots – утилита, позволяющая визуализировать данные анализа РНК-секвенирования для анализа экспрессии изоформ. Данная программа начала разрабатываться в 2011 году и является частью проекта MISO (Mixture of ISOforms), который занимается проблемами альтернативного сплайсинга в данных РНК-секвенирования. Название было придумано в соответствии с тем, что изменения в экзонной плотности данных РНК-секвенирования выглядят как роллы сашими, а также потому, что его сашими употребляют в пищу вместе с мисо. Описание этой утилиты было опубликовано в журнале Bioinformatics в 2015 году [7].

Sashimi Plots строит графики, визуализирующие уровень экспрессии экзонов и их возможные соединения, что позволяет визуализировать возможную структуру гена. Показывает оценки MISO для рассматриваемых событий, способен показывать несколько образцов на одном и том же рисунке и может создавать картинки в нескольких форматах (включая PDF и PNG). Утилиту можно запускать из командной строки, а можно использовать Sashimi plots через IGV. Также может принимать на вход данные, полученные в MISO.

Tablet

Скриншот работы программы Tablet
Скриншот работы программы Tablet

Tablet представляет собой написанную на Java программу, описание которой было опубликовано в журнале Briefings in Bioinformatics [8]. Это тоже программа-просмоторщик геномных данных и с её помощью можно визуализировать данные РНК-секвенирования. Может выполняться на компьютерах с операционными системами Windows, Mac и Linux. Поддерживает форматы данных ACE, AFG, MAQ, SOAP2, SAM, BAM, FASTA, FASTQ, and GFF3. Разработана специально для данных, получаемых при помощи технологий второго поколения секвенирования. Также поддерживает цветовую кодировку для построения выравниваний.

Integrated Genome Browser (IGB)

Скриншот работы программы IGB
Скриншот работы программы IGB

Integrated Genome Browser (IGB) — программа, изначально разработанная компанией Affimetrix, позволяющая просматривать данные РНК-секвенирования и ChIP-секвенирования вдоль аннотации генома. Её описание было опубликовано в журнале Bioinformatics[9]. Помимо выравнивания данная программа предоставляет возможности изучать альтернативный сплайсинг, регуляцию экспрессию генов, эпигенетические модификации ДНК и т. д. Также осуществляется проверка качества выравнивания, поиск однонуклеотидных полиморфизмов и т. д. На вход принимает множество форматов, в том числе BAM/SAM. По возможностям сходна с IGV.

RNAseqViewer

RNAseqViewer предназначена для визуализации одного или нескольких образцов РНК-секвенирования. Её описание было опубликовано в журнале Bioinformatics [10]. Основная задача – визуализация уровня экспрессии генов и альтернативного сплайсинга, кроме того, программа имеет инновационный подход к представлению транскрипционных данных. На вход программа принимает 7 типов файловых форматов. В зависимости от формата программа может визуализировать тепловую карту (SAM/BAM), связи между ридами и просмотр всего транскриптома (BED), просмотр всего транскриптома (GFF), нуклеотиды (FASTA), аннотацию генов (RefFlat/GTF) и гистограмму экспрессии (Wiggle). Программа написана на Python, предоставлена возможность работать на нескольких языках и возможно экспортировать данные во множество различных форматов, такие как графические и PDF. Поддерживается для Windows и Linux.

CBrowse

CBrowse была разработана в лаборатории Liang и её описание было опубликовано в журнале Bioinformatics в 2012 году [11]. На официальном сайте можно скачать программу, а также представлены видеоролик об использовании данной программы, инструкция по использованию и примеры вывода каждой программы. Программа представляет из себя инструмент для визуализации и анализа, основанный на использовании форматов SAM или BAM. На вход программе необходимо передать файл с последовательностью контигов, а также соответствующий SAM/BAM файл. Она обрабатывает входные данные, проводит поиск однонуклеотидных полиморфизов и повторов, создает изображение, JSON-MySQL-совместимые файлы, которые могут быть использованы в других программах.

Непосредственно за визуализацию отвечает программа Alignment Viewer, которая позволяет визуализировать выравнивание последовательностей в различном масштабе (от просмотра целых последовательностей до отдельных нуклеотидов), причём с различной цветовой кодировкой различий в нуклеотидных позициях. Помимо этого существует еще 4 инструмента для анализа: Contig viewer - программа для просмотра контигов представляет общую информацию о сборке также как и об индивидуальном контиге. Sequence viewer – программа-просмоторщик позволяет пользователям искать нуклеотидные последовательности в контигах. Polymorphism Viewer – программа предназначена для поиска полиморфизмов (однонуклеотидные полиморфизсы, а также одиночные вставки/делеции и другие полиморфизмы), она показывает их координаты и частоту в каждом контиге. SSR Viewer – программа, обеспечивающая поиск простых повторов в последовательности в каждом контиге (повтор с размером 1-12 нуклеотидов, причём как с идеальным соответствием, так и с неполным совпадением).

Другие

  • Artemis - бесплатный геномный браузер (и программа для аннотирования), визуализирующий данных РНК-секвенирования и позволяющий просмотреть белковую последовательность в 6 возможных рамках считывания.
  • Apollo - визуализатор и аннотатор, удобный для использования несколькими людьми - позволяет синхронизировать данные между ними.
  • BamView - позволяет просматривать BAM-файлы.
  • Degust - Интерактивный веб-инструмент для визуализации данных дифференциальной экспрессии генов.
  • GBrowse - пакет программ, которые позволяют визуализировать данные и анализировать их.
  • genomeview - программа визуализатор и редактор, позволяющая работать с множеством форматов файлов.
  • Tbrowse - простой, интуитивно понятный браузер для визуализации данных РНК-секвенирования.
  • Savant - программа-визуализатор с дружественным интерфейсом, разработанная в Университете Торонто.

Примечания

  1. Haas BJ, Zody MC (May 2010). “Advancing RNA-Seq analysis”. Nat Biotechnol. 28 (5): 421–3. DOI:10.1038/nbt0510-421. Используется устаревший параметр |month= (справка)
  2. Maher CA, Kumar-Sinha C, Cao X; et al. (March 2009). “Transcriptome sequencing to detect gene fusions in cancer”. Nature. 458 (7234): 97—101. DOI:10.1038/nature07638. Используется устаревший параметр |month= (справка)
  3. Nookaew I, Papini M, Pornputtapong N, Scalcinati G, Fagerberg L, Uhlén M, Nielsen J (November 2012). “A comprehensive comparison of RNA-Seq-based transcriptome analysis from reads to differential gene expression and cross-comparison with microarrays: a case study in Saccharomyces cerevisiae”. Nucleic Acids Res. 40 (20): 10084–97. DOI:10.1093/nar/gks804. Используется устаревший параметр |month= (справка)
  4. Ingolia NT, Brar GA, Rouskin S, McGeachy AM, Weissman JS (August 2012). “The ribosome profiling strategy for monitoring translation in vivo by deep sequencing of ribosome-protected mRNA fragments”. Nat Protoc. 7 (8): 1534—50. DOI:10.1038/nprot.2012.086. Используется устаревший параметр |month= (справка)
  5. Robinson JT, Thorvaldsdóttir H, Winckler W, Guttman M, Lander ES, Getz G, Mesirov JP (January 2011). “Integrative genomics viewer”. Nat Biotechnol. 29 (1): 24–6. DOI:10.1038/nbt.1754. Используется устаревший параметр |month= (справка)
  6. Thorvaldsdóttir H, Robinson JT, Mesirov JP (March 2013). “Integrative Genomics Viewer (IGV): high-performance genomics data visualization and exploration”. Brief Bioinform. 14 (2): 178–92. DOI:10.1093/bib/bbs017. Используется устаревший параметр |month= (справка)
  7. Katz Y, Wang ET, Silterra J, Schwartz S, Wong B, Thorvaldsdóttir H, Robinson JT, Mesirov JP, Airoldi EM, Burge CB (January 2015). “Quantitative visualization of alternative exon expression from RNA-seq data”. Bioinformatics. DOI:10.1093/bioinformatics/btv034. Используется устаревший параметр |month= (справка)
  8. Milne I, Stephen G, Bayer M, Cock PJ, Pritchard L, Cardle L, Shaw PD, Marshall D (March 2013). “Using Tablet for visual exploration of second-generation sequencing data”. Brief Bioinform. 14 (2): 193–202. DOI:10.1093/bib/bbs012. Используется устаревший параметр |month= (справка)
  9. Nicol JW, Helt GA, Blanchard SG Jr, Raja A, Loraine AE (October 2009). “The Integrated Genome Browser: free software for distribution and exploration of genome-scale datasets”. Bioinformatics. 25 (20): 2730–1. DOI:10.1093/bioinformatics/btp472. Используется устаревший параметр |month= (справка)
  10. Rogé X, Zhang X (March 2014). “RNAseqViewer: visualization tool for RNA-Seq data”. Bioinformatics. 30 (6): 891–2. DOI:10.1093/bioinformatics/btt649. Используется устаревший параметр |month= (справка)
  11. Li P, Ji G, Dong M, Schmidt E, Lenox D, Chen L, Liu Q, Liu L, Zhang J, Liang C (September 2012). “CBrowse: a SAM/BAM-based contig browser for transcriptome assembly visualization and analysis”. Bioinformatics. 28 (18): 2382–4. DOI:10.1093/bioinformatics/bts443. Используется устаревший параметр |month= (справка)

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .




Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2025
WikiSort.ru - проект по пересортировке и дополнению контента Википедии