RU2752663C1 - Способ квантификации статистического анализа альтернативного сплайсинга в данных рнк-сек - Google Patents

Способ квантификации статистического анализа альтернативного сплайсинга в данных рнк-сек Download PDF

Info

Publication number
RU2752663C1
RU2752663C1 RU2020116347A RU2020116347A RU2752663C1 RU 2752663 C1 RU2752663 C1 RU 2752663C1 RU 2020116347 A RU2020116347 A RU 2020116347A RU 2020116347 A RU2020116347 A RU 2020116347A RU 2752663 C1 RU2752663 C1 RU 2752663C1
Authority
RU
Russia
Prior art keywords
segment
sequencing data
rna sequencing
reads
readings
Prior art date
Application number
RU2020116347A
Other languages
English (en)
Inventor
Филипп Ефимович Хайтович
Павел Владимирович Мазин
Original Assignee
ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "СберМедИИ"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "СберМедИИ" filed Critical ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "СберМедИИ"
Priority to RU2020116347A priority Critical patent/RU2752663C1/ru
Application granted granted Critical
Publication of RU2752663C1 publication Critical patent/RU2752663C1/ru

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Изобретение относится к биотехнологии. Описан способ обнаружения отличий в частоте включения экзона при помощи анализа данных РНК-секвенирования. Согласно способу: получают данные РНК-секвенирования, состоящие из набора прочтений, из по меньшей мере одного образца, при этом образец получают из субъекта, принадлежащего к определенному биологическому виду; б) получают информацию о референсной геномной ДНК организма, принадлежащего к указанному биологическому виду, которая содержит последовательности генов; в) осуществляют разбиение указанных последовательностей генов на сегменты, при этом каждый сегмент содержит фрагмент гена между двумя ближайшими сайтами сплайсинга; г) картируют полученные наборы прочтений на указанные последовательности генов, и для каждого сегмента определяют прочтения, содержащие последовательность, которая соответствует последовательности этого сегмента; д) для каждого сегмента определяют количество «включающих» прочтений, подтверждающих наличие данного сегмента в данных РНК-секвенирования, также определяют количество «исключающих» прочтений, опровергающих наличие данного сегмента в данных РНК-секвенирования, и на основании этих двух чисел вычисляют частоту включения экзона, соответствующего данному сегменту. Техническим результатом изобретения является увеличение скорости анализа данных РНК-секвенирования и уменьшение времени, которое затрачивает специалист для интерпретации получаемых результатов. Получаемые результаты могут быть использованы в медицинской диагностике при изучении нарушений альтернативного сплайсинга и их ассоциаций с определенными заболеваниями или состояниями. 2 н.п. ф-лы, 1 ил.

Description

Область техники
Изобретение относится к биомедицинским технологиям, а именно к анализу данных РНК-секвенирования. Изобретение может быть использовано при диагностике заболеваний, связанных с нарушением альтернативного сплайсинга.
Уровень техники
Созревание мРНК у эукариот включает в себя стадию сплайсинга - вырезания участков пре-мРНК называемых интронами и сшивание оставшихся участков называющихся экзонами. Интроны с обоих сторон ограничены сайтами сплайсинга, с 5’-конца интрона находится донорный сайт, с 3’-конца интрона - акцепторный. Все экзоны (кроме первых и последних) также ограничены с обоих сторон сайтами сплайсинга. В случае, если один и тот же фрагмент пре-мРНК в некоторых случаях вставляется в зрелую. мРНК или исключаются из нее говорят об альтернативный сплайсинге (АС). Альтернативный сплайсинг отдельного фрагмента РНК в данном биологическом образце характеризуется его частотой включения - отношением концентраций транскриптов данного гена содержащих данные фрагмент к суммарной концентрации всех транскриптов гена. Известно, что играет ключевую роль в развитии и функционировании нервной, мышечной, иммунной и других систем. Нарушения альтернативного сплайсинга связаны с такими заболеваниями как аутизм, болезнь Альцгеймера или миотоническая дистрофия. Таким образом, изучение альтернативного сплайсинга имеет и прикладное и фундаментальное значение. Подобные исследования обычно включают в себя определение частот включения участков мРНК в каждом отдельном биологическом образце и сравнение этих частот включения между двумя группами образцов, например между образцами полученными от больных и здоровых доноров или между образцами выделенными из различных органов. Развитие методов секвенирования нового поколения позволило анализировать АС в масштабе всего генома. Массовое секвенирование РНК (РНК-Сек) позволяет получить десятки миллионов коротких прочтений РНК. Выравнивание этих фрагментов на геном позволяет определить какие участки генома транскрибируются и после процессинга пре-мРНК входят в зрелые мРНК. Сравнение выравнивай прочтений РНК-Сек с геномной аннотацией (набором геномных координат генов, транскриптов и составляющих их экзонов) может позволить вычислить частоты включения экзонов всех экспрессирующихся генов. На данный момент существует несколько методов, позволяющих исследовать альтернативный сплайсинг (АС) при помощи данных РНК-Сек, однако каждый из них обладает некоторыми недостатками. Методы Cuffdiff2 [https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3869392/], MISO [https://www.ncbi.nlm.nih.gov/pubmed/21057496], MATS [https://www.ncbi.nlm.nih.gov/pubmed/25480548] работают на уровне транскриптов или генов и не позволяют найти конкретный экзон, что необходимо для поиска причин паталогических изменений АС. Метод DEXseq [https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3460195/] направлен на выявление дифференциального использования экзонов не только в следствии АС, но также в следствии использования альтернативных стартов или концов транскрипции. Поэтому использование DEXseq для поиска патологических изменений АС может приводить к ложно-положительным результатам.
Сущность изобретения
Задачей настоящего изобретения является создание способа обнаружения отличий в результатах альтернативного сплайсинга (АС) у различных групп субъектов при помощи анализа данных РНК-Сек.
Указанная задача решается путем создания способа подсчета частоты включения экзона в данных РНК-секвенирования, включающего следующие стадии:
а) получают данные РНК-секвенирования, состоящие из набора прочтений, из по меньшей мере одного образца, при этом образец получают из субъекта, принадлежащего к определенному биологическому виду;
б) получают информацию о референсной геномной ДНК организма, принадлежащего к указанному биологическому виду, которая содержит последовательности генов;
в) осуществляют разбиение указанных последовательностей генов на сегменты, при этом каждый сегмент содержит фрагмент гена между двумя ближайшими сайтами сплайсинга;
г) картируют полученные наборы прочтений на указанные последовательности генов, и для каждого сегмента определяют прочтения, содержащие последовательность, которая соответствует последовательности этого сегмента;
д) для каждого сегмента определяют количество «включающих» прочтений, подтверждающих наличие данного сегмента в данных РНК-секвенирования, также определяют количество «исключающих» прочтений, опровергающих наличие данного сегмента в данных РНК-секвенирования, и на основании этих двух чисел вычисляют частоту включения экзона, соответствующего данному сегменту.
В предпочтительном варианте, данный способ характеризуется тем, что частоту включения экзона вычисляют по формуле:
Figure 00000001
,
где в и и обозначают количество включающих и исключающих прочтений, а дс и дп обозначают длину сегмента и прочтения в нуклеотидах, соответственно.
Указанная задача также решается путем создания способа определения статистически значимых отличий в частоте включения экзона в данных РНК-секвенирования, полученных из по меньшей мере двух различных образцов, включающего следующие стадии:
а) получают данные РНК-секвенирования, состоящие из набора прочтений, из по меньшей мере двух различных образцов, при этом образцы получают из субъектов, принадлежащих к одному биологическому виду;
б) получают информацию о референсной геномной ДНК организма, принадлежащего к указанному биологическому виду, которая содержит последовательности генов;
в) осуществляют разбиение указанных последовательностей генов на сегменты, при этом каждый сегмент содержит фрагмент гена между двумя ближайшими сайтами сплайсинга;
г) для каждого образца картируют полученные наборы прочтений на указанные последовательности генов, и для каждого сегмента определяют прочтения, содержащие последовательность, которая соответствует последовательности этого сегмента;
д) в каждом образце для каждого сегмента определяют количество «включающих» прочтений, подтверждающих наличие данного сегмента в данных РНК-секвенирования, также определяют количество «исключающих» прочтений, опровергающих наличие данного сегмента в данных РНК-секвенирования, и на основании этих двух чисел вычисляют частоту включения экзона, соответствующего данному сегменту;
е) определяют статистически значимые отличия в частоте включения экзона в по меньшей мере одном образце по сравнению с другими образцами.
В предпочтительном варианте, данный способ характеризуется тем, что частоту включения экзона в каждом образце вычисляют по формуле:
Figure 00000001
,
где в и и обозначают количество включающих и исключающих прочтений, а дс и дп обозначают длину сегмента и прочтения в нуклеотидах, соответственно.
Техническим результатом настоящего изобретения является увеличение скорости анализа данных РНК-секвенирования и уменьшение времени, которое затрачивает специалист для интерпретации получаемых результатов. Получаемые результаты могут быть использованы в медицинской диагностике при изучении нарушений АС и их ассоциаций с определенными заболеваниями или состояниями.
Краткое описание чертежей
Фиг. 1. Схема предложенного метода анализа АС. Аннотация генома, выравнивание прочтений и информация о разбиении образцов на сравниваемые группы является входными данными алгоритма. Алгоритм осуществляет разбиение генов на сегменты, подсчет прочтений и статистический анализ для поиска сегментов со статистически значимыми отличиями АС между группами.
Подробное раскрытие изобретения
В описании данного изобретения термины «включает» и «включающий» интерпретируются как означающие «включает, помимо всего прочего». Указанные термины не предназначены для того, чтобы их истолковывали как «состоит только из». Если не определено отдельно, технические и научные термины в данной заявке имеют стандартные значения, общепринятые в научной и технической литературе.
Прочтение (рид) - это короткая (от 30 до 500 нт) нуклеотидная последовательность, полученная в результате применения методов массового секвенирования к ДНК или РНК, выделенной из биологического образца. Наиболее часто применяемые технологии массового секвенирования позволяют получить несколько десятков миллионов прочтений на один биологический образец, обычно длина прочтения составляет около 100 нуклеотидов.
Картировать (или выравнивать) прочтение РНК-Сек на последовательности генов из геномной ДНК организма означает определить место в геномной ДНК, с которого был транскрибирован фрагмент, в результате секвенирования которого получилось данное прочтение.
Входными данными для анализа АС предлагаемым алгоритмом являются выравнивание данных РНК-сек на геном анализируемого организма и аннотация генома. Одновременно может анализироваться произвольное количество образцов РНК-сек полученных от одной или нескольких особей одного вида. Мощность метода зависит от количества прочтений в каждом образце, рекомендуется иметь хотя бы 30 млн прочтений на образец, однако метод может работать и с меньшим числом прочтений. Предлагаемый алгоритм для анализа АС состоит из трех стадий:
1. Разбиения всех генов, присутствующих в аннотации, на сегменты - фрагменты генов между двумя ближайшими сайтами сплайсинга.
В рамках этой процедуры рассматриваются сайты сплайсинга данного гена. Несколько сайтов с идентичными координатами и типами (донорный/акцепторный) схлопываются в один. Участок между двумя соседними сайтами сплайсинга является сегментом. Далее, все сегменты классифицируются на константные экзоны или интроны (сегменты, являющиеся экзонами или интронами соответственно во всех мРНК гена проходящих через данный участок) и альтернативные (сегменты, являющиеся экзонами в одних мРНК и интронами в других). Альтернативные сегменты разбиваются на четыре основных типа: кассетные экзоны (начинается с акцепторного сайта и кончается донорным), альтернативный донорный/акцепторный сегменты (начинается и кончается донорным/акцепторным сайтом) и удержанные интроны - начинаются с донорного сайта и кончаются акцепторным.
2. Подсчет числа прочтений
Для каждого сегмента в каждом образце подсчитывается два числа: количество прочтений, подтверждающих включение данного сегмента в мРНК («включающие» прочтения, то есть прочтения выравнивание которых пересекает сегмент хотя бы на один нуклеотид) и количество прочтений, подтверждающих исключение данного сегмента из мРНК («исключающие» прочтения, то есть прочтения выравнивающиеся на границу пары экзонов, один из которых находится до, а другой после данного сегмента). В ходе данной процедуры исключаются прочтения, которые выравниваются в несколько мест генома. Для устранения эффекта непроцессированных мРНК из подсчета исключающих прочтений и включающих прочтений для всех сегментов кроме удержанных интронов не учитываются прочтения пересекающиеся с интронами.
Для вычисления ЧВ ( частота включения сегмента ) число включающих и исключающих прочтений нормируется на количество различных позиций на которые могли бы потенциально выровняться прочтения:
Figure 00000001
где в и и обозначают количество включающих и исключающих прочтений, а дс и дп обозначают длину сегмента и прочтения соответственно. Предпочтительным является использование данных РНК-Сек с постоянной длинной прочтения, в ином случае используется средняя (на данный образец) длина прочтения.
3. Поиск сегментов со статистически значимыми отличиями ЧВ между тестовой и контрольной группами
Поиск сегментов с статистически значимыми отличиями в частотах включения осуществляется при помощи обобщенных линейных моделей с биномиальным распределением. Для учета биологической вариабельности используется тест на квази-отношение правдоподобий. Для коррекции на множественное тестирование применяется поправка Бенджамини-Хохберга. Сегменты с корректированным p-значением меньше 0.05 считаются статистически значимо отличными между сравниваемыми группами. Потенциально, благодаря использованию линейных моделей метод позволяет производить сравнение как двух выборок, так и анализировать более сложные экспериментальные дизайны с большим числом ковариатов.
Результатом работы алгоритма является список всех аннотированных сегментов, частоты их включения во всех сравниваемых образцах, разность средних частот включения между сравниваемыми группами образцов и p-значения для этого сравнения.
Примеры применения
Метод был применен для анализа изменений АС в ходе развития мозга человека и других приматов. Было показано что частоты включения сотен экзонов меняются в ходе постнатального развития мозга. При этом, некоторые изменения продолжаются и в старении, в частности, сплайсинг двух кассетных экзонов в транскриптах генов APP и MAPT, вовлеченных в болезнь Альцгеймера.
Несмотря на то, что изобретение описано со ссылкой на раскрываемые варианты воплощения, для специалистов в данной области должно быть очевидно, что конкретные подробно описанные случаи приведены лишь в целях иллюстрирования настоящего изобретения, и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения. Должно быть, понятно, что возможно осуществление различных модификаций без отступления от сути настоящего изобретения.

Claims (16)

1. Способ подсчета частоты включения экзона в данных РНК-секвенирования, включающий следующие стадии:
а) получают данные РНК-секвенирования, состоящие из набора прочтений, из по меньшей мере одного образца, при этом образец получают из субъекта, принадлежащего к определенному биологическому виду;
б) получают информацию о референсной геномной ДНК организма, принадлежащего к указанному биологическому виду, которая содержит последовательности генов;
в) осуществляют разбиение указанных последовательностей генов на сегменты, при этом каждый сегмент содержит фрагмент гена между двумя ближайшими сайтами сплайсинга;
г) картируют полученные наборы прочтений на указанные последовательности генов, и для каждого сегмента определяют прочтения, содержащие последовательность, которая соответствует последовательности этого сегмента;
д) для каждого сегмента определяют количество «включающих» прочтений, подтверждающих наличие данного сегмента в данных РНК-секвенирования, также определяют количество «исключающих» прочтений, опровергающих наличие данного сегмента в данных РНК-секвенирования, и на основании этих двух чисел вычисляют частоту включения экзона, соответствующего данному сегменту, по формуле:
Figure 00000002
,
где в и и обозначают количество включающих и исключающих прочтений, а дс и дп обозначают длину сегмента и прочтения в нуклеотидах, соответственно.
2. Способ определения статистически значимых отличий в частоте включения экзона в данных РНК-секвенирования, полученных из по меньшей мере двух различных образцов, включающий следующие стадии:
а) получают данные РНК-секвенирования, состоящие из набора прочтений, из по меньшей мере двух различных образцов, при этом образцы получают из субъектов, принадлежащих к одному биологическому виду;
б) получают информацию о референсной геномной ДНК организма, принадлежащего к указанному биологическому виду, которая содержит последовательности генов;
в) осуществляют разбиение указанных последовательностей генов на сегменты, при этом каждый сегмент содержит фрагмент гена между двумя ближайшими сайтами сплайсинга;
г) для каждого образца картируют полученные наборы прочтений на указанные последовательности генов, и для каждого сегмента определяют прочтения, содержащие последовательность, которая соответствует последовательности этого сегмента;
д) в каждом образце для каждого сегмента определяют количество «включающих» прочтений, подтверждающих наличие данного сегмента в данных РНК-секвенирования, также определяют количество «исключающих» прочтений, опровергающих наличие данного сегмента в данных РНК-секвенирования, и на основании этих двух чисел вычисляют частоту включения экзона, соответствующего данному сегменту, по формуле:
Figure 00000002
,
где в и и обозначают количество включающих и исключающих прочтений, а дс и дп обозначают длину сегмента и прочтения в нуклеотидах, соответственно;
е) определяют статистически значимые отличия в частоте включения экзона в по меньшей мере одном образце по сравнению с другими образцами.
RU2020116347A 2020-05-18 2020-05-18 Способ квантификации статистического анализа альтернативного сплайсинга в данных рнк-сек RU2752663C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2020116347A RU2752663C1 (ru) 2020-05-18 2020-05-18 Способ квантификации статистического анализа альтернативного сплайсинга в данных рнк-сек

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2020116347A RU2752663C1 (ru) 2020-05-18 2020-05-18 Способ квантификации статистического анализа альтернативного сплайсинга в данных рнк-сек

Publications (1)

Publication Number Publication Date
RU2752663C1 true RU2752663C1 (ru) 2021-07-29

Family

ID=77226351

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2020116347A RU2752663C1 (ru) 2020-05-18 2020-05-18 Способ квантификации статистического анализа альтернативного сплайсинга в данных рнк-сек

Country Status (1)

Country Link
RU (1) RU2752663C1 (ru)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160122753A1 (en) * 2013-06-12 2016-05-05 Tarjei Mikkelsen High-throughput rna-seq
RU2016107434A (ru) * 2013-08-07 2017-09-15 Регенерон Фармасьютикалз, Инк. Не являющиеся человеком животные с дефицитом дпнрнк
WO2019226804A1 (en) * 2018-05-23 2019-11-28 Envisagenics, Inc. Systems and methods for analysis of alternative splicing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160122753A1 (en) * 2013-06-12 2016-05-05 Tarjei Mikkelsen High-throughput rna-seq
RU2016107434A (ru) * 2013-08-07 2017-09-15 Регенерон Фармасьютикалз, Инк. Не являющиеся человеком животные с дефицитом дпнрнк
WO2019226804A1 (en) * 2018-05-23 2019-11-28 Envisagenics, Inc. Systems and methods for analysis of alternative splicing

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Liu, Ruolin, Ann E. Loraine, and Julie A. Dickerson. "Comparisons of computational methods for differential alternative splicing detection using RNA-seq in plant systems." BMC bioinformatics, 2014, 15(1): 1-16, см. стр.2-4. *
Wang, Weichen, et al. "Identifying differentially spliced genes from two groups of RNA-seq samples." Gene, 2013, 518(1): 164-170 (см. стр.165-166, 169-170; Supplementary text and figures. *
Wang, Weichen, et al. "Identifying differentially spliced genes from two groups of RNA-seq samples." Gene, 2013, 518(1): 164-170 (см. стр.165-166, 169-170; Supplementary text and figures. Liu, Ruolin, Ann E. Loraine, and Julie A. Dickerson. "Comparisons of computational methods for differential alternative splicing detection using RNA-seq in plant systems." BMC bioinformatics, 2014, 15(1): 1-16, см. стр.2-4. *

Similar Documents

Publication Publication Date Title
Takousis et al. Differential expression of microRNAs in Alzheimer's disease brain, blood, and cerebrospinal fluid
CN109637588B (zh) 一种基于全转录组高通量测序构建基因调控网络的方法
Robertson et al. Longitudinal dynamics of clonal hematopoiesis identifies gene-specific fitness effects
CN109767810B (zh) 高通量测序数据分析方法及装置
Smolka et al. Detection of mosaic and population-level structural variants with Sniffles2
Gabitto et al. Integrated multimodal cell atlas of Alzheimer’s disease
ES2923478T3 (es) Determinación y análisis de resultados de una secuenciación con moléculas asociadas a una diana en una cuantificación asociada con dianas biológicas
CN113450873A (zh) 一种预测胃癌预后和免疫治疗适用性的标志物及其应用
Walker et al. Empirical Bayes accomodation of batch-effects in microarray data using identical replicate reference samples: application to RNA expression profiling of blood from Duchenne muscular dystrophy patients
Aghamaleki et al. Application of an artificial neural network in the diagnosis of chronic lymphocytic leukemia
JP2015089364A (ja) 体細胞多重変異によるがん診断方法、がん医薬開発方法及びがん診断装置
Koh et al. An immune-related gene expression signature predicts brain metastasis in lung adenocarcinoma patients after surgery: gene expression profile and immunohistochemical analyses
Jin et al. Comprehensive analysis of transcriptome data for identifying biomarkers and therapeutic targets in head and neck squamous cell carcinoma
RU2752663C1 (ru) Способ квантификации статистического анализа альтернативного сплайсинга в данных рнк-сек
CN113789371A (zh) 一种基于批次矫正的拷贝数变异的检测方法
CN104428426A (zh) 多发性硬化的诊断miRNA概况
Hachim et al. Identifying asthma genetic signature patterns by mining gene expression big datasets using image filtering algorithms
JP7141038B2 (ja) 発症予測装置、及び発症予測システム
CN103937879B (zh) 尿毒症外周血单个核细胞超保守区域转录表达基因模型的构建方法与应用
Campbell et al. Applying gene expression microarrays to pulmonary disease
Zhang et al. Machine learning-based exceptional response prediction of nivolumab monotherapy with circulating microRNAs in non-small cell lung cancer
CN111961716B (zh) 一种急性胰腺炎预后标志物、急性胰腺炎预后预测模型及其应用
CN113234817B (zh) 利用CpG位点甲基化水平检测早期肝癌的标志物
Zhang et al. The specific microRNA profile and functional networks for children with allergic asthma
EP4361289A1 (en) Detection of gene expression pattern specific to pancreatic cancer, and detection of pancreatic cancer through combination with measurement of ca19-9