RU2812346C1 - Способ оценки детекции транслокаций гена alk в парафинизированных опухолевых образцах с помощью рнк-секвенирования - Google Patents
Способ оценки детекции транслокаций гена alk в парафинизированных опухолевых образцах с помощью рнк-секвенирования Download PDFInfo
- Publication number
- RU2812346C1 RU2812346C1 RU2023122818A RU2023122818A RU2812346C1 RU 2812346 C1 RU2812346 C1 RU 2812346C1 RU 2023122818 A RU2023122818 A RU 2023122818A RU 2023122818 A RU2023122818 A RU 2023122818A RU 2812346 C1 RU2812346 C1 RU 2812346C1
- Authority
- RU
- Russia
- Prior art keywords
- alk
- gene
- chimeric
- coverage
- alk gene
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 19
- 238000003559 RNA-seq method Methods 0.000 title claims abstract description 19
- 238000001514 detection method Methods 0.000 title claims abstract description 18
- 230000005945 translocation Effects 0.000 title claims description 14
- 101150023956 ALK gene Proteins 0.000 claims abstract description 59
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 40
- 108700024394 Exon Proteins 0.000 claims abstract description 36
- 230000014509 gene expression Effects 0.000 claims abstract description 22
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 6
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 6
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 6
- 239000000523 sample Substances 0.000 claims description 34
- 230000002062 proliferating effect Effects 0.000 claims description 14
- 239000012634 fragment Substances 0.000 claims description 7
- 238000000692 Student's t-test Methods 0.000 claims description 6
- 108020004999 messenger RNA Proteins 0.000 claims description 6
- 238000000528 statistical test Methods 0.000 claims description 6
- 238000012353 t test Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 5
- 210000004881 tumor cell Anatomy 0.000 claims description 5
- 239000013068 control sample Substances 0.000 claims description 4
- 239000012530 fluid Substances 0.000 claims description 4
- 102100033793 ALK tyrosine kinase receptor Human genes 0.000 abstract description 20
- 238000004458 analytical method Methods 0.000 abstract description 18
- 238000013459 approach Methods 0.000 abstract description 14
- 230000008707 rearrangement Effects 0.000 abstract description 6
- 201000011510 cancer Diseases 0.000 abstract description 5
- 239000003814 drug Substances 0.000 abstract description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 abstract description 3
- 238000011319 anticancer therapy Methods 0.000 abstract description 3
- 230000001575 pathological effect Effects 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 abstract description 2
- 230000015556 catabolic process Effects 0.000 abstract description 2
- 238000006731 degradation reaction Methods 0.000 abstract description 2
- 239000000126 substance Substances 0.000 abstract description 2
- 230000000694 effects Effects 0.000 abstract 1
- 210000001519 tissue Anatomy 0.000 description 21
- 210000004027 cell Anatomy 0.000 description 7
- 239000000090 biomarker Substances 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 102000004022 Protein-Tyrosine Kinases Human genes 0.000 description 5
- 108090000412 Protein-Tyrosine Kinases Proteins 0.000 description 5
- 238000003752 polymerase chain reaction Methods 0.000 description 5
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 4
- 201000005202 lung cancer Diseases 0.000 description 4
- 208000020816 lung neoplasm Diseases 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 102100027100 Echinoderm microtubule-associated protein-like 4 Human genes 0.000 description 3
- 101001057929 Homo sapiens Echinoderm microtubule-associated protein-like 4 Proteins 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 3
- 206010009944 Colon cancer Diseases 0.000 description 2
- 102000052575 Proto-Oncogene Human genes 0.000 description 2
- 108700020978 Proto-Oncogene Proteins 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000012350 deep sequencing Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000000771 oncological effect Effects 0.000 description 2
- 230000036285 pathological change Effects 0.000 description 2
- 231100000915 pathological change Toxicity 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- AILRADAXUVEEIR-UHFFFAOYSA-N 5-chloro-4-n-(2-dimethylphosphorylphenyl)-2-n-[2-methoxy-4-[4-(4-methylpiperazin-1-yl)piperidin-1-yl]phenyl]pyrimidine-2,4-diamine Chemical compound COC1=CC(N2CCC(CC2)N2CCN(C)CC2)=CC=C1NC(N=1)=NC=C(Cl)C=1NC1=CC=CC=C1P(C)(C)=O AILRADAXUVEEIR-UHFFFAOYSA-N 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 239000002146 L01XE16 - Crizotinib Substances 0.000 description 1
- 208000031671 Large B-Cell Diffuse Lymphoma Diseases 0.000 description 1
- 208000030289 Lymphoproliferative disease Diseases 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 208000014767 Myeloproliferative disease Diseases 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 208000006265 Renal cell carcinoma Diseases 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 208000026062 Tissue disease Diseases 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- -1 UTR Proteins 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 229960001611 alectinib Drugs 0.000 description 1
- KDGFLJKFZUIJMX-UHFFFAOYSA-N alectinib Chemical compound CCC1=CC=2C(=O)C(C3=CC=C(C=C3N3)C#N)=C3C(C)(C)C=2C=C1N(CC1)CCC1N1CCOCC1 KDGFLJKFZUIJMX-UHFFFAOYSA-N 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 229950004272 brigatinib Drugs 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 238000001818 capillary gel electrophoresis Methods 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 229960001602 ceritinib Drugs 0.000 description 1
- VERWOWGGCGHDQE-UHFFFAOYSA-N ceritinib Chemical compound CC=1C=C(NC=2N=C(NC=3C(=CC=CC=3)S(=O)(=O)C(C)C)C(Cl)=CN=2)C(OC(C)C)=CC=1C1CCNCC1 VERWOWGGCGHDQE-UHFFFAOYSA-N 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 208000018631 connective tissue disease Diseases 0.000 description 1
- 229960005061 crizotinib Drugs 0.000 description 1
- KTEIFNKAUNYNJU-GFCCVEGCSA-N crizotinib Chemical compound O([C@H](C)C=1C(=C(F)C=CC=1Cl)Cl)C(C(=NC=1)N)=CC=1C(=C1)C=NN1C1CCNCC1 KTEIFNKAUNYNJU-GFCCVEGCSA-N 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 206010012818 diffuse large B-cell lymphoma Diseases 0.000 description 1
- 230000037437 driver mutation Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000002055 immunohistochemical effect Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- IIXWYSCJSQVBQM-LLVKDONJSA-N lorlatinib Chemical compound N=1N(C)C(C#N)=C2C=1CN(C)C(=O)C1=CC=C(F)C=C1[C@@H](C)OC1=CC2=CN=C1N IIXWYSCJSQVBQM-LLVKDONJSA-N 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003387 muscular Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 108091008598 receptor tyrosine kinases Proteins 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 201000006845 reticulosarcoma Diseases 0.000 description 1
- 208000029922 reticulum cell sarcoma Diseases 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Abstract
Заявленное изобретение относится к персонализированной медицине для онкологических заболеваний, а именно к системе обнаружения химерных продуктов генов во всех типах опухолевых образцов, основанной на анализе данных РНК-секвенирования, а именно детекции дисбаланса покрытия экзонов гена. Изобретение описывает способ, позволяющий детектировать продукты экспрессии химерных генов ALK в широком спектре образцов патологических тканей пациентов на основе данных об экспрессии РНК. Способ основан на анализе характера экспрессии экзонов гена ALK и поиске дисбаланса покрытия экзонов, свидетельствующем о наличии структурной перестройки гена ALK. Подход основан на анализе полнотранскриптомных данных, что потенциально позволяет обнаружить химерные продукты также и других экспрессируемых в образце генов. Кроме того, данный способ может быть автоматизирован, что предотвращает потенциальные ошибки, связанные с ручным расчетом, и позволяет учитывать структурные перестройки, характерные для конкретного пациента, в сотнях и тысячах экспрессируемых генов. Применение данного способа позволит эффективно и точно детектировать химерные транскрипты ALK во всех типах опухолевых образцов, включая фиксированные в формалине парафинизированные образцы, степень деградации нуклеиновых кислот в которых повышена. Применение представленного подхода для быстрого и эффективного обнаружения потенциально всех клинически значимых химерных генов ALK повысит эффективность подбора противораковой терапии. 2 ил.
Description
ОБЛАСТЬ ТЕХНИКИ
Заявленное изобретение относится к персонализированной медицине для онкологических заболеваний, а именно к системе обнаружения химерных продуктов генов во всех типах опухолевых образцов, основанной на анализе данных РНК-секвенирования, а именно детекции дисбаланса покрытия экзонов гена.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ
Химерные гены образуются в результате структурных изменений хромосом и являются характерной чертой генома раковых клеток. Такие изменения генома могут служить драйверными мутациями канцерогенеза, если в образовании химерного продукта принимает участие протоонкоген или ген-супрессор опухолевого роста. Особый интерес представляют химерные продукты, одним из партнеров которых является представитель генов рецепторных тирозинкиназ, в частности, ген ALK. Так, транслокации гена ALK - клинически значимый биомаркер (Hallberg, Palmer, 2013). Описано более 30 5'-генов-партнеров, которые объединяются с 3'-частью гена ALK (Hallberg, Palmer, 2013; Lovly et al., 2014). К опухолям, где детектированы химерные гены ALK, относятся крупноклеточная лимфома, диффузная крупноклеточная В-клеточная лимфома, глиома, немелкоклеточный рак легкого, колоректальный рак, рак молочной железы, яичников и пищевода (Hallberg, Palmer, 2013). Транслокации ALK не являются редкостью и обнаруживаются примерно в 8% случаев немелкоклеточного рака легкого (Kris et al., 2014).
Препараты Кризотиниб, церитиниб, алектиниб, бригатиниб и лоратиниб одобрены контролирующими инстанциями США для лечения немелкоклеточного рака легкого с химерным геном ALK. Ответ на терапию, ингибирующую ALK, также описан в исследованиях почечноклеточного рака и рака толстой кишки (Drilon et al., 2017).
Ввиду высокой значимости детекции транслокаций гена ALK для эффективного подбора противораковой терапии, было разработано несколько тестов для обнаружения данного биомаркера. «Классические» подходы основаны на методах ПЦР, флуоресцентной in situ гибридизации (FISH) или на иммуногистохимическом исследовании (ИГХ).
Предложен ряд способов анализа транслокаций ALK с геном-партнером EML4 с использованием специфических наборов праймеров, позволяющих амплифицировать исследуемый фрагмент и анализировать результаты с помощью полимеразной цепной реакции (ПЦР) в реальном времени, капиллярного электрофореза или гель-электрофореза в агарозном геле, а также детекции методом FISH (патентные заявки WO 2011087709, опубл. 21.07.2011; WO 2011095894, опубл. 11.08.2011, RU 2509153 C1, опубл. 10.03.2014). Также предложен метод детекции продуктов амплификации кДНК EML4-ALK с использованием флуоресцентной гибридизации с биочипами (патентная заявка WO 2010132888). Существенное ограничение всех предложенных методик - детекция ограничена наборами праймеров для ПЦР, то есть методы применимы для анализа только одного клинически значимого биомаркера: химерного гена ALK в паре с EML4.
Антитела для обнаружения транслокаций ALK Ventana ALK (D5F3) CDx Assay (Ventana Medical Systems, Tucson, AZ) методом ИГХ одобрены FDA США и зарегистрированы в РФ РУ № РЗН 2020/9786 от 25.03.2020. Стоит отметить, ИГХ детектирует уровень экспрессии целого белка ALK или его фрагментов, что служит лишь косвенным признаком наличия транслокации. Возможно, это является причиной частых несовпадений результатов анализа ИГХ с данными, полученными методами ПЦР или FISH (Mok T, Peters S, Camidge DR, et al. 2021).
Наиболее близким к заявляемому подходу является способ обнаружения химерных генов, основанный на детекции внутреннего дисбаланса экспресссии фрагментов генов методом амплификации в реальном времени 5' и 3'-частей гена (US 11021758 B2, опубл. 01.06.2021). При образовании химерных продуктов 5' и 3'-части гена оказываются под контролем разных геномных регуляторных элементов, что может приводить к повышению уровня транскрипции части гена, слитой с более сильным промотором. В частности, клинической значимостью при диагностике и выборе терапии онкологических заболеваний обладают химерные гены, образованные в результате слияния 3'-части потенциального протоонкогена с более сильным промотором. Поэтому авторы предлагают амплифицировать в реальном времени 5' и 3'-части гена (нетранслируемые области, UTR, untranslated region) набором разработанных праймеров и затем рассчитывать разницу экспрессии (IDE, Intragenic Differential Expression) по формуле:
Превышение IDE порогового значения, определенного экспериментально, свидетельствует о значительной разнице в уровнях экспрессии 5' и 3'-частей гена и, следовательно, об образовании его химерных генов.
Описанный в патенте US 11021758 B2 метод обладает преимуществом, а именно возможностью детектировать все химерные продукты исследуемого гена, независимо от 5'-гена партнера и точного расположения точки химеризации. Однако этот метод не позволяет судить об экспрессии функционально значимой части гена ALK, кодирующей тирозинкиназный домен, поскольку детекция осуществляется заданным набором праймеров, специфичным к 3'-нетранслируемой области гена ALK. Описанный метод также не позволяет судить о транслокациях генов, отличных от ALK.
В настоящей заявке заявлен способ детекции транслокаций гена ALK в парафинизированных опухолевых образцах, основанный на анализе данных глубокого секвенирования тотальной мРНК. РНК-секвенирование не ограничено набором специфических праймеров и потенциально позволяет детектировать дисбаланс всех экспрессирующихся в образце генов. Также применение РНК-секвенирования позволяет объединить детекцию химерных генов ALK с определением других клинически значимых биомаркеров в одной экспериментальной процедуре.
КРАТКОЕ ИЗЛОЖЕНИЕ ИЗОБРЕТЕНИЯ
Техническим результатом данного изобретения является создание эффективного подхода к детекции структурных изменений гена ALK в раковых опухолях.
Описанный в настоящем изобретении подход заключается в анализе характера экспрессии гена ALK с целью детектировать дисбаланс экспрессии 5' и 3'-частей гена. Описанный в изобретении подход решает задачу детекции клинически значимого биомаркера - перестройки гена ALK, приведшей к его функциональному усилению, в различных типах опухолевых образцов, в том числе фиксированных в формалине парафинизированных образцах.
В качестве исходных данных представленный способ использует результаты транскриптомных исследований образцов клеток и тканей индивидуальных больных. В качестве биоматериала для исследования используются свежие, парафинизированные или законсервированные иным путем образцы опухолевой ткани или физиологических жидкостей, содержащих опухолевые клетки или фрагменты нуклеиновых кислот опухолевых клеток. Исследованием, предоставляющим исходные данные для способа, может быть транскриптомное профилирование: высокопроизводительное профилирование экспрессии генов на уровне РНК с использованием глубокого секвенирования тотальной мРНК.
На основе результатов транскриптомного профилирования, представленный способ детектирует дисбаланс экспрессии 5' и 3'-частей гена ALK, что свидетельствует о наличии в образце химерного продукта гена ALK.
Заявленный технический результат достигается посредством способа детекции транслокаций гена ALK в парафинизированных опухолевых образцах с помощью РНК-секвенирования путем оценки характера покрытия гена ALK прочтениями РНК-секвенирования, который состоит по меньшей мере из следующих этапов:
(а) получают образец ткани пациента, имеющей пролиферативный фенотип или образец физиологической жидкости, содержащей фрагменты нуклеиновых кислот опухолевых клеток;
(б) получают данные по экспрессии тотальной мРНК;
(в) получают данные из контрольной группы образцов ткани, не имеющей детектируемых химерных генов ALK, при этом контрольный образец получают из пролиферативной ткани того же типа, что и указанная ткань пациента, и тип данных, получаемых из контрольного образца, совпадает с типом данных, полученных на стадии (б);
(г) картируют прочтения РНК-секвенирования на экзоны гена ALK и нормализуют полученное число прочтений путем деления числа на длину соответствующего экзона и суммарное число прочтений в образце;
(д) сравнивают уровень покрытия экзонов 5' и 3'-частей гена ALK, при этом детекция статистически значимого различия - признак наличия химерного продукта гена ALK в образце: (i) применяют статистические тесты, например t-тест, для детекции значимой разницы покрытия 5' и 3'-частей гена ALK; (ii) проводят сравнение уровня покрытия экзонов 5' и 3'-частей гена ALK со средним уровнем покрытия соответствующих экзонов гена ALK контрольной группы.
КРАТКОЕ ОПИСАНИЕ РИСУНКОВ
Сущность изобретения поясняется рисунками, на которых:
Фиг. 1. Диаграмма покрытия экзонов гена ALK прочтениями РНК-секвенирования в образце с химерным транскриптом ALK-9.
Фиг. 2. Диаграмма покрытия экзонов гена ALK в образце с химерным транскриптом ALK-9 и в образцах контрольной группы (среднее значение). * - превышение уровня покрытия экзона в образце ALK-9 95%-го процентиля уровня покрытия экзона контрольной группы.
Эти рисунки не охватывают и, кроме того, не ограничивают весь объем вариантов реализации данного технического решения, а представляют собой только иллюстративный материал частного случая его реализации.
ВАРИАНТ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Далее будет описан вариант выполнения способа детекции транслокаций гена ALK в парафинизированных опухолевых образцах с помощью РНК-секвенирования путем оценки характера покрытия гена ALK прочтениями РНК-секвенирования.
В описании данного изобретения термины «включает» и «включающий» интерпретируются как означающие «включает, помимо всего прочего». Указанные термины не предназначены для того, чтобы их истолковывали как «состоит только из».
Под «пациентом», следует понимать человека (предпочтительно) или другое млекопитающее. Под «тканью» пациента или субъекта следует понимать значение, принятое в медицинской литературе - это система клеток и межклеточного вещества, объединенных общим происхождением, строением и выполняемыми функциями. В описании данного изобретения это может быть кровь, твердая ткань различного происхождения (например, эпителиальная, соединительная, нервная или мышечная) или часть любого органа пациента или субъекта.
Под образцом ткани пациента, имеющим пролиферативный фенотип, понимают образец опухолевой ткани, клетки которой обладают способностью к неконтролируемому делению в результате патологического изменения (обычно в результате изменения генетического аппарата клеток). Такой образец может быть частью доброкачественной или злокачественной опухоли.
Под пролиферативным или онкологическим заболеванием понимают заболевание, характеризуемое патологическим изменением генетического аппарата клеток, приводящее к неконтролируемому делению определенной популяции клеток. Примерами пролиферативных заболеваний могут служить миелопролиферативные заболевания, лимфопролиферативные заболевания, пролиферативные заболевания соединительной ткани и другие заболевания.
Под данными по экспрессии тотальной мРНК следует понимать данные, показывающие абсолютное или относительное количество всех или более 300 видов молекул мРНК в образце.
Под “картированием прочтений” стоит понимать биоинформатический метод анализа результатов секвенирования, состоящий в определении позиций в референсном геноме, откуда с наибольшей вероятностью могло быть получено каждое конкретное прочтение.
Под “покрытием экзона” стоит понимать количество прочтений, которые частично или полностью картируются на некоторый участок экзона исследуемого гена.
Под “5'-частью” стоит понимать часть полинуклеотида (гена или транскрипта), расположенную ближе к 5'-концу полинуклеотида относительно 3'-части, но не обязательно включающую большую часть 5'-части гена. Применительно к химерным продуктам ALK и транслокациям “5'-часть” означает область, расположенную в направлении 5', то есть до точки химеризации/точки разрыва.
Под “3'-частью” стоит понимать часть полинуклеотида (гена или транскрипта), расположенную ближе к 3'-концу полинуклеотида относительно 5'-части, но не обязательно включающую большую часть 3'-части гена. Применительно к химерным продуктам ALK и транслокациям “3'-часть” означает область, расположенную в направлении 3', то есть после точки химеризации/точки разрыва.
При описании известных химерных генов ALK и их транскриптов “5'-часть” и “3'-часть” обозначают, как правило, регионы, расположенные по разные стороны от точки разрыва и являющиеся частями разных генов. При анализе неизвестных транскриптов следует предполагать, что точка химеризации максимально отдалена от 5'- и 3'-частей, чтобы охватить для анализа максимальное число потенциальных мест слияния. Такой подход позволяет включить в анализ как можно большее число потенциальных химерных продуктов ALK, которые могут возникнуть в любом месте между 5'- и 3'-частями.
Если не определено отдельно, технические и научные термины в данном описании имеют стандартные значения, общепринятые в научной и технической литературе.
Представленный подход решает задачу обнаружения химерных продуктов гена ALK в различных типах образцов пролиферативной ткани для более эффективного назначения противораковой терапии при помощи технологии, основанной на анализе дисбаланса покрытия экзонов генов прочтениями РНК-секвенирования.
В качестве образцов патологической ткани могут браться образцы свежей, парафинизированной или законсервированной иным способом ткани, либо образцы физиологических жидкостей пациента, содержащих фрагменты нуклеиновых кислот опухолевых клеток. В предпочтительном варианте осуществления изобретения анализ ткани производится у пациента с пролиферативным или онкологическим заболеванием ткани. Также для патологической ткани предпочтительно проводить анализ наиболее гистологически и цитологически гомогенного участка ткани пациента, имеющей пролиферативный фенотип. Для этого возможно проводить дополнительную очистку ткани, имеющей пролиферативный фенотип, от других окружающих ее тканей с помощью методов, известных специалистам.
Способ эффективен для анализа данных по экспрессии РНК генов в различных типах образцов.
Первой решаемой технической задачей (1) является картирование прочтений РНК-секвенирования на экзоны гена ALK исходя из полнотраскриптомных данных.
При этом первая техническая задача разделяется на ряд подзадач:
1.1. Получение транскриптомных данных для анализируемого образца.
1.2. Картирование прочтений на экзоны гена ALK и их нормализация.
Второй решаемой технической задачей (2) является анализ характера покрытия экзонов 5'- и 3'-частей гена ALK для детекции дисбаланса экспрессии.
Вторая техническая задача разделяется на следующие подзадачи:
2.1. Сравнение уровня покрытия экзонов 5'- и 3'-частей с помощью статистических методов, например, t-test.
2.2. Сравнение уровня покрытия отдельных экзонов со средним уровнем покрытия соответствующих экзонов в контрольной группе образцов (образцы того же типа пролиферативной ткани, в которых химерные продукты обнаружены не были) и детекция превышения 95% перцентиля покрытия экзонов 3'-части гена анализируемого образца.
Общая схема способа
В сравнении с существующим наиболее близким известным методом, представленное изобретение обладает рядом преимуществ. Во-первых, применение РНК-секвенирования позволяет анализировать характер экспрессии всех генов в образце, то есть потенциально возможно детектировать химерные продукты всех известных генов, в том числе ALK. В то время как анализ на основе ПЦР ограничен набором праймеров, комплиментарных к последовательностям конкретного гена или ограниченного набора генов. Во-вторых, способ РНК-секвенирования позволяет комбинировать определение различных биомаркеров в одной экспериментальной процедуре, что сокращает время анализа и подбора терапии. В-третьих, в отличие от алгоритмов, основанных на поиске химерных прочтений, представленный способ адаптирован для анализа в том числе парафинизированных материалов, степень деградации нуклеиновых кислот в которых повышена.
Анализ дисбаланса покрытия экзонов
Для детекции значимой разницы уровней экспрессии 5'- и 3'-частей гена ALK предложено два подхода:
1. Применение статистических тестов, например предлагается использовать t-тест, для сравнения уровня покрытия экзонов, составляющих 5'- и 3'-части гена ALK. Детекция в результате применения статистического критерия статистически значимого превышения уровня покрытия экзонов 3'-части над 5'-частью свидетельствует о дисбалансе экспрессии гена ALK и, следовательно, о наличии продуктов его перестройки в образце (фиг. 1). Данный подход не требует дополнительной информации о характере покрытия экзонов гена ALK в образцах контрольной группы без химерных продуктов, что позволяет применять его непосредственно для анализа любых полнотранскриптомных данных. Однако для применения данного подхода необходима предварительная информация об ожидаемом положении точки разрыва/химеризации для корректного объединения экзонов анализируемого гена в группы 5' и 3'-частей, то есть расположенных до и после точки химеризации. В настоящем изобретении указано, что в состав 3'-части гена ALK должен входить тирозинкиназный домен, картируемый экзонами 20-24. Кроме того, применение статистического t-теста невозможно для анализа химерных транскриптов, которые образованы в результате слияния первого экзона 3'-гена с экзонами 5'-партнера, а также второго экзона, поскольку в этом случае только один экзон оказывается расположен до точки химеризации и применение статистических тестов для детекции значимой разницы покрытия экзонов до/после точки химеризации невозможно.
2. Детекция экзонов ALK, превышающих 95% процентиль уровня покрытия соответствующих экзонов в образцах того же типа пролиферативной ткани, в которых химерных продуктов не обнаружено (фиг. 2). Данный подход основан на сравнении уровня покрытия каждого экзона со средним уровнем покрытия соответствующего экзона в контрольной группе. Если покрытие большинства экзонов 5'-части гена ALK значимо превышает средний уровень покрытия контрольной группы и в то же время уровень покрытия экзонов 3'-части гена ALK значимо не превышают средний уровень покрытия соответствующих экзонов контрольной группы, то следует сделать вывод о наличии в образце химерного продукта с 5'-частью гена ALK. Преимущество данного подхода - отсутствие необходимости в предварительно оценки положения точки химеризации, при этом разделение гена ALK на 5'- и 3'-части может быть основано на знании о клинической значимости химерных продуктов. Например, важным является критерий включения в химерных продукт, т.е. в 5'-часть, экзонов, кодирующих тирозинкиназный домен (экзоны 20-24 для гена ALK). Ограничение описываемого способа - необходимость в группе сравнения, то есть в транскриптомных данных, полученных и обработанных тем же способом, что и исследуемые данные, для группы образцов того же типа заболевания без химерных продуктов гена ALK.
Нижеследующие примеры работы способа приведены в целях раскрытия характеристик настоящего изобретения и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения.
Пример 1. Детекция дисбаланса покрытия экзонов гена ALK в образце рака легкого статистическим тестом.
Фиксированный в формалине парафинизированный образец рака легкого ALK-9 с подтвержденным в клинической лаборатории химерным геном EML4-ALK был получен для валидации представленного способа. Сначала была выделена тотальная РНК и проведено полнотраскриптомное секвенирование. Для удаления рРНК и приготовления библиотек использовали KAPA RNA HyperPrep Kit with RiboErase (HMR) (Roche Sequencing, США). Различные адаптеры KAPA UDI Primer Mix (Roche Sequencing, США) использовались для объединения образцов в одном запуске. Секвенирование проводили на приборе Illumina NextSeq 550 в режиме прочтения с одного конца, длина прочтения 50 пар оснований, расчетная глубина 30 миллионов «сырых» прочтений на образец. Качество запуска анализировалось программным обеспечением Illumina SAV. Для демультиплексирования использовали программу Illumina Bcl2fastq2 v2.17.
Для образца было получено 9490295 уникально картированных прочтений. Для расчета уровня покрытия экзонов использовали пакет программного обеспечения BEDtools multicov с параметрами «по умолчанию». В качестве входных файлов были BAM (Binary Alignment/Map) файл результатов РНК-секвенирования соответствующего образца и BED (Browser Extensible Data) файл, содержащий координаты экзонов транскрипта гена ALK ENST00000389048.8, входящего в проект MANE (Matched Annotation between NCBI and EBI). Полученные значения числа прочтений нормировали на длину соответствующего экзона и глубину секвенирования образца.
Получили картину распределения прочтений (фиг. 1). Обнаружена значимая разница уровней покрытия 5' и 3'-частей гена ALK, которая подтверждается статистическим тестом: t-test, p-value = 3*10-6. В область экзонов с амплифицированным сигналом попадают также и экзоны 20-24, кодирующие тирозинкиназный домен ALK. По итогам анализа сделан вывод о наличии перестройки гена ALK в исследованном образце.
Пример 2. Детекция дисбаланса покрытия экзонов гена ALK в образце рака легкого путем сравнения с покрытием экзонов контрольной группы.
Для исследуемого образца анализировали нормализованные данные покрытия экзонов гена ALK, полученные в примере 1. Группа сравнения - контрольная группа, содержащая 53 образца рака легкого, в которых не детектировано химерных транскриптов и для которых получены и нормированы транскриптомные данные, согласно описанию из примера 1. Затем сравнивали уровень покрытия каждого экзона гена ALK в исследуемом образце с 95-й перцентилью уровня покрытия соответствующего экзона в образцах контрольной группы.
Неравномерная экспрессия экзонов гена ALK, свидетельствующая о наличии химерного продукта, подтверждается: в то время как уровень покрытия экзонов 5'-части (т.е. расположенных до точки химеризации) не превышает 95% перцентиль, 10 из 10 экзонов 3'-части превышают эту границу. В область экзонов с амплифицированным сигналом попадают также и экзоны 20-24, кодирующие тирозинкиназный домен ALK. По итогам анализа сделан вывод о наличии перестройки гена ALK в исследованном образце.
Таким образом, применение обоих предложенных критериев позволяет детектировать химерные гены ALK в опухолевых образцах без предварительного знания о втором гене-партнере химерного продукта или точном положении точки химеризации.
При использовании изобретения достигается следующий технический результат: разработан новый, эффективный способ детекции химерных генов ALK в различных типах опухолевых образцов, включая фиксированные в формалине парафинизированные ткани. Данный способ может быть автоматизирован, что предотвращает потенциальные ошибки, связанные с ручным расчетом, и позволяет потенциально обнаружить продукты всех экспрессируемых в образце химерных генов ALK.
ПРОМЫШЛЕННАЯ ПРИМЕНИМОСТЬ
Настоящее изобретение предназначено для использования в персонализированной онкологии.
Claims (6)
- Способ детекции транслокаций гена ALK в парафинизированных опухолевых образцах с помощью РНК-секвенирования путем оценки характера покрытия гена ALK прочтениями РНК-секвенирования, состоящий по меньшей мере из следующих этапов:
- (а) получают образец ткани пациента, имеющей пролиферативный фенотип или образец физиологической жидкости, содержащей фрагменты нуклеиновых кислот опухолевых клеток;
- (б) получают данные по экспрессии тотальной мРНК;
- (в) получают данные из контрольной группы образцов ткани, не имеющей детектируемых химерных генов ALK, при этом контрольный образец получают из пролиферативной ткани того же типа, что и указанная ткань пациента, и тип данных, получаемых из контрольного образца, совпадает с типом данных, полученных на стадии (б);
- (г) картируют прочтения РНК-секвенирования на экзоны гена ALK и нормализуют полученное число прочтений путем деления числа на длину соответствующего экзона и суммарное число прочтений в образце;
- (д) сравнивают уровень покрытия экзонов 5’ и 3’-частей гена ALK, детекция значимой разницы - признак наличия химерного продукта анализируемого гена в образце: (i) применяют статистические тесты, например t-тест, для детекции статистически значимой разницы покрытия 5’ и 3’-частей гена ALK; (ii) сравнение уровня покрытия экзонов 5’ и 3’-частей гена ALK со средним уровнем покрытия соответствующих экзонов гена ALK контрольной группы.
Publications (1)
Publication Number | Publication Date |
---|---|
RU2812346C1 true RU2812346C1 (ru) | 2024-01-30 |
Family
ID=
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019231259A1 (ko) * | 2018-06-01 | 2019-12-05 | 주식회사 제놉시 | 불안정한 세포유리 dna 검출 방법 및 이를 이용한 장치 |
RU2020100096A (ru) * | 2020-01-10 | 2021-07-12 | Общество С Ограниченной Ответственностью «Онкотест-Диагностика» | Способ параллельного выявления драйверных мутаций и транслокаций при раке легкого на единой диагностической платформе |
RU2020142821A (ru) * | 2018-06-01 | 2022-07-12 | Джинопси Ко., Лтд. | Способ детекции нестабильной внеклеточной днк и устройство с его использованием |
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019231259A1 (ko) * | 2018-06-01 | 2019-12-05 | 주식회사 제놉시 | 불안정한 세포유리 dna 검출 방법 및 이를 이용한 장치 |
RU2020142821A (ru) * | 2018-06-01 | 2022-07-12 | Джинопси Ко., Лтд. | Способ детекции нестабильной внеклеточной днк и устройство с его использованием |
RU2020100096A (ru) * | 2020-01-10 | 2021-07-12 | Общество С Ограниченной Ответственностью «Онкотест-Диагностика» | Способ параллельного выявления драйверных мутаций и транслокаций при раке легкого на единой диагностической платформе |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
García-Foncillas et al. | Incorporating BEAMing technology as a liquid biopsy into clinical practice for the management of colorectal cancer patients: an expert taskforce review | |
Crowley et al. | Liquid biopsy: monitoring cancer-genetics in the blood | |
Mohan et al. | Profiling of circulating free DNA using targeted and genome-wide sequencing in patients with SCLC | |
Sabari et al. | Changing the therapeutic landscape in non-small cell lung cancers: the evolution of comprehensive molecular profiling improves access to therapy | |
EP3464593B1 (en) | Molecular tagging methods and sequencing libraries | |
Cheng et al. | Co-development of a companion diagnostic for targeted cancer therapy | |
US11827938B2 (en) | Methods of prostate cancer prognosis | |
Gleeson et al. | Endoscopic ultrasound fine-needle aspiration cytology mutation profiling using targeted next-generation sequencing: personalized care for rectal cancer | |
US20190276897A1 (en) | Egfr and pten gene alterations predicts survival in patients with brain tumor | |
Dong et al. | Elevated CD44 expression predicts poor prognosis in patients with low‑grade glioma | |
WO2017047102A1 (en) | Biomarker for cancer and use thereof | |
CN110004229A (zh) | 多基因作为egfr单克隆抗体类药物耐药标志物的应用 | |
JP2020511137A (ja) | cfRNAに関する液体生検 | |
Del Re et al. | The amount of DNA combined with TP53 mutations in liquid biopsy is associated with clinical outcome of renal cancer patients treated with immunotherapy and VEGFR-TKIs | |
Qi et al. | Blood digital polymerase chain reaction as a potential method to detect human epidermal growth factor receptor 2 amplification in non-small cell lung cancer | |
JP2022528182A (ja) | 神経膠腫の診断用または予後予測用の組成物、及びそれに係わる情報を提供する方法 | |
RU2812346C1 (ru) | Способ оценки детекции транслокаций гена alk в парафинизированных опухолевых образцах с помощью рнк-секвенирования | |
JP2022513003A (ja) | 体細胞変異のための方法およびシステム、ならびにそれらの使用 | |
RU2814710C1 (ru) | Способ детекции транслокаций генов тирозинкиназных рецепторов в образцах опухолевой ткани с использованием данных рнк-секвенирования | |
US20190352704A1 (en) | Benign thyroid nodule-specific gene | |
KR20230025895A (ko) | 순환 종양 핵산 분자의 다중모드 분석 | |
Lim et al. | Circulating tumor DNA—From bench to bedside | |
Koba et al. | Molecular features of tumor-derived genetic alterations in circulating cell-free DNA in virtue of autopsy analysis | |
RU2818360C1 (ru) | Способ создания таргетной панели для исследования геномных регионов для выявления терапевтических биомаркеров ингибиторов иммунных контрольных точек (ИКТ) | |
TWI670498B (zh) | 一種用以評估大腸直腸癌肝轉移病患之預後的方法 |