RU2817869C1 - Method for assessing status of 14th exon of met gene according to rna sequencing data - Google Patents

Method for assessing status of 14th exon of met gene according to rna sequencing data Download PDF

Info

Publication number
RU2817869C1
RU2817869C1 RU2023122817A RU2023122817A RU2817869C1 RU 2817869 C1 RU2817869 C1 RU 2817869C1 RU 2023122817 A RU2023122817 A RU 2023122817A RU 2023122817 A RU2023122817 A RU 2023122817A RU 2817869 C1 RU2817869 C1 RU 2817869C1
Authority
RU
Russia
Prior art keywords
exon
met gene
exons
reads
rna sequencing
Prior art date
Application number
RU2023122817A
Other languages
Russian (ru)
Inventor
Антон Александрович Буздин
Елизавета Николаевна Рабушко
Даниил Витальевич Луппов
Максим Игоревич Сорокин
Елена Владимировна Поддубская
Мария Владимировна Сунцова
Виктор Сергеевич Ткачев
Александр Михайлович Симонов
Original Assignee
Общество С Ограниченной Ответственностью "Онкобокс"
Filing date
Publication date
Application filed by Общество С Ограниченной Ответственностью "Онкобокс" filed Critical Общество С Ограниченной Ответственностью "Онкобокс"
Application granted granted Critical
Publication of RU2817869C1 publication Critical patent/RU2817869C1/en

Links

Abstract

FIELD: biotechnology.
SUBSTANCE: described is a method for evaluating status of 14th exon of the MET gene by RNA sequencing data. Method comprises the steps of obtaining a biological material suitable for RNA sequencing, obtaining RNA sequencing data from the material, obtaining data on mapping reads to exons of the human MET gene, counting the number of SJ reads per junction of 13th and 15th exons and passed the quality control, and comparing it with threshold, user-defined and selected based on the required rigor and accuracy of determining the presence of such readings, calculating the normalized level of asymmetry of 13th, 14th and 15th exons and comparing it with a threshold defined by the user and selected based on the analysis of clinical samples, and analysing the results, in which, when all selected thresholds are overcome, a conclusion is made on the presence in the sample of the MET gene with skipping 14th exon.
EFFECT: improved detection of missing 14th exon of MET gene based on RNA sequencing data.
2 cl, 2 dwg, 4 ex

Description

ОБЛАСТЬ ТЕХНИКИTECHNICAL FIELD

Заявленное изобретение относится к персонализированной медицине для онкологических заболеваний, а именно к способу поддержки принятия клинических решений с использованием анализа данных РНК секвенирования, основанного на детекции прочтений, картированных на стыки экзонов и асимметрии покрытия прочтениями гена MET.The claimed invention relates to personalized medicine for cancer, namely to a method for supporting clinical decision-making using RNA sequencing data analysis based on detection of reads mapped to exon junctions and asymmetry of MET gene read coverage.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИBACKGROUND ART

Известны различные способы поддержки принятия клинических решений с использованием анализа данных РНК секвенирования на основе анализа транскриптов гена MET, например способ идентификации больного раком, который, вероятно, ответит на лечение антагонистом продукта гена MET (см. US2012089541A1, опубл.12.04.2012), включающий стадию определения уровня экспрессии C-MET. При высоком уровне этого биомаркера делается вывод, что пациент, вероятно, ответит на лечение антагонистом продукта этого гена.Various methods are known to support clinical decision making using analysis of RNA sequencing data based on analysis of MET gene transcripts, for example, a method for identifying a cancer patient who is likely to respond to treatment with an antagonist of the MET gene product (see US2012089541A1, publ. 04/12/2012), including the stage of determining the level of C-MET expression. When the level of this biomarker is high, it is concluded that the patient is likely to respond to treatment with an antagonist of this gene product.

На сегодняшний день наиболее надежным и не требующим дополнительных манипуляций с биологическим материалом способом оценки статуса 14-го экзона MET является способ, основанный на детекции прочтений, картированных на стыки экзонов и асимметрии покрытия прочтениями гена MET.Today, the most reliable and does not require additional manipulations with biological material method for assessing the status of the 14th exon of MET is a method based on the detection of reads mapped to exon junctions and asymmetry of read coverage of the MET gene.

Делеция 14-го экзона в транскрипте гена MET может привести к онкотрансформации клетки по нескольким механизмам. Такая изоформа встречается приблизительно в 3% всех опухолей пациентов, страдающих немелкоклеточным раком легкого. В 2020 году были одобрены для клинического применения два препарата-конкуренты аденозинтрифосфата (АТФ), специфично ингибирующие MET с пропуском 14-го экзона капматиниб (capmatinib) и тепотиниб (tepotinib). Эффективность этих препаратов для лечения немелкоклеточного рака легкого с пропуском 14-го экзона MET была доказана в ходе клинических испытаний, и они были одобрены для лечения данной патологии в нескольких странах. [https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8290191/].Deletion of the 14th exon in the MET gene transcript can lead to oncological transformation of the cell through several mechanisms. This isoform occurs in approximately 3% of all tumors of patients suffering from non-small cell lung cancer. In 2020, two adenosine triphosphate (ATP) competitor drugs that specifically inhibit MET exon 14 skipping, capmatinib and tepotinib, were approved for clinical use. These drugs have been shown to be effective in treating MET exon 14 skipping non-small cell lung cancer in clinical trials and have been approved in several countries. [https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8290191/].

Поэтому для эффективной терапии этими и другими препаратами, специфично воздействующими на MET с пропуском 14-го экзона, необходимо корректно детектировать эту изоформу.Therefore, for effective therapy with these and other drugs that specifically target MET with exon 14 skipping, it is necessary to correctly detect this isoform.

Существуют несколько методов детекции данной изоформы, а именно: основанная на секвенировании ДНК диагностическая платформа Illumina TruSight Tumor 26 assay [https://support.illumina.com/downloads/trusight_tumor_product_files.html], основанная на секвенировании РНК ArcherDx FusionPlex Solid Tumor assay [https://archerdx.com/research-products/solid-tumor-research/fusionplex-solid-tumor/] и система, основанная на ПЦР в реальном времени (см. US20170327887A1, опубл. 16.11.2017), выбранная заявителем в качестве наиболее близкого аналога. Все эти методики направлены на оценку мутационного статуса лишь малого числа геномных локусов, в число которых входит и ген MET, и уступают в количестве получаемой информации РНК-секвенированию опухолевого материала [https://www.sciencedirect.com/science/article/pii/S1556086419300073].There are several methods for detecting this isoform, namely: the DNA sequencing-based diagnostic platform Illumina TruSight Tumor 26 assay [https://support.illumina.com/downloads/trusight_tumor_product_files.html], based on RNA sequencing ArcherDx FusionPlex Solid Tumor assay [https http://archerdx.com/research-products/solid-tumor-research/fusionplex-solid-tumor/] and a system based on real-time PCR (see US20170327887A1, published 11/16/2017), selected by the applicant as the most a close analogue. All these methods are aimed at assessing the mutational status of only a small number of genomic loci, which include the MET gene, and are inferior in the amount of information obtained to RNA sequencing of tumor material [https://www.sciencedirect.com/science/article/pii/ S1556086419300073].

Соответственно, используя вышеупомянутые методы, невозможно одновременно оценить статус MET и уровень экспрессии большинства других генов - проведение процедуры РНК-секвенирования необходимо будет осуществлять отдельно, что, в частности, необходимо для работы систем персонализированной медицины, таких как Онкобокс [doi: 10.1007/978-1-0716-0138-9_17].Accordingly, using the above methods, it is impossible to simultaneously assess the MET status and the expression level of most other genes - the RNA-sequencing procedure will need to be carried out separately, which, in particular, is necessary for the operation of personalized medicine systems, such as Oncobox [doi: 10.1007/978- 1-0716-0138-9_17].

Предлагаемый способ является простым и надежным методом выявления пропуска 14-го экзона гена MET по данным РНК-секвенирования. The proposed method is a simple and reliable method for detecting the skipping of the 14th exon of the MET gene using RNA-seq data.

КРАТКОЕ ИЗЛОЖЕНИЕ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION

Техническим результатом данного изобретения является улучшение детекции пропуска 14го экзона гена MET на основе данных РНК секвенирования. Изобретение призвано улучшить системы персонализированной медицины путем внедрения возможности детекции пропуска 14го экзона гена MET непосредственно по данным профилей тотального РНК-секвенирования библиотек опухолевых тканей.The technical result of this invention is to improve the detection of skipping the 14th exon of the MET gene based on RNA sequencing data. The invention is intended to improve systems of personalized medicine by introducing the possibility of detecting the skipping of the 14th exon of the MET gene directly based on total RNA-sequencing profiles of tumor tissue libraries.

Заявленный технический результат достигается посредством способа оценки выявления статуса 14 экзона гена MET по данным РНК секвенирования, который состоит по меньшей мере из следующих шагов:The claimed technical result is achieved by means of a method for assessing the detection of the status of exon 14 of the MET gene according to RNA sequencing data, which consists of at least the following steps:

а) получения биологического материала (образец ткани пациента или его физиологические жидкости), пригодного для РНК секвенирования;a) obtaining biological material (a patient’s tissue sample or physiological fluids) suitable for RNA sequencing;

б) получения данных РНК секвенирования из материала пункта (а);b) obtaining RNA sequencing data from the material in point (a);

в) получения из данных пункта (б) данных о картировании прочтений на экзоны гена MET человека, в том числе о картировании на стыки экзонов;c) obtaining from the data in point (b) data on mapping reads to exons of the human MET gene, including mapping to exon junctions;

г) подсчета количества SJ прочтений, приходящихся на стык 13 и 15 экзонов и прошедших контроль качества, и сравнение его с выбранным порогом;d) counting the number of SJ reads at the junction of exons 13 and 15 that have passed quality control, and comparing it with the selected threshold;

д) подсчета нормированного уровня асимметрии покрытия 13, 14 и 15-го экзонов, и сравнение его с выбранным порогом, абсолютное значение которого должно быть достаточно большим, для заключения о том, что 14-й экзон был пропущен;e) calculating the normalized level of coverage asymmetry of the 13th, 14th and 15th exons, and comparing it with a selected threshold, the absolute value of which should be large enough to conclude that the 14th exon was skipped;

е) анализа результатов пунктов (в) и (г), при котором при преодолении всех выбранных порогов, описанных в пунктах (в) и (г), делается вывод о наличии в образце гена MET с пропуском 14-го экзона. f) analysis of the results of points (c) and (d), in which, when all selected thresholds described in points (c) and (d) are overcome, a conclusion is made about the presence of the MET gene with the skipping of the 14th exon in the sample.

В предпочтительном варианте выполнения при преодолении только одного из порогов (либо в пункте (в), либо в пункте (г)) биологический материал, из которого были получены данные РНК секвенирования, подвергается дополнительной проверке, позволяющей оценить статус 14-го экзона гена MET в этом биологическом материале. Если пороги пунктов (в) и (г) не были преодолены, делается вывод о том, что в образце нет транскриптов, соответствующих гену MET без 14-го экзона.In a preferred embodiment, when only one of the thresholds (either in point (c) or in point (d)) is passed, the biological material from which the RNA sequencing data was obtained is subjected to additional testing to assess the status of the 14th exon of the MET gene in this biological material. If the thresholds of points (c) and (d) have not been passed, it is concluded that there are no transcripts in the sample corresponding to the MET gene without exon 14.

КРАТКОЕ ОПИСАНИЕ РИСУНКОВBRIEF DESCRIPTION OF DRAWINGS

Сущность изобретения поясняется рисунками, на которых;The essence of the invention is illustrated by drawings in which;

Фиг. 1. Визуализация уровня покрытия, полученная при обработке данных РНК секвенирования опухоли с экспрессией гена MET c пропущенным 14 экзоном (можно заметить низкую степень покрытия 14-го экзона по сравнению с соседними с ним экзонами)Fig. 1. Visualization of the level of coverage obtained by processing RNA sequencing data of a tumor with expression of the MET gene with exon 14 missing (you can notice the low degree of coverage of the 14th exon compared to its neighboring exons)

Фиг. 2. Диаграмма размаха, показывающая распределение нормированных на длину средних разностей 14 и 13 и 14 и 15 экзонов. Красным отмечены образцы с прочтениями, приходящимися на стык 13 и 15 экзонов.Fig. 2. Range diagram showing the distribution of length-normalized mean differences of exons 14 and 13 and exons 14 and 15. Samples with reads located at the junction of exons 13 and 15 are marked in red.

Эти рисунки не охватывают и, кроме того, не ограничивают весь объем вариантов реализации данного технического решения, а представляют собой только иллюстративный материал частного случая его реализации.These drawings do not cover and, moreover, do not limit the entire scope of implementation options for this technical solution, but represent only illustrative material of a particular case of its implementation.

ВАРИАНТ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯOPTION FOR IMPLEMENTATION OF THE INVENTION

Далее будет описан вариант выполнения способа оценки статуса 14-го экзона гена MET по данным РНК секвенирования, который не ограничивает все варианты осуществления заявленного изобретения.Next, an embodiment of a method for assessing the status of the 14th exon of the MET gene according to RNA sequencing data will be described, which does not limit all embodiments of the claimed invention.

МЕТ представляет собой тирозинкиназу и протоонкоген, кодируемый на 7ой хромосоме. Активированный MET индуцирует сигнальные пути, участвующие в выживании и пролиферации клеток. MET is a tyrosine kinase and proto-oncogene encoded on chromosome 7. Activated MET induces signaling pathways involved in cell survival and proliferation.

Мутации в MET связаны с рядом видов рака, включая рак почек, желудка, нервной системы, саркомы и рак легких. Мутации, которые приводят к более высокой экспрессии или делеции некоторых экзонов, часто связаны с этими видами рака. В частности, делеция 14-го экзона и связана со значительным процентом случаев немелкоклеточного рака легкого и аденокарциномы. MET обычно не деградирует при потере 14-го экзона. Возникающая в результате дисрегуляция MET вызывает устойчивую активацию нижестоящих путей пролиферации и выживания клеток. Мутации, которые вызывают делеции экзона 14 MET, являются гетерогенными, часто затрагивая акцепторные или донорные сайты сплайсинга.Mutations in MET are associated with a number of cancers, including kidney, gastric, nervous system, sarcoma and lung cancer. Mutations that result in higher expression or deletion of certain exons are often associated with these cancers. In particular, deletion of exon 14 is associated with a significant percentage of cases of non-small cell lung cancer and adenocarcinoma. MET is not typically degraded upon loss of exon 14. The resulting dysregulation of MET causes sustained activation of downstream cell proliferation and survival pathways. Mutations that cause deletions of MET exon 14 are heterogeneous, often affecting acceptor or donor splice sites.

Обнаружение пропуска 14-го экзона гена MET позволит назначить пациенту препараты, демонстрирующие высокую эффективность против этой изоформы, такие как капматиниб (capmatinib) и тепотиниб (tepotinib)Detection of missing exon 14 of the MET gene will allow the patient to be prescribed drugs that demonstrate high efficacy against this isoform, such as capmatinib and tepotinib.

Системы персонализированной медицины, такие как Онкобокс [US11614434, опубл. 28.03.2023], применяют РНК секвенирование для предоставления рекомендаций по терапии пациентов со злокачественными новообразованиями.Personalized medicine systems such as Oncobox [US11614434, publ. 03/28/2023], use RNA sequencing to provide recommendations for the treatment of patients with malignant neoplasms.

Для картирования прочтений РНК секвенирования могут использоваться такие программы как STAR [https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3530905/], результатом работы которых являются геномные координаты, на которые картировалились те или иные прочтения, в том числе с разрывом внутри них. Ожидается, что большинство прочтений РНК секвенирования будет картироваться на экзоны, причем значения нормированных покрытий каждого экзона, входящего в конечную версию определенного транскрипта того или иного, экспрессирующегося в опухолевой ткани гена, не будет отличаться значительно (оценки допустимых разностей покрытий экзонов будут приведены ниже). В случае, если прочтение картировалось на референсный геном с разрывом, делается вывод о том, что оно пришло со стыка экзонов.To map RNA sequencing reads, programs such as STAR [https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3530905/] can be used, the result of which is the genomic coordinates to which certain reads were mapped, in including with a gap inside them. It is expected that the majority of RNA sequencing reads will be mapped to exons, and the normalized coverage values of each exon included in the final version of a particular transcript of a gene expressed in tumor tissue will not differ significantly (estimates of acceptable differences in exon coverage will be given below). If a read was mapped to a reference genome with a gap, it is concluded that it came from an exon junction.

В заявленном изобретении используются эти данные для детекции прочтений, картированных на стык 13-го и 15-го экзона гена MET. Присутствие таких прочтений может свидетельствовать о том, что 14 экзон в транскрипте гена был пропущен. The claimed invention uses these data to detect reads mapped to the junction of the 13th and 15th exons of the MET gene. The presence of such reads may indicate that exon 14 in the gene transcript was skipped.

Асимметрия покрытий 13, 14 и 15 экзона также проверяется. Неравномерность покрытия этих экзонов прочтениями зачастую связана с тем, что в зрелой мРНК пропущен 14 экзон, соответственно мы ожидаем обнаружить в исследуемом образце только небольшое количество прочтений, картированных на этот участок генома. Поэтому, при наличии пропуска 14-го экзона, средняя разность покрытий прочтениями 14го и 13го, и 14го и 15го экзонов будет детектируемо ниже, чем в случае без пропуска.Asymmetry of the exon 13, 14, and 15 coverages is also tested. The uneven coverage of these exons by reads is often due to the fact that exon 14 is skipped in the mature mRNA; accordingly, we expect to find only a small number of reads mapped to this region of the genome in the sample under study. Therefore, in the presence of a skip in the 14th exon, the average difference in read coverage between the 14th and 13th, and the 14th and 15th exons will be detectably lower than in the case without a skip.

Детектирование двух вышеупомянутых признаков считается достаточным основанием для назначения Capmatinib-а или Tepotinib-а пациенту, страдающему немелкоклеточным раком легкого. Детектирование одного из них может послужить причиной для дальнейшей проверки при помощи ПЦР-РВ со специально подобранными условиями и праймерами или любого другого метода, позволяющего выявить пропуск 14 экзона гена MET.Detection of the above two signs is considered sufficient reason to prescribe Capmatinib or Tepotinib to a patient suffering from non-small cell lung cancer. Detection of one of them may be a reason for further testing using RT-PCR with specially selected conditions and primers or any other method that allows the detection of skipping of exon 14 of the MET gene.

Под образцом РНК, понимают РНК, извлеченную из каких бы то ни было клеток человека.By RNA sample we mean RNA extracted from any human cells.

Под “картированием прочтений” стоит понимать биоинформатический метод анализа результатов секвенирования, состоящий в определении позиций в референсном геноме, откуда с наибольшей вероятностью могло быть получено каждое конкретное прочтение.By “read mapping” we mean a bioinformatics method for analyzing sequencing results, which consists of determining the positions in the reference genome from which each specific read could most likely have been obtained.

Под “SJ прочтениями” или “splice junction прочтениями” стоит понимать прочтения, отнесенные программами для картирования к вероятно картировавшимся на стык двух экзонов. By “SJ reads” or “splice junction reads” we mean reads classified by mapping programs as likely mapped to the junction of two exons.

Под “геномными координатами” стоит понимать позицию в референсном геноме. By “genomic coordinates” we mean a position in the reference genome.

Под “флагом прочтения” стоит понимать характеристику прочтения, указываемую в файлах картирования (.sam, .bam) в виде комбинации бинарных флагов, несущих информацию об определенных свойствах прочтения. By “read flag” we mean a read characteristic indicated in mapping files (.sam, .bam) as a combination of binary flags that carry information about certain read properties.

Под “парой оснований” стоит понимать пару двух азотистых оснований нуклеотидов на комплементарных цепочках нуклеиновых кислот, соединенную с помощью водородных связей.By “base pair” we mean a pair of two nitrogenous nucleotide bases on complementary nucleic acid chains, connected by hydrogen bonds.

Под “покрытием прочтениями” стоит понимать количество прочтений, картированных на определенный участок референсного генома. By “read coverage” we mean the number of reads mapped to a specific region of the reference genome.

Если не определено отдельно, технические и научные термины в данном описании имеют стандартные значения, общепринятые в научной и технической литературе.Unless otherwise defined, technical and scientific terms used in this specification have their standard meanings generally accepted in the scientific and technical literature.

Данный способ детекции пропуска 14-го экзона в транскрипте гена MET призван улучшить системы для подбора терапии больных с онкологическими заболеваниями. Улучшение возможно если в системе используется секвенирование РНК. This method of detecting the skipping of the 14th exon in the MET gene transcript is intended to improve systems for selecting therapy for patients with cancer. Improvement is possible if the system uses RNA sequencing.

Первой решаемой технической задачей (1) является анализ прочтений, картированных на стык экзонов. При этом в нее входят следующие подзадачи:The first technical challenge to be solved (1) is the analysis of reads mapped to exon junctions. It includes the following subtasks:

1.1 Детекция прочтений, приходящихся на стык экзонов 13 и 15 гена MET 1.1 Detection of reads at the junction of exons 13 and 15 of the MET gene

1.2 Анализ качества задетектированных прочтений. 1.2 Analysis of the quality of detected reads.

Второй решаемой задачей (2) является оценка уровня неравномерности покрытия прочтениями экзонов 13, 14, и 15. Данная задача также разбивается на подзадачи:The second task to be solved (2) is to assess the level of uneven coverage of exons 13, 14, and 15 by reads. This task is also divided into subtasks:

2.1 Нахождение прочтений, картированных на экзоны гена MET.2.1 Finding reads mapped to exons of the MET gene.

2.2 Анализ качества картирования каждого из найденных прочтений.2.2 Analysis of the quality of mapping of each of the found reads.

2.3 Подсчет покрытия прочтениями экзонов2.3 Calculation of exon read coverage

2.4 Подсчет асимметрии покрытия экзонов 13, 14 и 15 гена MET 2.4 Calculation of asymmetry coverage of exons 13, 14 and 15 of the MET gene

2.5 Определение границы разности покрытий, после преодоления которой можно считать, что в образце РНК присутствуют транскрипты, соответствующие гену MET c пропущенным 14 экзоном. 2.5 Determination of the coverage difference limit, after which it can be considered that the RNA sample contains transcripts corresponding to the MET gene with exon 14 missing.

Задача пункта 1.1 решается при помощи программ для картирования прочтений, полученных в ходе РНК секвенирования, которые детектируют SJ прочтения. Прочтения, приходящиеся на стык 13 и 15-го экзонов, находятся согласно геномным координатам: геномные координаты одного конца прочтения должны приходиться на 13 экзон, координаты другого - на 15 экзон. The problem of paragraph 1.1 is solved using programs for mapping reads obtained during RNA sequencing, which detect SJ reads. Reads falling at the junction of exons 13 and 15 are located according to genomic coordinates: the genomic coordinates of one end of the read should fall on exon 13, the coordinates of the other end should fall on exon 15.

Контроль качества (пункт 1.2) выполнялся на уровне длины перекрытия: длина перекрытия прочтения с каждым из экзонов должна составлять не менее 10 пар оснований. Quality control (clause 1.2) was performed at the level of overlap length: the length of read overlap with each exon must be at least 10 base pairs.

Для решения задачи 2 также используются данные, сгенерированные при картировании прочтений РНК секвенирования на геном человека.To solve problem 2, we also use data generated by mapping RNA sequencing reads to the human genome.

Задача пункта 2.1 включает в себя нахождение всех прочтений, перекрывающихся с экзонами гена MET. Осуществляется это при помощи программ биоинформатического анализа последовательностей нуклеиновых кислот человека. Objective 2.1 involves finding all reads that overlap exons of the MET gene. This is done using programs for bioinformatics analysis of human nucleic acid sequences.

После нахождения требуемых прочтений происходит их анализ качества (пункт 2.2). Используется метрика качества картирования (mapping quality или MapQ). Прочтение должно преодолевать определенный порог по этой метрике. В зависимости от протокола РНК секвенирования может быть добавлен такой критерий, как направление прочтения (прямое или обратное). Если для выравнивания прочтений используются программы, дополнительно сигнализирующие о непрохождении внутреннего для программы контроля качества прочтения, прочтения, не прошедшие этот контроль также, не включаются в дальнейший анализ. Также на прочтения накладываются требования по качеству картирования: длина перекрытия прочтения с каждым из экзонов должна составлять не менее 10 пар оснований (аналогично пункту 1.2). Прочтения, не обладающие данными свойствами, не включаются в подсчет покрытия. After finding the required readings, their quality is analyzed (clause 2.2). The mapping quality metric (mapQ) is used. Reading must pass a certain threshold for this metric. Depending on the RNA sequencing protocol, a criterion such as read direction (forward or reverse) may be added. If programs that additionally signal failure of the program's internal read quality control are used to align reads, reads that also fail this control are not included in further analysis. Reads are also subject to mapping quality requirements: the overlap length of the read with each exon must be at least 10 base pairs (similar to point 1.2). Reads that do not have these properties are not included in the coverage count.

Вычисление покрытия экзона (пункт 2.3) происходит следующим образом: длины перекрытий с рассматриваемым экзоном всех прочтений, прошедших контроль качества, суммируются и делятся на длину экзона в парах оснований. Интуитивный смысл этой величины заключается в том, что она представляет собой среднее количество прочтений, приходящихся на 1 пару оснований экзона. Визуализацию вычисленных значений покрытия экзонов гена MET можно найти в Фиг. 1. Calculation of exon coverage (clause 2.3) occurs as follows: the overlap lengths with the exon in question of all reads that have passed quality control are summed and divided by the length of the exon in base pairs. The intuitive meaning of this value is that it represents the average number of reads per exon base pair. A visualization of the calculated MET gene exon coverage values can be found in Fig. 1.

Для дальнейшей оценки асимметрии (пункт 2.4) берутся только те образцы, сумма покрытий по каждому из экзонов превышает 210 (данный порог соответствует среднему покрытию экзонов гена MET, равному 10). Образцы с более низким количеством картированных прочтений гена MET не подлежат анализу описываемым методом из-за сильной неравномерности покрытия. For further assessment of asymmetry (clause 2.4), only those samples are taken whose sum of coverage for each exon exceeds 210 (this threshold corresponds to the average coverage of exons of the MET gene equal to 10). Samples with a lower number of mapped MET gene reads are not subject to analysis by the described method due to severe uneven coverage.

Затем покрытия экзонов делятся на сумму покрытий всех экзонов гена MET и умножаются на 100 (последнее делается для удобства визуализации и документального представления). Таким образом достигается унификация оценки неравномерности - устраняется эффект от разного уровня экспрессии гена MET в разных образцах:The exon coverages are then divided by the sum of the coverages of all exons of the MET gene and multiplied by 100 (the latter is done for ease of visualization and documentation). In this way, unification of the assessment of unevenness is achieved - the effect of different levels of MET gene expression in different samples is eliminated:

, ,

где i и j - номера экзонов.where i and j are exon numbers.

Далее вычисляется среднее арифметическое разности нормированных покрытий 14 и 13 и 14 и 15 экзонов. Полученная величина и является мерой асимметрии покрытия между этими экзонами. Next, the arithmetic mean of the difference between the normalized coverages of exons 14 and 13 and exons 14 and 15 is calculated. The resulting value is a measure of the asymmetry of coverage between these exons.

После вычисления меры асимметрии покрытия необходимо понять, какую асимметрию считать достаточной, для заключения о том, что 14 экзон был пропущен (пункт 2.5). Для определения этого порога определяли асимметрию покрытия для 478 экспериментальных образцов РНК-секвенирования опухолевой ткани человека, ранее полученных компанией Онкобокс, со средним покрытием каждой пары оснований на экзонах больше 10. Предлагаемым в данном изобретении пограничным значением стало приблизительно значение внешнего нижнего ограничителя диаграммы размаха X1:After calculating the measure of coverage asymmetry, it is necessary to understand what asymmetry is considered sufficient to conclude that exon 14 was skipped (section 2.5). To determine this threshold, coverage asymmetry was determined for 478 experimental RNA-seq samples of human tumor tissue, previously obtained by Oncobox, with an average coverage of each base pair on exons greater than 10. The cutoff value proposed in this invention was approximately the value of the outer lower limit of the X1 range diagram:

где Q1 и Q3 - первая и третья квартили распределения нормированных покрытий. Это значение оказалось близко к 2, что и было взято в качестве граничного значения (Фиг 2.) where Q1 and Q3 are the first and third quartiles of the distribution of normalized coverages. This value turned out to be close to 2, which was taken as the limit value (Fig. 2.)

Таким образом, после нахождения нужного количества SJ прочтений и вычисления асимметрии покрытия можно делать выводы о наличии пропуска 14 экзона гена MET. При наличии только одного из 2х этих признаков (наличие SJ ридов или наличие асимметрии) образец РНК секвенирования проверяется как либо другим методом на наличие пропуска 14го экзона гена MET. При наличии и асимметрии покрытия и достаточного количества SJ прочтений делается вывод о наличии в образце пропущенного 14-го экзона гена MET. При отсутствии всех вышеупомянутых признаков делается вывод о том, что пропуска 14-го экзона гена MET в образце нет. Thus, after finding the required number of SJ reads and calculating the coverage asymmetry, we can draw conclusions about the presence of skipping exon 14 of the MET gene. If only one of these 2 signs is present (the presence of SJ reads or the presence of asymmetry), the RNA sequencing sample is checked by some other method for the presence of skipping the 14th exon of the MET gene. If there is both asymmetry of coverage and a sufficient number of SJ reads, it is concluded that the sample contains the missing 14th exon of the MET gene. In the absence of all the above-mentioned features, it is concluded that there is no missing exon 14 of the MET gene in the sample.

Пример 1Example 1

Образец РНК-секвенирования А был взят у пациента А, страдающего немелкоклеточным раком легкого. После картирования прочтений РНК-секвенирования производился подсчет нормированного покрытия и асимметрии, как это описано выше. Асимметрия составила -3.95, что меньше выбранного порога, равного -2. Последнее свидетельствует о потенциальном наличии в образце транскрипта гена MET с пропуском 14го экзона. Среди прочтений РНК секвенирования также были найдены прочтения, картированные с высоким качеством на стык 13-го и 15-го экзонов гена MET. Это подтвердило экспрессию изоформы гена MET c пропуском 14-го экзона в рассматриваемом образце. Из этих фактов делается вывод, что в опухоли пациента происходит экспрессия изоформы гена MET с пропуском 14го экзона и есть основания назначить препарат, эффективный против данной изоформы. RNA-seq sample A was collected from patient A, who had non-small cell lung cancer. After mapping RNA-seq reads, normalized coverage and skewness calculations were performed as described above. The skewness was -3.95, which is less than the selected threshold of -2. The latter indicates the potential presence in the sample of a MET gene transcript skipping the 14th exon. Among the RNA sequencing reads, reads were also found that were mapped with high quality to the junction of the 13th and 15th exons of the MET gene. This confirmed the expression of the MET gene isoform skipping the 14th exon in the sample under consideration. From these facts, it is concluded that the patient’s tumor expresses an isoform of the MET gene skipping the 14th exon, and there is reason to prescribe a drug effective against this isoform.

Пример 2Example 2

Образец РНК-секвенирования Б был взят у пациента Б, страдающего немелкоклеточным раком легкого. После картирования прочтений РНК-секвенирования производился подсчет нормированного покрытия и асимметрии, как это описано выше. Асимметрия составила -2.1, что меньше выбранного порога, равного -2. Среди картированных прочтений РНК секвенирования НЕ нашлись таковые на стык экзонов 13 и 15 гена MET. Эти факты говорят о том, что требуется дополнительная проверка этого образца на предмет наличия пропуска 14-го экзона гена MET.RNA-seq sample B was collected from patient B, who had non-small cell lung cancer. After mapping RNA-seq reads, normalized coverage and skewness calculations were performed as described above. The skewness was -2.1, which is less than the selected threshold of -2. Among the mapped RNA sequencing reads, there were NOT those for the junction of exons 13 and 15 of the MET gene. These facts suggest that further testing of this sample for missing exon 14 of the MET gene is required.

Для этого проводится 2 ПЦР в реальном времени (ПЦР-РВ). Первая ПЦР-РВ проводилась с 2-мя прамерами: прямым праймером F_13ex (последовательность: CAGAATTTCACAGGATTGATTG), картирующимся на 13 экзон гена MET, и обратным R_13-15ex (послеовательность: GATGAATTAGGAAACTGATCTTTAA), картирующимся на стык 13 и 15 экзонов. Длина ПЦР продукта 122 пар оснований. Вторая ПЦР-РВ проводилась со следующими праймерами: с прямым праймером F_13ex (последовательность: CAGAATTTCACAGGATTGATTG), картирующимся на 13 экзон гена MET, и обратным, картирующимся на стык 13 и 14 экзонов (К_13-14ex: TCACTGCCCAGATCTTTAA). Длина ПЦР продукта 116 пар оснований. Обе ПЦР проходили при следующих условиях: начальная денатурация 180 секунд при 95°С, затем 40 циклов 93°С 10 секунд, 58°С 30 секунд и 72°С 45 секунд, финальная элонгация длилась 2 минуты при 72°С. Для оценки качества продукта ПЦР использовали кривую плавления и секвенирование по Сэнгеру: в обоих случаях использовали праймер F_13ex. Пропуск 14 экзона считали верифицированным, если пороговый цикл обеих ПЦР не более 35. После проведения вышеописанных ПЦР-РВ с образцом Б мы получили пороговый цикл больше 35 только в контрольном ПЦР-РВ. To do this, 2 real-time PCR tests (RT-PCR) are performed. The first RT-PCR was carried out with 2 primers: forward primer F_13ex (sequence: CAGAATTTCACAGGATTGATTG), mapping to exon 13 of the MET gene, and reverse primer R_13-15ex (sequence: GATGAATTAGGAAACTGATCTTTAA), mapping to the junction of exons 13 and 15. The length of the PCR product is 122 base pairs. The second RT-PCR was carried out with the following primers: forward primer F_13ex (sequence: CAGAATTTCACAGGATTGATTG), mapping to exon 13 of the MET gene, and reverse primer, mapping to the junction of exons 13 and 14 (K_13-14ex: TCACTGCCCAGATCTTTAA). The length of the PCR product is 116 base pairs. Both PCRs were run under the following conditions: initial denaturation for 180 seconds at 95°C, followed by 40 cycles of 93°C for 10 seconds, 58°C for 30 seconds and 72°C for 45 seconds, and a final extension of 2 minutes at 72°C. To assess the quality of the PCR product, a melting curve and Sanger sequencing were used: in both cases, the F_13ex primer was used. Skipping of exon 14 was considered verified if the threshold cycle of both PCRs was no more than 35. After performing the above-described RT-PCR with sample B, we obtained a threshold cycle of more than 35 only in the control RT-PCR.

Из этих фактов делается вывод, что в опухоли пациента не происходит экспрессии изоформы гена MET с пропуском 14-го экзона и нет оснований назначить препарат, эффективный против данной изоформы. From these facts, it is concluded that the patient’s tumor does not express the MET gene isoform skipping the 14th exon and there is no reason to prescribe a drug effective against this isoform.

Пример 3Example 3

Образец РНК-секвенирования В был взят у пациента В, страдающего немелкоклеточным раком легкого. После картирования прочтений РНК-секвенирования производился подсчет нормированного покрытия и асимметрии, как это описано выше. Асимметрия составила -1.6, что больше выбранного порога, равного -2. Среди прочтений РНК секвенирования были найдены прочтения, картированные с высоким качеством на стык 13-го и 15-го экзонов гена MET. Эти факты говорят о том, что требуется дополнительная проверка этого образца на предмет наличия пропуска 14-го экзона гена MET.RNA-seq sample B was collected from patient B, who had non-small cell lung cancer. After mapping RNA-seq reads, normalized coverage and skewness calculations were performed as described above. The asymmetry was -1.6, which is greater than the selected threshold of -2. Among the RNA sequencing reads, reads were found that were mapped with high quality to the junction of the 13th and 15th exons of the MET gene. These facts suggest that further testing of this sample for missing exon 14 of the MET gene is required.

Для этого проводится 2 ПЦР в реальном времени (ПЦР-РВ). Первая ПЦР-РВ проводилась с 2мя прамерами: прямым праймером F_13ex (последовательность: CAGAATTTCACAGGATTGATTG), картирующимся на 13 экзон гена MET, и обратным R_13-15ex (послеовательность: GATGAATTAGGAAACTGATCTTTAA), картирующимся на стык 13 и 15 экзонов. Длина ПЦР продукта 122 пар оснований. Вторая ПЦР-РВ проводилась со следующими праймерами: с прямым праймером F_13ex (последовательность: CAGAATTTCACAGGATTGATTG), картирующимся на 13 экзон гена MET, и обратным, картирующимся на стык 13 и 14 экзонов (К_13-14ex: TCACTGCCCAGATCTTTAA). Длина ПЦР продукта 116 пар оснований. Обе ПЦР проходили при следующих условиях: начальная денатурация 180 секунд при 95°С, затем 40 циклов 93°С 10 секунд, 58°С 30 секунд и 72°С 45 секунд, финальная элонгация длилась 2 минуты при 72°С. Для оценки качества продукта ПЦР использовали кривую плавления и секвенирование по Сэнгеру: в обоих случаях использовали праймер F_13ex. Пропуск 14 экзона считали верифицированным, если пороговый цикл обеих ПЦР не более 35. После проведения вышеописанных ПЦР-РВ с образцом В мы получили пороговые циклы больше 35 во всех ПЦР-РВ. To do this, 2 real-time PCR tests (RT-PCR) are performed. The first RT-PCR was carried out with 2 primers: forward primer F_13ex (sequence: CAGAATTTCACAGGATTGATTG), mapping to exon 13 of the MET gene, and reverse primer R_13-15ex (sequence: GATGAATTAGGAAACTGATCTTTAA), mapping to the junction of exons 13 and 15. The length of the PCR product is 122 base pairs. The second RT-PCR was carried out with the following primers: forward primer F_13ex (sequence: CAGAATTTCACAGGATTGATTG), mapping to exon 13 of the MET gene, and reverse primer, mapping to the junction of exons 13 and 14 (K_13-14ex: TCACTGCCCAGATCTTTAA). The length of the PCR product is 116 base pairs. Both PCRs were run under the following conditions: initial denaturation for 180 seconds at 95°C, followed by 40 cycles of 93°C for 10 seconds, 58°C for 30 seconds and 72°C for 45 seconds, and a final extension of 2 minutes at 72°C. To assess the quality of the PCR product, a melting curve and Sanger sequencing were used: in both cases, the F_13ex primer was used. Skipping of exon 14 was considered verified if the threshold cycle of both PCRs was no more than 35. After performing the above-described RT-PCR with sample B, we obtained threshold cycles greater than 35 in all RT-PCRs.

Из этих фактов делается вывод, что в опухоли пациента происходит экспрессия изоформы гена MET с пропуском 14-го экзона и есть основания назначить препарат, эффективный против данной изоформы. From these facts, it is concluded that the patient’s tumor expresses an isoform of the MET gene skipping the 14th exon, and there is reason to prescribe a drug effective against this isoform.

Пример 4Example 4

Образец РНК-секвенирования Г был взят у пациента Г, страдающего немелкоклеточным раком легкого. После картирования прочтений РНК-секвенирования производился подсчет нормированного покрытия и асимметрии, как это описано выше. Асимметрия составила -0.3, что больше выбранного порога, равного -2. Среди прочтений РНК секвенирования не были найдены прочтения, картированные с высоким качеством на стык 13го и 15го экзонов гена MET. Из этих фактов делается вывод, что в опухоли пациента не происходит экспрессии изоформы гена MET с пропуском 14го экзона и нет оснований назначить препарат, эффективный против данной изоформы. The RNA-seq sample G was collected from patient G suffering from non-small cell lung cancer. After mapping RNA-seq reads, normalized coverage and skewness calculations were performed as described above. The asymmetry was -0.3, which is greater than the selected threshold of -2. Among the RNA sequencing reads, no reads were found that were mapped with high quality to the junction of the 13th and 15th exons of the MET gene. From these facts, it is concluded that the patient’s tumor does not express the MET gene isoform skipping the 14th exon and there is no reason to prescribe a drug effective against this isoform.

ПРОМЫШЛЕННАЯ ПРИМЕНИМОСТЬINDUSTRIAL APPLICABILITY

Настоящее изобретение предназначено для использования в персонализированной онкологии.The present invention is intended for use in personalized oncology.

Claims (8)

1. Способ оценки статуса 14-го экзона гена MET по данным РНК секвенирования, который состоит, по меньшей мере, из следующих шагов:1. A method for assessing the status of the 14th exon of the MET gene according to RNA sequencing data, which consists of at least the following steps: а) получение биологического материала, пригодного для РНК секвенирования;a) obtaining biological material suitable for RNA sequencing; б) получение данных РНК секвенирования из материала пункта (а);b) obtaining RNA sequencing data from the material in point (a); в) получение из данных пункта (б) данных о картировании прочтений на экзоны гена MET человека, в том числе о картировании на стыке экзонов;c) obtaining from the data in point (b) data on mapping reads to exons of the human MET gene, including mapping at the junction of exons; г) подсчет количества SJ прочтений, приходящихся на стык 13 и 15-го экзонов и прошедших контроль качества, и сравнение его с порогом, определяемым пользователем и выбранным на основе требуемой строгости и точности определения наличия таких прочтений;d) counting the number of SJ reads at the junction of exons 13 and 15 that have passed quality control, and comparing it with a user-defined threshold selected based on the required rigor and accuracy of determining the presence of such reads; д) подсчет нормированного уровня асимметрии покрытия 13, 14 и 15-го экзонов и сравнение его с порогом, определяемым пользователем и выбранным на основе анализа клинических образцов;e) calculating the normalized level of coverage asymmetry of exons 13, 14 and 15 and comparing it with a user-defined threshold selected based on analysis of clinical samples; е) анализ результатов пунктов (в) и (г), при котором при преодолении всех выбранных порогов, описанных в пунктах (в) и (г), делается вывод о наличии в образце гена MET с пропуском 14-го экзона.f) analysis of the results of points (c) and (d), in which, when all selected thresholds described in points (c) and (d) are overcome, a conclusion is made about the presence of the MET gene with the skipping of the 14th exon in the sample. 2. Способ оценки по п.1, отличающийся тем, что при преодолении только одного из порогов, либо в пункте (в), либо в пункте (г), биологический материал, из которого были получены данные РНК секвенирования, подвергается дополнительной проверке, позволяющей оценить статус 14-го экзона гена MET в этом биологическом материале, если пороги пунктов (в) и (г) не были преодолены, делается вывод о том, что в образце нет транскриптов, соответствующих гену MET без 14-го экзона.2. The assessment method according to claim 1, characterized in that when only one of the thresholds is overcome, either in point (c) or in point (d), the biological material from which the RNA sequencing data was obtained is subjected to additional testing, allowing evaluate the status of the 14th exon of the MET gene in this biological material, if the thresholds of points (c) and (d) have not been overcome, it is concluded that there are no transcripts in the sample corresponding to the MET gene without the 14th exon.
RU2023122817A 2023-09-03 Method for assessing status of 14th exon of met gene according to rna sequencing data RU2817869C1 (en)

Publications (1)

Publication Number Publication Date
RU2817869C1 true RU2817869C1 (en) 2024-04-22

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106811517A (en) * 2016-03-22 2017-06-09 凯杰(苏州)转化医学研究有限公司 It is a kind of for detecting that c-MET gene extrons 14 are skipped the composition and kit of mutation
WO2017194668A1 (en) * 2016-05-13 2017-11-16 Roche Diagnostics Gmbh Detection of met exon 14 deletions and associated therapies

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106811517A (en) * 2016-03-22 2017-06-09 凯杰(苏州)转化医学研究有限公司 It is a kind of for detecting that c-MET gene extrons 14 are skipped the composition and kit of mutation
WO2017194668A1 (en) * 2016-05-13 2017-11-16 Roche Diagnostics Gmbh Detection of met exon 14 deletions and associated therapies

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Kim S. Y. et al. Characterization of MET Exon 14 skipping alterations (in NSCLC) and identification of potential therapeutic targets using whole transcriptome sequencing // JTO Clinical and Research Reports, 2022, 3(9), p. 100-381. Холматов М.М. и др. Диагностика делеции экзона 14 гена MET в опухолях легкого у российских пациентов // Белые ночи 2019, с. 371-372. *

Similar Documents

Publication Publication Date Title
Siravegna et al. Plasma HER2 (ERBB2) copy number predicts response to HER2-targeted therapy in metastatic colorectal cancer
Crowley et al. Liquid biopsy: monitoring cancer-genetics in the blood
ES2894479T3 (en) Plasma DNA mutational analysis for cancer detection
ES2729504T3 (en) Analysis based on the size of the fetal DNA fraction in maternal plasma
Crisafulli et al. Whole exome sequencing analysis of urine trans-renal tumour DNA in metastatic colorectal cancer patients
US10829822B2 (en) Method for evaluating the efficacy of an EGFR-TKI treatment
CN106676178B (en) Method and system for evaluating tumor heterogeneity
US11827938B2 (en) Methods of prostate cancer prognosis
Terraf et al. Comprehensive assessment of germline pathogenic variant detection in tumor-only sequencing
CN112088220B (en) Surrogate markers and methods for tumor mutation load determination
AU2019216810B2 (en) Method of predicting response to therapy by assessing tumor genetic heterogeneity
CN113462775B (en) Gene markers for prognosis evaluation of colorectal cancer
Aimé et al. Somatic c. 34G> T KRAS mutation: a new prescreening test for MUTYH-associated polyposis?
CN111254196B (en) Application of INPP4B gene variation in prediction of sensitivity of non-small cell lung cancer patient to immune checkpoint inhibitor therapy
CN116113712A (en) Prognostic biomarkers for cancer
Shi et al. Integrative genomic profiling uncovers therapeutic targets of acral melanoma in Asian populations
Tsang et al. Homologous recombination deficiency signatures in gastrointestinal and thoracic cancers correlate with platinum therapy duration
CN110923329B (en) Application of FGFR4 point mutation in prediction of sensitivity of non-small cell lung cancer patient to immune checkpoint inhibitor therapy
RU2817869C1 (en) Method for assessing status of 14th exon of met gene according to rna sequencing data
JP6784673B2 (en) How to determine the survival prognosis of patients with pancreatic cancer
WO2020243587A1 (en) Methods and systems for urine-based detection of urologic conditions
US20220301654A1 (en) Systems and methods for predicting and monitoring treatment response from cell-free nucleic acids
JP2022551488A (en) Using Concurrent Marker Detection to Assess Diffuse Glioma and Responsiveness to Therapy
RU2812346C1 (en) Method of evaluating detection of alk gene translocations in paraffinized tumour samples using rna-sequencing
CA3099612C (en) Method of cancer prognosis by assessing tumor variant diversity by means of establishing diversity indices