RU2795410C2 - Biomarker panel and methods for detecting microsatellite instability in various types of cancer - Google Patents

Biomarker panel and methods for detecting microsatellite instability in various types of cancer Download PDF

Info

Publication number
RU2795410C2
RU2795410C2 RU2020127293A RU2020127293A RU2795410C2 RU 2795410 C2 RU2795410 C2 RU 2795410C2 RU 2020127293 A RU2020127293 A RU 2020127293A RU 2020127293 A RU2020127293 A RU 2020127293A RU 2795410 C2 RU2795410 C2 RU 2795410C2
Authority
RU
Russia
Prior art keywords
human
starting
gene
homopolymer
repeat containing
Prior art date
Application number
RU2020127293A
Other languages
Russian (ru)
Other versions
RU2795410C9 (en
RU2020127293A3 (en
RU2020127293A (en
Inventor
Брам ДЕ КРАНЕ
Клас ДЕКАННИРЕ
Ян ВАН ДЕ ВЕЛДЕ
Герт МАРТЕНС
Original Assignee
Биокартис Нв
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP18153056.9A external-priority patent/EP3514247B1/en
Application filed by Биокартис Нв filed Critical Биокартис Нв
Priority claimed from PCT/EP2019/051515 external-priority patent/WO2019145306A1/en
Publication of RU2020127293A3 publication Critical patent/RU2020127293A3/ru
Publication of RU2020127293A publication Critical patent/RU2020127293A/en
Application granted granted Critical
Publication of RU2795410C2 publication Critical patent/RU2795410C2/en
Publication of RU2795410C9 publication Critical patent/RU2795410C9/en

Links

Images

Abstract

FIELD: medical biotechnology.
SUBSTANCE: invention relates to oncology, in particular to cancers characterized by microsatellite instability (MSI) and/or mismatch repair deficiency (MMR−). A diagnostic panel of markers for the analysis of MSI loci is presented along with a method and kit for using the said panel in the detection of cancers characterized by microsatellite instability (MSI) and/or mismatch repair deficiency (MMR−). A cell derived from the HTC116 c1.110268743 cell line is presented for use as a control biological sample.
EFFECT: invention makes it possible to detect MSI in CRC even at its early stages in cancer tissue samples such as ovarian cancer, endometrial cancer and gastric cancer, the invention also can be used for prognostic and long-term studies in the context of immunotherapy.
23 cl, 7 dwg

Description

Область изобретения Field of invention

[0001] Настоящее изобретение в общем относится к области онкологии, в частности к видам рака, характеризующимся микросателлитной нестабильностью (MSI) и/или дефицитом репарации ошибочно спаренных оснований (MMR-). Примеры таких видов рака включают многие колоректальные опухоли, опухоли желудка и опухоли эндометрия. Таким образом, в настоящем изобретении представлена новая диагностическая панель маркеров для анализа локусов MSI вместе со способами и наборами для применения указанной панели в выявлении видов рака, характеризующихся микросателлитной нестабильностью (MSI) и/или дефицитом репарации ошибочно спаренных оснований (MMR-).[0001] The present invention relates generally to the field of oncology, in particular to cancers characterized by microsatellite instability (MSI) and/or mismatch repair (MMR-) deficiency. Examples of such cancers include many colorectal tumors, stomach tumors, and endometrial tumors. Thus, the present invention provides a novel diagnostic marker panel for the analysis of MSI loci, together with methods and kits for using said panel in the detection of cancers characterized by microsatellite instability (MSI) and/or mismatch repair (MMR-) deficiency.

Предпосылки изобретенияBackground of the invention

[0002] Ежегодно в Европе и США колоректальный рак (CRC) диагностируют у примерно 440000 пациентов. В новейших руководствах, таких как руководства NCCN для пациентов: рак толстой кишки, версия 1.2017, и клинические практические руководства ESMO по колоректальному раку с отягощенным семейным анамнезом рекомендуется проверка опухоли в отношении дефицита репарации ошибочно спаренных оснований (MMR) ДНК и/или статуса MSI у всех пациентов с CRC. Тем не менее, в настоящее время такие исследования по-прежнему недостаточно используются из-за технической сложности, лежащей их в основе. В частности, трудность заключается в проведении тестирования в отношении всех возможных мутаций, лежащих в основе дефицита MMR, и хотя имеются альтернативные подходы для их скрининга, существующие анализы по-прежнему требуют длительного времени для проведения манипуляций в лаборатории и, следовательно, не подходят для того, чтобы стать рутинными в диагностике.[0002] Approximately 440,000 patients are diagnosed with colorectal cancer (CRC) each year in Europe and the United States. Recent guidelines such as the NCCN Patient Guidelines: Colon Cancer Version 1.2017 and the ESMO Clinical Practice Guidelines for Colorectal Cancer with a Familial Family History recommend screening for tumor mismatch repair (MMR) DNA deficiency and/or MSI status in all patients with CRC. However, at present, such studies are still underutilized due to the technical complexity that underlies them. In particular, it is difficult to test for all possible mutations underlying MMR deficiency, and although there are alternative approaches to screen for them, existing assays still require a long time to be manipulated in the laboratory and are therefore not suitable. to become routine in diagnosis.

[0003] Вышеуказанные препятствия закономерно оказывают влияние на ведение и таким образом потенциально также на показатели выживаемости многих больных раком. И действительно, в значительной доле случаев колоректальной карциномы (CRC) установлено, что дефекты в генах MMR являются ключевыми в онкогенезе и прогрессировании заболевания. Например, эпигенетический сайленсинг гена MLH1, вовлеченного в MMR, является причиной около 12% CRC. Дополнительные 2-5% случаев обусловлены аутосомными доминантно наследуемыми мутациями с потерей функции в одном из генов MLH1, MSH2, PMS2 или MSH6, вовлеченных в MMR. Данное наследственное нарушение предрасположенности к раку известно как синдром Линча или наследуемый неполипозный CRC (HNPCC), который дополнительно приводит к повышенному риску возникновения карциномы желудка и эндометрия (среди прочего).[0003] The above obstacles naturally affect the management and thus potentially also the survival rates of many cancer patients. Indeed, in a significant proportion of colorectal carcinoma (CRC) cases, defects in the MMR genes have been found to be key to tumorigenesis and disease progression. For example, epigenetic silencing of the MLH1 gene involved in MMR is responsible for about 12% of CRCs. An additional 2-5% of cases are due to autosomal dominantly inherited loss-of-function mutations in one of the MLH1, MSH2, PMS2, or MSH6 genes involved in MMR. This inherited disorder of cancer predisposition is known as Lynch syndrome or hereditary non-polyposis CRC (HNPCC), which further leads to an increased risk of gastric and endometrial carcinoma (among others).

[0004] В путь MMR вовлечена значительная часть генов, при этом было идентифицировано множество различных генетических и эпигенетических нарушений, оказывающих влияние на этот путь. Вероятно, еще предстоит выявить ряд других нарушений. Таким образом, более практичным является диагностирование дефектов в аппарате MMR посредством скрининга в отношении оказываемого ими прямого результата. Последние являются результатом накопления ошибок репликации ДНК во всем геноме, которое может наблюдаться в виде изменений количества нуклеотидов вследствие делеции или вставки в последовательностях одно- и двухнуклеотидных повторов, например (A)n или (CA)n. Данное явление известно как микросателлитная нестабильность или MSI. Если дефицит MMR приводит к MSI в кодирующих участках, то наиболее частым результатом этого являются мутации промотора или мутации со сдвигом рамки считывания, что приводит к отсутствию экспрессии, экспрессии усеченных белков и/или белков, содержащих крупные новые последовательности, содержащие неоантигены. Кроме того, было показано, что MSI в граничных областях интрон-экзон воздействует на механизмы сплайсинга РНК и, следовательно, также препятствует трансляции белка. В целом фенотип MSI коррелирует с геномной нестабильностью, более высокой частотой мутаций и, как следствие, с различным характером роста опухоли и прогнозом.[0004] A significant number of genes are involved in the MMR pathway, and many different genetic and epigenetic disorders have been identified that affect this pathway. It is likely that a number of other violations have yet to be identified. Thus, it is more practical to diagnose defects in the MMR apparatus by screening for their direct result. The latter are the result of the accumulation of DNA replication errors throughout the genome, which can be observed as changes in the number of nucleotides due to deletion or insertion in sequences of single and double nucleotide repeats, for example (A) n or (CA) n . This phenomenon is known as microsatellite instability or MSI. If MMR deficiency leads to MSI in coding regions, then the most common result is promoter mutations or frameshift mutations resulting in lack of expression, expression of truncated proteins and/or proteins containing large novel sequences containing neoantigens. In addition, MSI at the intron-exon boundary regions has been shown to interfere with RNA splicing mechanisms and therefore also interfere with protein translation. In general, the MSI phenotype correlates with genomic instability, a higher mutation rate, and, as a result, with different tumor growth patterns and prognosis.

[0005] Опухоли с высокой MSI (MSI-H) в целом характеризуются лучшим прогнозом и сниженной вероятностью метастазирования по сравнению с микросателлитно-стабильными опухолями (MSS). Более того, эти два типа опухоли также по-разному реагируют на разные виды лечения. Например, CRC на ранней стадии с MSI обычно не отвечает на химиотерапию, основанную на 5-фторурациле, которая в настоящее время является золотым стандартом в лечении CRC (например, Webber et al., 2015). С другой стороны, опухоли c MSI проявляют повышенные уровни по меньшей мере пяти молекул контрольных точек иммунного ответа, которые представляют собой мишени для терапевтических ингибиторов, клинически тестируемых в настоящее время (Llosa et al. 2014). Например, ожидается, что пациенты с колоректальным раком с дефицитом репарации ошибочно спаренных оснований будут особенно хорошо отвечать на иммунотерапию антителами к PD-1, действие которых основано на блокировании взаимодействия рецепторов PD-1 на Т-клетках и рецепторов PD-L1 и PD-L2 на опухолевых клетках, выключая их механизмы уклонения от иммунной системы (Le et al., 2015). Множество других соединений и биологически активных веществ, таких как камптотецин или иринотекан, в настоящее время также проходят испытания в отношении целенаправленно воздействующих видов противоопухолевой терапии на основе уникального молекулярного следа MSI. [0005] High MSI tumors (MSI-H) generally have a better prognosis and a reduced likelihood of metastasis compared to microsatellite stable tumors (MSS). Moreover, these two types of tumor also respond differently to different types of treatment. For example, early-stage CRC with MSI usually does not respond to 5-fluorouracil-based chemotherapy, which is currently the gold standard in the treatment of CRC (eg, Webber et al., 2015). On the other hand, MSI tumors exhibit elevated levels of at least five immune response checkpoint molecules, which are targets for therapeutic inhibitors currently being clinically tested (Llosa et al. 2014). For example, mismatch repair-deficient colorectal cancer patients are expected to respond particularly well to immunotherapy with anti-PD-1 antibodies, which act by blocking the interaction of PD-1 receptors on T cells and PD-L1 and PD-L2 receptors. on tumor cells, turning off their mechanisms of evasion from the immune system (Le et al., 2015). Numerous other compounds and biologically active substances, such as camptothecin or irinotecan, are also currently being tested for targeted anticancer therapies based on the unique molecular footprint of MSI.

[0006] Таким образом, уже признано, что идентификация статуса MSI в опухолях может оказывать огромное влияние на исход лечения и, как следствие, также на качество жизни и среднюю продолжительность жизни многих пациентов с раком. Это лучше всего демонстрируется тем фактом, что во множестве официальных руководств уже настоятельно рекомендуется тестирование в отношении MSI при раке толстой кишки и синдроме Линча. Такие руководства включают, например, руководства NCCN по раку толстой кишки, клинические практические руководства ESMO по колоректальному раку с отягощенным семейным анамнезом, пересмотренные руководства Bethesda, клинические критерии Amsterdam II, общую целевую группу США по колоректальному раку и т. д.[0006] Thus, it is already recognized that the identification of MSI status in tumors can have a huge impact on the outcome of treatment and, as a result, also on the quality of life and life expectancy of many patients with cancer. This is best demonstrated by the fact that multiple official guidelines already strongly recommend testing for MSI in colon cancer and Lynch syndrome. Such guidelines include, for example, NCCN guidelines for colon cancer, ESMO clinical practice guidelines for family history of colorectal cancer, revised Bethesda guidelines, the Amsterdam II clinical criteria, the US Common Colorectal Cancer Task Force, etc.

[0007] В настоящее время для тестирования MSI наиболее часто используются две методики: иммуногистохимический анализ (IHC) и капиллярный электрофорез. IHC представляет собой дорогостоящую, трудоемкую и времязатратную методику с высоким показателем ложноотрицательньных результатов. При капиллярном электрофорезе флуоресцентную ПЦР используют для амплификации специфических геномных участков, содержащих нуклеотидные повторы, в опухолевых клетках и нормальных клетках, а затем определяют присутствие нестабильности путем сравнения длины продуктов амплификации. Во всем геноме существует сотни тысяч микросателлитных локусов, которые потенциально можно использовать в анализе MSI (Ellegren, Nat Rev Genet. 2004). [0007] Currently, two methods are most commonly used for testing MSI: immunohistochemical analysis (IHC) and capillary electrophoresis. IHC is an expensive, laborious and time consuming technique with a high false negative rate. In capillary electrophoresis, fluorescent PCR is used to amplify specific genomic regions containing nucleotide repeats in tumor cells and normal cells, and then determine the presence of instability by comparing the length of the amplification products. Throughout the genome, there are hundreds of thousands of microsatellite loci that could potentially be used in MSI analysis (Ellegren, Nat Rev Genet. 2004).

[0008] Например, консенсусная панель MSI, разработанная в 1997, и известная как панель Bethesda включает 5 микросателлитных маркеров, включающих 2 моно- или гомонуклеотидных повтора длиной в 25 и 26 нуклеотидов (BAT25 и BAT26 соответственно) и 3 двухнуклеотидных повтора (D2S123, D5S346, D17S250) (Boland et al, 1998). Образец, тестируемый с помощью панели Bethesda, определяют как имеющий высокую частоту MSI или фенотип «MSI-H» в том случае, если 30% или больше маркеров (т. е. по меньшей мере 2 в 5-маркерной панели) определили как нестабильные. Если один маркер из пяти (или <30% опухолевых маркеров) оценивают как MSI-положительный, то образец обозначают как имеющий низкую частоту MSI или «MSI-L». И наконец, если не обнаруживают измененных маркеров, то образец считается MSI-стабильным или «MSS» (Boland et al, 1998). [0008] For example, the MSI consensus panel, developed in 1997 and known as the Bethesda panel, includes 5 microsatellite markers, including 2 mono- or homonucleotide repeats of 25 and 26 nucleotides in length (BAT25 and BAT26, respectively) and 3 double-nucleotide repeats (D2S123, D5S346 , D17S250) (Boland et al, 1998). A sample tested with the Bethesda panel is defined as having a high frequency of MSI or an "MSI-H" phenotype if 30% or more markers (i.e., at least 2 in a 5-marker panel) are determined to be unstable. If one marker out of five (or <30% of tumor markers) is rated as MSI positive, then the sample is designated as having a low frequency of MSI or "MSI-L". Finally, if no altered markers are found, then the sample is considered MSI-stable or "MSS" (Boland et al, 1998).

[0009] Однако, несмотря на то что панель Bethesda является существующим стандартом тестирования MSI, она имеет ряд недостатков, таких как неравномерная распространенность локусов в разных этнических популяциях и разных типах опухолей. В частности, она проявляет низкую чувствительность, особенно в отношении видов рака, отличных от колоректального рака, для которого ее исходно разработали (Boland et al, 1998). Эти и другие факторы привели к ее расширению и/или диверсификации отдельными врачами и исследовательскими лабораториями за счет дополнительных маркеров, что впоследствии привело к потере стандартизации и плохой воспроизводимости. Примеры вышесказанного включают, например, Murphy et al, 2006 и WO2006047412 (Promega). В качестве альтернативы абсолютно новые микросателлитные маркеры, которые не перекрываются с любым из панели Bethesda, были также описаны, например в WO2013153130 (VIB) и Zhao et al, 2014 (eLife).[0009] However, although the Bethesda panel is the current standard for MSI testing, it has a number of disadvantages, such as uneven distribution of loci in different ethnic populations and different types of tumors. In particular, it shows low sensitivity, especially for cancers other than colorectal cancer, for which it was originally developed (Boland et al, 1998). These and other factors led to its expansion and/or diversification by individual physicians and research laboratories with additional markers, which subsequently led to a loss of standardization and poor reproducibility. Examples of the above include, for example, Murphy et al, 2006 and WO2006047412 (Promega). Alternatively, brand new microsatellite markers that do not overlap with any of the Bethesda panel have also been described in, for example, WO2013153130 (VIB) and Zhao et al, 2014 (eLife).

[0010] Другим недостатком известных в настоящее время подходов является их уровень сложности, необходимость в специализированных приборах, термоциклерах, выходящих за рамки стандартных лабораторных, а также их ограниченные технические возможности в плане автоматизации. Тестирование с помощью классической панели Bethesda, собственно, представляет собой тест в открытой пробирке, что повышает вероятность перекрестного контаминирования. Кроме того, тестирование требует квалифицированного лабораторного персонала и является времязатратным, дорогостоящим и трудоемким. Как правило, в существующих в настоящее время методиках выявления MSI используется один из следующих принципов: (i) применение флуоресцентно-меченых праймеров для выявления маркеров панели Bethesda с последующим капиллярным электрофорезом; (ii) анализ кривой плавления высокого разрешения 5 маркеров из панели Bethesda с использованием dsDNA-интеркалирующего красителя; (iii) масс-спектрометрическое выявление аллелей различной длины и (iv) секвенирование нового поколения (NGS) крупных участков ДНК (например, экзома) с последующим подсчетом количества мутаций или количества гомополимерных участков в настройке с несовпадением (Campbell et al., 2017, Cell).[0010] Another disadvantage of currently known approaches is their level of complexity, the need for specialized instruments, thermal cyclers that go beyond standard laboratory ones, as well as their limited technical capabilities in terms of automation. Bethesda classic panel testing is actually an open tube test, which increases the chances of cross-contamination. In addition, testing requires skilled laboratory personnel and is time-consuming, costly, and labor-intensive. Typically, current MSI detection techniques use one of the following principles: (i) use of fluorescently labeled primers to detect Bethesda panel markers followed by capillary electrophoresis; (ii) high resolution melt curve analysis of 5 markers from the Bethesda panel using dsDNA intercalating dye; (iii) mass spectrometric detection of alleles of different lengths and (iv) new generation sequencing (NGS) of large DNA regions (e.g. exome) followed by counting the number of mutations or the number of homopolymeric regions in a mismatched setting (Campbell et al., 2017, Cell ).

[0011] Например, в (i) исходной стратегии скрининга Bethesda на основе ПЦР требуется интерпретация экспертом, что препятствует эффективной и простой автоматизации. Далее, что касается (ii), то анализ кривой плавления высокого разрешения с использованием dsDNA-интеркалирующих красителей имеет недостаток, заключающийся в весьма ограниченных возможностях мультиплексирования для скрининга нескольких разных маркеров MSI в одном цикле, поскольку температура плавления для каждого ампликона соответствующего маркера должна в достаточной степени отличаться, чтобы не получать перекрывающиеся сигналы. Более того, поскольку данная стратегия основана на образовании гетеродуплексов между аллелями с нормальной и мутантной длиной, она также является менее чувствительной в сравнении с другими альтернативами. Далее, что касается (iii), то способ на основе масс-спектрометрии (Zhao et al, 2014), по сути, также поддается автоматизации, но требует специализированного приборного оснащения и высококвалифицированного персонала для интерпретации данных. И в заключение, что касается (iv), то хотя NGS, несомненно, обладает преимуществом в анализе очень большого количества положений, указывающих на MSI, в геноме или экзоме, а не только в селективных маркерах и хотя данный способ, в принципе, также поддается по меньшей мере частичной автоматизации, в настоящее время он является дорогостоящим и требует специализированного оборудования для NGS. Что касается балльной оценки гомополимеров, то NGS все еще недостаточно надежен для многократной оценки отдельных гомополимерных повторов, поскольку он по-прежнему склонен к потере информации об однонуклеотидных вставках/делециях в нити повторяющихся нуклеотидов. Кроме того, в связи с получением большого количества данных он остается времязатратным, сложным и требует высококвалифицированного специалиста-аналитика. [0011] For example, in (i) Bethesda's original PCR-based screening strategy requires expert interpretation, preventing efficient and easy automation. Further, with regard to (ii), high resolution melt curve analysis using dsDNA intercalating dyes has the disadvantage of very limited multiplexing capabilities for screening several different MSI markers in one run, since the melting temperature for each amplicon of the corresponding marker must be sufficiently degrees differ so as not to receive overlapping signals. Moreover, since this strategy is based on the formation of heteroduplexes between normal and mutant length alleles, it is also less sensitive than other alternatives. Further, regarding (iii), the mass spectrometry-based method (Zhao et al, 2014) is also inherently amenable to automation, but requires specialized instrumentation and highly skilled personnel to interpret the data. Finally, with respect to (iv), although NGS certainly has the advantage of analyzing a very large number of MSI-indicating positions in the genome or exome, and not just in selectable markers, and although this method is in principle also amenable to at least partially automated, it is currently expensive and requires specialized NGS equipment. As far as homopolymer scoring is concerned, NGS is still not reliable enough for multiple scoring of individual homopolymer repeats, as it is still prone to loss of information about single nucleotide insertions/deletions in a strand of repeat nucleotides. In addition, due to the acquisition of a large amount of data, it remains time-consuming, complex and requires a highly qualified analyst.

[0012] И в заключение, тестирование MSI является высоко востребованным в медицине, потребность в котором в настоящее время лишь частично удовлетворена существующими диагностическими способами из-за их технических ограничений. К ним, в частности, относятся ограниченные возможности выявления, высокая стоимость и/или время выполнения, потребность в специализированном оборудовании и/или интерпретация результатов высококвалифицированным экспертом. В настоящем изобретении преодолены вышеперечисленные недостатки путем обеспечения высокочувствительного набора лишь из нескольких коротких гомополимерных маркеров MSI такого типа, который описан в WO2013153130, вместе с исключительно надежным способом выявления гомонуклеотидных вставок или делеций (вставок/делеций) в их последовательностях. Данный способ является весьма удобным для автоматизации, не требует специфических молекулярных инфраструктур и может проводиться с использованием стандартного лабораторного оборудования, такого как обычный термоциклер, подключенный к компьютеру. Кроме того, он обеспечивает легкое дуплексирование или даже мультиплексирование более высокого уровня выбранных маркеров, что предоставляет преимущество в еще большем ограничении требуемого лабораторного материала, и, таким образом, упрощает внедрение в существующие платформы на основе ПЦР. Важно отметить, что данный способ обеспечивает получение весьма надежных результатов и позволяет проводить легкую и полностью автоматизированную интерпретацию с получением прямого отчета в качестве выходных данных. Авторы настоящего изобретения демонстрируют, что в настоящих условиях после получения образца ткани такие полные показатели статусов вставок/делеций могут быть получены менее чем за 3 часа. Таким образом, представленная в данном документе новая панель маркеров и способ их выявления предоставляют новую весьма выгодную альтернативу для выявления MSI в CRC даже на его ранних стадиях (как будет показано ниже) и в других образцах раковых тканей, таких как рак яичника, рак эндометрия и рак желудка, а также для прогностических и долговременных исследований в контексте иммунотерапии. Эти и другие преимущества и варианты применения настоящего изобретения представлены ниже.[0012] In conclusion, MSI testing is in high demand in medicine, a need for which is currently only partially met by existing diagnostic methods due to their technical limitations. These include, in particular, limited detection capabilities, high cost and/or execution time, the need for specialized equipment, and/or the interpretation of results by a highly qualified expert. The present invention overcomes the above drawbacks by providing a highly sensitive set of only a few short MSI homopolymer markers of the type described in WO2013153130, together with an exceptionally reliable method for detecting homonucleotide insertions or deletions (inserts/deletions) in their sequences. This method is very convenient for automation, does not require specific molecular infrastructures, and can be carried out using standard laboratory equipment, such as a conventional thermal cycler connected to a computer. In addition, it allows easy duplexing or even higher level multiplexing of selected markers, which has the advantage of further limiting the required laboratory material, and thus simplifies implementation in existing PCR-based platforms. It is important to note that this method provides very reliable results and allows easy and fully automated interpretation with a direct report as output. The inventors of the present invention demonstrate that under the present conditions, after receiving a tissue sample, such complete readings of insertion/deletion statuses can be obtained in less than 3 hours. Thus, the novel panel of markers and method for their detection presented herein provides a new, highly advantageous alternative for detecting MSI in CRC even at its early stages (as will be shown below) and in other cancer tissue samples such as ovarian cancer, endometrial cancer, and gastric cancer, as well as for prognostic and long-term studies in the context of immunotherapy. These and other advantages and applications of the present invention are presented below.

Краткое описание изобретенияBrief description of the invention

[0013] Настоящее изобретение определено в независимых пунктах прилагаемой формулы изобретения. Предпочтительные варианты осуществления определены в зависимых пунктах формулы изобретения. В частности, настоящее изобретение относится к панели биомаркеров для анализа локусов MSI в биологическом образце, при этом панель содержит следующие участки гомополимерных повторов, которые картированы на референтный геном человека GRCh38/hg38:[0013] The present invention is defined in the independent claims of the appended claims. Preferred embodiments are defined in the dependent claims. In particular, the present invention relates to a panel of biomarkers for the analysis of MSI loci in a biological sample, the panel containing the following regions of homopolymer repeats that are mapped to the reference human genome GRCh38/hg38:

гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене DIDO1 человека и начинающийся с положения chr20:62905340;a homopolymer repeat containing 11 consecutive adenines located in the human DIDO1 gene and starting at position chr20:62905340;

гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене MRE11 человека и начинающийся с положения chr11:94479765;homopolymer repeat containing 11 consecutive adenines, localized in the human MRE11 gene and starting at position chr11:94479765;

гомополимерный повтор, содержащий 10 последовательных аденинов, локализованный в гене SULF2 человека и начинающийся с положения chr20:47657577; иa homopolymer repeat containing 10 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577; And

гомополимерный повтор, содержащий 8 последовательных аденинов, локализованный в гене ACVR2A человека и начинающийся с положения chr2:147926117.homopolymer repeat containing 8 consecutive adenines, localized in the human ACVR2A gene and starting at position chr2:147926117.

[0014] Также важно, что настоящее изобретение относится к способу анализа локусов MSI в биологическом образце, предусматривающему стадию:[0014] It is also important that the present invention relates to a method for analyzing MSI loci in a biological sample, comprising the step of:

- определения количества нуклеотидов в следующих гомополимерных повторах, которые картированы на референтный геном человека GRCh38/hg38:- determination of the number of nucleotides in the following homopolymer repeats, which are mapped to the reference human genome GRCh38/hg38:

гомополимерном повторе, содержащем 11 последовательных аденинов, локализованном в гене DIDO1 человека и начинающемся с положения chr20:62905340;homopolymer repeat containing 11 consecutive adenines, localized in the human DIDO1 gene and starting at position chr20:62905340;

гомополимерном повторе, содержащем 11 последовательных аденинов, локализованном в гене MRE11 человека и начинающемся с положения chr11:94479765;homopolymer repeat containing 11 consecutive adenines, localized in the human MRE11 gene and starting at position chr11:94479765;

гомополимерном повторе, содержащем 10 последовательных аденинов, локализованном в гене SULF2 человека и начинающемся с положения chr20:47657577; иa homopolymer repeat containing 10 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577; And

гомополимерном повторе, содержащем 8 последовательных аденинов, локализованном в гене ACVR2A человека и начинающемся с положения chr2:147926117.homopolymer repeat containing 8 consecutive adenines, localized in the human ACVR2A gene and starting at position chr2:147926117.

[0015] В рамках вышеизложенного настоящее изобретение также относится к набору для анализа локусов MSI в биологическом образце, при этом набор содержит средства для амплифицирования участков нуклеиновой кислоты, содержащих по меньшей мере указанные выше гомополимерные повторы. [0015] Within the framework of the foregoing, the present invention also relates to a kit for the analysis of MSI loci in a biological sample, while the kit contains means for amplifying nucleic acid regions containing at least the above homopolymer repeats.

[0016] И наконец, в то же время важно, что настоящее изобретение также касается клетки или любого другого материала, в частности генетического материала, полученного из клеточной линии HTC116 cl.110268743, которая предусматривает одну гомонуклеотидную делецию в каждом из указанных выше гомополимерных повторов и в нескольких других преимущественных гомополимерных повторах. Клеточную линию HTC116 cl.110268743 успешно депонировали в соответствии с Будапештским договором в депозитарии BCCM/GeneCorner в Бельгии под номером доступа LMBP 12278CB.[0016] Finally, while importantly, the present invention also relates to a cell or any other material, in particular genetic material derived from the cell line HTC116 cl. in several other preferred homopolymer repeats. The cell line HTC116 cl.110268743 was successfully deposited under the Budapest Treaty with the BCCM/GeneCorner depository in Belgium under accession number LMBP 12278CB.

Краткое описание графических материаловBrief description of graphic materials

[0017] Для более полного понимания сущности настоящего изобретения ссылаются на следующее подробное описание, рассматриваемое в сочетании с прилагаемыми графическими материалами, на которых: [0017] For a more complete understanding of the essence of the present invention, reference is made to the following detailed description, considered in conjunction with the accompanying drawings, on which:

на фигуре 1 показан статус MSI по 7 микросателлитным маркерам (BTBD7, RYR3, SEC31A, ACVR2A, DIDO1, MRE11 и SULF2) в 128 образцах колоректального рака с MSI-H. Разные панели демонстрируют статус MSI (белый, MSS; темно-серый, MSI-H), когда образцы оценивают в отношении минимального набора из A) 4 маркеров, и B), C) и D) - последовательно добавляя маркер к минимальному набору из 4 маркеров. Статус маркера для отдельных образцов указан как дикий тип (светло-серый) или мутантный (серый);Figure 1 shows MSI status for 7 microsatellite markers (BTBD7, RYR3, SEC31A, ACVR2A, DIDO1, MRE11 and SULF2) in 128 colorectal cancer samples with MSI-H. Different panels show MSI status (white, MSS; dark grey, MSI-H) when samples are evaluated against a minimum set of A) 4 markers, and B), C) and D) - sequentially adding a marker to a minimum set of 4 markers. Marker status for individual samples is indicated as wild type (light grey) or mutant (grey);

на фигуре 2 показан статус MSI по 7 микросателлитным маркерам (BTBD7, RYR3, SEC31A, ACVR2A, DIDO1, MRE11 и SULF2) в 15 образцах рака желудка с MSI-H и 19 образцах рака эндометрия. Разные панели демонстрируют статус MSI (белый, MSS; темно-серый, MSI-H), когда образцы оценивают в отношении минимального набора из A) 4 маркеров, и B), C) и D) - последовательно добавляя маркер к минимальному набору из 4 маркеров. Статус маркера для отдельных образцов указан как дикий тип (светло-серый), или мутантный (серый), или без результата (диагональная линия).Figure 2 shows MSI status for 7 microsatellite markers (BTBD7, RYR3, SEC31A, ACVR2A, DIDO1, MRE11 and SULF2) in 15 MSI-H gastric cancer samples and 19 endometrial cancer samples. Different panels show MSI status (white, MSS; dark grey, MSI-H) when samples are evaluated against a minimum set of A) 4 markers, and B), C) and D) - sequentially adding a marker to a minimum set of 4 markers. Marker status for individual samples is indicated as wild type (light grey) or mutant (grey) or no result (diagonal line).

Фигура 3: мутационная нагрузка (измеренная по количеству замен (левая панель), количеству вставок/делеций (средняя панель) или по всем мутациям (правая панель)) в 33 с MSI-H относительно 89 образцов с MSS.Figure 3: Mutation load (measured by number of substitutions (left panel), number of insertions/deletions (middle panel) or all mutations (right panel)) at 33 s MSI-H versus 89 samples with MSS.

Фигура 4: мутационная нагрузка (измеренная по количеству соматических событий (замен и вставок/делеций) в MSI-H по сравнению с образцами с MSS в зависимости от типа рака. EM - эндометриальный, CRC - колоректальный.Figure 4: Mutation load (measured by the number of somatic events (substitutions and insertions/deletions) in MSI-H compared to samples with MSS, depending on the type of cancer. EM - endometrial, CRC - colorectal.

Фигура 5A: диаграмма корреляции между количеством мутантных микросателлитных маркеров от 1 до 6 (BTBD7, RYR3, SEC31A, ACVR2A, DIDO1 и MRE11) и мутационной нагрузкой в образцах с MSI, измеренной по (A) количеству соматических замен (при этом корректирование с помощью количества вставок/делеций, количества замен и количества мутантных маркеров коррелируют с p-значением = 1,92e-07) или по (B) количеству соматических вставок/делеций (при этом корректирование с помощью замен, количества вставок/делеций и количества мутантных маркеров коррелируют с p-значением = 7,1e-07), (C) корреляция между соматическими заменами и вставками/делециями в опухоли c MSI, показывающая высокую корреляцию между соматическими заменами и вставками/делециями в образцах с MSI-H. Корреляция является последовательной для обоих типов опухолей EM c MSI и опухолей CRC c MSI, но не для опухолей с MSS. Figure 5A: Plot of correlation between the number of mutant microsatellite markers from 1 to 6 (BTBD7, RYR3, SEC31A, ACVR2A, DIDO1 and MRE11) and mutation load in MSI samples measured by (A) the number of somatic substitutions (correcting with the number insertions/deletions, number of substitutions, and number of mutant markers correlate with p-value = 1.92e-07) or by (B) number of somatic insertions/deletions (while adjusting for substitutions, number of insertions/deletions, and number of mutant markers correlate with p-value = 7.1e-07), (C) Correlation between somatic substitutions and insertions/deletions in MSI tumor showing high correlation between somatic substitutions and insertions/deletions in MSI-H samples. The correlation is consistent for both types of EM tumors with MSI and CRC tumors with MSI, but not for tumors with MSS.

Фигура 5B: диаграммы корреляции между количеством мутантных микросателлитных маркеров и мутационной нагрузкой, как показано на фиг. 5A выше, но дополненные данными по еще одному маркеру (SULF2). В (A) показана корреляция с количеством соматических замен, при этом добавление еще одного маркера изменило p-значение до 6,5e-05). В (B) показана корреляция с количеством соматических вставок/делеций, при этом добавление еще одного маркера изменило p-значение до 2e-16. В (C) показана корреляция между соматическими заменами и вставками/делециями, при этом можно видеть, что добавление еще одного маркера дополнительно улучшает значимость корреляции в образцах с MSI-H. Figure 5B: Plots of the correlation between the number of mutant microsatellite markers and mutation burden as shown in FIG. 5A above, but supplemented with data for another marker (SULF2). (A) shows a correlation with the number of somatic substitutions, with the addition of one more marker changing the p-value to 6.5e-05). (B) shows the correlation with the number of somatic insertions/deletions, with the addition of one more marker changing the p-value to 2e-16. In (C) the correlation between somatic substitutions and insertions/deletions is shown, and it can be seen that the addition of one more marker further improves the significance of the correlation in MSI-H samples.

Фигура 6: количество положительных маркеров в качестве прогностического фактора для мутационной нагрузки опухоли (TMB). В среднем наблюдали более 348 замен и более 119 вставок/делеций с увеличением на один положительный маркер (данные показаны для 7 маркеров, как это представлено на фигуре 5B).Figure 6: Number of positive markers as a predictor for tumor mutation load (TMB). On average, more than 348 substitutions and more than 119 insertions/deletions were observed with an increase of one positive marker (data shown for 7 markers, as presented in figure 5B).

Фигура 7: обзор стадирования опухоли CRC, связанного с подходящими, неподходящими, ошибочными и несовпадающими результатами при способе тестирования MSI в соответствии с настоящим изобретением, реализованного в платформе Biocartis Idylla, по сравнению с IHC-анализом.Figure 7: Overview of CRC tumor staging associated with fit, inappropriate, erroneous and mismatch results in the MSI testing method according to the present invention implemented in the Biocartis Idylla platform compared to IHC analysis.

Подробное описание изобретенияDetailed description of the invention

[0018] Настоящее изобретение в целом относится к новой панели биомаркеров MSI, способам использования данной панели, автоматизированным системам и наборам для проведения указанных способов, при этом наборы могут предпочтительно содержать или могут быть представлены в виде картриджа, совместимого с указанными автоматизированными системами, и содержать средства, а также предпочтительно положительный контрольный материал для выявления вставок/делеций в указанной панели. [0018] The present invention generally relates to a new MSI biomarker panel, methods of using this panel, automated systems and kits for carrying out these methods, while the kits may preferably contain or may be presented in the form of a cartridge compatible with these automated systems, and contain means, and preferably a positive control material to detect insertions/deletions in the specified panel.

[0019] В предпочтительном варианте осуществления по настоящему изобретению представлена панель биомаркеров для анализа локусов MSI в биологическом образце, при этом панель содержит по меньшей мере следующие участки гомополимерных повторов или их мутантных форм (причем мутация представляет собой присутствие по меньшей мере одной вставки/делеции в последовательности гомополимерного повтора), которые картированы на референтный геном человека GRCh38/hg38:[0019] In a preferred embodiment, the present invention provides a panel of biomarkers for analyzing MSI loci in a biological sample, wherein the panel contains at least the following regions of homopolymer repeats or mutant forms thereof (wherein the mutation is the presence of at least one insertion/deletion in homopolymer repeat sequences) that are mapped to the reference human genome GRCh38/hg38:

гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене DIDO1 человека и начинающийся с положения chr20:62905340;a homopolymer repeat containing 11 consecutive adenines located in the human DIDO1 gene and starting at position chr20:62905340;

гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене MRE11 человека и начинающийся с положения chr11:94479765;homopolymer repeat containing 11 consecutive adenines, localized in the human MRE11 gene and starting at position chr11:94479765;

гомополимерный повтор, содержащий 10 последовательных аденинов, локализованный в гене SULF2 человека и начинающийся с положения chr20:47657577; иa homopolymer repeat containing 10 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577; And

гомополимерный повтор, содержащий 8 последовательных аденинов, локализованный в гене ACVR2A человека и начинающийся с положения chr2:147926117.homopolymer repeat containing 8 consecutive adenines, localized in the human ACVR2A gene and starting at position chr2:147926117.

[0020] Авторы настоящего изобретения осуществили проверку множества выбранных произвольным образом маркеров типа, раскрытого в WO2013153130 (VIB), которые являются гомополимерами, существенно более короткими, чем маркеры в панели Bethesda. Произвольный отбор меньшего количества маркеров из раскрытого в том документе предпочтительного набора из 56 маркеров не привел к получению надежного анализа, способного к многократному выявлению фенотипа MSI-H в широком диапазоне образцов рака человека с помощью минимального количества и наиболее основных лабораторных ресурсов. Маркеры либо не поддавались выявлению в мультиплексной или даже в дуплексной реакции, либо имело место варьирование по количеству нуклеотидов среди разных этнических групп людей. Случайный выбор экзонного гомополимерного повтора, содержащего 8 последовательных аденинов, локализованного в гене ACVR2A человека и начинающегося с положения chr2:147926117, который не раскрыт в предпочтительном наборе из 56 в WO2013153130, и экзонного гомополимерного повтора, содержащего 11 последовательных аденинов, локализованного в гене MRE11 человека и начинающегося с положения chr11:94479765, который вообще не раскрыт в WO2013153130, неожиданно привел к получению высокоэффективной панели для выявления MSI в опухолях человека с дефицитом MMR.[0020] The present inventors tested a plurality of randomly selected markers of the type disclosed in WO2013153130 (VIB) which are homopolymers substantially shorter than the markers in the Bethesda panel. Random selection of fewer markers from the preferred set of 56 markers disclosed in that document did not result in a robust assay capable of repeatedly detecting the MSI-H phenotype in a wide range of human cancer samples with the minimum and most basic laboratory resources. The markers were either not detectable in the multiplex or even duplex reaction, or there was variation in the number of nucleotides among different ethnic groups of people. Random selection of an exon homopolymer repeat containing 8 contiguous adenines located in the human ACVR2A gene starting at position chr2:147926117, which is not disclosed in the preferred set of 56 in WO2013153130, and an exon homopolymer repeat containing 11 contiguous adenines located in the human MRE11 gene and starting at position chr11:94479765, which is not disclosed at all in WO2013153130, unexpectedly resulted in a highly efficient panel for detecting MSI in MMR-deficient human tumors.

[0021] Выявили, что эффективность минимальной панели из всего лишь 4 маркеров, представленной в данном документе, превышает минимально приемлемую эффективность, заданную на уровне 95%, для корректной идентификации образцов колоректального рака человека с подтвержденной MSI-H. В разделе «Примеры» ниже авторы настоящего изобретения демонстрируют, что вышеприведенная минимальная панель по настоящему изобретению способна успешно выявлять 123 положительных образца с MSI-H в пуле из 128 образцов CRC с MSI-H, что составляет 96% образцов, корректно идентифицированных как MSI-H. Таким образом, в предпочтительном варианте осуществления представлена панель, характеризующаяся показателем корректной идентификации, составляющим по меньшей мере 90%, предпочтительно по меньшей мере 95% образцов опухолей с MSI-H. [0021] The performance of the minimum panel of only 4 markers presented herein was found to exceed the minimum acceptable performance set at 95% for correctly identifying MSI-H confirmed human colorectal cancer specimens. In the Examples section below, the present inventors demonstrate that the above minimal panel of the present invention is able to successfully detect 123 MSI-H positive samples in a pool of 128 MSI-H CRC samples, representing 96% of the samples correctly identified as MSI-H. h. Thus, in a preferred embodiment, there is provided a panel having a correct identification rate of at least 90%, preferably at least 95%, of tumor samples with MSI-H.

[0022] Логично, что при добавлении дополнительных маркеров можно постепенно повысить эту эффективность. Таким образом, в предпочтительном варианте осуществления настоящего изобретения представлена панель в соответствии с предыдущим вариантом осуществления, дополнительно содержащая любой один, два или все из следующих трех участков гомополимерных повторов или их мутантных форм, которые картированы на референтный геном человека GRCh38/hg38: [0022] It is logical that by adding additional markers, this efficiency can be gradually increased. Thus, in a preferred embodiment of the present invention, there is provided a panel according to the previous embodiment, further comprising any one, two, or all of the following three homopolymer repeat regions, or mutant forms thereof, that are mapped to the human GRCh38/hg38 reference genome:

гомополимерного повтора, содержащего 10 последовательных аденинов, локализованного в гене BTBD7 человека и начинающегося с положения chr14:93241685;a homopolymer repeat containing 10 consecutive adenines located in the human BTBD7 gene and starting at position chr14:93241685;

гомополимерного повтора, содержащего 9 последовательных тиминов, локализованного в гене SEC31A человека и начинающегося с положения chr4:82864412; a homopolymer repeat containing 9 consecutive thymines located in the human SEC31A gene and starting at position chr4:82864412;

гомополимерного повтора, содержащего 10 последовательных аденинов, локализованного в гене RYR3 человека и начинающегося с положения chr15:33865341.homopolymer repeat containing 10 consecutive adenines, localized in the human RYR3 gene and starting at position chr15:33865341.

[0023] Представленные в данном документе маркеры гомополимерных повторов, которые составляют панель биомаркеров по настоящему изобретению, представляют собой лишь короткие нити из не более 11 повторяющихся гомонуклеотидов, например, 11 последовательных аденинов в 3'UTR DIDO1. Любому специалисту в данной области техники будет понятно, что комплементарные им последовательности, например, 11 последовательных тиминов, комплементарных 11 последовательным аденинам в последовательности 3'UTR DIDO1, также должны истолковываться как подпадающие в объем используемых в данном документе упомянутых выше терминов.[0023] The homopolymer repeat markers provided herein, which comprise the panel of biomarkers of the present invention, are only short strands of no more than 11 repeat homonucleotides, eg 11 consecutive adenines in the 3'UTR of DIDO1. One skilled in the art will appreciate that their complementary sequences, for example the 11 consecutive thymines complementary to the 11 consecutive adenines in the DIDO1 3'UTR sequence, should also be construed as falling within the scope of the above-mentioned terms used herein.

[0024] В особенно предпочтительном варианте осуществления представлена панель, содержащая пять следующих участков гомополимерных повторов или их мутантных форм, которые картированы на референтный геном человека GRCh38/hg38:[0024] In a particularly preferred embodiment, a panel is provided containing the following five regions of homopolymer repeats, or mutant forms thereof, that are mapped to the reference human genome GRCh38/hg38:

гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене DIDO1 человека и начинающийся с положения chr20:62905340;a homopolymer repeat containing 11 consecutive adenines located in the human DIDO1 gene and starting at position chr20:62905340;

гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене MRE11 человека и начинающийся с положения chr11:94479765;homopolymer repeat containing 11 consecutive adenines, localized in the human MRE11 gene and starting at position chr11:94479765;

гомополимерный повтор, содержащий 10 последовательных аденинов, локализованный в гене SULF2 человека и начинающийся с положения chr20:47657577;a homopolymer repeat containing 10 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577;

гомополимерный повтор, содержащий 8 последовательных аденинов, локализованный в гене ACVR2A человека и начинающийся с положения chr2:147926117; и homopolymer repeat containing 8 consecutive adenines, localized in the human ACVR2A gene and starting at position chr2:147926117; And

гомополимерный повтор, содержащий 10 последовательных аденинов, локализованный в гене BTBD7 человека и начинающийся с положения chr14:93241685.homopolymer repeat containing 10 consecutive adenines, localized in the human BTBD7 gene and starting at position chr14:93241685.

Используя данный основной набор из пяти маркеров, 124 из 128, т. е. 97% образцов опухолей могут быть идентифицированы как MSI-H.Using this core set of five markers, 124 out of 128, i.e. 97% of tumor samples can be identified as MSI-H.

[0025] В другом предпочтительном варианте осуществления представлена панель, содержащая шесть следующих участков гомополимерных повторов или их мутантных форм, которые картированы на референтный геном человека GRCh38/hg38:[0025] In another preferred embodiment, a panel is provided containing the following six regions of homopolymer repeats, or mutant forms thereof, that are mapped to the reference human genome GRCh38/hg38:

гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене DIDO1 человека и начинающийся с положения chr20:62905340;a homopolymer repeat containing 11 consecutive adenines located in the human DIDO1 gene and starting at position chr20:62905340;

гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене MRE11 человека и начинающийся с положения chr11:94479765;homopolymer repeat containing 11 consecutive adenines, localized in the human MRE11 gene and starting at position chr11:94479765;

гомополимерный повтор, содержащий 10 последовательных аденинов, локализованный в гене SULF2 человека и начинающийся с положения chr20:47657577;a homopolymer repeat containing 10 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577;

гомополимерный повтор, содержащий 8 последовательных аденинов, локализованный в гене ACVR2A человека и начинающийся с положения chr2:147926117;homopolymer repeat containing 8 consecutive adenines, localized in the human ACVR2A gene and starting at position chr2:147926117;

гомополимерный повтор, содержащий 10 последовательных аденинов, локализованный в гене BTBD7 человека и начинающийся с положения chr14:93241685; иa homopolymer repeat containing 10 consecutive adenines located in the human BTBD7 gene and starting at position chr14:93241685; And

гомополимерный повтор, содержащий 9 последовательных тиминов, локализованный в гене SEC31A человека и начинающийся с положения chr4:82864412.homopolymer repeat containing 9 consecutive thymines, localized in the human SEC31A gene and starting at position chr4:82864412.

За счет дальнейшего добавления дополнительного маркера, локализованного в гене SEC31A, к основному набору маркеров все 128 образцов могут быть оценены как MSI-H, что делает панель еще более эффективной в определении статуса MSI.By further adding an additional marker located in the SEC31A gene to the core set of markers, all 128 samples can be assessed as MSI-H, making the panel even more effective in determining MSI status.

[0026] В еще одном предпочтительном варианте осуществления представлена панель, содержащая семь следующих участков гомополимерных повторов или их мутантных форм, которые картированы на референтный геном человека GRCh38/hg38:[0026] In yet another preferred embodiment, a panel is provided containing the following seven homopolymer repeat regions, or mutant forms thereof, that are mapped to the GRCh38/hg38 human reference genome:

гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене DIDO1 человека и начинающийся с положения chr20:62905340;a homopolymer repeat containing 11 consecutive adenines located in the human DIDO1 gene and starting at position chr20:62905340;

гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене MRE11 человека и начинающийся с положения chr11:94479765;homopolymer repeat containing 11 consecutive adenines, localized in the human MRE11 gene and starting at position chr11:94479765;

гомополимерный повтор, содержащий 10 последовательных аденинов, локализованный в гене SULF2 человека и начинающийся с положения chr20:47657577;a homopolymer repeat containing 10 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577;

гомополимерный повтор, содержащий 8 последовательных аденинов, локализованный в гене ACVR2A человека и начинающийся с положения chr2:147926117; homopolymer repeat containing 8 consecutive adenines, localized in the human ACVR2A gene and starting at position chr2:147926117;

гомополимерный повтор, содержащий 10 последовательных аденинов, локализованный в гене BTBD7 человека и начинающийся с положения chr14:93241685;a homopolymer repeat containing 10 consecutive adenines located in the human BTBD7 gene and starting at position chr14:93241685;

гомополимерный повтор, содержащий 9 последовательных тиминов, локализованный в гене SEC31A человека и начинающийся с положения chr4:82864412; иhomopolymer repeat containing 9 consecutive thymines, localized in the human SEC31A gene and starting at position chr4:82864412; And

гомополимерный повтор, содержащий 10 последовательных аденинов, локализованный в гене RYR3 человека и начинающийся с положения chr15:33865341.homopolymer repeat containing 10 consecutive adenines, localized in the human RYR3 gene and starting at position chr15:33865341.

Набор из вышеуказанных семи маркеров рассчитан для уменьшения показателя потенциальной вероятности ложноотрицательньных результатов до ~ 1/1900. Таким образом, добавление еще одного маркера, совместимого с панелями из предыдущих вариантов осуществления, предоставляет дополнительную гарантию эффективности, в частности в реализации панели в выявлении MSI в разных видах рака, отличных от колоректального, например, в раке яичника, раке эндометрия и раке желудка. The set of the above seven markers is calculated to reduce the potential false negative rate to ~ 1/1900. Thus, the addition of another marker compatible with the panels of the previous embodiments provides an additional guarantee of effectiveness, in particular in the implementation of the panel in the detection of MSI in different cancers other than colorectal, for example, in ovarian cancer, endometrial cancer and gastric cancer.

[0027] В предпочтительном варианте осуществления биологический образец получен от индивидуума с подозрением на опухоль. В другом варианте осуществления биологический образец представляет собой образец опухоли, предположительно свежую ткань или фиксированный образец опухоли, например, замороженный образец или образец FFPE. В особенно предпочтительном варианте опухоль выбрана из колоректальной опухоли, опухоли яичника, опухоли эндометрия или опухоли желудка. В другом возможном варианте осуществления образец представляет собой жидкий биоптат. В другом возможном варианте осуществления образец представляет собой любой образец ткани, как, например, мононуклеарные клетки периферической крови (PBMC) или другие лейкоциты или ткань кожи пациента, предположительно страдающего синдромом Линча.[0027] In a preferred embodiment, the biological sample is obtained from an individual with a suspected tumor. In another embodiment, the biological sample is a tumor sample, presumably fresh tissue, or a fixed tumor sample, such as a frozen sample or a FFPE sample. In a particularly preferred embodiment, the tumor is selected from a colorectal tumor, an ovarian tumor, an endometrial tumor, or a gastric tumor. In another possible embodiment, the sample is a liquid biopsy. In another possible embodiment, the sample is any tissue sample, such as peripheral blood mononuclear cells (PBMC) or other leukocytes or skin tissue from a patient suspected of having Lynch syndrome.

[0028] Дополнительной целью настоящего изобретения является обеспечение способа анализа локусов MSI в биологическом образце, при этом способ предусматривает стадию определения количества нуклеотидов в панели биомаркеров согласно описанным выше вариантам осуществления.[0028] It is a further object of the present invention to provide a method for analyzing MSI loci in a biological sample, the method comprising the step of determining the number of nucleotides in a panel of biomarkers according to the embodiments described above.

[0029] Следовательно, в одном варианте осуществления по настоящему изобретению представлен способ анализа локусов MSI в биологическом образце, предусматривающий стадию:[0029] Therefore, in one embodiment, the present invention provides a method for analyzing MSI loci in a biological sample, comprising the step of:

- определения количества нуклеотидов в следующих гомополимерных повторах, которые картированы на референтный геном человека GRCh38/hg38:- determination of the number of nucleotides in the following homopolymer repeats, which are mapped to the reference human genome GRCh38/hg38:

гомополимерном повторе, содержащем 11 последовательных аденинов, локализованном в гене DIDO1 человека и начинающемся с положения chr20:62905340;homopolymer repeat containing 11 consecutive adenines, localized in the human DIDO1 gene and starting at position chr20:62905340;

гомополимерном повторе, содержащем 11 последовательных аденинов, локализованном в гене MRE11 человека и начинающемся с положения chr11:94479765;homopolymer repeat containing 11 consecutive adenines, localized in the human MRE11 gene and starting at position chr11:94479765;

гомополимерном повторе, содержащем 10 последовательных аденинов, локализованном в гене SULF2 человека и начинающемся с положения chr20:47657577; иa homopolymer repeat containing 10 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577; And

гомополимерном повторе, содержащем 8 последовательных аденинов, локализованном в гене ACVR2A человека и начинающемся с положения chr2:147926117.homopolymer repeat containing 8 consecutive adenines, localized in the human ACVR2A gene and starting at position chr2:147926117.

[0030] По тем же описанным выше причинам в предпочтительном варианте осуществления способ по настоящему изобретению также дополнительно предусматривает определение количества нуклеотидов в любом одном, двух или всех из следующих участков гомополимерных повторов, которые картированы на референтный геном человека GRCh38/hg38: [0030] For the same reasons described above, in a preferred embodiment, the method of the present invention further comprises determining the number of nucleotides in any one, two, or all of the following homopolymer repeat regions that are mapped to the human GRCh38/hg38 reference genome:

гомополимерного повтора, содержащего 10 последовательных аденинов, локализованного в гене BTBD7 человека и начинающегося с положения chr14:93241685; a homopolymer repeat containing 10 consecutive adenines located in the human BTBD7 gene and starting at position chr14:93241685;

гомополимерного повтора, содержащего 9 последовательных тиминов, локализованного в гене SEC31A человека и начинающегося с положения chr4:82864412;a homopolymer repeat containing 9 consecutive thymines located in the human SEC31A gene and starting at position chr4:82864412;

гомополимерного повтора, содержащего 10 последовательных аденинов, локализованного в гене RYR3 человека и начинающегося с положения chr15:33865341.homopolymer repeat containing 10 consecutive adenines, localized in the human RYR3 gene and starting at position chr15:33865341.

[0031] В конкретном варианте осуществления представлен способ, предусматривающий стадию:[0031] In a particular embodiment, a method is provided comprising the step of:

- определения количества нуклеотидов в пяти следующих гомополимерных повторах, которые картированы на референтный геном человека GRCh38/hg38:- determination of the number of nucleotides in the following five homopolymer repeats, which are mapped to the reference human genome GRCh38/hg38:

гомополимерном повторе, содержащем 11 последовательных аденинов, локализованном в гене DIDO1 человека и начинающемся с положения chr20:62905340;homopolymer repeat containing 11 consecutive adenines, localized in the human DIDO1 gene and starting at position chr20:62905340;

гомополимерном повторе, содержащем 11 последовательных аденинов, локализованном в гене MRE11 человека и начинающемся с положения chr11:94479765;homopolymer repeat containing 11 consecutive adenines, localized in the human MRE11 gene and starting at position chr11:94479765;

гомополимерном повторе, содержащем 10 последовательных аденинов, локализованном в гене SULF2 человека и начинающемся с положения chr20:47657577; гомополимерном повторе, содержащем 8 последовательных аденинов, локализованном в гене ACVR2A человека и начинающемся с положения chr2:147926117; иa homopolymer repeat containing 10 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577; homopolymer repeat containing 8 consecutive adenines, localized in the human ACVR2A gene and starting at position chr2:147926117; And

гомополимерном повторе, содержащем 10 последовательных аденинов, локализованном в гене BTBD7 человека и начинающемся с положения chr14:93241685.homopolymer repeat containing 10 consecutive adenines, localized in the human BTBD7 gene and starting at position chr14:93241685.

[0032] В более конкретном варианте осуществления представлен способ, предусматривающий стадию:[0032] In a more specific embodiment, a method is provided comprising the step of:

- определения количества нуклеотидов в шести следующих гомополимерных повторах, которые картированы на референтный геном человека GRCh38/hg38:- determination of the number of nucleotides in the following six homopolymer repeats, which are mapped to the reference human genome GRCh38/hg38:

гомополимерном повторе, содержащем 11 последовательных аденинов, локализованном в гене DIDO1 человека и начинающемся в положении chr20:62905340;homopolymer repeat containing 11 consecutive adenines, localized in the human DIDO1 gene and starting at position chr20:62905340;

гомополимерном повторе, содержащем 11 последовательных аденинов, локализованном в гене MRE11 человека и начинающемся в положении chr11:94479765;homopolymer repeat containing 11 consecutive adenines, localized in the human MRE11 gene and starting at position chr11:94479765;

гомополимерном повторе, содержащем 10 последовательных аденинов, локализованном в гене SULF2 человека и начинающемся в положении chr20:47657577;a homopolymer repeat containing 10 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577;

гомополимерном повторе, содержащем 8 последовательных аденинов, локализованном в гене ACVR2A человека и начинающемся в положении chr2:147926117; homopolymer repeat containing 8 consecutive adenines, localized in the human ACVR2A gene and starting at position chr2:147926117;

гомополимерном повторе, содержащем 10 последовательных аденинов, локализованном в гене BTBD7 человека и начинающемся в положении chr14:93241685; иa homopolymer repeat containing 10 consecutive adenines located in the human BTBD7 gene and starting at position chr14:93241685; And

гомополимерном повторе, содержащем 9 последовательных тиминов, локализованном в гене SEC31A человека и начинающемся в положении chr4:82864412.homopolymer repeat containing 9 consecutive thymines, localized in the human SEC31A gene and starting at position chr4:82864412.

[0033] В другом конкретном варианте осуществления представлен способ, предусматривающий стадию:[0033] In another specific embodiment, a method is provided comprising the step of:

- определения количества нуклеотидов в семи следующих гомополимерных повторах, которые картированы на референтный геном человека GRCh38/hg38:- determination of the number of nucleotides in the following seven homopolymer repeats, which are mapped to the reference human genome GRCh38/hg38:

гомополимерном повторе, содержащем 11 последовательных аденинов, локализованном в гене DIDO1 человека и начинающемся в положении chr20:62905340;homopolymer repeat containing 11 consecutive adenines, localized in the human DIDO1 gene and starting at position chr20:62905340;

гомополимерном повторе, содержащем 11 последовательных аденинов, локализованном в гене MRE11 человека и начинающемся в положении chr11:94479765;homopolymer repeat containing 11 consecutive adenines, localized in the human MRE11 gene and starting at position chr11:94479765;

гомополимерном повторе, содержащем 10 последовательных аденинов, локализованном в гене SULF2 человека и начинающемся в положении chr20:47657577;a homopolymer repeat containing 10 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577;

гомополимерном повторе, содержащем 8 последовательных аденинов, локализованном в гене ACVR2A человека и начинающемся в положении chr2:147926117; homopolymer repeat containing 8 consecutive adenines, localized in the human ACVR2A gene and starting at position chr2:147926117;

гомополимерном повторе, содержащем 10 последовательных аденинов, локализованном в гене BTBD7 человека и начинающемся в положении chr14:93241685;a homopolymer repeat containing 10 consecutive adenines located in the human BTBD7 gene and starting at position chr14:93241685;

гомополимерном повторе, содержащем 9 последовательных тиминов, локализованном в гене SEC31A человека и начинающемся в положении chr4:82864412; иa homopolymer repeat containing 9 consecutive thymines located in the human SEC31A gene and starting at position chr4:82864412; And

гомополимерном повторе, содержащем 10 последовательных аденинов, локализованном в гене RYR3 человека и начинающемся в положении chr15:33865341.homopolymer repeat containing 10 consecutive adenines, localized in the human RYR3 gene and starting at position chr15:33865341.

[0034] В возможных вариантах осуществления способ по настоящему изобретению может дополнительно предусматривать стадию диагностирования статуса MSI у биологического образца, если вставка/делеция выявлена в по меньшей мере двух гомополимерных повторах.[0034] In possible embodiments, the method of the present invention may further comprise the step of diagnosing MSI status in a biological sample if an insertion/deletion is detected in at least two homopolymer repeats.

[0035] Предпочтительно представлены способы по настоящему изобретению, где биологический образец, полученный от субъекта, представляет собой опухоль или образец предполагаемой опухоли. В принципе, раскрытые в данном документе способы могут проводиться с применением любого подтвержденного образца или образца предполагаемой опухоли. В предпочтительном варианте осуществления опухоль представляет собой колоректальную опухоль, опухоль желудка, опухоль яичника или опухоль эндометрия.[0035] Preferably, the methods of the present invention are provided wherein the biological sample obtained from the subject is a tumor or a sample of a putative tumor. In principle, the methods disclosed herein can be carried out using any confirmed or putative tumor sample. In a preferred embodiment, the tumor is a colorectal tumor, gastric tumor, ovarian tumor, or endometrial tumor.

[0036] Специалистам в данной области техники будет понятно, что свойства панели маркеров гомополимерного повтора по настоящему изобретению определяют, что способы по настоящему изобретению будут предпочтительно осуществляться с применением геномной ДНК, присутствующей в биологических образцах. В зависимости от типа образца в предпочтительном варианте осуществления способу по настоящему изобретению предшествовали какие-либо из следующих стадий: [0036] Those skilled in the art will appreciate that the properties of the homopolymer repeat marker panel of the present invention determine that the methods of the present invention will preferably be carried out using genomic DNA present in biological samples. Depending on the type of sample, in a preferred embodiment, the method of the present invention was preceded by any of the following steps:

- экстрагирования и/или выделения нуклеиновой кислоты, потенциально содержащей целевую последовательность, из источника нуклеиновой кислоты;- extracting and/or isolating a nucleic acid potentially containing a target sequence from a nucleic acid source;

- обеспечения указанной экстрагированной и/или очищенной нуклеиновой кислоты, потенциально содержащей мишень, для стадии амплификации указанной нуклеиновой кислоты.- providing said extracted and/or purified nucleic acid potentially containing a target for the step of amplifying said nucleic acid.

[0037] Поскольку геномная ДНК представляет собой богатый и сложный материал на основе нуклеиновой кислоты, преимущественно, чтобы последовательности, фланкирующие участки гомополимерных повторов, определенные выше, амплифицировались до стадии определения в них количества нуклеотидов. Таким образом, в предпочтительном варианте осуществления представлен способ, дополнительно предусматривающий стадию:[0037] Because genomic DNA is a rich and complex nucleic acid material, it is advantageous for the sequences flanking the homopolymer repeat regions defined above to be amplified to the step of determining their nucleotide count. Thus, in a preferred embodiment, a method is provided further comprising the step of:

- амплифицирования участков нуклеиновой кислоты, содержащих гомополимерные повторы, перечисленные выше. Любому специалисту в данной области техники будет очевидно, что такое амплифицирование будет давать продукты амплификации, содержащие последовательность гомополимерного повтора независимо от ее статуса по MSI. То есть такие продукты амплификации могут содержать вариант дикого типа (WT) указанного гомополимерного повтора или его MSI-вариант, т. е. мутант, содержащий вставку/делецию по меньшей мере одного гомонуклеотида в последовательности гомополимерного повтора.- amplification of nucleic acid regions containing the homopolymer repeats listed above. It will be apparent to one of skill in the art that such amplification will produce amplification products containing a homopolymer repeat sequence, regardless of its MSI status. That is, such amplification products may contain a wild-type (WT) variant of said homopolymer repeat or an MSI variant thereof, i.e., a mutant containing the insertion/deletion of at least one homonucleotide in the sequence of the homopolymer repeat.

[0038] Естественно, что в очевидном варианте осуществления амплификацию предпочтительно выполняют посредством полимеразной цепной реакции (ПЦР), например, с использованием средств для выполнения ПЦР, таких как подходящие реагенты и/или устройство, представляющее собой термоциклер. Однако также могут использоваться другие методики амплификации, известные в данной области техники. Они включают без ограничения изотермическую амплификацию с образованием петель (LAMP), амплификацию, основанную на последовательности нуклеиновых кислот (NASBA), амплификацию с замещением цепей (SDA), амплификацию с множественным замещением цепей (MDA), амплификацию по типу катящегося кольца (RCA), лигазную цепную реакцию (LCR), хеликазно-зависимую амплификацию (HDA) или амплификацию по методу рамификации (RAM).[0038] Naturally, in an obvious embodiment, the amplification is preferably performed by polymerase chain reaction (PCR), for example, using means for performing PCR, such as suitable reagents and/or a thermal cycler device. However, other amplification techniques known in the art may also be used. These include, but are not limited to, isothermal loop amplification (LAMP), nucleic acid sequence based amplification (NASBA), strand displacement amplification (SDA), multiple strand displacement amplification (MDA), rolling ring amplification (RCA), ligase chain reaction (LCR), helicase dependent amplification (HDA) or ramification method amplification (RAM).

[0039] В предпочтительном варианте осуществления представлен способ, где стадия амплифицирования предусматривает применение по меньшей мере одного праймера, имеющего последовательность, идентифицированную с помощью любого из следующих SEQ ID NO:1-14:[0039] In a preferred embodiment, a method is provided wherein the amplification step involves the use of at least one primer having a sequence identified by any of the following SEQ ID NOs: 1-14:

для маркера DIDO1:for DIDO1 marker:

SEQ ID NO: 1 - TAGCGTGTGAATCGGACATSEQ ID NO: 1 - TAGCGTGTGAATCGGACAT

SEQ ID NO: 2 - TTGACTGGGCAGATAGGGGASEQ ID NO: 2 - TTGACTGGGCAGATAGGGGA

Для маркера MRE11:For MRE11 marker:

SEQ ID NO: 3 - ATAGTTCACCCATGGAAACCSEQ ID NO: 3 - ATAGTTCACCCATGGAAACC

SEQ ID NO: 4 - GGAGGAGAATCTTAGGGAAASEQ ID NO: 4 - GGAGGAGAATCTTAGGGAAA

Для маркера BTBD7:For BTBD7 marker:

SEQ ID NO: 5 - ACTGGACTCCCGCTGGSEQ ID NO: 5 - ACTGGACTCCCGCTGG

SEQ ID NO: 6 - CGCTCAGCCTCCATAAATCSEQ ID NO: 6 - CGCTCAGCCTCCATAAATC

Для маркера SULF2:For the SULF2 marker:

SEQ ID NO: 7 - CAACTTCATTTCTTTTCAGTACCTTSEQ ID NO: 7 - CAACTTCATTTCTTTTCAGTACCTT

SEQ ID NO: 8 - CTGTCCAGATACCATTTCTCSEQ ID NO: 8 - CTGTCCAGATACCATTTCTC

Для маркера ACVR2A:For ACVR2A marker:

SEQ ID NO: 9 - AGCATCCATCTCTTGAAGACATSEQ ID NO: 9 - AGCATCCATCTCTTGAAGACAT

SEQ ID NO: 10 - GCATGTTTCTGCCAATAATCTCTSEQ ID NO: 10 - GCATGTTTCTGCCAATAATCTCT

Для маркера SEC31A:For SEC31A marker:

SEQ ID NO: 11 - CAACTTCAGCAGGCTGTSEQ ID NO: 11 - CAACTTCAGCAGGCTGT

SEQ ID NO: 12 - AGTCTGAGAAGCATCAATTTTSEQ ID NO: 12-AGTCTGAGAAGCATCAATTTT

Для маркера RYR3:For RYR3 marker:

SEQ ID NO: 13 - CATTTTCTAAATGCCTCCCTTAAASEQ ID NO: 13 - CATTTTCTAAATGCCTCCCTTAAA

SEQ ID NO: 14 - GTCCATTAGGCACAAAAAGSEQ ID NO: 14 - GTCCATTAGGCACAAAAAG

[0040] В более конкретном варианте осуществления стадия амплифицирования предусматривает применение по меньшей мере одной пары праймеров, выбранной из следующих: SEQ ID NO: 1 и SEQ ID NO: 2; SEQ ID NO: 3 и SEQ ID NO: 4; SEQ ID NO: 5 и SEQ ID NO: 6; SEQ ID NO: 7 и SEQ ID NO: 8; SEQ ID NO: 9 и SEQ ID NO: 10; SEQ ID NO: 11 и SEQ ID NO: 12 или SEQ ID NO: 13 и SEQ ID NO: 14.[0040] In a more specific embodiment, the stage of amplification involves the use of at least one pair of primers selected from the following: SEQ ID NO: 1 and SEQ ID NO: 2; SEQ ID NO: 3 and SEQ ID NO: 4; SEQ ID NO: 5 and SEQ ID NO: 6; SEQ ID NO: 7 and SEQ ID NO: 8; SEQ ID NO: 9 and SEQ ID NO: 10; SEQ ID NO: 11 and SEQ ID NO: 12 or SEQ ID NO: 13 and SEQ ID NO: 14.

[0041] Любому специалисту в данной области техники будет понятно, что в зависимости от условий амплификации, вышеперечисленные последовательности праймера будут, вероятно, работать также в том случае, если 1, 2 или в некоторых случаях даже, возможно, 3 нуклеотида в них изменены, т. е. добавлены, удалены или замещены другим нуклеотидом или модифицированным нуклеотидом. Таким образом, в возможном варианте осуществления настоящего изобретения также представлена по меньшей мере одна последовательность праймера, с помощью любого из вышеуказанных SEQ ID NO: 1-14, где 1, 2 или 3 нуклеотида подвергнуты изменению. В альтернативном варианте осуществления настоящего изобретения также представлена по меньшей мере одна последовательность праймера, которая на по меньшей мере 80%, предпочтительно на по меньшей мере 85%, более предпочтительно на по меньшей мере 90% или наиболее предпочтительно на по меньшей мере 95% идентична любой из вышеуказанных последовательностей под SEQ ID NO: 1-14. Специалистам в данной области техники будет понятно, что с целью получения ампликонов, охватывающих представляющие интерес участки гомополимерных повторов, можно сконструировать альтернативные праймеры из 5, 10, 20, 50 или 100 нуклеотидов, охватывающие участки выше или ниже относительно положений вышеописанных пар праймеров. Таким образом, такие пары альтернативных праймеров следует также рассматривать в качестве альтернативного очевидного варианта осуществления по настоящему изобретению.[0041] Any person skilled in the art will understand that depending on the amplification conditions, the above primer sequences will probably work also if 1, 2 or in some cases even possibly 3 nucleotides in them are changed, i.e. added, removed or replaced by another nucleotide or a modified nucleotide. Thus, in a possible embodiment of the present invention, at least one primer sequence is also provided, using any of the above SEQ ID NOs: 1-14, where 1, 2 or 3 nucleotides have been changed. In an alternative embodiment, the present invention also provides at least one primer sequence that is at least 80%, preferably at least 85%, more preferably at least 90%, or most preferably at least 95% identical to any from the above sequences under SEQ ID NO: 1-14. Those skilled in the art will appreciate that, in order to obtain amplicons spanning the homopolymer repeat regions of interest, alternative primers of 5, 10, 20, 50, or 100 nucleotides can be designed spanning regions above or below the positions of the primer pairs described above. Thus, such alternative primer pairs should also be considered as an alternative obvious embodiment of the present invention.

[0042] Преимущество представленного в данном документе способа заключается в том, что он полностью поддается автоматизации и адаптации к любому стандартному термоциклеру для количественной ПЦР, что позволяет выполнять его обычным лабораторным персоналом без необходимости специального обучения. В дополнение к вышесказанному способ является высокочувствительным, подходящим для мультиплексирования, может обеспечивать оценку относительных количеств выявляемых последовательностей гомополимерных нуклеотидных повторов и их вариантов. Следовательно, в возможном варианте осуществления ПЦР может быть количественной или полуколичественной ПЦР[0042] The method presented here has the advantage of being fully automated and adaptable to any standard quantitative PCR thermal cycler, allowing it to be performed by normal laboratory personnel without the need for special training. In addition to the above, the method is highly sensitive, suitable for multiplexing, can provide an estimate of the relative amounts of detected sequences of homopolymeric nucleotide repeats and their variants. Therefore, in a possible embodiment, the PCR may be quantitative or semi-quantitative PCR

[0043] Поскольку способы по настоящему изобретению касаются выявления изменений в количестве гомонуклеотидов в нити очень коротких (т. е. < 12 нт.) последовательностей гомонуклеотидных повторов, предпочтительно, чтобы они были высокоспецифичными. Например, в ходе амплификации участков гомополимерных повторов, происходит проскальзывание полимеразы. Это приводит к ошибкам в копировании исходного количества повторяющихся нуклеотидов, что обуславливает накопление искусственных делеций или вставок в амплифицированном ПЦР-продукте. Следовательно, в предпочтительном варианте осуществления стадию амплифицирования проводят с применением корректирующей полимеразы, т. е. полимеразы, обладающей 3'-5'-экзонуклеазной активностью. Многие такие полимеразы, предназначенные для ПЦР, известны и доступны для коммерческой реализации. Примеры включают без ограничения такие полимеразы, как Q5, Pfx, Pfu, Ex Taq и т. д.[0043] Because the methods of the present invention are concerned with detecting changes in the number of homonucleotides in a strand of very short (ie < 12 nt) homonucleotide repeat sequences, it is preferred that they be highly specific. For example, during amplification of homopolymer repeat regions, polymerase slippage occurs. This leads to errors in copying the initial number of repeated nucleotides, which causes the accumulation of artificial deletions or insertions in the amplified PCR product. Therefore, in a preferred embodiment, the amplification step is carried out using a corrective polymerase, ie a polymerase having 3'-5' exonuclease activity. Many such PCR polymerases are known and commercially available. Examples include, without limitation, polymerases such as Q5, Pfx, Pfu, Ex Taq, etc.

[0044] В более предпочтительных вариантах осуществления анализ кривой плавления продуктов амплификации нуклеиновой кислоты используют на стадии определения количества нуклеотидов. Следовательно, в особенно преимущественном варианте осуществления способов по настоящему изобретению стадия амплифицирования обеспечивает данные кривой плавления. [0044] In more preferred embodiments, analysis of the melting curve of nucleic acid amplification products is used in the step of determining the number of nucleotides. Therefore, in a particularly advantageous embodiment of the methods of the present invention, the amplification step provides melt curve data.

[0045] Плавление или анализ кривой плавления представляет собой оценку характеристик диссоциации или ассоциации молекулы двухнитевой нуклеиновой кислоты в ходе изменений температуры. Следовательно, данные кривой плавления необходимо понимать как любые данные, представляющие собой либо характеристики диссоциации, либо характеристики ассоциации молекулы нуклеиновой кислоты, полученные в ходе исследования, например, целевого продукта амплификации нуклеиновой кислоты. Данные кривой плавления можно получить посредством встраивания подходящих флюоресцентных фрагментов в исследуемые образцы, которые обрабатывают с помощью любого прибора или способа проведения амплификации, например посредством термоциклирования, ПЦР, количественной ПЦР и т. д. Эти данные можно получить с помощью любого аппарата, который оснащен средствами доведения температуры образца до температуры, превышающей температуру плавления образца ДНК, и который оснащен известными флюорометрическими или спектрофотометрическими средствами. Примеры таких приборов включают без ограничения стандартные оптические термоциклеры, обычно используемые для qPCR, или флуорометры с контролем температуры и т. д.[0045] Melting or melting curve analysis is an evaluation of the dissociation or association characteristics of a double-stranded nucleic acid molecule during temperature changes. Therefore, melt curve data is to be understood as any data representing either the dissociation characteristics or the association characteristics of a nucleic acid molecule obtained by assaying, for example, a target nucleic acid amplification product. Melting curve data can be obtained by incorporating suitable fluorescent fragments into test samples that are processed with any amplification instrument or method such as thermal cycling, PCR, quantitative PCR, etc. These data can be obtained using any apparatus that is equipped with the means bringing the temperature of the sample to a temperature above the melting point of the DNA sample, and which is equipped with known fluorometric or spectrophotometric means. Examples of such instruments include, without limitation, standard optical thermal cyclers commonly used for qPCR or temperature controlled fluorometers, etc.

[0046] Анализ кривой плавления и анализ плавления высокого разрешения (HRM) представляют собой способы, обычно используемые для выявления и анализа присутствия последовательностей нуклеиновой кислоты в образце. Один способ контроля характеристик диссоциации и ассоциации нуклеиновой кислоты проводят с помощью красителей. Химические реакции для выявления, используемые для qPCR и анализа кривой плавления, основаны на (a) химических реакциях, которые обычно выявляют флуоресценцию красителя, связывающегося с мишенью, например, флуорофора, связывающего ДНК, такого как LC Green, LC Green+, Eva Green, SYTO9 CYBR Green, или на (b) целевых химических реакциях, в которые обычно используются ДНК-зонды, меченные флуорофором, как, например, зонды типа «маяк», и/или праймеры, как, например, праймеры типа «скорпион». В данной области техники хорошо известно, что другие химические реакции для выявления можно использовать в анализе кривой плавления.[0046] Melt curve analysis and high resolution melt analysis (HRM) are methods commonly used to detect and analyze the presence of nucleic acid sequences in a sample. One way to control the dissociation and association characteristics of a nucleic acid is with dyes. The detection chemistries used for qPCR and melt curve analysis are based on (a) chemistries that typically detect the fluorescence of a target-binding dye, e.g., a DNA-binding fluorophore such as LC Green, LC Green+, Eva Green, SYTO9 CYBR Green, or (b) targeted chemistry reactions that typically use fluorophore labeled DNA probes such as beacon probes and/or primers such as scorpion primers. It is well known in the art that other detection chemistries can be used in melt curve analysis.

[0047] В одном варианте осуществления по настоящему изобретению продукты амплификации нагревают в присутствии одного или более интеркалирующих красителей в ходе процедуры исследования кривой плавления. Диссоциация ДНК в ходе нагревания может быть измерена посредством значительного снижения получаемой в результате флуоресценции. В другом конкретном варианте осуществления продукты амплификации нагревают в присутствии одной или более нуклеиновых кислот, меченых красителем, например одного или более зондов, в ходе процедуры исследования кривой плавления. В случае флуоресцентного анализа кривой плавления, основанного на использовании зонда, вариабельность выявления нуклеиновых кислот основана на температуре плавления, полученной в результате термической денатурации гибрида зонд-мишень. По мере продолжения нагревания образовавшихся ампликонов изменения в силе сигнала выявляют в зависимости от температуры, как правило, в пределах температурного интервала с получением исходных данных кривой плавления.[0047] In one embodiment of the present invention, the amplification products are heated in the presence of one or more intercalating dyes during a melt curve test procedure. DNA dissociation during heating can be measured by a significant reduction in the resulting fluorescence. In another specific embodiment, the amplification products are heated in the presence of one or more dye-labeled nucleic acids, such as one or more probes, during a melt curve procedure. In the case of probe-based fluorescent melt curve analysis, the variability in nucleic acid detection is based on the melt temperature obtained from thermal denaturation of the probe-target hybrid. As heating of the resulting amplicons continues, changes in signal strength are detected as a function of temperature, typically within a temperature range, to provide baseline melt curve data.

[0048] В предпочтительных вариантах осуществления способов по настоящему изобретению амплифицирование предусматривает использование зонда. В принципе, в возможных вариантах осуществления можно использовать любой мишень-специфический олигонуклеотидный зонд, подходящий для проведения анализа кривой плавления. Предпочтительные известные зонды могут включать пару, состоящую из флуорофора и гасителя, а также могут преимущественно образовывать вторичные структуры, такие как петли или шпильки. [0048] In preferred embodiments of the methods of the present invention, amplification involves the use of a probe. In principle, any target-specific oligonucleotide probe suitable for performing melt curve analysis can be used in possible embodiments. Preferred known probes may include a pair of fluorophore and quencher, and may also preferentially form secondary structures such as loops or hairpins.

[0049] В частности, предпочтительными являются зонды типа «молекулярный маяк» или «молекулярные маяки», которые представляют собой молекулы в форме шпильки с внутренне гашенным флуорофором, флуоресценция которых восстанавливается, когда они связываются с целевой последовательностью нуклеиновой кислоты. В связи с этим «молекулярные маяки» не разрушаются под действием полимеразы и могут использоваться в исследовании кинетики гибридизации с их мишенью посредством определения кривой плавления. Длина типичного зонда типа «молекулярный маяк» составляет приблизительно 20, предпочтительно 25 нуклеотидов или больше. Как правило, длина участка, который является комплементарным целевой последовательности и связывается с ней, составляет 18-30 пар оснований. Структура и механизм действия «молекулярных маяков» широко известны в данной области техники. [0049] In particular, "molecular beacon" or "molecular beacon" probes are preferred, which are hairpin-shaped molecules with an internally quenched fluorophore that regain fluorescence when they bind to a target nucleic acid sequence. In this regard, "molecular beacons" are not destroyed by the action of polymerase and can be used in the study of the kinetics of hybridization with their target by determining the melting curve. The length of a typical molecular beacon probe is about 20, preferably 25 nucleotides or more. Typically, the length of the region that is complementary to and binds to the target sequence is 18-30 base pairs. The structure and mechanism of action of "molecular beacons" are widely known in the art.

[0050] Следовательно, в особенно предпочтительном варианте осуществления представлен способ, где стадия амплифицирования предусматривает применение по меньшей мере одного зонда типа «молекулярный маяк».[0050] Therefore, in a particularly preferred embodiment, a method is provided wherein the amplification step involves the use of at least one molecular beacon probe.

[0051] В предпочтительном варианте осуществления из вышеуказанных вариантов осуществления зонд типа «молекулярный маяк» содержит последовательность, идентичную или комплементарную мутантной последовательности гомополимерных нуклеотидных повторов, характеризующуюся делецией по меньшей мере одного гомонуклеотида в целевой последовательности гомополимерных повторов. Такая структура «молекулярного маяка» обеспечивает высокочувствительное и специфическое выявление выбранного мутантного маркера MSI, оставаясь при этом достаточно чувствительным к маркеру дикого типа (т. е. предполагаемому). Следует отметить, что под термином «целевая последовательность гомополимерных нуклеотидных повторов» понимают последовательность гомополимерных повторов дикого типа или референтную последовательность гомополимерных повторов, ожидаемую в условиях отсутствия MSI. И, наоборот, под «мутантной последовательностью гомополимерных нуклеотидных повторов» понимают последовательность гомополимерных нуклеотидных повторов, характеризующуюся вставкой или делецией по меньшей мере одного гомонуклеотида в последовательности гомополимерных повторов. Затем будет измеряться разница между исходными данными плавления для дикого типа и для мутантной формы, что будет представлять собой характеристику исходных данных кривой плавления.[0051] In a preferred embodiment of the above embodiments, the molecular beacon probe contains a sequence identical or complementary to a mutant homopolymer nucleotide repeat sequence characterized by a deletion of at least one homonucleotide in the target homopolymer repeat sequence. This "molecular beacon" structure provides highly sensitive and specific detection of the selected MSI mutant marker while remaining sufficiently sensitive to the wild-type (i.e. putative) marker. It should be noted that the term "target sequence of homopolymeric nucleotide repeats" means the sequence of homopolymeric repeats of the wild type or the reference sequence of homopolymeric repeats expected in the absence of MSI. Conversely, by "mutant homopolymeric nucleotide repeat sequence" is meant a homopolymeric nucleotide repeat sequence characterized by the insertion or deletion of at least one homonucleotide in the homopolymeric repeat sequence. The difference between the original melting data for the wild type and for the mutant form will then be measured, which will be a characterization of the original melting curve data.

[0052] В конкретном варианте осуществления представлен способ, где по меньшей мере один зонд типа «молекулярный маяк» имеет последовательность, идентифицированную в любом из следующих SEQ ID NO:[0052] In a specific embodiment, a method is provided wherein at least one molecular beacon probe has a sequence identified in any of the following SEQ ID NOs:

Figure 00000001
Figure 00000001

[0053] В возможном варианте осуществления представлен по меньшей мере один зонд типа «молекулярный маяк», характеризующийся определенной степенью вариабельности последовательности по отношению к указанным выше последовательностям под SEQ ID NO. 15-21. Причиной такой вариабельности может быть применение другой последовательности типа «стебель» «молекулярного маяка» (выделена подчеркиванием и курсивом выше) или удаление или добавление нуклеотидов к гибридизирующей части «маяка», которая является специфичной в отношении подлежащей выявлению последовательности (указана жирным выше). Последнее может включать добавление или удаление 1 или 2 нуклеотидов в последовательностях гомополимерных повторов или включать большее или меньшее количество нуклеотидов в указанной фланкирующей последовательности повтора.[0053] In an exemplary embodiment, at least one molecular beacon probe is provided that has a certain degree of sequence variability relative to the above sequences under SEQ ID NO. 15-21. The reason for this variability may be the use of a different stem type sequence of the molecular beacon (highlighted in italics above) or deletion or addition of nucleotides to the beacon hybridizing portion that is specific for the sequence to be detected (indicated in bold above). The latter may include the addition or deletion of 1 or 2 nucleotides in homopolymer repeat sequences, or include more or less nucleotides in said flanking repeat sequence.

[0054] Вследствие таким образом приданной специфичности указанному зонду типа «молекулярный маяк» к одному маркеру гомополимерных повторов и его нестабильным (мутантным) вариантам, также обеспечивается возможность разработки мультиплексного анализа, при котором по меньшей мере два зонда, а предположительно и больше, типа «молекулярный маяк» используют в одной реакционной пробирке или в одном отсеке.[0054] Due to the specificity thus imparted to said probe of the "molecular beacon" type for one marker of homopolymer repeats and its unstable (mutant) variants, it is also possible to develop a multiplex analysis in which at least two probes, and presumably more, of the type " molecular beacon" is used in one reaction tube or in one compartment.

[0055] Таким образом, в другом предпочтительном варианте осуществления представлен способ, где стадия амплифицирования предусматривает по меньшей мере одну дуплексную амплификацию пары гомополимерных повторов, при этом указанная пара выбрана из следующих комбинаций:[0055] Thus, in another preferred embodiment, a method is provided wherein the amplification step comprises at least one duplex amplification of a pair of homopolymer repeats, said pair being selected from the following combinations:

- дуплексной амплификации гомополимерного повтора, содержащего 11 последовательных аденинов, локализованного в гене DIDO1 человека и начинающегося с положения chr20:62905340, вместе с гомополимерным повтором, содержащим 11 последовательных аденинов, локализованным в гене MRE11 человека и начинающимся с положения chr11:94479765;- duplex amplification of a homopolymer repeat containing 11 consecutive adenines located in the human DIDO1 gene and starting at position chr20:62905340, together with a homopolymer repeat containing 11 consecutive adenines located in the human MRE11 gene and starting at position chr11:94479765;

- дуплексной амплификации гомополимерного повтора, содержащего 8 последовательных аденинов, локализованного в гене ACVR2A человека и начинающегося с положения chr2:147926117, вместе с гомополимерным повтором, содержащим 9 последовательных тиминов, локализованным в гене SEC31A человека и начинающимся с положения chr4:82864412; и- duplex amplification of a homopolymeric repeat containing 8 consecutive adenines located in the human ACVR2A gene and starting at position chr2:147926117, together with a homopolymeric repeat containing 9 consecutive thymines located in the human SEC31A gene and starting at position chr4:82864412; And

- дуплексной амплификации гомополимерного повтора, содержащего 10 последовательных аденинов, локализованного в гене BTBD7 человека и начинающегося с положения chr14:93241685, вместе с гомополимерным повтором, содержащим 10 последовательных аденинов, локализованным в гене SULF2 человека и начинающимся с положения chr20:47657577.- duplex amplification of a homopolymer repeat containing 10 consecutive adenines located in the human BTBD7 gene and starting at position chr14:93241685, together with a homopolymer repeat containing 10 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577.

[0056] В особенно преимущественном варианте осуществления, который значительно улучшает надежность способов по настоящему изобретению, в частности при использовании мультиплексирования, применяют новый подход, при котором используется функция вейвлет-преобразования в отношении исходных данных кривой плавления. [0056] In a particularly advantageous embodiment, which greatly improves the robustness of the methods of the present invention, in particular when using multiplexing, a novel approach is adopted that uses a wavelet transform function on the original melt curve data.

[0057] Вейвлеты представляют собой математические функции, которые разделяют данные на разные частотные составляющие, а затем каждый компонент анализируют с разрешением, сопоставимым с его масштабом. Такие базисные функции представляют собой короткие волны с ограниченной продолжительностью. Базисные функции вейвлет-преобразования приводят к частоте. Существует множество различных вейвлетов, которые могут использоваться в качестве базисных функций. Базисная функция ~(t), которую также называют материнский вейвлет, представляет собой функцию преобразования. Термин «материнский» подразумевает, что функции с другим участком носителя функции, который используют в способе преобразования, получают из одной главной функции или материнского вейвлета. Иными словами, материнский вейвлет представляет собой прототип для создания других функций-окон. В целом вейвлет ψ(t) представляет собой комплекснозначную функцию. Общую вейвлет-функцию определяют как:[0057] Wavelets are mathematical functions that separate data into different frequency components, and then each component is analyzed with a resolution comparable to its scale. Such basis functions are short waves with limited duration. The basis functions of the wavelet transform lead to the frequency. There are many different wavelets that can be used as basis functions. The basis function ~(t), also called the mother wavelet, is the transformation function. The term "mother" implies that the features with a different feature carrier portion that is used in the transform method are derived from one main feature or mother wavelet. In other words, the mother wavelet is a prototype for creating other window functions. In general, the wavelet ψ(t) is a complex-valued function. The general wavelet function is defined as:

Figure 00000002
Figure 00000002

Данный параметр сдвига 'τ' определяет положение окна во времени, и, таким образом, он определяет, какая часть сигнала x(t) анализируется. В анализе вейвлет-преобразования переменную частоты 'ω' заменяют переменной масштаба 's', а переменную сдвига во времени представляют с помощью 'τ'.This shift parameter 'τ' determines the position of the window in time, and thus it determines which part of the signal x(t) is analyzed. In the wavelet transform analysis, the frequency variable 'ω' is replaced by the scale variable 's', and the time shift variable is represented by 'τ'.

[0058] Вейвлет-преобразование использует эти функции материнского вейвлета и производит разложение сигнала x(t) на взвешенный набор масштабированных вейвлет-функций ψ(t). Основное преимущество использования вейвлетов заключается в том, что они позволяют регистрировать характеристику и уникальную сигнатуру данного более крупного и более сложного набора данных без потери в результате данных. [0058] The wavelet transform uses these mother wavelet functions and decomposes the signal x(t) into a weighted set of scaled wavelet functions ψ(t). The main advantage of using wavelets is that they allow the characteristic and unique signature of a given larger and more complex data set to be captured without resulting data loss.

[0059] Например, два больших исходных набора данных кривой плавления, полученные для двух продуктов амплификации, отличающихся по длине только одним нуклеотидом, являются в высокой степени подобными, но после использования вейвлет-преобразования будут получены две разные сигнатуры. Такие сигнатуры затем будет легче сравнить друг с другом с целью логического заключения, что в одном из продуктов амплификации присутствовала вставка или делеция. И в заключение, использование вейвлет-функции приводит к уменьшению шумов и увеличению вычислительной эффективности и скорости при работе с большими и аналогичными наборами данных. Следовательно, обработанные с помощью вейвлет данные являются особенно подходящими для классификации образцов с использованием составного анализа нескольких мультиплексных мишеней в пределах одного эксперимента, особенно когда имеются полученные большие исходные наборы данных, которые требуют выделения незначительного разброса данных. [0059] For example, two large initial melt curve datasets obtained for two amplification products differing in length by only one nucleotide are highly similar, but after using the wavelet transform, two different signatures will be obtained. Such signatures will then be easier to compare with each other in order to logically conclude that an insertion or deletion was present in one of the amplification products. Finally, the use of the wavelet function results in noise reduction and increased computational efficiency and speed when working with large and similar datasets. Therefore, wavelet-processed data is particularly suitable for classifying samples using composite analysis of multiple multiplex targets within a single experiment, especially when there are large initial datasets obtained that require little data scatter to be extracted.

[0060] Существующие в настоящее время способы выявления MSI характеризуются следующими недостатками: [0060] Currently existing methods for detecting MSI are characterized by the following disadvantages:

(a) для определения длины повторов требуется дополнительное специализированное оборудование для выполнения анализа после ПЦР, и/или этот анализ обычно требует интерпретации высококвалифицированным специалистом; или (b) в случае анализа кривой плавления высокого разрешения с использованием dsDNA-интеркалирующих красителей недостаток заключается в очень ограниченной возможности мультиплексирования, чтобы избежать перекрывания сигналов плавления от разных ампликонов, и кроме того, он не обеспечивает возможность количественной оценки нестабильных (мутантных) последовательностей по сравнению со стабильными (дикого типа) последовательностями. Авторы настоящего изобретения выявили, что использование дискретного вейвлет-преобразования в отношении данных кривой плавления приводит к надежной и корректной интерпретации результатов в полностью автоматизированном режиме, за счет чего преодолеваются эти недостатки.(a) repeat length determination requires additional specialized post-PCR assay equipment and/or the assay usually requires interpretation by a highly skilled person; or (b) in the case of high resolution melt curve analysis using dsDNA intercalating dyes, the disadvantage is very limited multiplexing capability to avoid overlap of melt signals from different amplicons, and furthermore, it does not provide the ability to quantify unstable (mutant) sequences by compared to stable (wild-type) sequences. The present inventors have found that the use of a discrete wavelet transform on melt curve data leads to a reliable and correct interpretation of the results in a fully automated manner, thereby overcoming these shortcomings.

[0061] Таким образом, в предпочтительном варианте осуществления способ по настоящему изобретению дополнительно предусматривает стадии:[0061] Thus, in a preferred embodiment, the method of the present invention further comprises the steps of:

(a) применения вейвлет-преобразования в отношении данных кривой плавления и (a) applying a wavelet transform to the melt curve data, and

(b) применение результатов, полученных на (a), в определении количества нуклеотидов в любом из гомополимерных повторов, перечисленных выше. Другими словами, в одном варианте осуществления представлены способы, в которых применяют функцию вейвлет-преобразований для анализа данных кривой плавления нуклеиновых кислот из тестируемого образца для определения присутствия или отсутствия вставки/делеции в каждом из гомополимерных повторов из выбранной панели биомаркеров, затем эту информацию можно использовать для определения указанного тестируемого образца, как характеризующегося или не характеризующегося MSI.(b) applying the results obtained in (a) in determining the number of nucleotides in any of the homopolymer repeats listed above. In other words, in one embodiment, methods are provided that use a wavelet transform function to analyze nucleic acid melt curve data from a test sample to determine the presence or absence of an insertion/deletion in each of the homopolymer repeats from a selected panel of biomarkers, then this information can be used to determine said test sample as characterized or not characterized by MSI.

[0062] В предпочтительном варианте осуществления данные кривой плавления являются исходными данными кривой плавления, т. е. данными, представляющими собой исходные параметры сигнала, полученного в исследовании диссоциации или ассоциации нуклеиновой кислоты. Иными словами, такие исходные параметры не подвергают математической обработке путем, например, использования первой или второй производной анализа кривой плавления, как это часто осуществляют в данной области техники, но после получения с помощью детектора их передают в компьютер, где в отношении них используют функцию вейвлет-преобразования.[0062] In a preferred embodiment, the melt curve data is the raw melt curve data, i.e., data representing the raw signal parameters obtained in a nucleic acid dissociation or association assay. In other words, such initial parameters are not subjected to mathematical processing by, for example, using the first or second derivative of the analysis of the melting curve, as is often done in the art, but after being obtained using a detector, they are transferred to a computer, where a wavelet function is applied to them. -conversions.

[0063] В наиболее предпочтительном варианте осуществления вейвлет-преобразование представляет собой дискретное вейвлет-преобразование или «DWT». DWT представляет собой любое вейвлет-преобразование, для которого вейвлеты отбирают дискретно. Как и в случае других вейвлет-преобразований, ключевым преимуществом, которым оно обладает перед преобразованиями Фурье, является разрешающая способность во времени: оно охватывает частоту и положение информации (положение во времени). Использование дискретного вейвлет-преобразования в отношении исходных параметров дает набор преобразованных выходных вейвлет-коэффициентов в разных масштабах: (a) один является результатом аппроксимирования выходящего сигнала, который представляет собой низкочастотный состав компонента входящего сигнала и (b) другой является комплексным результатом, который дает высокочастотные компоненты, являющиеся элементами входного сигнала на разных уровнях. Данные коэффициенты далее упоминаются как дискретные коэффициенты вейвлет-преобразования или коэффициенты dwt. Разделение характеристик на различные масштабы (или частоты) позволяет оператору или компьютерному алгоритму выбирать наиболее подходящие коэффициенты dwt для некоторых решений или анализа, то есть осуществлять процесс, который часто называется вейвлет-фильтрованием. Данный процесс может быть использован повторно, разделяя сигнал на множество диапазонов частот. При использовании в отношении данных кривой плавления наивысшая частота вейвлет-коэффициентов преимущественно является шумом, при этом наиболее низкие коэффициенты разрешения охватывают информацию, связанную с усилением прибором или эффективностью амплификации в предыдущей реакции амплификации. Оба характеризуются отсутствием или низкой применимостью для идентификации специфического олигонуклеотида в образце, который подвергнут анализу кривой плавления, но обладают потенциальной применимостью с учетом надежности такой идентификации. Пакеты, содержащие все функции, необходимые для обработки данных и нанесения на график DWT, уже описаны (Aldrich, 2015) и известны опытным программистам и математикам. [0063] In the most preferred embodiment, the wavelet transform is a discrete wavelet transform or "DWT". A DWT is any wavelet transform for which wavelets are sampled discretely. As with other wavelet transforms, the key advantage it has over Fourier transforms is time resolution: it captures the frequency and position of the information (position in time). Using the discrete wavelet transform on the original parameters yields a set of transformed output wavelet coefficients on different scales: (a) one is the result of an approximation of the output signal, which is the low-frequency content of the input signal component, and (b) the other is the complex result, which gives the high-frequency components that are elements of the input signal at different levels. These coefficients are hereinafter referred to as discrete wavelet transform coefficients or dwt coefficients. Separating the features into different scales (or frequencies) allows the operator or computer algorithm to choose the most appropriate dwt coefficients for some decision or analysis, a process often referred to as wavelet filtering. This process can be reused by dividing the signal into multiple frequency bands. When used on melt curve data, the highest frequency wavelet coefficients are predominantly noise, with the lowest resolution factors capturing information related to instrument gain or amplification efficiency in a previous amplification reaction. Both have no or low utility for identifying a specific oligonucleotide in a sample subjected to melt curve analysis, but have potential utility given the reliability of such identification. Packages containing all the functions required for data processing and plotting DWT have already been described (Aldrich, 2015) and known to experienced programmers and mathematicians.

[0064] В предпочтительном варианте осуществления способа на стадии проведения дискретного вейвлет-преобразования в отношении данных кривой плавления для получения коэффициентов dwt при конкретных настройках будет рассчитано одномерное (1D) вейвлет-преобразование по исходным данным или обработанным данным с применением материнского вейвлета из семейства Добеши. Материнский вейвлет представляет собой немодифицированный вейвлет, выбранный в качестве основы для дискретного вейвлет-преобразования (Daubechies, 1992). Хорошие результаты получали при использовании материнского вейвлета DB8. Дополнительные тесты с материнскими вейвлетами DB4 и Хаара также обеспечивали весьма хорошую эффективность, результаты которой могут быть предоставлены по запросу. Исходя из последнего, авторы настоящего изобретения считают, что другие существующие материнские вейвлеты также могут являться подходящими. Материнский вейвлет может быть и предпочтительно является последовательно увеличенным, сдвинутым и масштабированным, используя алгоритм пирамиды dwt, для создания набора дочерних вейвлетов, которые наилучшим образом представляют собой анализируемый сигнал флуоресценции кривой плавления; при этом набор вейвлетов и коэффициенты масштаба, полученные из алгоритма, представляют собой результат дискретного вейвлет-преобразования. В указанном примере граничные условия для DWT являются периодическими. Ввод исходных данных для преобразования может быть для всех измеренных данных или их подгруппы, которая покрывает все значимые события указанного эксперимент. [0064] In a preferred embodiment of the method, at the stage of performing a discrete wavelet transform on the melt curve data to obtain dwt coefficients at specific settings, a one-dimensional (1D) wavelet transform will be calculated from the original data or processed data using the mother wavelet from the Daubechies family. The mother wavelet is an unmodified wavelet chosen as the basis for the discrete wavelet transform (Daubechies, 1992). Good results were obtained using the mother wavelet DB8. Additional tests with DB4 and Haar mother wavelets also provided very good performance, the results of which are available upon request. Based on the latter, the authors of the present invention believe that other existing mother wavelets may also be suitable. The mother wavelet can be, and preferably is, successively enlarged, shifted and scaled using the dwt pyramid algorithm to create a set of child wavelets that best represent the analyzed melt curve fluorescence signal; in this case, the set of wavelets and the scale factors obtained from the algorithm are the result of a discrete wavelet transform. In this example, the boundary conditions for DWT are periodic. Input of initial data for transformation can be for all measured data or their subgroup, which covers all significant events of the specified experiment.

[0065] В соответствии с вышесказанным с целью получения коэффициентов dwt в способах по настоящему изобретению может использоваться дискретное вейвлет-преобразование исходных данных кривых плавления или математически трансформированных или обработанных данных кривых плавления, т. е. только на выбранных исходных данных. [0065] In accordance with the above, in order to obtain dwt coefficients, the methods of the present invention can use a discrete wavelet transform of the original melt curve data or mathematically transformed or processed melt curve data, i.e., only on selected source data.

[0066] Кроме того, не всегда требуется использовать все коэффициенты dwt для конечного определения количества нуклеотидов. Для увеличения скорости вычисления вполне достаточно лишь отбора коэффициентов dwt. Предпочтительно дискретное вейвлет-преобразование проводят c исходными данными кривой плавления. Однако необязательно проводить обработку исходных данных в соответствии с любым математическим способом, известным в данной области техники, для получения выборки исходных данных. В последнем случае дискретное вейвлет-преобразование будет использоваться в отношении указанной выборки исходных данных также для получения коэффициентов dwt. Таким образом, в конкретном варианте осуществления результаты, полученные на (a), могут представлять собой коэффициенты dwt, полученные из исходных данных кривой плавления. В альтернативном варианте осуществления результаты, полученные на (a), могут представлять собой коэффициенты dwt, полученные из выборки исходных данных кривой плавления. В еще одном конкретном варианте осуществления результаты, полученные на (a), могут представлять собой выборку коэффициента dwt, полученного из вышеуказанных альтернативных вариантов осуществления.[0066] In addition, it is not always necessary to use all the dwt coefficients for the final determination of the number of nucleotides. To increase the calculation speed, it is quite sufficient to select only the coefficients dwt. Preferably, the discrete wavelet transform is performed on the original melt curve data. However, it is not necessary to process the raw data in accordance with any mathematical method known in the art to obtain a sample of the raw data. In the latter case, the discrete wavelet transform will be used on the specified source data sample also to obtain the dwt coefficients. Thus, in a particular embodiment, the results obtained in (a) may be the dwt coefficients obtained from the raw melt curve data. In an alternative embodiment, the results obtained in (a) may be dwt coefficients obtained from a sample of raw melt curve data. In yet another specific embodiment, the results obtained in (a) may be a sample of the dwt coefficient obtained from the above alternative embodiments.

[0067] В одном конкретном варианте осуществления дискретное вейвлет-преобразование представляет собой 1D дискретное вейвлет-преобразование. В еще более конкретном варианте осуществления 1D дискретное вейвлет-преобразование представляет собой 1D вейвлет-преобразование Добеши. [0067] In one particular embodiment, the discrete wavelet transform is a 1D discrete wavelet transform. In an even more specific embodiment, the 1D discrete wavelet transform is a 1D Daubechies wavelet transform.

[0068] Для использования дискретного вейвлет-преобразования должен быть выбран материнский вейвлет. В дополнительном предпочтительном варианте осуществления используют дискретное вейвлет-преобразование Добеши, в котором используется материнский вейвлет из семейства Добеши, наиболее предпочтительно, представляющий собой материнский вейвлет DB8 или материнский вейвлет DB4 или Хаара.[0068] To use the discrete wavelet transform, the mother wavelet must be selected. In a further preferred embodiment, a discrete Daubechies wavelet transform is used that uses a Daubechies family of mother wavelets, most preferably a DB8 mother wavelet or a DB4 or Haar mother wavelet.

[0069] В принципе, в альтернативном возможном варианте осуществления в способе по настоящему изобретению может использоваться любая функция вейвлет-преобразования, подходящая для генерирования значимых коэффициентов, которые охватывают информацию, позволяющую определить отличия на уровне одного нуклеотида. Примеры могут включать вейвлет Хаара (который также может считаться частью семейства Добеши), наименее асимметричный, вейвлет Койфлет или наилучшим образом локализованный. В альтернативных вариантах осуществления могут использоваться альтернативные алгоритмы для вычисления dwt, в том числе алгоритм лифтинга или дуальное разложение с применением комплексного вейвлет-преобразования. Другие формы дискретного вейвлет-преобразования включают вейвлет-преобразование без децимирования или недецимированное вейвлет-преобразование, где исключено понижение выборки, или преобразование Ньюленда, где ортонормированный базис вейвлетов формируется из соответствующим образом сконструированных фильтров «верх шляпы» в диапазоне частот. Возможно, существуют другие примеры, и они будут легко применимы к раскрытым в данном документе способам соответствующим специалистом. [0069] In principle, in an alternative possible embodiment, the method of the present invention may use any wavelet transform function suitable to generate meaningful coefficients that capture information allowing differences to be determined at the single nucleotide level. Examples may include the Haar wavelet (which can also be considered part of the Daubechies family), the least asymmetric, the Coiflet wavelet, or the best localized. In alternative embodiments, alternative algorithms may be used to calculate dwt, including a lifting algorithm or a dual decomposition using a complex wavelet transform. Other forms of discrete wavelet transform include undecimated wavelet transform or non-decimated wavelet transform where downsampling is eliminated, or Newland transform where an orthonormal wavelet basis is formed from appropriately designed "top of the hat" filters in the frequency range. Possibly other examples exist and will be readily applicable to the methods disclosed herein by the person skilled in the art.

[0070] Одним из основных преимуществ способов по настоящему изобретению является их непосредственная автоматизация и адаптация, в частности, к известным стандартным системам для qPCR. Следовательно, в конкретном варианте осуществления представлен способ, где определение количества нуклеотидов в вышеперечисленных гомополимерных повторах проводят в автоматизированном режиме, например, с помощью программного обеспечения. Это может быть проведено в автоматизированной системе, например, оснащенной подходящим оборудованием и программными средствами, которая может считывать сигналы, полученные с помощью способов по настоящему изобретению, анализировать их и представить вывод, исходя из присутствия или отсутствия вставок/делеций в выбранном маркере из указанного образца. Особенно подходящей системой для такой автоматизации является платформа Biocartis Idylla™, которая помимо выполнения ПЦР и обеспечения интерпретации ее результатов, также полностью автоматизирует всю последовательность технологических операций обработки образца и выделения нуклеиновой кислоты. Следовательно, в возможном варианте осуществления по настоящему изобретению представлен полностью автоматизированный, начиная от образца и заканчивая результатом, способ анализа локусов MSI. [0070] One of the main advantages of the methods of the present invention is their direct automation and adaptation, in particular, to known standard systems for qPCR. Therefore, in a specific embodiment, a method is provided wherein the determination of the number of nucleotides in the above homopolymer repeats is carried out in an automated manner, for example, using software. This can be carried out in an automated system, for example, equipped with suitable hardware and software, which can read the signals obtained using the methods of the present invention, analyze them and provide a conclusion based on the presence or absence of insertions / deletions in a selected marker from a specified sample. . A particularly suitable system for such automation is the Biocartis Idylla™ platform, which, in addition to performing PCR and providing interpretation of its results, also fully automates the entire workflow of sample processing and nucleic acid extraction. Therefore, in an exemplary embodiment, the present invention provides a fully automated, from sample to result, method for analyzing MSI loci.

[0071] В еще одном перспективном варианте осуществления по настоящему изобретению выполняют способ, где определение количества нуклеотидов в любом из вышеперечисленных гомополимерных повторов также дополнительно осуществляют в контрольном биологическом образце. Данный контрольный или референтный образец может быть, например, материалом, полученным из опухоли с MSI-H с подтвержденным присутствием вставки/делеции в любом из вышеперечисленных выбранных гомополимерных повторах, или конструкцией на основе синтетической или выделенной нуклеиновой кислоты, например плазмидой. Особенно предпочтительный референтный образец может быть, например, одним из стандартов Acrometrix, который содержит смесь как синтетической, так и геномной ДНК. В технологии используется подробно охарактеризованная и секвенированная клеточная линия GM2438 в качестве геномного фона ДНК, в которую введены секвенированные синтетические мишени. В подходе Acrometrix такие мишени представляют собой линейные синтетические молекулы ДНК, содержащие последовательность, имитирующую изменение, ассоциированное, например, с выбранным биомаркером, который в контексте настоящего изобретения может быть последовательностью из любых из описанных выше гомополимерных повторов, содержащих вставку/делецию, предпочтительно для целей ПЦР вместе с их фланкирующими последовательностями. Мишени дополнительно содержат «хвостовую» последовательность, связанную с описанной выше последовательностью, имитирующей изменение, которая дополнительно служит для идентификации и количественного определения мишеней. Полученная в результате последовательность считается гибридной последовательностью, содержащей последовательность, имитирующую изменение, и хвостовую последовательность. Например, хвост может имитировать такое известное изменение в гене, как SNP, для которого доступны анализы для выявления, и, следовательно, может обеспечить дополнительные средства для непрямого абсолютного количественного определения последовательности, имитирующей изменение, как в данном случае вставку/делецию в выбранных маркере или маркерах. Такой стандарт, например, может быть применим для целей верификации и валидации, например, он может быть предусмотрен в случае дополнительного исследования посредством NGS, в частности, из-за того, что существующие подходы на основе NGS по-прежнему склонны к потере информации о вставках/делециях в последовательностях гомополимерных повторов.[0071] In another promising embodiment, the present invention performs a method, where the determination of the number of nucleotides in any of the above homopolymer repeats is also additionally carried out in a control biological sample. This control or reference sample can be, for example, an MSI-H tumor-derived material with confirmed insertion/deletion in any of the above selected homopolymer repeats, or a synthetic or isolated nucleic acid construct, such as a plasmid. A particularly preferred reference sample may be, for example, one of the Acrometrix standards, which contains a mixture of both synthetic and genomic DNA. The technology uses a thoroughly characterized and sequenced GM2438 cell line as a genomic DNA background, into which sequenced synthetic targets are introduced. In the Acrometrix approach, such targets are linear synthetic DNA molecules containing a sequence that mimics the change associated, for example, with a selected biomarker, which in the context of the present invention can be a sequence of any of the insertion/deletion-containing homopolymer repeats described above, preferably for purposes PCR along with their flanking sequences. The targets further comprise a "tail" sequence linked to the mimic change sequence described above, which further serves to identify and quantify the targets. The resulting sequence is considered to be a hybrid sequence containing a sequence mimicking the change and a tail sequence. For example, a tail may mimic a known change in a gene such as a SNP for which assays are available for detection, and therefore may provide additional means to indirectly absolute quantify the sequence that mimics the change, such as in this case an insertion/deletion in a selected marker or markers. Such a standard, for example, may be applicable for verification and validation purposes, for example, it may be provided in the case of additional research by NGS, in particular because existing NGS-based approaches are still prone to loss of information about inserts. /deletions in sequences of homopolymer repeats.

[0072] В качестве альтернативы в предпочтительном варианте осуществления по настоящему изобретению контрольный биологический образец содержит материал, полученный из клеточной линии HTC116 cl.110268743, которую создавали для целей настоящего изобретения и депонировали в соответствии с Будапештским договором 28 ноября 2017 г. в депозитарии BCCM/GeneCorner в Бельгии под номером доступа LMBP 12278CB. Клеточная линия содержит одну гомонуклеотидную делецию в каждом из указанных выше гомополимерных повторов. Это означает, что геном клеточной линии содержит следующие мутантные (т. е. MSI-вариант) гомополимерные повторы:[0072] Alternatively, in a preferred embodiment of the present invention, the control biological sample contains material derived from the cell line HTC116 cl. GeneCorner in Belgium under accession number LMBP 12278CB. The cell line contains one homonucleotide deletion in each of the above homopolymer repeats. This means that the genome of the cell line contains the following mutant (i.e. MSI variant) homopolymer repeats:

10 аденинов, локализованных в гене DIDO1 человека и начинающихся с положения chr20:62905340;10 adenines located in the human DIDO1 gene and starting at position chr20:62905340;

10 аденинов, локализованных в гене MRE11 человека и начинающихся с положения chr11:94479765;10 adenines located in the human MRE11 gene and starting at position chr11:94479765;

9 аденинов, локализованных в гене SULF2 человека и начинающихся с положения chr20:47657577; 9 adenines located in the human SULF2 gene and starting at position chr20:47657577;

7 аденинов, локализованных в гене ACVR2A человека и начинающихся с положения chr2:147926117;7 adenines located in the human ACVR2A gene and starting at position chr2:147926117;

9 аденинов, локализованных в гене BTBD7 человека и начинающихся с положения chr14:93241685;9 adenines located in the human BTBD7 gene and starting at position chr14:93241685;

8 тиминов, локализованных в гене SEC31A человека и начинающихся с положения chr4:82864412; и8 thymines located in the human SEC31A gene and starting at position chr4:82864412; And

9 аденинов, локализованных в гене RYR3 человека и начинающихся с положения chr15:33865341.9 adenines located in the human RYR3 gene and starting at position chr15:33865341.

Кроме того, клеточная линия также характеризуется вставкой/делецией нескольких других повторов, ассоциированных с MSI, например, BAT25 и BAT26 из панели Bethesda, которые могут использоваться в сравнительных исследованиях.In addition, the cell line also features the insertion/deletion of several other MSI-associated repeats, such as BAT25 and BAT26 from the Bethesda panel, which can be used in comparative studies.

[0073] В связанном аспекте настоящего изобретения также представлены клетка или любой другой материал, в частности генетический материал, который получен из клеточной линии HTC116 cl.110268743. Таким материалом может быть выделенная геномная ДНК или клеточный лизат. Другие подходящие формы такого материала будут очевидны специалисту в данной области техники в зависимости от конечного назначения представленных в данном документе способов и наборов на основе указанных способов.[0073] In a related aspect of the present invention, a cell or any other material, in particular genetic material, is also provided, which is derived from the cell line HTC116 cl.110268743. Such material can be isolated genomic DNA or cell lysate. Other suitable forms of such material will be apparent to those skilled in the art, depending on the end use of the methods presented herein and kits based on said methods.

[0074] В дополнительном аспекте настоящего изобретения также представлены наборы для выявления вставок/делеций в панели биомаркеров MSI по настоящему изобретению или для проведения способа в соответствии с настоящим изобретением. В конкретном варианте осуществления настоящего изобретения представлен набор для анализа локусов MSI в биологическом образце, при этом набор содержит средства для выявления участков нуклеиновой кислоты, содержащих описанные выше гомополимерные повторы, представленные в панели биомаркеров по настоящему изобретению. Предпочтительно указанные средства являются специфичными в отношении последовательности, т. е. сконструированы для специфического распознавания в последовательности указанных гомополимерных повторов с их фланкирующими участками выбранной длины. В предпочтительном варианте осуществления специфичные в отношении последовательности средства предусматривают праймер, или пару праймеров, или зонд, способные к гибридизации с участком, содержащим гомополимерный повтор. Например, такие средства могут предпочтительно предусматривать праймер, гибридизирующийся с участком выше или ниже повтора, и сконструированный для получения в реакции амплификации продукта амплификации, содержащего по меньшей мере один из указанных гомополимерных повторов или их мутантных вариантов, например, содержащие на один или два гомонуклеотида меньше или больше по сравнению с вариантом гомополимерного повтора дикого типа. В другом примере средства могут предусматривать зонд, способный к гибридизации с любой из указанных последовательностей гомополимерных повторов (или их мутантных вариантов, содержащих вставку/делецию) и с по меньшей мере одним непосредственно фланкирующим участком (т. е. выше или ниже, но предпочтительно оба варианта) указанной последовательности повтора. В конкретном варианте осуществления средства предусматривают по меньшей мере один праймер или пару праймеров, выбранные из SEQ ID NO: 1-14. В альтернативном конкретном варианте осуществления средства предусматривают по меньшей мере один зонд типа «молекулярный маяк», выбранный из SEQ ID NO: 15-21. В возможном варианте осуществления средства предусматривают по меньшей мере один праймер или пару праймеров, выбранные из SEQ ID NO: 1-14, и по меньшей мере один зонд типа «молекулярный маяк», выбранный из SEQ ID NO: 15-21. Средства могут дополнительно предусматривать, например, корректирующую полимеразу, подходящие буферные системы, dNTP, выбранные красители, необязательно с совместимыми гасителями и т. д. В дополнительном варианте осуществления представлен набор, содержащий материал, представляющий собой контрольный биологический образец, предпочтительно представляющий собой материал, полученный из клеточной линии HTC116 cl.110268743[0074] In a further aspect of the present invention, kits are also provided for detecting insertions/deletions in an MSI biomarker panel of the present invention or for carrying out a method in accordance with the present invention. In a particular embodiment, the present invention provides a kit for the analysis of MSI loci in a biological sample, which kit contains means for detecting nucleic acid regions containing the homopolymer repeats described above, presented in the panel of biomarkers of the present invention. Preferably, said agents are sequence specific, i.e., designed to specifically recognize in sequence said homopolymer repeats with their flanking portions of selected length. In a preferred embodiment, the sequence-specific agents provide a primer, or a pair of primers, or a probe capable of hybridizing to a region containing a homopolymeric repeat. For example, such agents may preferably provide a primer that hybridizes upstream or downstream of the repeat and is designed to produce, in an amplification reaction, an amplification product containing at least one of said homopolymer repeats or mutant variants thereof, e.g. or more compared to the wild-type homopolymer repeat variant. In another example, the means may provide a probe capable of hybridizing to any of the indicated sequences of homopolymer repeats (or insertion/deletion mutants thereof) and to at least one immediately flanking region (i.e., above or below, but preferably both variant) of the specified repetition sequence. In a specific embodiment, the means provide at least one primer or a pair of primers selected from SEQ ID NO: 1-14. In an alternative specific embodiment, the means provide at least one molecular beacon probe selected from SEQ ID NOs: 15-21. In an exemplary embodiment, the means comprise at least one primer or primer pair selected from SEQ ID NOs: 1-14 and at least one molecular beacon probe selected from SEQ ID NOs: 15-21. The means may additionally provide, for example, corrective polymerase, suitable buffer systems, dNTPs, selected dyes, optionally compatible quenchers, etc. from cell line HTC116 cl.110268743

[0075] В предпочтительном варианте осуществления представлен набор, дополнительно содержащий картридж. Необязательно набор может быть представлен в форме картриджа. Таким образом, преимущественно в настоящем изобретении представлен набор, где указанные средства для выявления участков нуклеиновой кислоты, содержащие описанную выше панель биомаркеров гомополимерных повторов, представлены в картридже, выполненном с возможностью взаимодействия с автоматизированной системой. Как описано выше, подходящий пример картриджа и автоматизированной системы, выполненной с возможностью взаимодействия с ним, представляет собой платформу Biocartis Idylla™. Дополнительные подробности в отношении этой и аналогично применимых в настоящем изобретении систем можно найти в WO2007004103, EP1896180, EP1904234 и EP2419705. Из документов, цитируемых в данном документе, можно понять, что предпочтительные картриджи содержат не только средства для проведения ПЦР, но также могут быть выполнены с возможностью непосредственного приема источника нуклеиновой кислоты или образца, проведения выделения или экстрагирования нуклеиновых кислот из указанного источника нуклеиновой кислоты и предоставления (например, посредством перекачивания) экстрагированной таким образом нуклеиновой кислоты для последующего анализа на основе ПЦР. [0075] In a preferred embodiment, a kit further comprising a cartridge is provided. Optionally, the kit may be in the form of a cartridge. Thus, advantageously, the present invention provides a kit wherein said means for detecting nucleic acid regions comprising the panel of homopolymer repeat biomarkers described above are presented in a cartridge capable of interacting with an automated system. As described above, a suitable example of a cartridge and an automated system capable of interacting with it is the Biocartis Idylla™ platform. Additional details regarding this and similarly applicable systems in the present invention can be found in WO2007004103, EP1896180, EP1904234 and EP2419705. From the documents cited herein, it can be understood that the preferred cartridges contain not only the means for performing PCR, but can also be configured to directly receive a nucleic acid source or sample, perform isolation or extraction of nucleic acids from said nucleic acid source, and provide (for example, by pumping) the thus extracted nucleic acid for subsequent analysis based on PCR.

[0076] В предпочтительном варианте осуществления такие средства, как праймеры, зонды и/или другие реагенты, в том числе корректирующая полимераза могут быть предоставлены в указанном картридже в нанесенном формате, что способствует увеличенному сроку хранения.[0076] In a preferred embodiment, tools such as primers, probes, and/or other reagents, including corrective polymerase, can be provided in said cartridge in a coated format that promotes extended shelf life.

[0077] В дополнительном связанном аспекте настоящего изобретения также представлены автоматизированные системы для выявления вставок/делеций в панели биомаркеров MSI в соответствии со способами по настоящему изобретению и/или для проведения анализа с помощью наборов в соответствии с настоящим изобретением.[0077] In a further related aspect of the present invention, automated systems are also provided for detecting insertions/deletions in an MSI biomarker panel in accordance with the methods of the present invention and/or for performing analysis with kits in accordance with the present invention.

[0078] В возможном варианте осуществления такая автоматизированная система может содержать панель управления и прибор, совместимые с картриджами многоразового применения по настоящему изобретению. Прибор содержит контрольные модули для проведения анализов. Пульт управления представляет собой компьютер для контроля и наблюдения за действиями прибора и за статусом картриджа в ходе анализов. Предпочтительно анализ будет полностью проводиться внутри картриджа и может включать, например, ПЦР в режиме реального времени. После введения образца в такой картридж по настоящему изобретению, который предварительно заполнен реагентами, описанными выше, картридж вставляют в прибор и прибор контролирует анализ, который автоматически проводится в картридже. После проведения анализа программное обеспечение пульта управления обрабатывает результаты и генерирует отчет, доступный конечному пользователю автоматизированной системы.[0078] In an exemplary embodiment, such an automated system may comprise a control panel and instrument compatible with the refillable cartridges of the present invention. The device contains control modules for analysis. The control panel is a computer to control and monitor the operation of the instrument and the status of the cartridge during the analysis. Preferably, the assay will be carried out entirely within the cartridge and may include, for example, real-time PCR. After introducing a sample into such a cartridge of the present invention, which is pre-filled with the reagents described above, the cartridge is inserted into the instrument and the instrument controls the analysis that is automatically carried out in the cartridge. After the analysis, the control desk software processes the results and generates a report available to the end user of the automated system.

[0079] Автоматизированная система может быть автоматизированной системой открытого или закрытого типа. После внесения или помещения образца в картридж, картридж вставляют в систему, которую затем закрывают и оставляют закрытой в ходе осуществления эксплуатации системы. В системе закрытого типа все необходимые реагенты встроены, поэтому закрытая конфигурация обеспечивает преимущество, которое заключается в проведении выявления без контаминации. В качестве альтернативы в автоматизированной системе может использоваться открытый доступный картридж. Необходимые реагенты добавляют в открытый картридж при необходимости, после чего образец может быть помещен в открытый картридж и картридж может быть введен в анализ в закрытой автоматизированной системе.[0079] The automated system may be an open or closed type automated system. After the sample has been deposited or placed in the cartridge, the cartridge is inserted into the system, which is then closed and left closed during operation of the system. In a closed system, all necessary reagents are built in, so the closed configuration provides the advantage of carrying out detection without contamination. Alternatively, an open accessible cartridge may be used in an automated system. Required reagents are added to the open cartridge as needed, after which the sample can be placed in the open cartridge and the cartridge can be entered into the assay in a closed automated system.

[0080] Предпочтительно используют системы, основанные на применении картриджа, содержащие одну или более реакционных камер и одну или несколько жидкостных камер. Некоторые жидкостные камеры могут содержать жидкость, которую используют для получения лизата образца. Другие камеры могут содержать жидкости, такие как реакционные буферы, промывочные жидкости и растворы для амплификации. Реакционные камеры используются для проведения разных стадий выявления, как, например, промывание, лизис и амплификация.[0080] Preferably, cartridge based systems are used, comprising one or more reaction chambers and one or more fluid chambers. Some fluid chambers may contain fluid that is used to prepare the sample lysate. Other chambers may contain liquids such as reaction buffers, washes, and amplification solutions. Reaction chambers are used for various detection steps such as washing, lysis and amplification.

[0081] В особенно желательном варианте осуществления в соответствии с вышеперечисленными вариантами осуществления для упрощения и облегчения интерпретации результатов способа в соответствии с настоящим изобретением также проводят анализ кривой плавления в автоматизированном режиме посредством компьютеризованного способа.[0081] In a particularly desirable embodiment, in accordance with the above embodiments, in order to simplify and facilitate the interpretation of the results of the method in accordance with the present invention, the analysis of the melting curve is also carried out in an automated manner by a computerized method.

[0082] И наконец, также целью настоящего изобретения является обеспечение применения панелей биомаркеров, способов, наборов, включающих картриджи, и автоматизированных систем в соответствии с настоящим изобретением для анализа локусов MSI в образце опухоли или биологическом образце, которые, как предполагается, содержат опухолевый материал.[0082] Finally, it is also an object of the present invention to provide the use of biomarker panels, methods, kits including cartridges, and automated systems in accordance with the present invention for the analysis of MSI loci in a tumor sample or biological sample that is suspected to contain tumor material. .

[0083] В предпочтительном варианте осуществления опухоль представляет собой колоректальный рак (CRC). В альтернативном варианте осуществления, опухоль представляет собой рак яичника или рак эндометрия. В еще одном варианте осуществления опухоль представляет собой рак желудка.[0083] In a preferred embodiment, the tumor is colorectal cancer (CRC). In an alternative embodiment, the tumor is ovarian cancer or endometrial cancer. In yet another embodiment, the tumor is gastric cancer.

[0084] В возможном варианте осуществления по настоящему изобретению также представлено применение панелей биомаркеров, способов, наборов, включающих картриджи, и автоматизированных систем в соответствии с настоящим изобретением для анализа локусов MSI в образце опухоли и для прогнозирования ответа субъекта на иммунотерапию, от которого получили образец опухоли, исходя из анализа. Последнее применение может быть предусмотрено с учетом недавних сообщений из литературных источников, в частности, Turajlic et al., 2017, Lancet Oncology, где было показано, что повышенное накопление вставок/делеций в геноме коррелирует с образованием новых открытых рамок считывания, кодирующих большое количество неоантигенных последовательностей. Наряду с этим в дальнейшем авторы настоящего изобретения демонстрируют, что выявление по меньшей мере 2 или 3 вставок/делеций в панели биомаркеров по настоящему изобретению в значительной степени коррелирует с общим количеством вставок/делеций и неоантигенов при оценке каждого образца. Данные авторов настоящего изобретения дополнительно показывают, что отличающийся иммуногенный фенотип опухоли может быть спрогнозирован с помощью способов и/или наборов по настоящему изобретению. Последнее является многообещающим по следующим причинам. Блокирование контрольных точек иммунного ответа было ранее одобрено для лечения неоперабельных или метастатических опухолей с высокой микросателлитной нестабильностью (MSI-H) независимо от участка их локализации или гистологической характеристики. Наблюдаемый показатель ответа составил ~40%. В настоящее время отсутствует одобренный FDA тест для выявления статуса MSI. Опухоль с MSI-H характеризуется такими гистопатологическими характеристиками, как высокая инфильтрация лимфоцитами и высокая мутационная нагрузка опухоли. В частности, такие опухоли характеризуются высоким количеством мутаций типа «вставка/делеция», которые известны высокой иммуногенностью, приводящей к избытку неоантигенов. Из результатов исследования авторов настоящего изобретения следует, что опухоли с MSI-H, характеризующиеся высоким показателем вставок/делеций, очевидно, будут высоко восприимчивы к иммунотерапии антителами, нацеливающимися на молекулы контрольных точек иммунного ответа, например, PD-1, PD-L1 или PD-L2. Следовательно, в другом возможном варианте осуществления представлен способ анализа локусов MSI в соответствии с настоящим изобретением, который предусматривает стадию применения полученной информации о количестве гомополимерных повторов для принятия решения о проведении иммунотерапии у субъекта, от которого получен биологический образец. В возможных вариантах осуществления способ может предусматривать стадию применения полученной информации о количестве гомополимерных повторов для установления мутационной нагрузки опухоли или нагрузки опухоли вставками/делециями. В предпочтительных вариантах осуществления установленная мутационная нагрузка опухоли или нагрузка опухоли вставками/делециями представлена в виде оценки общего количества мутаций или представлена в виде балльной оценки. В конкретном варианте осуществления способы по настоящему изобретению могут предусматривать стадию применения полученной информации о количестве гомополимерных повторов, или о мутационной нагрузке опухоли, или о нагрузке опухоли вставками/делециями, или об оценке общего количества мутаций, или о балльной оценке для принятия решения о проведении иммунотерапии у субъекта, от которого получен биологический образец. Как поясняется выше, в предпочтительных вариантах осуществления таких способов иммунотерапия предусматривает лечение с помощью антитела, нацеливающегося на фактор, представляющий собой контрольную точку иммунного ответа, причем наиболее предпочтительно указанное антитело представляет собой антитело, специфичное к любой из следующих мишеней: PD-1, PD-L1 или PD-L2. В дополнительном аспекте данные авторов настоящего изобретения также указывают на то, что опухоли с высоким содержанием неоантигенов также будут восприимчивы к подходам специфического нацеливания на образовавшиеся неоантигены посредством Т-клеток с химерным антигенами или средств терапевтической вакцинотерапии. Таким образом, также могут быть представлены возможные варианты осуществления способов по настоящему изобретению, в которых реализуются указанные способы. Кроме того, эти и другие варианты применения настоящего изобретения в диагностике, прогнозировании и клиническом наблюдении субъектов будут легко доступны специалистам в данной области техники.[0084] In an exemplary embodiment, the present invention also provides the use of panels of biomarkers, methods, kits including cartridges, and automated systems in accordance with the present invention to analyze MSI loci in a tumor sample and to predict the response of the subject to immunotherapy from which the sample was obtained. tumors, based on the analysis. The latter application can be envisaged in view of recent reports from the literature, in particular, Turajlic et al., 2017, Lancet Oncology, where it was shown that increased accumulation of insertions / deletions in the genome correlates with the formation of new open reading frames encoding a large number of neoantigenic sequences. Along with this, the present inventors further demonstrate that the detection of at least 2 or 3 insertions/deletions in the panel of biomarkers of the present invention correlates significantly with the total number of insertions/deletions and neoantigens when assessing each sample. The data of the present inventors further demonstrate that a different immunogenic tumor phenotype can be predicted using the methods and/or kits of the present invention. The latter is promising for the following reasons. Immune checkpoint blocking has been previously approved for the treatment of unresectable or metastatic tumors with high microsatellite instability (MSI-H) regardless of their site or histological characteristics. The observed response rate was ~40%. There is currently no FDA-approved test to detect MSI status. A tumor with MSI-H is characterized by histopathological characteristics such as high lymphocyte infiltration and high tumor mutation load. In particular, such tumors are characterized by a high number of insertion/deletion mutations, which are known to be highly immunogenic leading to an excess of neoantigens. It follows from the results of our study that MSI-H tumors having a high insertion/deletion rate are likely to be highly responsive to immunotherapy with antibodies targeting immune response checkpoint molecules, such as PD-1, PD-L1, or PD. -L2. Therefore, in another possible embodiment, a method for analyzing MSI loci according to the present invention is provided, which includes the step of using the obtained information on the number of homopolymer repeats to make a decision on the administration of immunotherapy in the subject from which the biological sample is obtained. In possible embodiments, the method may include the step of using the obtained information about the number of homopolymer repeats to establish the mutation load of the tumor or the insertion/deletion load of the tumor. In preferred embodiments, the established tumor mutation load or insertion/deletion tumor load is presented as an estimate of the total number of mutations or is presented as a score. In a specific embodiment, the methods of the present invention may include the step of using the obtained information about the number of homopolymer repeats, or about the mutation load of the tumor, or about the load of the tumor with insertions/deletions, or about the estimation of the total number of mutations, or about the scoring to decide on the administration of immunotherapy. in the subject from which the biological sample was obtained. As explained above, in preferred embodiments of such methods, immunotherapy involves treatment with an antibody targeting a checkpoint factor of the immune response, most preferably said antibody being an antibody specific for any of the following targets: PD-1, PD- L1 or PD-L2. In a further aspect, the present inventors' data also indicate that tumors rich in neoantigens will also be susceptible to specific targeting approaches to neoantigens generated by chimeric antigen T cells or therapeutic vaccine therapy. Thus, possible embodiments of the methods of the present invention in which said methods are implemented can also be presented. In addition, these and other uses of the present invention in the diagnosis, prognosis, and clinical follow-up of subjects will be readily available to those skilled in the art.

ПримерыExamples

1. Выявление микросателлитной нестабильности (MSI) в образцах рака с помощью нового набора высокочувствительных маркеров1. Detection of microsatellite instability (MSI) in cancer samples using a new set of highly sensitive markers

[0085] Получение минимального набора из 4 маркеров из любого указанного набора маркеров не является простым. Например, описанный Zhao et al, 2014, eLife анализ с помощью Sequenom 18 образцов с MSI-H с использованием панели из 59 маркеров показал, что маркер в среднем определяется как мутантный в 44,26% образцов. Хотя данная большая панель маркеров является высокоэффективной в выявлении статуса MSI, произвольно полученные из нее наборы из 4 выбранных маркеров показывают значительно более низкую теоретическую эффективность по сравнению с предложенным в данном документе основным набором, содержащим ACRV2A, DIDO1, MRE11, SULF2. Кроме того, эти произвольно выбранные панели обладают рядом недостатков, заключающихся в том, что они могут содержать маркеры, демонстрирующие этнически зависимые отличия в гомополимерном участке, например, такие, которые наблюдали в случае маркера TMEM65 для субпопуляций Карибского бассейна. Данные отличия делают исключительно сложным конструирование надежной и эффективной панели с низким количеством маркеров, поскольку они могут понижать точность интерпретации изменений, внесенных MSI. Последнее становится особенно важным при определении небольшого количества различных маркеров и/или при отсутствии соответствующего контроля, что обычно наблюдается в случае, например, классического набора биомаркеров MSI Bethesda, имеющего широкий диапазон индивидуальной изменчивости и множественные вариантные аллели, особенно в африканских популяциях (Buhard et al., 2006).[0085] Obtaining a minimum set of 4 tokens from any given set of tokens is not straightforward. For example, described by Zhao et al, 2014, an eLife analysis with Sequenom of 18 samples with MSI-H using a panel of 59 markers showed that the marker was determined to be mutated in 44.26% of the samples on average. Although this large panel of markers is highly effective in detecting MSI status, randomly derived sets of 4 selected markers show a significantly lower theoretical performance compared to the core set proposed in this document containing ACRV2A, DIDO1, MRE11, SULF2. In addition, these randomly selected panels have a number of disadvantages in that they may contain markers showing ethnically dependent differences in the homopolymer region, such as those observed with the TMEM65 marker for Caribbean subpopulations. These differences make it extremely difficult to design a reliable and efficient panel with a low number of markers, since they can reduce the accuracy of interpreting changes made by MSI. The latter becomes especially important when a small number of different markers and/or in the absence of appropriate controls, which is usually observed in the case of, for example, the classic MSI Bethesda biomarker set, which has a wide range of individual variability and multiple variant alleles, especially in African populations (Buhard et al ., 2006).

Определение профиля MSI при CRC, раке желудка и раке эндометрияMSI profiling in CRC, gastric and endometrial cancer

[0086] Определяли профиль статуса по 7 микросателлитным маркерам (BTBD7, RYR3, SEC31A, ACVR2A, DIDO1, MRE11 и SULF2) в 128 образцах колоректального рака с MSI-H. Несколько клинических баз и разных этнических групп включали для оценки надежности выбора маркеров. Кроме того, статус по 7 маркерам проверяли в 15 образцах рака желудка с MSI-H и 19 образцах рака эндометрия с MSI-H. Длину повтора определяли по ДНК из FFPE с помощью ПЦР и с последующим определением характеристик продукта амплификации с помощью «молекулярных маяков».[0086] The status profile was determined by 7 microsatellite markers (BTBD7, RYR3, SEC31A, ACVR2A, DIDO1, MRE11 and SULF2) in 128 MSI-H colorectal cancer samples. Several clinical sites and different ethnic groups were included to assess the reliability of the choice of markers. In addition, the status of 7 markers was checked in 15 MSI-H gastric cancer samples and 19 MSI-H endometrial cancer samples. Repeat length was determined from FFPE DNA by PCR followed by characterization of the amplification product by molecular beacons.

Материалы и способыMaterials and methods

[0087] Образцы. В общей сложности 128 FFPE образцов CRC человека с MSI-H получали из различных источников, включая Кембриджский университет, Португальский институт онкологии в Порту, Cureline, Boca Biolistics, Trans-Hit, Geneticist Inc, Righshospitalet, Origene и Asterand. 15 образцов желудка человека с MSI-H получили от Cureline и Trans-Hit и 19 образцов эндометрия человека с MSI-H получили от IDIBELL.[0087] Samples. A total of 128 FFPE human CRC samples with MSI-H were obtained from various sources including the University of Cambridge, the Portuguese Cancer Institute in Porto, Cureline, Boca Biolistics, Trans-Hit, Geneticist Inc, Righshospitalet, Origene and Asterand. 15 MSI-H human stomach samples were obtained from Cureline and Trans-Hit and 19 MSI-H human endometrial samples were obtained from IDIBELL.

[0088] Обработка образцов. Каждый образец FFPE с MSI-H помещали в струйный картридж, являющийся разработкой Biocartis Idylla™. Картриджи закрывали и загружали в платформу Idylla™, предназначенную для автоматизированных генетических анализов на основе ПЦР, после чего начинали полностью автоматизированную пробоподготовку. Если вкратце, то ДНК извлекали из образцов FFPE в соответствии с протоколом разжижения FFPE Biocartis, а затем ее закачивали в отсеки для ПЦР в картриджах в соответствии со стандартным протоколом для Idylla™.[0088] Sample processing. Each FFPE sample with MSI-H was placed in an ink cartridge developed by Biocartis Idylla™. The cartridges were capped and loaded into the Idylla™ platform for automated PCR-based genetic analyzes, after which fully automated sample preparation began. Briefly, DNA was extracted from FFPE samples according to the FFPE Biocartis liquefaction protocol and then pumped into cartridge PCR wells according to the standard protocol for Idylla™.

[0089] ПЦР. Отсеки для ПЦР картриджа загружали так, чтобы они содержали следующие смеси ПЦР на пару праймеров или дуплекс пары праймеров, как указано ниже:[0089] PCR. The PCR cartridge compartments were loaded to contain the following PCR mixtures per primer pair or primer pair duplex as follows:

Figure 00000003
Figure 00000003

Figure 00000004
Figure 00000004

Последовательности пар праймеров и зонды для каждого маркера представлены ниже:The primer pair sequences and probes for each marker are shown below:

Figure 00000005
Figure 00000005

Условия для ПЦР представлены ниже:Conditions for PCR are presented below:

Figure 00000006
Figure 00000006

[0090] Плавление ампликона. Продукты ПЦР подвергали денатурации в картриджах в течение 2 минут при 92°. Затем получали данные кривой плавления по интенсивности флуоресценции при нагревании смеси от 40 C до 76,6 C с шагом 0,3 C (12 сек на цикл), при этом сигналы флуоресценции контролировали после каждого повышения на 0,3 C.[0090] Amplicon melting. The PCR products were denatured in cartridges for 2 minutes at 92°. Melting curve data were then obtained from fluorescence intensity by heating the mixture from 40 C to 76.6 C in 0.3 C increments (12 sec per cycle), with fluorescence signals monitored after each 0.3 C increase.

[0091] Постобработка. На первой стадии анализа данных исходные значения измерения флуоресценции для кривой плавления загружали из прибора Idylla™. На следующей стадии только первые 64 цикла сохраняли из вектора измеренных значений. Данная подгруппа называется «участок, представляющий интерес» или ROI, поскольку наиболее важные изменения сигнала наблюдают в пределах данного окна. В более поздних циклах в основном наблюдают плавление «маяков». Следующей стадией в алгоритме постобработки является применение дискретного вейвлет-преобразования (DWT) по отношению к вектору измерения (ROI). Вейвлеты особенно хорошо подходят для анализа кривых плавления, поскольку они представляют собой низкочастотное явление, которое возникает в конкретной температурной зоне. Вейвлеты способны одновременно выполнять временной и частотный анализ. Это значит, что они могут интерпретировать и то, что происходит в плане низкочастотных изменений, и то, когда это происходит. Таким образом, вейвлеты кратко обобщают способ анализа кривой плавления. В данном конкретном случае используют вейвлет DB8 и сохраняют коэффициенты третьего уровня. После данного преобразования, и масштаб, и вейвлет-коэффициенты сохраняются, что дает два набора из 8 коэффициентов. Один набор из 16 вейвлет-коэффициентов рассчитывают для каждого маркера, представленного в данном анализе. Данный набор вейвлет-коэффициентов на маркер называют результатами постобработки для каждого маркера.[0091] Post-processing. In the first step of data analysis, the initial fluorescence measurements for the melt curve were downloaded from the Idylla™ instrument. In the next step, only the first 64 cycles were saved from the vector of measured values. This subgroup is referred to as the "region of interest" or ROI because the most important signal changes are observed within this window. In later cycles, the melting of "lighthouses" is mainly observed. The next step in the post-processing algorithm is to apply the discrete wavelet transform (DWT) to the measurement vector (ROI). Wavelets are particularly well suited to the analysis of melt curves because they are a low frequency phenomenon that occurs in a particular temperature zone. Wavelets are capable of simultaneously performing time and frequency analysis. This means that they can interpret both what happens in terms of low frequency changes and when it happens. Thus, wavelets briefly generalize the way to analyze the melting curve. In this particular case, the DB8 wavelet is used and the coefficients of the third level are stored. After this transformation, both the scale and the wavelet coefficients are preserved, resulting in two sets of 8 coefficients. One set of 16 wavelet coefficients is calculated for each marker presented in this analysis. This set of wavelet coefficients per marker is called the post-processing results for each marker.

[0092] Дерево принятия решений. Вторая стадия анализа данных кривой плавления называется деревом принятия решений. На данной стадии алгоритм распознавания образов используется с целью классификации валидных образцов на основе результатов постобработки. Для этого алгоритм классификации, являющийся нейронной сетью, задействуют по отношению к результатам постобработки каждого маркера. Данную сеть обучали с помощью меченных данных, для которых известен введенный генотип. В случае эталонных данных такое мечение основывается на введенном генотипе, который был представлен. В случае клинических данных данное мечение получают в результате визуальной балльной оценки профилей плавления специалистами по кривой плавления. Посредством итеративной оптимизации весов в составе нейронной сети алгоритм может научиться распознавать отличия между кривой для дикого типа (WT) и кривой для мутантного типа. Алгоритм предоставляет балльную оценку вероятности в качестве результата для каждого маркерного гена, которая отражает достоверность решения (1 для мутантного типа и 0 для WT). Образец оценивают как MSI-H, если по меньшей мере два маркера имеют балльную оценку вероятности, превышающую 0,5.[0092] A decision tree. The second step in analyzing melt curve data is called a decision tree. At this stage, the pattern recognition algorithm is used to classify valid samples based on the results of post-processing. To do this, the classification algorithm, which is a neural network, is used in relation to the results of post-processing of each marker. This network was trained using labeled data for which the introduced genotype is known. In the case of reference data, this labeling is based on the introduced genotype that has been presented. In the case of clinical data, this labeling is obtained by visual scoring of the melting profiles by experts on the melting curve. By iteratively optimizing the weights within the neural network, the algorithm can learn to recognize differences between the wild-type (WT) curve and the mutant-type curve. The algorithm provides a probability score as an output for each marker gene, which reflects the validity of the decision (1 for mutant type and 0 for WT). A sample is scored as MSI-H if at least two markers have a probability score greater than 0.5.

Результатыresults

1. Определение профиля MSI при CRC1. Determination of the MSI profile at CRC

[0093] Первый анализ. Основной набор из четырех маркеров, включающий ACVR2A, DIDO1, MRE11 и SULF2, оценивали в отношении их способности выявлять положительные образцы MSI-H в пуле из 128 образцов с MSI-H. Образец оценивали как положительный, когда дерево принятия решений по данным кривой плавления, подвергнутым постобработке, дает по меньшей мере два маркера, выявленных как характеризующиеся вставкой/делецией. При использовании данного основного набора из четырех маркеров 96% образцов могут быть идентифицированы как MSI-H. Поскольку минимальная приемлемая эффективность была задана как определяющая по меньшей мере 95% образцов, выборку, осуществленную выше, приняли за основной набор маркеров MSI.[0093] First analysis. A core set of four markers including ACVR2A, DIDO1, MRE11 and SULF2 were evaluated for their ability to detect MSI-H positive samples in a pool of 128 MSI-H samples. A sample was scored positive when the post-processed melt curve data decision tree yielded at least two markers identified as having an insertion/deletion. Using this basic set of four markers, 96% of samples can be identified as MSI-H. Since the minimum acceptable potency was set to account for at least 95% of the samples, the sampling above was taken as the core set of MSI markers.

Figure 00000007
Figure 00000007

[0094] Для обеспечения дополнительной оценки эффективности этих маркеров все возможные пермутации 3 маркеров из основной панели из 4 подвергали такому же анализу эффективности. Результаты указывают на то, что эффективность ухудшается для каждой возможной подвыборки, при этом она находится в диапазоне от 83% до 93%. С целью придания анализу большей надежности среди разных типов рака предпочтительной является схема с по меньшей мере четырьмя маркерами.[0094] To provide further evaluation of the efficacy of these markers, all possible permutations of 3 markers from the main panel of 4 were subjected to the same efficacy analysis. The results indicate that performance degrades for every possible subsample, ranging from 83% to 93%. In order to make the analysis more reliable among different types of cancer, a scheme with at least four markers is preferred.

Figure 00000008
Figure 00000008

[0095] Второй анализ. Путем добавления дополнительного маркера (BTBD7) к основному набору из четырех маркеров еще один образец может быть оценен как MSI-H, что обеспечивает 97% корректно оцененных образцов, делая тем самым панель более эффективной в определении статуса MSI.[0095] Second analysis. By adding an additional marker (BTBD7) to the main set of four markers, one more sample can be scored as MSI-H, resulting in 97% of correctly scored samples, thus making the panel more efficient in determining MSI status.

Figure 00000009
Figure 00000009

[0096] Третий анализ. Путем добавления дополнительного маркера (SEC31A) к набору из пяти маркеров все образцы в тестируемом ограниченном наборе образцов можно оценить как MSI-H, что обеспечивает еще большую эффективность.[0096] Third analysis. By adding an additional marker (SEC31A) to the set of five markers, all samples in the limited set of samples tested can be evaluated as MSI-H, providing even greater efficiency.

Figure 00000010
Figure 00000010

[0097] Четвертый анализ. Путем добавления дополнительного маркера (RYR3) к набору из шести маркеров, как и следовало ожидать, все образцы также оценивают как MSI-H. Хотя это и не сразу становится очевидным из представленных данных, теоретически добавление 7-го маркера, по-видимому, все же повышает эффективность анализа в случае анализа больших наборов образцов. В теории, учитывая наблюдаемые частоты мутаций этих маркеров в образцах с MSI-H, для 7 маркеров показатель ложноотрицательных результатов прогнозируется как не превышающий ~1/1900, который для более крупных наборов образцов может стать значимым.[0097] Fourth analysis. By adding an additional marker (RYR3) to the set of six markers, as expected, all samples were also scored as MSI-H. Although it is not immediately apparent from the data presented, theoretically the addition of a 7th marker still seems to increase the efficiency of the analysis in the case of analyzing large sets of samples. In theory, given the observed mutation rates of these markers in MSI-H samples, for 7 markers the false negative rate is predicted to be no greater than ~1/1900, which for larger sample sets may become significant.

Figure 00000011
Figure 00000011

[0098] Результаты анализа образца CRC показаны на фигуре 1. [0098] The results of the CRC sample analysis are shown in Figure 1.

2. Определение профиля MSI при раке желудка и раке эндометрия2. MSI profiling in gastric and endometrial cancer

[0099] Первый анализ. Затем также оценивали основной набор из четырех наиболее эффективных маркеров для CRC (ACVR2A, DIDO1, MRE11 и SULF2) в пуле из 34 образцов рака, в частности 15 образцов рака желудка и 19 образцов рака эндометрия (EN). [0099] First analysis. A core set of the four most effective markers for CRC (ACVR2A, DIDO1, MRE11 and SULF2) was then also evaluated in a pool of 34 cancer samples, specifically 15 gastric cancer samples and 19 endometrial cancer samples (EN).

Figure 00000012
Figure 00000012

Результаты указывают на то, что гомополимерный повтор в ACVR2A является намного более эффективным маркером для CRC, чем для других типов рака. Однако, несмотря на очень маленький пул образцов, результаты для основного набора при раке желудка и раке EN вплотную приближаются к приемлемому пороговому уровню, составляющему 95%, что является хорошим показателем того, что в случае более крупного пула образцов набор из 4 основных маркеров, представленный в данном документе, в целом может применяться по отношению к другим типам опухолей, а не только к CRC, с дефицитом по MMR или к типам опухолей с микросателлитной нестабильностью. С целью получения лучшего представления об эффективности основной панели определению профиля следует подвергнуть большее количество.The results indicate that the homopolymer repeat in ACVR2A is a much more effective marker for CRC than for other types of cancer. However, despite the very small sample pool, the results for the core set in gastric cancer and EN cancer are very close to the acceptable threshold of 95%, which is a good indication that in the case of a larger sample pool, the set of 4 core markers represented by herein, can generally be applied to tumor types other than CRC, MMR deficient, or microsatellite unstable tumor types. In order to get a better idea of the effectiveness of the main panel, a larger number should be profiled.

[0100] Второй анализ. Путем добавления дополнительного маркера (BTBD7) к основному набору из четырех маркеров еще один образец может быть оценен как MSI-H, что при таком небольшом наборе образцов уже доводит эффективность такой панели из пяти маркеров к наиболее оптимальному значению, составляющему 97% корректно оцененных образцов.[0100] Second analysis. By adding an additional marker (BTBD7) to the main set of four markers, one more sample can be assessed as MSI-H, which, with such a small set of samples, already brings the efficiency of such a panel of five markers to the most optimal value, which is 97% of correctly evaluated samples.

Figure 00000013
Figure 00000013

[0101] Третий анализ. Путем добавления дополнительного маркера (SEC31A) к набору из пяти маркеров все образцы могут быть оценены как MSI-H.[0101] Third analysis. By adding an additional marker (SEC31A) to the set of five markers, all samples can be evaluated as MSI-H.

Figure 00000014
Figure 00000014

1. Автоматизированное определение профиля MSI по 7 маркерам с помощью MSI-теста Idylla™1. Automated 7 marker MSI profiling with the Idylla™ MSI test

[0102] Предпосылки: выявление микросателлитной нестабильности (MSI) рекомендовали для всех пациентов с колоректальным раком (CRC). В настоящее время клиническим золотым стандартом является иммуногистохимическое окрашивание белков, вовлеченных в репарацию ошибочно спаренных оснований, и/или ПЦР-анализ часто мутирующих участков с короткими тандемными повторами в ДНК. MSI-тест Idylla™, разработанный с применением нового набора коротких гомополимеров, выбранных из данных о полной экзомной последовательности посредством способа без смещения (Zhao et al. 2014; eLife), способен к более быстрому выявлению с более высокой специфичностью и селективносью по сравнению с существующими способами.[0102] Background: detection of microsatellite instability (MSI) was recommended for all patients with colorectal cancer (CRC). Currently, the clinical gold standard is immunohistochemical staining of proteins involved in mismatch repair and/or PCR analysis of frequently mutating short tandem repeats in DNA. The Idylla™ MSI assay, designed using a new set of short homopolymers selected from full exome sequence data via a no-bias method (Zhao et al. 2014; eLife), is capable of faster detection with higher specificity and selectivity than existing ways.

[0103] Способы: прототип картриджей для MSI-теста Idylla™ разрабатывали до окончательного варианта конструкции. Длину повтора при новом наборе из 7 биомаркеров определяли на 348 образцах CRC, фиксированных в формалине и залитых в парафин (FFPE), с использованием таких опытных тестов, которые обеспечивают возможность полностью автоматизированной последовательности выполняемых действий, в том числе получение образца, амплификацию ДНК с последующим анализом кривой плавления и автоматизированную интерпретацию данных. Несколько клинических баз и разных этнических групп образцов пациентов включали для оценки надежности выбора маркеров. Все образцы дополнительно подвергали скринингу с помощью референтной методики выявления MSI (система анализа MSI Promega).[0103] Methods: Prototype cartridges for the Idylla™ MSI test were developed to final design. The repeat length of the new set of 7 biomarkers was determined on 348 formalin-fixed and paraffin-embedded (FFPE) CRC samples, using such advanced tests that allow for a fully automated workflow, including sample acquisition, DNA amplification, followed by melting curve analysis and automated data interpretation. Several clinical sites and different ethnic groups of patient samples were included to assess the reliability of the choice of markers. All samples were further screened with the MSI Reference Detection Method (MSI Promega Assay System).

[0104] Результаты: сто двадцать семь (36,5%) и 116 (33,3%) образцов классифицировали как характеризующиеся высокой MSI (MSI-H), а 209 (60,1%) и 220 (57,3%) образцов классифицировали как микросателлитно-стабильные (MSS) с помощью Idylla™ и Promega соответственно, в то время как 12 образцов (3,4%) не удалось классифицировать с помощью какой-либо методики. Анализ соответствия выявил общее совпадение, составляющее 96,1% (93,4% - 97,7%, 95% CI). 14 случаев классифицировали как MSI-H с помощью Idylla™, но с MSS (11) или недействительные (3) с помощью Promega; при этом медианный показатель положительных маркеров на основании Idylla™ составил 3/7.[0104] Results: one hundred and twenty-seven (36.5%) and 116 (33.3%) samples were classified as high MSI (MSI-H), and 209 (60.1%) and 220 (57.3%) samples were classified as microsatellite stable (MSS) by Idylla™ and Promega, respectively, while 12 samples (3.4%) could not be classified by any method. The match analysis revealed an overall match of 96.1% (93.4% - 97.7%, 95% CI). 14 cases were classified as MSI-H by Idylla™ but with MSS (11) or invalid (3) by Promega; while the median rate of positive markers based on Idylla™ was 3/7.

[0105] Выводы: в данном исследовании проводили валидацию новых биомаркеров MSI в отношении их способности различать статус MSI-H и MSS в больших и разнообразных наборах образцов CRC. Также продемонстрировали возможность полностью автоматизированного анализа для тестирования MSI. Опытный MSI-тест Idylla™ совместим с полностью интегрированной платформой Idylla™, обеспечивая точные и надежные результаты в течение 150 минут с использованием лишь одного FFPE-среза опухоли (референтный образец не требовался).[0105] Conclusions: New MSI biomarkers were validated in this study for their ability to discriminate between MSI-H and MSS status in a large and diverse set of CRC samples. Also demonstrated the possibility of fully automated analysis for testing MSI. Idylla™'s mature MSI test is compatible with the fully integrated Idylla™ platform, providing accurate and reliable results within 150 minutes using only a single FFPE tumor slice (no reference sample required).

Общие выводыGeneral conclusions

[0106] Представленная в данном документе панель лишь из четырех основных маркеров, включающих гомополимерные повторы в генах ACVR2A, DIDO1, MRE11 и SULF2, демонстрирует надлежащую эффективность в анализе образцов CRC. Также показана высокая эффективность в случае с образцами рака желудка и эндометрия, несмотря на тот факт, что у авторов настоящего изобретения была возможность доступа и определения профиля лишь в небольшом количестве из этих образцов. Определение профиля большего количества образцов с MSI-H, отличных по происхождению от CRC, с большой вероятностью подтверждает применимость минимальной основной панели из двух маркеров для более широкого спектра видов рака. В настоящее время очевидно, что гомополимер в гене ACVR2A представляет собой особенно эффективный и достаточно специфичный маркер MSI для CRC. Следовательно, в отношении других типов рака в качестве альтернативного варианта осуществления настоящего изобретения могут быть предложены и протестированы другие минимальные основные панели. Из представленных в данном документе предварительных данных видно, что могут быть предложены следующие три панели - из 4 основных маркеров: (1) DIDO1, SULF2, BTBD7 и SEC31A; (2) DIDO1, SULF2, BTBD7 и ACVR2A; и (3) DIDO1, SULF2, SEC31A и RYR3. Независимо от типов образцов с дефицитом MMR, для панели из 5 основных маркеров, содержащей ACVR2A, DIDO1, MRE11, SULF2 и BTBD7, было показано, что она в целом является подходящей для диагностирования в случае образцов разного происхождения и, следовательно, составляет особенно привлекательный вариант осуществления настоящего изобретения.[0106] Presented herein, a panel of only four major markers, including homopolymer repeats in the ACVR2A, DIDO1, MRE11 and SULF2 genes, demonstrates adequate performance in the analysis of CRC samples. It has also been shown to be highly effective with gastric and endometrial cancer samples, despite the fact that the present inventors were able to access and profil only a small number of these samples. The profiling of more non-CRC MSI-H samples strongly supports the applicability of a minimum core panel of two markers to a wider range of cancers. It is now apparent that the homopolymer in the ACVR2A gene is a particularly efficient and quite specific MSI marker for CRC. Therefore, for other types of cancer, other minimum core panels may be proposed and tested as an alternative embodiment of the present invention. From the preliminary data presented in this document, it appears that the following three panels can be proposed - out of 4 main markers: (1) DIDO1, SULF2, BTBD7 and SEC31A; (2) DIDO1, SULF2, BTBD7 and ACVR2A; and (3) DIDO1, SULF2, SEC31A and RYR3. Regardless of the types of MMR-deficient specimens, a panel of 5 major markers containing ACVR2A, DIDO1, MRE11, SULF2 and BTBD7 has been shown to be generally suitable for diagnosis in case of specimens of different origins and therefore constitutes a particularly attractive option. implementation of the present invention.

2. Новый набор из 7 вставок/делеций гомополимера для выявления MSI, ассоциированной с высокой мутационной нагрузкой опухоли и общей нагрузкой вставками/делециями, при раке эндометрия и колоректального рака2. A novel set of 7 insertion/deletion homopolymers to detect MSI associated with high tumor mutation load and total insertion/deletion load in endometrial and colorectal cancer

[0107] Предпосылки: блокирование контрольных точек иммунного ответа было ранее одобрено для лечения неоперабельных или метастатических опухолей с высокой микросателлитной нестабильностью (MSI-H) независимо от участка их локализации или гистологической характеристики. Наблюдаемый показатель ответа составил ~40%. В настоящее время отсутствует одобренный FDA тест для выявления статуса MSI. Опухоль с MSI-H характеризуется такими гистопатологическими характеристиками, как высокая инфильтрация лимфоцитами и высокая мутационная нагрузка опухоли. В частности, такие опухоли характеризуются высоким количеством мутаций типа «вставка/делеция», которые известны тем, что по сравнению с однонуклеотидными вариантами обуславливают сдвиг рамки считывания и, как следствие, приводят к избытку неоантигенов, которые являются высокоиммуногенными. Следовательно, высокий показатель вставок/делеций в опухолях с MSI-H может быть прогностическим фактором ответа на терапию антителом к PD1.[0107] BACKGROUND: Blocking of immune response checkpoints has been previously approved for the treatment of unresectable or metastatic tumors with high microsatellite instability (MSI-H) regardless of their site of localization or histological characteristics. The observed response rate was ~40%. There is currently no FDA-approved test to detect MSI status. A tumor with MSI-H is characterized by histopathological characteristics such as high lymphocyte infiltration and high tumor mutation load. In particular, such tumors are characterized by a high number of insertion/deletion mutations, which are known to cause a frameshift compared to single nucleotide variants and, as a result, lead to an excess of neoantigens, which are highly immunogenic. Therefore, a high insertion/deletion rate in MSI-H tumors may be a predictor of response to anti-PD1 antibody therapy.

[0108] Способы. Авторы настоящего изобретения выбрали опухоли с MSI и MSS, для которых данные полного секвенирования экзома были доступны из предыдущего сообщения авторов настоящего изобретения (Zhao et al., eLife 2014). Они включают 11 образцов рака эндометрия с MSI, 22 образца колоректального рака с MSI и 89 образцов с MSS. Затем авторы настоящего изобретения определяли стратифицированную мутационную нагрузку по замещениям и вставкам/делециям исходя из данных полного секвенирования экзома. Семь маркеров, описанных в данном документе, амплифицировали и проводили секвенирование ампликонов по парным концевым тегам с помощью Illumina HiSeq 4000. Ампликоны секвенировали при минимальном охвате 5000x и среднем охвате 87000x. Образцы с MSS использовали для расчета средней процентной доли ридов с делециями. Маркер считался положительным, если процентная доля мутантных ридов была больше 6 SD (что соответствует P-значению <1,0e-5). Ряд маркеров дали высокие показатели фоновых мутаций из-за проскальзывания полимеразы в гомополимерном участке. Эти показатели находились в диапазоне от 6,6% (для ACVR2A) до 36,0% (для BTBD7).[0108] Methods. The present inventors selected tumors with MSI and MSS for which whole exome sequencing data were available from a previous report by the present inventors (Zhao et al., eLife 2014). They include 11 endometrial cancer samples with MSI, 22 colorectal cancer samples with MSI, and 89 samples with MSS. The present inventors then determined the stratified mutation load by substitutions and insertions/deletions from the whole exome sequencing data. The seven markers described herein were amplified and amplicon sequencing of paired end tags was performed using an Illumina HiSeq 4000. Amplicons were sequenced at a minimum coverage of 5000x and an average coverage of 87000x. Samples with MSS were used to calculate the average percentage of reads with deletions. The marker was considered positive if the percentage of mutant reads was greater than 6 SD (corresponding to a P-value of <1.0e -5 ). A number of markers gave high rates of background mutations due to polymerase slippage in the homopolymeric region. These figures ranged from 6.6% (for ACVR2A) to 36.0% (for BTBD7).

[0109] Результаты. Девятнадцать опухолей с MSI-H были положительными по вставкам/делециям в по меньшей мере 2 из 6 маркерах, исходно подвергнутых скринингу, из-за технической сложности (показано на фиг. 5A), а затем полностью в 7 (показано на фиг. 5B) маркерах, тогда как опухоли с MSS не были положительными ни по одной из них. Дополнительно авторы настоящего изобретения определили корреляцию между количеством положительных вставок/делеций во всех доступных опухолях с MSI-H (n=19+14) с мутационной нагрузкой. Это выявило положительную корреляцию для как несинонимичной мутационной нагрузки, так и для мутационной нагрузки вставками/делециями (значения для всех 7 вставок/делеций взаимосвязаны: r=0,68, p<6,5e-05, и r=0,75, p<2e-16 соответственно). Что касается дополнительных маркеров вставок/делеций, которые были положительными, то авторы настоящего изобретения выявили повышение частоты мутаций вставок/делеций, составляющее 119 вставок/делеций, начиная с медианного показателя ~250 вставок/делеций на 3 положительных маркера. Результаты показаны на прилагаемых фигурах 3-6.[0109] Results. Nineteen tumors with MSI-H were positive for insertion/deletion in at least 2 of the 6 markers initially screened due to technical difficulty (shown in Fig. 5A) and then completely in 7 (shown in Fig. 5B) markers, while tumors with MSS were not positive for any of them. Additionally, the authors of the present invention determined the correlation between the number of positive insertions/deletions in all available tumors with MSI-H (n=19+14) with mutation load. This revealed a positive correlation for both non-synonymous mutation load and insertion/deletion mutation load (values for all 7 insertions/deletions are correlated: r=0.68, p<6.5e -05 , and r=0.75, p <2e -16 respectively). With regard to additional insertion/deletion markers that were positive, the present inventors found an increase in insertion/deletion mutation rate of 119 insertions/deletions starting from a median of ~250 insertions/deletions per 3 positive markers. The results are shown in the attached figures 3-6.

[0110] Вывод. Выборка из 7 вставок/делеций достоверно выявляет MSI-H в случае рака эндометрия и колоректального рака, в то время как количество положительных вставок/делеций служит в качестве показателя мутационной нагрузки опухоли, а также общей нагрузки опухоли вставками/делециями, и, таким образом, может использоваться в качестве теста нагрузки опухоли неоантигенами, которая является прогностическим фактором ответа опухолей с MSI-H на терапию в антителом к PD-1. Эти 7 маркеров будут доступны в качестве полностью автоматизированного MSI-теста Idylla™ для выявления статуса MSI и могут использоваться в качестве сопутствующей диагностики для прогнозирования исхода иммунотерапии опухолей с MSI-H.[0110] Conclusion. A sample of 7 inserts/deletions reliably detects MSI-H in endometrial and colorectal cancers, while the number of positive inserts/deletions serves as an indicator of tumor mutation load as well as total tumor load of inserts/deletions, and thus can be used as a tumor loading test with neoantigens, which is a predictor of the response of MSI-H tumors to anti-PD-1 antibody therapy. These 7 markers will be available as a fully automated Idylla™ MSI test to detect MSI status and can be used as a companion diagnostic to predict the outcome of tumor immunotherapy with MSI-H.

3. Обзор стадирования опухоли CRC, связанного с подходящими, неподходящими, ошибочными и несовпадающими результатами при MSI-тесте Idylla™ и IHC-анализе3. Overview of CRC Tumor Staging Associated with Pass, Fail, Mismatch, and Mismatch Results in Idylla™ MSI Test and IHC Analysis

[0111] Материалы. Исследование проводили с 330 оставшимися образцами FFPE, полученными в результате рутинной диагностики в двух университетских клиниках: в университетской клинике Орхуса (клиническая база 1) и университетской клинике Антверпена (клиническая база 2). Образцы получили от пациентов с CRC, и они являлись репрезентативными для всех стадий CRC, включая стадию I. Данные IHC по MSI были предоставлены обеими исследовательскими центрами, и они основывались на результатах IHC-анализа ретроспективных FFPE-срезов (ретроспективных гистопатологических данных) согласно стандарту клинической практики (SoC). В обеих клинических базах проводили тестирование на MSI с использованием MSI-теста Idylla™, включающего 7 маркеров, описанных в данном документе. Тесты проводили по месту нахождения обоих клинических баз на наборах из 150 и 180 образцов соответственно. В информационных целях определяли соответствие данных MSI-теста Idylla™ и ретроспективных данных иммуногистохимического (IHC) анализа MSI. Из 330 образцов информация о стадии была недоступна для 16 образцов (см. также таблицу на фигуре 7), и она основывалась на данных, доступных в отчете о гистопатологическом анализе. В ряде случаев результаты стадирования Опухоль, узлы и метастазы (TNM) (в соответствии с требованиями 7 редакции Американского объединенного комитета по онкологическим заболеваниям) были получены из параметров T и N только из-за ограниченности источника в отчете о гистопатологическом исследовании. В данном случае в исследуемой популяции 6,7% (N=22), 19,4% (N=64), 43,3% (N=143) и 25,8% (N=85) имели стадию I, стадию II, стадию III и стадию IV соответственно, что показано в первой колонке на фигуре 7.[0111] Materials. The study was carried out with 330 remaining FFPE samples obtained as a result of routine diagnostics in two university clinics: Aarhus University Hospital (Clinical Base 1) and Antwerp University Hospital (Clinical Base 2). Samples were obtained from patients with CRC and were representative of all stages of CRC, including stage I. IHC data for MSI were provided by both study centers and were based on the results of IHC analysis of retrospective FFPE sections (retrospective histopathological data) according to the clinical standard. practices (SoC). Both sites tested for MSI using the Idylla™ MSI test, which includes the 7 markers described in this document. The tests were performed at the location of both clinical sites on sets of 150 and 180 samples, respectively. For informational purposes, the correspondence between the Idylla™ MSI test data and retrospective MSI immunohistochemical (IHC) data was determined. Of the 330 samples, staging information was not available for 16 samples (see also the table in Figure 7) and was based on the data available in the histopathological analysis report. In a number of cases, Tumor, Nodules, and Metastases (TNM) staging results (according to the 7th edition of the American Joint Committee on Cancer) were derived from the T and N parameters only due to source limitations in the histopathological examination report. In this study population, 6.7% (N=22), 19.4% (N=64), 43.3% (N=143) and 25.8% (N=85) had stage I, stage II, stage III and stage IV, respectively, as shown in the first column in figure 7.

[0112] Способы. MSI-тест Idylla™ проводили с образцами FFPE автоматизированным способом с использованием разработанной Biocartis системы на основе картриджа и платформы Idylla™. Образцы FFPE помещали в отдельные картриджи, содержащие реагенты, описанные выше, после чего проводили технологические операции с картриджами и анализ с помощью автоматизированной платформы в соответствии с описанными выше протоколами. Затем результаты, полученные после проведения MSI-теста Idylla™, объединяли с оценкой статуса MSI FFPE-образцов, которые оценивали с помощью IHC. Недействительный результат для двух FFPE-образцов подтверждали посредством перекрестного тестирования с помощью системы анализа MSI Analysis System v 1.2, основанной на панели Bethesda Promega, в соответствии с утвержденным производителем протоколом.[0112] Methods. The Idylla™ MSI test was performed on FFPE samples in an automated manner using the Idylla™ cartridge and platform system developed by Biocartis. The FFPE samples were placed in separate cartridges containing the reagents described above, after which the cartridges were processed and analyzed using an automated platform in accordance with the protocols described above. The results from the Idylla™ MSI test were then combined with the MSI status of the FFPE samples, which were evaluated by IHC. The invalid result for the two FFPE samples was confirmed by cross-testing with the MSI Analysis System v 1.2 analysis system based on the Bethesda Promega panel, according to the manufacturer's approved protocol.

[0113] Результаты. Сравнение данных MSI-теста Idylla™ и ретроспективных данных иммуногистохимического анализа (IHC) MSI предоставлено только для информационных целей и показано на фигуре 7. Данные результаты показывают, что только два из в общей сложности 330 образцах были оценены как недействительные в MSI-тесте Idylla™, и что тест является надежным, поскольку во всех 330 проведенных тестах ошибки отсутствовали. Недействительность результата теста для двух образцов, вероятно, была обусловлена их низким качеством, что было подтверждено Promega MSI Analysis System v 1.2, которая также не смогла провести анализ указанных образцов (данные не показаны). Данные результаты в целом показывают надлежащее соответствие между результатами MSI-теста Idylla™ и результатами IHC-анализа. Важно отметить, что наряду с результатами IHC, MSI-тест Idylla™ также корректно идентифицировал фенотип MSI-H в двух образцах CRC стадии I. Это демонстрирует то, что для идентификации ранней стадии опухолей с MSI-H необходимо не только проводить тестирование на присутствие нарушений в пути MMR на уровне белка, но также можно выявлять сигнатуру микросателлитной нестабильности на уровне ДНК.[0113] Results. A comparison of Idylla™ MSI test data and MSI retrospective immunohistochemistry (IHC) data is provided for informational purposes only and is shown in Figure 7. These results indicate that only two of a total of 330 samples were scored as invalid in the Idylla™ MSI test. , and that the test is reliable because there were no errors in all 330 tests performed. The invalidity of the test result for two samples was probably due to their low quality, which was confirmed by Promega MSI Analysis System v 1.2, which also failed to analyze these samples (data not shown). These results generally show good agreement between the results of the Idylla™ MSI test and the results of the IHC assay. Importantly, along with the IHC results, the Idylla™ MSI test also correctly identified the MSI-H phenotype in two stage I CRC samples. in the MMR pathway at the protein level, but the signature of microsatellite instability at the DNA level can also be detected.

[0114] Вывод. Результаты подтвердили надежность способов анализа MSI в соответствии с настоящим изобретением и предоставили первое, насколько это известно авторам настоящего изобретения, клиническое доказательство того, что тест молекулярной сигнатуры MSI может корректно определить статус MSI-H при CRC стадии I. Это также указывает на то, что тест наиболее вероятно будет способен корректно идентифицировать статус MSI-H также при других типах рака стадии I. [0114] Output. The results confirmed the robustness of the MSI assay methods of the present invention and provided the first, to the present inventors' knowledge, clinical evidence that the MSI molecular signature test can correctly detect MSI-H status in stage I CRC. This also indicates that the test will most likely be able to correctly identify MSI-H status also in other types of stage I cancer.

ОпределенияDefinitions

[0115] Используемый в данном документе термин «биологический образец» или просто «образец» предназначен для включения ряда биологических источников, которые содержат нуклеиновую кислоту и/или клеточный материал, независимо от того, был он сразу получен из организма (т. е. свежий образец ткани) или законсервирован посредством любого способа, известного в данной области техники (например, замороженный образец или образец FFPE). Примеры биологических образцов включают культуры клеток, такие как клетки млекопитающих, а также клетки эукариотических организмов, биологические жидкости, осадки биологических жидкостей, образцы лаважа, образцы, полученные тонкоигольной аспирационной биопсией, биоптаты, образцы тканей, раковые клетки, другие типы клеток, полученные от пациента, клетки из культуры тканей или выращенные in vitro клетки от индивидуума, тестируемого в отношении заболевания или инфекции и/или проходящего лечение в отношении их, или образцы для криминалистического исследования. Неограничивающие примеры образцов биологической жидкости включают цельную кровь, костный мозг, цереброспинальную жидкость (CSF), перитонеальную жидкость, плевральную жидкость, лимфатическую жидкость, сыворотку крови, плазму крови, мочу, хилус, стул, эякулят, мокроту, аспират грудного соска, слюну, образцы мазков, жидкие образцы, полученные смывом или промыванием, и/или образцы, полученные с помощью щетки. [0115] As used herein, the term "biological sample" or simply "sample" is intended to include a range of biological sources that contain nucleic acid and/or cellular material, regardless of whether it was directly obtained from the body (i.e., fresh tissue sample) or preserved by any method known in the art (eg frozen sample or FFPE sample). Examples of biological specimens include cell cultures such as mammalian and eukaryotic cells, biological fluids, biological fluid pellets, lavage specimens, fine needle aspiration biopsy specimens, biopsy specimens, tissue specimens, cancer cells, other cell types obtained from a patient , tissue culture cells or in vitro grown cells from an individual being tested for and/or being treated for a disease or infection, or forensic samples. Non-limiting examples of body fluid samples include whole blood, bone marrow, cerebrospinal fluid (CSF), peritoneal fluid, pleural fluid, lymphatic fluid, serum, plasma, urine, chyle, stool, ejaculate, sputum, nipple aspirate, saliva, samples swabs, liquid samples obtained by flushing or rinsing, and/or samples obtained with a brush.

[0116] Используемый в данном документе термин «нуклеиновая кислота» и его эквивалент «полинуклеотид» означает полимер из рибонуклеотидов или дезоксирибонуклеотидов, связанных вместе фосфодиэфирными связями между нуклеотидными мономерами. (Дезокси)нуклеотиды являются фосфорилированными формами (дезокси)нуклеозидов, которые наиболее часто включают аденозин, гуанозин, цитидин, тимидин или уридин. Такие нуклеозиды состоят из сахара пентозы, представляющего собой рибозу или дезоксирибозу, и азотистого основания («нуклеинового основания» или просто «основания»), представляющего собой либо аденин, гуанин (которые относятся к пуринам), цитозин, тимин, либо урацил (которые относятся к пиримидинам). Последовательность, с которой такие основания (или их нуклеозиды, или нуклеотиды последних) расположены в нити нуклеиновой кислоты, называют «последовательностью нуклеиновой кислоты», и их традиционно приводят в направлении от так называемого 5'-конца к 3'-концу, ссылаясь на химическую ориентацию нити нуклеиновой кислоты. «5'» берет начало от 5'-углерода первого (дезокси)рибозного кольца, с которого начинается чтение последовательности нуклеиновой кислоты, и «3'» берет начало от 3'-углерода последнего (дезокси)рибозного кольца, на котором чтение последовательности нуклеиновой кислоты заканчивается. Последовательности нуклеиновой кислоты могут, например, представлять собой ATATGCC, что следует интерпретировать в данном документе как 5'-ATATGCC-3' последовательность нуклеиновой кислоты. По такому же правилу последняя последовательность будет комплементарна последовательности 5'-GGCATAT-3' или просто GGCATAT. Последовательность нуклеиновой кислоты может быть последовательностью гомополимерного повтора, т. е. последовательностью, полученной из определенного количества последовательных нуклеотидов, которые содержат одно и то же азотистое основание, которое также называют в данном документе «гомонуклеотидом». Например, термин «гомополимерный повтор, содержащий 8 последовательных аденинов» следует толковать как относящийся к по меньшей мере части нуклеиновой кислоты, при этом указанная часть состоит из цепи, содержащей 8 последовательных нуклеотидов, где каждый из указанных нуклеотидов содержит аденин в качестве азотистого основания. Такая последовательность будет обозначена как 5'-AAAAAAAA-3' (или просто AAAAAAAA), тогда как комплементарная ей последовательность будет обозначена как 5'-TTTTTTTT-3' (или TTTTTTTT). Термины «мутантная форма гомополимерного повтора» или «их мутантные формы» должны толковаться в данном документе как относящиеся к вариантам MSI указанного гомополимерного повтора, которые предусматривают вставку или делецию (то есть «вставкой/делецией») по меньшей мере одного гомонуклеотида. Например, мутантная форма гомополимерного повтора, содержащая 8 последовательных аденинов, будет гомополимерным повтором, содержащим 7 последовательных аденинов, или гомополимерным повтором, содержащим 9 последовательных аденинов. Нуклеиновые кислоты включают без ограничения ДНК и РНК, в том числе, например, геномную ДНК, митохондриальную или мтДНК, кДНК, мРНК, рРНК, тРНК, гетерогенную ядерную РНК, микроРНК, длинную некодирующую РНК, миРНК и их различные модифицированные варианты. Нуклеиновые кислоты, как правило, можно получить из природных источников, таких как биологические образцы, полученные от разных типов организмов. С другой стороны, нуклеиновые кислоты можно также синтезировать, получать с помощью рекомбинации или других любых из известных разработанных человеком способов (например, ПЦР).[0116] As used herein, the term "nucleic acid" and its equivalent "polynucleotide" means a polymer of ribonucleotides or deoxyribonucleotides linked together by phosphodiester bonds between nucleotide monomers. (Deoxy)nucleotides are phosphorylated forms of (deoxy)nucleosides which most commonly include adenosine, guanosine, cytidine, thymidine, or uridine. Such nucleosides are composed of a pentose sugar, which is either ribose or deoxyribose, and a nitrogenous base ("nucleic base" or simply "base"), which is either adenine, guanine (which are purines), cytosine, thymine, or uracil (which are to the pyrimidines). The sequence in which such bases (or their nucleosides, or the latter's nucleotides) are arranged in a nucleic acid strand is referred to as the "nucleic acid sequence", and they are traditionally given in the direction from the so-called 5' end to the 3' end, referring to the chemical orientation of the nucleic acid strand. "5'" originates from the 5'-carbon of the first (deoxy)ribose ring, from which the reading of the nucleic acid sequence begins, and "3'" originates from the 3'-carbon of the last (deoxy)ribose ring, from which the reading of the nucleic acid sequence acid ends. Nucleic acid sequences may, for example, be ATATGCC, which should be interpreted herein as a 5'-ATATGCC-3' nucleic acid sequence. By the same rule, the last sequence will be complementary to the sequence 5'-GGCATAT-3' or simply GGCATAT. The nucleic acid sequence may be a homopolymer repeat sequence, ie, a sequence derived from a certain number of consecutive nucleotides that contain the same nitrogenous base, also referred to herein as a "homonucleotide". For example, the term "homopolymer repeat containing 8 consecutive adenines" should be interpreted as referring to at least a portion of a nucleic acid, said portion consisting of a chain containing 8 consecutive nucleotides, where each of said nucleotides contains adenine as the nitrogenous base. Such a sequence will be designated as 5'-AAAAAAAA-3' (or simply AAAAAAAA), while its complementary sequence will be designated as 5'-TTTTTTTT-3' (or TTTTTTTT). The terms "mutant form of a homopolymer repeat" or "mutant forms thereof" are to be construed herein as referring to MSI variants of said homopolymer repeat that involve the insertion or deletion (i.e., "insert/deletion") of at least one homonucleotide. For example, a mutant form of a homopolymer repeat containing 8 consecutive adenines would be a homopolymer repeat containing 7 consecutive adenines or a homopolymer repeat containing 9 consecutive adenines. Nucleic acids include, without limitation, DNA and RNA, including, for example, genomic DNA, mitochondrial or mtDNA, cDNA, mRNA, rRNA, tRNA, heterogeneous nuclear RNA, microRNA, long non-coding RNA, miRNA, and various modified variants thereof. Nucleic acids can generally be obtained from natural sources, such as biological samples obtained from different types of organisms. On the other hand, nucleic acids can also be synthesized, produced by recombination, or by any of the known man-made methods (eg, PCR).

[0117] Термином «количественная ПЦР» или просто «qPCR» в данном документе определяется лабораторная методика, основанная на полимеразной цепной реакции (ПЦР), которую применяют для амплификации и одновременного выявления или количественной оценки целевой молекулы ДНК. В отличие от стандартной ПЦР, где продукт реакции выявляют при ее завершении, т. е. после окончания термоциклирования, ключевой характеристикой qPCR является то, что ДНК-продукт выявляют в ходе термоциклирования по мере прохождения реакции «в режиме реального времени»; поэтому альтернативным названием qPCR является «ПЦР в режиме реального времени». В настоящее время существует много разных типов qPCR. Например, если начинать со стадии обратной транскрипции (RT), то qPCR можно использовать для количественной оценки числа матричных РНК, и в таком случае ее называют qPCR с обратной транскрипцией или RT-qPCR. Используемые в данном документе термины «количественная ПЦР» или просто «qPCR» будут использоваться с предпочтением перед терминами «ПЦР в режиме реального времени» или «RT-PCR», чтобы избежать путаницы с «ПЦР с обратной транскрипцией», которую также часто сокращают как RT-PCR. В большинстве анализов qPCR используют одну из двух наиболее распространенных методик выявления продукта амплификации в режиме реального времени: (a) интеркаляцию неспецифических флуоресцентных красителей с любой двухнитевой ДНК или (b) использование специфичных в отношении последовательности ДНК-зондов, состоящих из олигонуклеотидов, которые мечены флуоресцентным репортером, который обеспечивает возможность выявления только после гибридизации зонда с комплементарной ему целевой последовательностью. Флуоресцентные сигналы, генерируемые в ходе термоциклирования, выявляют с помощью соответствующей оптической системы для выявления и отслеживают, начиная с того момента, когда они проходят фоновый пороговый уровень, и до тех пор, пока реакция не достигнет плато. Количество копий целевых последовательностей можно оценивать с помощью стратегий относительного или абсолютного количественного определения, обычно путем проведения анализа формы полученной кривой амплификации (стратегия стандартной кривой) или путем определения момента, когда сигнал превышает некоторое пороговое значение (часто называемое значением Ct, но иногда также значением Cp или значением Cq). При относительном количественном определении уровни целевой нуклеиновой кислоты, оцениваемые в конкретном образце с использованием Ct или анализа стандартной кривой, выражают относительно значений, полученных для той же мишени в другом референтном образце, например, необработанном контрольном образце. И наоборот, при абсолютном количественном определении сигнал qPCR сопоставляют с исходным количеством копий с использованием стандартной кривой, или его также можно вычислять в соответствии с более современной методикой цифровой ПЦР. В настоящее время первая стратегия по-прежнему является более употребительной, и она основана на оценке количества целевой ДНК путем сравнения полученных значений с предварительно построенной стандартной кривой. Эти и другие стратегии количественного определения qPCR широко известны в данной области техники, и характерное для них вычисление может различаться в большей или меньшей степени в зависимости от конкретного применения и системы qPCR. [0117] The term "quantitative PCR" or simply "qPCR" as used herein defines a polymerase chain reaction (PCR) based laboratory technique that is used to amplify and simultaneously detect or quantify a target DNA molecule. Unlike standard PCR, where the reaction product is detected at its completion, i.e. after the end of thermal cycling, the key characteristic of qPCR is that the DNA product is detected during thermal cycling as the reaction progresses "in real time"; therefore, the alternative name for qPCR is "real-time PCR". There are currently many different types of qPCR. For example, if starting from a reverse transcription (RT) step, then qPCR can be used to quantify the number of messenger RNAs, in which case it is called reverse transcription qPCR or RT-qPCR. As used herein, the terms "quantitative PCR" or simply "qPCR" will be used in preference to the terms "real-time PCR" or "RT-PCR" to avoid confusion with "reverse transcription PCR", which is also often abbreviated as RT-PCR. Most qPCR assays use one of the two most common real-time amplification product detection techniques: (a) intercalation of non-specific fluorescent dyes from any double-stranded DNA, or (b) use of sequence-specific DNA probes consisting of oligonucleotides that are fluorescently labeled. reporter, which provides the possibility of detection only after hybridization of the probe with its complementary target sequence. Fluorescent signals generated during thermal cycling are detected with an appropriate optical detection system and monitored from the moment they pass the background threshold until the reaction reaches a plateau. The copy number of target sequences can be estimated using either relative or absolute quantification strategies, usually by analyzing the shape of the resulting amplification curve (standard curve strategy) or by determining when the signal exceeds some threshold value (often called the Ct value, but sometimes also the Cp value). or the value of Cq). In relative quantitation, levels of target nucleic acid assessed in a particular sample using Ct or standard curve analysis are expressed relative to values obtained for the same target in another reference sample, such as an untreated control sample. Conversely, in absolute quantification, the qPCR signal is compared to the original number of copies using a standard curve, or it can also be calculated according to the more modern digital PCR technique. At present, the first strategy is still more common and is based on estimating the amount of target DNA by comparing the obtained values with a pre-built standard curve. These and other qPCR quantification strategies are well known in the art and their characteristic calculation may vary to a greater or lesser extent depending on the particular qPCR application and system.

[0118] Используемый в данном документе термин «средства для проведения количественной ПЦР» следует понимать как минимальную необходимую совокупность реагентов и элементов для проведения qPCR. Обычно они включают любые реагенты, обеспечивающие поддающееся выявлению при ПЦР в режиме реального времени термоциклирование матрицы, представляющую собой нуклеиновую кислоту, полученной из источника нуклеиновой кислоты. В зависимости от типа qPCR такие реагенты включают без ограничения полимеразу, предназначенную для ПЦР, по меньшей мере один набор праймеров, поддающийся выявлению краситель или зонд, dNTP, буфер для ПЦР и т. д. Кроме того, «средства для проведения количественной ПЦР» обычно также будут включать любую стандартную известную в данной области техники минимальную сборочную единицу из частей, которая обычно без ограничения включает следующее: (1) подходящий отсек (далее называемый «отсеком для термоциклирования в рамках qPCR»), где происходит поддающееся выявлению в режиме реального времени термоциклирование. Такие отсеки могут, например, быть образованы камерой, подходящей для амплификации нуклеиновых кислот, т. е. изготовленной из соответствующего материала и обеспечивающей возможность достаточной регуляции внутренней температуры, а также содержащей по меньшей мере одну перегородку, позволяющую выявлять в режиме реального времени сигналы, генерируемые в ходе такой амплификации, например, светопроницаемую перегородку. Кроме того, (2) средства для изменения температуры в данной камере или другом отсеке широко известны из различных существующих установок для термоциклирования. Затем (3) средства для выявления сигналов, генерируемых в ходе термоциклирования при qPCR, такие как оптический детектор, соединенный с компьютером и т. д. Если вкратце, то такая минимальная сборочная единица обычно будет включать любую известную в данной области техники систему или системы, способные к инициации и поддержанию реакции термоциклирования в отсеке для термоциклирования при qPCR, настраивая и регулируя температуру для обеспечения стабильных условий термоциклирования в нем и т. п. Кроме того, она также будет предусматривать любое соответствующее устройство или устройства для выявления, средства для обработки данных (например, компьютер, альтернативно соединенный с базой данных) и системы вывода, позволяющие считывать и контролировать термоциклирование в ходе реакции qPCR в режиме реального времени (с использованием компьютерного экрана, на котором отображается ход реакции в соответствующем графическом пользовательском интерфейсе). Дополнительно она также будет содержать любые пакеты программного обеспечения, подходящие для эксплуатации аппарата и/или отображения полученных результатов, и которые при необходимости содействуют их интерпретации. [0118] As used herein, the term "quantitative PCR tools" should be understood as the minimum required set of reagents and elements for qPCR. Typically, they include any reagents that allow real-time PCR detectable thermal cycling of a nucleic acid template derived from a source of nucleic acid. Depending on the type of qPCR, such reagents include, but are not limited to, PCR polymerase, at least one primer set, a detectable dye or probe, dNTP, PCR buffer, etc. In addition, "quantitative PCR tools" are usually will also include any standard minimum assembly of parts known in the art, which typically includes, without limitation, the following: (1) a suitable compartment (hereinafter referred to as "qPCR thermal cycling compartment") where real-time detectable thermal cycling occurs . Such compartments may, for example, be formed by a chamber suitable for nucleic acid amplification, i.e. made of an appropriate material and allowing sufficient regulation of the internal temperature, and also containing at least one partition, allowing real-time detection of signals generated by during such amplification, for example, a translucent septum. In addition, (2) means for changing the temperature in a given chamber or other compartment are widely known from various existing thermal cycling plants. Then (3) means for detecting the signals generated during qPCR thermal cycling, such as an optical detector connected to a computer, etc. In short, such a minimum assembly will usually include any system or systems known in the art, capable of initiating and maintaining a thermal cycling reaction in the qPCR thermal cycling compartment, adjusting and regulating the temperature to ensure stable thermal cycling conditions therein, etc. In addition, it will also provide for any appropriate device or devices for detection, means for data processing ( for example, a computer, alternatively connected to a database) and output systems that allow real-time reading and monitoring of thermal cycling during a qPCR reaction (using a computer screen displaying the progress of the reaction in an appropriate graphical user interface). In addition, it will also contain any software packages suitable for operating the apparatus and/or displaying the results obtained, and which, if necessary, assist in their interpretation.

[0119] Под используемым в данном документе термином «картридж» следует понимать замкнутую сборочную единицу из камер и/или каналов, которая сформирована в виде единого объекта, который можно переносить или передвигать как таковой, прикрепленный к внутренней или внешней части более крупного прибора, подходящего для приема такого картриджа или соединения с ним. Некоторые части, содержащиеся в картридже, могут быть прочно соединены, в то время как другие могут быть гибко соединены и могут перемещаться относительно других компонентов картриджа. Аналогично под используемым в данном документе термином «струйный картридж» следует понимать картридж, включающий по меньшей мере одну камеру или один канал, подходящие для обработки, подготовки, выпуска или осуществления анализа текучей среды, предпочтительно жидкости. Пример такого картриджа представлен в WO2007004103. Предпочтительно струйный картридж может представлять собой микроструйный картридж. В контексте струйных картриджей выражения «выше» и «ниже» могут быть определены как относящиеся к направлению, в котором текучие среды текут в таком картридже. А именно, отрезок струйного пути в картридже, из которого текучая среда течет перетекает во второй отрезок в том же картридже, следует интерпретировать как установленный выше в отношении последнего. Аналогично отрезок, к которому текучая среда прибывает позже, расположен ниже отрезка, который пройден указанной текучей средой ранее.[0119] As used herein, the term "cartridge" should be understood as a closed assembly of chambers and / or channels, which is formed as a single object that can be carried or moved as such, attached to the inside or outside of a larger device, suitable to receive or connect to such a cartridge. Some parts contained in the cartridge may be firmly connected, while others may be flexibly connected and move relative to other components of the cartridge. Similarly, the term "inkjet cartridge" as used herein should be understood to mean a cartridge that includes at least one chamber or one channel suitable for processing, preparing, discharging, or analyzing a fluid, preferably a liquid. An example of such a cartridge is presented in WO2007004103. Preferably, the inkjet cartridge may be a microjet cartridge. In the context of inkjet cartridges, the terms "above" and "below" may be defined as referring to the direction in which fluids flow in such a cartridge. Namely, the section of the jet path in the cartridge, from which the fluid flows into the second section in the same cartridge, should be interpreted as established above in relation to the latter. Similarly, the segment to which the fluid arrives later is located below the segment that was passed by the specified fluid earlier.

[0120] В целом используемые в данном документе термины «струйный» или иногда «микроструйный» относятся к системам и конструкциям, имеющим отношение к характеру, контролю и манипулированию в отношении текучих сред, которые геометрически ограничены в маленьком, обычно меньше миллиметра, масштабе в по меньшей мере одном или двух измерениях (например, ширина и высота или канал). Такие малообъемные текучие среды перемещают, смешивают, разделяют или иным образом обрабатывают в микромасштабе, требующем малого размера и низкого потребления энергии. Микроструйные системы включают такие структуры, как микропневматические системы (источники давления, насосы для перекачки жидкостей, микроклапаны и т. д.) и микроструйные структуры для манипуляций в микро-, нано- и пиколитровых объемах (микроструйные каналы и т. д.). Иллюстративные струйные системы были описаны в EP1896180, EP1904234 и EP2419705, и, соответственно, могут использоваться в определенных вариантах осуществления представленного в данном документе изобретения.[0120] As used herein generally, the terms "fluidic" or sometimes "microfluidic" refer to systems and structures related to the character, control, and manipulation of fluids that are geometrically constrained on a small, typically less than a millimeter, scale of at least one or two dimensions (eg width and height or channel). Such low volume fluids are moved, mixed, separated, or otherwise processed on a micro scale requiring small size and low energy consumption. Microfluidic systems include structures such as micropneumatic systems (pressure sources, fluid pumps, microvalves, etc.) and microfluidic structures for manipulations in micro-, nano-, and picoliter volumes (microfluidic channels, etc.). Exemplary inkjet systems have been described in EP1896180, EP1904234, and EP2419705 and, accordingly, may be used in certain embodiments of the invention presented herein.

[0121] Применяемый в данном документе термин «DWT» обозначает дискретное вейвлет-преобразование; термин «коэффициент dwt» обозначает коэффициент дискретного вейвлет-преобразования. Вейвлет-преобразование означает расчет с применением программы или подпрограммы с использованием исходных данных. Таким образом, набор коэффициентов dwt представляет собой преобразованный с помощью вейвлет-преобразования набор величин. Наиболее подходящими коэффициентами dwt для анализа нуклеиновой кислоты являются те коэффициенты, которые охватывают значимые события эксперимента, например, в случае эксперимента с плавлением молекулы двухнитевой нуклеиновой кислоты наиболее подходящими коэффициентами dwt могут быть пики или сдвиги пиков в исходных данных кривой плавления. [0121] As used herein, the term "DWT" refers to the discrete wavelet transform; the term "coefficient dwt" denotes the coefficient of the discrete wavelet transform. Wavelet transform means a calculation using a program or subroutine using the original data. Thus, the set of coefficients dwt is a set of values transformed using the wavelet transform. The most appropriate dwt coefficients for nucleic acid analysis are those coefficients that capture the significant events of the experiment, for example, in the case of a double-stranded nucleic acid molecule melt experiment, the most appropriate dwt coefficients may be peaks or peak shifts in the original melt curve data.

[0122] Применяемые в данном документе термины «исходные данные кривой плавления», «исходные данные по кривой плавления» и «исходные данные для кривой плавления» эквивалентны и используются взаимозаменяемо. Они обозначают характеристики, полученные в результате экспериментов по диссоциации или ассоциации нуклеиновых кислот. [0122] As used herein, the terms "melt curve baseline", "melt curve baseline", and "melt curve baseline" are equivalent and are used interchangeably. They denote characteristics obtained from experiments on the dissociation or association of nucleic acids.

--->--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ SEQUENCE LIST

<110> Биокартис НВ<110> Biokartis NV

<120> ПАНЕЛЬ БИОМАРКЕРОВ И СПОСОБЫ ВЫЯВЛЕНИЯ МИКРОСАТЕЛЛИТНОЙ НЕСТАБИЛЬНОСТИ<120> BIOMARKER PANEL AND METHODS FOR DETECTION OF MICROSATELLITE INSTABILITY

ПРИ РАЗНЫХ ВИДАХ РАКА FOR DIFFERENT TYPES OF CANCER

<130> BCT-094<130> BCT-094

<150> EP18168304.6<150>EP18168304.6

<151> 2018-04-19<151> 2018-04-19

<150> EP18153059.9<150>EP18153059.9

<151> 2018-01-23<151> 2018-01-23

<160> 21<160> 21

<170> BiSSAP 1.3.6<170> BiSSAP 1.3.6

<210> 1<210> 1

<211> 19<211> 19

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 1<400> 1

tagcgtgtga atcggacat 19tagcgtgtga atcggacat 19

<210> 2<210> 2

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 2<400> 2

ttgactgggc agatagggga 20ttgactggggc agatagggga 20

<210> 3<210> 3

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 3<400> 3

atagttcacc catggaaacc 20atagttcacc catggaaacc 20

<210> 4<210> 4

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 4<400> 4

ggaggagaat cttagggaaa 20ggaggagaat cttagggaaa 20

<210> 5<210> 5

<211> 16<211> 16

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 5<400> 5

actggactcc cgctgg 16actggactcc cgctgg 16

<210> 6<210> 6

<211> 19<211> 19

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 6<400> 6

cgctcagcct ccataaatc 19cgctcagcct ccataaatc 19

<210> 7<210> 7

<211> 25<211> 25

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 7<400> 7

caacttcatt tcttttcagt acctt 25caacttcatt tcttttcagt acctt 25

<210> 8<210> 8

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 8<400> 8

ctgtccagat accatttctc 20ctgtccagat accatttctc 20

<210> 9<210> 9

<211> 22<211> 22

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 9<400> 9

agcatccatc tcttgaagac at 22agcatccatc tcttgaagac at 22

<210> 10<210> 10

<211> 23<211> 23

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 10<400> 10

gcatgtttct gccaataatc tct 23gcatgtttct gccaataatc tct 23

<210> 11<210> 11

<211> 17<211> 17

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 11<400> 11

caacttcagc aggctgt 17caacttcagc aggctgt 17

<210> 12<210> 12

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 12<400> 12

agtctgagaa gcatcaattt t 21agtctgagaa gcatcaattt t 21

<210> 13<210> 13

<211> 24<211> 24

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 13<400> 13

cattttctaa atgcctccct taaa 24cattttctaa atgcctccct taaa 24

<210> 14<210> 14

<211> 19<211> 19

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 14<400> 14

gtccattagg cacaaaaag 19gtccattagg cacaaaaag 19

<210> 15<210> 15

<211> 34<211> 34

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Синтетическая ДНК<223> Synthetic DNA

<400> 15<400> 15

cgcacgacat ggaaaaaaaa aatccgtgcg taaa 34cgcacgacat ggaaaaaaaa aatccgtgcg taaa 34

<210> 16<210> 16

<211> 33<211> 33

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Синтетическая последовательность<223> Synthetic sequence

<400> 16<400> 16

cgtcgaacct taaaaaaaaa agttaccgac gaa 33cgtcgaacct taaaaaaaaa agttaccgac gaa 33

<210> 17<210> 17

<211> 36<211> 36

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Синтетическая ДНК<223> Synthetic DNA

<400> 17<400> 17

cgcacgactt attaaaaaaa aatgacagtg cgtaaa 36cgcacgactt attaaaaaaa aatgacagtg cgtaaa 36

<210> 18<210> 18

<211> 33<211> 33

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Синтетическая ДНК<223> Synthetic DNA

<400> 18<400> 18

cgtcggtacc ttaaaaaaaa acatcacgac gaa 33cgtcggtacc ttaaaaaaaa acatcacgac gaa 33

<210> 19<210> 19

<211> 23<211> 23

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Синтетическая ДНК<223> Synthetic DNA

<400> 19<400> 19

gtgcataaaa aaagagcact aaa 23gtgcataaaa aaagagcact aaa 23

<210> 20<210> 20

<211> 33<211> 33

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Синтетическая ДНК<223> Synthetic DNA

<400> 20<400> 20

cgcacttgcc aaaaaaaatt gatggtgcgt aaa 33cgcacttgcc aaaaaaaatt gatggtgcgt aaa 33

<210> 21<210> 21

<211> 30<211> 30

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Синтетическая ДНК<223> Synthetic DNA

<400> 21<400> 21

cgtcgccctt aaaaaaaaac tgccgacgaa 30cgtcgccctt aaaaaaaaac tgccgacgaa 30

<---<---

Claims (58)

1. Панель биомаркеров для анализа локусов MSI в биологическом образце колоректальной опухоли, опухоли эндометрия или желудка, при этом панель содержит следующие участки гомополимерных повторов, которые картированы на референтный геном человека GRCh38/hg38:1. Panel of biomarkers for the analysis of MSI loci in a biological sample of a colorectal tumor, endometrial tumor or stomach, while the panel contains the following sections of homopolymer repeats that are mapped to the reference human genome GRCh38/hg38: гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене DIDO1 человека и начинающийся с положения chr20:62905340;a homopolymer repeat containing 11 consecutive adenines located in the human DIDO1 gene and starting at position chr20:62905340; гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене MRE11 человека и начинающийся с положения chr11:94479765;homopolymer repeat containing 11 consecutive adenines, localized in the human MRE11 gene and starting at position chr11:94479765; гомополимерный повтор, содержащий 10 последовательных аденинов, локализованный в гене SULF2 человека и начинающийся с положения chr20:47657577; иa homopolymer repeat containing 10 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577; And гомополимерный повтор, содержащий 8 последовательных аденинов, локализованный в гене ACVR2A человека и начинающийся с положения chr2:147926117.homopolymer repeat containing 8 consecutive adenines, localized in the human ACVR2A gene and starting at position chr2:147926117. 2. Панель по п. 1, дополнительно содержащая любой один, два или все из следующих участков гомополимерных повторов, которые картированы на референтный геном человека GRCh38/hg38:2. The panel of claim 1, further comprising any one, two, or all of the following homopolymer repeat regions that are mapped to the GRCh38/hg38 human reference genome: гомополимерного повтора, содержащего 9 последовательных тиминов, локализованного в гене SEC31A человека и начинающегося с положения chr4:82864412;a homopolymer repeat containing 9 consecutive thymines located in the human SEC31A gene and starting at position chr4:82864412; гомополимерного повтора, содержащего 10 последовательных аденинов, локализованного в гене BTBD7 человека и начинающегося с положения chr14:93241685;a homopolymer repeat containing 10 consecutive adenines located in the human BTBD7 gene and starting at position chr14:93241685; гомополимерного повтора, содержащего 10 последовательных аденинов, локализованного в гене RYR3 человека и начинающегося с положения chr15:33865341.homopolymer repeat containing 10 consecutive adenines, localized in the human RYR3 gene and starting at position chr15:33865341. 3. Способ анализа локусов MSI в биологическом образце колоректальной опухоли, опухоли эндометрия или желудка, предусматривающий стадии:3. A method for analyzing MSI loci in a biological sample of a colorectal tumor, an endometrial tumor or a stomach tumor, comprising the steps: - амплифицирования участков нуклеиновой кислоты, содержащих гомополимерные повторы, которые картированы на референтный геном человека GRCh38/hg38:- amplification of nucleic acid regions containing homopolymer repeats that are mapped to the reference human genome GRCh38/hg38: гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене DIDO1 человека и начинающийся с положения chr20:62905340;a homopolymer repeat containing 11 consecutive adenines located in the human DIDO1 gene and starting at position chr20:62905340; гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене MRE11 человека и начинающийся с положения chr11:94479765;homopolymer repeat containing 11 consecutive adenines, localized in the human MRE11 gene and starting at position chr11:94479765; гомополимерный повтор, содержащий 10 последовательных аденинов, локализованный в гене SULF2 человека и начинающийся с положения chr20:47657577; иa homopolymer repeat containing 10 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577; And гомополимерный повтор, содержащий 8 последовательных аденинов, локализованный в гене ACVR2A человека и начинающийся с положения chr2:147926117; иhomopolymer repeat containing 8 consecutive adenines, localized in the human ACVR2A gene and starting at position chr2:147926117; And - определения количества нуклеотидов в указанных гомополимерных повторах.- determining the number of nucleotides in these homopolymer repeats. 4. Способ по п. 3, дополнительно предусматривающий определение количества нуклеотидов в любом одном, двух или всех из следующих участков гомополимерных повторов, которые картированы на GRCh38/hg38:4. The method of claim 3, further comprising determining the number of nucleotides in any one, two or all of the following regions of homopolymer repeats that are mapped to GRCh38/hg38: гомополимерного повтора, содержащего 9 последовательных тиминов, локализованного в гене SEC31A человека и начинающегося с положения chr4:82864412;a homopolymer repeat containing 9 consecutive thymines located in the human SEC31A gene and starting at position chr4:82864412; гомополимерного повтора, содержащего 10 последовательных аденинов, локализованного в гене BTBD7 человека и начинающегося с положения chr14:93241685;a homopolymer repeat containing 10 consecutive adenines located in the human BTBD7 gene and starting at position chr14:93241685; гомополимерного повтора, содержащего 10 последовательных аденинов, локализованного в гене RYR3 человека и начинающегося с положения chr15:33865341.homopolymer repeat containing 10 consecutive adenines, localized in the human RYR3 gene and starting at position chr15:33865341. 5. Способ по любому из пп. 3, 4, где результатом стадии амплифицирования является получение данных кривой плавления.5. The method according to any one of paragraphs. 3, 4, where the result of the amplification step is to obtain melting curve data. 6. Способ по п. 5, дополнительно предусматривающий стадии:6. The method according to claim 5, further comprising the steps of: (a) применения вейвлет-преобразования в отношении данных кривой плавления и(a) applying a wavelet transform to the melt curve data, and (b) применения результатов, полученных на (а), в определении количества нуклеотидов в любом из гомополимерных повторов, перечисленных в пп. 3-4.(b) applying the results obtained in (a) in determining the number of nucleotides in any of the homopolymer repeats listed in paragraphs. 3-4. 7. Способ по любому из пп. 3-6, где стадия амплифицирования предусматривает применение по меньшей мере одного зонда типа «молекулярный маяк», где зонд типа «молекулярный маяк» выбран из SEQ ID NO: 15-21. 7. The method according to any one of paragraphs. 3-6 wherein the amplification step involves the use of at least one molecular beacon probe, where the molecular beacon probe is selected from SEQ ID NOs: 15-21. 8. Способ по любому из пп. 3-7, где стадия амплифицирования предусматривает применение по меньшей мере одного праймера, имеющего последовательность, идентифицированную с помощью любого из следующих SEQ ID NO: 1-14.8. The method according to any one of paragraphs. 3-7, wherein the amplification step involves the use of at least one primer having the sequence identified by any of the following SEQ ID NOs: 1-14. 9. Способ по любому из пп. 3-8, где стадия амплифицирования предусматривает по меньшей мере одну дуплексную амплификацию пары гомополимерных повторов, при этом указанная пара выбрана из следующих комбинаций:9. The method according to any one of paragraphs. 3-8, where the amplification step involves at least one duplex amplification of a pair of homopolymer repeats, said pair being selected from the following combinations: - дуплексной амплификации гомополимерного повтора, содержащего 11 последовательных аденинов, локализованного в гене DIDO1 человека и начинающегося с положения chr20:62905340, вместе с гомополимерным повтором, содержащим 11 последовательных аденинов, локализованным в гене MRE11 человека и начинающимся с положения chr11:94479765;- duplex amplification of a homopolymer repeat containing 11 consecutive adenines located in the human DIDO1 gene and starting at position chr20:62905340, together with a homopolymer repeat containing 11 consecutive adenines located in the human MRE11 gene and starting at position chr11:94479765; - дуплексной амплификации гомополимерного повтора, содержащего 8 последовательных аденинов, локализованного в гене ACVR2A человека и начинающегося с положения chr2:147926117, вместе с гомополимерным повтором, содержащим 9 последовательных тиминов, локализованным в гене SEC31A человека и начинающимся с положения chr4:82864412; и- duplex amplification of a homopolymer repeat containing 8 consecutive adenines located in the human ACVR2A gene and starting at position chr2:147926117, together with a homopolymer repeat containing 9 consecutive thymines located in the human SEC31A gene and starting at position chr4:82864412; And - дуплексной амплификации гомополимерного повтора, содержащего 10 последовательных аденинов, локализованного в гене BTBD7 человека и начинающегося с положения chr14:93241685, вместе с гомополимерным повтором, содержащим 10 последовательных аденинов, локализованным в гене SULF2 человека и начинающимся с положения chr20:47657577.- duplex amplification of a homopolymer repeat containing 10 consecutive adenines located in the human BTBD7 gene and starting at position chr14:93241685, together with a homopolymer repeat containing 10 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577. 10. Способ по любому из пп. 3-9, где определение количества нуклеотидов в любом из гомополимерных повторов, перечисленных в пп. 3-4, также дополнительно выполняют в контрольном биологическом образце, содержащем материал, полученный из клеточной линии НТС116 c1.110268743.10. The method according to any one of paragraphs. 3-9, where the determination of the number of nucleotides in any of the homopolymer repeats listed in paragraphs. 3-4 are also additionally performed in a control biological sample containing material derived from the cell line HTC116 c1.110268743. 11. Способ по любому из пп. 3-10, где образец опухоли представляет собой опухоль I стадии, предпочтительно представляющую собой колоректальную опухоль I стадии.11. The method according to any one of paragraphs. 3-10, wherein the tumor sample is a stage I tumor, preferably a stage I colorectal tumor. 12. Способ по любому из пп. 3-11, дополнительно предусматривающий стадию применения полученной информации о количестве гомополимерных повторов для установления мутационной нагрузки опухоли или нагрузки опухоли вставками/делециями.12. The method according to any one of paragraphs. 3-11, further comprising the step of using the obtained information about the number of homopolymer repeats to establish the mutation load of the tumor or the tumor load of insertions/deletions. 13. Способ по п. 12, где установленная мутационная нагрузка опухоли или нагрузка опухоли вставками/делециями представлена в виде оценки общего количества мутаций или представлена в виде балльной оценки.13. The method of claim 12, wherein the established tumor mutation load or insertion/deletion tumor load is presented as an estimate of the total number of mutations or is presented as a score. 14. Способ по любому из пп. 3-13, дополнительно предусматривающий стадию применения полученной информации о количестве гомополимерных повторов, или о мутационной нагрузке опухоли, или о нагрузке опухоли вставками/делециями, или об оценке общего количества мутаций, или о балльной оценке для принятия решения о проведении иммунотерапии у субъекта, от которого получен биологический образец.14. The method according to any one of paragraphs. 3-13, further comprising the step of applying the obtained information on the number of homopolymer repeats, or on the mutational burden of the tumor, or on the burden of the tumor with insertions/deletions, or on the assessment of the total number of mutations, or on the scoring to decide whether to conduct immunotherapy in the subject, from from which the biological sample was obtained. 15. Набор для анализа локусов MSI в биологическом образце колоректальной опухоли, опухоли эндометрия или желудка, при этом набор содержит праймеры или зонды, выполненные с возможностью специфически гибридизироваться с участками нуклеиновой кислоты или амплифицировать их, при этом участки нуклеиновой кислоты содержат следующие участки гомополимерных повторов, которые картированы на референтный геном человека GRCh38/hg38:15. A kit for the analysis of MSI loci in a biological sample of a colorectal tumor, an endometrial tumor or a stomach, while the kit contains primers or probes made with the ability to specifically hybridize with nucleic acid regions or amplify them, while the nucleic acid regions contain the following homopolymer repeat regions, which are mapped to the reference human genome GRCh38/hg38: гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене DIDO1 человека и начинающийся с положения chr20:62905340;a homopolymer repeat containing 11 consecutive adenines located in the human DIDO1 gene and starting at position chr20:62905340; гомополимерный повтор, содержащий 11 последовательных аденинов, локализованный в гене MRE11 человека и начинающийся с положения chr11:94479765;homopolymer repeat containing 11 consecutive adenines, localized in the human MRE11 gene and starting at position chr11:94479765; гомополимерный повтор, содержащий 10 последовательных аденинов, локализованный в гене SULF2 человека и начинающийся с положения chr20:47657577; иa homopolymer repeat containing 10 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577; And гомополимерный повтор, содержащий 8 последовательных аденинов, локализованный в гене ACVR2A человека и начинающийся с положения chr2:147926117.homopolymer repeat containing 8 consecutive adenines, localized in the human ACVR2A gene and starting at position chr2:147926117. 16. Набор по п. 15, дополнительно содержащий праймеры или зонды, выполненные с возможностью специфически гибридизироваться с участками нуклеиновой кислоты или амплифицировать их, при этом участки нуклеиновой кислоты содержат один, два или все из следующих гомополимерных повторов, которые картированы на референтный геном человека GRCh38/hg38:16. The kit according to claim 15, further comprising primers or probes configured to specifically hybridize to or amplify nucleic acid regions, wherein the nucleic acid regions contain one, two, or all of the following homopolymer repeats that are mapped to the reference human genome GRCh38 /hg38: гомополимерного повтора, содержащего 9 последовательных тиминов, локализованного в гене SEC31A человека и начинающегося с положения chr4:82864412;a homopolymer repeat containing 9 consecutive thymines located in the human SEC31A gene and starting at position chr4:82864412; гомополимерного повтора, содержащего 10 последовательных аденинов, локализованного в гене BTBD7 человека и начинающегося с положения chr14:93241685;a homopolymer repeat containing 10 consecutive adenines located in the human BTBD7 gene and starting at position chr14:93241685; гомополимерного повтора, содержащего 10 последовательных аденинов, локализованного в гене RYR3 человека и начинающегося с положения chr15:33865341.homopolymer repeat containing 10 consecutive adenines, localized in the human RYR3 gene and starting at position chr15:33865341. 17. Набор по п. 15 или 16, где праймеры содержат по меньшей мере один праймер или пару праймеров, выбранных из SEQ ID NO: 14.17. The kit according to claim 15 or 16, where the primers contain at least one primer or a pair of primers selected from SEQ ID NO: 14. 18. Набор по п. 15 или 16, где зонды содержат зонд типа «молекулярный маяк».18. A kit according to claim 15 or 16, wherein the probes comprise a molecular beacon probe. 19. Набор по п. 18, где зонд типа «молекулярный маяк» выбран из SEQ ID NO: 15-21.19. The kit of claim 18 wherein the molecular beacon probe is selected from SEQ ID NOs: 15-21. 20. Набор по любому из пп. 15-19, дополнительно содержащий материал, полученный из клеточной линии НТС116 c1.110268743.20. Set according to any one of paragraphs. 15-19, additionally containing material derived from the cell line HTC116 c1.110268743. 21. Набор по любому из пп. 15-20, дополнительно содержащий картридж.21. Set according to any one of paragraphs. 15-20 further comprising a cartridge. 22. Клетка, полученная из клеточной линии НТС116 c1.110268743, для применения в качестве контрольного биологического образца в способе по любому из пп. 3-14, содержащая участки нуклеиновой кислоты, содержащие следующие участки гомополимерных повторов, которые картированы на референтный геном человека GRCh38/hg38:22. A cell derived from the cell line HTC116 c1.110268743, for use as a control biological sample in the method according to any one of paragraphs. 3-14 containing nucleic acid regions containing the following regions of homopolymer repeats that are mapped to the reference human genome GRCh38/hg38: гомополимерный повтор, содержащий 10 последовательных аденинов, локализованный в гене DIDO1 человека и начинающийся с положения chr20:62905340;a homopolymer repeat containing 10 consecutive adenines located in the human DIDO1 gene and starting at position chr20:62905340; гомополимерный повтор, содержащий 10 последовательных аденинов, локализованный в гене MRE11 человека и начинающийся с положения chr11:94479765;a homopolymer repeat containing 10 consecutive adenines located in the human MRE11 gene and starting at position chr11:94479765; гомополимерный повтор, содержащий 9 последовательных аденинов, локализованный в гене SULF2 человека и начинающийся с положения chr20:47657577; иa homopolymer repeat containing 9 consecutive adenines located in the human SULF2 gene and starting at position chr20:47657577; And гомополимерный повтор, содержащий 7 последовательных аденинов, локализованный в гене ACVR2A человека и начинающийся с положения chr2:147926117.homopolymer repeat containing 7 consecutive adenines, localized in the human ACVR2A gene and starting at position chr2:147926117. 23. Клетка по п. 22, дополнительно содержащая участки нуклеиновой кислоты, содержащие один, два или все из следующих участков гомополимерных повторов, которые картированы на референтный геном человека GRCh38/hg38:23. A cell according to claim 22, additionally containing nucleic acid regions containing one, two or all of the following homopolymer repeat regions that are mapped to the reference human genome GRCh38/hg38: гомополимерного повтора, содержащего 8 последовательных тиминов, локализованного в гене SEC31A человека и начинающегося с положения chr4:82864412;a homopolymer repeat containing 8 consecutive thymines located in the human SEC31A gene and starting at position chr4:82864412; гомополимерного повтора, содержащего 9 последовательных аденинов, локализованного в гене BTBD7 человека и начинающегося с положения chr14:93241685;a homopolymer repeat containing 9 consecutive adenines located in the human BTBD7 gene and starting at position chr14:93241685; гомополимерного повтора, содержащего 9 последовательных аденинов, локализованного в гене RYR3 человека и начинающегося с положения chr15:33865341.homopolymer repeat containing 9 consecutive adenines, localized in the human RYR3 gene and starting at position chr15:33865341.
RU2020127293A 2018-01-23 2019-01-22 Biomarker panel and methods for detecting microsatellite instability in various types of cancer RU2795410C9 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP18153056.9A EP3514247B1 (en) 2018-01-23 2018-01-23 Biomarker panel and methods for detecting microsatellite instability in cancers
EP18153056.9 2018-01-23
EP18168304 2018-04-19
EP18168304.6 2018-04-19
PCT/EP2019/051515 WO2019145306A1 (en) 2018-01-23 2019-01-22 Biomarker panel and methods for detecting microsatellite instability in cancers

Publications (4)

Publication Number Publication Date
RU2020127293A3 RU2020127293A3 (en) 2022-02-24
RU2020127293A RU2020127293A (en) 2022-02-24
RU2795410C2 true RU2795410C2 (en) 2023-05-03
RU2795410C9 RU2795410C9 (en) 2023-06-02

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013153130A1 (en) * 2012-04-10 2013-10-17 Vib Vzw Novel markers for detecting microsatellite instability in cancer and determining synthetic lethality with inhibition of the dna base excision repair pathway
RU2765410C2 (en) * 2016-11-30 2022-01-28 Онкомед Фармасьютикалс, Инк. Methods for treating cancer, including tigit-binding agents

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013153130A1 (en) * 2012-04-10 2013-10-17 Vib Vzw Novel markers for detecting microsatellite instability in cancer and determining synthetic lethality with inhibition of the dna base excision repair pathway
RU2765410C2 (en) * 2016-11-30 2022-01-28 Онкомед Фармасьютикалс, Инк. Methods for treating cancer, including tigit-binding agents

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YOSEF E MARUVKA et al. Analysis of somatic microsatellite indels identifies driver events in human tumors, NATURBIOTECHNOLOGY, vol. 35, no. 10,11 September 2017 (2017-09-11), pages 951-959, XP055481846,;ISSN: 1087-0156, DOI: 10.1038/nbt.3966. *

Similar Documents

Publication Publication Date Title
CN111868262B (en) Biomarker panel and method for detecting microsatellite instability in cancer
EP2569453B1 (en) Nucleic acid isolation methods
CA2786696C (en) Oligonucleotides and methods for detecting pik3ca mutations
JP2007509613A (en) QRT-PCR assay system for gene expression profiling
RU2730622C2 (en) Improved detection of short homopolymeric repeats
JP2018520706A (en) Automation from sampling to NGS library preparation
Li et al. The cornerstone of integrating circulating tumor DNA into cancer management
EP3514247B1 (en) Biomarker panel and methods for detecting microsatellite instability in cancers
RU2795410C2 (en) Biomarker panel and methods for detecting microsatellite instability in various types of cancer
RU2795410C9 (en) Biomarker panel and methods for detecting microsatellite instability in various types of cancer
WO2016210147A1 (en) Egfr assay
CN113462783B (en) Brain glioma chromosome lp/19q detection method based on MassArray nucleic acid mass spectrum and application thereof
EP3325697B1 (en) Optimized clinical sample sequencing
WO2019084998A1 (en) Kit for detecting kras, nras, or braf gene mutation
EP1563097A2 (en) Sampling method and apparatus for amplification reaction analysis
Deharvengt et al. Molecular assessment of human diseases in the clinical laboratory
CN113930501A (en) Digital PCR detection method for human EGFR gene mutation and application
US20050089875A1 (en) Quantitative analysis of expression profiling information produced at various stages of an amplification process
CN113913514A (en) Digital PCR detection method for human CTNNB1 gene mutation and application thereof
CN110551815A (en) Kit for detecting human Ras gene mutation and using method thereof
Sykes et al. dPCR-digital Polymerase Chain Reaction (3)