RU2779946C2 - Individualized anti-tumor vaccines - Google Patents

Individualized anti-tumor vaccines Download PDF

Info

Publication number
RU2779946C2
RU2779946C2 RU2017133613A RU2017133613A RU2779946C2 RU 2779946 C2 RU2779946 C2 RU 2779946C2 RU 2017133613 A RU2017133613 A RU 2017133613A RU 2017133613 A RU2017133613 A RU 2017133613A RU 2779946 C2 RU2779946 C2 RU 2779946C2
Authority
RU
Russia
Prior art keywords
cancer
cells
mutations
tumor
rna
Prior art date
Application number
RU2017133613A
Other languages
Russian (ru)
Other versions
RU2017133613A (en
RU2017133613A3 (en
Inventor
Угур САХИН
Себастьян КРАЙТЕР
Мустафа ДИКЕН
Ян ДИКМАНН
Михаель КОЗЛОВСКИ
Цедрик БРИТТЕН
Джон КЭСТЛ
Мартин ЛЁВЕР
Бернхард РЕНАРД
Тана ОМОКОКО
ГРАФ Йоханнес Хендрикус ДЕ
Original Assignee
Бионтех Рна Фармасьютикалс Гмбх
Трон - Транслационале Онкологи Ан Дер Универзитетсмедицин Дер Йоханнес Гутенберг-Универзитет Майнц Гемайннютциге Гмбх
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Бионтех Рна Фармасьютикалс Гмбх, Трон - Транслационале Онкологи Ан Дер Универзитетсмедицин Дер Йоханнес Гутенберг-Универзитет Майнц Гемайннютциге Гмбх filed Critical Бионтех Рна Фармасьютикалс Гмбх
Publication of RU2017133613A publication Critical patent/RU2017133613A/en
Publication of RU2017133613A3 publication Critical patent/RU2017133613A3/ru
Application granted granted Critical
Publication of RU2779946C2 publication Critical patent/RU2779946C2/en

Links

Images

Abstract

FIELD: pharmaceutics; medicine.
SUBSTANCE: object 1 is a method for the production of an individualized vaccine for use in the treatment or prevention of cancer, including the effective amount of recombinant polyepitope polypeptide containing mutation-based neoepitopes, which are the result of cancer-specific somatic mutations in a cancer sample of a patient with cancer, or nucleic acid encoding the specified polyepitope polypeptide, where mutation-based neoepitopes are cross-linked together by means of peptide bonds or linkers. The method includes stages of identification of cancer-specific somatic mutations in the cancer sample of the patient with cancer to obtain a signature of patient’s cancer mutations and to obtain a vaccine, a characteristic feature of which is the obtained cancer mutation signature. Objects 2 and 3 are an individualized vaccine for use in the treatment or prevention of cancer. Object 4 is a method for the treatment of a patient with cancer, including the administration of a vaccine to the patient.
EFFECT: creation of an individualized antitumor vaccine due to obtaining an active vaccine start based on cancer-specific somatic mutations in a cancer sample of a patient with cancer.
30 cl, 21 dwg, 8 tbl, 9 ex

Description

Область техникиTechnical field

Настоящее изобретение относится к получению вакцин, которые специфичны к опухолям пациентов и потенциально пригодны для иммунотерапии первичной опухоли, а также метастазов опухоли.The present invention relates to the production of vaccines that are specific to patient tumors and are potentially useful in primary tumor immunotherapy as well as tumor metastases.

Уровень техникиState of the art

Злокачественные новообразования являются основной причиной смертности, вызывая 1 из каждых 4 смертей. Лечение злокачественных новообразований традиционно основывалось на законе средних чисел, то есть используют то, что работает лучше у наибольшего количества пациентов. Однако вследствие молекулярной гетерогенности в злокачественных новообразованиях зачастую менее чем 25% подвергнутых лечению индивидуумов получают пользу от одобренных методов лечения. Индивидуализированная медицина, в основе которой лежит специально подобранное лечение пациентов, рассматривается в качестве потенциального решения низкоэффективных и высокозатратных инноваций в области разработки лекарственных средств.Malignancies are the leading cause of death, causing 1 out of every 4 deaths. Treatment of malignant neoplasms has traditionally been based on the law of averages, that is, use what works best for the largest number of patients. However, due to molecular heterogeneity in cancers, often less than 25% of treated individuals benefit from approved therapies. Personalized medicine, based on tailored patient care, is seen as a potential solution to low-efficiency, high-cost innovations in drug development.

Антигенспецифичная иммунотерапия, имеющая своей целью повышение или индукцию иммунного ответа у пациентов, успешно применяется при контроле онкологических заболеваний. T-клетки играют центральную роль в клеточно-опосредованном иммунитете человека и животных. Распознавание и связывание конкретного антигена опосредовано T-клеточными рецепторами (TCR), экспрессирующимися на поверхности T-клеток. T-клеточный рецептор (TCR) T-клетки способен взаимодействовать с иммуногенными пептидами (эпитопами), связанными с молекулами главного комплекса гистосовместимости (MHC) и презентированными на поверхности клеток-мишеней. Специфичное связывание TCR передает каскад сигналов внутрь T-клетки, приводя к пролиферации и дифференцировке в зрелую эффекторную T-клетку.Antigen-specific immunotherapy, which aims to increase or induce an immune response in patients, has been successfully used in cancer control. T cells play a central role in cell-mediated immunity in humans and animals. Recognition and binding of a particular antigen is mediated by T cell receptors (TCR) expressed on the surface of T cells. The T cell receptor (TCR) of T cells is capable of interacting with immunogenic peptides (epitopes) associated with major histocompatibility complex (MHC) molecules and presented on the surface of target cells. Specific binding of the TCR transmits a signaling cascade into the T cell, leading to proliferation and differentiation into the mature effector T cell.

Идентификация растущего количества патоген- и опухолеспецифичных антигенов (TAA) приводит к получению большой коллекции подходящих мишеней для иммунотерапии. Клетки, презентирующие иммуногенные пептиды (эпитопы), выделенные из этих антигенов, могут быть подвергнуты специфичному направленному воздействию с помощью активной или пассивной стратегии иммунизации. Активная иммунизация может приводить к индукции и экспансии антиген-специфичных T-клеток у пациентов, которые способны специфично распознавать и уничтожать больные клетки. Для противоопухолевой вакцинации могут использоваться различные антигенные форматы, включающие цельные злокачественные клетки, белки, пептиды или иммунизирующие векторы, такие как РНК-, ДНК- или вирусные векторы, которые могут применяться непосредственно in vivo или in vitro путем стимуляции DC с последующим переносом пациенту.The identification of a growing number of pathogen and tumor specific antigens (TAA) is leading to a large collection of suitable immunotherapy targets. Cells presenting immunogenic peptides (epitopes) isolated from these antigens can be specifically targeted using an active or passive immunization strategy. Active immunization can lead to the induction and expansion of antigen-specific T cells in patients that are able to specifically recognize and destroy diseased cells. Various antigenic formats can be used for anti-tumor vaccination, including whole cancer cells, proteins, peptides, or immunizing vectors such as RNA, DNA or viral vectors, which can be applied directly in vivo or in vitro by DC stimulation followed by transfer to the patient.

Злокачественные новообразования могут возникать в результате накопления геномных мутаций и эпигенетических изменений, часть которых может являться причиной заболевания. Дополнительно к опухолеспецифичным антигенам человеческие злокачественные новообразования несут в себе в среднем 100-120 несинонимичных мутаций, из которых многие могут быть мишенями для вакцин. Более чем 95% мутаций в опухоли уникальны и специфичны для пациента (Weide et al. 2008: J. Immunother. 31, 180-188). Количество соматических мутаций, изменяющих белок, которые могут приводить к образованию опухолеспецифичных T-клеточных эпитопов, находится в диапазоне от 30 до 400. Было предсказано in silico, что на каждого пациента приходится 40-60 эпитопов, ограниченных по HLA класса I, выделенных из опухолеспецифичных соматических мутаций (Azuma et al. 1993: Nature 366, 76-79). Кроме того, также в результате опухолеспецифичных мутаций, вероятно, возникают de novo эпитопы, ограниченные по HLA класса II, однако их количество все еще остается неизвестным.Malignant neoplasms can result from the accumulation of genomic mutations and epigenetic changes, some of which may be the cause of the disease. In addition to tumor-specific antigens, human cancers carry an average of 100-120 non-synonymous mutations, of which many can be targets for vaccines. More than 95% of mutations in a tumor are unique and specific to the patient (Weide et al. 2008: J. Immunother. 31, 180-188). The number of somatic protein-altering mutations that can result in tumor-specific T cell epitopes ranges from 30 to 400. It has been predicted in silico that there are 40-60 HLA class I restricted epitopes isolated from tumor-specific cells per patient per patient. somatic mutations (Azuma et al. 1993: Nature 366, 76-79). In addition, also as a result of tumor-specific mutations, de novo HLA class II-restricted epitopes are likely to arise, but their number is still unknown.

Следует отметить, что некоторые несинонимичные мутации случайным образом вовлечены в неопластическую трансформацию, критическую для поддержания онкогенного фенотипа (ведущие мутации/driver mutations) и могут представлять собой потенциальную «ахиллесову пяту» раковых клеток. Как таковые несинонимичные мутации не являются объектом для толерантности центральной иммунной системы, и они могут быть идеальными кандидатами для разработки индивидуальных противоопухолевых вакцин. Мутации, обнаруженные в первичной опухоли, также могут присутствовать в метастазах. Однако некоторые исследования продемонстрировали, что в процессе эволюции опухоли метастазирующие опухоли пациента приобретают дополнительные генетические мутации, которые часто являются клинически важными (Suzuki et al. 2007: Mol. Oncol. 1 (2), 172- 180; Campbell et al. 2010: Nature 467 (7319), 1109-1113). Кроме того, также молекулярные характеристики многих метастазов имеют значительные отклонения от характеристик первичных опухолей.It should be noted that some non-synonymous mutations are randomly involved in neoplastic transformation, which is critical for maintaining the oncogenic phenotype (driver mutations) and may represent a potential “Achilles heel” of cancer cells. As such, non-synonymous mutations are not subject to central immune system tolerance, and they may be ideal candidates for the development of individual cancer vaccines. Mutations found in the primary tumor may also be present in metastases. However, some studies have shown that, during tumor evolution, a patient's metastatic tumors acquire additional genetic mutations that are often clinically important (Suzuki et al. 2007: Mol. Oncol. 1 (2), 172-180; Campbell et al. 2010: Nature 467 (7319), 1109-1113). In addition, also the molecular characteristics of many metastases have significant deviations from those of primary tumors.

Техническая задача, лежащая в основе настоящего изобретения, заключается в получении высокоэффективной индивидуализированной противоопухолевой вакцины.The technical problem underlying the present invention is to obtain a highly effective individualized antitumor vaccine.

Настоящее изобретение базируется на идентификации специфичных для пациента опухолевых мутаций и направленном воздействии на индивидуальную для пациента «сигнатуру» опухолевых мутаций. Конкретно, настоящее изобретение, которое включает секвенирование генома, предпочтительно, экзома или транскриптома, базируется на применении подхода индивидуализированной иммунотерапии и имеет своей целью иммунотерапевтическое направленное воздействие на множество индивидуальных опухолевых мутаций. Секвенирование с использованием технологий Секвенирования Следующего Поколения (англ. Next Generation Sequencing) (NGS) позволяет осуществить быструю и не затратную эффективную идентификацию опухолевых мутаций, специфичных для пациента.The present invention is based on the identification of patient-specific tumor mutations and the targeted impact on the patient-specific "signature" of tumor mutations. Specifically, the present invention, which involves sequencing a genome, preferably an exome or a transcriptome, is based on an individualized immunotherapy approach and aims to target a plurality of individual tumor mutations immunotherapeutically. Sequencing using Next Generation Sequencing (NGS) technologies allows rapid and cost effective identification of patient-specific tumor mutations.

Идентификация несинонимичных точечных мутаций, приводящих к аминокислотным заменам, которые будут присутствовать в молекулах главного комплекса гистосовместимости пациента (MHC), обеспечивает новые эпитопы (неоэпитопы), которые специфичны для злокачественного новообразования пациента, но не обнаруживаются в здоровых клетках пациента. Сбор данного набора мутаций из раковых клеток, таких как циркулирующие опухолевые клетки (CTC), позволяет приготовить вакцину, которая индуцирует иммунный ответ с потенциальным направленным воздействием на первичную опухоль, даже если она содержит генетически отличные субпопуляции, а также на опухолевые метастазы. Для вакцинации такие неоэпитопы, идентифицированные согласно настоящему изобретению, предоставляются пациенту в форме полипептида, включающего указанные неоэпитопы, после соответствующего процессирования и презентирования молекулами MHC, неоэпитопы представляются иммунной системе пациента для стимуляции соответствующих T-клеток.The identification of non-synonymous point mutations resulting in amino acid substitutions that would be present in the patient's major histocompatibility complex (MHC) molecules provides new epitopes (neoepitopes) that are specific to the patient's malignancy but are not found in healthy patient cells. Harvesting this set of mutations from cancer cells, such as circulating tumor cells (CTCs), allows the preparation of a vaccine that induces an immune response with the potential to target the primary tumor, even if it contains genetically distinct subpopulations, as well as tumor metastases. For vaccination, such neoepitopes identified according to the present invention are provided to the patient in the form of a polypeptide comprising said neoepitopes, after appropriate processing and presentation by MHC molecules, the neoepitopes are presented to the patient's immune system to stimulate the appropriate T cells.

Предпочтительно, если такой полипептид предоставляется пациенту путем введения РНК, кодирующей полипептид. Стратегия, в которой in vitro транскрибируемая РНК (IVT-RNA) непосредственно инъецируется пациенту различными способами иммунизации, успешно тестировалась на некоторых моделях млекопитающих. РНК может транслироваться в трансфецированных клетках, а экспрессированный белок после процессирования презентируется на молекулах MHC на поверхности клеток для вызова иммунного ответа.Preferably, such a polypeptide is provided to a patient by administration of an RNA encoding the polypeptide. A strategy in which in vitro transcribed RNA (IVT-RNA) is directly injected into a patient by various immunization methods has been successfully tested in several mammalian models. RNA can be translated in transfected cells, and the expressed protein, after processing, is presented on MHC molecules on the cell surface to elicit an immune response.

Преимущества использования РНК в качестве варианта обратимой генной терапии включают временную экспрессию и не трансформирующий характер. РНК не нуждается в попадании в ядро для экспрессии и, кроме того, не может интегрироваться в геном хозяина, таким образом, исключая риск канцерогенеза. Степень трансфекции, достигаемая с помощью РНК, является достаточно высокой. Кроме того, количества полученного белка соответствуют количествам при физиологической экспрессии.Advantages of using RNA as a reversible gene therapy option include transient expression and non-transforming nature. RNA does not need to enter the nucleus for expression and, moreover, cannot integrate into the host genome, thus eliminating the risk of carcinogenesis. The degree of transfection achieved with RNA is quite high. In addition, the amount of protein obtained corresponds to the amount of physiological expression.

Разумное обоснование иммунотерапевтического направленного воздействия на множество индивидуальных мутаций заключается в том, что (i) эти мутации экспрессируются эксклюзивно, (ii) мутированные эпитопы, как ожидается, идеальны для Т-клеточной иммунотерапии, так как Т-клетки, распознающие их, не подвергаются тимусной селекции, (iii) ускользание опухоли от иммунного ответа может быть уменьшено, например, путем направленного воздействия на «ведущие мутации», которые являются в высокой степени существенными для опухолевого фенотипа, и (iv) мультиэпитопный иммунный ответ более вероятно приведет к улучшенному клиническому эффекту.The rationale for immunotherapeutic targeting of multiple individual mutations is that (i) these mutations are exclusively expressed, (ii) the mutated epitopes are expected to be ideal for T-cell immunotherapy because the T cells that recognize them are not subjected to thymic selection, (iii) tumor escape from the immune response can be reduced, for example, by targeting "master mutations" that are highly significant for the tumor phenotype, and (iv) a multi-epitope immune response is more likely to result in improved clinical outcome.

Сущность изобретенияThe essence of the invention

Настоящее изобретение относится к эффективным способам получения индивидуальных рекомбинантных противоопухолевых вакцин, индуцирующих эффективный и специфичный иммунный ответ у онкопациентов и оказывающих потенциальное направленное воздействие на первичную опухоль, а также на метастазы опухоли. Противоопухолевые вакцины, получаемые согласно изобретению, при введении пациенту дают группу MHC-презентированных эпитопов, специфичных для опухоли пациента и подходящих для стимулирования, инициирования и/или экспансии T-клеток, направленных против клеток, экспрессирующих антигены, из которых выделены MHC-презентированные эпитопы. Таким образом, вакцины, описанные в данном документе, предпочтительно способны индуцировать или стимулировать клеточный ответ, предпочтительно, цитотоксическую Т-клеточную активность, против злокачественного новообразования, характеризующегося презентацией одного или нескольких антигенов, экспрессируемых опухолевыми клетками, с помощью молекул MHC класса I. Так как вакцина, получаемая согласно настоящему изобретению, будет направленно воздействовать на опухолеспецифичные мутации, она будет специфичной для опухоли пациента.The present invention relates to effective methods for obtaining individual recombinant antitumor vaccines that induce an effective and specific immune response in cancer patients and have a potential targeted effect on the primary tumor, as well as tumor metastases. The antitumor vaccines prepared according to the invention, when administered to a patient, provide a group of MHC-presented epitopes specific to the patient's tumor and suitable for stimulating, initiating and/or expanding T cells directed against cells expressing antigens from which the MHC-presented epitopes are isolated. Thus, the vaccines described herein are preferably capable of inducing or stimulating a cellular response, preferably cytotoxic T cell activity, against a cancer characterized by the presentation of one or more antigens expressed by the tumor cells by MHC class I molecules. Since the vaccine produced according to the present invention will target tumor-specific mutations, it will be specific to the patient's tumor.

В одном аспекте, настоящее изобретение относится к способу получения индивидуализированной противоопухолевой вакцины, включающему стадии:In one aspect, the present invention relates to a method for obtaining an individualized antitumor vaccine, including the steps:

(a) идентификации опухолеспецифичных соматических мутаций в образце опухоли онкопациента с получением сигнатуры опухолевых мутаций пациента; и(a) identifying tumor-specific somatic mutations in a tumor sample of the oncology patient to obtain a signature of the patient's tumor mutations; and

(b) получения вакцины, характерной чертой которой является сигнатура опухолевых мутаций, полученная в стадии (a).(b) obtaining a vaccine, the characteristic feature of which is the signature of tumor mutations obtained in stage (a).

В одном воплощении, способ по изобретению включает следующие стадии: In one embodiment, the method of the invention includes the following steps:

- получение образца опухоли из онкопациента и получение неопухолевого образца, который предпочтительно выделен из онкопациента;- obtaining a tumor sample from the cancer patient and obtaining a non-tumor sample, which is preferably isolated from the cancer patient;

- идентификацию различий в последовательностях между геномом, экзомом и/или транскриптомом опухолевого образца и геномом, экзомом и/или транскриптомом неопухолевого образца;- identifying sequence differences between the genome, exome and/or transcriptome of the tumor sample and the genome, exome and/or transcriptome of the non-tumor sample;

- дизайн полипептида, включающего эпитопы, включающие различия в последовательностях, определенные в стадии (ii);- the design of the polypeptide, including epitopes, including differences in the sequences defined in stage (ii);

- получение полипептида, спроектированного в стадии (iii), или нуклеиновой кислоты, предпочтительно, РНК, кодирующей указанный полипептид; и- obtaining a polypeptide designed in stage (iii), or a nucleic acid, preferably RNA, encoding the specified polypeptide; and

- получение вакцины, включающей полипептид или нуклеиновую кислоту, полученные в стадии (iv).- obtaining a vaccine comprising a polypeptide or nucleic acid obtained in step (iv).

Согласно изобретению, опухолевый образец относится к любому образцу, такому как образец, взятый из организма, выделенный из тканей пациента, содержащий или ожидаемо содержащий опухолевые или раковые клетки. Образец, взятый из организма, может представлять собой любой образец ткани, такой как кровь, образец ткани, полученный из первичной опухоли или из опухолевых метастазов, или любой другой образец, содержащий опухолевые или раковые клетки. Предпочтительно, если образец организма представляет собой кровь, а опухолеспецифичные соматические мутации или различия в последовательностях определяют в одной или в нескольких циркулирующих опухолевых клетках (CTC), содержащихся в крови. В другом воплощении, опухолевый образец относится к одной или нескольким выделенным опухолевым или раковым клеткам, таким как циркулирующие опухолевые клетки (CTC), или к образцу, содержащему одну или несколько выделенных опухолевых или раковых клеток, таким как циркулирующие опухолевые клетки (CTC).According to the invention, a tumor sample refers to any sample, such as a sample taken from the body, isolated from the tissues of a patient, containing or expected to contain tumor or cancer cells. The sample taken from the body may be any tissue sample, such as blood, a tissue sample obtained from a primary tumor or from tumor metastases, or any other sample containing tumor or cancer cells. Preferably, the body sample is blood and tumor-specific somatic mutations or sequence differences are detected in one or more circulating tumor cells (CTCs) contained in the blood. In another embodiment, the tumor sample refers to one or more isolated tumor or cancer cells, such as circulating tumor cells (CTC), or a sample containing one or more isolated tumor or cancer cells, such as circulating tumor cells (CTC).

Неопухолевый образец относится к любому образцу, такому как образец из организма, который выделен из тканей пациента или другого индивидуума, который предпочтительно того же вида, что и пациент, предпочтительно, из здорового индивидуума, не содержащего или ожидаемо не содержащего опухолевых или раковых клеток. Образец из организма может представлять собой любой образец ткани, такой как кровь, или образец из нетуморогенной ткани.A non-tumor sample refers to any sample, such as a sample from an organism, that is isolated from the tissues of a patient or other individual, which is preferably of the same species as the patient, preferably from a healthy individual free of or expected to be free of tumor or cancer cells. The body sample can be any tissue sample, such as blood, or a non-tumorogenic tissue sample.

Согласно изобретению термин «сигнатура мутаций злокачественных опухолей» может относиться к мутациям злокачественных опухолей, присутствующим в одной или в нескольких раковых клетках пациента, или может относиться только к части мутаций злокачественных опухолей, присутствующих в одной или в нескольких раковых клетках пациента. Соответственно, настоящее изобретение может включать идентификацию всех опухолеспецифичных мутаций, присутствующих в одной или в нескольких раковых клетках пациента, или может включать идентификацию только части опухолеспецифичных мутаций, присутствующих в одной или в нескольких раковых клетках пациента. Как правило, способ по изобретению обеспечивает идентификацию ряда мутаций, которые дают достаточное количество неоэпитопов, включаемых в вакцину. «Мутация злокачественных опухолей» относится к различию в последовательности между нуклеиновой кислотой, содержащейся в раковой клетке, и нуклеиновой кислотой, содержащейся в здоровой клетке.According to the invention, the term "cancer mutation signature" may refer to cancer mutations present in one or more of the patient's cancer cells, or may refer to only a subset of the cancer mutations present in one or more of the patient's cancer cells. Accordingly, the present invention may include identifying all of the tumor-specific mutations present in one or more of the patient's cancer cells, or may include identifying only a portion of the tumor-specific mutations present in one or more of the patient's cancer cells. Typically, the method of the invention will identify a number of mutations that provide a sufficient number of neoepitopes to be included in a vaccine. "Cancer mutation" refers to a difference in sequence between a nucleic acid contained in a cancer cell and a nucleic acid contained in a healthy cell.

Предпочтительно, мутации, идентифицированные в способах согласно настоящему изобретению, представляют собой несинонимичные мутации, предпочтительно, несинонимичные мутации белков, экспрессированных в опухолевых или в раковых клетках.Preferably, the mutations identified in the methods of the present invention are non-synonymous mutations, preferably non-synonymous mutations of proteins expressed in tumor or cancer cells.

В одном воплощении опухолеспецифичные соматические мутации или различия в последовательности определяются в геноме, предпочтительно, во всем геноме опухолевого образца. Таким образом, способ по изобретению может включать идентификацию сигнатуры опухолевых мутаций генома, предпочтительно, всего генома одной или нескольких раковых клеток. В одном воплощении стадия идентификации опухолеспецифичных соматических мутаций в опухолевом образце онкопациента включает идентификацию полного геномного профиля опухолевых мутаций.In one embodiment, tumor-specific somatic mutations or sequence differences are determined in the genome, preferably in the entire genome of the tumor sample. Thus, the method of the invention may include identifying the signature of tumor mutations in the genome, preferably the entire genome of one or more cancer cells. In one embodiment, the step of identifying tumor-specific somatic mutations in a cancer patient's tumor sample comprises identifying a complete genomic profile of the tumor mutations.

В одном воплощении опухолеспецифичные соматические мутации или различия в последовательности определяются в экзоме, предпочтительно, во всем экзоме опухолевого образца. Экзом представляет собой часть генома организма, и образован экзонами, которые представляют собой кодирующие участки экспрессирующихся генов. Экзом обеспечивает генетический проект, используемый для синтеза белков и других функциональных генных продуктов. Он является наиболее функционально релевантной частью генома и, таким образом, наиболее вероятно вносит вклад в фенотип организма. По оценкам, экзом человеческого генома составляет 1,5% суммарного генома (Ng, PC et al., PLoS Gen., 4(8): 1-15, 2008). Таким образом, способ по изобретению может включать идентификацию характерной опухолевой мутации экзома, предпочтительно, всего экзома одной или нескольких раковых клеток. В одном воплощении стадия идентификации опухолеспецифичных соматических мутаций в опухолевом образце онкопациента включает идентификацию полного экзомного профиля опухолевых мутаций.In one embodiment, tumor-specific somatic mutations or sequence differences are detected in the exome, preferably in the entire exome of the tumor sample. The exome is part of the genome of an organism, and is formed by exons, which are the coding regions for expressed genes. Exome provides the genetic blueprint used for the synthesis of proteins and other functional gene products. It is the most functionally relevant part of the genome and thus most likely to contribute to the phenotype of an organism. The exome of the human genome is estimated to represent 1.5% of the total genome (Ng, PC et al., PLoS Gen., 4(8): 1-15, 2008). Thus, the method of the invention may include identifying a characteristic tumor mutation of the exome, preferably the entire exome of one or more cancer cells. In one embodiment, the step of identifying tumor-specific somatic mutations in a tumor sample from a cancer patient comprises identifying a complete exome profile of the tumor mutations.

В одном воплощении опухолеспецифичные соматические мутации или различия в последовательности определяются в транскриптоме, предпочтительно, в полном транскриптоме опухолевого образца. Транскриптом представляет собой набор всех молекул РНК, включающих мРНК, рРНК, тРНК и другие некодирующие РНК, вырабатываемые в одной клетке или в популяции клеток. В контексте настоящего изобретения транскриптом обозначает набор всех молекул РНК, выработанных в одной клетке, в популяции клеток, предпочтительно в популяции раковых клеток, или во всех клетках данного индивидуума в определенный момент времени. Таким образом, способ по изобретению может включать идентификацию сигнатуры опухолевых мутаций транскриптома, предпочтительно, всего транскриптома одной или нескольких раковых клеток. В одном воплощении стадия идентификации опухолеспецифичных соматических мутаций в опухолевом образце онкопациента включает идентификацию полного транскриптомного профиля опухолевых мутаций.In one embodiment, tumor-specific somatic mutations or sequence differences are detected in the transcriptome, preferably in the entire transcriptome of the tumor sample. A transcriptome is a set of all RNA molecules, including mRNA, rRNA, tRNA, and other non-coding RNA, produced in a single cell or population of cells. In the context of the present invention, a transcriptome refers to the set of all RNA molecules produced in one cell, in a population of cells, preferably in a population of cancer cells, or in all cells of a given individual at a given time. Thus, the method of the invention may include identifying the signature of tumor mutations in the transcriptome, preferably the entire transcriptome of one or more cancer cells. In one embodiment, the step of identifying tumor-specific somatic mutations in a tumor sample of a cancer patient comprises identifying a complete transcriptome profile of the tumor mutations.

В одном воплощении стадия идентификации опухолеспецифичных соматических мутаций или идентификации различий в последовательностях включает секвенирование генома из одной клетки (single cell sequencing) для одной или нескольких раковых клеток, предпочтительно, из 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или даже более. Таким образом, способ по изобретению может включать идентификацию характерной опухолеспецифичной мутации указанной одной или нескольких раковых клеток. В одном воплощении раковые клетки представляют собой циркулирующие опухолевые клетки. Раковые клетки, такие как циркулирующие опухолевые клетки, могут быть выделены перед секвенированием генома из одной клетки.In one embodiment, the step of identifying tumor-specific somatic mutations or identifying sequence differences comprises single cell sequencing of the genome for one or more cancer cells, preferably 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 or more. Thus, the method of the invention may include identifying a characteristic tumor-specific mutation of said one or more cancer cells. In one embodiment, the cancer cells are circulating tumor cells. Cancer cells, such as circulating tumor cells, can be isolated prior to genome sequencing from a single cell.

В одном воплощении стадия идентификации опухолеспецифичных соматических мутаций или идентификации различий в последовательностях включает применение секвенирования следующего поколения (NGS).In one embodiment, the step of identifying tumor-specific somatic mutations or identifying sequence differences includes the use of next generation sequencing (NGS).

В одном воплощении стадия идентификации опухолеспецифичных соматических мутаций или идентификации различий в последовательностях включает секвенирование геномной ДНК и/или РНК опухолевого образца.In one embodiment, the step of identifying tumor-specific somatic mutations or identifying sequence differences comprises sequencing the genomic DNA and/or RNA of the tumor sample.

Для обнаружения опухолеспецифичных соматических мутаций или различий в последовательностях информацию о последовательностях, полученную из опухолевого образца, предпочтительно сравнивали с эталонной (референсной), такой как информация о последовательностях, полученная в результате секвенирования ДНК или РНК здоровых незлокачественных клеток, таких как клетки зародышевой линии, которые могут быть получены либо из пациента, либо из других индивидуумов. В одном воплощении нормальную геномную зародышевую ДНК получают из мононуклеаров периферической крови (PBMC).To detect tumor-specific somatic mutations or sequence differences, sequence information obtained from a tumor sample is preferably compared with a reference, such as sequence information obtained from DNA or RNA sequencing of healthy non-malignant cells, such as germline cells, which may be obtained either from the patient or from other individuals. In one embodiment, normal genomic germline DNA is obtained from peripheral blood mononuclear cells (PBMCs).

Вакцина, предлагаемая согласно способам настоящего изобретения, относится к вакцине, которая при введении пациенту предпочтительно обеспечивает группу MHC-презентированных эпитопов, например, 2 или более, 5 или более, 10 или более, 15 или более, 20 или более, 25 или более, 30 или более, и предпочтительно, до 60, до 55, до 50, до 45, до 40, до 35 или до 30 MHC-презентированных эпитопов, включающих изменения последовательности на основе идентифицированных мутаций или различий последовательностей. Такие MHC-презентированные эпитопы, включающие изменения последовательности на основе идентифицированных мутаций или различий в последовательностях, также обозначаются в данном документе как «неоэпитопы». Презентация таких эпитопов клетками пациента, в частности антигенпрезентирующими клетками, предпочтительно приводит в результате к направленному воздействию Т-клеток на MHC-связанные эпитопы и, таким образом, на опухоль пациента, предпочтительно, первичную опухоль, а также на опухолевые метастазы, экспрессирующие антигены, из которых выделены MHC-презентированные эпитопы, которые презентируют те же эпитопы, что и на поверхности опухолевых клеток.A vaccine according to the methods of the present invention refers to a vaccine which, when administered to a patient, preferably provides a group of MHC-presented epitopes, e.g., 2 or more, 5 or more, 10 or more, 15 or more, 20 or more, 25 or more, 30 or more, and preferably up to 60, up to 55, up to 50, up to 45, up to 40, up to 35 or up to 30 MHC-presented epitopes, including sequence changes based on identified mutations or sequence differences. Such MHC-presented epitopes, including sequence changes based on identified mutations or sequence differences, are also referred to herein as "neoepitopes". The presentation of such epitopes by the patient's cells, in particular antigen-presenting cells, preferably results in the targeting of T cells to MHC-bound epitopes and thus to the patient's tumor, preferably the primary tumor, as well as tumor metastases expressing antigens from which isolated MHC-presented epitopes that present the same epitopes as on the surface of tumor cells.

Для получения вакцины способ по изобретению может включать произвольное включение в вакцину достаточного количества неоэпитопов (предпочтительно, в форме кодирующей нуклеиновой кислоты) или может включать дополнительную стадию определения применимости идентифицированных мутаций в эпитопах для противоопухолевой вакцинации. Таким образом, дополнительные стадии могут включать одну или несколько из представленных ниже: (i) оценку того, локализованы ли изменения в последовательности известных или прогнозируемых MHC-презентированных эпитопах, (ii) in vitro и/или in silico тестирование того, локализованы ли изменения последовательности в MHC-презентированных эпитопах, например, тестирование того, являются ли изменения последовательности частью пептидных последовательностей, которые процессируются и/или представлены в виде MHC-презентированных эпитопов, и (iii) in vitro тестирование того, способны ли рассматриваемые мутированные эпитопы, конкретно присутствующие в виде их природной последовательности, например, будучи фланкированными аминокислотными последовательностями, которые также фланкируют указанные эпитопы в природном белке, при экспрессии в антигенпрезентирующих клетках стимулировать T-клетки пациента, обладающие нужной специфичностью. Каждая из таких фланкирующих последовательностей может включать 3 или более аминокислот, 5 или более, 10 или более, 15 или более, 20 или более и, предпочтительно, до 50, до 45, до 40, до 35 или до 30 аминокислот и может фланкировать последовательности эпитопа с N-конца и/или с C-конца.To obtain a vaccine, the method of the invention may include the optional inclusion in the vaccine of a sufficient number of neoepitopes (preferably in the form of an encoding nucleic acid) or may include the additional step of determining the applicability of identified mutations in epitopes for antitumor vaccination. Thus, additional steps may include one or more of the following: (i) evaluating whether changes are located in the sequence of known or predicted MHC-presented epitopes, (ii) in vitro and/or in silico testing whether changes in sequence are located in MHC-presented epitopes, for example, testing whether the sequence changes are part of the peptide sequences that are processed and/or presented as MHC-presented epitopes, and (iii) in vitro testing whether the mutated epitopes in question, specifically present in in their natural sequence, for example, when flanked by amino acid sequences that also flank said epitopes in the natural protein, when expressed in antigen-presenting cells, stimulate the patient's T cells with the desired specificity. Each of these flanking sequences may include 3 or more amino acids, 5 or more, 10 or more, 15 or more, 20 or more, and preferably up to 50, up to 45, up to 40, up to 35, or up to 30 amino acids, and may flank sequences epitope from the N-terminus and/or from the C-terminus.

Мутации или различия в последовательностях, определенные согласно изобретению, могут быть выстроены по их пригодности в качестве эпитопов для противоопухолевой вакцинации. Таким образом, в одном аспекте способ по изобретению включает ручной или компьютерный аналитический процесс, в котором анализируются идентифицированные мутации и отбираются по их пригодности к использованию в соответствующих предлагаемых вакцинах. В предпочтительном воплощении указанный аналитический процесс представляет собой процесс на основе компьютерного алгоритма. Предпочтительно, указанный аналитический процесс включает одну или несколько, а предпочтительно все из следующих стадий:Mutations or sequence differences determined according to the invention can be ranked by their suitability as epitopes for tumor vaccination. Thus, in one aspect, the method of the invention includes a manual or computer-assisted analytical process that analyzes identified mutations and selects them for their suitability for use in respective proposed vaccines. In a preferred embodiment, said analytical process is a computer algorithm based process. Preferably, said analytical process includes one or more, and preferably all, of the following steps:

- идентификацию экспрессирующихся, модифицирующих белок мутаций, например, путем анализа транскриптов;- identification of expressed, protein-modifying mutations, for example, by analyzing transcripts;

- идентификацию мутаций, которые потенциально иммуногенны, например, путем сравнения данных, полученных с использованием доступных баз данных подтвержденных иммуногенных эпитопов, например, тех, что содержатся в общедоступных базах иммунных эпитопов, таких как, например, «IMMUNE EPITOPE DATABASE AND ANALYSIS RESOURCE» по адресу http://www.immunoepitope.org- identification of mutations that are potentially immunogenic, e.g. by comparing data obtained using available databases of confirmed immunogenic epitopes, e.g. http://www.immunepitope.org

Стадия идентификации мутаций, которые потенциально иммуногенны, может включать определение и/или упорядочивание эпитопов согласно прогнозу их MHC-связывающей способности, предпочтительно связывание с MHC класса-I.The step of identifying mutations that are potentially immunogenic may include identifying and/or sequencing epitopes according to their predictive MHC-binding capacity, preferably binding to MHC class-I.

В другом воплощении изобретения эпитопы могут быть отобраны и/или упорядочены путем использования дополнительных параметров, таких как воздействие на белок, ассоциированная экспрессия генов, уникальность последовательности, прогнозированная вероятность презентации и ассоциация с онкогенами.In another embodiment of the invention, epitopes can be selected and/or ordered using additional parameters such as protein exposure, associated gene expression, sequence uniqueness, predicted probability of presentation, and association with oncogenes.

Анализы множества CTC также позволяют осуществить отбор и приоритезацию мутаций. Например, приоритет мутации, которая обнаружена в большом количестве CTC, может быть выше, чем у мутации, обнаруженной в меньшем количестве CTC.Multiple CTC assays also allow selection and prioritization of mutations. For example, the priority of a mutation that is found in a large number of CTCs may be higher than that of a mutation found in a smaller number of CTCs.

Коллекция мутаций на основе неоэпитопов, идентифицированных согласно изобретению и обеспечиваемых вакциной по изобретению, предпочтительно присутствует в форме полипептида, включающего указанные неоэпитопы (полиэпитопный полипептид), или в виде нуклеиновой кислоты, конкретно, РНК, кодирующей указанный полипептид. Кроме того, неоэпитопы могут присутствовать в полипептиде в форме вакцинной последовательности, т.е. присутствовать в виде их природной последовательности, например, будучи фланкированными аминокислотными последовательностями, которые также фланкируют указанные эпитопы в природных белках. Каждая из таких фланкирующих последовательностей может включать 5 или более аминокислот, 10 или более, 15 или более, 20 или более и, предпочтительно, до 50, до 45, до 40, до 35 или до 30 аминокислот и может фланкировать эпитопные последовательности с N-конца и/или с C-конца. Таким образом, вакцинная последовательность может включать 20 или большее количество аминокислот, 25 или более, 30 или более, 35 или более, 40 или более, и предпочтительно, до 50, до 45, до 40, до 35 или до 30 аминокислот. В одном воплощении неоэпитопы и/или вакцинные последовательности располагаются в полипептиде голова к хвосту.The collection of neoepitope-based mutations identified according to the invention and provided by the vaccine of the invention is preferably present in the form of a polypeptide comprising said neoepitopes (polyepitope polypeptide) or in the form of a nucleic acid, specifically RNA, encoding said polypeptide. In addition, neoepitopes may be present in the polypeptide in the form of a vaccine sequence, i. be present in their natural sequence, for example, being flanked by amino acid sequences which also flank said epitopes in naturally occurring proteins. Each of such flanking sequences may include 5 or more amino acids, 10 or more, 15 or more, 20 or more, and preferably up to 50, up to 45, up to 40, up to 35, or up to 30 amino acids, and may flank epitope sequences with N- end and/or C-terminus. Thus, the vaccine sequence may include 20 or more amino acids, 25 or more, 30 or more, 35 or more, 40 or more, and preferably up to 50, up to 45, up to 40, up to 35 or up to 30 amino acids. In one embodiment, neoepitopes and/or vaccine sequences are arranged head-to-tail in the polypeptide.

В одном воплощении неоэпитопы и/или вакцинные последовательности разделены линкерами, конкретно, нейтральными линкерами. Термин «линкер» согласно изобретению относится к пептидам, добавляемым между двумя пептидными доменами, такими как эпитопы или вакцинные последовательности для связывания указанных пептидных доменов. Нет никакого конкретного ограничения, касающегося линкерной последовательности. Однако предпочтительно, что линкерная последовательность снижает стерические затруднения между двумя пептидными доменами, хорошо транслируется и поддерживает или дает возможность процессирования эпитопов. Кроме того, линкер не должен обладать последовательностями иммуногенных элементов, или обладает ими в небольшом количестве. Линкеры, предпочтительно, не должны создавать неэндогенных неоэпитопов типа тех, которые образуются в области тесного контакта между соседними неоэпитопами, которые могут вызывать нежелательные иммунные реакции. Таким образом, полиэпитопная вакцина предпочтительно содержит линкерные последовательности, которые способны уменьшить количество нежелательных MHC-связывающих эпитопов из мест соединения. Hoyt et al. (EMBO J. 25(8), 1720-9, 2006) и Zhang et al. (J. Biol. Chem., 279(10), 8635-41, 2004) продемонстрировали, что глицин-богатые последовательности способствуют протеасомному процессированию и, таким образом, использование глицин-богатых линкерных последовательностей минимизирует количество линкер-содержащих пептидов, которые могут процессироваться протеасомой. Кроме того, согласно наблюдениям, глицин ингибирует сильное связывание со связывающими бороздками MHC (Abastado et al., J. Immunol. 151(7), 3569-75, 1993). Schlessinger et al. (Proteins, 61(1), 115-26, 2005) обнаружили, что аминокислоты глицин и серин, включенные в аминокислотную последовательность, приводят в результате к получению более гибкого белка, который более эффективно транслируется и процессируется протеасомой, что дает лучший доступ к кодируемым неоэпитопам. Каждый из линкеров может включать 3 или большее количество аминокислот, 6 или более, 10 или более, 15 или более, 20 или более, и предпочтительно, до 50, до 45, до 40, до 35 или до 30 аминокислот. Предпочтительно, линкер обогащен аминокислотами глицином и/или серином. Предпочтительно, по меньшей мере, 50%, по меньшей мере, 60%, по меньшей мере, 70%, по меньшей мере, 80%, по меньшей мере, 90%, или, по меньшей мере, 95% аминокислот линкера представляют собой глицин и/или серин. В одном воплощении линкер по существу состоит из аминокислот глицина и/или серина. В одном воплощении, линкер включает аминокислотную последовательность (GGS)a(GSS)b(GGG)c(SSG)d(GSG)e где a, b, c, d и e независимо представляют собой число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, или 20 и где a + b + c + d + e отличаются от 0 и предпочтительно составляют 2 или более, 3 или более, 4 или более или 5 или более. В одном воплощении, линкер включает последовательность, описанную в данном документе, включающую линкерные последовательности, описанные в примерах, такие как последовательность GGSGGGGSG.In one embodiment, the neoepitopes and/or vaccine sequences are separated by linkers, specifically neutral linkers. The term "linker" according to the invention refers to peptides added between two peptide domains, such as epitopes or vaccine sequences to link said peptide domains. There is no particular limitation regarding the linker sequence. However, it is preferred that the linker sequence reduces steric hindrance between the two peptide domains, is well translated, and maintains or enables epitope processing. In addition, the linker should not have sequences of immunogenic elements, or have them in small quantities. Linkers should preferably not create non-endogenous neoepitopes such as those that form in close contact between adjacent neoepitopes, which may elicit unwanted immune responses. Thus, the polyepitope vaccine preferably contains linker sequences that are capable of reducing unwanted MHC-binding epitopes from junction sites. Hoyt et al. (EMBO J. 25(8), 1720-9, 2006) and Zhang et al. (J. Biol. Chem., 279(10), 8635-41, 2004) demonstrated that glycine-rich sequences facilitate proteasome processing and thus the use of glycine-rich linker sequences minimizes the amount of linker-containing peptides that can be processed. proteasome. In addition, glycine has been observed to inhibit strong binding to MHC binding grooves (Abastado et al., J. Immunol. 151(7), 3569-75, 1993). Schlessinger et al. (Proteins, 61(1), 115-26, 2005) found that the amino acids glycine and serine included in the amino acid sequence result in a more flexible protein that is more efficiently translated and processed by the proteasome, allowing better access to encoded neoepitopes. Each of the linkers may include 3 or more amino acids, 6 or more, 10 or more, 15 or more, 20 or more, and preferably up to 50, up to 45, up to 40, up to 35, or up to 30 amino acids. Preferably, the linker is enriched in the amino acids glycine and/or serine. Preferably at least 50%, at least 60%, at least 70%, at least 80%, at least 90%, or at least 95% of the amino acids of the linker are glycine and/or serine. In one embodiment, the linker essentially consists of the amino acids glycine and/or serine. In one embodiment, the linker comprises the amino acid sequence (GGS) a (GSS) b (GGG) c (SSG) d (GSG) e where a, b, c, d and e are independently a number selected from 0, 1, 2 , 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, or 20 and where a + b + c + d + e differ from 0 and preferably 2 or more, 3 or more, 4 or more, or 5 or more. In one embodiment, the linker includes the sequence described herein, including the linker sequences described in the examples, such as the sequence GGSGGGGSG.

В другом воплощении настоящего изобретения группу мутаций на основе неоэпитопов, идентифицированных согласно изобретению и представленных с помощью вакцины по изобретению, предпочтительно присутствует в форме группы полипептидов, включающих указанные неоэпитопы, которые также могут перекрываться, или в форме группы нуклеиновых кислот, конкретно, РНК, кодирующих указанные полипептиды.In another embodiment of the present invention, the group of mutations based on the neoepitopes identified according to the invention and presented using the vaccine according to the invention is preferably present in the form of a group of polypeptides comprising said neoepitopes, which may also overlap, or in the form of a group of nucleic acids, in particular RNAs encoding said polypeptides.

В одном конкретном предпочтительном воплощении полиэпитопный полипептид согласно настоящему изобретению вводят пациенту в форме нуклеиновой кислоты, предпочтительно, РНК, такой как in vitro транскрибированная или синтетическая РНК, которая может экспрессироваться в клетках пациента, таких как антигенпрезентирующие клетки с получением полипептида. Настоящее изобретение также предусматривает введение одного или нескольких мультиэпитопных полипептидов, которые для целей настоящего изобретения включены с использованием термина «полиэпитопный полипептид», предпочтительно в форме РНК, такой как in vitro транскрибированная или синтетическая РНК, которая может экспрессироваться в клетках пациента, таких как антигенпрезентирующие клетки, с получением одного или нескольких полипептидов. В случае введения более чем одного мультиэпитопного полипептида неоэпитопы, которые представлены с помощью различных мультиэпитопных полипептидов, могут быть различными или частично перекрываться. После того как полипептид по изобретению появляется в клетках пациента, таких как антигенпрезентирующие клетки, полипептид по изобретению процессируется с получением неоэпитопов, идентифицированных согласно изобретению. Введение вакцины, представленной согласно изобретению, может давать эпитопы, презентируемые MHC класса II, которые способны вызывать ответ клеток CD4+ T-хелперов против клеток, экспрессирующих антигены, из которых выделены MHC-презентированные эпитопы. В ином случае или дополнительно, введение вакцины, представленной согласно изобретению, может обеспечивать эпитопы, презентируемые MHC класса I, которые способны вызывать ответ CD8+ T-клеток против клеток, экспрессирующих антигены, из которых выделены MHC-презентированные эпитопы. Кроме того, введение вакцины, представленной согласно изобретению, может обеспечивать один или несколько неоэпитопов (включая известные неоэпитопы и неоэпитопы, идентифицированные по изобретению), а также один или несколько эпитопов, не содержащих опухолеспецифичных соматических мутаций, но экспрессирующихся опухолевыми клетками и предпочтительно индуцирующими иммунный ответ против опухолевых клеток, предпочтительно опухолеспецифичный иммунный ответ. В одном воплощении введение вакцины, представленной согласно изобретению, обеспечивает неоэпитопы, которые представляют собой эпитопы, презентированные MHC класса II, и/или способны вызывать ответ CD4+ хэлперных T-клеток против клеток, экспрессирующих антигены, из которых выделены MHC-презентированные эпитопы, а также эпитопы, не содержащие опухолеспецифичных соматических мутаций, которые представляют собой эпитопы, презентированные MHC класса I, и/или способны вызывать ответ CD8+ T-клеток против клеток, экспрессирующих антигены, из которых выделены MHC-презентированные эпитопы. В одном воплощении эпитопы, не содержащие опухолеспецифичных соматических мутаций, выделены из опухолевого антигена. В одном воплощении неоэпитопы и эпитопы, не содержащие опухолеспецифичных соматических мутаций, обладают синергическим эффектом при лечении злокачественного новообразования. Предпочтительно, вакцина, представленная согласно изобретению, применяется для полиэпитопного стимулирования ответа цитотоксических и/или хэлперных T-клеток.In one particular preferred embodiment, the polyepitopic polypeptide of the present invention is administered to a patient in the form of a nucleic acid, preferably RNA, such as in vitro transcribed or synthetic RNA, which can be expressed in the patient's cells, such as antigen-presenting cells to produce a polypeptide. The present invention also provides for the introduction of one or more multi-epitope polypeptides, which for the purposes of the present invention are included using the term "polyepitope polypeptide", preferably in the form of RNA, such as in vitro transcribed or synthetic RNA, which can be expressed in cells of the patient, such as antigen-presenting cells , to obtain one or more polypeptides. In the case of introducing more than one multi-epitope polypeptide, the neo-epitopes that are represented by different multi-epitope polypeptides may be different or partially overlap. After the polypeptide of the invention appears in the patient's cells, such as antigen presenting cells, the polypeptide of the invention is processed to produce the neoepitopes identified according to the invention. Administration of the vaccine of the invention can produce class II MHC-presented epitopes that are capable of eliciting a CD4+ T helper cell response against cells expressing antigens from which the MHC-presented epitopes have been isolated. Alternatively or additionally, administration of the vaccine of the invention may provide MHC class I presented epitopes that are capable of eliciting a CD8+ T cell response against cells expressing antigens from which the MHC presented epitopes are isolated. In addition, the administration of the vaccine of the invention may provide one or more neoepitopes (including known neoepitopes and neoepitopes identified by the invention), as well as one or more epitopes that do not contain tumor-specific somatic mutations, but are expressed by tumor cells and preferably induce an immune response. against tumor cells, preferably a tumor-specific immune response. In one embodiment, administration of a vaccine of the invention provides neoepitopes that are epitopes presented by MHC class II and/or are capable of eliciting a CD4+ helper T cell response against cells expressing antigens from which the MHC-presented epitopes are isolated, as well as epitopes that do not contain tumor-specific somatic mutations, which are MHC class I presented epitopes and/or are capable of inducing a CD8+ T cell response against cells expressing antigens from which MHC-presented epitopes are isolated. In one embodiment, epitopes free of tumor-specific somatic mutations are isolated from a tumor antigen. In one embodiment, neoepitopes and epitopes that do not contain tumor-specific somatic mutations have a synergistic effect in the treatment of malignancy. Preferably, the vaccine of the invention is used to polyepitope stimulate a cytotoxic and/or helper T cell response.

В следующем аспекте в настоящем изобретении предлагается вакцина, которую получают способом по изобретению. Соответственно, настоящее изобретение относится к вакцине, включающей рекомбинантный полипептид, включающий неоэпитопы на основе мутаций, причем указанные неоэпитопы получены на основании опухолеспецифичных соматических мутаций в опухолевом образце онкопациента, или включающей нуклеиновую кислоту, кодирующую указанный полипептид. Такой рекомбинантный полипептид также может включать эпитопы, не включающие опухолеспецифичных соматических мутаций, обсуждаемых выше. Предпочтительные воплощения такой вакцины описаны выше в контексте способа по изобретению.In a further aspect, the present invention provides a vaccine which is produced by the method of the invention. Accordingly, the present invention relates to a vaccine comprising a recombinant polypeptide comprising mutation-based neoepitopes, said neoepitopes derived from tumor-specific somatic mutations in a tumor sample of a cancer patient, or comprising a nucleic acid encoding said polypeptide. Such a recombinant polypeptide may also include epitopes that do not include the tumor-specific somatic mutations discussed above. Preferred embodiments of such a vaccine are described above in the context of the method of the invention.

Вакцина, представленная согласно изобретению, может включать фармацевтически приемлемый носитель и необязательно может включать один или несколько адъювантов, стабилизаторов и т.д. Вакцина может быть представлена в форме терапевтической или профилактической вакцины.The vaccine provided according to the invention may include a pharmaceutically acceptable carrier and may optionally include one or more adjuvants, stabilizers, etc. The vaccine may be presented in the form of a therapeutic or prophylactic vaccine.

Другой аспект настоящего изобретения относится к способу индуцирования иммунного ответа у пациента, включающему введение пациенту вакцины, представленной согласно изобретению.Another aspect of the present invention relates to a method for inducing an immune response in a patient, comprising administering to the patient the vaccine provided according to the invention.

Другой аспект относится к способу лечения онкопациента, включающему стадии:Another aspect relates to a method for treating a cancer patient, comprising the steps of:

(a) получение индивидуальной противоопухолевой вакцины с помощью способа по изобретению; и(a) obtaining an individual antitumor vaccine using the method according to the invention; and

(b) введение указанной вакцины пациенту.(b) administering said vaccine to a patient.

Другой аспект относится к способу лечения онкопациента, включающему введение пациенту вакцины по изобретению.Another aspect relates to a method of treating a cancer patient, comprising administering to the patient a vaccine of the invention.

В следующих аспектах, в изобретении предлагаются вакцины, описанные в данном документе, для применения в способах лечения, описанных в данном документе, конкретно, для применения при лечении или при предотвращении злокачественного новообразования.In the following aspects, the invention provides the vaccines described herein for use in the methods of treatment described herein, specifically for use in the treatment or prevention of cancer.

Лечение злокачественного новообразования, описанное в данном документе, может объединяться с хирургическим удалением и/или с традиционной химиотерапией.The cancer treatment described herein may be combined with surgical removal and/or conventional chemotherapy.

Другой аспект изобретения относится к способу определения частоты ложноположительных результатов на основе данных по секвенированию следующего поколения, причем указанный способ включает:Another aspect of the invention relates to a method for determining a false positive rate based on next generation sequencing data, said method comprising:

забор первого образца генетического материала от животного или человека;taking the first sample of genetic material from an animal or human;

забор второго образца генетического материала от животного или человека;taking a second sample of genetic material from an animal or human;

забор первого образца генетического материала из опухолевых клеток;taking the first sample of genetic material from tumor cells;

забор второго образца генетического материала из указанных опухолевых клеток;taking a second sample of genetic material from said tumor cells;

определение общего покрытия при сравнении с опухолью путем подсчета всех оснований эталонного генома, которые включены как в опухоль, так и, по меньшей мере, в один из числа указанного первого образца генетического материала из животного или человека и указанного второго образца генетического материала из животного или человека;determination of total coverage when compared to a tumor by counting all reference genome bases that are included in both the tumor and at least one of said first animal or human genetic material sample and said second animal or human genetic material sample ;

определение общего покрытия при сравнении «сам против себя» путем подсчета всех оснований эталонного генома, которые охватываются обоими из числа указанного первого образца генетического материала из животного или человека и указанного второго образца генетического материала из животного или человека;determining overall coverage in a self-versus-self comparison by counting all bases of the reference genome that are covered by both of said first animal or human genetic material sample and said second animal or human genetic material sample;

деление указанного общего покрытия при сравнении с опухолью на указанное общее покрытие при сравнении «сам против себя» с получением нормализации;dividing said total coverage when compared to a tumor by said total coverage when comparing self-versus-self to obtain a normalization;

определение частоты ложноположительных результатов путем деления 1) количества однонуклеотидных вариаций с баллом качества выше, чем Q при сравнении указанного первого образца генетического материала из животного или человека и указанного второго образца генетического материала из животного или человека, на 2) количество однонуклеотидных вариаций с показателем качества выше, чем Q при сравнении указанного первого образца генетического материала из указанных опухолевых клеток и указанного второго образца генетического материала из указанных опухолевых клеток и путем 3) умножения полученного результата на указанную нормализацию.determining the false positive rate by dividing 1) the number of single nucleotide variations with a quality score greater than Q when comparing said first sample of animal or human genetic material and said second sample of animal or human genetic material by 2) the number of single nucleotide variations with a quality score greater than than Q when comparing said first sample of genetic material from said tumor cells and said second sample of genetic material from said tumor cells and 3) multiplying the result by said normalization.

В одном воплощении, указанный генетический материал является ДНК.In one embodiment, said genetic material is DNA.

В одном воплощении, Q определяют с помощью:In one embodiment, Q is determined using:

установления ряда качественных признаков S=(s1,…,sn), где S предпочтительней T=(t1,…,tn), что обозначается через S>T, где si > ti для всех i=1,…,n;establishing a number of qualitative features S=(s 1 ,…,s n ), where S is preferable to T=(t 1 ,…,t n ), which is denoted by S>T, where s i > t i for all i=1, …,n;

определения частоты ложноположительных результатов путем деления 1) количества однонуклеотидных вариаций с баллом качества выше, чем Q, при сравнении указанного первого образца генетического материала из животного или человека и указанного второго образца генетического материала из животного или человека, на 2) количество однонуклеотидных вариаций с показателем качества выше, чем Q, при сравнении указанного первого образца генетического материала из указанных опухолевых клеток и указанного второго образца генетического материала из указанных опухолевых клеток и путем 3) умножения полученного результата на указанную нормализацию:determining the false positive rate by dividing 1) the number of single nucleotide variations with a quality score greater than Q when comparing said first sample of animal or human genetic material and said second sample of animal or human genetic material by 2) the number of single nucleotide variations with a quality score higher than Q when comparing said first sample of genetic material from said tumor cells and said second sample of genetic material from said tumor cells and by 3) multiplying the result obtained by said normalization:

определения интервала значений для каждого свойства для m мутаций с n всех качественных признаков для каждого;determining a range of values for each property for m mutations with n all qualitative features for each;

выборочный отбор до p значений из указанного интервала значений;selective selection of up to p values from the specified range of values;

создание всех возможных комбинаций из выбранных значений качества, что приводит в результате к получению pn экспериментальных точек;creating all possible combinations of the selected quality values, resulting in p n experimental points;

применения случайного образца указанных экспериментальных точек в качестве прогнозирующего параметра для обучения «случайного леса»;applying a random sample of said experimental points as a predictive parameter for training the "random forest";

применения соответствующего промежуточного значения частоты ложноположительных результатов в качестве ответа для указанного обучения «случайного леса»,applying the appropriate intermediate false positive rate as the answer for the specified random forest training,

где полученный в результате балл регрессии указанного обучения «случайного леса» представляет собой Q.where the resulting regression score of the specified "random forest" training is Q.

В одном воплощении, указанный второй образец ДНК из животного или человека является аллогенным по отношению к указанному первому образцу ДНК из животного или человека. В одном воплощении, указанный второй образец ДНК из животного или человека является аутологичным по отношению к указанному первому образцу ДНК из животного или человека. В одном воплощении, указанный второй образец ДНК из животного или человека является ксеногенным по отношению к указанному первому образцу ДНК из животного или человека.In one embodiment, said second animal or human DNA sample is allogeneic to said first animal or human DNA sample. In one embodiment, said second animal or human DNA sample is autologous to said first animal or human DNA sample. In one embodiment, said second animal or human DNA sample is xenogeneic to said first animal or human DNA sample.

В одном воплощении, указанный генетический материал является РНК.In one embodiment, said genetic material is RNA.

В одном воплощении, Q определяют с помощью:In one embodiment, Q is determined using:

установления ряда качественных признаков S=(s1,…,sn), где S предпочтительней T=(t1,…,tn), что обозначается через S>T, где si > ti для всех i=1,…,n;establishing a number of qualitative features S=(s 1 ,…,s n ), where S is preferable to T=(t 1 ,…,t n ), which is denoted by S>T, where s i > t i for all i=1, …,n;

определения промежуточного частоты ложноположительных результатов путем деления 1) количества однонуклеотидных вариаций с показателем качества S>T при сравнении указанного первого образца РНК из животного или человека и указанного второго образца РНК из животного или человека, на 2) количество однонуклеотидных вариаций с показателем качества S>T при сравнении указанного первого образца РНК из указанных опухолевых клеток и указанного второго образца РНК из указанных опухолевых клеток и путем 3) умножения полученного результата на указанную нормализацию;determining an intermediate false positive rate by dividing 1) the number of single nucleotide variations with quality score S>T when comparing said first animal or human RNA sample and said second animal or human RNA sample by 2) the number of single nucleotide variations with quality score S>T comparing said first RNA sample from said tumor cells and said second RNA sample from said tumor cells and 3) multiplying the result by said normalization;

определения интервала значений для каждого свойства для m мутаций с n всех качественных признаков;determining a range of values for each property for m mutations with n all qualitative features;

выборочный отбор до p значений из указанного интервала значений;selective selection of up to p values from the specified range of values;

создание всех возможных комбинаций из выбранных качественных значений, что приводит в результате к получению pn экспериментальных точек;creation of all possible combinations from the selected qualitative values, which results in obtaining p n experimental points;

применения случайного образца указанных экспериментальных точек в качестве прогнозирующего параметра для обучения «случайного леса»;applying a random sample of said experimental points as a predictive parameter for training the "random forest";

применения соответствующего промежуточного значения частоты ложноположительных результатов в качестве ответа на указанное обучение «случайного леса»,applying the appropriate intermediate false positive rate as a response to the specified random forest training,

где полученный в результате балл регрессии указанного обучения случайного леса представляет собой Q.where the resulting regression score of the specified random forest training is Q.

В одном воплощении, указанный второй образец РНК из животного или человека является аллогенным по отношению к указанному первому образцу РНК из животного или человека. В одном воплощении, указанный второй образец РНК из животного или человека является аутологичным по отношению к указанному первому образцу РНК из животного или человека. В одном воплощении, указанный второй образец РНК из животного или человека является ксеногенным по отношению к указанному первому образцу РНК из животного или человека.In one embodiment, said second animal or human RNA sample is allogeneic to said first animal or human RNA sample. In one embodiment, said second animal or human RNA sample is autologous to said first animal or human RNA sample. In one embodiment, said second animal or human RNA sample is xenogeneic to said first animal or human RNA sample.

В одном воплощении, указанная частота ложноположительных результатов применяется для получения вакцинного состава. В одном воплощении вакцина доставляется внутривенно. В одном воплощении вакцина доставляется внутрикожно. В одном воплощении вакцина доставляется внутримышечно. В одном воплощении вакцина доставляется подкожно. В одном воплощении указанная вакцина специально создана для конкретного пациента.In one embodiment, the specified false positive rate is used to obtain a vaccine formulation. In one embodiment, the vaccine is delivered intravenously. In one embodiment, the vaccine is delivered intradermally. In one embodiment, the vaccine is delivered intramuscularly. In one embodiment, the vaccine is delivered subcutaneously. In one embodiment, said vaccine is specifically designed for a particular patient.

В одном воплощении один из числа указанного первого образца генетического материала из животного или человека и указанного второго образца генетического материала из животного или человека взят у указанного конкретного пациента.In one embodiment, one of said first animal or human genetic material sample and said second animal or human genetic material sample is from said particular patient.

В одном воплощении в указанной стадии определения общего покрытия при сравнении с опухолью путем подсчета всех оснований эталонного генома, который включен как в опухоль, так и, по меньшей мере, в один из числа указанного первого образца генетического материала из животного или человека и указанного второго образца генетического материала из животного или человека, применяется автоматизированная система подсчета всех оснований;In one embodiment, in said step of determining overall coverage when compared to a tumor by counting all bases of a reference genome that is included both in the tumor and in at least one of said first sample of animal or human genetic material and said second sample genetic material from an animal or human, an automated all-base scoring system is used;

В одном воплощении в указанной стадии определения общего покрытия при сравнении «сам против себя» путем подсчета всех оснований эталонного генома, которые перекрываются в обоих из числа указанного первого образца генетического материала из животного или человека и указанного второго образца генетического материала из животного или человека, применяется указанная автоматизированная система.In one embodiment, in said step of determining overall coverage in a self-versus-self comparison by counting all the reference genome bases that overlap in both of said first animal or human genetic material sample and said second animal or human genetic material sample, specified automated system.

В одном воплощении в указанной стадии деления указанного общего покрытия при сравнении с опухолью на указанное общее покрытие при сравнении «сам против себя» с получением нормализации, применяется указанная автоматизированная система.In one embodiment, in said step of dividing said total coverage compared with a tumor by said total coverage in a self-versus-self comparison to obtain a normalization, said automated system is applied.

В одном воплощении указанная стадия определения частоты ложноположительных результатов путем деления 1) количества однонуклеотидных вариаций с баллом качества выше, чем Q при сравнении указанного первого образца генетического материала из животного или человека и указанного второго образца генетического материала из животного или человека, на 2) количество однонуклеотидных вариаций с баллом качества выше чем Q в сравнении указанного первого образца генетического материала из указанных опухолевых клеток и указанного второго образца генетического материала из указанных опухолевых клеток и путем 3) умножения полученного результата на указанную нормализацию.In one embodiment, said step of determining a false positive rate by dividing 1) the number of single nucleotide variations with a quality score greater than Q when comparing said first sample of animal or human genetic material and said second sample of animal or human genetic material by 2) the number of single nucleotide variations variations with a quality score higher than Q by comparing said first sample of genetic material from said tumor cells and said second sample of genetic material from said tumor cells and 3) multiplying the result obtained by said normalization.

Другой аспект изобретения относится к способу определения расчетной кривой соотношений правильного и ложного обнаружения сигналов (ROC), причем указанный способ включает:Another aspect of the invention relates to a method for determining a calculated true/false detection ratio (ROC) curve, said method comprising:

получение набора данных мутаций, причем каждая мутация ассоциирована с частотой ложноположительных результатов (FDR); иobtaining a mutation data set, each mutation being associated with a false positive rate (FDR); and

для каждой мутации:for each mutation:

определение частоты истинно положительных результатов (TPR) путем вычитания указанного FDR из единицы; иdetermining a true positive rate (TPR) by subtracting said FDR from one; and

определение частоты ложноположительных результатов (FPR) путем установления указанного FPR равным указанному FDR; иdetermining a false positive rate (FPR) by setting said FPR equal to said FDR; and

получение расчетной ROC путем построения, для каждой мутации, точки при суммарных значениях TPR и FPR до указанной мутации, деленных на сумму всех значений TPR и FPR.obtaining an estimated ROC by plotting, for each mutation, a point at the sum of the TPR and FPR values prior to the specified mutation, divided by the sum of all TPR and FPR values.

Другие особенности и преимущества настоящего изобретения будут видны из следующего детального описания и из приложенной формулы изобретения.Other features and advantages of the present invention will appear from the following detailed description and from the appended claims.

Подробное описание изобретенияDetailed description of the invention

Хотя настоящее изобретение будет описано подробно ниже, следует принять к сведению, что это изобретение не ограничивается описанными здесь конкретными методологией, протоколами и реактивами, поскольку они могут меняться. Также следует принять к сведению, что использованная здесь терминология необходима только для целей описания конкретных воплощений, и не предназначена для ограничения объема настоящего изобретения, который будет ограничен только прилагаемой формулой изобретения. Если иное не указано, все технические и научные термины, использованные здесь, имеют те же смыслы, которые вкладываются в них обычными специалистами в данной области. Although the present invention will be described in detail below, it should be noted that this invention is not limited to the specific methodology, protocols, and reagents described here, as they may change. It should also be appreciated that the terminology used here is only for the purposes of describing specific embodiments, and is not intended to limit the scope of the present invention, which will be limited only by the appended claims. Unless otherwise indicated, all technical and scientific terms used herein have the same meanings as those of ordinary skill in the art.

Далее будут описаны элементы настоящего изобретения. Эти элементы перечислены с конкретными воплощениями, однако следует понимать, что они могут объединяться любым способом и в любом количестве с созданием дополнительных воплощений. По-разному описанные примеры и предпочтительные воплощения не следует рассматривать как ограничения настоящего изобретения, они предназначены исключительно для ясного описания воплощений. Следует понимать, что описание поддерживает и охватывает воплощения, которые объединяют ясно описанные воплощения с любым количеством раскрытых и/или предпочтительных воплощений. Кроме того, любые перестановки и комбинации всех описанных элементов в данной заявке следует рассматривать как раскрытые описанием настоящей заявки до тех пор, пока из контекста не следует иное. Например, если в предпочтительном воплощении РНК включает поли(A)-хвост, состоящий из 120 нуклеотидов, а в другом предпочтительном воплощении молекула РНК включает аналог 5’-кэпа, то в предпочтительном воплощении РНК включает поли(A)-хвост, состоящий из 120 нуклеотидов и аналог 5’-кэпа.Next, the elements of the present invention will be described. These elements are listed with specific embodiments, however, it should be understood that they can be combined in any manner and in any number to create additional embodiments. The variously described examples and preferred embodiments should not be construed as limitations of the present invention, but are intended solely to clearly describe the embodiments. It should be understood that the description supports and covers embodiments that combine the clearly described embodiments with any number of disclosed and/or preferred embodiments. In addition, any permutations and combinations of all described elements in this application should be considered as disclosed by the description of this application until the context indicates otherwise. For example, if in a preferred embodiment the RNA comprises a 120 nucleotide poly(A) tail and in another preferred embodiment the RNA molecule comprises a 5' cap analogue, then in a preferred embodiment the RNA comprises a 120 nucleotide poly(A) tail. nucleotides and a 5'-cap analog.

Предпочтительно, термины, используемые в данном документе, определяются согласно описанию в «A multilingual glossary of biotechnological terms: (IUPAC Recommendations)», H.G.W. Leuenberger, B. Nagel, and H.

Figure 00000001
Eds., (1995) Helvetica Chimica Acta, CH-4010 Basel, Switzerland.Preferably, the terms used herein are defined as described in "A multilingual glossary of biotechnological terms: (IUPAC Recommendations)", HGW Leuenberger, B. Nagel, and H.
Figure 00000001
Eds., (1995) Helvetica Chimica Acta, CH-4010 Basel, Switzerland.

При осуществлении настоящего изобретения будут использоваться, если не указано иное, обычные методы биохимии, клеточной биологии, иммунологии и технологии рекомбинантных ДНК, которые объяснены в публикациях, принадлежащих к данной области техники (см., например, Molecular Cloning: A Laboratory Manual, 2nd Edition, J. Sambrook et al. eds., Cold Spring Harbor Laboratory Press, Cold Spring Harbor 1989).In carrying out the present invention will be used, unless otherwise indicated, conventional methods of biochemistry, cell biology, immunology and recombinant DNA technology, which are explained in publications belonging to the technical field (see, for example, Molecular Cloning: A Laboratory Manual, 2 nd Edition, J. Sambrook et al.eds., Cold Spring Harbor Laboratory Press, Cold Spring Harbor 1989).

Во всем этом описании и в формуле изобретения ниже, если контекст не требует иного, слово «включает» и вариации, такие как «содержит» или «содержащий» будут подразумевать включение заявленных установленных компонентов, чисел или стадий, или группы компонентов, чисел или стадий, но не исключение любых других компонентов, чисел или стадий, или группы компонентов, чисел или стадий, хотя в некоторых воплощениях такие другие компоненты, числа или стадии могут быть исключены, т.е. объект изобретения состоят из включения установленных компонентов, чисел или стадий, или группы компонентов, чисел или стадий. Подразумевается, что термины в единственном числе в контексте описания изобретения (и особенно в контексте формулы изобретения) охватывают как форму единственного числа, так и множественного числа до тех пор, пока в данном документе не указано иное или до тех пор пока нет очевидного противоречия контексту. Перечисление интервалов в данном документе предназначено всего лишь для того, чтобы служить в качестве метода сокращения индивидуального обозначения для каждого отдельного значения, попадающего в интервал. До тех пор, пока в данном документе не указано иное, каждое индивидуальное значение включено в описание, как если бы оно было индивидуально перечислено в данном документе.Throughout this description and in the claims below, unless the context otherwise requires, the word "comprises" and variations such as "comprises" or "comprising" will be intended to include the stated stated components, numbers, or steps, or a group of components, numbers, or steps. , but not the exclusion of any other components, numbers, or steps, or a group of components, numbers, or steps, although in some embodiments, such other components, numbers, or steps may be excluded, i.e. the object of the invention consist of the inclusion of specified components, numbers or steps, or a group of components, numbers or steps. Terms in the singular in the context of the description of the invention (and especially in the context of the claims) are intended to cover both the singular and the plural, unless otherwise specified herein or unless there is an obvious conflict with the context. The range enumeration in this document is only intended to serve as a method of shortening the individual notation for each individual value that falls within the range. Until otherwise specified in this document, each individual value is included in the description as if it were individually listed in this document.

Все способы, описанные в данном документе, могут осуществляться в любом подходящем порядке, если в данном документе не указано иное или если иное очевидно не следует из контекста. Использование любого из примеров и всех примеров, или типичного выражения (например, «такой как»), представленное в данном документе, предназначено всего лишь для лучшей иллюстрации изобретения и не ограничивает объем изобретения, заявленного иным способом. Никакая формулировка в описании не должна толковаться в качестве обозначения любого не заявленного элемента, существенного для практического применения изобретения.All of the methods described herein may be performed in any suitable order, unless otherwise indicated herein or unless the context clearly dictates otherwise. The use of any of the examples and all examples, or exemplary expression (eg, "such as") provided herein, is only intended to better illustrate the invention and does not limit the scope of the invention otherwise claimed. No wording in the specification is to be construed as denoting any unclaimed element essential to the practice of the invention.

Несколько документов цитируются по всему тексту данного описания. Каждый из документов, процитированных в данном документе (включая все патенты, патентные заявки, научные публикации, описания производителя, инструкции, и т.д.), процитированные либо выше, либо ниже по тексту, включены таким образом ссылкой в полном объеме. Ничто в данном документе не должно быть истолковано как признание того, что изобретение не имеет право на изменение даты на более раннюю дату по отношению к противопоставленному документу вследствие более раннего создания настоящего изобретения (antedate).Several documents are cited throughout this specification. Each of the documents cited in this document (including all patents, patent applications, scientific publications, manufacturer's descriptions, instructions, etc.) cited either above or below is hereby incorporated by reference in its entirety. Nothing in this document should be construed as an admission that the invention is not entitled to change the date to an earlier date in relation to the opposed document due to the earlier creation of the present invention (antedate).

Вакцина, предлагаемая согласно изобретению, представляет собой рекомбинантную вакцину.The vaccine according to the invention is a recombinant vaccine.

Термин «рекомбинантный» в контексте настоящего изобретения означает «сделанный с применением генетической инженерии». Предпочтительно, «рекомбинантный компонент», такой как рекомбинантный полипептид в контексте настоящего изобретения не является природным и предпочтительно является результатом комбинации компонентов, таких как аминокислотные последовательности и последовательности нуклеиновой кислоты, которые не объединены в природе. Например, рекомбинантный полипептид в контексте настоящего изобретения может содержать несколько аминокислотных последовательностей, таких как неоэпитопы или вакцинные последовательности, выделенные из различных белков или различных частей одного белка, сшитые вместе, например, посредством пептидных связей или подходящих линкеров.The term "recombinant" in the context of the present invention means "made using genetic engineering". Preferably, a "recombinant component" such as a recombinant polypeptide in the context of the present invention is not naturally occurring and preferably results from a combination of components such as amino acid sequences and nucleic acid sequences that are not naturally combined. For example, a recombinant polypeptide in the context of the present invention may contain several amino acid sequences, such as neoepitopes or vaccine sequences, isolated from different proteins or different parts of the same protein, linked together, for example, via peptide bonds or suitable linkers.

Термин «природный» при использовании в данном документе обозначает тот факт, что объект может быть обнаружен в естественной среде. Например, пептид или нуклеиновая кислота, которые присутствуют в организме (включая вирусы) и могут быть выделены из источника в естественной среде и которые не были специально модифицированы человеком в лаборатории, являются природными.The term "natural" when used in this document refers to the fact that the object can be found in the natural environment. For example, a peptide or nucleic acid that is present in the body (including viruses) and can be isolated from a source in the natural environment and that has not been specially modified by humans in a laboratory is natural.

Согласно изобретению термин «вакцина» относится к фармацевтическому препарату (фармацевтической композиции) или к продукту, который при введении индуцирует иммунный ответ, конкретно клеточный иммунный ответ, который распознает и атакует патоген или больную клетку, такую как раковая клетка. Вакцина может использоваться для предотвращения или лечения заболевания. Термин «индивидуальная противоопухолевая вакцина» касается конкретного онкопациента и означает, что противоопухолевая вакцина адаптирована для нужд или особых обстоятельств индивидуального онкопациента.According to the invention, the term "vaccine" refers to a pharmaceutical preparation (pharmaceutical composition) or product that, when administered, induces an immune response, specifically a cellular immune response that recognizes and attacks a pathogen or a diseased cell, such as a cancer cell. The vaccine may be used to prevent or treat a disease. The term "individual cancer vaccine" refers to a specific cancer patient and means that the cancer vaccine is tailored to the needs or special circumstances of the individual cancer patient.

Термин «иммунный ответ» относится к интегрированному ответу организма на антиген и предпочтительно относится к клеточному иммунному ответу или к клеточному, а также к гуморальному иммунному ответу. Иммунный ответ может быть защитным/превентивным/профилактическим и/или терапевтическим.The term "immune response" refers to the body's integrated response to an antigen, and preferably refers to a cellular immune response or a cellular as well as a humoral immune response. The immune response may be protective/preventive/prophylactic and/or therapeutic.

«Индукция иммунного ответа» может означать, что перед индукцией не было никакого иммунного ответа против конкретного антигена, но это также может означать, что перед индукцией имелся определенный уровень иммунного ответа против конкретного антигена, и после индукции указанного иммунного ответа он усилился. Таким образом, «индукция иммунного ответа» также включает «усиление иммунного ответа». Предпочтительно, после индукции иммунного ответа у объекта указанный объект защищен от развития заболевания, такого как злокачественное новообразование, или путем индукции иммунного ответа улучшается патологическое состояние. Например, иммунный ответ против антигена, экспрессируемого опухолью, может быть индуцирован у пациента, имеющего злокачественное новообразование, или у объекта с риском развития злокачественного новообразования. Индукция иммунного ответа в данном случае может означать, что патологическое состояние объекта улучшается, что у объекта не разовьются метастазы, или что у объекта с риском развития злокачественного новообразования не разовьется злокачественное новообразование."Induction of an immune response" can mean that there was no immune response against a particular antigen before induction, but it can also mean that there was a certain level of immune response against a particular antigen before induction, and after the induction of said immune response, it increased. Thus, "induction of an immune response" also includes "enhancement of an immune response". Preferably, after inducing an immune response in an object, said object is protected from the development of a disease, such as malignancy, or the pathological condition is improved by inducing an immune response. For example, an immune response against an antigen expressed by a tumor can be induced in a patient having cancer or in a subject at risk of developing cancer. The induction of an immune response in this case may mean that the pathological state of the subject is improving, that the subject will not develop metastases, or that the subject at risk of developing malignancy will not develop malignant neoplasm.

Подразумевается, что «клеточный иммунный ответ», «клеточный ответ», «клеточный ответ против антигена» или аналогичный термин включает клеточный ответ, направленный на клетки, отличающиеся презентацией антигена с помощью MHC класса I и класса II. Клеточный ответ относится к клеткам, называемым T-клетки или T-лимфоциты, которые действуют либо как «хэлперы», либо как «киллеры». Хэлперные T-клетки (также обозначаемые CD4+ T-клетки) играют центральную роль путем регуляции иммунного ответа, и киллерные клетки (также называемые цитотоксическими T-клетками, цитолитическими T-клетками, CD8+ T-клетками или CTL) убивают больные клетки, такие как опухолевые клетки, предотвращая продуцирование большего количества больных клеток. В предпочтительных воплощениях настоящее изобретение включает стимуляцию противоопухолевого CTL-ответа против опухолевых клеток, экспрессирующих один или несколько антигенов, экспрессированных опухолью, и предпочтительно, презентирующих такие антигены, экспрессированные опухолью, с помощью MHC класса I."cellular immune response", "cellular response", "cellular response against antigen" or a similar term is meant to include a cellular response directed at cells differing in antigen presentation by MHC class I and class II. The cellular response refers to cells called T-cells or T-lymphocytes, which act as either "helpers" or "killers". Helper T cells (also called CD4 + T cells) play a central role by regulating the immune response, and killer cells (also called cytotoxic T cells, cytolytic T cells, CD8 + T cells, or CTLs) kill diseased cells such as like tumor cells, preventing the production of more diseased cells. In preferred embodiments, the present invention includes stimulating an anti-tumor CTL response against tumor cells expressing one or more tumor-expressed antigens, and preferably presenting such tumor-expressed antigens, with MHC class I.

«Антиген» согласно изобретению охватывает любое вещество, которое будет вызывать иммунный ответ. Конкретно, «антиген» относится к любому веществу, предпочтительно, к пептиду или белку, который специфично реагирует с антителами или T-лимфоцитами (T-клетками). Согласно настоящему изобретению термин «антиген» включает любую молекулу, которая включает, по меньшей мере, один эпитоп. Предпочтительно, антиген в контексте настоящего изобретения представляет собой молекулу, которая необязательно после процессирования индуцирует иммунную реакцию, которая предпочтительно специфична по отношению к антигену (включая клетки, экспрессирующие антиген). Согласно настоящему изобретению может использоваться любой подходящий антиген, который является кандидатом для иммунной реакции, где иммунная реакция предпочтительно представляет собой клеточную иммунную реакцию. В контексте воплощений настоящего изобретения антиген предпочтительно презентируется клеткой, предпочтительно антигенпрезентирующей клеткой, которая включает больную клетку, конкретно опухолевую клетку, в контексте молекул MHC, что приводит в результате к иммунной реакции против антигена. Антиген предпочтительно представляет собой продукт, который соответствует природному антигену или выделен из него. Такие природные антигены включают опухолевые антигены."Antigen" according to the invention encompasses any substance that will elicit an immune response. Specifically, "antigen" refers to any substance, preferably a peptide or protein, that specifically reacts with antibodies or T-lymphocytes (T-cells). According to the present invention, the term "antigen" includes any molecule that includes at least one epitope. Preferably, an antigen in the context of the present invention is a molecule that optionally, after processing, induces an immune response that is preferably specific for the antigen (including cells expressing the antigen). Any suitable antigen that is a candidate for an immune response can be used according to the present invention, where the immune response is preferably a cellular immune response. In the context of embodiments of the present invention, the antigen is preferably presented by a cell, preferably an antigen presenting cell, which includes a diseased cell, specifically a tumor cell, in the context of MHC molecules, resulting in an immune response against the antigen. The antigen is preferably a product that matches or is derived from a naturally occurring antigen. Such natural antigens include tumor antigens.

В предпочтительном воплощении антиген представляет собой опухолевый антиген, т.е. часть опухолевой клетки, такую как белок или пептид, экспрессированный в опухолевой клетке, который может быть выделен из цитоплазмы, с клеточной поверхности или из ядра клетки, в частности, который изначально присутствует во внутриклеточном пространстве ил в виде поверхностных антигенов опухолевых клеток. Например, опухолевые антигены включают карциноэмбриональный антиген, α1-фетопротеин, изоферритин и фетальный сульфогликопротеин, α2-H-ферропротеин и γ-фетопротеин. Согласно настоящему изобретению опухолевый антиген предпочтительно включает любой антиген, который экспрессируется в определенном типе опухоли и необязательно является характерной чертой по отношению к типу и/или уровню экспрессии для опухолей или злокачественных образований, а также для опухолевых или раковых клеток. В одном воплощении термин «опухолевый антиген» или «опухолеспецифичный антиген» относится к белкам, которые при нормальных условиях специфично экспрессируются в ограниченном количестве тканей и/или органов или на определенных стадиях развития, например, опухолевый антиген может в нормальных условиях специфично экспрессироваться в ткани желудка, предпочтительно, в слизистой желудка, в репродуктивных органах, например, в яичках, в трофобластной ткани, например, в плаценте, или в зародышевых клеточных линиях, и они экспрессируются или аберрантно экспрессируются в одной или в нескольких опухолевых или раковых тканях. В данном контексте, «ограниченное количество» предпочтительно означает не более чем 3, более предпочтительно не более чем 2. Опухолевые антигены в контексте настоящего изобретения включают, например, дифференцировочные антигены, предпочтительно, специфичные для клеточного типа дифференцировочные антигены, т.е. белки, которые при нормальных условиях специфично экспрессируются в определенном клеточном типе на определенной стадии дифференцировки, антигены злокачественного новообразования/яичка, т.e., белки, которые при нормальных условиях специфично экспрессируются в яичке и иногда в плаценте, и антигены, специфичные для зародышевой клеточной линии. Предпочтительно, опухолевый антиген или аберрантная экспрессия опухолевого антигена идентифицирует раковые клетки. В контексте настоящего изобретения опухолевый антиген, который экспрессируется раковой клеткой объекта, например, пациента, страдающего онкологическим заболеванием, предпочтительно представляет собой собственный белок у указанного объекта. В предпочтительных воплощениях опухолевый антиген в контексте настоящего изобретения специфично экспрессируется при нормальных условиях в ткани или в органе, которые не является существенным, т.е. ткань или органы, которые при разрушении с помощью иммунной системы не приводят к смерти объекта, или в органах или структурах организма, которые не доступны или труднодоступны для иммунной системы.In a preferred embodiment, the antigen is a tumor antigen, i. part of the tumor cell, such as a protein or peptide expressed in the tumor cell, which can be isolated from the cytoplasm, from the cell surface or from the nucleus of the cell, in particular, which is initially present in the intracellular space or as surface antigens of the tumor cells. For example, tumor antigens include carcinoembryonic antigen, α1-fetoprotein, isoferritin and fetal sulfoglycoprotein, α2-H-ferroprotein and γ-fetoprotein. According to the present invention, the tumor antigen preferably includes any antigen that is expressed in a certain type of tumor and is optionally characteristic in relation to the type and/or level of expression for tumors or malignancies, as well as for tumor or cancer cells. In one embodiment, the term "tumor antigen" or "tumor-specific antigen" refers to proteins that under normal conditions are specifically expressed in a limited number of tissues and/or organs or at certain stages of development, for example, a tumor antigen may under normal conditions be specifically expressed in gastric tissue. , preferably in the gastric mucosa, in the reproductive organs, for example, in the testicles, in trophoblastic tissue, for example, in the placenta, or in germ cell lines, and they are expressed or aberrantly expressed in one or more tumor or cancer tissues. In this context, "limited number" preferably means no more than 3, more preferably no more than 2. Tumor antigens in the context of the present invention include, for example, differentiation antigens, preferably cell type-specific differentiation antigens, i. proteins that under normal conditions are specifically expressed in a certain cell type at a certain stage of differentiation, cancer/testis antigens, i.e., proteins that under normal conditions are specifically expressed in the testis and sometimes in the placenta, and germ cell specific antigens lines. Preferably, the tumor antigen or aberrant expression of the tumor antigen identifies cancer cells. In the context of the present invention, a tumor antigen that is expressed by a cancer cell of a subject, for example a cancer patient, is preferably a self-protein of said subject. In preferred embodiments, the tumor antigen in the context of the present invention is specifically expressed under normal conditions in a tissue or organ that is not essential, i. tissue or organs that, when destroyed by the immune system, do not result in the death of the subject, or in organs or structures of the body that are not accessible or difficult to access by the immune system.

Согласно изобретению термины «опухолевый антиген», «антиген, экспрессированный опухолью», «антиген злокачественного новообразования» и «антиген, экспрессированный клетками злокачественного новообразования» эквивалентны и используются в данном документе взаимозаменяемо.According to the invention, the terms "tumor antigen", "tumor expressed antigen", "cancer antigen" and "antigen expressed by cancer cells" are equivalent and are used interchangeably herein.

Термин «иммуногенность» относится к относительной эффективности антигена для индукции иммунной реакции.The term "immunogenicity" refers to the relative effectiveness of an antigen in inducing an immune response.

«Антигенный пептид» согласно изобретению предпочтительно относится к части или к фрагменту антигена, который способен стимулировать иммунный ответ, предпочтительно, клеточный ответ против антигена или клеток, характеризующихся экспрессией антигена, предпочтительно, с помощью презентации антигена, таких как больные клетки, конкретно, раковые клетки. Предпочтительно, антигенный пептид способен стимулировать клеточный иммунитет против клетки, характеризующейся презентацией антигена с помощью MHC класса I и предпочтительно способен стимулировать антигенреспонсивные цитотоксические T-лимфоциты (CTL). Предпочтительно, антигенные пептиды согласно изобретению представляют собой пептиды, которые презентируются MHC класса I и/или класса II, или которые могут процессироваться с получением пептидов, презентируемых MHC класса I и/или класса II. Предпочтительно, антигенные пептиды включают аминокислотную последовательность, по существу соответствующую аминокислотной последовательности фрагмента антигена. Предпочтительно, указанный фрагмент антигена представляет собой пептид, презентированный MHC класса I и/или класса II. Предпочтительно, антигенный пептид согласно изобретению включает аминокислотную последовательность, по существу соответствующую аминокислотной последовательности такого фрагмента, и процессируется с получением такого фрагмента, т.е. пептида, презентируемого MHC класса I и/или класса II, который выделен из антигена.An "antigenic peptide" according to the invention preferably refers to a portion or fragment of an antigen which is capable of stimulating an immune response, preferably a cellular response against the antigen or cells expressing the antigen, preferably by antigen presentation, such as diseased cells, in particular cancer cells. . Preferably, the antigenic peptide is capable of stimulating cellular immunity against a cell characterized by antigen presentation by MHC class I, and preferably is capable of stimulating antigen-responsive cytotoxic T lymphocytes (CTL). Preferably, the antigenic peptides of the invention are peptides that are presented by MHC class I and/or class II, or which can be processed to produce peptides presented by MHC class I and/or class II. Preferably, the antigenic peptides comprise an amino acid sequence substantially corresponding to the amino acid sequence of the antigen fragment. Preferably, said antigen fragment is a peptide presented by MHC class I and/or class II. Preferably, the antigenic peptide of the invention comprises an amino acid sequence substantially corresponding to the amino acid sequence of such a fragment, and is processed to obtain such a fragment, i.e. a peptide presented by MHC class I and/or class II, which is isolated from the antigen.

Если пептид будет презентироваться непосредственно, т.е. без процессирования, в частности, без расщепления, то он будет иметь длину, которая подходит для связывания с молекулой MHC, конкретно с молекулой MHC класса I, и предпочтительно его длина составляет 7-20 аминокислот, более предпочтительно, 7-12 аминокислот, более предпочтительно, 8-11 аминокислот, конкретно, 9 или 10 аминокислот.If the peptide will be presented directly, i.e. without processing, in particular without cleavage, then it will have a length that is suitable for binding to an MHC molecule, in particular an MHC class I molecule, and preferably its length is 7-20 amino acids, more preferably 7-12 amino acids, more preferably , 8-11 amino acids, specifically 9 or 10 amino acids.

Если пептид является частью более крупного компонента, включающего дополнительные последовательности, например, вакцинной последовательности или полипептида, и презентируется после процессирования, конкретно после расщепления, то пептид, полученный с помощью процессирования, имеет длину, которая подходит для связывания с молекулой MHC, конкретно с молекулой MHC класса I, и предпочтительно, его длина составляет 7-20 аминокислот, более предпочтительно, 7-12 аминокислот, более предпочтительно, 8-11 аминокислот, конкретно, 9 или 10 аминокислот. Предпочтительно, последовательность пептида, который будет презентироваться после процессирования, выделена из аминокислотной последовательности антигена, т.е., его последовательность по существу соответствует и предпочтительно полностью идентична фрагменту антигена. Таким образом, антигенный пептид или вакцинная последовательность согласно изобретению в одном воплощении включает последовательность длиной 7-20 аминокислот, более предпочтительно, 7-12 аминокислот, более предпочтительно, 8-11 аминокислот, конкретно, 9 или 10 аминокислот, которые по существу соответствуют и предпочтительно полностью идентичны фрагменту антигена, а после процессирования антигенного пептида или вакцинной последовательности представляют собой презентированный пептид. Согласно изобретению такой пептид, полученный с помощью процессирования, включает идентифицированное изменение последовательности.If the peptide is part of a larger component containing additional sequences, such as a vaccine sequence or a polypeptide, and is presented after processing, specifically after cleavage, then the peptide obtained by processing is of a length that is suitable for binding to an MHC molecule, specifically to the molecule MHC class I, and preferably, its length is 7-20 amino acids, more preferably 7-12 amino acids, more preferably 8-11 amino acids, in particular 9 or 10 amino acids. Preferably, the sequence of the peptide to be presented after processing is derived from the amino acid sequence of the antigen, i.e., its sequence substantially corresponds to, and preferably is completely identical to, the antigen fragment. Thus, an antigenic peptide or vaccine sequence according to the invention in one embodiment comprises a sequence of 7-20 amino acids, more preferably 7-12 amino acids, more preferably 8-11 amino acids, in particular 9 or 10 amino acids, which substantially correspond to and preferably completely identical to the antigen fragment, and after processing the antigenic peptide or vaccine sequence, they are the presented peptide. According to the invention, such a peptide obtained by processing includes an identified sequence change.

Согласно изобретению антигенный пептид или эпитоп может быть представлен в вакцине в виде части более крупного компонента, такого как вакцинная последовательность и/или полипептид, включающий более чем один антигенный пептид или эпитоп. Присутствующий антигенный пептид или эпитоп получают после соответствующего процессирования.According to the invention, an antigenic peptide or epitope may be present in a vaccine as part of a larger component, such as a vaccine sequence and/or a polypeptide comprising more than one antigenic peptide or epitope. The antigenic peptide or epitope present is obtained after appropriate processing.

Пептиды, имеющие аминокислотные последовательности, по существу соответствующие последовательности пептида, которая презентируется молекулой MHC класса I, могут отличаться в одном или в нескольких остатках, которые не существенны для распознавания TCR пептида в качестве презентируемого молекулой MHC класса I, или могут отличаться по связыванию пептида с MHC. Такие по сути соответствующие пептиды также способны стимулировать антиген-респонсивные CTL и могут рассматриваться как иммунологически эквивалентные. Пептиды, имеющие аминокислотные последовательности, отличающиеся от презентируемых пептидов в остатке, который не влияет на распознавание TCR, но улучшает стабильность связывания с MHC, могут улучшить иммуногенность антигенного пептида и могут обозначаться в данном документе как «оптимизированные пептиды». С использованием имеющихся знания по поводу того, какой из этих остатков наиболее вероятно может влиять на связывание либо с MHC, либо с TCR, можно применять рациональный способ дизайна по сути подходящих пептидов. Полученные в результате функциональные пептиды, рассматриваются как антигенные пептиды.Peptides having amino acid sequences substantially corresponding to the sequence of the peptide that is presented by the MHC class I molecule may differ in one or more residues that are not essential for TCR recognition of the peptide as being presented by the MHC class I molecule, or may differ in the binding of the peptide to MHC. Such substantially corresponding peptides are also capable of stimulating antigen-responsive CTLs and may be considered immunologically equivalent. Peptides having amino acid sequences different from the presented peptides in a residue that does not affect TCR recognition but improves MHC binding stability can improve the immunogenicity of the antigenic peptide and may be referred to herein as "optimized peptides". With current knowledge as to which of these residues is most likely to influence binding to either the MHC or the TCR, a rational way to design essentially suitable peptides can be applied. The resulting functional peptides are considered antigenic peptides.

Антигенный пептид при презентации в MHC должен распознаваться T-клеточным рецептором. Предпочтительно, антигенный пептид, если он распознается T-клеточным рецептором, способен индуцировать в присутствии соответствующих ко-стимулирующих сигналов клональную экспансию T-клетки, несущей T-клеточный рецептор, специфично распознающий антигенный пептид. Предпочтительно, антигенные пептиды, в частности если они презентируются в контексте молекул MHC, способны стимулировать иммунный ответ, предпочтительно клеточный ответ против антигена, от которого они произошли, или против клеток, характеризующихся экспрессией антигена, и, предпочтительно, характеризующихся презентацией антигена. Предпочтительно, антигенный пептид способен стимулировать клеточный иммунитет против клетки, характеризующейся презентацией антигена с помощью MHC класса I и предпочтительно способной стимулировать антиген-респонсивные CTL. Такая клетка предпочтительно является клеткой-мишенью.The antigenic peptide, when presented to the MHC, must be recognized by the T-cell receptor. Preferably, the antigenic peptide, if recognized by the T cell receptor, is capable of inducing, in the presence of appropriate costimulatory signals, clonal expansion of the T cell carrying the T cell receptor specifically recognizing the antigenic peptide. Preferably, the antigenic peptides, in particular when presented in the context of MHC molecules, are capable of stimulating an immune response, preferably a cellular response, against the antigen from which they are derived or against cells expressing the antigen, and preferably presenting the antigen. Preferably, the antigenic peptide is capable of stimulating cellular immunity against a cell characterized by MHC class I antigen presentation and preferably capable of stimulating antigen-responsive CTLs. Such a cell is preferably a target cell.

«Процессирование антигена» или «процессирование» относится к деградации полипептида или антигена в продукты процессирования, которые представляют собой фрагменты указанного полипептида или антигена (например, деградация полипептида в пептиды) и к ассоциации одного или нескольких из таких фрагментов (например, посредством связывания) с молекулами MHC для презентации с помощью клеток, предпочтительно, антигенпрезентирующих клеток, специфическим T-клеткам."Antigen processing" or "processing" refers to the degradation of a polypeptide or antigen into processing products that are fragments of said polypeptide or antigen (e.g., degradation of the polypeptide into peptides) and the association of one or more of such fragments (e.g., via binding) with MHC molecules for presentation by cells, preferably antigen-presenting cells, to specific T cells.

«Антигенпрезентирующие клетки» (англ. Antigen presenting cells, APC) представляют собой клетки, которые презентируют пептидные фрагменты белковых антигенов в ассоциации с молекулами MHC на своей клеточной поверхности. Некоторые APC могут активировать антиген-специфичные T-клетки."Antigen presenting cells" (APCs) are cells that present peptide fragments of protein antigens in association with MHC molecules on their cell surface. Some APCs can activate antigen-specific T cells.

Специализированные антигенпрезентирующие клетки очень эффективны в интернализации антигена или посредством фагоцитоза, или посредством рецептор-опосредованного эндоцитоза, и последующем представлении фрагмента антигена, связанного с молекулой MHC класса II, на своей мембране. T-клетка распознает и взаимодействует с комплексом антиген-молекула MHC класса II на мембране антигенпрезентирующей клетки. Затем антигенпрезентирующей клеткой вырабатывается дополнительный ко-стимулирующий сигнал, приводя к активации T-клетки. Экспрессия ко-стимулирующих молекул представляет собой характерную черту специализированных антигенпрезентирующих клеток.Specialized antigen-presenting cells are very efficient in internalizing an antigen, either through phagocytosis or receptor-mediated endocytosis, and subsequently presenting an antigen fragment bound to an MHC class II molecule on their membrane. The T cell recognizes and interacts with the MHC class II antigen-molecule complex on the membrane of the antigen-presenting cell. An additional co-stimulatory signal is then produced by the antigen-presenting cell, leading to the activation of the T cell. The expression of co-stimulatory molecules is a characteristic feature of specialized antigen-presenting cells.

Основные типы специализированных антигенпрезентирующих клеток представляют собой дендритные клетки, которые обладают широким спектром антигенной презентации, и вероятно являются наиболее важными антигенпрезентирующими клетками, макрофаги, B-клетки и определенные активированные эпителиальные клетки.The main types of specialized antigen presenting cells are dendritic cells, which have a wide spectrum of antigen presentation, and are probably the most important antigen presenting cells, macrophages, B cells and certain activated epithelial cells.

Дендритные клетки (англ. Dendritic cells, DC) представляют собой популяцию лейкоцитов, которые презентируют захваченные в периферических тканях антигены T-клеткам посредством обоих антигенпрезентирующих путей, с помощью молекул MHC класса II и I. Хорошо известно, что дендритные клетки являются мощными индукторами иммунного ответа, а активация этих клеток является критической стадией индукции противоопухолевого иммунитета.Dendritic cells (DC) are a population of leukocytes that present antigens captured in peripheral tissues to T cells via both antigen-presenting pathways, using MHC class II and I molecules. It is well known that dendritic cells are powerful inducers of the immune response. , and the activation of these cells is a critical step in the induction of antitumor immunity.

Дендритные клетки стандартно классифицируют как «незрелые» и «зрелые» клетки, что может использоваться в качестве простого пути различения между двумя хорошо охарактеризованными фенотипами. Однако эта номенклатура не должна подразумевать исключения всех возможных промежуточных стадий дифференцировки.Dendritic cells are conventionally classified as "immature" and "mature" cells, which can be used as a simple way to distinguish between two well-characterized phenotypes. However, this nomenclature should not imply the exclusion of all possible intermediate stages of differentiation.

Незрелые дендритные клетки характеризуются как антигенпрезентирующие клетки с высокой способностью поглощения и процессирования антигена, которая коррелирует с высокой экспрессией рецептора Fcγ и маннозного рецептора. Зрелый фенотип, как правило, характеризуется более низкой экспрессией этих маркеров, но при этом высокой экспрессией молекул клеточной поверхности, ответственных за активацию T-клеток, таких как молекулы MHC класса I и II, молекул адгезии (например, CD54 и CD11) и ко-стимулирующих молекул (например, CD40, CD80, CD86 и 4-1 BB).Immature dendritic cells are characterized as antigen-presenting cells with high antigen uptake and processing capacity, which correlates with high Fcγ receptor and mannose receptor expression. The mature phenotype is typically characterized by lower expression of these markers, but high expression of cell surface molecules responsible for T cell activation, such as MHC class I and II molecules, adhesion molecules (eg, CD54 and CD11), and co- stimulatory molecules (eg, CD40, CD80, CD86 and 4-1 BB).

Созревание дендритных клеток обозначается как статус активации дендритной клетки, при котором такие антигенпрезентирующие дендритные клетки приводят к стимуляции Т-клеток, в то время как презентация незрелыми дендритными клетками приводит к устойчивости. Созревание дендритных клеток прежде всего вызвано биомолекулами с микробными свойствами, детектируемыми с помощью рецепторов врожденного иммунитета (бактериальная ДНК, вирусная РНК, эндотоксин и т.д.), про-воспалительных цитокинов (TNF, IL-1, IFN), лигированием CD40 на поверхности дендритных клеток с помощью CD40L, и веществами, высвобождаемыми из клеток в состоянии клеточной смерти под действием стресса. Дендритные клетки могут быть получены культивированием клеток костного мозга in vitro с использованием цитокинов, таких как гранулоцитарно-макрофагальный колониестимулирующий фактор (GM-CSF) и фактор некроза опухоли альфа.Dendritic cell maturation is referred to as the state of dendritic cell activation in which such antigen-presenting dendritic cells result in stimulation of T cells, while presentation by immature dendritic cells results in resistance. The maturation of dendritic cells is primarily driven by biomolecules with microbial properties, detected by innate immune receptors (bacterial DNA, viral RNA, endotoxin, etc.), pro-inflammatory cytokines (TNF, IL-1, IFN), CD40 ligation on the surface dendritic cells with CD40L, and substances released from cells in a state of cell death under stress. Dendritic cells can be obtained by culturing bone marrow cells in vitro using cytokines such as granulocyte-macrophage colony stimulating factor (GM-CSF) and tumor necrosis factor alpha.

Неспециализированные антигенпрезентирующие клетки не экспрессируют конститутивно белки MHC класса II, требуемые для взаимодействия с нативными T-клетками; они экспрессируются только при стимуляции неспециализированных антигенпрезентирующих клеток с помощью цитокинов, таких как IFNγ.Non-specialized antigen-presenting cells do not constitutively express MHC class II proteins required to interact with native T cells; they are only expressed when non-specialized antigen-presenting cells are stimulated with cytokines such as IFNγ.

«Антигенпрезентирующие клетки» могут быть нагружены пептидами, презентируемыми молекулами MHC класса I путем трансдукции клеток с использованием нуклеиновой кислоты, предпочтительно РНК, кодирующей пептид или полипептид, включающий презентируемый пептид, например, нуклеиновой кислотой, кодирующей антиген."Antigen-presenting cells" can be loaded with peptides presented by MHC class I molecules by transducing cells using a nucleic acid, preferably an RNA encoding a peptide or a polypeptide comprising the presenting peptide, for example, a nucleic acid encoding an antigen.

В некоторых воплощениях фармацевтическая композиция по изобретению, включающая носитель для доставки гена, целью которого являются дендритные или другие антигенпрезентирующие клетки, может вводиться пациенту, приводя в результате к трансфекции, которая осуществляется in vivo. In vivo трансфекция дендритных клеток может, как правило, осуществляться с использование методов, хорошо известных в данной области. таких как описанные в WO 97/24447, или с помощью метода генной пушки, описанного в Mahvi et al., Immunology and cell Biology 75: 456-460, 1997.In some embodiments, a pharmaceutical composition of the invention, comprising a gene delivery vehicle targeting dendritic or other antigen presenting cells, may be administered to a patient, resulting in transfection that occurs in vivo. In vivo transfection of dendritic cells can generally be carried out using techniques well known in the art. such as those described in WO 97/24447, or using the gene gun method described in Mahvi et al., Immunology and cell Biology 75: 456-460, 1997.

Согласно изобретению термин «антигенпрезентирующая клетка» также включает клетки-мишени.According to the invention, the term "antigen-presenting cell" also includes target cells.

«Клетка-мишень» будет обозначать клетку, которая является мишенью для иммунного ответа, такого как клеточный иммунный ответ. Клетки-мишени включают клетки, которые презентируют антиген или антигенный эпитоп, т.е. пептидный фрагмент, выделенный из антигена, и включают любую нежелательную клетку, такую как раковая клетка. В предпочтительных воплощениях клетка-мишень представляет собой клетку, экспрессирующую антиген, как описано в данном документе, и предпочтительно, презентирующая указанный антиген с помощью молекулы MHC класса I."Target cell" will mean a cell that is the target of an immune response, such as a cellular immune response. Target cells include cells that present an antigen or antigenic epitope, ie. a peptide fragment isolated from an antigen and include any unwanted cell such as a cancer cell. In preferred embodiments, the target cell is a cell expressing an antigen as described herein, and preferably presenting said antigen with an MHC class I molecule.

Термин «эпитоп» относится к антигенной детерминанте в молекуле, такой как антиген, т.е., к части в нем или к фрагменту молекулы, которая распознается иммунной системой, например, которая распознается T-клеткой, конкретно при презентации в контексте молекул MHC. Эпитоп белка, такого как опухолевый антиген предпочтительно включает непрерывный или прерывистый участок указанного белка и предпочтительно имеет длину 5-100 аминокислот, предпочтительно 5-50, более предпочтительно 8-30, наиболее предпочтительно 10-25 аминокислот, например, эпитоп может иметь длину предпочтительно 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, или 25 аминокислот. Особенно предпочтительно, если эпитоп в контексте настоящего изобретения представляет собой T-клеточный эпитоп.The term "epitope" refers to an antigenic determinant in a molecule, such as an antigen, i.e., a portion or fragment of a molecule that is recognized by the immune system, for example, that is recognized by a T cell, specifically when presented in the context of MHC molecules. An epitope of a protein such as a tumor antigen preferably comprises a continuous or discontinuous stretch of said protein and is preferably 5-100 amino acids in length, preferably 5-50, more preferably 8-30, most preferably 10-25 amino acids, e.g. the epitope may preferably be 9 amino acids in length , 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 amino acids. Particularly preferably, if the epitope in the context of the present invention is a T-cell epitope.

Согласно изобретению эпитоп может связываться с молекулами MHC, такими как молекулы MHC на поверхности клетки и таким образом может представлять собой «MHC-связывающий пептид» или «антигенный пептид». Термин «MHC-связывающий пептид» относится к пептиду, который связывается с молекулой MHC класса I и/или с молекулой MHC класса II. В случае комплексов молекулы MHC класса I/пептид связывающие пептиды, как правило, имеют длину 8-10 аминокислот, хотя могут быть эффективными и более длинные или более короткие пептиды. В случае комплексов молекулы MHC класса II/пептид связывающие пептиды, как правило, имеют длину 10-25 аминокислот, а конкретнее, 13-18 аминокислот, хотя могут быть эффективными и более длинные или более короткие пептиды.According to the invention, an epitope can bind to MHC molecules, such as MHC molecules on the cell surface, and thus can be a "MHC binding peptide" or "antigenic peptide". The term "MHC binding peptide" refers to a peptide that binds to an MHC class I molecule and/or to an MHC class II molecule. In the case of MHC class I/peptide complexes, binding peptides are typically 8-10 amino acids in length, although longer or shorter peptides may be effective. In the case of MHC class II/peptide complexes, binding peptides are typically 10-25 amino acids in length, and more specifically 13-18 amino acids in length, although longer or shorter peptides may be effective.

Термины «эпитоп», «антигенный пептид», «антигенный эпитоп», «иммуногенный пептид» и «MHC-связывающий пептид» используются в данном документе взаимозаменяемо и предпочтительно относятся к неполному представлению антигена, который предпочтительно способен вызывать иммунный ответ против антигена или клетки, экспрессирующей или включающей предпочтительно презентированный антиген. Предпочтительно, термины относятся к иммуногенному участку антигена. Предпочтительно, этот участок антигена, которая распознается (т.e., специфично связывается) T-клеточным рецептором, конкретно если он презентирован в контексте молекул MHC. Такие предпочтительные иммуногенные участки связываются с молекулой MHC класса I или класса II. При использовании в данном документе говорят, что иммуногенный участок «связывается с» молекулой MHC класса I или класса II, если такое связывание детектируется с использованием анализа, известного в данной области.The terms "epitope", "antigenic peptide", "antigenic epitope", "immunogenic peptide" and "MHC binding peptide" are used interchangeably herein and preferably refer to a partial presentation of an antigen, which is preferably capable of eliciting an immune response against an antigen or cell, expressing or preferably including the presented antigen. Preferably, the terms refer to the immunogenic site of the antigen. Preferably, this is an antigen site that is recognized (ie, specifically bound) by a T-cell receptor, specifically if it is presented in the context of MHC molecules. Such preferred immunogenic sites bind to an MHC class I or class II molecule. As used herein, an immunogenic site is said to "bind to" a class I or class II MHC molecule if such binding is detected using an assay known in the art.

При использовании в данном документе термин «неоэпитоп» относится к эпитопу, который отсутствует в эталоне, таком как нормальная неопухолевая или клетка зародышевой линии, но который обнаруживается в раковых клетках. В частности к этому относятся ситуации, когда в нормальной не опухолевой или в зародышевой клетке обнаруживается соответствующий эпитоп, однако благодаря одной или нескольким мутациям в опухолевой клетке последовательность эпитопа изменяется, приводя в результате к появлению неоэпитопа.As used herein, the term "neoepitope" refers to an epitope that is not present in a reference, such as a normal non-tumor or germline cell, but which is found in cancer cells. In particular, this includes situations where a corresponding epitope is found in a normal non-tumor or germ cell, but due to one or more mutations in the tumor cell, the sequence of the epitope is changed, resulting in the appearance of a neo-epitope.

Термин «участок» относится к части. По отношению к конкретной структуре, такой как аминокислотная последовательность или белок, термин его «участок» может означать непрерывную или дискретную часть указанной структуры. Предпочтительно, участок аминокислотной последовательности включает, по меньшей мере, 1%, по меньшей мере, 5%, по меньшей мере, 10%, по меньшей мере, 20%, по меньшей мере, 30%, предпочтительно по меньшей мере, 40%, предпочтительно по меньшей мере, 50%, более предпочтительно по меньшей мере, 60%, более предпочтительно по меньшей мере, 70%, еще более предпочтительно по меньшей мере, 80%, и наиболее предпочтительно по меньшей мере, 90% аминокислот указанной аминокислотной последовательности. Предпочтительно, если участок представляет собой дискретную часть, то указанная дискретная часть состоит из 2, 3, 4, 5, 6, 7, 8, или более частей структуры, причем каждая часть представляет собой непрерывный элемент структуры. Например, дискретная часть аминокислотной последовательности может состоять из 2, 3, 4, 5, 6, 7, 8, или более, предпочтительно, не более чем из 4 частей указанной аминокислотной последовательности, где каждая часть предпочтительно включает, по меньшей мере, 5 непрерывно расположенных аминокислот, по меньшей мере, 10 непрерывно расположенных аминокислот, предпочтительно по меньшей мере, 20 непрерывно расположенных аминокислот, предпочтительно, по меньшей мере, 5 непрерывно расположенных аминокислот из аминокислотной последовательности.The term "plot" refers to a part. With respect to a particular structure, such as an amino acid sequence or a protein, the term "region" thereof may mean a continuous or discrete portion of said structure. Preferably, the amino acid sequence portion comprises at least 1%, at least 5%, at least 10%, at least 20%, at least 30%, preferably at least 40%, preferably at least 50%, more preferably at least 60%, more preferably at least 70%, even more preferably at least 80%, and most preferably at least 90% of the amino acids of said amino acid sequence. Preferably, if the section is a discrete part, then said discrete part consists of 2, 3, 4, 5, 6, 7, 8, or more parts of the structure, each part being a continuous element of the structure. For example, a discrete portion of an amino acid sequence may consist of 2, 3, 4, 5, 6, 7, 8, or more, preferably no more than 4 portions of said amino acid sequence, where each portion preferably includes at least 5 contiguous contiguous amino acids, at least 10 contiguous amino acids, preferably at least 20 contiguous amino acids, preferably at least 5 contiguous amino acids from the amino acid sequence.

Термины «часть» и «фрагмент» используются в данном документе взаимозаменяемо и относятся к непрерывному элементу. Например, часть структуры, такой как аминокислотная последовательность или белок, относится к непрерывному элементу указанной структуры. Участок, часть или фрагмент структуры предпочтительно включает одно или несколько функциональных свойств указанной структуры. Например, участок, часть или фрагмент эпитопа, пептида или белка предпочтительно является иммунологически эквивалентным эпитопу, пептиду или белку, из которого он выделен. В контексте настоящего изобретения «часть» структуры, такой как аминокислотная последовательность, предпочтительно включает, предпочтительно состоит из, по меньшей мере, 10%, по меньшей мере, 20%, по меньшей мере, 30%, по меньшей мере, 40%, по меньшей мере, 50%, по меньшей мере, 60%, по меньшей мере, 70%, по меньшей мере, 80%, по меньшей мере, 85%, по меньшей мере, 90%, по меньшей мере, 92%, по меньшей мере, 94%, по меньшей мере, 96%, по меньшей мере, 98%, по меньшей мере, 99% цельной структуры аминокислотной последовательности.The terms "part" and "fragment" are used interchangeably herein and refer to a continuous element. For example, a part of a structure, such as an amino acid sequence or a protein, refers to a contiguous element of said structure. The site, part or fragment of the structure preferably includes one or more functional properties of the specified structure. For example, a region, portion, or fragment of an epitope, peptide, or protein is preferably immunologically equivalent to the epitope, peptide, or protein from which it is derived. In the context of the present invention, a "part" of a structure, such as an amino acid sequence, preferably comprises, preferably consists of at least 10%, at least 20%, at least 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 80%, at least 85%, at least 90%, at least 92%, at least at least 94%, at least 96%, at least 98%, at least 99% of the whole structure of the amino acid sequence.

Термин «иммунореактивная клетка» в контексте настоящего изобретения относится к клетке, которая оказывает эффекторные функции в процессе иммунной реакции. «Иммуннореактивная клетка» предпочтительно способна связываться с антигеном или с клеткой, характеризующейся презентацией антигена или антигенного пептида, выделенного из антигена, и опосредует иммунный ответ. Например, такие клетки секретируют цитокины и/или хемокины, секретируют антитела, распознают опухолевые клетки и необязательно уничтожают такие клетки. Например, иммунореактивные клетки включают T-клетки (цитотоксические T-клетки, хэлперные T-клетки, опухолепроникающие Т-клетки), B-клетки, натуральные киллеры, нейтрофилы, макрофаги и дендритные клетки. Предпочтительно, в контексте настоящего изобретения «иммунореактивные клетки» представляют собой T-клетки, предпочтительно CD4+ и/или CD8+ T-клетки.The term "immunoreactive cell" in the context of the present invention refers to a cell that has effector functions in the immune response. An "immunoreactive cell" is preferably capable of binding to an antigen or a cell presenting an antigen or an antigenic peptide derived from an antigen and mediates an immune response. For example, such cells secrete cytokines and/or chemokines, secrete antibodies, recognize tumor cells, and optionally kill such cells. For example, immunoreactive cells include T cells (cytotoxic T cells, helper T cells, tumor-invading T cells), B cells, natural killer cells, neutrophils, macrophages, and dendritic cells. Preferably, in the context of the present invention, "immunoreactive cells" are T cells, preferably CD4 + and/or CD8 + T cells.

Предпочтительно, «иммунореактивная клетка» распознает антиген или антигенный пептид, выделенный из антигена с некоторой степенью специфичности, конкретно, если он презентируется в контексте молекул MHC, как например на поверхности антигенпрезентирующих клеток или больных клеток, таких как опухолевые клетки. Предпочтительно, указанное распознавание дает возможность клетке, которая распознает антиген или антигенный пептид, выделенный из указанного антигена, быть респонсивной или реактивной. Если клетка представляет собой хэлперную T-клетку (CD4+ T-клетка), несущую рецепторы, которые распознают антиген или антигенный пептид, выделенный из антигена в контексте молекул MHC класса II, такая респонсивность или реактивность может включать высвобождение цитокинов и/или активацию CD8+ лимфоцитов (CTL) и/или B-клеток. Если клетка представляет собой CTL, то такая респонсивность или реактивность может включать уничтожение клеток, представленных в контексте молекул MHC класса I, т.e., клеток, отличающихся презентацией антигена с использованием молекул MHC класса I, например, посредством апоптоза или перфорин-опосредованного клеточного лизиса. Согласно изобретению респонсивность CTL может включать длительное выделение кальция, клеточное деление, продуцирование цитокинов, таких как IFN-γ и TNF-α, положительную регуляцию активации маркеров, таких как CD44 и CD69, и специфичное цитолитическое уничтожение антиген-экспрессирующих клеток-мишеней. Респонсивность CTL также может определяться с использованием искусственного репортера, который точно выявляет респонсивность CTL. Такие CTL, которые распознают антиген или антигенный пептид, выделенный из антигена, и являются респонсивными или реактивными, также обозначаются в данном документе как «антиген-респонсивные CTL». Если клетка представляет собой B-клетку, то такая респонсивность может включать высвобождение иммуноглобулинов.Preferably, the "immunoreactive cell" recognizes an antigen or antigenic peptide isolated from an antigen with some degree of specificity, specifically if it is presented in the context of MHC molecules, such as on the surface of antigen presenting cells or diseased cells such as tumor cells. Preferably, said recognition enables a cell that recognizes an antigen or antigenic peptide derived from said antigen to be responsive or reactive. If the cell is a helper T cell (CD4 + T cell) bearing receptors that recognize an antigen or antigenic peptide derived from an antigen in the context of MHC class II molecules, such responsiveness or reactivity may include cytokine release and/or CD8 + activation. lymphocytes (CTL) and/or B cells. If the cell is a CTL, then such responsiveness or reactivity may include the killing of cells presented in the context of MHC class I molecules, i.e., cells that differ in antigen presentation using MHC class I molecules, for example, through apoptosis or perforin-mediated cellular lysis. According to the invention, CTL responsiveness may include sustained calcium release, cell division, production of cytokines such as IFN-γ and TNF-α, upregulation of marker activation such as CD44 and CD69, and specific cytolytic killing of antigen-expressing target cells. CTL responsiveness can also be determined using an artificial reporter that accurately detects CTL responsiveness. Those CTLs that recognize an antigen or antigenic peptide derived from an antigen and are responsive or reactive are also referred to herein as "antigen-responsive CTLs". If the cell is a B cell, then such responsiveness may include the release of immunoglobulins.

Термины «T-клетка» и «T-лимфоцит» используются взаимозаменяемо в данном документе и включают T-хэлперные клетки (CD4+ T-клетки) и цитотоксические T-клетки (CTL, CD8+ T-клетки), которые включают цитолитические T-клетки.The terms "T cell" and "T lymphocyte" are used interchangeably herein and include T helper cells (CD4+ T cells) and cytotoxic T cells (CTL, CD8+ T cells), which include cytolytic T cells.

T-клетки принадлежат к группе белых кровяных клеток, известных как лимфоциты, и играют центральную роль в клеточно-опосредованном иммунитете. Они могут отличаться от другого типа лимфоцитов, таких как B-клетки и природные киллерные клетки присутствием специального рецептора на их клеточной поверхности, называемого T-клеточный рецептор (TCR). Тимус является принципиальным органом, отвечающим за созревание T-клеток. Было обнаружено несколько различных подгрупп T-клеток, каждая с различной функцией.T cells belong to a group of white blood cells known as lymphocytes and play a central role in cell-mediated immunity. They may differ from other types of lymphocytes such as B cells and natural killer cells by the presence of a special receptor on their cell surface called the T cell receptor (TCR). The thymus is the principal organ responsible for the maturation of T cells. Several different subsets of T cells have been found, each with a different function.

T-хэлперные клетки помогают другим белым кровяным клеткам в иммунологических процессах, включая созревание B-клеток в плазматические клетки и активацию цитотоксических T-клеток и макрофагов. Эти клетки также известны как CD4+ T-клетки, так как они экспрессируют белок CD4 на своей поверхности. Хэлперные T-клетки становятся активированными, когда им презентируются пептидные антигены молекулами MHC класса II, которые экспрессируются на поверхности антигенпрезентирующих клеток (APC). После активации они быстро делятся и секретируют небольшие белки, называемые цитокинами, которые регулируют или способствуют активному иммунному ответу.Helper T cells assist other white blood cells in immunological processes, including the maturation of B cells into plasma cells and the activation of cytotoxic T cells and macrophages. These cells are also known as CD4+ T cells because they express the CD4 protein on their surface. Helper T cells become activated when they are presented with peptide antigens by class II MHC molecules that are expressed on the surface of antigen presenting cells (APCs). Once activated, they rapidly divide and secrete small proteins called cytokines that regulate or promote an active immune response.

Цитотоксические T-клетки разрушают инфицированные вирусами клетки и опухолевые клетки, а также вовлечены в отторжение трансплантата. Эти клетки также известны как CD8+ T-клетки, так как они экспрессируют гликопротеин CD8 на своей поверхности. Эти клетки распознают свои мишени путем связывания с антигеном, ассоциированным с молекулой MHC класса I, которая присутствует на поверхности почти каждой клетки организма.Cytotoxic T cells destroy virus-infected cells and tumor cells and are also involved in transplant rejection. These cells are also known as CD8+ T cells since they express the CD8 glycoprotein on their surface. These cells recognize their targets by binding to an antigen associated with the MHC class I molecule, which is present on the surface of almost every cell in the body.

Большинство T-клеток имеют T-клеточный рецептор (TCR), присутствующий в комплексе некоторых белков. Фактически T-клеточный рецептор состоит из двух отдельных пептидных цепей, которые образуются из независимых генов T-клеточного рецептора альфа и бета (TCRα и TCRβ) и называются α- и β-TCR-цепями. γδ T-клетки (гамма дельта T-клетки) характеризуют небольшую подгруппу T-клеток, на своей поверхности которых находятся отличающиеся T-клеточные рецепторы (TCR). При этом в γδ T-клетках TCR образуется из одной γ-цепи и одной δ-цепи. Эта группа T-клеток обычно гораздо меньше (2% от суммарных T-клеток), чем αβ T-клетки.Most T cells have a T cell receptor (TCR) present in a complex of several proteins. In fact, the T-cell receptor consists of two separate peptide chains, which are formed from independent T-cell receptor alpha and beta genes (TCRα and TCRβ) and are called α- and β-TCR chains. γδ T cells (gamma delta T cells) characterize a small subset of T cells that have distinct T cell receptors (TCRs) on their surface. At the same time, in γδ T-cells, TCR is formed from one γ-chain and one δ-chain. This group of T cells is usually much smaller (2% of total T cells) than αβ T cells.

Первый сигнал в активации T-клеток обеспечивается путем связывания T-клеточного рецептора с коротким пептидом, презентированным главным комплексом гистосовместимости (MHC) на другой клетке. Такое связывание гарантирует, что активируется только T-клетка с TCR, специфичным к данному пептиду. Клетка-партнер обычно представляет собой специализированную антигенпрезентирующую клетку (APC), как правило, дендритную клетку в случае наивного ответа, хотя B-клетки и макрофаги могут быть важными APC. Пептиды, презентированные CD8+ T-клеткам с помощью молекул MHC класса I, как правило, имеют длину 8-10 аминокислот; пептиды, презентированные CD4+ T-клеткам с помощью молекул MHC класса II, как правило, длиннее, поскольку концы связывающей бороздки молекулы MHC класса II открыты.The first signal in T cell activation is provided by binding of the T cell receptor to a short peptide presented by the major histocompatibility complex (MHC) on another cell. This binding ensures that only the T cell with the TCR specific to that peptide is activated. The partner cell is usually a specialized antigen presenting cell (APC), typically a dendritic cell in case of a naive response, although B cells and macrophages can be important APCs. Peptides presented to CD8+ T cells by MHC class I molecules are typically 8-10 amino acids in length; peptides presented to CD4+ T cells by MHC class II molecules tend to be longer because the ends of the binding groove of the MHC class II molecule are open.

Согласно настоящему изобретению T-клеточный рецептор способен связываться с определенной мишенью, если он имеет достаточную аффинность к указанной определенной мишени, и связывается с указанной определенной мишенью в стандартных анализах. «Аффинность» или «аффинность связывания» часто измеряют с помощью равновесной константы диссоциации (KD). T-клеточный рецептор не способен (по существу) к связыванию с мишенью, если он не обладает достаточной аффинностью к указанной мишени, и не связывается существенно с указанной мишенью в стандартных анализах.According to the present invention, a T cell receptor is capable of binding to a specific target if it has sufficient affinity for said specific target and binds to said specific target in standard assays. "Affinity" or "binding affinity" is often measured using the equilibrium dissociation constant (K D ). A T cell receptor is not (substantially) capable of binding to a target if it does not have sufficient affinity for said target and does not bind substantially to said target in standard assays.

T-клеточный рецептор предпочтительно способен к специфичному связыванию с определенной мишенью. T-клеточный рецептор специфичен к определенной мишени, если он способен связываться с указанной определенной мишенью, в то время как он (по существу) не способен связываться с другими мишенями, т.е. не обладает достаточной аффинностью к другим мишеням и не связывается в значительной степени с другими мишенями в стандартных анализах.The T cell receptor is preferably capable of specific binding to a specific target. A T-cell receptor is specific for a particular target if it is able to bind to said particular target while it is (substantially) unable to bind to other targets, ie. does not have sufficient affinity for other targets and does not bind significantly to other targets in standard assays.

Образование цитотоксических T-лимфоцитов может быть вызвано in vivo включением антигена или антигенного пептида в антигенпрезентирующие клетки in vivo. Антиген или антигенный пептид могут быть представлены как в виде белка, так и в виде ДНК (например, внутри вектора) или в виде РНК. Антиген может процессироваться с получением пептида-партнера для молекулы MHC, в то время как его фрагмент может презентироваться без необходимости дополнительного процессирования. Последнее происходит, в частности, если они связываются с молекулами MHC. В целом, возможно введение пациенту с помощью внутрикожной инъекции. Однако инъекция может также проводиться по внутриузловому пути в лимфатический узел (Maloy et al. (2001), Proc Natl Acad Sci USA 98:3299-303). Полученные в результате клетки презентируют представляющий интерес комплекс и распознаются аутологичными цитотоксическими T-лимфоцитами, которые затем размножаются.The formation of cytotoxic T-lymphocytes can be caused in vivo by incorporation of an antigen or antigenic peptide into antigen-presenting cells in vivo. The antigen or antigenic peptide can be present either as a protein or as DNA (eg within a vector) or as RNA. The antigen can be processed into a partner peptide for the MHC molecule while its fragment can be presented without the need for further processing. The latter occurs, in particular, if they bind to MHC molecules. In general, it is possible to administer to a patient by intradermal injection. However, injection can also be via an intranodal route to a lymph node (Maloy et al. (2001), Proc Natl Acad Sci USA 98:3299-303). The resulting cells present the complex of interest and are recognized by autologous cytotoxic T-lymphocytes, which then proliferate.

Специфичная активация CD4+ или CD8+ T-клеток может детектироваться различными путями. Методы детекции специфичной T-клеточной активации включают детекцию пролиферации T-клеток, выработки цитокинов (например, лимфокинов), или генерацию цитотоксической активности. Для CD4+ T-клеток предпочтительным методом детекции специфичной T-клеточной активации является детекция пролиферации T-клеток. Для CD8+ T-клеток предпочтительным методом детекции специфичной T-клеточной активации является детекция генерации цитотоксической активности. Specific activation of CD4+ or CD8+ T cells can be detected in various ways. Methods for detecting specific T cell activation include detection of T cell proliferation, production of cytokines (eg, lymphokines), or generation of cytotoxic activity. For CD4+ T cells, the preferred method for detecting specific T cell activation is to detect T cell proliferation. For CD8+ T cells, the preferred method for detecting specific T cell activation is to detect the generation of cytotoxic activity.

Термин «главный комплекс гистосовместимости» и аббревиатура «MHC» включает молекулы MHC класса I и MHC класса II и относится к комплексу генов, которые присутствуют у всех позвоночных. Белки или молекулы MHC важны для передачи сигналов между лимфоцитами и антигенпрезентирующими клетками или больными клетками в иммунных реакциях, где белки и молекулы MHC связываются с пептидами и презентируют их для распознавания T-клеточными рецепторами. Белки, кодируемые MHC, экспрессируются на поверхности клеток и представляют Т-клеткам как свои собственные антигены (пептидные фрагменты из самой клетки), так и чужеродные антигены (например, фрагменты проникших микроорганизмов).The term "major histocompatibility complex" and the abbreviation "MHC" includes MHC class I and MHC class II molecules and refers to a complex of genes that are present in all vertebrates. MHC proteins or molecules are important for signaling between lymphocytes and antigen presenting cells or diseased cells in immune responses where proteins and MHC molecules bind to peptides and present them for recognition by T cell receptors. MHC-encoded proteins are expressed on the surface of cells and present both their own antigens (peptide fragments from the cell itself) and foreign antigens (eg, fragments of invading microorganisms) to T cells.

Область MHC делится на три подгруппы, класс I, класс II, и класс III. Белки MHC класса I содержат α-цепь и β2-микроглобулин (не является частью MHC, кодируемого хромосомой 15). Они презентируют антигенные фрагменты цитотоксическим T-клеткам. На большинстве клеток иммунной системы, особенно на антигенпрезентирующих клетках, белки MHC класса II содержат α- и β-цепи, и они презентируют антигенные фрагменты T-хэлперным клеткам. Область MHC класса III кодирует другие иммунные компоненты, такие как компоненты комплемента и некоторые компоненты, которые кодируют цитокины.The MHC area is divided into three subgroups, class I, class II, and class III. Class I MHC proteins contain the α-chain and β2-microglobulin (not part of the MHC encoded by chromosome 15). They present antigenic fragments to cytotoxic T cells. On most cells of the immune system, especially antigen-presenting cells, MHC class II proteins contain α- and β-chains, and they present antigenic fragments to T-helper cells. The MHC class III region encodes for other immune components such as complement components and some components that encode for cytokines.

У человека гены в области MHC, которые кодируют антигенпрезентирующие белки на клеточной поверхности, относятся к генам человеческого лейкоцитарного антигена (HLA). Однако аббревиатура MHC часто используется для обозначения продуктов генов HLA. Гены HLA включают девять так называемых классических генов MHC: HLA-A, HLA-B, HLA-C, HLA-DPA1, HLA-DPB1, HLA-DQA1, HLA-DQB1, HLA-DRA, и HLA-DRB1.In humans, genes in the MHC region that encode antigen-presenting proteins on the cell surface are referred to as human leukocyte antigen (HLA) genes. However, the abbreviation MHC is often used to refer to HLA gene products. HLA genes include nine so-called classic MHC genes: HLA-A, HLA-B, HLA-C, HLA-DPA1, HLA-DPB1, HLA-DQA1, HLA-DQB1, HLA-DRA, and HLA-DRB1.

В одном предпочтительном воплощении всех аспектов изобретения молекула MHC представляет собой молекулу HLA.In one preferred embodiment of all aspects of the invention, the MHC molecule is an HLA molecule.

Под «клеткой, характеризующейся презентацией антигена» или «клеткой, презентирующей антиген» или под аналогичными выражениями понимают клетку, такую как больная клетка, например, раковая клетка, или антигенпрезентирующая клетка, презентирующую антиген или фрагмент, выделенный из указанного антигена, например, путем процессирования антигена в контексте молекул MHC, конкретно молекул MHC класса I. Аналогично, термин «заболевание, характеризующееся презентацией антигена» обозначает заболевание, в которое вовлечены клетки, характеризующиеся презентацией антигена, в частности, с помощью молекул MHC класса I. На презентацию антигена клеткой может влиять трансфекция клетки нуклеиновой кислотой, такой как РНК, кодирующей антиген.By "antigen presenting cell" or "antigen presenting cell" or similar expressions is meant a cell, such as a diseased cell, such as a cancer cell, or an antigen presenting cell presenting an antigen or a fragment isolated from said antigen, for example, by processing antigen in the context of MHC molecules, specifically MHC class I molecules. Similarly, the term "disease characterized by antigen presentation" means a disease in which cells characterized by antigen presentation, in particular by MHC class I molecules, are involved. transfecting the cell with a nucleic acid, such as RNA, encoding an antigen.

Под «презентируемым фрагментом антигена» или под аналогичными выражениями понимают, что фрагмент может презентироваться с помощью молекул MHC класса I или класса II, предпочтительно MHC класса I, например, при добавлении непосредственно к антигенпрезентирующим клеткам. В одном воплощении фрагмент представляет собой фрагмент, который в естественной среде презентируется клетками, экспрессирующими антиген.By "presentable antigen fragment" or similar expressions is meant that the fragment can be presented with MHC class I or class II molecules, preferably MHC class I, for example when added directly to antigen presenting cells. In one embodiment, the fragment is a fragment that is naturally presented by cells expressing the antigen.

Термин «иммунологически эквивалентный» означает, что иммунологически эквивалентные молекулы, такие как иммунологически эквивалентные аминокислотные последовательности демонстрируют такие же или по существу такие же иммунологические свойства и/или оказывают такие же или по существу такие же иммунологические эффекты, например, в отношении типа иммунологического эффекта, такого как индуцирование гуморального и/или клеточного иммунного ответа, силы и/или продолжительности индуцированной иммунной реакции или специфичности индуцированной иммунной реакции. В контексте настоящего изобретения термин «иммунологически эквивалентный» предпочтительно используется в отношении иммунологических эффектов или свойств пептида, используемого для иммунизации. Например, аминокислотная последовательность иммунологически эквивалентна эталонной аминокислотной последовательности, если указанная аминокислотная последовательность при экспонировании иммунной системе объекта индуцирует иммунную реакцию, обладающую специфичностью реакции с эталонной аминокислотной последовательностью.The term "immunologically equivalent" means that immunologically equivalent molecules, such as immunologically equivalent amino acid sequences, exhibit the same or substantially the same immunological properties and/or have the same or substantially the same immunological effects, for example, in terms of the type of immunological effect, such as inducing a humoral and/or cellular immune response, the strength and/or duration of the induced immune response, or the specificity of the induced immune response. In the context of the present invention, the term "immunologically equivalent" is preferably used in relation to the immunological effects or properties of the peptide used for immunization. For example, an amino acid sequence is immunologically equivalent to a reference amino acid sequence if said amino acid sequence, when exposed to the subject's immune system, induces an immune response having reaction specificity with the reference amino acid sequence.

Термин «иммунные эффекторные функции» в контексте настоящего изобретения включает любые функции, опосредованные компонентами иммунной системы, что приводит в результате, например, к уничтожению опухолевых клеток или к ингибированию опухолевого роста и/или к ингибированию развития опухоли, включая ингибирование распространения опухоли и метастазирования. Предпочтительно, иммунные эффекторные функции в контексте настоящего изобретения представляют собой эффекторные функции, опосредованные Т-клетками. Такие функции включают в случае хэлперной T-клетки (CD4+ T-клетка) распознавание антигена или антигенного пептида, выделенного из антигена, в контексте молекул MHC класса II с помощью T-клеточных рецепторов, высвобождение цитокинов и/или активацию CD8+ лимфоцитов (CTL) и/или B-клеток, и в случае CTL распознавание антигена или антигенного пептида, выделенного из антигена, в контексте молекул MHC класса I с помощью T-клеточных рецепторов, уничтожение клеток, презентированных в контексте молекул MHC класса I, т.e., клеток, характеризующихся презентацией антигена с помощью молекулы MHC класса I, например, посредством апопотоза или перфорин-опосредованного клеточного лизиса, продуцирование цитокинов, таких как IFN-γ и TNF-α, и специфичное цитолитическое уничтожение антиген-экспрессирующих клеток-мишеней.The term "immune effector functions" in the context of the present invention includes any functions mediated by components of the immune system that result, for example, in the destruction of tumor cells or inhibition of tumor growth and/or inhibition of tumor development, including inhibition of tumor spread and metastasis. Preferably, immune effector functions in the context of the present invention are T cell mediated effector functions. Such functions include, in the case of a helper T cell (CD4 + T cell), recognition of an antigen or an antigenic peptide derived from an antigen in the context of class II MHC molecules via T cell receptors, release of cytokines, and/or activation of CD8 + lymphocytes (CTL ) and/or B cells, and in the case of CTL, recognition of an antigen or an antigenic peptide derived from an antigen in the context of MHC class I molecules by T cell receptors, killing cells presented in the context of MHC class I molecules, i.e. , cells characterized by antigen presentation by an MHC class I molecule, for example, via apoptosis or perforin-mediated cell lysis, production of cytokines such as IFN-γ and TNF-α, and specific cytolytic killing of antigen-expressing target cells.

Термин «геном» относится к суммарному количеству генетической информации в хромосомах организма или клетки. Термин «экзом» относится к кодирующим областям генома. Термин «транскриптом» относится к набору всех молекул РНК.The term "genome" refers to the total amount of genetic information in the chromosomes of an organism or cell. The term "exome" refers to coding regions of the genome. The term "transcriptome" refers to the set of all RNA molecules.

«Нуклеиновая кислота» согласно изобретению предпочтительно представляет собой дезоксирибонуклеиновую кислоту (ДНК) или рибонуклеиновую кислоту (РНК), более предпочтительно, РНК, наиболее предпочтительно, in vitro транскрибированную РНК (IVT РНК) или синтетическую РНК. Нуклеиновые кислоты включают согласно изобретению геномную ДНК, кДНК, мРНК, рекомбинантно продуцированные и химически синтезированные молекулы. Согласно изобретению нуклеиновая кислота может присутствовать в виде одноцепочечной или двухцепочечной и линейно или ковалентно циклически замкнутой молекулы. Согласно изобретению нуклеиновая кислота может быть изолированной. Термин «изолированная нуклеиновая кислота» означает согласно изобретению, что нуклеиновая кислота (i) была амплифицирована in vitro, например, посредством полимеразной цепной реакции (ПЦР), (ii) была получена рекомбинантно путем клонирования, (iii) была очищена, например, путем расщепления и разделения с помощью гель-электрофореза, или (iv) была синтезирована, например, с помощью химического синтеза. Нуклеиновая кислота может применяться для введения внутрь, т.е. для трансфекции клеток, конкретно, в форме РНК, которая может быть получена путем in vitro транскрипции с ДНК-матрицы. Кроме того, РНК может быть модифицирована перед применением с помощью стабилизирующих последовательностей, кэппирования и полиаденилирования.The "Nucleic acid" according to the invention is preferably deoxyribonucleic acid (DNA) or ribonucleic acid (RNA), more preferably RNA, most preferably in vitro transcribed RNA (IVT RNA) or synthetic RNA. Nucleic acids include, according to the invention, genomic DNA, cDNA, mRNA, recombinantly produced and chemically synthesized molecules. According to the invention, the nucleic acid may be present as a single or double stranded and linearly or covalently cyclic molecule. According to the invention, the nucleic acid may be isolated. The term "isolated nucleic acid" means according to the invention that the nucleic acid (i) has been amplified in vitro, for example by polymerase chain reaction (PCR), (ii) has been obtained recombinantly by cloning, (iii) has been purified, for example by digestion and separation using gel electrophoresis, or (iv) was synthesized, for example, using chemical synthesis. The nucleic acid can be used for oral administration, ie. for transfection of cells, specifically in the form of RNA, which can be obtained by in vitro transcription from a DNA template. In addition, RNA can be modified prior to use by stabilizing sequences, capping, and polyadenylation.

Термин «генетический материал» относится к выделенной нуклеиновой кислоте, либо к ДНК, либо к РНК, к участку двойной спирали, к участку хромосомы или к цельному геному организма или клетки, конкретно к экзому или транскриптому.The term "genetic material" refers to an isolated nucleic acid, either DNA or RNA, a portion of a double helix, a portion of a chromosome, or the entire genome of an organism or cell, specifically an exome or transcriptome.

Термин «мутация» относится к изменению или к различию в последовательности нуклеиновой кислоты (нуклеотидной замене, вставке или делеции) по сравнению с эталоном. «Соматическая мутация» может происходить в любой из клеток организма за исключением зародышевых клеток (спермий и яйцеклетка) и, таким образом, не переходят к потомству. Эти изменения могут (но не всегда) вызывать злокачественное новообразование или другие заболевания. Предпочтительно, мутация представляет собой несинонимичную мутацию. Термин «несинонимичная мутация» относится к мутации, предпочтительно, к нуклеотидной замене, которая приводит в результате к аминокислотной замене, такой как аминокислотная замена в продукте трансляции.The term "mutation" refers to a change or difference in a nucleic acid sequence (nucleotide substitution, insertion or deletion) compared to a reference. "Somatic mutation" can occur in any of the body's cells with the exception of germ cells (sperm and egg) and thus does not pass to the offspring. These changes can (but not always) cause cancer or other diseases. Preferably, the mutation is a non-synonymous mutation. The term "non-synonymous mutation" refers to a mutation, preferably a nucleotide change, that results in an amino acid change, such as an amino acid change in a translation product.

Согласно изобретению термин «мутация» включает точечные мутации, вставки-делеции, сшивки, хромотрипсис и РНК-редактирующие мутации.According to the invention, the term "mutation" includes point mutations, insertion-deletions, cross-links, chromothripsis and RNA-editing mutations.

Согласно изобретению термин «вставка-делеция» описывает особый класс мутаций, определенный как мутация, приводящая в результате к колокализованным вставке и делеции и к приобретению или к потере нуклеотидов. В кодирующих участках генома, если длина вставки-делеции не кратна 3, они ведут к получению мутации со сдвигом рамки считывания. Вставки-делеции могут противопоставляться точечной мутации; в случае, где вставка-делеция вставляет и удаляет нуклеотиды из последовательности, точечная мутация является формой замены, которая заменяет один нуклеотид на другой.According to the invention, the term "insert-deletion" describes a specific class of mutations, defined as a mutation that results in colocalized insertion and deletion and in the gain or loss of nucleotides. In the coding regions of the genome, if the length of the insertion-deletion is not a multiple of 3, they lead to a frameshift mutation. Insertion-deletion may be opposed to point mutation; in the case where insertion-deletion inserts and removes nucleotides from a sequence, a point mutation is a form of substitution that replaces one nucleotide with another.

Сшивки могут приводить к образованию гибридных генов, образованных из двух ранее отдельных генов. Они могут происходить в результате транслокации, интерстициальной делеции, или инверсии сегмента хромосомы. Часто сшитые гены представляют собой онкогены. Онкогенные сшитые гены могут приводить к получению генного продукта с новой или отличной функцией от функции двух партнеров по сшивке. В ином случае, протоонкоген сшивается с сильным промотором и посредством этого включается онкогенная функция путем положительной регуляции, вызванной сильным промотором из 5`-области партнера по сшивке. Получение онкогенных сшитых транскриптов также может быть вызвано транс-сплайсингом или событиями неправильного прочтения.Crosslinks can lead to the formation of hybrid genes formed from two previously separate genes. They can occur as a result of translocation, interstitial deletion, or inversion of a chromosome segment. Cross-linked genes are often oncogenes. Oncogenic crosslinked genes can result in a gene product with a new or different function from that of the two crosslinking partners. Otherwise, the proto-oncogene is linked to a strong promoter and thereby the oncogenic function is turned on by upregulation caused by the strong promoter from the 5' region of the crosslinking partner. The production of oncogenic cross-linked transcripts can also be caused by trans-splicing or misread events.

Согласно изобретению термин «хромотрипсис» относится к генетическому явлению, в ходе которого специфические области генома раскалываются и затем сшиваются вместе в процессе одного разрушительного события.According to the invention, the term "chromothripsis" refers to a genetic event in which specific regions of the genome are cleaved and then sewn back together in a single destructive event.

Согласно изобретению термины «РНК-редакция» или «РНК-редактирование» относятся к молекулярным процессам, в которых информационное содержание в молекуле РНК изменяется посредством химического изменения в составе оснований. РНК-редактирование включает нуклеозидные модификации, такие как дезаминирования цитидина (C) до уридина (U) и аденозина (A) до инозина (I), а также не матричные нуклеотидные добавления и вставки. РНК-редактирование в мРНК изменяет аминокислотную последовательность кодируемого белка, так что он отличается от предсказанного с помощью последовательности геномной ДНК.According to the invention, the terms "RNA editing" or "RNA editing" refer to molecular processes in which the information content in an RNA molecule is changed through a chemical change in the composition of the bases. RNA editing includes nucleoside modifications such as deaminations of cytidine (C) to uridine (U) and adenosine (A) to inosine (I), as well as non-template nucleotide additions and insertions. RNA editing in mRNA changes the amino acid sequence of the encoded protein so that it differs from that predicted by the genomic DNA sequence.

Термин «сигнатура мутаций злокачественной опухоли» относится к мутациям, которые присутствуют в раковых клетках по сравнению с неопухолевыми эталонными клетками.The term "cancer mutation signature" refers to mutations that are present in cancer cells compared to non-tumor reference cells.

Согласно изобретению, «эталон» может использоваться для корреляции и сравнения результатов, полученных в способах по изобретению из опухолевых образцов. Как правило, «эталон» может быть получен на основе одного или нескольких нормальных образцов, которые не подвержены опухолевому заболеванию, или получены из пациента или из одного или нескольких индивидуумов, предпочтительно, здоровых, в частности, из индивидуумов того же вида. «Эталон» может быть определен эмпирически путем тестирования достаточно большого количества нормальных образцов.According to the invention, a "reference" can be used to correlate and compare the results obtained in the methods of the invention from tumor samples. Typically, a "reference" may be derived from one or more normal samples that are not susceptible to neoplastic disease, or obtained from a patient or from one or more individuals, preferably healthy, in particular from individuals of the same species. A "reference" can be determined empirically by testing a sufficiently large number of normal samples.

Согласно изобретению может использоваться любой подходящий метод секвенирования, предпочтительными являются технологии Секвенирования Следующего Поколения (NGS). Методы Секвенирования Третьего Поколения могут заменять технологию NGS в будущем для повышения скорости стадии секвенирования метода. С целью прояснения: термины «Секвенирование Следующего Поколения» или «NGS» в контексте настоящего изобретения означают все новые высокопроизводительные технологи секвенирования, которые в отличие от «стандартной» методологии секвенирования, известной как метод Сэнгера, читают матрицы нуклеиновых кислот случайным образом параллельно по всему геному путем разрывов цельного генома на короткие участки. Такие NGS-технологии (также известные как технологии массивно-параллельного секвенирования) могут предоставлять информацию о последовательности нуклеиновых кислот цельного генома, экзома, транскриптома (все транскрибирующиеся последовательности генома) или метилома (все метилированные последовательности генома) в очень короткие сроки, например, в течение 1-2 недель, предпочтительно в течение 1-7 дней или наиболее предпочтительно в течение менее чем 24 часов, и в принципе позволяют осуществлять способы секвенирования отдельной клетки. Множество NGS платформ, которые коммерчески доступны или которые упоминаются в научной литературе, может использоваться в контексте настоящего изобретения, например, те, что описаны в Zhang et al. 2011: The impact of next-generation sequencing on genomics. J. Genet Genomics 38 (3), 95-109; или в Voelkerding et al. 2009: Next generation sequencing: From basic research to diagnostics. Clinical chemistry 55, 641-658. Частными примерами таких NGS-технологий/платформ являютсяAny suitable sequencing method can be used according to the invention, with Next Generation Sequencing (NGS) technologies being preferred. Third Generation Sequencing methods may replace NGS technology in the future to increase the speed of the method's sequencing step. For the sake of clarity, the terms "Next Generation Sequencing" or "NGS" in the context of the present invention means all new high-throughput sequencing technologies that, in contrast to the "standard" sequencing methodology known as the Sanger method, read nucleic acid arrays randomly in parallel throughout the genome by breaking the entire genome into short sections. Such NGS technologies (also known as massively parallel sequencing technologies) can provide whole genome, exome, transcriptome (all transcribed genome sequences), or methylome (all methylated genome sequences) nucleic acid sequence information in a very short time, for example, within 1-2 weeks, preferably within 1-7 days, or most preferably within less than 24 hours, and in principle allow single cell sequencing methods. Many NGS platforms that are commercially available or that are mentioned in the scientific literature can be used in the context of the present invention, such as those described in Zhang et al. 2011: The impact of next-generation sequencing on genomics. J Genet Genomics 38(3), 95-109; or in Voelkerding et al. 2009: Next generation sequencing: From basic research to diagnostics. Clinical chemistry 55, 641-658. Particular examples of such NGS technologies/platforms are

1. Технология секвенирование- путем-синтеза (sequencing-by-synthesis), известная как пиросеквенирование, выполняемое, например, в «GS-FLX 454 Genome SequencerTM» компании, ассоциированной с «Roche», «454 Life Sciences» (Бренфорд, Коннектикут), впервые описана в Ronaghi et al. 1998: A sequencing method based on real-time pyrophosphate». Science 281 (5375), 363-365. Эта технология использует эмульсионную ПЦР, в которой шарики, связывающие одноцепочечную ДНК, инкапсулируются посредством интенсивного встряхивания в водные мицеллы, содержащие ПЦР-реагенты, окруженные маслом для амплификации с помощью эмульсионной ПЦР. В процессе пиросеквенирования свет, испускаемый из молекул фосфата во время включения нуклеотидов, записывается по мере того, как полимераза синтезирует ДНК-цепь.1. Sequencing-by-synthesis technology, known as pyrosequencing, performed, for example, in the "GS-FLX 454 Genome Sequencer TM " of a company associated with Roche, "454 Life Sciences" (Brenford, Connecticut), first described in Ronaghi et al. 1998: A sequencing method based on real-time pyrophosphate. Science 281 (5375), 363-365. This technology uses emulsion PCR, in which single-stranded DNA-binding beads are encapsulated by vigorous shaking into aqueous micelles containing PCR reagents surrounded by emulsion PCR amplification oil. In the pyrosequencing process, the light emitted from the phosphate molecules during the incorporation of nucleotides is recorded as the polymerase synthesizes the DNA strand.

2. Способы секвенирование-путем-синтеза, разработанные «Solexa» (теперь часть «Illumina Inc.», Сан Диего, Калифорния), которые базируются на обратимых красителях-терминаторах, и выполняемые, например, в «Illumina/Solexa Genome Analyzer™» и в «Illumina HiSeq 2000 Genome Analyzer™». В данной технологии все четыре нуклеотида добавляются одновременно в кластерные фрагменты с гибридизованными нуклеотидными праймерами в каналы с проточными ячейками, содержащими ДНК-полимеразу. Мостиковая амплификация расширяет кластерные цепи с помощью всех четырех флуоресцентно меченых нуклеотидов для секвенирования.2. Sequence-by-synthesis methods developed by Solexa (now part of Illumina Inc., San Diego, CA) based on reversible terminator dyes and run in, for example, the Illumina/Solexa Genome Analyzer™ and in the Illumina HiSeq 2000 Genome Analyzer™. In this technology, all four nucleotides are added simultaneously to cluster fragments with hybridized nucleotide primers in channels with flow cells containing DNA polymerase. Bridge amplification expands the cluster strands with all four fluorescently labeled nucleotides for sequencing.

3. Способы секвенирование-путем-лигирования (Sequencing-by-ligation), например, выполняемые на платформе «SOLid™» «Applied Biosystems» (теперь «Life Technologies Corporation», Карлсбад, Калифорния). В данной технологии пул всех возможных олигонуклеотидов фиксированной длины метят согласно отсеквенированному положению. Олигонуклеотиды отжигаются и лигируются; предпочтительное лигирование с помощью ДНК-лигазы для парных последовательностей приводит в результате к получению сигнала, информативного в отношении нуклеотида в данном положении. Перед секвенированием ДНК амплифицируется с помощью эмульсионной ПЦР. Полученные шарики, каждый из которых содержит только копии одной ДНК-молекулы, располагаются на предметном стекле. В качестве второго примера платформа «Polonator™ G.007» от «Dover Systems» (Салем, Нью-Гемпшир) также применяет способ секвенирование-путем-лигированиея используя случайное расположение, на основе использования шариков, эмульсионной ПЦР для амплификации ДНК-фрагментов для параллельного секвенирования.3. Sequencing-by-ligation methods, such as those performed on the SOLid™ platform of Applied Biosystems (now Life Technologies Corporation, Carlsbad, CA). In this technology, a pool of all possible fixed length oligonucleotides is labeled according to the sequenced position. Oligonucleotides are annealed and ligated; preferential ligation with DNA ligase for paired sequences results in a signal that is informative of the nucleotide at that position. Prior to sequencing, the DNA is amplified by emulsion PCR. The resulting beads, each containing only copies of a single DNA molecule, are placed on a glass slide. As a second example, the Polonator™ G.007 platform from Dover Systems (Salem, New Hampshire) also employs a sequencing-by-ligation method using random bead-based emulsion PCR to amplify DNA fragments for parallel sequencing.

4. Технологии секвенирования одиночной молекулы, такие как, например, применяемые в системе «PacBio RS» от «Pacific Biosciences» (Менло-Парк, Калифорния) или в «HeliScope™» на платформе «Helicos Biosciences» (Кембридж, Массачусетс). Отличные характеристики данной технологии заключаются в ее способности секвенировать одиночные молекул ДНК или РНК без амплификации, определенной как секвенирование одиночных молекул ДНК в реальном времени (SMRT). Например, «HeliScope» использует высокочувствительную систему детекции флуоресценции для прямой детекции каждого нуклеотида по мере его синтеза. Аналогичный способ на основе резонансного переноса энергии флуоресценции (FRET) был разработан в «Visigen Biotechnology» (Хьюстон, Техас). Другими технологиями секвенирования одиночных молекул на основе флуоресценции являются «U.S. Genomics» («GeneEngine™») и «Genovoxx» («AnyGene™»).4. Single molecule sequencing technologies such as, for example, those used in the PacBio RS system from Pacific Biosciences (Menlo Park, Calif.) or the HeliScope™ platform of Helicos Biosciences (Cambridge, Massachusetts). The excellent characteristics of this technology lie in its ability to sequence single molecules of DNA or RNA without amplification, defined as real-time single molecule DNA sequencing (SMRT). For example, HeliScope uses a highly sensitive fluorescence detection system to directly detect each nucleotide as it is synthesized. A similar fluorescence resonance energy transfer (FRET) method has been developed at Visigen Biotechnology (Houston, Texas). Other fluorescence-based single molecule sequencing technologies are "U.S. Genomics (GeneEngine™) and Genovoxx (AnyGene™).

5. Нанотехнологии для секвенирования одиночных молекул, в которых используются различные наноструктуры, например, расположенные на чипе для отслеживания движения полимеразной молекулы по одиночной цепи в процессе репликации. Частными примерами способов на основе нанотехнологий являются платформа «GridON™» от «Oxford Nanopore Technologies» (Оксфорд, Великобритания), платформы секвенирования нано-пор с вспомогательной гибридизацией («HANS™»), разработанные «Nabsys» (Провиденс, Род-Айленд), и запатентованная платформа ДНК-секвенирования на основе лигазы с использованием технологии ДНК-наношариков (DNA nanoball) (DNB), называемая комбинаторным лигированием зонд-якорь («cPAL™»).5. Nanotechnologies for single molecule sequencing, which use various nanostructures, for example, located on a chip to track the movement of a polymerase molecule along a single strand during replication. Particular examples of nanotechnology-based methods are the "GridON™" platform from Oxford Nanopore Technologies (Oxford, UK), assisted hybridization nano-pore sequencing ("HANS™") platforms from Nabsys (Providence, Rhode Island) , and a proprietary ligase-based DNA sequencing platform using DNA nanoball (DNB) technology called combinatorial probe-anchor ligation (“cPAL™”).

6. Технологии секвенирования одиночных молекул на основе электронной микроскопии, например, разработанные «LightSpeed Genomics» (Саннивейл, Калифорния) и «Halcyon Molecular» (Редвуд-Сити, Калифорния).6. Single molecule sequencing technologies based on electron microscopy, such as those developed by LightSpeed Genomics (Sunnyvale, CA) and Halcyon Molecular (Redwood City, CA).

7. Ионное полупроводниковое секвенирование, которое основано на детекции ионов водорода, которые высвобождаются во время полимеризации ДНК. Например, «Ion Torrent Systems» (Сан-Франциско, Калифорния) используют чип высокой плотности из микро-обработанных лунок для осуществления данного биохимического процесса массивно-параллельным путем. Каждая лунка содержит различную ДНК-матрицу. Дно лунок представляет собой ионочувствительный слой, которое является запатентованным ионным сенсором.7. Ion semiconductor sequencing, which is based on the detection of hydrogen ions that are released during DNA polymerization. For example, Ion Torrent Systems (San Francisco, CA) uses a high-density chip of micro-machined wells to carry out this biochemical process in a massively parallel fashion. Each well contains a different DNA template. The bottom of the wells is an ion sensitive layer, which is a patented ion sensor.

Предпочтительно, ДНК и РНК предпочтительно служат в качестве исходного материала для NGS. Такие нуклеиновые кислоты легко могут быть получены из образцов, таких как биологический материал, например, из свежих, быстрозамороженных или погруженных в парафин фиксированных формалином опухолевых тканей (FFPE) или из свежевыделенных клеток или из CTC, которые присутствуют в периферической крови пациентов. Нормальная не подверженная мутациям геномная ДНК или РНК может быть выделена из нормальной соматической ткани, однако клетки зародышевой линии являются предпочтительными в контексте настоящего изобретения. Зародышевую ДНК или РНК выделяют из мононуклеаров периферической крови (PBMC) пациентов с негематологическими злокачественными опухолями. Хотя нуклеиновые кислоты, выделенные из тканей FFPE или из свежевыделенных одиночных клеток, высоко фрагментированы, они подходят для NGS-применений.Preferably, DNA and RNA preferably serve as starting material for NGS. Such nucleic acids can easily be obtained from samples such as biological material, for example, from fresh, quick-frozen or paraffin-embedded formalin-fixed tumor tissues (FFPE) or from freshly isolated cells or from CTCs that are present in the peripheral blood of patients. Normal unmutated genomic DNA or RNA can be isolated from normal somatic tissue, however, germline cells are preferred in the context of the present invention. Germ DNA or RNA is isolated from peripheral blood mononuclear cells (PBMC) of patients with non-hematologic malignancies. Although nucleic acids isolated from FFPE tissues or from freshly isolated single cells are highly fragmented, they are suitable for NGS applications.

Несколько направленных NGS-методов для секвенирования экзомов описаны в научной литературе (для обзора см., например, Teer and Mullikin 2010: Human Mol Genet 19 (2), R145-51), каждый из которых может использоваться совместно с настоящим изобретением. Многие и этих методов (описанных, например, как захват генома, разделение генома, обогащение генома и т.д.) используют методы гибридизации и включают методы на основе использования чипа (например, Hodges et al. 2007: Nat. Genet. 39, 1522-1527) и методы гибридизации в растворе (например, Choi et al. 2009: Proc. Natl. Acad. Sci USA 106, 19096-19101). Коммерческие наборы для приготовления образца ДНК и последующего захвата экзома также доступны: например, «Illumina Inc.» (Сан-Диего, Калифорния) предлагает «TruSeq™ DNA Sample Preparation Kit» и «Exome Enrichment Kit TruSeq™ Exome Enrichment Kit».Several targeted NGS methods for exome sequencing are described in the scientific literature (for a review, see, for example, Teer and Mullikin 2010: Human Mol Genet 19 (2), R145-51), each of which can be used in conjunction with the present invention. Many of these methods (described, for example, as genome capture, genome separation, genome enrichment, etc.) use hybridization methods and include chip-based methods (for example, Hodges et al. 2007: Nat. Genet. 39, 1522 -1527) and solution hybridization methods (e.g., Choi et al. 2009: Proc. Natl. Acad. Sci USA 106, 19096-19101). Commercial kits for DNA sample preparation and subsequent exome capture are also available: for example, "Illumina Inc." (San Diego, CA) offers "TruSeq™ DNA Sample Preparation Kit" and "Exome Enrichment Kit TruSeq™ Exome Enrichment Kit".

С целью уменьшения количества ложных положительных результатов при детекции опухолеспецифичных соматических мутаций или различий в последовательности при сравнении, например, последовательности опухолевого образца с последовательностью эталонного образца, такого как последовательность образца зародышевой линии, предпочтительно определять последовательность в дубликатах одного или обоих их этих типов образцов. Таким образом, предпочтительно, что последовательность эталонного образца, такая как последовательность образца зародышевой линии, определяется два раза, три раза или более. В ином случае или дополнительно, последовательность опухолевого образца определяется два раза, три раза или более. Также возможно определение последовательности эталонного образца, такой как последовательность образца зародышевой линии и/или последовательности опухолевого образца более чем один раз посредством определения, по меньшей мере, единожды последовательности геномной ДНК и определения, по меньшей мере, единожды последовательности РНК указанного эталонного образца и/или указанного опухолевого образца. Например, путем определения вариаций между репликами эталонного образца, такого как образец зародышевой линии, может быть определена частота ложно положительных (FDR) соматических мутаций в виде статистической величины. Технические повторы образца должны давать идентичные результаты, и любая детектируемая мутация в данном сравнении «сам против себя» является ложно положительной. Конкретно, для определения частоты ложно положительных результатов для детекции соматических мутаций в опухолевом образце относительно эталонного образца, может использоваться технический повтор эталонного образца в качестве эталона для оценки количества ложно положительных результатов. Кроме того, различные связанные с качеством показатели (например, перекрывание или качество SNP) могут быть объединены в единую бальную оценку качества с использованием способа машинного обучения. Для данной соматической вариации могут быть подсчитаны все остальные вариации с превышением бальной оценки качества, что дает возможность упорядочивания всех вариаций в наборе данных.In order to reduce the number of false positives when detecting tumor-specific somatic mutations or sequence differences when comparing, for example, the sequence of a tumor sample with the sequence of a reference sample, such as the sequence of a germline sample, it is preferable to determine the sequence in duplicates of one or both of these types of samples. Thus, it is preferable that the sequence of the reference sample, such as the sequence of the germline sample, is determined two times, three times or more. Otherwise, or additionally, the sequence of the tumor sample is determined two times, three times or more. It is also possible to determine the sequence of a reference sample, such as the sequence of a germline sample and/or the sequence of a tumor sample more than once by determining at least once the sequence of genomic DNA and determining at least once the RNA sequence of said reference sample and/or specified tumor sample. For example, by determining the variation between replicates of a reference sample, such as a germline sample, the false positive (FDR) somatic mutation rate can be determined as a statistic. Technical replicates of a sample should produce identical results, and any detectable mutation in a given self-versus-self comparison is a false positive. Specifically, to determine the false positive rate for detecting somatic mutations in a tumor sample relative to a reference sample, the technical replica of the reference sample can be used as a benchmark for estimating the number of false positives. In addition, various quality-related metrics (eg, overlap or SNP quality) can be combined into a single quality score using a machine learning method. For a given somatic variation, all other variations can be scored in excess of the quality score, making it possible to order all variations in the dataset.

Согласно изобретению может применяться высокопроизводительный метод полногеномного генотипирования одиночной клетки.According to the invention, a high throughput single cell genome wide genotyping method can be used.

В одном воплощении высокопроизводительного полногеномного генотипирования одиночной клетки может использоваться платформа «Fluidigm». Такой способ может включать следующие стадии:In one embodiment of high throughput single cell genome wide genotyping, the "Fluidigm" platform can be used. Such a method may include the following steps:

1. Забор опухолевой ткани/клеток и здоровой ткани от данного пациента.1. Collection of tumor tissue/cells and healthy tissue from a given patient.

2. Генетический материал выделяют из опухолевых и из здоровых клеток и затем его экзом (ДНК) секвенируют с использованием стандартных протоколов секвенирования следующего поколения (NGS). Перекрывание NGS таково, что могут детектироваться гетерозиготные аллели, по меньшей мере, с 5%-частотой. Транскриптом (РНК) также выделяют из опухолевых клеток, конвертируют в кДНК и секвенируют для определения того, какие гены экспрессируются опухолевыми клетками.2. Genetic material is isolated from tumor and healthy cells and then its exome (DNA) is sequenced using standard next generation sequencing (NGS) protocols. The overlap of NGS is such that heterozygous alleles can be detected with at least 5% frequency. The transcriptome (RNA) is also isolated from tumor cells, converted to cDNA, and sequenced to determine which genes are expressed by tumor cells.

3. Несинонимичные экспрессирующиеся однонуклеотидные вариации (англ. single nucleotide variation, SNV) идентифицируют, как описано в данном документе. Отфильтровывают участки, которые являются SNP в здоровой ткани.3. Non-synonymous expressed single nucleotide variations (English single nucleotide variation, SNV) are identified as described in this document. Filter out sites that are SNPs in healthy tissue.

4. N=96 мутации из (3) отбирают, перекрывая различные частоты. Анализы SNP-генотипирования на основе детектирования флуоресценции разработаны и синтезированы для этих мутаций (примеры таких анализов включают: SNP-анализ на основе «TaqManо» от «Life Technologies» или тесты «SNPtype» от «Fluidigm»). Тесты будут включать праймеры амплификации специфической мишени (STA) для амплификации ампликонов, содержащих данный SNV (это стандарт в тестах «TaqMan» и «SNPtype»).4. N=96 mutations from (3) are selected by overlapping different frequencies. SNP genotyping assays based on fluorescence detection are designed and synthesized for these mutations (examples of such assays include: TaqMano based SNP assay from Life Technologies or SNPtype assays from Fluidigm). The tests will include specific target amplification (STA) primers to amplify amplicons containing this SNV (this is the standard in the TaqMan and SNPtype tests).

5. Индивидуальные клетки будут выделены из опухолевой и из здоровой ткани либо с помощью лазерной микродиссекции (LMD) либо с помощью дисагрегации до одноклеточных суспензий с последующей сортировкой, как описано ранее (Dalerba P. et al. (2011) Nature Biotechnology 29: 1120-1127). Клетки могут быть отобраны либо без предварительного отбора (т.e. все), или, в ином случае, опухолевые клетки могут быть обогащены. Методы обогащения включают: специфическое окрашивание, сортировка клеток по размеру, гистологический анализ во время LMD, и так далее.5. Individual cells will be isolated from tumor and healthy tissue either by laser microdissection (LMD) or by disaggregation to single cell suspensions followed by sorting as previously described (Dalerba P. et al. (2011) Nature Biotechnology 29: 1120- 1127). Cells can be selected either without pre-selection (ie all), or, alternatively, tumor cells can be enriched. Enrichment methods include: specific staining, cell size sorting, histological analysis during LMD, and so on.

6. Индивидуальные клетки будут выделены в ПЦР-пробирках, содержащих мастер-микс вместе с STA-праймерами, и ампликоны, содержащие SNV, будут амплифицированы. В ином случае, геном одиночной клетки будет амплифицирован амплификацией цельного генома (WGA), как описано ранее (Frumkin D. et al. (2008) Cancer Research 68: 5924). Клеточный лизис будет осуществлен либо в стадии нагревания при 95°C, либо посредством специального лизирующего буфера.6. Individual cells will be isolated in PCR tubes containing the master mix along with STA primers and the SNV containing amplicons will be amplified. Otherwise, the single cell genome will be amplified by whole genome amplification (WGA) as previously described (Frumkin D. et al. (2008) Cancer Research 68: 5924). Cell lysis will be carried out either in a heating step at 95°C or with a special lysis buffer.

7. STA-амплифицированные образцы разводят и загружают на чип для генотипрования «Fluidigm».7. STA-amplified samples are diluted and loaded onto the Fluidigm genotyping chip.

8. Образцы из здоровой ткани будут использоваться в качестве положительных контролей для определения кластеров гомозиготных аллелей (без мутации). Так как NGS-данные выявляют, что гомозиготные мутации исключительно редкие, как правило, ожидаются только два кластера: XX и XY, с X=здоровым.8. Healthy tissue samples will be used as positive controls to identify clusters of homozygous alleles (no mutation). Since NGS data reveals that homozygous mutations are exceptionally rare, typically only two clusters are expected: XX and XY, with X=healthy.

9. Количество чипов, которые могут быть сделаны, не ограничено, с возможностью практического осуществления анализа до ~1000 одиночных клеток (~10 чипов). Если осуществлять в 384-луночных планшетах, то приготовление образца уменьшится до нескольких дней.9. The number of chips that can be made is not limited, with the possibility of practical implementation of the analysis up to ~1000 single cells (~10 chips). If carried out in 384-well plates, sample preparation will be reduced to several days.

10. Затем определяют SNV для каждой клетки.10. Then determine the SNV for each cell.

В другом воплощении высокопроизводительного полногеномного генотипирования одиночной клетки может использоваться платформа NGS. Такой способ может включать следующие стадии:In another embodiment of high throughput single cell genome wide genotyping, the NGS platform may be used. Such a method may include the following steps:

1. Стадии 1-6 выше идентичны за исключением того, что N (количество анализируемых SNV) может быть гораздо больше 96. В случае WGA, несколько циклов STA будут осуществлены после. STA-праймеры будут содержать две универсальные последовательности метки на каждом праймере.1. Steps 1-6 above are identical except that N (the number of SNVs analyzed) can be much larger than 96. In the case of WGA, several STA cycles will be performed after. The STA primers will contain two universal tag sequences on each primer.

2. После STA, праймеры со штрихкодом будут амплифицироваться путем ПЦР в ампликоны. Праймеры со штрихкодом содержат уникальные последовательности «штрихкода» и вышеуказанные универсальные последовательности метки. Каждая клетка, таким образом, будет содержать уникальный штрихкод.2. After STA, the barcoded primers will be amplified by PCR into amplicons. Barcoded primers contain unique "barcode" sequences and the above generic label sequences. Each cell will thus contain a unique barcode.

3. Ампликоны из всех клеток будут смешиваться и секвенироваться посредством NGS. Практическое ограничение количества клеток, которые могут быть мультиплексированы, заключается в количестве планшетов, которое может быть приготовлено. Так как образцы могут быть приготовлены в 384-луночных планшетах, то практическое ограничение будет составлять ~5000 клеток.3. Amplicons from all cells will be mixed and sequenced by NGS. A practical limitation on the number of cells that can be multiplexed is the number of plates that can be prepared. Since samples can be prepared in 384-well plates, the practical limit would be ~5000 cells.

4. На основе данных о последовательностях детектируют SNV (или друге структурные аномалии) индивидуальных клеток.4. Based on sequence data, SNV (or other structural abnormalities) of individual cells are detected.

Согласно изобретению для приоретизации антигенов можно использовать опухолевую генетическую реконструкцию на основе генотипирования одиночной клетки («филогенетическая антигенная приоритезация»). Кроме антигенной системы приоритетов на основе таких критериев, как экспрессия, тип мутации (несинонимичная против другой), MHC-связывающие характеристики и так далее, можно использовать дополнительное направление для приоритезации, разработанное для того, чтобы справиться с внутриопухолевой и межопухолевой гетерогенностью, и систематической ошибкой биопсии, может использоваться как описано, например, ниже.According to the invention, tumor genetic reconstruction based on single cell genotyping ("phylogenetic antigen prioritization") can be used to prioritize antigens. In addition to an antigenic priority system based on criteria such as expression, mutation type (non-synonymous vs. other), MHC-binding characteristics, and so on, an additional prioritization avenue designed to deal with intratumoral and intertumoral heterogeneity and bias can be used. biopsy, can be used as described, for example, below.

1. Идентификация большинства широкораспространенных антигенов1. Identification of most common antigens

Частоту каждого SNV можно точно оценить на основе анализа одиночной клетки, описанного выше, совместно с высокопроизводительным методом полногеномного генотипирования, и большинство присутствующих широкораспространенных SNV может быть отобрано для получения индивидуальных противоопухолевых вакцин (IVAC).The frequency of each SNV can be accurately estimated based on the single cell assay described above, in conjunction with the high throughput whole genome genotyping method, and most of the widespread SNVs present can be selected for individualized cancer vaccines (IVACs).

2. Идентификация первичных базальных антигенов на основе анализа «дерево с корнем» (root tree analysis).2. Identification of primary basal antigens based on root tree analysis.

NGS-данные из опухолей предполагают, что гомозиготные мутации (горячие точки в обоих аллелях) представляют собой редкие события. Таким образом, нет необходимости гаплотипирования, и филогенетическое дерево опухолевых соматических мутаций может быть создано на основе данных SNV одиночной клетки. Зародышевая последовательность будет использоваться для корня дерева. С помощью алгоритма для воспроизводства наследственных последовательностей последовательности узлов около корня дерева будут воспроизведены. Эти последовательности содержат самые ранние мутации, которые по прогнозам существуют в первичной опухоли (определенные в данном документе как первичные базальные мутации/антигены). Благодаря низкой вероятности того, что две мутации произойдут на одинаковых аллелях в одном и том же положении генома, мутации в наследственных последовательностях по прогнозам будут фиксированы в опухоли.NGS data from tumors suggest that homozygous mutations (hot spots in both alleles) are rare events. Thus, there is no need for haplotyping, and a phylogenetic tree of tumor somatic mutations can be generated from single cell SNV data. The germ sequence will be used for the root of the tree. Using an algorithm to reproduce hereditary sequences, sequences of nodes near the root of the tree will be reproduced. These sequences contain the earliest mutations predicted to exist in the primary tumor (defined herein as primary basal mutations/antigens). Due to the low probability that two mutations will occur on the same alleles at the same position in the genome, mutations in ancestral sequences are predicted to be fixed in the tumor.

Приоритезация первичных базальных антигенов не эквивалентна приоритезации наиболее частых мутаций в биопсии (хотя первичные базальные мутации, как ожидается, будут среди наиболее частых в биопсии). Причина следующая: скажем две SNV присутствуют во всех клетках, выделенных из биопсии (и таким образом имеют такую же частоту – 100%), но одна мутация является базальной, а другая нет, поэтому базальная мутация должна быть отобрана для IVAC. Это происходит из-за того, что базальная мутация вероятно присутствует во всех областях опухоли, тогда как более поздняя мутация может быть более недавней мутацией, которая случайно зафиксировалась в области, где была взята биопсия. Кроме того, базальные антигены, вероятно, существуют в метастазирующих опухолях, полученных из первичной опухоли. Таким образом, путем приоритезации базальных антигенов для IVAC специалист может существенно повысить шанс, что IVAC будет способна ликвидировать всю опухоль, а не только часть опухоли.Prioritizing primary basal antigens is not equivalent to prioritizing the most common mutations in a biopsy (although primary basal mutations are expected to be among the most common in biopsies). The reason is: let's say two SNVs are present in all biopsy cells (and thus have the same frequency of 100%), but one mutation is basal and the other is not, so the basal mutation must be selected for IVAC. This is because the basal mutation is likely to be present in all areas of the tumor, while the later mutation may be a more recent mutation that was accidentally fixed in the area where the biopsy was taken. In addition, basal antigens probably exist in metastatic tumors derived from the primary tumor. Thus, by prioritizing basal antigens for IVAC, the skilled artisan can greatly increase the chance that IVAC will be able to eradicate the entire tumor rather than just part of the tumor.

Если вторичные опухоли существуют, и они также были отобраны, то можно оценить эволюционное дерево всех опухолей. Такой подход может улучшить ошибкоустойчивость дерева и позволить детектировать мутации, которые являются базальными по отношению ко всем опухолям.If secondary tumors exist and they have also been selected, then the evolutionary tree of all tumors can be estimated. This approach can improve the robustness of the tree and allow the detection of mutations that are basal to all tumors.

3. Идентификация антигенов, которые максимально охватывают опухоль(и)3. Identification of antigens that maximally cover the tumor(s)

Другой способ получения антигенов, который максимально перекрывает все опухолевые участки, заключается в заборе нескольких биопсий из опухоли. Одна стратегия будет заключаться в отборе антигенов, идентифицированных с помощью анализа NGS, присутствующих во всех биопсиях. Для улучшения шансов идентификации базальных мутаций может быть осуществлен филогенетический анализ на основе мутаций одиночной клетки из всех биопсий.Another way to obtain antigens, which maximally covers all tumor sites, is to take several biopsies from the tumor. One strategy would be to select antigens identified by NGS analysis present in all biopsies. To improve the chances of identifying basal mutations, phylogenetic analysis can be performed based on single cell mutations from all biopsies.

В случае метастазирования, могут быть получены биопсии из всех опухолей, и могут быть отобраны мутации, идентифицированные посредством NGS, которые являются общими для всех опухолей.In the case of metastasis, biopsies can be obtained from all tumors and mutations identified by NGS that are common to all tumors can be selected.

4. Использование CTC для приоритезации антигенов, которые ингибируют метастазирование4. Use of CTC to prioritize antigens that inhibit metastasis

Считается, что метастазирующие опухоли получаются из одиночных клеток. Таким образом, путем генотипирования индивидуальных клеток, выделенных из различных опухолей данного пациента, совместно с генотипированием циркулирующих опухолевых клеток пациента (CTC), специалист может восстановить эволюционную историю злокачественного новообразования. Ожидание заключается в наблюдении метастазирующих опухолей, эволюционирующих из исходной опухоли посредством филогенетической ветви CTC, выделенных из первичной опухоли.It is believed that metastatic tumors are obtained from single cells. Thus, by genotyping individual cells isolated from a given patient's various tumors, in conjunction with genotyping the patient's circulating tumor cells (CTCs), one can reconstruct the evolutionary history of the cancer. The expectation is to observe metastatic tumors evolving from the original tumor through the phylogenetic branch of the CTC isolated from the primary tumor.

Ниже (несмещенный метод для идентификации, подсчета и генетического зондирования CTC) мы описываем расширение вышеописанного метода высокопроизводительного полногеномного генотипирования одиночной клетки для несмещенного выделения и геномного анализа CTC. Используя анализ, описанный выше, специалист может в последствие восстановить филогенетическое дерево первичной опухоли, CTC и вторичных опухолей, развившихся из метастазов (если они есть). На основе этого дерева специалист может идентифицировать мутации (ведомые и ведущие), которые появляются в момент или сразу после того, как CTC впервые открепляются от первичной опухоли. Ожидание состоит в том, что геномы CTC, происходящих из первичной опухоли, эволюционно более похожи на геномы первичной опухоли, чем геномы вторичной опухоли. Кроме того, ожидается, что геномы CTC, происходящих из первичной опухоли, будут содержать уникальные мутации, которые фиксируются во вторичных опухолях, или которые вероятно будут фиксироваться, если вторичные опухоли образуются в будущем. Эти уникальные мутации могут быть расположены в порядке приоритета для IVAC для направленного воздействия (или предотвращения) метастазирования.Below (an unbiased method for CTC identification, enumeration and genetic probing), we describe an extension of the above high-throughput single cell genome-wide genotyping method for unbiased isolation and genomic analysis of CTC. Using the analysis described above, the specialist can subsequently reconstruct the phylogenetic tree of the primary tumor, CTC, and secondary tumors developed from metastases (if any). Based on this tree, the specialist can identify mutations (slave and lead) that appear at or shortly after CTCs first detach from the primary tumor. The expectation is that the genomes of CTCs derived from the primary tumor are evolutionarily more similar to the genomes of the primary tumor than the genomes of the secondary tumor. In addition, the genomes of CTCs derived from a primary tumor are expected to contain unique mutations that are fixed in secondary tumors, or that are likely to be fixed if secondary tumors form in the future. These unique mutations can be prioritized for IVAC to target (or prevent) metastasis.

Преимущество приоритетных мутаций CTC против первичных базальных мутаций заключается в том, что антигены, выделенные из CTC, могут мобилизовать T-клетки специфично для направленного воздействия на метастазы, и таким образом, они будут независимым крылом направленного воздействия Т-клеток на первичную опухоль (с использованием различных антигенов). Кроме того, если есть мало вторичных опухолей (или их нет), то ожидается, что шанс ускользания от иммунитета от выделенных из CTC антигенов, будет ниже, поскольку вероятность для ускользания опухоли от иммунитета будет коррелировать с количеством опухолевых клеток, несущих данный антиген.The advantage of CTC priority mutations versus primary basal mutations is that CTC-derived antigens can mobilize T cells specifically to target metastases, and thus they will be an independent wing of T cell targeting of the primary tumor (using different antigens). In addition, if there are few or no secondary tumors, then the chance of immune escape from CTC-derived antigens is expected to be lower, since the likelihood for a tumor to escape immunity will correlate with the number of tumor cells bearing a given antigen.

5. Идентификация антигенов, присутствующих в одной и той же клетке («коктейль» IVAC)5. Identification of antigens present in the same cell (“cocktail” IVAC)

Считается, что опухоль эволюционирует путем подавления мутаций в результате селективного давления иммунной системы и терапии. Противоопухолевые вакцины, направленно воздействующие на множество антигенов, которые сосуществуют на одной и той же клетке и которые также нередки в опухоли, имеют больший шанс преодоления механизма ускользания опухоли от иммунитета, и таким образом, уменьшают шанс рецидива. Такие «вакцины-коктейли» будут аналогичны антиретровирусной комбинированной терапии для HIV+-пациентов. Сосуществующие мутации могут быть идентифицированы с помощью филогенетического анализа или путем проверки SNV-выравнивания всех клеток.It is believed that the tumor evolves by suppressing mutations as a result of the selective pressure of the immune system and therapy. Cancer vaccines that target multiple antigens that coexist on the same cell and that are also not uncommon in the tumor have a greater chance of overcoming the tumor's immune escape mechanism, and thus reduce the chance of recurrence. Such "vaccine cocktails" would be similar to antiretroviral combination therapy for HIV+ patients. Coexisting mutations can be identified by phylogenetic analysis or by checking the SNV alignment of all cells.

Кроме того, согласно изобретению, может использоваться несмещенный метод идентификации, подсчета и генетического зондирования CTC. Такой способ может включать следующие стадии:In addition, according to the invention, an unbiased method for identifying, enumerating and genetically probing CTCs can be used. Such a method may include the following steps:

1. Получение биопсии опухоли(ей) и определение атласа соматических мутаций.1. Obtaining a biopsy of the tumor(s) and determining the atlas of somatic mutations.

2. Операция 1: Отбор N≥96 мутаций для дополнительного исследования на основе ранее разработанной схемы приоритезации.2. Step 1: Selection of N≥96 mutations for further study based on the previously developed prioritization scheme.

Операция 2: Осуществление анализа одиночной клетки (см. выше описанный метод высокопроизводительного полногеномного генотипирования одиночной клетки) с последующим филогенетическим анализом для отбора N≥96 первичных базальных мутаций и возможно более недавних мутаций для максимального разнообразия. Первые мутации применимы для идентификации CTC (см. ниже), а последние для осуществления филогенетического анализа (см. раздел «идентификация антигенов, сосуществующих на одной и той же клетке («коктейль» IVAC»)).Step 2: Perform a single cell analysis (see the high throughput single cell genome wide genotyping method described above) followed by phylogenetic analysis to select for N≥96 primary basal mutations and possibly more recent mutations for maximum diversity. The former mutations are applicable for CTC identification (see below), and the latter for phylogenetic analysis (see section “identification of antigens coexisting on the same cell (“IVAC cocktail”)).

3. Получение цельной крови из онкопациента3. Obtaining whole blood from a cancer patient

4. Лизис эритроцитов4. Lysis of erythrocytes

5. Удаление лейкоцитов путем истощения CD45+ клеток (например, посредством сортировки, магнитных микросфер, конъюгированных с анти-CD45 антителом, и т.д.) для обогащения CTC.5. Removal of leukocytes by depletion of CD45+ cells (eg, by sorting, magnetic microspheres conjugated with an anti-CD45 antibody, etc.) to enrich CTC.

6. Удаление свободной ДНК с помощью гидролиза ДНК-азой. Источником свободной ДНК может быть ДНК, присутствующая в крови, или ДНК из мертвых клеток.6. Removal of free DNA by DNase hydrolysis. The source of free DNA can be DNA present in the blood or DNA from dead cells.

7. Сортировка оставшихся клеток в ПЦР-пробирки, осуществление STA (на основе отобранных мутаций) и скрининг на «Fluidigm» (вышеописанный метод высокопроизводительного полногеномного генотипирования одиночной клетки). CTC должны, как правило, быть положительными по множеству SNV.7. Sorting the remaining cells into PCR tubes, performing STA (based on selected mutations) and screening for "Fluidigm" (high throughput single cell genome wide genotyping method described above). CTCs should generally be positive across multiple SNVs.

8. Клетки, идентифицированные как опухолевые (=CTC) могут затем дополнительно анализироваться филогенетически на основе панели скринированных SNV (см. раздел «Идентификация антигенов, сосуществующих на одной и той же клетке («коктейль» IVAC»)).8. Cells identified as tumor (=CTC) can then be further analyzed phylogenetically based on a panel of screened SNVs (see Identification of Antigens Coexisting on the Same Cell (“IVAC Cocktail”)).

Также возможно объединить этот способ с ранее созданными способами для выделенных CTC. Например, специалист может отсортировать EpCAM+ клетки, или клетки, положительные по цитокератинам (Rao CG. et al. (2005) International journal of oncology 27: 49; Allard WJ. et al. (2004) Clinical Cancer Research 10: 6897-6904). Эти предполагаемые CTC могут затем подтверждаться/зондироваться на «Fluidigm»/NGS для выделения их мутаций.It is also possible to combine this method with previously created methods for dedicated CTCs. For example, one skilled in the art can sort EpCAM+ cells, or cells positive for cytokeratins (Rao CG. et al. (2005) International journal of oncology 27:49; Allard WJ. et al. (2004) Clinical Cancer Research 10: 6897-6904) . These putative CTCs can then be confirmed/probed with Fluidigm/NGS to isolate their mutations.

Этот способ может использоваться для подсчета CTC. Так как способ не базируется на конкретном маркере, который может экспрессироваться опухолевыми клетками или не может экспрессироваться опухолевыми клетками, но скорее базируeтся на профиле мутаций опухолевых соматических мутаций, уникальных для пациента, то он представляет собой несмещенный метод для детекции и подсчета CTC.This method can be used to calculate CTC. Since the method is not based on a specific marker that may or may not be expressed by tumor cells, but rather is based on the mutation profile of tumor somatic mutations unique to the patient, it is an unbiased method for detecting and enumerating CTC.

Согласно изобретению может быть использован способ, включающий опухолевую филогенетическую реконструкцию на основе генотипирования одиночной клетки для обогащения ведущих мутаций («филогенетический фильтр»).According to the invention, a method can be used that includes tumor phylogenetic reconstruction based on single cell genotyping to enrich leading mutations ("phylogenetic filter").

В одном воплощении данного способа осуществляется пан-опухолевый филогенетический анализ для извлечения ведущих мутаций.In one embodiment of this method, a pan-tumor phylogenetic analysis is performed to extract leading mutations.

Например, могут быть детектированы ведущие мутации из n=1 опухолей.For example, leading mutations from n=1 tumors can be detected.

В вышеописанном разделе «Идентификация первичных базальных антигенов на основе анализа «дерево с корнем»» мы описали способ выявления исходных последовательностей и/или идентификации клеток, которые имеют последовательности, близкие к «корню дерева». Ожидается, что количество мутаций в этих последовательностях будет значительно меньше, чем количество мутаций в суммарном образце опухоли, так как по определению они представляют собой последовательности, близкие к «корню дерева». Таким образом, с помощью отбора последовательностей, близких к «корню дерева» ожидается, что множество ведомых мутаций будет «филогенетически отфильтровано». Данная процедура имеет потенциал для существенного обогащения ведущих мутаций. Затем ведущие мутации могут использоваться для идентификации/отбора лечения пациента или могут использоваться в качестве ключей для новых терапий.In the above section "Identification of primary basal antigens based on the analysis" tree with a root ", we described a method for identifying the original sequences and/or identifying cells that have sequences close to the" tree root ". It is expected that the number of mutations in these sequences will be significantly less than the number of mutations in the total tumor sample, since by definition they are sequences close to the "root of the tree". Thus, by selecting sequences close to the "root of the tree", it is expected that many driven mutations will be "phylogenetically filtered out". This procedure has the potential to significantly enrich leading mutations. The lead mutations can then be used to identify/select a patient's treatment, or can be used as keys for new therapies.

В другом примере могут быть детектированы ведущие мутации из n>1 опухолей данного типа.In another example, lead mutations can be detected from n>1 tumors of a given type.

С помощью реконструкции первичных базальных мутаций из множества опухолей конкретного типа специалист может существенно повысить шанс детекции ведущих мутаций. Так как базальные последовательности, близкие к «корню дерева», отфильтровывают множество ведомых мутаций, то соотношение сигнала к фону при детекции ведущих мутаций, как ожидается, существенно повысится. Таким образом, данный способ имеет потенциал детектировать (1) менее частую ведущую мутацию (2) частую ведущую мутацию из меньшего количества образцов.By reconstructing primary basal mutations from a variety of tumors of a particular type, one can significantly increase the chance of detecting leading mutations. Since basal sequences close to the "root of the tree" filter out many lead mutations, the signal-to-background ratio for detecting lead mutations is expected to increase significantly. Thus, this method has the potential to detect (1) a less frequent lead mutation (2) a frequent lead mutation from fewer samples.

В другом воплощении способа, включающего опухолевую филогенетическую реконструкцию на основе генотипирования одиночной клетки для обогащения ведущих мутаций («филогенетический фильтр»), осуществляется филогенетический анализ для извлечения ведущих мутаций, вызывающих метастазирование.In another embodiment of the method, including tumor phylogenetic reconstruction based on single cell genotyping to enrich for lead mutations ("phylogenetic filter"), a phylogenetic analysis is performed to extract lead mutations that cause metastasis.

В вышеописанном разделе «Использование CTC для приоритизации антигенов, которые ингибируют метастазирование» мы описали способ детекции CTC-ассоциированных мутаций. Этот способ также может использоваться для обогащения ведущих мутаций, приводящих к метастазированию. Например, с помощью картирования комбинированной филогенетики первичной опухоли, вторичной опухоли и CTC, CTC, выделенные из первичной опухоли, должны связываться между филогенетическими ветвями первичной и вторичной опухоли. Такой филогенетический анализ может помочь точно указать мутации, уникальные в данном переходном состоянии между первичной и вторичной опухолями. Фракция этих мутаций может представлять собой ведущие мутации. Кроме того, путем сравнения уникальных CTC-мутаций из различных случаев одной и той же опухоли (т.e., n>1 опухолей), специалист может дополнительно получить обогащение уникальными ведущими мутациями, вызывающими метастазирование.In the above section "Using CTC to prioritize antigens that inhibit metastasis" we described a method for detecting CTC-associated mutations. This method can also be used to enrich for leading mutations leading to metastasis. For example, by mapping the combined phylogenetics of the primary tumor, secondary tumor, and CTC, CTCs isolated from the primary tumor should be linked between the phylogenetic branches of the primary and secondary tumors. Such phylogenetic analysis can help pinpoint mutations that are unique in a given transitional state between primary and secondary tumors. A fraction of these mutations may represent lead mutations. In addition, by comparing unique CTC mutations from different cases of the same tumor (i.e., n>1 tumors), one can further enrich for unique metastasis-causing lead mutations.

Согласно изобретению может использоваться филогенетический анализ для идентификации первичных опухолей против вторичных.According to the invention, phylogenetic analysis can be used to identify primary versus secondary tumors.

В случае метастазирования если делать забор из всех опухолей, то «дерево с корнем» может использоваться для прогноза временного порядка, в котором появляются опухоли: какая опухоль первичная (узлы, ближайшие к «корню дерева») и какие опухоли являются самыми последними. Это может быть полезно в случаях, когда трудно определить, какая опухоль является первичной.In the case of metastasis, if all tumors are sampled, the rooted tree can be used to predict the temporal order in which tumors appear: which tumor is primary (nodes closest to the tree root) and which tumors are the most recent. This may be useful in cases where it is difficult to determine which tumor is the primary.

В контексте настоящего изобретения термин «РНК» относится к молекуле, которая включает, по меньшей мере, один рибонуклеотидный остаток и предпочтительно полностью или частично состоит из рибонуклеотидных остатков. «Рибонуклеотид» относится к нуклеотиду, содержащему гидроксильную группу в 2’-положении β-D-рибофуранозильной группы. Термин «РНК» включает двухцепочечную РНК, одноцепочечную РНК, изолированную РНК, такую как частично или полностью очищенная РНК, фактически чистую РНК, синтетическую РНК и рекомбинантно полученную РНК, такую как модифицированная РНК, которая отличается от природной РНК вставкой, делецией, заменой и/или изменением одного или нескольких нуклеотидов. Такие изменения могут включать вставку не нуклеотидного материала, как например на конце(ах) РНК или внутри, например, к одному или нескольким нуклеотидам РНК. Нуклеотиды молекул РНК также могут включать нестандартные нуклеотиды, такие как синтетические нуклеотиды или химически синтезированные нуклеотиды или дезоксинуклеотиды. Эти измененные РНК могут обозначаться как аналоги или аналоги природных РНК.In the context of the present invention, the term "RNA" refers to a molecule that includes at least one ribonucleotide residue and preferably consists entirely or partially of ribonucleotide residues. "Ribonucleotide" refers to a nucleotide containing a hydroxyl group at the 2' position of the β-D-ribofuranosyl group. The term "RNA" includes double-stranded RNA, single-stranded RNA, isolated RNA such as partially or completely purified RNA, virtually pure RNA, synthetic RNA, and recombinantly produced RNA such as modified RNA that differs from natural RNA by insertion, deletion, substitution and/ or a change in one or more nucleotides. Such changes may include the insertion of non-nucleotide material, such as at the end(s) of the RNA or internally, for example, to one or more nucleotides of the RNA. Nucleotides of RNA molecules may also include non-standard nucleotides such as synthetic nucleotides or chemically synthesized nucleotides or deoxynucleotides. These altered RNAs may be referred to as natural RNA analogs or analogs.

Согласно настоящему изобретению термин «РНК» включает и предпочтительно относится к «мРНК». Термин «мРНК» означает «матричную РНК» и относится к «транскрипту», который генерируется с использованием ДНК-матрицы и кодирует пептид или полипептид. Как правило, мРНК включает 5’-UTR, область, кодирующую белок, и 3’-UTR. мРНК обладает только ограниченным периодом полужизни в клетках и in vitro. В контексте настоящего изобретения мРНК может быть получена in vitro транскрипцией ДНК-матрицы. Методология in vitro транскрипции известна специалистам. Например, существует множество коммерчески доступных наборов реактивов для in vitro транскрипции.According to the present invention, the term "RNA" includes and preferably refers to "mRNA". The term "mRNA" means "messenger RNA" and refers to a "transcript" that is generated using a DNA template and encodes a peptide or polypeptide. Typically, an mRNA includes a 5'-UTR, a protein-coding region, and a 3'-UTR. mRNA has only a limited half-life in cells and in vitro. In the context of the present invention, mRNA can be obtained in vitro by transcription of a DNA template. The methodology for in vitro transcription is known to those skilled in the art. For example, there are many commercially available kits for in vitro transcription.

Согласно изобретению стабильность и эффективность трансляции РНК может, если необходимо, быть модифицирована. Например, РНК может быть стабилизирована и ее трансляция увеличивается с помощью одной или нескольких модификаций, обладающих стабилизирующим эффектом и/или повышением эффективности трансляции РНК. Такие модификации описаны, например, в PCT/EP2006/009448, включенном в данный документ ссылкой. С целью повышения экспрессии РНК, используемой согласно настоящему изобретению, она может быть модифицирована внутри кодирующей области, т.е. последовательности, кодирующей экспрессируемый пептид или белок, предпочтительно без изменения последовательности экспрессируемого пептида или белка, так чтобы повысить GC-содержание для увеличения стабильности мРНК и для осуществления оптимизации кодонов и, таким образом, для усиления трансляции в клетках.According to the invention, the stability and efficiency of RNA translation can, if necessary, be modified. For example, the RNA can be stabilized and its translation increased by one or more modifications that have a stabilizing effect and/or increase the efficiency of RNA translation. Such modifications are described, for example, in PCT/EP2006/009448, incorporated herein by reference. In order to increase the expression of the RNA used according to the present invention, it can be modified within the coding region, i.e. sequence encoding the expressed peptide or protein, preferably without changing the sequence of the expressed peptide or protein, so as to increase the GC content to increase mRNA stability and to effect codon optimization and thus enhance translation in cells.

Термин «модификация» в контексте РНК, используемой в настоящем изобретении, включает модификацию РНК, которая в норме не присутствует в указанной РНК.The term "modification" in the context of the RNA used in the present invention, includes the modification of RNA, which is not normally present in the specified RNA.

В одном воплощении изобретения РНК, используемая согласно изобретению, не содержит некэпированные 5'-трифосфаты. Удаление таких некэпированных 5'-трифосфатов может быть достигнуто путем обработки РНК с помощью фосфатазы.In one embodiment of the invention, the RNA used according to the invention does not contain uncapped 5'-triphosphates. Removal of such uncapped 5'-triphosphates can be achieved by treating the RNA with phosphatase.

РНК согласно изобретению может содержать модифицированные рибонуклеотиды с целью повышения ее стабильности и/или уменьшения цитотоксичности. Например, в одном воплощении в РНК, использующейся согласно изобретению, 5-метилцитидин частично или полностью замещен, предпочтительно полностью, на цитидин. В ином случае или дополнительно, в одном воплощении в РНК, использующейся согласно изобретению, псевдоуридин частично или полностью замещен, предпочтительно полностью, на уридин.RNA according to the invention may contain modified ribonucleotides in order to increase its stability and/or reduce cytotoxicity. For example, in one embodiment, in the RNA used according to the invention, 5-methylcytidine is partially or completely replaced, preferably completely, by cytidine. Alternatively or additionally, in one embodiment, in the RNA used according to the invention, pseudouridine is partially or completely replaced, preferably completely, by uridine.

В одном воплощении термин «модификация» относится к обеспечению РНК 5’-кэп или аналогом 5’-кэп. Термин «5’-кэп» относится к кэпирующей структуре, обнаруженной на 5'-конце молекулы мРНК, и, как правило, состоит из гуанозин-нуклеотида, связанного с мРНК посредством необычной 5'-5' трифосфатной связи. В одном воплощении этот гуанозин метилирован в 7-положении. Термин «стандартный 5’-кэп» относится к природной группе РНК 5’-кэп, предпочтительно к группе кэп 7-метилгуанозина (m7G). В контексте настоящего изобретения термин «5’-кэп» включает аналог 5’-кэп, который напоминает структуру кэп РНК и который модифицирован так, что он обладает способностью стабилизировать РНК и/или усиливать трансляцию РНК при присоединении к ней, предпочтительно in vivo и/или в клетке.In one embodiment, the term "modification" refers to providing the RNA with a 5'-cap or 5'-cap analogue. The term "5'-cap" refers to the capping structure found at the 5' end of the mRNA molecule and typically consists of a guanosine nucleotide linked to the mRNA via an unusual 5'-5' triphosphate bond. In one embodiment, this guanosine is methylated at the 7-position. The term "standard 5'-cap" refers to the naturally occurring RNA 5'-cap group, preferably the 7-methylguanosine (m 7 G) cap group. In the context of the present invention, the term "5'-cap" includes a 5'-cap analog that resembles the structure of an RNA cap and that is modified so that it has the ability to stabilize RNA and/or enhance translation of RNA when attached to it, preferably in vivo and/ or in a cage.

Предпочтительно, 5’-конец РНК включает кэп-структуру, имеющую следующую общую формулу:Preferably, the 5' end of the RNA includes a cap structure having the following general formula:

Figure 00000002
Figure 00000002

где R1 и R2 независимо представляют собой гидрокси или метокси, и W-, X- и Y- независимо представляют собой кислород, серу, селен или BH3. В предпочтительном воплощении R1 и R2 представляют собой гидрокси, и W-, X- и Y- представляют собой кислород. В следующем предпочтительном воплощении, один из R1 и R2, предпочтительно R1 представляет собой гидрокси, а другой метокси, и W-, X- и Y- представляют собой кислород. В следующем предпочтительном воплощении, R1 и R2 представляют собой гидрокси, и один из W-, X- и Y-, предпочтительно X- представляет собой серу, селен, или BH3, предпочтительно серу, в то время как другой представляет собой кислород. В следующем предпочтительном воплощении, один из R1 и R2, предпочтительно R2 представляют собой гидрокси, а другой метокси, и один из W-, X- и Y-, предпочтительно X- представляет собой серу, селен, или BH3, предпочтительно серу, в то время как другой представляет собой кислород.where Roneand R2are independently hydroxy or methoxy, and W-, X- and Y- are independently oxygen, sulfur, selenium, or BH3. In a preferred embodiment Roneand R2are hydroxy, and W-, X- and Y- are oxygen. In a further preferred embodiment, one of Roneand R2, preferably Roneis hydroxy and the other is methoxy, and W-, X- and Y- are oxygen. In a further preferred embodiment, Roneand R2are hydroxy, and one of the W-, X- and Y-, preferably X-represents sulfur, selenium, or BH3, preferably sulfur while the other is oxygen. In a further preferred embodiment, one of Roneand R2, preferably R2are hydroxy and the other is methoxy, and one is W-, X- and Y-, preferably X-represents sulfur, selenium, or BH3, preferably sulfur while the other is oxygen.

В вышеописанной формуле нуклеотид с правой стороны связан с цепью РНК через ее 3’-группу.In the above formula, the nucleotide on the right side is linked to the RNA chain through its 3' group.

Те Кэп-структуры, где, по меньшей мере, один из W-, X- и Y- представляет собой серу, т.е. который имеет фосфоротиоатный компонент, существуют в различных диастереомерных формах, каждая из которых охвачена в данном документе. Кроме того, настоящее изобретение охватывает все таутомеры и стереоизомеры вышеописанной формулы.Those Cap structures where at least one of W - , X - and Y - is sulfur, i. e. which has a phosphorothioate component exist in various diastereomeric forms, each of which is covered in this document. In addition, the present invention covers all tautomers and stereoisomers of the above formula.

Например, Кэп-структура, имеющая вышеописанную структуру, где R1 представляет собой метокси, R2 представляет собой гидрокси, X- представляет собой серу, и W- и Y- представляют собой кислород, существуют в двух диастереомерных формах (Rp и Sp). Их можно разрешить на ВЭЖХ с обращенной фазой, и они получили названия D1 и D2 согласно порядку их элюции с колонки ВЭЖХ с обращенной фазой. Согласно изобретению изомер D1 m2 7,2’-OGppSpG является конкретно предпочтительным.For example, the cap structure having the structure described above, where R 1 is methoxy , R 2 is hydroxy, X - is sulfur, and W - and Y - are oxygen, exists in two diastereomeric forms (Rp and Sp). They can be resolved on reverse phase HPLC and are named D1 and D2 according to the order in which they were eluted from the reverse phase HPLC column. According to the invention, the D1 m 2 7,2'-O Gpp S pG isomer is particularly preferred.

Получение РНК, содержащие 5’-кэп или аналог 5’-кэп, может быть достигнуто с помощью in vitro транскрипции ДНК-матрицы в присутствии указанной 5’-кэп или аналога 5’-кэп, где указанная 5’-кэп котранскрипционно включается в образованную цепь РНК, или РНК может быть получена, например, с помощью in vitro транскрипции, а 5’-кэп может быть присоединен к РНК посттранскрипционно с использованием кэппирующих ферментов, например, кэппирующих ферментов вируса вакцинии.The production of RNAs containing a 5'-cap or 5'-cap analog can be achieved by in vitro transcription of a DNA template in the presence of said 5'-cap or 5'-cap analog, where said 5'-cap is cotranscriptionally incorporated into the formed the RNA strand or RNA can be generated, for example, by in vitro transcription, and the 5'-cap can be attached to the RNA post-transcriptionally using capping enzymes, for example, capping enzymes of the vaccinia virus.

РНК может включать дополнительные модификации. Например, дополнительная модификация РНК, используемая в настоящем изобретении, может представлять собой удлинение или укорачивание природного поли(A) хвоста или изменение 5’- или 3’-нетранслируемых областей (UTR), как например, введение UTR, который не связан с кодирующей областью указанной РНК, например, вставка или замена имеющейся 3’-UTR на одну или несколько, предпочтительно две копии 3’-UTR, выделенных из гена глобина, такого как альфа2-глобин, альфа1-глобин, бета-глобин, предпочтительно, бета-глобин, более предпочтительно, человеческий бета-глобин.The RNA may include additional modifications. For example, additional modification of the RNA used in the present invention may be an extension or shortening of the natural poly(A) tail or a change in the 5' or 3' untranslated regions (UTRs), such as introducing a UTR that is not associated with a coding region. said RNA, e.g. insertion or replacement of an existing 3'-UTR with one or more, preferably two, copies of a 3'-UTR derived from a globin gene such as alpha2-globin, alpha1-globin, beta-globin, preferably beta-globin more preferably human beta globin.

РНК, содержащая открытую поли-A последовательность, транслируется более эффективно, чем РНК, содержащая скрытую поли-A последовательность. Термин «поли(A) хвост» или «поли-A последовательность» относится к последовательности остатков аденила (A), которые, как правило, локализованы на 3’-конце молекулы РНК, и «открытая поли-A последовательность» означает, что поли-A последовательность на 3’-конце молекулы РНК, содержащая A поли-A-последовательности, за которой не следуют нуклеотиды, отличные от A, локализованные на 3’-конце, т.е. ниже поли-A-последовательности. Кроме того, длинная поли-A-последовательность около 120 пар оснований приводит к получению оптимальной стабильности транскрипта и эффективности трансляции РНК.RNA containing an open poly-A sequence is translated more efficiently than RNA containing a hidden poly-A sequence. The term "poly(A) tail" or "poly-A sequence" refers to a sequence of adenyl(A) residues that are typically located at the 3' end of an RNA molecule, and "open poly-A sequence" means that a poly -A sequence at the 3' end of the RNA molecule containing A poly-A sequences not followed by nucleotides other than A located at the 3' end, i.e. below the poly-A sequence. In addition, a long poly-A sequence of about 120 base pairs results in optimal transcript stability and RNA translation efficiency.

Таким образом, с целью повышения стабильности и/или экспрессии РНК, используемой согласно изобретению, она может быть модифицирована так, чтобы присутствовать совместно с поли-A-последовательностью, предпочтительно, имеющей длину 10-500 остатков аденозина, более предпочтительно, 30-300, еще более предпочтительно 65-200 и особенно 100-150 остатков аденозина. В особенно предпочтительном воплощении поли-A-последовательность имеет длину приблизительно 120 остатков аденозина. Для дополнительного повышения стабильности и/или экспрессии РНК, используемой согласно изобретению, поли-A-последовательность может быть открытой.Thus, in order to increase the stability and/or expression of the RNA used according to the invention, it can be modified so as to be present together with a poly-A sequence, preferably having a length of 10-500 adenosine residues, more preferably 30-300, even more preferably 65-200 and especially 100-150 adenosine residues. In a particularly preferred embodiment, the poly-A sequence is approximately 120 adenosine residues in length. To further increase the stability and/or expression of the RNA used according to the invention, the poly-A sequence may be open.

Кроме того, включение 3’-нетранслируемой области (UTR) в 3’-нетранслируемую область молекулы РНК может привести к повышению эффективности трансляции. Синергический эффект может быть достигнут путем включения двух или нескольких из таких 3’-нетранслируемых областей. 3’-нетранслируемые области могут быть аутологичными или гетерологичными по отношению к РНК, в которую они вводятся. В одном конкретном воплощении 3’-нетранслируемая область выделена из человеческого гена β-глобина.In addition, the inclusion of the 3'-untranslated region (UTR) in the 3'-untranslated region of the RNA molecule can lead to an increase in the efficiency of translation. A synergistic effect can be achieved by including two or more of these 3' untranslated regions. The 3'-untranslated regions may be autologous or heterologous to the RNA into which they are introduced. In one specific embodiment, the 3'-untranslated region is isolated from the human β-globin gene.

Комбинация вышеописанных модификаций, т.е. включение поли-A-последовательности, открытие поли-A-последовательности и включение одной или нескольких 3’-нетранслируемых областей, имеет синергическое влияние на стабильность РНК и повышает эффективность трансляции.A combination of the above modifications, i.e. the incorporation of a poly-A sequence, the opening of a poly-A sequence, and the incorporation of one or more 3'-untranslated regions has a synergistic effect on RNA stability and enhances translation efficiency.

Термин «стабильность» РНК относится к «периоду полужизни» РНК. «Период полужизни» относится к периоду времени, который необходим для потери половины активности, количества или числа молекул. В контексте настоящего изобретения, период полужизни РНК является показателем стабильности указанной РНК. Период полужизни РНК может влиять на «продолжительность экспрессии» РНК. Может ожидаться, что РНК, имеющая продолжительный период полужизни, будет экспрессироваться в течение продолжительного периода времени.The term "stability" of RNA refers to the "half-life" of RNA. "Half-life" refers to the period of time that is required for the loss of half the activity, amount or number of molecules. In the context of the present invention, the half-life of an RNA is indicative of the stability of said RNA. The half-life of RNA can influence the "length of expression" of the RNA. An RNA having a long half-life can be expected to be expressed over an extended period of time.

Конечно, если согласно изобретению целесообразно уменьшить стабильность и/или эффективность трансляции РНК, то возможна модификация РНК, которая воспрепятствует функции элементов, которые, как описано выше, повышают стабильность и/или эффективность трансляции РНК.Of course, if according to the invention it is desirable to reduce the stability and/or efficiency of RNA translation, then modification of the RNA is possible, which interferes with the function of elements that, as described above, increase the stability and/or efficiency of RNA translation.

Термин «экспрессия» используется согласно изобретению в его наиболее широком значении, и включает продуцирование РНК и/или пептидов или белков, например, с помощью транскрипции и/или трансляции. По отношению к РНК термин «экспрессия» или «трансляция» относится конкретно к продуцированию пептидов или полипептидов. Также он включает частичную экспрессию нуклеиновых кислот. Кроме того, экспрессия может быть транзиторной или стабильной.The term "expression" is used according to the invention in its broadest sense, and includes the production of RNA and/or peptides or proteins, for example, using transcription and/or translation. In relation to RNA, the term "expression" or "translation" refers specifically to the production of peptides or polypeptides. It also includes partial expression of nucleic acids. In addition, expression may be transient or stable.

Согласно изобретению термин экспрессия также включает «аберрантную экспрессию» или «аномальную экспрессию». «Абберантная экспрессия» или «аномальная экспрессия» означает согласно изобретению, что экспрессия изменяется, предпочтительно повышается по сравнению с эталоном, например, с состоянием объекта, не имеющего заболевания, ассоциированного с абберантной или аномальной экспрессией определенного белка, например, опухолевого антигена. Повышение экспрессии относится к повышению, по меньшей мере, на 10%, конкретно, по меньшей мере, на 20%, по меньшей мере, на 50% или, по меньшей мере, на 100%, или более. В одном воплощении, экспрессия обнаружена только в больной ткани, в то время как экспрессия в здоровой ткани репрессирована.According to the invention, the term expression also includes "aberrant expression" or "abnormal expression". "Aberrant expression" or "abnormal expression" means according to the invention that the expression is changed, preferably increased, compared to a reference, for example, the state of an object that does not have a disease associated with aberrant or abnormal expression of a certain protein, for example, a tumor antigen. An increase in expression refers to an increase of at least 10%, specifically at least 20%, at least 50% or at least 100% or more. In one embodiment, expression is found only in diseased tissue while expression in healthy tissue is repressed.

Термин «специфично экспрессируется» означает, что белок экспрессируется по существу только в специфической ткани или в органе. Например, то, что опухолевый антиген специфично экспрессируется в слизистой желудка означает, что указанный белок главным образом экспрессируется в слизистой желудка и не экспрессируется в других тканях, или не экспрессируется в значительной степени в других тканях или типах органов. Таким образом, белок, который экспрессируется исключительно в клетках слизистой желудка и в значительно меньшей степени в любой другой ткани, такой как яички, специфично экспрессируется в клетках слизистой желудка. В некоторых воплощениях, опухолевый антиген также может специфично экспрессироваться при нормальных условиях в более чем одном типе ткани, как например, в 2 или 3 типах тканей или органов, но предпочтительно, в не более чем 3 различных типах тканей или органов. В этом случае опухолевый антиген специфично экспрессируется в этих органах. Например, если опухолевый антиген экспрессируется при нормальных условиях предпочтительно в приблизительно равной степени в легком и в желудке, то указанный опухолевый антиген специфично экспрессируется в легком и в желудке.The term "specifically expressed" means that the protein is expressed essentially only in a specific tissue or organ. For example, the fact that a tumor antigen is specifically expressed in the gastric mucosa means that said protein is predominantly expressed in the gastric mucosa and is not expressed in other tissues, or is not expressed to a significant extent in other tissues or organ types. Thus, a protein that is exclusively expressed in gastric mucosal cells and to a much lesser extent in any other tissue, such as the testes, is specifically expressed in gastric mucosal cells. In some embodiments, the tumor antigen can also be specifically expressed under normal conditions in more than one tissue type, such as 2 or 3 tissue or organ types, but preferably no more than 3 different tissue or organ types. In this case, the tumor antigen is specifically expressed in these organs. For example, if a tumor antigen is expressed under normal conditions, preferably in approximately equal proportions in the lung and in the stomach, then said tumor antigen is specifically expressed in the lung and in the stomach.

В контексте настоящего изобретения термин «транскрипция» относится к процессу, в котором генетический код последовательности ДНК транскрибируется в РНК. Затем РНК может транслироваться в белок. Согласно настоящему изобретению термин «транскрипция» включает «in vitro транскрипцию», где термин «in vitro транскрипция» относится к процессу, в котором РНК, конкретно мРНК синтезируется in vitro в бесклеточной системе, предпочтительно с использованием соответствующих клеточных экстрактов. Предпочтительно, клонирующие векторы применяются для генерирования транскриптов. Эти клонирующие векторы, как правило, спроектированы как транскрипционные векторы и согласно изобретениею охвачены термином «вектор». Согласно настоящему изобретению, РНК, используемая в настоящем изобретении, предпочтительно является in vitro транскрибированной РНК (IVT-РНК) и может быть получена с помощью in vitro транскрипции соответствующей ДНК-матрицы. Промотор для контроля транскрипции может представлять собой любой промотор для любой РНК-полимеразы. Конкретные примеры РНК-полимераз представляют собой T7, T3, и SP6 РНК-полимеразы. Предпочтительно, in vitro транскрипция согласно изобретению контролируется T7- или SP6-промтором. ДНК-матрица для in vitro транскрипции может быть получена путем клонирования нуклеиновой кислоты, конкретно, кДНК и путем введения в соответствующий вектор для in vitro транскрипции. кДНК может быть получена путем обратной транскрипции РНК.In the context of the present invention, the term "transcription" refers to the process in which the genetic code of a DNA sequence is transcribed into RNA. The RNA can then be translated into protein. According to the present invention, the term "transcription" includes "in vitro transcription", where the term "in vitro transcription" refers to a process in which RNA, specifically mRNA, is synthesized in vitro in a cell-free system, preferably using appropriate cell extracts. Preferably, cloning vectors are used to generate transcripts. These cloning vectors are generally designed as transcription vectors and are encompassed by the term "vector" according to the invention. According to the present invention, the RNA used in the present invention is preferably an in vitro transcribed RNA (IVT-RNA) and can be obtained by in vitro transcription of an appropriate DNA template. The transcription control promoter can be any promoter for any RNA polymerase. Specific examples of RNA polymerases are T7, T3, and SP6 RNA polymerases. Preferably, in vitro transcription according to the invention is controlled by a T7 or SP6 promoter. A DNA template for in vitro transcription can be obtained by cloning a nucleic acid, specifically a cDNA, and inserting it into an appropriate in vitro transcription vector. cDNA can be obtained by reverse transcription of RNA.

Термин «трансляция» согласно изобретению относится к процессу в рибосоме клетки, с помощью которой цепь матричной РНК направляет сборку последовательности аминокислот с получением пептида или полипептида.The term "translation" according to the invention refers to the process in the ribosome of a cell by which a messenger RNA chain directs the assembly of an amino acid sequence to produce a peptide or polypeptide.

Последовательности контроля экспрессии или регуляторные последовательности, которые согласно изобретению могут быть функционально связаны с нуклеиновой кислотой, могут быть гомологичными или гетерологичными по отношению к нуклеиновой кислоте. Кодирующая последовательность и регуляторная последовательность связаны вместе «функционально», если они связаны вместе ковалентно, так что транскрипция или трансляция кодирующей последовательности находится под контролем или влиянием регуляторной последовательности. Если кодирующая последовательность транслируется в функциональный белок с функциональной связью регуляторной последовательности с кодирующей последовательностью, то индукция регуляторной последовательности приводит к транскрипции кодирующей последовательности, не вызывая при этом сдвига рамки считывания в кодирующей последовательности или неспособности транслироваться в целевой белок или пептид.The expression control sequences or regulatory sequences that may be operably linked to a nucleic acid according to the invention may be homologous or heterologous to the nucleic acid. A coding sequence and a regulatory sequence are "operably" linked together if they are covalently linked together such that transcription or translation of the coding sequence is under the control or influence of the regulatory sequence. If the coding sequence is translated into a functional protein with the regulatory sequence operably linked to the coding sequence, then induction of the regulatory sequence results in transcription of the coding sequence without causing a frameshift in the coding sequence or failure to translate into the target protein or peptide.

Термин «последовательность, контролирующая экспрессию» или «регуляторная последовательность» включает согласно изобретению промоторы, последовательности связывания с рибосомой и другие элементы контроля, которые контролируют транскрипцию нуклеиновой кислоты или трансляцию полученной РНК. В одном воплощении изобретения могут контролироваться регуляторные последовательности. Точная структура регуляторных последовательностей может варьировать в зависимости от вида или в зависимости от типа клеток, но, как правило, включает 5’-нетранслируемые и 5’- и 3’-нетранслируемые последовательности, которые вовлечены в инициирование транскрипции или трансляции, такие как TATA-бокс, кэппирующие последовательности, CAAT-последовательность и так далее. Конкретно, 5’-нетранслируемые регуляторные последовательности включают промоторную область, которая включает последовательность контроля транскрипции функционально связанного гена. Регуляторные последовательности также могут включать энхансерные последовательности или 5`-активаторные последовательности.The term "expression control sequence" or "regulatory sequence" includes, according to the invention, promoters, ribosome binding sequences, and other control elements that control the transcription of a nucleic acid or translation of the resulting RNA. In one embodiment of the invention, regulatory sequences can be controlled. The exact structure of the regulatory sequences may vary by species or by cell type, but generally includes 5'-untranslated and 5'- and 3'-untranslated sequences that are involved in initiating transcription or translation, such as TATA- boxing, capping sequences, CAAT sequence, and so on. Specifically, 5'-non-translated regulatory sequences include a promoter region that includes a transcriptional control sequence for an operably linked gene. The regulatory sequences may also include enhancer sequences or 5' activator sequences.

Предпочтительно, согласно изобретению, если РНК, экспрессирующаяся в клетке, может вводиться в указанную клетку. В одном воплощении способов по изобретению РНК, которую вводят в клетку, получают с помощью in vitro транскрипции соответствующей ДНК-матрицы.Preferably, according to the invention, if the RNA expressed in the cell can be introduced into said cell. In one embodiment of the methods of the invention, the RNA that is introduced into the cell is obtained by in vitro transcription of the appropriate DNA template.

Согласно изобретению такие термины, как «РНК, способная экспрессироваться» и «кодирующая РНК» используются взаимозаменяемо в данном документе и по отношению к конкретному пептиду или полипептиду означают, что РНК, если она присутствует в соответствующей среде, предпочтительно внутри клетки, может экспрессироваться с получением указанного пептида или полипептида. Предпочтительно, РНК, которая, согласно изобретению, способна взаимодействовать с клеточным аппаратом трансляции с получением пептида или полипептида, способна экспрессироваться.According to the invention, terms such as "RNA capable of being expressed" and "coding RNA" are used interchangeably herein and, in relation to a particular peptide or polypeptide, mean that RNA, if present in an appropriate environment, preferably within a cell, can be expressed to obtain said peptide or polypeptide. Preferably, the RNA which, according to the invention, is capable of interacting with the cellular translation apparatus to produce a peptide or polypeptide, is capable of being expressed.

Термины такие, как «перенос», «введение» или «трансфекция» используются в данном документе взаимозаменяемо и относятся к введению нуклеиновых кислот, конкретно экзогенных или гетерологичных нуклеиновых кислот, в частности, РНК в клетку. Согласно настоящему изобретению клетка может образовывать часть органа, ткани и/или организма. Согласно настоящему изобретению введение нуклеиновой кислоты достигается как с использованием «голой» нуклеиновой кислоты, так и в комбинации с реагентом введения. Предпочтительно, введение нуклеиновых кислот происходит в форме «голых» нуклеиновых кислот. Предпочтительно, РНК вводят в комбинации со стабилизирующими веществами, такими как ингибиторы РНК-азы. Настоящее изобретение также рассматривает повторное введение нуклеиновых кислот в клетки для возможности экспрессии в течение продолжительных периодов времени.Terms such as "transfer", "introduction" or "transfection" are used interchangeably herein and refer to the introduction of nucleic acids, specifically exogenous or heterologous nucleic acids, in particular RNA, into a cell. According to the present invention, a cell may form part of an organ, tissue and/or organism. According to the present invention, the introduction of a nucleic acid is achieved both using a "naked" nucleic acid, and in combination with an introduction reagent. Preferably, the introduction of nucleic acids occurs in the form of "naked" nucleic acids. Preferably, the RNA is administered in combination with stabilizing agents such as RNase inhibitors. The present invention also contemplates the re-introduction of nucleic acids into cells to allow expression over extended periods of time.

Клетки могут трансфецироваться с помощью любых носителей, которые могут ассоциироваться с РНК, например, путем образования комплексов с РНК или образуя везикулы, в которые заключена или инкапсулирована РНК, приводя в результате к повышенной стабильности РНК по сравнению с «голой» РНК. Носители, используемые согласно изобретению, включают, например, липид-содержащие носители, такие как катионные липиды, липосомы, конкретно катионные липосомы, и мицеллы и наночастицы. Катионные липиды могут образовывать комплексы с отрицательно заряженными нуклеиновыми кислотами. Согласно изобретению может использоваться любой катионный липид.Cells can be transfected with any carrier that can associate with RNA, for example by complexing with RNA or by forming vesicles that embed or encapsulate the RNA, resulting in increased stability of the RNA compared to naked RNA. Carriers useful according to the invention include, for example, lipid-containing carriers such as cationic lipids, liposomes, in particular cationic liposomes, and micelles and nanoparticles. Cationic lipids can form complexes with negatively charged nucleic acids. Any cationic lipid can be used according to the invention.

Предпочтительно, введение РНК, которая кодирует пептид или полипептид, в клетку, конкретно в клетку, присутствующую in vivo, приводит к экспрессии указанного пептида или полипептида в клетке. В конкретных воплощениях, предпочтительно направление нуклеиновых кислот в конкретные клетки. В таких воплощениях, носитель, который применяется для введения нуклеиновой кислоты в клетку (например, ретровирус или липосома), экспонирует направляющую молекулу. Например, молекула, такая как антитело, которое специфично к поверхностному мембранному белку на клетке-мишени, или лиганд к рецептору на клетке-мишени может быть включена в носитель нуклеиновой кислоты или может быть связана с ним. В случае, когда нуклеиновая кислота вводится с помощью липосомы, белки, которые связываются с поверхностным мембранным белком, который ассоциирован с эндоцитозом, могут быть включены в липосомный состав с целью возможности направления и/или поглощения. Такие белки охватывают капсидные белки или их фрагменты, которые специфичны к конкретному типу клеток, антитела к белкам, которые интернализуются, белки, которые имеют внутриклеточную локализацию и т.д.Preferably, the introduction of an RNA that encodes a peptide or polypeptide into a cell, specifically a cell present in vivo, results in the expression of said peptide or polypeptide in the cell. In specific embodiments, targeting nucleic acids to specific cells is preferred. In such embodiments, the carrier that is used to introduce the nucleic acid into the cell (eg, a retrovirus or liposome) displays a targeting molecule. For example, a molecule, such as an antibody that is specific for a surface membrane protein on the target cell, or a ligand for a receptor on the target cell, may be included in or linked to the nucleic acid carrier. In the case where the nucleic acid is administered via a liposome, proteins that bind to a surface membrane protein that is associated with endocytosis can be included in the liposome formulation to allow targeting and/or uptake. Such proteins include capsid proteins or fragments thereof that are specific to a particular cell type, antibodies to proteins that are internalized, proteins that are intracellularly localized, and so on.

Согласно настоящему изобретению термин «пептид» относится к веществам, включающим два или более, предпочтительно 3 или более, предпочтительно 4 или более, предпочтительно 6 или более, предпочтительно 8 или более, предпочтительно 10 или более, предпочтительно 13 или более, предпочтительно 16 или более, предпочтительно 21 или более и предпочтительно до 8, 10, 20, 30, 40 или 50, конкретно до 100 аминокислот, соединенных ковалентно пептидными связями. Термин «полипептид» или «белок» относится к крупным пептидам, предпочтительно к пептидам, содержащим более чем 100 аминокислотных остатков, но, в общем, термины «пептид», «полипептид» и «белок» являются синонимами и используются в данном документе взаимозаменяемо.According to the present invention, the term "peptide" refers to substances comprising two or more, preferably 3 or more, preferably 4 or more, preferably 6 or more, preferably 8 or more, preferably 10 or more, preferably 13 or more, preferably 16 or more , preferably 21 or more and preferably up to 8, 10, 20, 30, 40 or 50, specifically up to 100 amino acids connected by covalent peptide bonds. The term "polypeptide" or "protein" refers to large peptides, preferably peptides containing more than 100 amino acid residues, but, in general, the terms "peptide", "polypeptide" and "protein" are synonymous and are used interchangeably herein.

Согласно изобретению термин «изменение последовательности» по отношению к пептидам или белкам относится к аминокислотным вариантам со вставками, аминокислотным вариантам с добавлениями, аминокислотным вариантам с делециями и аминокислотным вариантам с заменой, предпочтительно, к аминокислотным вариантам с заменой. Все эти изменения последовательности согласно изобретению потенциально могут создавать новые эпитопы.According to the invention, the term "sequence change" in relation to peptides or proteins refers to amino acid insertion variants, amino acid addition variants, amino acid deletion variants and amino acid substitution variants, preferably amino acid substitution variants. All of these sequence changes according to the invention can potentially create new epitopes.

Аминокислотные варианты со вставкой включают вставки одной или двух или более аминокислот в конкретную аминокислотную последовательность.Inserted amino acid variants include insertions of one or two or more amino acids into a particular amino acid sequence.

Аминокислотные варианты с добавлением включают амино- и/или карбокси-концевые сшивки одной или более аминокислот, как например, 1, 2, 3, 4 или 5, или более аминокислот.Amino acid addition variants include amino and/or carboxy-terminal crosslinks of one or more amino acids, such as 1, 2, 3, 4 or 5 or more amino acids.

Аминокислотные варианты с делецией характеризуются удалением одной или более аминокислот из последовательности, как например, удалением 1, 2, 3, 4 или 5, или более аминокислот.Deletion amino acid variants are characterized by the removal of one or more amino acids from a sequence, such as the removal of 1, 2, 3, 4, or 5 or more amino acids.

Аминокислотные варианты с заменой характеризуются тем, что, по меньшей мере, один остаток в последовательности удаляется, а другой остаток вставляется на его место.Substitutional amino acid variants are characterized in that at least one residue in the sequence is removed and another residue is inserted in its place.

Термин «выделенный» согласно изобретению означает, что конкретный компонент, конкретно, конкретная последовательность присутствует у субъекта, из которого он выделен, конкретно организм или молекула. В случае аминокислотных последовательностей, особенно конкретных областей последовательностей, «выделенный» конкретно означает, что соответствующая аминокислотная последовательность выделена из аминокислотной последовательности, в которой она присутствует.The term "isolated" according to the invention means that a specific component, specifically, a specific sequence, is present in the subject from which it is isolated, specifically an organism or molecule. In the case of amino acid sequences, especially specific regions of the sequences, "isolated" specifically means that the corresponding amino acid sequence is isolated from the amino acid sequence in which it is present.

Термин «клетка» или «клетка-хозяин» предпочтительно представляет собой интактную клетку, т.е. с интактной мембраной, которая не высвобождала свои обычные внутриклеточные компоненты, такие как ферменты, органеллы или генетический материал. Интактная клетка предпочтительно представляет собой жизнеспособную клетку, т.е. живую клетку, способную осуществлять свои обычные метаболические функции. Предпочтительно, указанный термин относится согласно изобретению с любой клетке, которая может быть трансформирована или трансфецирована с использованием экзогенной нуклеиновой кислоты. Термин «клетка» включает согласно изобретению прокариотические клетки (например, E. coli) или эукариотические клетки (например, дендритные клетки, B-клетки, клетки CHO, клетки COS, клетки K562, клетки HEK293, клетки HELA, дрожжевые клетки, и клетки насекомых). Экзогенная нуклеиновая кислота может быть обнаружена внутри клетки (i) в свободно диспергированном состоянии, как таковом, (ii) включенной в рекомбинантный вектор, или (iii) интегрированной в геном клетки-хозяина или в митохондриальную ДНК. Особенно предпочтительны клетки млекопитающих, такие как клетки человека, мышей, хомяков, свиней, коз и приматов. Клетки могут быть выделены из большого количества типов ткани и включают первичные клетки и клеточные линии. Специфические примеры включают кератиноциты, лейкоциты периферической крови, стволовые клетки костного мозга и эмбриональные стволовые клетки. В следующих воплощениях клетка представляет собой антигенпрезентирующую клетку, в частности, дендритную клетку, моноцит или макрофаг.The term "cell" or "host cell" preferably represents an intact cell, ie. with an intact membrane that has not released its usual intracellular components such as enzymes, organelles, or genetic material. The intact cell is preferably a viable cell, ie. a living cell capable of carrying out its normal metabolic functions. Preferably, said term refers according to the invention to any cell that can be transformed or transfected using exogenous nucleic acid. The term "cell" includes, according to the invention, prokaryotic cells (e.g., E. coli) or eukaryotic cells (e.g., dendritic cells, B cells, CHO cells, COS cells, K562 cells, HEK293 cells, HELA cells, yeast cells, and insect cells ). The exogenous nucleic acid can be found within the cell (i) in a freely dispersed state, as such, (ii) incorporated into a recombinant vector, or (iii) integrated into the host cell's genome or mitochondrial DNA. Particularly preferred are mammalian cells such as human, mouse, hamster, pig, goat and primate cells. Cells can be isolated from a wide variety of tissue types and include primary cells and cell lines. Specific examples include keratinocytes, peripheral blood leukocytes, bone marrow stem cells, and embryonic stem cells. In further embodiments, the cell is an antigen presenting cell, in particular a dendritic cell, a monocyte, or a macrophage.

Клетка, которая включает молекулу нуклеиновой кислоты, предпочтительно экспрессирует пептид или полипептид, кодируемый нуклеиновой кислотой.A cell that includes a nucleic acid molecule preferably expresses the peptide or polypeptide encoded by the nucleic acid.

Термин «клональная экспансия» относится к процессу, в котором умножается количество соответствующего компонента. В контексте настоящего изобретения термин предпочтительно используется в контексте иммунологического ответа, в котором лимфоциты стимулируются антигеном, пролиферируют, и специфический лимфоцит, распознающий указанный антиген, умножается. Предпочтительно, если клональная экспансия приводит к дифференцировке лимфоцитов.The term "clonal expansion" refers to a process in which the amount of the respective component is multiplied. In the context of the present invention, the term is preferably used in the context of an immunological response in which lymphocytes are stimulated by an antigen, proliferate, and a specific lymphocyte recognizing said antigen multiplies. Preferably, clonal expansion leads to lymphocyte differentiation.

Такие термины как «снижение» или «ингибирование» относятся к способности вызывать общее уменьшение уровня, предпочтительно на 5% или более, 10% или более, 20% или более, более предпочтительно, на 50% или более, и наиболее предпочтительно на 75% или более. Термин «ингибирует» или ему подобные выражения включает полное или по существу полное ингибирование, т.е. снижение до ноля или по существу до ноля.Terms such as "reduction" or "inhibition" refer to the ability to cause an overall decrease in the level, preferably 5% or more, 10% or more, 20% or more, more preferably 50% or more, and most preferably 75% or more. The term "inhibits" or similar expressions includes complete or substantially complete inhibition, i.e. reduction to zero or substantially to zero.

Термины, такие как «увеличение», «усиление», «стимулирование» или «пролонгация» предпочтительно относятся к увеличению, усилению, стимулированию или пролонгации, по меньшей мере, на около 10%, предпочтительно, по меньшей мере, на 20%, предпочтительно, по меньшей мере, на 30%, предпочтительно, по меньшей мере, на 40%, предпочтительно, по меньшей мере, на 50%, предпочтительно, по меньшей мере, на 80%, предпочтительно, по меньшей мере, на 100%, предпочтительно, по меньшей мере, на 200% и конкретно, по меньшей мере, на 300%. Эти термины также могут относиться к увеличению, усилению, стимуляции или пролонгации от ноля или неизмеряемого или недетектируемого уровня до уровня более чем ноль или до уровня, который измеряется или детектируется.Terms such as "increase", "enhancement", "stimulation" or "prolongation" preferably refer to an increase, enhancement, stimulation or prolongation of at least about 10%, preferably at least 20%, preferably at least 30%, preferably at least 40%, preferably at least 50%, preferably at least 80%, preferably at least 100%, preferably by at least 200%, and specifically by at least 300%. These terms may also refer to an increase, enhancement, stimulation, or prolongation from zero, or an unmeasured or undetectable level, to a level greater than zero, or to a level that is measurable or detectable.

Агенты, композиции и способы, описанные в данном документе, могут использоваться для лечения объекта, имеющего заболевание, например, заболевание, характеризующееся присутствием больных клеток, экспрессирующих антиген и презентирующих антигенный пептид. Особенно предпочтительные заболевания включают злокачественные новообразования. Агенты, композиции и методы, описанные в данном документе, также могут использоваться для иммунизации или вакцинации для предотвращения заболевания, описанного в данном документе.The agents, compositions, and methods described herein can be used to treat a subject having a disease, for example, a disease characterized by the presence of diseased cells expressing an antigen and presenting an antigenic peptide. Particularly preferred diseases include malignancies. The agents, compositions, and methods described herein may also be used for immunization or vaccination to prevent the disease described herein.

Согласно изобретению термин «заболевание» относится к любому патологическому состоянию, включая злокачественные новообразования, конкретно те формы злокачественных новообразований, которые описаны в данном документе.According to the invention, the term "disease" refers to any pathological condition, including malignant neoplasms, specifically those forms of malignant neoplasms that are described in this document.

Термин «нормальный» относится к здоровому состоянию или к состояниям у здорового объекта или ткани, т.е. к не патологическим состояниям, где «здоровый» предпочтительно означает не злокачественный.The term "normal" refers to a healthy state or conditions in a healthy object or tissue, ie. to non-pathological conditions, where "healthy" preferably means non-cancerous.

«Заболевание, включающее клетки, экспрессирующие антиген» согласно изобретению означает, что детектируется экспрессия антигена в клетках больной ткани или органа. Экспрессия в клетках больной ткани или органа может повышаться по сравнению со здоровой тканью или органом. Повышение относится к повышению, по меньшей мере, на 10%, конкретно, по меньшей мере, на 20%, по меньшей мере, на 50%, по меньшей мере, на 100%, по меньшей мере, на 200%, по меньшей мере, на 500%, по меньшей мере, на 1000%, по меньшей мере, на 10000% или даже более. В одном воплощении, экспрессия обнаружена только в больной ткани, в то время как экспрессия в здоровой ткани репрессирована. Согласно изобретению заболевания, включающие или ассоциированные с клетками, экспрессирующими антиген, включают злокачественные новообразования.A "disease involving cells expressing an antigen" according to the invention means that the expression of an antigen is detected in cells of a diseased tissue or organ. Expression in cells of a diseased tissue or organ may be increased relative to healthy tissue or organ. Increase refers to an increase of at least 10%, specifically at least 20%, at least 50%, at least 100%, at least 200%, at least , by 500%, at least 1000%, at least 10000% or even more. In one embodiment, expression is found only in diseased tissue while expression in healthy tissue is repressed. According to the invention, diseases involving or associated with cells expressing an antigen include malignant neoplasms.

Злокачественная опухоль (медицинский термин: злокачественное новообразование) представляет собой класс заболеваний, в которых группа клеток проявляет неконтролируемый рост (деление за пределами нормальных границ), инвазию (проникновение внутрь и разрушение соседних тканей), и иногда метастазирование (распространение в другие места в организме через лимфу или кровь). Эти три злокачественных свойства злокачественных образований отличают их от доброкачественных опухолей, которые самоограничиваются и не являются инвазивными или метастазирующими. Большинство злокачественных образований образуют опухоль, но некоторые, подобные лейкозу - нет.A malignant tumor (medical term: malignant neoplasm) is a class of diseases in which a group of cells exhibits uncontrolled growth (dividing outside of normal boundaries), invasion (invading and destroying adjacent tissues), and sometimes metastasis (spread to other locations in the body through lymph or blood). These three malignant properties of malignancies distinguish them from benign tumors, which are self-limiting and do not invasive or metastasize. Most cancers form a tumor, but some, like leukemia, do not.

Злокачественная опухоль по существу являются синонимом злокачественному новообразованию. Неоплазия, злокачественное новообразование и злокачественная опухоль по существу являются синонимами.A malignant tumor is essentially synonymous with a malignant neoplasm. Neoplasia, malignancy, and malignancy are essentially synonymous.

Согласно изобретению термин «опухоль» или «опухолевое заболевание» относятся к аномальному росту клеток (называемых неопластическими клетками, туморогенными клетками или опухолевыми клетками), предпочтительно образуя опухоль или поражение. Термином «опухолевая клетка» обозначают аномальную клетку, которая растет быстрой неконтролируемой клеточной пролиферацией и продолжает расти после стимулов, которые инициировали прекращение нового роста. Опухоли демонстрируют частичную или полную потерю структурной организации и функциональной координации с нормальной тканью, и обычно образуют отдельную массу ткани, которая может быть доброкачественной, предзлокачественной или злокачественной.According to the invention, the term "tumor" or "tumor disease" refers to the abnormal growth of cells (called neoplastic cells, tumor cells or tumor cells), preferably forming a tumor or lesion. The term "tumor cell" refers to an abnormal cell that grows by rapid uncontrolled cell proliferation and continues to grow after stimuli that initiated the cessation of new growth. Tumors show partial or complete loss of structural organization and functional coordination with normal tissue, and usually form a discrete mass of tissue that may be benign, premalignant, or malignant.

Доброкачественная опухоль представляет собой опухоль, которая лишена всех трех злокачественных свойств злокачественного новообразования. Таким образом, по определению доброкачественная опухоль не растет неограниченно, в агрессивной манере, не проникает в окружающие ее ткани и не распространяется в не соседние ткани (не метастазирует).A benign tumor is a tumor that lacks all three of the malignant properties of a malignancy. Thus, by definition, a benign tumor does not grow indefinitely, in an aggressive manner, does not penetrate into surrounding tissues, and does not spread to non-adjacent tissues (does not metastasize).

Неоплазма представляет собой аномальную массу ткани как результат неоплазии. Неоплазия (новый рост по-гречески) представляет собой аномальную пролиферацию клеток. Рост клеток превышен и не координируется с ростом нормальных тканей вокруг них. Рост продолжается в такой же избыточной манере даже после отмены стимулов. Обычно он вызывает появление узла или опухоли. Неоплазмы могут быть доброкачественными, предзлокачественными или злокачественными.Neoplasm is an abnormal mass of tissue as a result of neoplasia. Neoplasia (new growth in Greek) is an abnormal proliferation of cells. Cell growth is exceeded and not coordinated with the growth of normal tissues around them. Growth continues in the same exuberant manner even after the stimulus is removed. It usually causes a nodule or tumor to appear. Neoplasms can be benign, premalignant, or malignant.

«Рост опухоли» или «опухолевый рост» согласно изобретению относится к тенденции опухоли увеличиваться в размере и/или к тенденции опухолевых клеток пролиферировать."Tumor growth" or "tumor growth" according to the invention refers to the tendency of a tumor to increase in size and/or to the tendency of tumor cells to proliferate.

Для целей настоящего изобретения термины «злокачественное новообразование» и «заболевание, ассоциированное со злокачественным образованием» используются взаимозаменяемо с терминами «опухоль» и «опухолевое заболевание».For the purposes of the present invention, the terms "cancer" and "disease associated with malignancy" are used interchangeably with the terms "tumor" and "neoplastic disease".

Злокачественные заболевания классифицируют по типу клеток, которые имеют сходство с опухолью, и, таким образом, предполагается, что данная ткань является происхождением опухоли. Это, соответственно, гистология и локализация.Malignant diseases are classified according to the type of cells that resemble the tumor, and thus the tissue is assumed to be the origin of the tumor. These are, respectively, histology and localization.

Термины «злокачественное новообразование» или «рак» согласно изобретению включает лейкозы, семиномы, меланомы, тератомы, лифомы, нейробластомы, глиомы, ректальный рак, рак эндометрия, рак почки, рак надпочечника, рак щитовидной железы, злокачественное новообразование крови, рак кожи, рак мозга, рак шейки матки, рак кишечника, рак печени, рак толстой кишки, рак желудка, рак кишечника, рак головы и шеи, желудочно-кишечный рак, рак лимфатического узла, рак пищевода, колоректальный рак, рак поджелудочной железы, рак уха, горла и носа (ENT), рак молочной железы, рак предстательной железы, рак матки, рак яичника, рак легкого и их метастазы. Примеры включают карциному легкого, карциному молочной железы, карциному толстой кишки, почечноклеточную карциному, карциному шейки матки или метастазы типов рака или опухоли, описанные выше. Термин злокачественное новообразование согласно изобретению также включает метастазы злокачественного новообразования и рецидив злокачественного новообразования.The terms "malignancy" or "cancer" according to the invention includes leukemias, seminomas, melanomas, teratomas, lymphomas, neuroblastomas, gliomas, rectal cancer, endometrial cancer, kidney cancer, adrenal cancer, thyroid cancer, blood cancer, skin cancer, cancer brain, cervical cancer, bowel cancer, liver cancer, colon cancer, stomach cancer, colon cancer, head and neck cancer, gastrointestinal cancer, lymph node cancer, esophageal cancer, colorectal cancer, pancreatic cancer, ear cancer, throat cancer and nose (ENT), breast cancer, prostate cancer, uterine cancer, ovarian cancer, lung cancer and their metastases. Examples include lung carcinoma, breast carcinoma, colon carcinoma, renal cell carcinoma, cervical carcinoma, or metastases of the types of cancer or tumor described above. The term cancer according to the invention also includes cancer metastases and cancer recurrence.

Основные типы рака легкого представляют собой мелкоклеточный рак легкого (SCLC) и немелкоклеточный рак легкого (NSCLC). Существует три основных типа немелкоклеточного рака легкого: плоскоклеточный рак легкого, аденокарцинома и крупноклеточный рак легкого. Аденокарциномы насчитывают приблизительно 10% от всех случаев рака легкого. Данное злокачественное новообразование обычно наблюдается в периферических областях легких в противоположность мелкоклеточному раку легкого и плоскоклеточному раку легкого, которые оба имеют тенденцию к более центральной локализации.The main types of lung cancer are small cell lung cancer (SCLC) and non-small cell lung cancer (NSCLC). There are three main types of non-small cell lung cancer: squamous cell lung cancer, adenocarcinoma, and large cell lung cancer. Adenocarcinomas account for approximately 10% of all lung cancers. This malignancy usually occurs in the peripheral regions of the lung in contrast to small cell lung cancer and squamous cell lung cancer, which both tend to be more centrally located.

Рак кожи представляет собой злокачественный рост на коже. Наиболее распространенными раками кожи являются базальноклеточный рак, плоскоклеточный рак и меланома. Злокачественная меланома представляет собой серьезный тип рака кожи. Он возникает из-за неконтролируемого роста пигментных клеток, называемых меланоцитами.Skin cancer is a malignant growth on the skin. The most common skin cancers are basal cell carcinoma, squamous cell carcinoma, and melanoma. Malignant melanoma is a serious type of skin cancer. It occurs due to the uncontrolled growth of pigment cells called melanocytes.

Согласно изобретению «карцинома» представляет собой злокачественную опухоль, возникшую из эпителиальных клеток. Данная группа характеризует наиболее распространенные злокачественные новообразования, включающие распространенные формы рака молочной железы, предстательной железы, легкого и толстой кишки.According to the invention, a "carcinoma" is a malignant tumor arising from epithelial cells. This group characterizes the most common malignant neoplasms, including common forms of breast, prostate, lung and colon cancer.

«Бронхиолярная карцинома» представляет собой карциному легкого, которая, как считают, имеет происхождение из эпителия концевых бронхиол, в которых неопластическая ткань распространяется по альвеолярным стенкам и вырастает в небольшие массы внутри альвеол. Муцин может быть обнаружен в некоторых таких клетках и в веществе альвеол, которые также включают денудированные клетки."Bronchiolar carcinoma" is a carcinoma of the lung believed to be derived from the epithelium of terminal bronchioles, in which neoplastic tissue extends along the alveolar walls and grows into small masses within the alveoli. Mucin can be found in some of these cells and in the material of the alveoli, which also includes denuded cells.

«Аденокарцинома» представляет собой злокачественное новообразование, которое происходит из ткани желез. Эта ткань также является частью крупной категории тканей, известной как эпителиальная ткань. Эпителиальная ткань включает кожу, железы и множество других тканей, которые выстилают полости и органы организма. Эпителий эмбриологически происходит из эктодермы, эндодермы и мезодермы. Чтобы быть отнесенными к аденокарциноме клеткам необязательно быть частью железы, при условии, что они обладают секреторными свойствами. Данная форма карциномы может встречаться у некоторых высших млекопитающих, включая человека. Хорошо дифференцированные аденокарциномы имеют тенденцию к наличию сходства с тканями железы, из которой они происходят, в то время как у плохо дифференцированных такого сходства может не быть. С помощью окрашивания клеток из биопсии, патолог определит, является ли опухоль аденокарциномой или относится к некоторым другим типам злокачественных новообразований. Аденокарциномы могут возникать во множестве тканей организма из-за природы повсеместного присутствия желез внутри организма. Хотя каждая из желез может не секретировать одни и те же вещества, если имеет место экзокринная функция у клетки, то она считается железистой, а ее злокачественная форма, таким образом, называется аденокарциномой. Злокачественные аденокарциномы проникают в другие ткани и часто метастазируют при условии наличия для этого достаточного времени. Аденокарцинома яичника представляет собой наиболее распространенный тип карциномы яичника. Она включает сывороточную и слизистую аденокарциному, светлоклеточную аденокарциному и эндометриоидную аденокарциному."Adenocarcinoma" is a malignant neoplasm that originates from the tissue of the glands. This tissue is also part of a larger category of tissue known as epithelial tissue. Epithelial tissue includes the skin, glands, and many other tissues that line the body's cavities and organs. The epithelium is embryologically derived from the ectoderm, endoderm and mesoderm. Cells do not need to be part of a gland to be classified as adenocarcinoma, provided they have secretory properties. This form of carcinoma can occur in some higher mammals, including humans. Well-differentiated adenocarcinomas tend to resemble the tissues of the gland from which they originate, while poorly differentiated ones may not. By staining the cells from the biopsy, the pathologist will determine if the tumor is an adenocarcinoma or some other type of cancer. Adenocarcinomas can occur in a variety of body tissues due to the nature of the ubiquitous presence of glands within the body. Although each of the glands may not secrete the same substances, if the cell has exocrine function, then it is considered glandular, and its malignant form is thus called adenocarcinoma. Malignant adenocarcinomas invade other tissues and often metastasize, given sufficient time to do so. Adenocarcinoma of the ovary is the most common type of ovarian carcinoma. It includes serum and mucosal adenocarcinoma, clear cell adenocarcinoma, and endometrioid adenocarcinoma.

Почечноклеточная карцинома также известна в качестве почечноклеточного рака, или почечноклеточной аденокарциномы представляет собой рак почки, который происходит из ткани, выстилающей проксимальный извитой каналец, очень небольших каналов в почке, которые фильтруют кровь и удаляют продукты жизнедеятельности. Почечноклеточная карцинома представляет собой гораздо более распространенный тип рака почки у взрослых и наиболее летальный из всех опухолей мочеполовой системы. Различные подтипы почечноклеточных карцином представляют собой светлоклеточную почечноклеточную карциному и папиллярную почечноклеточную карциному. Светлоклеточная почечноклеточная карцинома представляет собой наиболее распространенную форму почечноклеточной карциномы. Под микроскопом клетки, которые составляют светлоклеточную почечноклеточную карциному, кажутся очень светлыми или прозрачными. Папиллярная почечноклеточная карцинома представляет собой второй наиболее распространенный подтип. Эти злокачественные новообразования образуют пальцеподобные отростки (называемые сосочками) в некоторых, если не в большинстве опухолей.Renal cell carcinoma, also known as renal cell carcinoma, or renal cell adenocarcinoma, is a cancer of the kidney that originates from the tissue lining the proximal convoluted tubule, very small channels in the kidney that filter the blood and remove waste products. Renal cell carcinoma is the much more common type of kidney cancer in adults and the most lethal of all genitourinary tumors. The various subtypes of renal cell carcinomas are clear cell renal cell carcinoma and papillary renal cell carcinoma. Clear cell renal cell carcinoma is the most common form of renal cell carcinoma. Under a microscope, the cells that make up clear cell renal cell carcinoma appear very light or transparent. Papillary renal cell carcinoma is the second most common subtype. These cancers form finger-like growths (called papillae) in some, if not most, tumors.

Лимфома и лейкоз представляют собой неоплазии, происходящие из гемопоэтических клеток (кроветворных).Lymphoma and leukemia are neoplasias derived from hematopoietic (blood-forming) cells.

Бластная опухоль или бластома представляет собой опухоль (обычно злокачественную), которая имеет сходство с незрелой эмбриональной тканью. Многие из этих опухолей наиболее распространены среди детей.A blast tumor or blastoma is a tumor (usually malignant) that resembles immature embryonic tissue. Many of these tumors are most common in children.

Под «метастазированием» понимают распространение опухолевых клеток из места своего происхождения в другую часть организма. Образование метастазов представляет собой очень сложный процесс и зависит от отделения злокачественных опухолевых клеток от первичной опухоли, инвазии через внеклеточный матрикс, проникновения через эндотелиальную базальную мембрану для входа в брюшную полость и в сосуды, и затем после осуществления транспортировки кровотоком, от инфильтрации органов-мишеней. Наконец, рост новой опухоли, т.е. вторичной опухоли или метастатической опухоли в месте-мишени зависит от ангиогенеза. Метастазирование опухоли часто происходит даже после удаления первичной опухоли, так как опухолевые клетки или компоненты могут оставаться и развивать метастатический потенциал. В одном воплощении, термин «метастазирование» согласно изобретению относится к «отдаленному метастазированию», которое относится к метастазированию, которое отдалено от первичной опухоли и региональной системы лимфатических узлов.By "metastasis" is meant the spread of tumor cells from their place of origin to another part of the body. The formation of metastases is a very complex process and depends on the separation of malignant tumor cells from the primary tumor, invasion through the extracellular matrix, penetration through the endothelial basement membrane to enter the abdominal cavity and into the vessels, and then after the implementation of transport by the bloodstream, from infiltration of target organs. Finally, the growth of a new tumor, i.e. secondary tumor or metastatic tumor at the target site depends on angiogenesis. Tumor metastasis often occurs even after removal of the primary tumor, as tumor cells or components may remain and develop metastatic potential. In one embodiment, the term "metastasis" according to the invention refers to "distant metastasis", which refers to metastasis that is distant from the primary tumor and the regional lymph node system.

Клетки вторичной метастатической опухоли имеют сходство с клетками исходной опухоли. Это означает, что если рак яичника метастазирует в печень, то вторичная опухоль будет состоять из аномальных клеток яичника, а не из аномальных клеток печени. Следовательно, опухоль в печени называют метастазирующим раком яичников, а не раком печени.The cells of a secondary metastatic tumor are similar to the cells of the original tumor. This means that if ovarian cancer metastasizes to the liver, then the secondary tumor will be made up of abnormal ovarian cells and not abnormal liver cells. Therefore, a tumor in the liver is called metastatic ovarian cancer and not liver cancer.

В раке яичника метастазирование может происходить следующими путями: посредством непосредственного контакта или распространения, он может проникать в близлежащую ткань или органы, расположенные близко или около яичников, такие как фаллопиевы трубы, матка, мочевой пузырь, прямая кишка, и т.д.; путем оседания или выпадения в аномальной полости, которая является наиболее распространенным путем распространения рака яичника. Опухолевые клетки разрывают поверхность массы яичника и «капают» на другие структуры в брюшной полости, такие как печень, желудок, толстая кишка или диафрагма; путем отрыва от массы яичника, проникновения в лимфатические сосуды и затем путем передвижения к другим областям организма или к отдаленным органам, таким как легкое или печень; путем отрыва от массы яичника, проникновения в кровеносную систему и затем путем передвижения к другим областям организма или к отдаленным органам.In ovarian cancer, metastasis can occur in the following ways: through direct contact or spread, it can spread to nearby tissue or organs located close to or near the ovaries, such as the fallopian tubes, uterus, bladder, rectum, etc.; by settling or falling out in an abnormal cavity, which is the most common way for ovarian cancer to spread. Tumor cells rupture the surface of the ovarian mass and drip onto other structures in the abdomen, such as the liver, stomach, colon, or diaphragm; by breaking away from the mass of the ovary, penetrating the lymphatics and then traveling to other areas of the body or to distant organs such as the lung or liver; by detachment from the mass of the ovary, penetration into the circulatory system and then by movement to other areas of the body or to distant organs.

Согласно изобретению метастатический рак яичника включает злокачественную опухоль в фаллопиевых трубах, злокачественную опухоль в органах брюшной полости, таких как кишечник, злокачественную опухоль в матке, злокачественную опухоль в мочевом пузыре, злокачественную опухоль в прямой кишке, злокачественную опухоль в печени, злокачественную опухоль в желудке, злокачественную опухоль в толстой кишке, злокачественную опухоль в диафрагме, злокачественную опухоль в легких, злокачественную опухоль в области, выстилающей брюшную или тазовую полость (брюшина), и злокачественную опухоль в мозге. Аналогично, метастатический рак легкого относится к злокачественному образованию, которое распространяется от легких к отдаленным и/или к нескольким местам в организме и включает злокачественную опухоль в печени, злокачественную опухоль в надпочечной железе, злокачественную опухоль в костях и злокачественную опухоль в мозге.According to the invention, metastatic ovarian cancer includes a malignant tumor in the fallopian tubes, a malignant tumor in the abdominal organs such as the intestines, a malignant tumor in the uterus, a malignant tumor in the bladder, a malignant tumor in the rectum, a malignant tumor in the liver, a malignant tumor in the stomach, a cancer in the colon, a cancer in the diaphragm, a cancer in the lungs, a cancer in the area that lines the abdominal or pelvic cavity (peritoneum), and a cancer in the brain. Similarly, metastatic lung cancer refers to cancer that spreads from the lungs to distant and/or multiple sites in the body and includes liver cancer, adrenal cancer, bone cancer, and brain cancer.

Термин «циркулирующие опухолевые клетки» или «CTC» относится к клеткам, которые открепляются от первичной опухоли или от опухолевых метастазов и циркулируют в кровотоке. CTC могут составлять посевной материал для последующего роста дополнительных опухолей (метастаз) в различных тканях. Циркулирующие опухолевые клетки обнаруживаются с частотой порядка 1-10 CTC на 1 мл цельной крови пациентов с метастазирующим заболеванием. Для выделения CTC были разработаны исследовательские методы. В данной области описано несколько исследовательских методов для выделения CTC, например, методы, которые используют тот факт, что эпителиальные клетки обычно экспрессируют белок клеточной адгезии EpCAM, который отсутствует в нормальных клетках крови. Захват на основе иммуномагнитных микросфер включает в себя обработку образцов крови с помощью антитела к EpCAM, которое конъюгировано с магнитными частицами, с последующим разделением связанных клеток в магнитном поле. Выделенные клетки затем окрашивали с антителом к другому эпителиальному маркеру цитокератину, а также к обычному лейкоцитарному маркеру CD45, так чтобы отличить редкие CTC от контаминирующих лейкоцитов. Этот трудоемкий и полуавтоматизированный способ идентифицирует CTC со средним выходом приблизительно 1 CTC/мл и чистотой 0,1% (Allard et al., 2004: Clin Cancer Res 10, 6897-6904). Второй метод выделения CTC использует микрофлюидное устройство захвата CTC, которое включает течение цельной крови через камеру с 80000 встроенных микростолбиков, которые становятся функциональными из-за покрытия антителом к EpCAM. Затем CTC окрашивают вторичными антителами либо против цитокератина, либо против тканеспецифичных маркеров, таких как PSA в раке предстательной железы или HER2 в раке молочной железы, и визуализируют с помощью автоматизированного сканирования микростолбиков на множестве панелей вдоль трехмерных координат. CTC-чипы способны идентифицировать цитокератин-положительные циркулирующие опухолевые клетки у пациентов со средним выходом 50 клеток/мл и чистотой в интервале 1–80% (Nagrath et al., 2007: Nature 450, 1235-1239). Другая возможность выделения CTC представляет собой использование теста «CellSearch™ Circulating Tumor Cell» (CTC) от «Veridex, LLC» (Раритан, Нью-Джерси), который захватывает, идентифицирует и считает CTC в пробирке крови. Система «CellSearch™» представляет собой методологию, одобренную Управлением по контролю за пищевыми продуктами и лекарственными препаратами США (FDA), для подсчета CTC в цельной крови, который основан на комбинации иммуномагнитного мечения и автоматизированной цифровой микроскопии. Существуют другие методы для выделения CTC, описанные в научной литературе, каждый из которых может использоваться совместно с настоящим изобретением.The term "circulating tumor cells" or "CTC" refers to cells that detach from the primary tumor or from tumor metastases and circulate in the bloodstream. CTCs can form seed material for the subsequent growth of additional tumors (metastases) in various tissues. Circulating tumor cells are detected at a rate of 1-10 CTC/mL of whole blood from patients with metastatic disease. Research methods have been developed to isolate CTC. Several research methods for isolating CTC are described in the art, for example, methods that exploit the fact that epithelial cells normally express the cell adhesion protein EpCAM, which is not present in normal blood cells. Immunomagnetic bead capture involves treating blood samples with an anti-EpCAM antibody that is conjugated to magnetic particles, followed by separating the bound cells in a magnetic field. The isolated cells were then stained with antibody to another epithelial marker, cytokeratin, as well as to the common leukocyte marker CD45, so as to distinguish rare CTCs from contaminating leukocytes. This laborious and semi-automated method identifies CTCs with an average yield of approximately 1 CTC/ml and a purity of 0.1% (Allard et al., 2004: Clin Cancer Res 10, 6897-6904). The second method of CTC isolation uses a microfluidic CTC capture device that involves flowing whole blood through a chamber with 80,000 built-in microbeads that become functional due to coating with EpCAM antibody. CTCs are then stained with secondary antibodies either against cytokeratin or tissue-specific markers such as PSA in prostate cancer or HER2 in breast cancer and visualized by automated microbar scanning on multiple panels along 3D coordinates. CTC chips are able to identify cytokeratin-positive circulating tumor cells in patients with an average yield of 50 cells/ml and a purity in the range of 1-80% (Nagrath et al., 2007: Nature 450, 1235-1239). Another option for isolating CTC is to use the CellSearch™ Circulating Tumor Cell (CTC) test from Veridex, LLC (Raritan, NJ), which captures, identifies, and counts CTC in a blood tube. The CellSearch™ system is a US Food and Drug Administration (FDA) approved methodology for the enumeration of CTC in whole blood, which is based on a combination of immunomagnetic labeling and automated digital microscopy. There are other methods for isolating CTC described in the scientific literature, each of which can be used in conjunction with the present invention.

Возврат или рецидив происходит, когда человек снова подвергается воздействию состояния, которому он подвергался в прошлом. Например, если пациент страдал от опухолевого заболевания, получил успешное лечение указанного заболевания, и у него снова развилось указанное заболевание, то это указанное вновь развившееся заболевание может рассматриваться как возврат или рецидив. Однако согласно изобретению возврат или рецидив опухолевого заболевания необязательно может происходить в месте исходного опухолевого заболевания. Таким образом, например, если пациент страдал от опухоли яичников и получил успешное лечение, то возврат или рецидив может представлять собой появление опухоли в месте, отличном от яичников. Возврат или рецидив опухоли также включает ситуации, где опухоль появляется в месте, отличном от места исходной опухоли, а также в месте исходной опухоли. Предпочтительно, исходная опухоль, для которой пациент получил лечение, представляет собой первичную опухоль, а опухоль в месте, отличном от места исходной опухоли, представляет собой вторичную или метастатическую опухоль.A relapse or relapse occurs when a person is again exposed to a condition that they were exposed to in the past. For example, if a patient suffered from a neoplastic disease, received successful treatment for said disease, and developed said disease again, then said newly developed disease may be considered a relapse or relapse. However, according to the invention, the return or recurrence of the neoplastic disease may optionally occur at the site of the original neoplastic disease. Thus, for example, if a patient has been suffering from an ovarian tumor and has been successfully treated, then recurrence or recurrence may be the occurrence of a tumor at a site other than the ovaries. The return or recurrence of the tumor also includes situations where the tumor appears in a place other than the site of the original tumor, as well as in the site of the original tumor. Preferably, the original tumor for which the patient has been treated is a primary tumor, and a tumor at a site other than the original tumor is a secondary or metastatic tumor.

Термин «лечить» означает вводить соединение или композицию, как описано в данном документе, объекту с целью предотвращения или устранения заболевания, включая уменьшение размера опухоли или количества опухолей у объекта; прекращение или замедление заболевания у объекта; ингибирование или замедление развития нового заболевания у объекта; уменьшение частоты или тяжести симптомов и/или рецидивов у объекта, который в настоящее время имеет или ранее имел заболевание; и/или продление, т.e. увеличение продолжительности жизни объекта. Конкретно, термин «лечение заболевания» включает излечение, сокращение продолжительности, ослабление, предотвращение, замедление или ингибирование прогрессии или ухудшения, или предотвращение или задержка приступа заболевания или его симптомов.The term "treat" means to administer a compound or composition as described herein to a subject for the purpose of preventing or eliminating a disease, including reducing the size of a tumor or the number of tumors in the subject; stopping or slowing down the disease in the subject; inhibiting or slowing the development of a new disease in the subject; reducing the frequency or severity of symptoms and/or relapses in a subject who currently has or previously had the disease; and/or renewal, i.e. increasing the lifespan of an object. Specifically, the term "treating a disease" includes curing, shortening, ameliorating, preventing, slowing or inhibiting the progression or worsening of, or preventing or delaying the onset of a disease or its symptoms.

Термин «имеющий риск» означает объекта, т.е. пациента, который идентифицирован как имеющий более высокие, чем обычные, шансы развития заболевания, конкретно, злокачественного новообразования, по сравнению с общей популяцией. Кроме того, объект, который имел или который имеет в настоящее время заболевание, конкретно злокачественное новообразование, представляет собой объекта, который имеет повышенный риск развития заболевания, как например у объекта может продолжиться развитие заболевания. Объекты, которые в настоящее время имеют или которые имели злокачественное новообразование, также имеют повышенный риск метастазирования злокачественного новообразования.The term "at risk" means an entity, i.e. a patient who is identified as having a higher than normal chance of developing a disease, specifically cancer, compared to the general population. In addition, an object that has or currently has a disease, specifically cancer, is an object that has an increased risk of developing the disease, such as the object may continue to develop the disease. Subjects that currently have or have had cancer also have an increased risk of cancer metastasis.

Термин «иммунотерапия» относится к лечению, включающему активацию специфической иммунной реакции. В контексте настоящего изобретения термины, такие как «защищает», «предотвращает», «профилактический», «превентивный», или «защитный» относятся к предотвращению или лечению или к обоим в отношении появления и/или продолжения заболевания у объекта и конкретно для минимизации шанса, что у объекта разовьется заболевание, или для задержки развития заболевания. Например, человек с риском развития опухоли, как описано выше, будет кандидатом для терапии для предотвращения опухоли.The term "immunotherapy" refers to treatment, including the activation of a specific immune response. In the context of the present invention, terms such as "protects", "prevents", "prophylactic", "preventive", or "protective" refer to preventing or treating or both in relation to the onset and/or continuation of a disease in a subject and specifically to minimize the chance that the subject will develop a disease, or to delay the development of a disease. For example, a person at risk of developing a tumor as described above would be a candidate for therapy to prevent a tumor.

Профилактическое введение иммунотерапии, например, профилактическое введение композиции по изобретению предпочтительно защищает реципиента от развития заболевания. Терапевтическое введение иммунотерапии, например, терапевтическое введение композиции по изобретению может приводить к ингибированию прогресса/роста заболевания. Ингибирование включает замедление прогресса/роста заболевания, конкретно нарушение прогрессии заболевания, которое предпочтительно приводит к устранению заболевания.Prophylactic administration of immunotherapy, for example, prophylactic administration of a composition of the invention, preferably protects the recipient from the development of the disease. The therapeutic administration of immunotherapy, for example, the therapeutic administration of a composition of the invention may result in inhibition of the progress/growth of the disease. Inhibition includes slowing down the progress/growth of a disease, specifically disrupting the progression of a disease, which preferably results in elimination of the disease.

Иммунотерапия может осуществляться с использованием любого и множества способов, в которых агенты, представленные в данном документе, действуют для удаления больных клеток из пациента. Такое удаление может иметь место как результат усиления или индуцирования у пациента иммунного ответа, специфичного к антигену или клетке, экспрессирующей антиген.Immunotherapy can be carried out using any and a variety of methods in which the agents provided herein act to remove diseased cells from a patient. Such removal may take place as a result of amplification or induction in the patient of an immune response specific to an antigen or a cell expressing the antigen.

В некоторых воплощениях иммунотерапия может быть активной иммунотерапией, в которой лечение основано на in vivo стимулировании эндогенной иммунной системы хозяина для реагирования против больных клеток, с введением агентов, модифицирующих иммунный ответ (таких как полипептиды и нуклеиновые кислоты, представленные в данном документе).In some embodiments, immunotherapy may be active immunotherapy, in which treatment is based on in vivo stimulation of the host's endogenous immune system to respond against diseased cells, with the administration of immune response modifying agents (such as the polypeptides and nucleic acids provided herein).

Агенты и композиции, представленные в данном документе, могут использоваться индивидуально или в комбинации со стандартными терапевтическими схемами, такими как хирургическая операция, облучение, химиотерапия и/или трансплантация костного мозга (аутологичная, синергическая, аллогенная или чужеродная).The agents and compositions provided herein may be used alone or in combination with standard therapeutic regimens such as surgery, radiation, chemotherapy, and/or bone marrow transplantation (autologous, synergistic, allogeneic, or foreign).

Термин «иммунизация» или «вакцинация» описывает процесс лечения объекта с целью индуцирования иммунного ответа для терапевтических или профилактических целей.The term "immunization" or "vaccination" describes the process of treating an object to induce an immune response for therapeutic or prophylactic purposes.

Термин «in vivo» относится к ситуации в субъекте.The term "in vivo" refers to the situation in the subject.

Термины «объект», «индивидуум», «организм» или «пациент» используются взаимозаменяемо и относятся к позвоночным животным, предпочтительно к млекопитающим. Например, млекопитающие в контексте настоящего изобретения представляют собой людей, приматов, отличных от человека, домашних животных, таких как собаки, кошки, овцы, крупный рогатый скот, козы, свиньи, лошади и т.д., лабораторных животных, таких как мыши, крысы, кролики, морские свинки и т.д., а также животных в неволе, таких как животные зоопарков. Термин «животное» при использовании в данном документе включает человека. Термин «объект» также может включать пациента, т.е. животное, предпочтительно человека, имеющего заболевание, предпочтительно, описанное в данном документе.The terms "object", "individual", "organism" or "patient" are used interchangeably and refer to vertebrate animals, preferably mammals. For example, mammals in the context of the present invention are humans, non-human primates, domestic animals such as dogs, cats, sheep, cattle, goats, pigs, horses, etc., laboratory animals such as mice, rats, rabbits, guinea pigs, etc., as well as captive animals such as zoo animals. The term "animal" as used herein includes a human. The term "object" may also include a patient, i. an animal, preferably a human, having a disease, preferably as described herein.

Термин «аутологичный» используется для описания чего-либо, что выделено из того же объекта. Например, «аутологичный трансплантат» относится к трансплантату ткани или органов, с происхождением из того же объекта. Такие процедуры являются предпочтительными, так как они преодолевают иммунологический барьер, который в ином случае приводит к отторжению.The term "autologous" is used to describe something that is extracted from the same object. For example, "autologous transplant" refers to a transplant of tissue or organs originating from the same entity. Such treatments are preferred because they overcome the immunological barrier that would otherwise lead to rejection.

Термин «гетерологичный» используется для описания чего-то, что состоит из множества различных элементов. Например, костный мозг, перенесенный от одного индивидуума к другому индивидууму, представляет собой гетерологичный трансплантат. Гетерологичный ген представляет собой ген, выделенный из источника, отличного от объекта.The term "heterologous" is used to describe something that is made up of many different elements. For example, bone marrow transferred from one individual to another individual is a heterologous transplant. A heterologous gene is a gene isolated from a source other than the subject.

В качестве части композиции для иммунизации или вакцинации, предпочтительно, если один или нескольких агентов, описанных в данном документе, вводятся вместе с одним или несколькими адъювантами для индукции иммунного ответа или для повышения иммунного ответа. Термин «адъювант» относится к соединениям, которые удлиняют или усиливают или ускоряют иммунный ответ. Композиция по настоящему изобретению предпочтительно проявляет свой эффект без добавления адъювантов. Кроме того, композиция по настоящему изобретению может содержать любой известный адъювант. Адъюванты включают гетерологичную группу соединений, таких как эмульсии (например, адъюванты Фрейнда), минеральные соединения (такие как квасцы), бактериальные продукты (такие как Bordetella pertussis токсин), липосомы и иммуно-стимулирующие комплексы. Примеры адъювантов представляют собой монофосфорил-липид-A (MPL, «SmithKline Beecham»). Сапонины, такие как QS21 («SmithKline Beecham»), DQS21 («SmithKline Beecham»; WO 96/33739), QS7, QS17, QS18, и QS-L1 (So et al., 1997, Mol. Cells 7: 178-186), неполные адъюванты Фрейнда, полные адъюванты Фрейнда, витамин E, монтанид, квасцы, CpG-олигнуклеотиды (Krieg et al., 1995, Nature 374: 546-549), и различные эмульсии вода-в-масле, которые готовят из биологически деградируемых масел, таких как сквален и/или токоферол.As part of an immunization or vaccination composition, it is preferred that one or more of the agents described herein be administered together with one or more adjuvants to induce an immune response or to enhance an immune response. The term "adjuvant" refers to compounds that prolong or enhance or accelerate the immune response. The composition of the present invention preferably exhibits its effect without the addition of adjuvants. In addition, the composition of the present invention may contain any known adjuvant. Adjuvants include a heterologous group of compounds such as emulsions (eg Freund's adjuvants), mineral compounds (such as alum), bacterial products (such as Bordetella pertussis toxin), liposomes, and immunostimulatory complexes. Examples of adjuvants are monophosphoryl lipid-A (MPL, SmithKline Beecham). Saponins such as QS21 ("SmithKline Beecham"), DQS21 ("SmithKline Beecham"; WO 96/33739), QS7, QS17, QS18, and QS-L1 (So et al., 1997, Mol. Cells 7: 178- 186), incomplete Freund's adjuvants, complete Freund's adjuvants, vitamin E, montanide, alum, CpG olignucleotides (Krieg et al., 1995, Nature 374:546-549), and various water-in-oil emulsions that are prepared from biologically degradable oils such as squalene and/or tocopherol.

Другие вещества, которые стимулируют иммунный ответ пациента, также могут быть введены. Например, возможно использование цитокинов в вакцинации, благодаря их регуляторным свойствам в отношении лимфоцитов. Такие цитокины включают, например, интерлейкин-12 (IL-12) который, как было показано, повышает защитное действие вакцин (см. Science 268:1432-1434, 1995), GM-CSF и IL-18.Other substances that stimulate the patient's immune response may also be administered. For example, it is possible to use cytokines in vaccination, due to their regulatory properties in relation to lymphocytes. Such cytokines include, for example, interleukin-12 (IL-12) which has been shown to increase the protective effect of vaccines (see Science 268:1432-1434, 1995), GM-CSF and IL-18.

Существует ряд соединений, которые усиливают иммунный ответ и которые, таким образом, можно использовать в вакцинации. Указанные соединения включают ко-стимулирующие молекулы, представленные в форме белков или нуклеиновых кислот, таких как B7-1 и B7-2 (CD80 и CD86, соответственно).There are a number of compounds which enhance the immune response and which can thus be used in vaccination. These compounds include co-stimulatory molecules presented in the form of proteins or nucleic acids, such as B7-1 and B7-2 (CD80 and CD86, respectively).

Согласно изобретению «образец опухоли» представляет собой образец, такой как физический образец, содержащий опухолевые или раковые клетки, такие как циркулирующие опухолевые клетки (CTC), конкретно образец ткани, включающий биологические жидкости и/или клеточный образец. Согласно изобретению «не онкогенный образец» представляет собой такой образец, как физический образец, не содержащий опухолевых или раковых клеток, таких как циркулирующие опухолевые клетки (CTC), конкретно, образец ткани, включающий биологические жидкости и /или клеточный образец. Такие физические образцы могут быть получены стандартным образом, как например, с помощью биопсии ткани, включая пункционную биопсию, и посредством забора крови, бронхиального аспирата, мокроты, мочи, экскрементов и других биологических жидкостей. Согласно изобретению термин «образец» также включает обработанный образец, такой как фракции или изоляты биологических образцов, например, нуклеиновые кислоты или клеточные изоляты.According to the invention, a "tumor sample" is a sample, such as a physical sample containing tumor or cancer cells, such as circulating tumor cells (CTC), specifically a tissue sample, including biological fluids and/or a cellular sample. According to the invention, a "non-oncogenic sample" is such a sample as a physical sample that does not contain tumor or cancer cells, such as circulating tumor cells (CTC), specifically, a tissue sample, including biological fluids and/or a cellular sample. Such physical samples can be obtained in a standard manner, such as by tissue biopsy, including needle biopsy, and by collection of blood, bronchial aspirate, sputum, urine, feces, and other body fluids. According to the invention, the term "sample" also includes a processed sample, such as fractions or isolates of biological samples, for example, nucleic acids or cell isolates.

Терапевтически активные агенты, вакцины и композиции, описанные в данном документе, могут вводиться любым подходящим путем, включая инъекцию или инфузию. Введение может проводиться, например, перорально, внутривенно, внутрибрюшинно, внутримышечно, подкожно или трансдермально. В одном воплощении введение проводится интранодально, как например, посредством инъекции в лимфатический узел. Другие формы введения предусматривают in vitro трансфекцию антигенпрезентирующих клеток, таких как дендритные клетки, нуклеиновыми кислотами, описанными в данном документе, с последующим введением антигенпрезентирующих клеток.The therapeutically active agents, vaccines, and compositions described herein may be administered by any suitable route, including injection or infusion. Administration may be, for example, orally, intravenously, intraperitoneally, intramuscularly, subcutaneously or transdermally. In one embodiment, the administration is intranodal, such as by injection into a lymph node. Other forms of administration involve the in vitro transfection of antigen-presenting cells, such as dendritic cells, with the nucleic acids described herein, followed by the introduction of antigen-presenting cells.

Агенты, описанные в данном документе, вводятся в эффективных количествах. «Эффективное количество» относится к количеству, которое достигает целевой реакции или целевого эффекта индивидуально или совместно с другими дозами. В случае лечения конкретного заболевания или конкретного состояния, целевая реакция предпочтительно относится к ингибированию течения заболевания. Ингибирование включает замедление прогресса заболевания и, в частности, прекращение или реверсию прогресса заболевания. Целевой реакцией при лечении заболевания или состояния также может быть задержка проявления или предотвращение приступа указанного заболевания или указанного состояния.The agents described herein are administered in effective amounts. "Effective amount" refers to the amount that achieves the desired response or effect, alone or in conjunction with other doses. In the case of treating a specific disease or a specific condition, the target response preferably refers to the inhibition of the course of the disease. Inhibition includes slowing down the progress of a disease, and in particular stopping or reversing the progress of a disease. The target response in the treatment of a disease or condition may also be to delay the onset or prevent the onset of said disease or said condition.

Эффективное количество агента, описанного в данном документе, будет зависеть от состояния, подвергаемого лечению, от тяжести заболевания, индивидуальных параметров пациента, включающих возраст, физиологическое состояние, размер и массу, продолжительность лечения, тип сопровождающейся терапии (если имеется), специфический путь введения и подобные факторы. Соответственно, вводимые дозы агентов, описанных в данном документе, могут зависеть от множества таких параметров. В случае, когда реакция пациента недостаточна при исходной дозе, могут использоваться более высокие дозы (или эффективно более высокие дозы, полученные с помощью другого более точно локализованного пути введения).The effective amount of an agent described herein will depend on the condition being treated, the severity of the disease, individual patient parameters including age, physiology, size and weight, duration of treatment, type of concomitant therapy (if any), specific route of administration, and similar factors. Accordingly, the administered doses of the agents described herein may depend on a variety of such parameters. In the event that the patient's response is insufficient at the initial dose, higher doses may be used (or effectively higher doses given by another more precisely localized route of administration).

Фармацевтические композиции по изобретению предпочтительно являются стерильными и содержат эффективное количество терапевтически активного вещества для получения целевой реакции или целевого эффекта.Pharmaceutical compositions according to the invention are preferably sterile and contain an effective amount of a therapeutically active substance to obtain the desired response or effect.

Фармацевтические композиции по изобретению, как правило, вводятся в фармацевтически совместимых количествах и в фармацевтически совместимом препарате. Термин «фармацевтически совместимый» относится к нетоксическому материалу, который не взаимодействует с действием активного компонента фармацевтической композиции. Препараты данного типа обычно могут содержать соли, буферные вещества, консерванты, носители, вспомогательные вещества, усиливающие иммунитет, такие как адъюванты, например, CpG-олигонуклеотиды, цитокины, сапонин, GM-CSF и/или РНК и где это необходимо, терапевтически активные соединения. При использовании в медицине соли должны быть фармацевтически совместимыми. Однако соли, которые не являются фармацевтически совместимыми, могут использоваться для приготовления фармацевтически совместимых солей и включены в изобретение. Фармакологически и фармацевтически совместимые соли данного типа включают в частности соли, приготовленные из следующих кислот: хлороводородной, бромоводородной, серной, азотной, фосфорной, малеиновой, уксусной, салициловой, лимонной, муравьиной, малоновой, янтарной кислоты и так далее. Фармацевтически совместимые соли также могут быть приготовлены в виде солей щелочных металлов или солей щелочноземельных металлов, таких как натриевые соли, калиевые соли или кальциевые соли.Pharmaceutical compositions of the invention are generally administered in pharmaceutically compatible amounts and in a pharmaceutically compatible formulation. The term "pharmaceutically compatible" refers to a non-toxic material that does not interact with the action of the active ingredient of the pharmaceutical composition. Formulations of this type may generally contain salts, buffers, preservatives, carriers, immune enhancing excipients such as adjuvants, for example CpG oligonucleotides, cytokines, saponin, GM-CSF and/or RNA, and where appropriate, therapeutically active compounds. . When used in medicine, the salts must be pharmaceutically compatible. However, salts that are not pharmaceutically compatible can be used to prepare pharmaceutically compatible salts and are included in the invention. Pharmacologically and pharmaceutically compatible salts of this type include in particular salts prepared from the following acids: hydrochloric, hydrobromic, sulfuric, nitric, phosphoric, maleic, acetic, salicylic, citric, formic, malonic, succinic acid and so on. Pharmaceutically compatible salts may also be prepared as alkali metal salts or alkaline earth metal salts such as sodium salts, potassium salts or calcium salts.

Фармацевтическая композиция может включать фармацевтически совместимый носитель. Термин «носитель» относится к органическому или неорганическому компоненту, природного или синтетического происхождения, где активный компонент объединен с целью облегчения применения. Согласно изобретению термин «фармацевтически совместимый носитель» включает совместимые твердые или жидкие фильтры, разбавители или инкапсулирующие вещества, которые подходят для введения пациенту. Компоненты фармацевтической композиции по изобретению обычно такие, что отсутствует взаимодействие, которое существенно ослабляет фармацевтическую эффективность.The pharmaceutical composition may include a pharmaceutically compatible carrier. The term "carrier" refers to an organic or inorganic component, natural or synthetic origin, where the active component is combined for the purpose of ease of use. According to the invention, the term "pharmaceutically compatible carrier" includes compatible solid or liquid filters, diluents or encapsulating substances that are suitable for administration to a patient. The components of the pharmaceutical composition according to the invention are usually such that there is no interaction that significantly impairs pharmaceutical efficacy.

Фармацевтические композиции по изобретению могут содержать подходящие буферные вещества, такие как уксусная кислота в соли, борная кислота в соли и фосфорная кислота в соли.The pharmaceutical compositions of the invention may contain suitable buffer substances such as acetic acid in salt, boric acid in salt and phosphoric acid in salt.

Фармацевтические композиции, где необходимо, также могут содержать подходящие консерванты, такие как хлорид бензалкония, хлорбутанол, парабен и тимеросал.The pharmaceutical compositions, where necessary, may also contain suitable preservatives such as benzalkonium chloride, chlorobutanol, paraben and thimerosal.

Фармацевтические композиции обычно представлены в стандартной лекарственной форме и могут быть приготовлены способом, который известен, как таковой. Фармацевтические композиции по изобретению могут быть представлены в форме капсул, таблеток, пастилок, растворов, суспензий, сиропов, эликсиров или, например, в форме эмульсий.Pharmaceutical compositions are usually presented in unit dosage form and may be prepared in a manner known per se. The pharmaceutical compositions of the invention may be in the form of capsules, tablets, lozenges, solutions, suspensions, syrups, elixirs or, for example, emulsions.

Композиции, подходящие для парентерального введения, обычно включают стерильный водный или неводный препарат активного соединения, который предпочтительно является изотоническим по отношению к крови реципиента. Примеры совместимых носителей и растворителей это раствор Рингера и изотонический раствор хлорида натрия. Кроме того, обычно используются стерильные фиксированные масла в качестве раствора или суспензионной среды.Compositions suitable for parenteral administration generally comprise a sterile aqueous or non-aqueous preparation of the active compound, which is preferably isotonic with the recipient's blood. Examples of compatible vehicles and diluents are Ringer's solution and isotonic sodium chloride solution. In addition, sterile fixed oils are commonly used as a solution or suspension medium.

Настоящее изобретение описано подробно с помощью чертежей и примеров, представленных ниже, которые используются только для иллюстративных целей и не предназначены для ограничения. Благодаря описанию и примерам, следующие воплощения, которые вероятно включены в изобретение, доступны специалисту в данной области.The present invention is described in detail using the drawings and examples below, which are used for illustrative purposes only and are not intended to be limiting. Through the description and examples, the following embodiments, which are likely to be included in the invention, are available to a person skilled in the art.

ЧертежиBlueprints

Фигура 1Figure 1

Верх: Способ обнаружения и приоритезации вероятно иммуногенных соматических мутаций в суммарных опухолевых образцах. Низ: Способ, применяемый к системе B16 и Black6.Top: A method for detecting and prioritizing likely immunogenic somatic mutations in total tumor samples. Bottom: Method applied to the B16 and Black6 system.

Фигура 2: Пример Подтвержденной Мутации в Kif18bFigure 2: Example of a Confirmed Mutation in Kif18b

Мутация, идентифицированная в гене Kif18b с помощью NGS секвенирования экзома, которую подтверждали с помощью секвенирования по Сэнгеру. В клетках дикого типа последовательность представляет собой T/T. В опухолевых клетках, последовательность представляет собой смесь T/G.A mutation identified in the Kif18b gene by NGS exome sequencing, which was confirmed by Sanger sequencing. In wild-type cells, the sequence is T/T. In tumor cells, the sequence is a mixture of T/G.

Фигура 3: Иммунологическая реактивность против мутированных последовательностейFigure 3: Immunological reactivity against mutated sequences

Мышей (n=5) иммунизировали дважды (d0, d7) с использованием мутированных пептидных последовательностей (100 мкг + 50 мкг ПолиI:C; подкожно). На 12 день мышей умерщвляли и собирали клетки селезенки. Анализ «IFNγ ELISpot» осуществляли с использованием 5x105 клеток селезенки/на лунку в качестве эффекторов, и 5x104 дендритных клеток костного мозга, загруженных вместе с пептидами (2 мкг/мл в течение 2ч при 37°C и 5% CO2) в качестве клеток-мишеней. Эффекторные клетки селезенки тестировали против мутированного пептида, пептида дикого типа и контрольного пептида (нуклеопротеина вируса везикулярного стоматита, VSV-NP, ак 52 - 59). Представлено среднее значение, измеряющее количество пятен, из которых фоновые пятна против VSV-NP вычитались для каждой мыши (незакрашенные круги: мышей иммунизировали пептидом дикого типа; закрашенные боксы: мышей иммунизировали мутированными пептидами). Данные представлены для каждой мыши и изображено среднее значение ± стандартная ошибка среднего.Mice (n=5) were immunized twice (d0, d7) with mutated peptide sequences (100 μg + 50 μg PolyI:C; subcutaneously). On day 12, mice were sacrificed and spleen cells were harvested. An "IFNγ ELISpot" assay was performed using 5x10 5 spleen cells/well as effectors and 5x10 4 bone marrow dendritic cells loaded with peptides (2 μg/ml for 2h at 37°C and 5% CO 2 ) in as target cells. Spleen effector cells were tested against the mutated peptide, the wild-type peptide and the control peptide (vesicular stomatitis virus nucleoprotein, VSV-NP, ak 52-59). Shown is the mean value measuring the number of spots from which background anti-VSV-NP spots were subtracted for each mouse (open circles: mice immunized with wild-type peptide; solid boxes: mice immunized with mutated peptides). Data are presented for each mouse and the mean ± standard error of the mean is shown.

Фигура 4: Преимущество выживания для мышей, вакцинированных новыми идентифицированными мутированными пептидными последовательностями.Figure 4: Survival advantage for mice vaccinated with newly identified mutated peptide sequences.

Клетки B16F10 (7,5 x 104) инокуровали подкожно в d0. Мышей вакцинировали пептидом 30 («Jerini Peptide Technologies» (Берлин); 100 мкг пептид + 50 мкг поли I:C п.к. («Invivogen»)) в день - 4, день + 2 и день + 9. Контрольная группа получала только Поли I:C (50 мкг п.к.). Опухолевой рост отслеживали до дня + 16 *, p < 0,05 в логарифмическом ранговом критерии (Mantel-Cox).B16F10 cells (7.5 x 10 4 ) were inoculated subcutaneously in d0. Mice were vaccinated with peptide 30 (Jerini Peptide Technologies (Berlin); 100 μg peptide + 50 μg poly I:C sc (Invivogen)) on day - 4, day + 2 and day + 9. The control group received Poly I:C only (50 µg sc). Tumor growth was monitored to day + 16*, p < 0.05 in log-rank test (Mantel-Cox).

Фигура 5Figure 5

(A) Примеры повышенной белковой экспрессии (слева eGFP, справа Люцифераза) с РНК, оптимизированной для стабильной и эффективной трансляции (B) Пример полиэпитопной экспансии антиген-специфичных CD8+ и CD4+ T-клеток с РНК, оптимизированной для эффективного таргетинга антигенов (см. Reference Kreiter, Konrad, Sester et al, Cancer Immunol. Immunother. 56: 1577-1587, 2007). T (C) Пример пре-клинического доказательства противоопухолевой эффективности в модели B16 меланомы с использованием РНК-вакцины, которая кодирует одиночный эпитоп (OVA-SIINFEKL). Данные по выживаемости получали для мышей, обработанных с помощью вакцины индивидуально или с помощью вакцины в комбинации с адъювантом. (D) Дизайн индивидуальных полинеоэпитопных вакцин. Носитель вакцины объединяет функциональные элементы для повышенной экспрессии и оптимизированной иммуногенности. До 30 мутированных эпитопов, которые разделены линкерами, могут быть интегрированы в молекулу в контексте их природных последовательностей.(A) Examples of increased protein expression (left eGFP, right Luciferase) with RNA optimized for stable and efficient translation (B) Example of polyepitope expansion of antigen-specific CD8 + and CD4 + T cells with RNA optimized for efficient antigen targeting (see Reference Kreiter, Konrad, Sester et al, Cancer Immunol Immunother 56:1577-1587, 2007). T (C) An example of pre-clinical evidence of antitumor efficacy in the B16 melanoma model using an RNA vaccine that encodes a single epitope (OVA-SIINFEKL). Survival data were obtained from mice treated with the vaccine alone or with the vaccine in combination with an adjuvant. (D) Design of individual polyneoepitope vaccines. The vaccine carrier combines functional elements for increased expression and optimized immunogenicity. Up to 30 mutated epitopes that are separated by linkers can be integrated into a molecule in the context of their natural sequences.

Фигура 6: Дизайн конструктаFigure 6: Construct Design

(A) Схематическая диаграмма полиэпитопного РНК-конструкта. Cap: кэп-аналог; 5´UTR : 5´нетранслируемая область; L : Линкер; Seq. 1 : РНК-последовательность, кодирующая пептид, содержащий мутированную ак; 3´UTR : 3´нетранслируемая область; poly-A: поли-A хвост. (B) последовательность РНК-конструктов, кодирующих 2 ак последовательности, включающие мутированную ак из B16F10. Старт- и стоп-кодон, а также сигнальный пептид и последовательность MITD не являются частью схематического чертежа, который обозначен с помощью «….».(A) Schematic diagram of a polyepitope RNA construct. Cap: cap analogue; 5´UTR : 5´untranslated region; L : Linker; Seq. 1: RNA sequence encoding a peptide containing a mutated aa; 3´UTR : 3´untranslated region; poly-A: poly-A tail. (B) Sequence of RNA constructs encoding 2 aa sequences including a mutated aa from B16F10. The start and stop codon, as well as the signal peptide and the MITD sequence, are not part of the schematic drawing, which is indicated by "....".

Фигура 7: Функциональность РНК-полиэпитопаFigure 7: Functionality of RNA polyepitope

(A-C) Данные для «IFNγ ELISpot» с использованием 5 x 105 клеток селезенки на лунку в качестве эффекторов и 5 x 104 BMDC в качестве клеток-мишеней. BMDC загружали пептидом (2 мкг/мл в течение 2ч при 37°C и 5% CO2) или трансфецировали РНК (20 мкг) с помощью электропорации. Контрольная РНК представляла собой eGFP (левая панель) или РНК-конструкт, кодирующий 2 несвязанных пептида, содержащих мутированные ак, разделенные линкером. Данные представлены в виде среднего значения ± станд. ош. среднего. (A) Представлены данные для мутированного пептида 30, пептида дикого типа 30 и РНК, кодирующей мутацию 30 и 31. (B) Представлены данные для мутированного пептида 12, пептида дикого типа 12 и РНК, кодирующей мутацию 12 и 39. (C) Изображен характерный ELISpot-скан для считывания данных одной мыши, представленной в (B).(AC) Data for "IFNγ ELISpot" using 5 x 10 5 spleen cells per well as effectors and 5 x 10 4 BMDC as target cells. BMDC were loaded with peptide (2 μg/ml for 2h at 37°C and 5% CO 2 ) or transfected with RNA (20 μg) by electroporation. Control RNA was eGFP (left panel) or an RNA construct encoding 2 unlinked peptides containing mutated aa separated by a linker. Data are presented as mean ± std. osh. average. (A) Shown are data for mutated peptide 30, wild-type peptide 30, and RNA encoding mutation 30 and 31. (B) Shown are data for mutated peptide 12, wild-type peptide 12, and RNA encoding mutation 12 and 39. (C) Depicted representative ELISpot scan for reading data from a single mouse shown in (B).

Фигура 8: Два воплощения полинеоэпитопных РНК-вакцин, демонстрирующих соединяющие эпитопыFigure 8: Two embodiments of polyneoepitope RNA vaccines showing bridging epitopes

РНК-вакцина может быть сконструирована вместе с линкерами (верх) или без линкеров (низ) между пептидами, кодирующими мутацию. Хорошие эпитопы включают те, которые включают соматическую мутацию (“*”) и связываются с молекулами MHC. Плохие эпитопы включают эпитопы, которые связываются с молекулами MHC, но содержат либо части двух пептидов (низ), либо части пептида и линкерную последовательность (верх).An RNA vaccine can be designed with or without linkers (top) between mutant-encoding peptides. Good epitopes include those that include a somatic mutation (“*”) and bind to MHC molecules. Bad epitopes include epitopes that bind to MHC molecules but contain either parts of two peptides (bottom) or parts of a peptide and a linker sequence (top).

Фигура 9: Выявление и описание характеристик «T-клеточного поддающегося воздействию лекарственных средств мутанома (mutanome)»Figure 9: Identification and characterization of "T-cell drug-responsive mutanome"

(A) Блок-схема дает понятие об экспериментальной процедуре, начиная от образцов B16F10 и C57BL/6 до вывода данных «ELISPOT». (B) Представлены количество хитов для каждой стадии оценки и процесс отбора мутаций для подтверждения ДНК и иммуногенное тестирование. Мутации, отобранные для подтверждения и тестирования иммуногенности, это те, которые, согласно прогнозу, являются иммуногенными, и которые находятся в генах, экспрессирующихся при RPKM > 10. (C) T-клеточный поддающийся воздействию лекарственных средств «мутаном» картировали в геноме B16F10. Циклы от внешней к внутренней позиции для следующих подгрупп: (1) присутствие в каждом из трех повторений, (2) FDR < 0,05, (3) локализованы в областях, кодирующих белок, (4) вызывают несинонимичные изменения, (5) локализованы в экспрессирующихся генах, и (6) представлены в подтвержденном виде. Мышиные хромосомы (внешний круг), плотность генов (зеленый), экспрессия генов (зеленый(низкая)/желтый/красный(высокая)), и соматические мутации (оранжевый).(A) The flowchart gives an idea of the experimental procedure from samples B16F10 and C57BL/6 to the output of "ELISPOT" data. (B) Shown are the number of hits for each evaluation step and the mutation selection process for DNA confirmation and immunogenic testing. Mutations selected for confirmation and testing of immunogenicity are those predicted to be immunogenic and are found in genes expressed at RPKM > 10. (C) T-cell drug-responsive "mutanome" mapped to the B16F10 genome. Cycles from outer to inner position for the following subgroups: (1) present in each of the three repetitions, (2) FDR < 0.05, (3) localized in protein-coding regions, (4) cause non-synonymous changes, (5) localized in expressed genes, and (6) are presented in a confirmed form. Mouse chromosomes (outer circle), gene density (green), gene expression (green(low)/yellow/red(high)), and somatic mutations (orange).

Фигура 10: Иммунный ответ, вызванный in vivo с помощью вакцинации мышей длинными синтетическими пептидами, представляющими мутациюFigure 10: Immune response elicited in vivo by vaccination of mice with long synthetic peptides representing the mutation

(A,B) «IFN-γ ELISPOT» анализ T-клеточных эффекторов из мышей, вакцинированных пептидами, кодирующими мутацию. Столбцы характеризуют средние значения (±станд. ош. среднего) 5 мышей на группу. Звездочки указывают статистически значимые различия реактивности против мутации и против пептида дикого типа (критерий Стьюдента; p-значение < 0,05). (A) Спленоциты вакцинированных мышей повторно стимулировали с помощью BMDC, трансфецированных пептидом, кодирующим мутацию, используемым для вакцинации, соответствующим пептидом дикого типа и чужеродным контрольным пептидом (VSV-NP). (B) Для анализа T-клеточной реактивности против эндогенно процессированных мутаций спленоциты вакцинированных мышей повторно стимулировали с помощью BMDC, трансфецированных контрольной РНК (eGFP) или РНК, кодирующей указанную мутацию. (C) Мутация 30 (ген Kif18B, белок Q6PFD6, мутация p.K739N). Проведение секвенирования по Сэнгеру и последовательность мутации (верх). Локализация белковых доменов и мутации (низ).(A,B) "IFN-γ ELISPOT" analysis of T-cell effectors from mice vaccinated with peptides encoding the mutation. Columns represent the mean (±St. O. Mean) of 5 mice per group. Asterisks indicate statistically significant differences in reactivity against the mutation and against the wild-type peptide (Student's t-test; p-value < 0.05). (A) Splenocytes from vaccinated mice were restimulated with BMDCs transfected with the peptide encoding the mutation used for vaccination, the corresponding wild-type peptide, and a foreign control peptide (VSV-NP). (B) To analyze T cell reactivity against endogenously processed mutations, splenocytes from vaccinated mice were restimulated with BMDC, transfected control RNA (eGFP) or RNA encoding the indicated mutation. (C) Mutation 30 (Kif18B gene, Q6PFD6 protein, p.K739N mutation). Sanger sequencing and mutation sequence (top). Localization of protein domains and mutations (bottom).

Фигура 11: Противоопухолевые эффекты вакцин с мутированным пептидом у мышей с агрессивно растущими опухолями B16F10 Figure 11: Antitumor effects of mutated peptide vaccines in mice with aggressively growing B16F10 tumors

(A) C57BL/6 мышам (n = 7) инокулировали 7.5 x 104 B16F10-клеток п.к. в бок мыши. На 3 и 10 день после инокуляции опухоли, мышей вакцинировали с помощью 100 μг пептида MUT30 или MUT44 + 50 μг поли(I:C) или с помощью адъюванта отдельно. (B) C57BL/6 мыши (n = 5) получали одну иммунизацию 100 μг MUT30 пептида + 50 μг поли(I:C) на -4 день. В день 0 инокулировали п.к. 7.5 x 104 клеток B16F10 в бок мыши. Бустерную иммунизацию пептидом MUT30 (+ поли(I:C)) проводили на 2 и на 9 день.(A) C57BL/6 mice (n = 7) were inoculated with 7.5 x 10 4 B16F10 cells sc. to the side of the mouse. On days 3 and 10 after tumor inoculation, mice were vaccinated with 100 μg MUT30 or MUT44 peptide + 50 μg poly(I:C) or adjuvant alone. (B) C57BL/6 mice (n=5) received one immunization with 100 μg MUT30 peptide + 50 μg poly(I:C) on day -4. On day 0, s.c. were inoculated. 7.5 x 10 4 B16F10 cells in the flank of the mouse. Booster immunization with the MUT30 peptide (+poly(I:C)) was performed on days 2 and 9.

Кривая выживаемости Каплана-Мейера (слева). Кинетика опухолевого роста (справа).Kaplan-Meier survival curve (left). Kinetics of tumor growth (right).

Фигура 12: Вакцинация с помощью РНК, кодирующих мутации, приводит к CD4+ и CD8+ T-клеточному ответуFigure 12: Vaccination with RNA encoding mutations leads to CD4 + and CD8 + T-cell response

Данные анализа окрашивания внутриклеточных цитокинов для IFN-γ в CD4+ и CD8+ T-клеточных эффекторах, полученных из мышей, вакцинированных РНК, кодирующей мутации. РНК кодировали 1 (Моноэпитоп, верхний ряд), 2 (Биэпитоп, средний ряд), или 16 (Полиэпитоп, нижний ряд) различных мутаций. Пятна характеризуют средние значения для 3 мышей на группу. Звездочки указывают статистически значимые различия реактивности против мутации и против контрольного пептида (VSV-NP) (критерий Стьюдента; p-значение < 0,05). Графики FACS демонстрируют эффекторы из животного с наивысшей секрецией IFN-γ для каждой мутации и выявляют фенотип T-клеточного ответа.Data from analysis of intracellular cytokine staining for IFN-γ in CD4 + and CD8 + T-cell effectors derived from mice vaccinated with RNA encoding the mutation. RNA coded for 1 (Monoepitope, top row), 2 (Biepitope, middle row), or 16 (Polyepitope, bottom row) different mutations. Spots represent average values for 3 mice per group. Asterisks indicate statistically significant differences in reactivity against the mutation and against the control peptide (VSV-NP) (Student's t-test; p-value < 0.05). FACS plots show the effectors from the animal with the highest secretion of IFN-γ for each mutation and reveal the phenotype of the T-cell response.

Фигура 13: Вакцинация с использованием Полиэпитопной РНК, кодирующей мутации, приводит к T-клеточным ответам против нескольких мутацийFigure 13: Vaccination with Polyepitope RNA Encoding Mutations Leads to T Cell Responses Against Multiple Mutations

«IFN-γ ELISPOT» анализ T-клеточных эффекторов из мышей, вакцинированных полиэпитопным пептидом, кодирующим мутации, который несет 16 различных мутаций. Столбцы представляют средние значения (±станд. ош. среднего) для 3 мышей на группу. Фотографии демонстрируют три копии лунок с клетками из одного типичного животного, повторно стимулированными с использованием указанных пептидов."IFN-γ ELISPOT" analysis of T-cell effectors from mice vaccinated with a mutation-encoding polyepitope peptide that carries 16 different mutations. Bars represent means (±SEM) for 3 mice per group. The photographs show three copies of wells with cells from one typical animal restimulated with the indicated peptides.

Фигура 14: Вакцинация с использованием 5 различных модельных эпитопов, кодируемых одной РНК, приводит к иммунному ответу против всех кодируемых эпитоповFigure 14: Vaccination with 5 different model epitopes encoded by a single RNA results in an immune response against all encoded epitopes

A) «IFN-γ ELISPOT» анализ T-клеточных эффекторов из мышей, вакцинированных модельным полиэпитопным пептидом, кодирующим мутации, который несет 5 различных модельных эпитопов (SIINFEKL, Trp2, VSV-NP, Inf-NP, OVA класса II). Спленоциты повторно стимулировали с использованием указанных пептидов. Пятна характеризуют средние трех копий лунок из 5 мышей на группу. B) Окрашивание пентамером лимфоцитов крови одной контрольной мыши и одной мыши, иммунизированной модельным полиэпитопным пептидом. Окрашенные Inf-NP пентамером клетки CD8+ специфичны к пептиду Inf-NP.A) "IFN-γ ELISPOT" analysis of T-cell effectors from mice vaccinated with a model polyepitope peptide encoding mutations that carries 5 different model epitopes (SIINFEKL, Trp2, VSV-NP, Inf-NP, OVA class II). Splenocytes were re-stimulated with the indicated peptides. Spots characterize the average of three copies of wells from 5 mice per group. B) Pentamer staining of blood lymphocytes from one control mouse and one mouse immunized with the model polyepitope peptide. Inf-NP pentamer-stained CD8 + cells are specific for the Inf-NP peptide.

Фигура 15: A CD4+ T-клетки, индуцирующие мутацию, могут индуцировать мощный противоопухолевый эффект против меланомы B16F10 в синергии со слабым CD8+ T-клеточным эпитопомFigure 15: A Mutation-inducing CD4 + T cells can induce a potent antitumor effect against B16F10 melanoma in synergy with a weak CD8 + T cell epitope

Мышам C57BL/6 (n = 8) инокулировали 1 x 105 клеток B16F10 п.к. в бок. На 3, 10 и 17 день после инокуляции опухоли мышей вакцинировали 100 µг MUT30, Trp2 или с обоими пептидами + 50 µг поли(I:C). A) представлено среднее значение кинетики опухолевого роста для каждой группы. На 28 день средние значения между группами одной обработки и необработанными животными и группой комбинированной обработки статистически различны (тест Манна-Уитни, p-значение < 0,05). B) График выживания Каплана-Мейера для различных групп. Кривые выживания мышей, вакцинированных MUT30 и MUT30 + Trp2, являются статистически различными (логарифмический ранговый критерий, p-значение = 0,0029).C57BL/6 mice (n = 8) were inoculated with 1 x 10 5 B16F10 cells sc. to the side. On days 3, 10 and 17 after tumor inoculation, mice were vaccinated with 100 µg MUT30, Trp2, or both peptides + 50 µg poly(I:C). A) shows the average value of the kinetics of tumor growth for each group. At day 28, the mean values between the single treatment groups and the untreated animals and the combined treatment group were statistically different (Mann-Whitney test, p-value < 0.05). B) Kaplan-Meier survival plot for different groups. The survival curves of mice vaccinated with MUT30 and MUT30 + Trp2 are statistically different (log-rank test, p-value = 0.0029).

Фигура 16: Обзор способа обнаружения соматических мутаций в B16Figure 16: Overview of the method for detecting somatic mutations in B16

Количество индивидуальных стадий дано как пример для одного образца B16, по сравнению с одним образцом black6. «Экзоны» служат для обозначения координат экзонов, определенных всеми белок-кодирующими транскриптами RefSeq.The number of individual stages is given as an example for one B16 sample, compared to one black6 sample. "Exons" refers to the coordinates of the exons defined by all RefSeq protein-coding transcripts.

Фигура 17: Диаграмма Венна, демонстрирует количество соматических вариаций в белок-кодирующих экзонах, обнаруженных одним или двумя или всеми тремя программными инструментами, соответственно.Figure 17: Venn diagram showing the number of somatic variations in protein-coding exons detected by one or two or all three software tools, respectively.

Количества рассчитывали после фильтрации и представляют собой консенсус всех трех образцов.Amounts were calculated after filtration and represent the consensus of all three samples.

Фигура 18: А Примеры обнаруженных однонуклеотидных вариаций: Соматическая мутация, обнаруженная во всех трех образцах B16 (слева), несоматическая мутация, обнаруженная во всех образцах B16 и black6 (посередине) и мутация, обнаруженная только в одном образце black6 (справа). B Вычисленное распределение FDR для набора данных, проверенные мутации которого были отобраны; распределение визуализировано как средняя расчетная кривая ROC с серыми столбиками, указывающими на 95% доверительный интервал для среднего в обоих координатах при единообразно отобранных местоположениях. Среднее получено из распределения расчетных кривых ROC для FDR всех возможных 18 комбинаций (см. текст). Figure 18: A Examples of single nucleotide variations detected: Somatic mutation found in all three B16 samples (left), non-somatic mutation found in all B16 and black6 samples (middle) and mutation found in only one black6 sample (right). B Computed FDR distribution for the dataset whose tested mutations were selected; the distribution is visualized as the mean calculated ROC curve with gray bars indicating the 95% confidence interval for the mean in both coordinates at uniformly sampled locations. The average is obtained from the distribution of the calculated ROC curves for FDR of all possible 18 combinations (see text).

Фигура 19: А Оценочные кривые ROC для сравнения трех различных программных инструментов (дубликаты, 38х покрытие). B Расчетные кривые ROC для сравнения различных средних глубин секвенирования («samtools», без реплик). 38x служит для обозначения покрытия, полученного экспериментом, при этом дискретизация других покрытий была снижена начиная с этих данных. C Расчетные кривые ROC визуализируют эффект воспроизведения эксперимента (38x покрытие, «samtools»). D Расчетные кривые ROC для различных протоколов секвенирования («samtools», без реплик). Кривые оценивали с помощью результатов библиотеки 2х100 нт.Figure 19: A ROC Evaluation Curves for comparing three different software tools (duplicates, 38x coverage). B Estimated ROC curves for comparison of different average sequencing depths (samtools, no replicas). 38x is used to denote the coverage obtained by experiment, while other coverages have been downsampled starting from this data. C The calculated ROC curves visualize the effect of reproducing the experiment (38x coverage, "samtools"). D Estimated ROC curves for various sequencing protocols ("samtools", no replicas). Curves were evaluated using the results of the 2x100 nt library.

Фигура 20: А Десять проверенных мутаций с наиболее низкими значениями FDR, выбранные с помощью оптимального набора параметров из конечного набора из 2396 вариаций. Ни одна из этих мутаций не присутствует в dbSNP (версия 128; сборка генома mm9). В Относительное количество вариаций, обнаруженное в той же базе данных, что и А, для данного предела FDR, нанесенное на график отдельно для всех вариантов в базе данных и проверенных мутаций. Для визуальной ясности показаны только значения от 0 до 10% FDR.Figure 20: A Ten tested mutations with the lowest FDR values, selected using the optimal set of parameters from a finite set of 2396 variations. None of these mutations are present in dbSNP (version 128; mm9 genome assembly). B Relative amount of variation found in the same database as A for a given FDR limit, plotted separately for all database variants and mutations tested. For visual clarity, only values from 0 to 10% FDR are shown.

Фигура 21: Противоопухолевая активность кодирующей мутацию полиэпитопной РНК-вакцины Мыши C57BL/6 (n = 10) инокулировали 1 x 105 клеток B16F10 п.к. в бок мыши. В день 3, 6, 10, 17 и 21 после инокуляции опухоли, мышей вакцинировали полиэпитопной РНК, вместе с липосомным реактивом для трансфекции РНК. Контрольная группа получала липосомы без РНК. На фигуре показан график выживания Каплана-Мейера для различных групп. Кривые выживания статистически отличны (логарифмический ранговый критерий, p-значение = 0,0008).Figure 21: Antitumor activity of the mutation-encoding polyepitope RNA vaccine C57BL/6 mice (n=10) were inoculated with 1 x 10 5 B16F10 cells sc. to the side of the mouse. On days 3, 6, 10, 17 and 21 after tumor inoculation, mice were vaccinated with polyepitope RNA, along with a liposomal RNA transfection reagent. The control group received liposomes without RNA. The figure shows a Kaplan-Meier survival plot for various groups. Survival curves are statistically different (log-rank test, p-value = 0.0008).

ПримерыExamples

Методы и способы, использованные в данном документе, описаны или осуществляются так, как по существу известно и как описано, например, в Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. Все способы, включая применение наборов и реактивов, осуществляются согласно информации изготовителей, если конкретно не указано иное.Methods and methods used herein are described or practiced as per se known and as described, for example, in Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY All methods, including use of kits and reagents, are performed according to manufacturer's information unless specifically noted otherwise.

Пример 1. Детекция и приориетизация мутацийExample 1 Mutation Detection and Prioritization

Вначале мы продемонстрировали объективное профилирование образцов опухоли и нормы, которое основано на результатах секвенирования, для идентификации соматических мутаций. Мы продемонстрировали это не только для образцов основной части опухоли, но также, впервые, мы продемонстрировали способность идентифицировать мутации из индивидуальных циркулирующих опухолевых клеток. Затем мы приоритизировали мутации для включения в полинеоэпитопную вакцину на основе спрогнозированной иммуногенности мутаций и продемонстрировали, что идентифицированные мутации действительно являются иммуногенными.We first demonstrated objective profiling of tumor and normal specimens, which is based on sequencing results, to identify somatic mutations. We have demonstrated this not only for bulk tumor samples, but also, for the first time, we have demonstrated the ability to identify mutations from individual circulating tumor cells. We then prioritized mutations for inclusion in the polyneoepitope vaccine based on the predicted immunogenicity of the mutations and demonstrated that the identified mutations are indeed immunogenic.

Детекция мутацийMutation detection

Обоснование использования CTC: детекция циркулирующих опухолевых клеток (СTС) из периферической крови онкопациентов является признанным независимым прогностическим маркером клинического течения опухолевого заболевания (Pantel et al, Trends Mol Med 2010; 16(9):398-406). На протяжении многих лет, клиническое значение CTC были предметом интенсивных научных и клинических исследований в онкологии. Было показано, что детекция CTC в крови пациентов с метастатическим раком молочной железы, предстательной железы и колоректальным раком, имеет прогностическое значение, обеспечивая дополнительную информацию для традиционных методов имеджинга и других прогностических опухолевых биомаркеров. Последовательно забранные образцы крови, взятые у пациента до, в ранней стадии, и после лечения терапевтическим агентом (системным или таргетным) содержат информацию об ответе на лечение/неудаче лечения. Молекулярный анализ обладающих лекарственной устойчивостью CTC может обеспечить дальнейшее понимание механизмов устойчивости (например, мутаций в определенных сигнальных путях или потере целевой экспрессии) у индивидуальных пациентов. Дополнительная возможность профилирования и генетического описания CTC заключается в идентификации новых мишеней злокачественных опухолей для разработки новых таргетных терапий. Эта новая диагностическая стратегия упоминается как «Жидкая Биопсия Опухоли». Поскольку профилирование может быть осуществлено быстро и периодически, с необходимостью получения только крови пациента без хирургического вмешательства, то данный подход может обеспечить обзор состояния опухоли в «реальном времени». Rationale for the use of CTC: The detection of circulating tumor cells (CTC) from the peripheral blood of cancer patients is a recognized independent prognostic marker of the clinical course of a tumor disease (Pantel et al, Trends Mol Med 2010; 16(9):398-406). For many years, the clinical significance of CTC has been the subject of intense scientific and clinical research in oncology. The detection of CTC in the blood of patients with metastatic breast, prostate, and colorectal cancer has been shown to be of prognostic value, providing additional information for traditional imaging methods and other prognostic tumor biomarkers. Sequentially taken blood samples taken from the patient before, at an early stage, and after treatment with a therapeutic agent (systemic or targeted) contain information about the response to treatment/treatment failure. Molecular analysis of drug-resistant CTCs may provide further insight into the mechanisms of resistance (eg, mutations in certain signaling pathways or loss of target expression) in individual patients. An additional opportunity for profiling and genetic characterization of CTC lies in the identification of new targets of malignant tumors for the development of new targeted therapies. This new diagnostic strategy is referred to as "Liquid Tumor Biopsy". Since profiling can be performed quickly and periodically, with the need to obtain only the patient's blood without surgery, this approach can provide a "real time" overview of the tumor status.

Мутации опухолевых клеток Мы продемонстрировали нашу способность идентифицировать мутации с помощью клеток меланомы B16, захвата экзома для экстракции белок-кодирующих областей, секвенирования следующего поколения с помощью нашего «HiSeq 2000», с последующим биоинформатическим анализом с помощью нашего программного конвейера «iCAM» (фиг. 1). Мы идентифицировали 2448 несинонимичных мутаций и отобрали 50 для подтверждения. Мы смогли подтвердить все 50 соматических мутаций.Tumor Cell Mutations We demonstrated our ability to identify mutations using B16 melanoma cells, exome capture to extract protein-coding regions, next-generation sequencing with our HiSeq 2000, followed by bioinformatic analysis with our iCAM software pipeline (Fig. one). We identified 2448 non-synonymous mutations and selected 50 for confirmation. We were able to confirm all 50 somatic mutations.

Ниже представлен пример влияния на белок обнаруженной соматической мутации в клетках меланомы B16:The following is an example of the effect on a protein of a detected somatic mutation in B16 melanoma cells:

Kifl8b, NM_197959, экзон 3Kifl8b, NM_197959, exon 3

Мутация (+15 aк) SPSKPSFQEFVDWENVSPELNSTDQPFLPSMutation (+15 ak) SPSKPSFQEFVDWENVSPELNSTDQPFLPS

Дикий тип (+15 aк) SPSKPSFQEFVDWEKVSPELNSTDQPFLPSWild type (+15 ak) SPSKPSFQEFVDWEKVSPELNSTDQPFLPS

Мутации индивидуальных циркулирующих опухолевых клеток (CTC): Затем мы смогли идентифицировать опухоль-специфичные соматические мутации NGS-профилированием РНК из одиночных CTC. Меченные клетки меланомы B16 внутривенно инъецировали в мышиные хвосты, мышей умерщвляли, кровь собирали из сердец, клетки сортировали для извлечения меченных циркулирующих клеток B16 (СTC), экстрагировали РНК, осуществляли «SMART» кДНК-синтез и неспецифическую амплификацию, а затем NGS-анализ RNA-Seq и последующий анализ данных (ниже).Individual circulating tumor cell (CTC) mutations: We were then able to identify tumor-specific somatic mutations by NGS RNA profiling from single CTCs. Labeled B16 melanoma cells were intravenously injected into mouse tails, mice were sacrificed, blood was collected from hearts, cells were sorted to extract labeled circulating B16 cells (CTC), RNA was extracted, "SMART" cDNA synthesis and non-specific amplification were performed, and then NGS analysis of RNA -Seq and subsequent data analysis (below).

Мы профилировали восемь индивидуальных CTC и идентифицировали соматические мутации. Более того, в восьми из восьми клеток, идентифицировали ранее идентифицированные мутации. Во множестве случаев, данные демонстрируют гетерогенность на уровне индивидуальных клеток. Например, в положении 144078227 на хромосоме 2 (сборка mm9) в гене Snx15, в двух клетках был эталонный нуклеотид (С), тогда как в двух других клетках был мутированный нуклеотид (T). We profiled eight individual CTCs and identified somatic mutations. Moreover, in eight of the eight cells, previously identified mutations were identified. In many cases, the data demonstrate heterogeneity at the level of individual cells. For example, at position 144078227 on chromosome 2 (mm9 assembly) in the Snx15 gene, two cells had a reference nucleotide (C) while two other cells had a mutated nucleotide (T).

Это говорит о том, что мы способны профилировать индивидуальные CTC для идентификации соматических мутаций, фундаментальный путь к iVAC (индивидуализированной вакцине) «в реальном времени», в которых пациенты профилированы соответствующим образом и результаты отражают текущий статус пациента, а не статус в более раннюю временную точку. Более того, это говорит о том, что мы способны идентифицировать гетерогенные соматические мутации, которые присутствуют в поднаборе опухолевых клеток, что позволяет оценить частоту мутаций, например, для идентификации основных мутаций и редких мутаций.This suggests that we are able to profile individual CTCs to identify somatic mutations, a fundamental route to iVAC (individualized vaccine) "real time" in which patients are profiled appropriately and the results reflect the patient's current status rather than status at an earlier time. point. Moreover, this suggests that we are able to identify heterogeneous somatic mutations that are present in a subset of tumor cells, which allows us to estimate the frequency of mutations, for example, to identify major mutations and rare mutations.

СпособыWays

Образцы: Для эксперимента профилирования, образцы включают 5-10 мм образцы хвостов мышей C57BL/6 («Black6») и сильноагрессивные мышиные клетки меланомы («B16»), которые изначально были получены из мышей Black6.Samples: For the profiling experiment, samples include 5-10 mm tail samples from C57BL/6 mice ("Black6") and highly aggressive mouse melanoma cells ("B16"), which were originally derived from Black6 mice.

Циркулирующие опухолевые клетки (CTC) были созданы с использованием флуоресцентно меченых клеток меланомы B16. Клетки B16 ресуспендировали в PBS и добавляли к ним равный объем свежеприготовленного раствора CFSE (5 µM в PBS). Образец осторожно перемешивали вибрационным смесителем, с последующей инкубацией в течение 10 минут при комнатной температуре. Для остановки реакции мечения, равное количество PBS, содержащего 20% FSC добавляли к образцу и осторожно смешивали вибрационным смесителем. После 20 минутной инкубации при комнатной температуре клетки дважды отмывали с помощью PBS. В конце клетки ресуспендировали в PBS и инъецировали внутривенно (в.в.) мышам. Через 3 минуты мышей умерщвляли и собирали кровь. Circulating tumor cells (CTCs) were generated using fluorescently labeled B16 melanoma cells. B16 cells were resuspended in PBS and an equal volume of freshly prepared CFSE solution (5 µM in PBS) was added to them. The sample was gently mixed with a vibrating mixer, followed by incubation for 10 minutes at room temperature. To stop the labeling reaction, an equal amount of PBS containing 20% FSC was added to the sample and gently mixed with a vibrating mixer. After 20 minutes of incubation at room temperature, the cells were washed twice with PBS. Finally, cells were resuspended in PBS and injected intravenously (iv) into mice. Mice were sacrificed after 3 minutes and blood was collected.

Эритроциты из образцов крови лизировали добавлением 1,5 мл свежеприготовленного раствора «PharmLyse» («Beckton Dickinson») на 100 мкл крови. После одной стадии отмывки добавляли к образцу 7-AAD и инкубировали в течение 5 минут при комнатной температуре. За инкубацией следовали две стадии отмывки и образец ресуспендировали в 500 мкл PBS. Erythrocytes from blood samples were lysed by adding 1.5 ml of freshly prepared PharmLyse solution (Beckton Dickinson) per 100 μl of blood. After one wash step, 7-AAD was added to the sample and incubated for 5 minutes at room temperature. The incubation was followed by two wash steps and the sample was resuspended in 500 µl PBS.

Меченные CFSE циркулирующие клетки B16 сортировали с помощью клеточного сортера «Aria I» («BD»). Одиночные клетки сортировали в 96-луночные планшеты с v-образным дном, в которые был добавлен буфер «RLT» («Qiagen»), в объеме 50 мкл/лунку. После окончания сортировки планшеты хранили при -80°C до начала экстракции нуклеиновых кислот и приготовления образцов. CFSE-labeled circulating B16 cells were sorted using an "Aria I" ("BD") cell sorter. Single cells were sorted into 96-well v-bottom plates supplemented with RLT buffer (Qiagen) at a volume of 50 μl/well. After sorting was complete, the plates were stored at -80°C until nucleic acid extraction and sample preparation began.

Экстракция нуклеиновых кислот и приготовление образцов: нуклеиновые кислоты из клеток B16 (ДНК и РНК) и ткани хвоста Black6 (ДНК) экстрагировали с помощью набора «Qiagen DNeasy Blood and Tissue kit» (для ДНК) и набора «Qiagen RNeasy Micro kit» (для РНК).Nucleic acid extraction and sample preparation: Nucleic acids from B16 cells (DNA and RNA) and Black6 tail tissue (DNA) were extracted using the Qiagen DNeasy Blood and Tissue kit (for DNA) and the Qiagen RNeasy Micro kit (for RNA).

Из индивидуальных отсортированных CTC экстрагировали РНК и осуществляли SMART-синтез кДНК и неспецифическую амплификацию. РНК из сортированных СTC-клеток экстрагировали с помощью набора «RNeasy Micro Kit» («Qiagen», Хильден, Германия) согласно инструкциям поставщика. Модифицированный протокол «BD SMART» использовали для синтеза кДНК: Обратную транскриптазу «Mint» («Evrogen», Москва, Россия) объединяли с олиго(dT)-T-праймером long для праймирования реакции синтеза первой цепи и TS-short ("Eurogentec S.A.», Сераинг, Бельгия), вводящим олиго(рибоG) последовательность, для обеспечения возможности создание удлиненной матрицы посредством активности терминальной трансферазы у обратной транскриптазы и для переключения матрицы [Chenchik, A., Y. et al. 1998. Generation and use of high quality cDNA from small amounts of total RNA by SMART PCR. In Gene Cloning and Analysis by RT-PCR. P. L. J. Siebert, ed. BioTechniques Books, MA, Natick. 305-319]. Первая цепь кДНК, синтезированная согласно инструкциям производителя подверглась амплификации в течение 35 циклов с 5 Ед. полимеразы «PfuUltra Hotstart High-Fidelity DNA Polymerase» ("Stratagene», Ла-Хойя, Калифорния) и 0,48 µM праймера TS-PCR в присутствии 200 µM dNTP (условия амплификации: 2 мин. при 95°C в течение, 30 с при 94°C, 30 с при 65°C, 1 мин. при 72°C в течение, конечное удлинение в течение 6 мин. при 72°C). Успешную амплификацию CTC-генов контролировали с помощью специфических праймеров для отслеживания актина и GAPDH. RNA was extracted from individual sorted CTCs and SMART cDNA synthesis and non-specific amplification were performed. RNA from sorted CTC cells was extracted using the RNeasy Micro Kit (Qiagen, Hilden, Germany) according to the supplier's instructions. The modified BD SMART protocol was used for cDNA synthesis: Mint reverse transcriptase (Evrogen, Moscow, Russia) was combined with oligo(dT)-T-primer long to prime the first-strand synthesis reaction and TS-short (Eurogentec S.A. ", Seraing, Belgium), introducing an oligo(riboG) sequence to allow the creation of an extended template through the activity of the terminal transferase at the reverse transcriptase and to switch the template [Chenchik, A., Y. et al. 1998. Generation and use of high quality cDNA from small amounts of total RNA by SMART PCR. In Gene Cloning and Analysis by RT-PCR. P. L. J. Siebert, ed. BioTechniques Books, MA, Natick. 305-319]. 35 cycles with 5 U PfuUltra Hotstart High-Fidelity DNA Polymerase (Stratagene, La Jolla, CA) and 0.48 µM TS-PCR primer in the presence of 200 µM dNTP (amplification conditions: 2 min at 95 °C during , 30 s at 94°C, 30 s at 65°C, 1 min. at 72°C for, final elongation for 6 min. at 72°C). Successful amplification of the CTC genes was monitored using specific primers to track actin and GAPDH.

Секвенирование следующего поколения, ДНК-секвенирование: Захват экзома для ресеквенирования ДНК осуществляли с помощью теста для захвата на основе раствора «Agilent Sure-Select» [Gnirke A et al: Solution hybrid selection with ultra-long oligonucleotides for massively parallel targeted sequencing. Nat Biotechnol 2009, 27:182-189], в данном случае спроектированном для захвата всех областей, кодирующих белки мыши.Next generation sequencing, DNA sequencing: Exome capture for DNA resequencing was performed using the Agilent Sure-Select solution capture assay [Gnirke A et al: Solution hybrid selection with ultra-long oligonucleotides for massively parallel targeted sequencing. Nat Biotechnol 2009, 27:182-189], in this case designed to capture all mouse protein-coding regions.

Вкратце, 3 мкг очищенной геномной ДНК фрагментировали до 150-200 п.о. с помощью ультразвукового устройства «Covaris S2». Концы фрагментов гДНК достраивали с помощью T4 ДНК-полимеразы, фрагмента Кленова и фосфорилировали по 5' c помощью T4 полинуклеотидкиназы. гДНК-фрагменты с тупыми концами 3’-аденилировали с использованием фрагмента Кленова (от 3’ к 5’ экзо минус). 3'-концевые одиночные T-перекрывающиеся парные концевые адаптеры «Illumina» лигировали к гДНК-фрагментам с помощью T4 ДНК-лигазы в молярном соотношении адаптера к вставке геномной ДНК 10:1. Лигированные с адаптерами фрагменты гДНК обогащали, добавляли последовательности, специфичные для предварительного захвата и проточной кюветы, с помощью праймеров «Illumina PE PCR 1.0» и «2.0» и полимеразы «Herculase II» («Agilent») в течение 4 циклов ПЦР.Briefly, 3 μg of purified genomic DNA was fragmented to 150-200 bp. using the ultrasonic device "Covaris S2". The ends of the gDNA fragments were completed with T4 DNA polymerase, Klenow fragment and phosphorylated at 5' with T4 polynucleotide kinase. Blunt-ended gDNA fragments were 3'-adenylated using a Klenow fragment (3' to 5' exo minus). Illumina 3' single T-overlapped paired end adapters were ligated to the gDNA fragments with T4 DNA ligase in a 10:1 molar ratio of adapter to genomic DNA insert. The gDNA fragments ligated with adapters were enriched, sequences specific for pre-capture and flow cell were added using Illumina PE PCR 1.0 and 2.0 primers and Herculase II polymerase (Agilent) during 4 PCR cycles.

500 нг лигированных с адаптером обогащенных ПЦР фрагментов гДНК гибридизовали с РНК-библиотекой биотинилированных приманок цельного мышиного экзома «SureSelect» фирмы «Agilent» в течение 24 часов при 65°C. Гибридизованные комплексы гДНК/РНК-приманка удаляли с помощью покрытых стрептавидином магнитных микросфер. Комплексы гДНК/РНК-приманка отмывали и РНК-приманки отщепляли в ходе элюции в элюционном буфере «SureSelect», оставляя захваченные обогащенные ПЦР гДНК фрагменты с лигированными адаптерами. Фрагменты гДНК амплифицировали ПЦР после захвата с помощью ДНК-полимеразы «Herculase II» (Agilent) и праймеров «SureSelect GA» в течение 10 циклов.500 ng of the adapter-ligated PCR-enriched gDNA fragments were hybridized with Agilent's SureSelect whole mouse exome biotinylated bait RNA library for 24 hours at 65°C. The hybridized gDNA/bait RNA complexes were removed using streptavidin-coated magnetic microspheres. The gDNA/bait RNA complexes were washed out and the bait RNAs were cleaved during elution in SureSelect elution buffer, leaving the captured PCR-enriched gDNA fragments with ligated adapters. The gDNA fragments were amplified by PCR after capture with Herculase II DNA polymerase (Agilent) and SureSelect GA primers for 10 cycles.

Все очистки осуществили в 1,8х объеме магнитных микросфер «AMPure XP» («Agencourt»). Все контроли качества осуществляли с помощью теста «Qubit HS» от «Invitrogen», а размер фрагментов определяли с помощью теста «HS DNA» на «Bioanalyzer 2100» от «Agilent». All purifications were performed in 1.8x the volume of AMPure XP magnetic microspheres (Agencourt). All quality controls were performed using the Qubit HS test from Invitrogen and the fragment size was determined using the HS DNA test on a Bioanalyzer 2100 from Agilent.

Библиотеки гДНК с обогащенным экзомом кластеризовали на «cBot» с помощью набора «Truseq SR cluster kit v2.5» при использовании 7 pM, и 50 п.о. секвенировали на «Illumina HiSeq2000» с помощью набора «Truseq SBS kit-HS 50 bp».Exome-enriched gDNA libraries were clustered on cBot using the Truseq SR cluster kit v2.5 using 7 pM, and 50 bp. sequenced on Illumina HiSeq2000 using Truseq SBS kit-HS 50 bp.

Секвенирование следующего поколения, Секвенирование РНК (RNA-Seq): mRNA-seq кДНК-библиотеки с «штрих-кодами» получали из 5 мкг общей РНК с помощью модифицированной версии протокола «Illumina mRNA-seq». мРНК выделяли с помощью магнитных микросфер «Seramag Oligo(dT)» («Thermo Scientific»). Выделенную мРНК фрагментировали с помощью двухвалентных катионов и нагревания, что приводило к получению фрагментов в диапазоне 160-220 нуклеотидов. Фрагментированную мРНК преобразовывали в кДНК с помощью случайных праймеров и SuperScriptII (Invitrogen) с последующим синтезом второй цепи с использованием полимеразы I и РНКазы H. Концы кДНК достраивали с помощью T4 ДНК-полимеразы, фрагмента Кленова и фосфорилировали по 5' с помощью T4 полинуклеотидкиназы. кДНК-фрагменты с тупыми концами 3’-аденилировали с использованием фрагмента Кленова (от 3’ к 5’ экзо минус). 3'-концевые одиночные T-перекрывающие, специфичные для «Illumina multiplex» адаптеры лигировали с помощью T4 ДНК-лигазы в молярном соотношении адаптера к кДНК-вставке 10:1.Next Generation Sequencing, RNA Sequencing (RNA-Seq): mRNA-seq Barcoded cDNA libraries were generated from 5 µg of total RNA using a modified version of the Illumina mRNA-seq protocol. mRNA was isolated using Seramag Oligo(dT) magnetic microspheres (Thermo Scientific). The isolated mRNA was fragmented using divalent cations and heating, resulting in fragments in the range of 160-220 nucleotides. Fragmented mRNA was converted into cDNA using random primers and SuperScriptII (Invitrogen), followed by second strand synthesis using polymerase I and RNase H. The cDNA ends were completed with T4 DNA polymerase, Klenow fragment and phosphorylated 5' with T4 polynucleotide kinase. Blunt-ended cDNA fragments were 3'-adenylated using a Klenow fragment (3' to 5' exo minus). 3' single T-overlapping "Illumina multiplex" specific adapters were ligated with T4 DNA ligase in a molar ratio of adapter to cDNA insert of 10:1.

кДНК-библиотеки очищали и отбирали по размеру 200-220 п.о. с помощью геля «E-Gel 2% SizeSelect gel» («Invitrogen»). Обогащение, добавление последовательностей «Illumina» для индексирования из шести оснований и последовательностей для проточной кюветы осуществляли ПЦР с использованием ДНК-полимеразы «Phusion» («Finnzymes»). Все очистки осуществляли с помощью 1,8x объема магнитных микросфер «AgencourtAMPure XP». Все контроли качества осуществляли с помощью теста «Qubit HS» от «Invitrogen» и размер фрагментов определяли с помощью теста «HS DNA» на «Bioanalyzer 2100» от «Agilent».cDNA libraries were purified and selected for size 200-220 bp. using E-Gel 2% SizeSelect gel (Invitrogen). Enrichment, addition of Illumina six-base indexing sequences and flow cell sequences were performed by PCR using Phusion DNA polymerase (Finnzymes). All purifications were performed with 1.8x the volume of AgencourtAMPure XP magnetic beads. All quality controls were performed using the Qubit HS test from Invitrogen and the size of the fragments was determined using the HS DNA test on a Bioanalyzer 2100 from Agilent.

Библиотеки RNA-Seq с штрих-кодами кластеризовали на «cBot» с помощью набора «Truseq SR cluster kit v2.5» при использовании 7 pM, и секвенировали по 50 п.о. на «Illumina HiSeq2000» с помощью набора «Truseq SBS kit-HS 50 bp".Barcoded RNA-Seq libraries were clustered on cBot with a Truseq SR cluster kit v2.5 using 7 pM and sequenced at 50 bp. on the Illumina HiSeq2000 using the Truseq SBS kit-HS 50 bp.

CTC: Для RNA-Seq-профилирования CTC, использовали модифицированную версию данного протокола в котором использовали 500-700 нг SMART-амплифицированной кДНК, двухконцевые адаптеры были лигированы а обогащение ПЦР осуществлено с помощью праймеров «Illumina PE PCR primers» 1.0 и 2.0.CTC: For RNA-Seq profiling of CTC, a modified version of this protocol was used that used 500-700 ng of SMART-amplified cDNA, double-ended adapters were ligated, and PCR enrichment was performed with Illumina PE PCR primers 1.0 and 2.0.

Анализ данных NGS, генная экспрессия: Для определения значений экспрессии, выходные ряды последовательностей для образцов РНК, полученные с помощью «Illumina HiSeq 2000», предварительно обрабатывали согласно стандартному протоколу «Illumina». Анализ включает фильтрование низкокачественных ридов и разуплотнение. Для анализа транскриптома RNA-Seq риды последовательностей выравнивали относительно референсной геномной последовательности [Mouse Genome Sequencing Consortium. Initial sequencing and comparative analysis of the mouse genome. Nature, 420, 520-562 (2002)] с использованием «bowtie» (версия 0.12.5) [Langmead B. et al. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol 10:R25] с использованием параметров «-v2 –best» для выравниваний генома и параметров по умолчанию для выравниваний транскриптов. Координаты выравнивания сравнивали с координатами экзонов транскриптов RefSeq [Pruitt KD. et al. NCBI Reference Sequence (RefSeq): a curated non-redundant sequence database of genomes, transcripts and proteins. Nucleic Acids Res. 2005 Jan 1;33(Database issue):D501-4] и для каждого транскрипта количество перекрывающих выравниваний записывали. Риды последовательностей, которые не поддаются выравниванию с геномном последовательностью, выравнивали относительно базы данных всех возможных экзон-экзонных соединяющих последовательностей транскриптов RefSeq. Количество ридов, выровненных относительно границ сплайсинга, объединяли с количествами соответствующего транскрипта, полученного в предыдущей стадии и нормализовали по RPKM (количество ридов, на килобазу экзонной модели на миллион картированных ридов) (Mortazavi A et al., Nat Methods 2008;5:621-8). (2008). Mapping and quantifying mammalian transcriptomes by rna-seq. Nat Methods, 5(7):621-628]) для каждого транскрипта. Как значения экспрессии гена, так и значения экспрессии экзона рассчитывали на основании нормализованного количества ридов, перекрывающих каждый ген или экзон, соответственно. Analysis of NGS Data, Gene Expression: To determine expression values, Illumina HiSeq 2000 RNA sample output sequences were pre-processed according to standard Illumina protocol. The analysis includes filtering out low-quality reads and decompressing. For transcriptome analysis of RNA-Seq, sequence reads were aligned with a reference genomic sequence [Mouse Genome Sequencing Consortium. Initial sequencing and comparative analysis of the mouse genome. Nature, 420, 520-562 (2002)] using "bowtie" (version 0.12.5) [Langmead B. et al. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol 10:R25] using "-v2 --best" options for genome alignments and default options for transcript alignments. Alignment coordinates were compared with exon coordinates of RefSeq transcripts [Pruitt KD. et al. NCBI Reference Sequence (RefSeq): a curated non-redundant sequence database of genomes, transcripts and proteins. Nucleic Acids Res. 2005 Jan 1;33(Database issue):D501-4] and for each transcript the number of overlapping alignments was recorded. Sequence reads that did not align with the genomic sequence were aligned against a database of all possible exon-exon bridging sequences of the RefSeq transcripts. The number of reads aligned with the splicing boundaries were combined with the amounts of the corresponding transcript obtained in the previous step and normalized to RPKM (number of reads, per exon model kilobase per million reads mapped) (Mortazavi A et al., Nat Methods 2008;5:621- eight). (2008). Mapping and quantifying mammalian transcriptomes by rna-seq. Nat Methods, 5(7):621-628]) for each transcript. Both gene expression values and exon expression values were calculated based on the normalized number of reads overlapping each gene or exon, respectively.

Обнаружение мутаций, основанная часть опухоль: 50 нт одноконцевые риды «Illumina HiSeq 2000» выравнивали с помощью «bwa» (версия 0.5.8c) [Li H. and Durbin R. (2009) Fast and accurate short read alignment with Burrows-Wheeler Transform. Bioinformatics, 25:1754-60] с использованием настроек по умолчанию с эталонной сборкой мышиного генома mm9. Неопределенные риды - это те из ридов, которые картируются во множестве мест генома - удаляли, оставшиеся выравнивания сортировали, индексировали и конвертировали в бинарный и сжатый формат (BAM), а баллы качества ридов преобразовали из стандарта «Illumina» «phred+64» в баллы качества стандарта Сенгера с помощью сценариев оболочки.Mutation detection, tumor-based part: 50 nt Illumina HiSeq 2000 single-ended reads were aligned with bwa (version 0.5.8c) [Li H. and Durbin R. (2009) Fast and accurate short read alignment with Burrows-Wheeler Transform . Bioinformatics, 25:1754-60] using the default settings with the mm9 mouse genome reference assembly. Indeterminate reads - these are those of the reads that map to many places in the genome - were deleted, the remaining alignments were sorted, indexed and converted to binary and compressed format (BAM), and the quality scores of the reads were converted from the Illumina standard "phred + 64" to scores the quality of the Sanger standard using shell scripts.

Для каждой из секвенируемых дорожек идентифицировали мутации с помощью трех компьютерных программ: «samtools» (версия 0.1.8) [Li H. Improving SNP discovery by base alignment quality. Bioinformatics. 2011 Apr 15;27(8):1157-8. Epub 2011 Feb 13], GATK (version 1.0.4418) [McKenna A. et al. The Genome Analysis Toolkit: a MapReduce framework for analyzing next-generation DNA sequencing data. Genome Res. 2010 Sep;20(9):1297-303. Epub 2010 Jul 19], и «SomaticSniper» (http://genome.wustl.edu /software/somaticsniper). Для «samtools» использовали рекомендованные авторами настройки и критерии фильтра, включая фильтрацию первого раунда, максимально покрытие 200. Для второго раунда фильтрации «samtools» минимальный балл качества вставки-делеции был равен 50, минимальное качество точечной мутации было равно 30. Для прогноза мутаций «GATK», мы следовали разработанным авторами указаниям с наработанными рекомендациями, представленными в пользовательском руководстве «GATK» (http://www.broadinstitute.org/gsa/wiki/index.php/The_Genome_Analysis_Toolkit). Стадия рекалибровки балла качества варианта была опущена и заменена жесткой фильтрацией. Для присваивания мутаций с помощью «SomaticSniper» использовали параметры по умолчанию, и только прогнозируемые мутации с «соматическим баллом» равным 30 или больше рассматривали в дальнейшем.For each of the sequenced tracks, mutations were identified using three computer programs: "samtools" (version 0.1.8) [Li H. Improving SNP discovery by base alignment quality. bioinformatics. 2011 Apr 15;27(8):1157-8. Epub 2011 Feb 13], GATK (version 1.0.4418) [McKenna A. et al. The Genome Analysis Toolkit: a MapReduce framework for analyzing next-generation DNA sequencing data. Genome Res. 2010 Sep;20(9):1297-303. Epub 2010 Jul 19], and "SomaticSniper" (http://genome.wustl.edu/software/somaticsniper). For samtools, we used the settings and filter criteria recommended by the authors, including first round filtering, maximum coverage 200. For the second round of samtools filtering, the minimum insertion-deletion quality score was 50, the minimum point mutation quality was 30. For mutation prediction " GATK", we followed the guidelines developed by the authors with best practices presented in the GATK user guide (http://www.broadinstitute.org/gsa/wiki/index.php/The_Genome_Analysis_Toolkit). The variant quality score recalibration step was omitted and replaced with hard filtering. For assignment of mutations using "SomaticSniper" used the default parameters, and only predicted mutations with a "somatic score" equal to 30 or more were considered further.

Обнаружение мутаций, CTC: Согласно iCAM-способу для основной части опухоли, 50 нт одноконцевые риды «Illumina HiSeq 2000» выравнивали с помощью «bwa» (версия 0.5.8c) [5]) с использованием настроек по умолчанию по референсной сборке мышиного генома mm9. Поскольку риды CTC NGS получали из теста RNA-Seq, риды также выравнивали по последовательностям транскриптома, включая экзон-экзонные соединения, с использованием «bowtie» (выше). С использованием всех нуклеотидных последовательностей из ридов мы сравнили как референсный геном, так и мутации, полученные из основной части опухоли B16. Для отображения результатов идентифицированные мутации оценивали как с помощью скриптов Perl, так и вручную с помощью программного обеспечения «samtools» и «IGV» (Integrated Genome Viewer).Mutation detection, CTC: According to the iCAM method for the main part of the tumor, 50 nt single-ended "Illumina HiSeq 2000" reads were aligned with "bwa" (version 0.5.8c) [5]) using the default settings of the reference assembly of the mouse genome mm9 . Since the CTC NGS reads were generated from the RNA-Seq assay, the reads were also aligned for transcriptome sequences, including exon-exon junctions, using the "bowtie" (above). Using all nucleotide sequences from the reads, we compared both the reference genome and mutations derived from the main part of the B16 tumor. To display the results, the identified mutations were evaluated both using Perl scripts and manually using the "samtools" and "IGV" (Integrated Genome Viewer) software.

Выходным результатом «обнаружения мутаций» является идентификация соматических мутаций в опухолевых клетках, из образца – данные NGS – список мутаций. В образцах B16 мы идентифицировали 2448 соматических мутаций с помощью повторного секвенирования экзома.The output of "mutation detection" is the identification of somatic mutations in tumor cells, from the sample - NGS data - a list of mutations. In B16 samples, we identified 2448 somatic mutations using exome resequencing.

Приоритизация мутацийMutation prioritization

Затем мы продемонстрировали возможность конвейерной приоритезации мутаций для включения в вакцину. Этот способ, названный «конвейер детекции индивидуальных мутаций в злокачественной опухоли» (англ. individual cancer mutation detection pipeline, iCAM) идентифицирует и приоритезирует соматические мутации посредством серии стадий включения множества новейших алгоритмов и биоинформатических методов. Выходным результатом данного способа является перечень соматических мутаций, приоритезированных на основании вероятной иммуногенности. We then demonstrated the possibility of pipelined prioritization of mutations for inclusion in a vaccine. This method, called the "individual cancer mutation detection pipeline" (iCAM), identifies and prioritizes somatic mutations through a series of steps incorporating a variety of advanced algorithms and bioinformatics techniques. The output of this method is a list of somatic mutations prioritized based on likely immunogenicity.

Идентификация соматических мутаций: Мутации идентифицированы с помощью трех различных алгоритмов, как для образца B16, таки для образца Black6 (Обнаружение мутаций, выше). Первая стадия iCAM заключается в объединении выходных перечней каждого алгоритма для получения высокодостоверного перечня соматических мутаций. Варианты выдаваемые «GATK» и «samtools» в одном образце относительно референсного генома. Для выбора высокодостоверных мутаций с незначительным количеством ложноположительных результатов для данного образца (т.е. опухоли или нормы), мутации отбирали так, чтобы они были идентифицированы во всех репликах. Затем отбирали варианты, которые присутствуют в опухолевом образце, но не присутствуют в нормальном образце. «SomaticSniper» автоматически сообщает о потенциальных соматических вариациях из парных данных опухоли и нормы. Мы дополнительно отфильтровали результаты по пересечению результатов, полученных из реплик. Для удаления максимально возможного количества ложноположительных прогнозов, мы осуществили пересечение перечней мутаций, полученных путем применения всех алгоритмов ко всем репликам. Конечная стадия для каждой соматической мутации заключается в присвоении значения достоверности (p-значение) для каждой мутации на основании глубины покрытия, качества SNP, качества консенсуса и качества картирования.Identification of Somatic Mutations: Mutations were identified using three different algorithms for both sample B16 and sample Black6 (Mutation Detection, above). The first step of iCAM is to combine the output lists of each algorithm to obtain a highly reliable list of somatic mutations. Variants issued by "GATK" and "samtools" in the same sample relative to the reference genome. To select highly significant mutations with few false positives for a given sample (ie, tumors or normals), mutations were selected such that they were identified in all replicas. Then selected options that are present in the tumor sample, but not present in the normal sample. SomaticSniper automatically reports potential somatic variations from paired tumor and normal data. We additionally filtered the results by the intersection of the results obtained from the replicas. To remove as many false positives as possible, we crossed the mutation lists obtained by applying all algorithms to all replicas. The final step for each somatic mutation is to assign a confidence value (p-value) for each mutation based on coverage depth, SNP quality, consensus quality, and mapping quality.

Влияние мутации: влияние фильтрованных, консенсусных, соматических мутаций определяется скриптом в пределах конвейера детекции мутаций «iCaM». Во-первых, мутации, которые происходят в генетических областях, которые не являются уникальными в геноме, например, такие которые происходят в паралогах белков и в псевдогенах, исключены из анализа, поскольку риды последовательностей, которые выравниваются во множестве мест, удаляются. Во-вторых, определяется, происходит ли мутация в транскрипте. В-третьих, определяется происходит ли мутация в белок-кодирующей области. В-четвертых, последовательность транскрипта транслируется с или без мутации для определения, того, есть ли изменение в аминокислотной последовательности. Mutation Impact: The impact of filtered, consensus, somatic mutations is scripted within the iCaM mutation detection pipeline. First, mutations that occur in genetic regions that are not unique in the genome, such as those that occur in protein paralogs and pseudogenes, are excluded from the analysis because sequence reads that align in multiple places are removed. Second, it is determined whether a mutation occurs in the transcript. Third, it is determined whether the mutation occurs in the protein-coding region. Fourth, the transcript sequence is translated with or without mutation to determine if there is a change in the amino acid sequence.

Экспрессия мутации: конвейер iCAM выбирает соматические мутации, которые обнаружены в генах и экзонах, которые экспрессируются в опухолевых клетках. Уровни экспрессии определяются по NGS-данным RNA-Seq опухолевых клеток (выше). Количество ридов, которые перекрывают ген и экзон указывает на уровни экспрессии. Эти количества нормализуются относительно RPKM (количество ридов, на килобазу экзонной модели на миллион картированных ридов) [Mortazavi A. et al. Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nat Methods. 2008 Jul;5(7):621-8. Epub 2008 May 30]) и те, которые экспрессируются выше 10 RPKM, отбираются.Mutation Expression: The iCAM pipeline selects somatic mutations that are found in genes and exons that are expressed in tumor cells. Expression levels are determined from the NGS data of RNA-Seq of tumor cells (above). The number of reads that overlap the gene and exon indicates levels of expression. These numbers are normalized to RPKM (number of reads, per exon model kilobase per million mapped reads) [Mortazavi A. et al. Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nat Methods. 2008 Jul;5(7):621-8. Epub 2008 May 30]) and those expressed above 10 RPKM are selected.

Связывание MHC: для определения вероятности того, что эпитоп, содержащий мутированный пептид, связывается с молекулой MHC, конвейер iCAM запускается в модифицированной версии программного обеспечения для MHC-прогноза из «Immune Epitope Database» (http://www.iedb.org/). Локальная установка включает модификации для оптимизации потока данных через алгоритм. Для данных B16 и Black6, прогноз был запущен с помощью всех доступных аллелей black6 MHC класса I и всех эпитопов для соответствующих длин пептидов. Мутации выбирают таким образом, чтобы они находились в эпитопе, который входит в 95% процентиль распределения балла прогноза тренировочных данных IEDB (http://mhcbindingpredictions.immuneepitope.org/dataset.html), учитывая все аллели MHC и все потенциальные эпитопы, перекрывающие мутацию. MHC Binding: To determine the likelihood that an epitope containing a mutated peptide binds to an MHC molecule, the iCAM pipeline is run in a modified version of the MHC prediction software from the Immune Epitope Database (http://www.iedb.org/) . The local installation includes modifications to optimize the flow of data through the algorithm. For B16 and Black6 data, prediction was run with all available MHC class I black6 alleles and all epitopes for the respective peptide lengths. Mutations are chosen to be in an epitope that is in the 95% percentile distribution of the IEDB training data prediction score (http://mhcbindingpredictions.immuneepitope.org/dataset.html), considering all MHC alleles and all potential mutation-overlapping epitopes .

Критерий выбора мутации: соматические мутации выбирают по следующим критериям: а) имеющие уникальное содержимое последовательности, b) идентифицированные всеми тремя программами, с) высокая достоверность мутации, d) несинонимичное изменение белка, e) высокий уровень экспрессии транскрипта, f) и прогноз связывания с подходящим MHC класса I.Mutation Selection Criteria: Somatic mutations are selected according to the following criteria: a) having unique sequence content, b) identified by all three programs, c) high mutation certainty, d) non-synonymous protein change, e) high level of transcript expression, f) and prediction of binding to suitable MHC class I.

Выходным результатом данного способа является перечень соматических мутаций, приоритезированных на основании вероятной иммуногенности. В клетках меланомы B16 присутствует 2448 соматических мутаций. 1247 из этих мутаций обнаружены в генных транскриптах. Их них 734 вызывают несинонимичные изменения в белках. Из них 149 находятся в генах, экспрессируемых в опухолевых клетках. Из этих экспрессирующих несинонимичные мутации, 102, согласно прогнозу, присутствуют на молекулах MHC. Эти 102 вероятные иммуногенные мутации затем проходят через стадию подтверждения мутаций (ниже).The output of this method is a list of somatic mutations prioritized based on likely immunogenicity. There are 2448 somatic mutations in B16 melanoma cells. 1247 of these mutations were found in gene transcripts. Of these, 734 cause non-synonymous changes in proteins. Of these, 149 are found in genes expressed in tumor cells. Of these expressing non-synonymous mutations, 102 are predicted to be present on MHC molecules. These 102 probable immunogenic mutations then go through a mutation confirmation step (below).

Подтверждение мутацийMutation confirmation

Соматические мутации из повторно секвенированного ДНК-экзома подтверждали любым из двух способов, повторного секвенирования мутированной области и анализ RNA-Seq.Somatic mutations from the resequenced DNA exome were confirmed by either of two methods, resequencing of the mutated region and RNA-Seq analysis.

Для подтверждения мутаций повторным секвенированием, геномную область, содержащую мутацию, амплифицировали стандартным ПЦР из 50 нг как опухолевой ДНК, так и нормальной контрольной ДНК. Размер амплифицированных продуктов находился в диапазоне 150-400 нт. Специфичность реакции контролировали загрузкой продукта ПЦР на устройство «Qiaxel» («Qiagen»). Продукты ПЦР очищали с помощью набора для очистки «minElute PCR purification kit» («Qiagen»). Специфичные продукты ПЦР секвенировали стандартным способом секвенирования по Сэнгеру («Eurofins»), с последующим анализом электрофореграмм.To confirm the mutations by resequencing, the genomic region containing the mutation was amplified by standard PCR from 50 ng of both tumor DNA and normal control DNA. The size of the amplified products was in the range of 150-400 nt. The specificity of the reaction was controlled by loading the PCR product onto a Qiaxel device (Qiagen). PCR products were purified using a minElute PCR purification kit (Qiagen). Specific PCR products were sequenced using the standard Sanger sequencing method (Eurofins), followed by electrophoregram analysis.

Подтверждение мутации также было выполнено проверкой опухолевой РНК. Значения экспрессии опухолевых генов и экзонов получали из RNA-Seq (NGS-секвенирование РНК), путем картирования нуклеотидных последовательностей на транскриптах и их подсчета. Мы проверили сами данные последовательностей для идентификации мутаций в опухолевом образце [Berger MF. et al. Integrative analysis of the melanoma transcriptome. Genome Res. 2010 Apr;20(4):413-27. Epub 2010 Feb 23], тем самым обеспечив независимое подтверждение идентифицированных соматических мутаций, полученных из ДНК.Mutation confirmation was also performed by testing for tumor RNA. Tumor gene and exon expression values were obtained from RNA-Seq (NGS RNA sequencing), by mapping nucleotide sequences on transcripts and counting them. We tested the sequence data itself to identify mutations in the tumor sample [Berger MF. et al. Integrative analysis of the melanoma transcriptome. Genome Res. 2010 Apr;20(4):413-27. Epub 2010 Feb 23], thereby providing independent confirmation of identified somatic mutations derived from DNA.

Таблица 1. Перечень генов, содержащих 50 проверенных мутацийTable 1. List of genes containing 50 verified mutations

Гены, содержащие 50 идентифицированных и подтвержденных соматических мутаций, с аннотацией относительно символа гена, названия гена и прогнозированной локализации и функции.Genes containing 50 identified and confirmed somatic mutations, annotated with gene symbol, gene name, and predicted location and function.

Figure 00000003
Figure 00000003

Figure 00000004
Figure 00000004

Figure 00000005
Figure 00000005

Пример 2. Алгоритм отбора IVAC позволяет осуществить детекцию иммуногенных мутацийExample 2 IVAC Selection Algorithm Allows Detection of Immunogenic Mutations

Для того, чтобы исследовать, можно ли индуцировать специфичные Т-клеточные ответы против подтвержденных мутаций клеток меланомы B16F10, не подвергавшиеся обработкам мыши C57BL/6 (n=5/пептид) иммунизировали дважды (d0, d7) подкожно 100 мкг пептида (+ 50 мкг полиI:C в качестве адъюванта), содержащего либо мутированную ак последовательность, либо ак последовательность дикого типа (см. таблицу 2). Все пептиды имеют длину 27 ак с мутированной ак/ак дикого типа в центральном положении. На 12 день мышей умерщвляли и собирали клетки селезенки. Для считывания данных использовали способ «IFNγ ELISpot» с 5x105 клетками селезенки/лунку в качестве эффекторов, и 5x104 дендритных клеток костного мозга, загруженных пептидами (2 мкг/мл) в качестве клеток-мишеней. Эффекторные клетки селезенки тестировали против мутированного пептида, пептида дикого типа и контрольного пептида (нуклеопротеина вируса везикулярного стоматита, VSV-NP). To investigate whether specific T cell responses could be induced against confirmed B16F10 melanoma cell mutations, untreated C57BL/6 mice (n=5/peptide) were immunized twice (d0, d7) subcutaneously with 100 µg of peptide (+50 µg polyI:C as an adjuvant) containing either a mutated a sequence or a wild type a sequence (see Table 2). All peptides are 27 aa long with a wild-type mutated aa/a in the central position. On day 12, mice were sacrificed and spleen cells were harvested. Data were read using the IFNγ ELISpot method with 5x10 5 spleen cells/well as effectors and 5x10 4 bone marrow dendritic cells loaded with peptides (2 μg/ml) as target cells. Spleen effector cells were tested against the mutated peptide, wild-type peptide and control peptide (vesicular stomatitis virus nucleoprotein, VSV-NP).

На 44 протестированных последовательностях мы наблюдали, что 6 из них индуцируют Т-клеточный иммунитет, направленный только против мутированной последовательности, но не против пептида дикого типа (фиг. 3). On the 44 sequences tested, we observed that 6 of them induce T-cell immunity directed only against the mutated sequence but not against the wild-type peptide (FIG. 3).

Данные доказывают, что идентифицированные и приоритезированные мутации могут быть использованы для индукции опухоль-специфичного Т-клеточного иммунитета после применения в качестве пептидной вакцины в необработанных антигеном мышах.The data prove that the identified and prioritized mutations can be used to induce tumor-specific T-cell immunity after application as a peptide vaccine in untreated mice.

Figure 00000006
Figure 00000006

Пример 3. Идентифицированные мутации могут обеспечивать терапевтический противоопухолевый иммунитетExample 3 Identified Mutations Can Confer Therapeutic Antitumor Immunity

Для проверки наличия у идентифицированных мутаций способности наделять противоопухолевым иммунитетом после вакцинации интактных мышей мы исследовали этот вопрос с пептидом № 30, который, как было показано, индуцирует селективную в отношении мутации T-клеточную реактивность. Клетки B16F10 (7,5 x 104) инокуровали подкожно в d0. Мышей вакцинировали пептидом 30 (см. таблицу 1; 100 мкг пептид + 50 мкг ПолиI:C п.к.) в день - 4, день + 2 и день + 9. Контрольная группа получала только Поли I:C (50 мкг п.к.). Рост опухоли отслеживали каждый второй день. На день +16 мы обнаружили, что только у 1 из 5 мышей в группе пептидной вакцины развилась опухоль, тогда как в контрольной группе у 4 из 5 мышей, был показан рост опухоли. To test for the ability of the identified mutations to confer anti-tumor immunity after vaccination of intact mice, we investigated this issue with peptide no. 30, which has been shown to induce mutation-selective T-cell reactivity. B16F10 cells (7.5 x 10 4 ) were inoculated subcutaneously in d0. Mice were vaccinated with peptide 30 (see Table 1; 100 µg peptide + 50 µg Poly I:C sc) on day - 4, day + 2 and day + 9. The control group received only Poly I:C (50 µg s.p.). to.). Tumor growth was monitored every other day. On day +16 we found that only 1 out of 5 mice in the peptide vaccine group developed a tumor, while in the control group 4 out of 5 mice showed tumor growth.

Данные доказывают, что пептидная последовательность, включающая B16F10-специфичную мутацию, может наделять противоопухолевым иммунитетом, который эффективно способен разрушать опухолевые клетки (см. фиг. 4). Поскольку B16F10 является сильноагрессивной опухолевой клеточной линией, то обнаружение того, что методология, примененная для идентификации и приоритетизации мутаций в конечном счете приводит к отбору мутации, которая сама по себе уже является эффективной в качестве вакцины, является важным доказательством концепции всего этого процесса.The data prove that a peptide sequence comprising a B16F10-specific mutation can confer anti-tumor immunity that is effectively capable of destroying tumor cells (see FIG. 4). Because B16F10 is a highly aggressive tumor cell line, the discovery that the methodology used to identify and prioritize mutations ultimately leads to the selection of a mutation that is already effective as a vaccine on its own is an important proof of concept for this entire process.

Пример 4. Данные поддерживающие полиэпитопную антигенную презентациюExample 4 Data supporting polyepitope antigen presentation

Проверенные мутации из белок-кодирующих областей пациента, составляют пул, из которого могут быть выбраны кандидаты для сборки шаблона вакцины с полинеоэпитопом для использования в качестве предшественника для GMP-изготовления РНК-вакцины. Подходящие в качестве вакцинного каркаса векторные кассеты уже были описаны (Holtkamp, S. et al., Blood, 108: 4009-4017, 2006; Kreiter, S. et al., Cancer Immunol. Immunother., 56: 1577-1587, 2007; Kreiter, S. et al., J.Immunol., 180: 309-318, 2008). Предпочтительные векторные кассеты модифицированы в их кодирующих и нетранслируемых областях (UTR) и обеспечивают максимизированную трансляцию кодируемого белка в течение длительных периодов времени (Holtkamp, S. et al., Blood, 108: 4009-4017, 2006; Kuhn, A. N. et al., Gene Ther., 17: 961-971, 2010). Кроме того, векторный каркас содержит антиген-направляющие модули для одновременной экспансии как цитотоксичных, так и хэлперных Т-клеток (Kreiter, S. et al., Cancer Immunol. Immunother., 56: 1577-1587, 2007; Kreiter, S. et al., J. Immunol., 180: 309-318, 2008; Kreiter, S. et al., Cancer Research, 70 (22), 9031-9040, 2010 (фиг. 5). Важно отметить, что мы доказали, что такая РНК-вакцина может быть использована для презентации множества эпитопов MHC класса I и II одновременно. Tested mutations from the patient's protein coding regions constitute a pool from which candidates can be selected to assemble a polyneoepitope vaccine template for use as a precursor for GMP RNA vaccine fabrication. Suitable vector cassettes as a vaccine scaffold have already been described (Holtkamp, S. et al., Blood, 108: 4009-4017, 2006; Kreiter, S. et al., Cancer Immunol. Immunother., 56: 1577-1587, 2007 ; Kreiter, S. et al., J. Immunol., 180: 309-318, 2008). Preferred vector cassettes are modified in their coding and untranslated regions (UTRs) and maximize translation of the encoded protein over long periods of time (Holtkamp, S. et al., Blood, 108: 4009-4017, 2006; Kuhn, A. N. et al., Gene Ther., 17: 961-971, 2010). In addition, the vector scaffold contains antigen targeting modules for the simultaneous expansion of both cytotoxic and helper T cells (Kreiter, S. et al., Cancer Immunol. Immunother., 56: 1577-1587, 2007; Kreiter, S. et al., J. Immunol., 180: 309-318, 2008; Kreiter, S. et al., Cancer Research, 70 (22), 9031-9040, 2010 (Fig. 5) Importantly, we have shown that that such an RNA vaccine can be used to present multiple MHC class I and II epitopes simultaneously.

IVAC последовательности РНК-вакцины с полинеоэпитопом построены с участка вплоть до 30 аминокислот, которые включают мутации в центре. Эти последовательности соединены голова-к-хвосту через короткие линкеры для образования вакцины с полинеоэпитопом, кодирующей вплоть до 30 или большего количества выбранных мутаций и фланкирующие их области. Эти пациент-специфичные индивидуально оптимизированные вставки являются кодон-оптимизированными и клонированными в РНК-каркас, описанный выше. Контроль качества таких конструктов включает in vitro транскрипцию и экспрессию в клетках для проверки функциональной транскрипции и трансляции. Анализ трансляции будет осуществлен с антителами против с-концевого направляющего домена.The IVAC sequences of the polyneoepitope RNA vaccine are constructed from a stretch of up to 30 amino acids, which include mutations in the center. These sequences are connected head-to-tail via short linkers to form a polyneoepitope vaccine encoding up to 30 or more selected mutations and their flanking regions. These patient-specific individually optimized inserts are codon-optimized and cloned into the RNA scaffold described above. Quality control of such constructs includes in vitro transcription and expression in cells to test for functional transcription and translation. Translation analysis will be performed with antibodies against the c-terminal targeting domain.

Пример 5. Научная проверка концепции для РНК-конструкта с поли-нео эпитопомExample 5 Scientific proof of concept for an RNA construct with a poly-neo epitope

Концепция РНК с поли-нео эпитопом основана на длинной мРНК, транскрибированной in vitro, которая состоит из последовательно соединенных последовательностей, кодирующих мутированные пептиды, соединенные линкерными последовательностями (см. фиг. 6). Кодирующие последовательности выбирают из несинонимичных мутаций, и в них всегда встроен кодон для мутированной аминокислоты, фланкированной областями от 30 до 75 пар оснований из контекста исходной последовательности. Линкерная последовательность кодирует аминокислоты, которые предпочтительно не обрабатываются клеточной машинерией процессирования антигена. The concept of poly-neo epitope RNA is based on a long mRNA transcribed in vitro, which consists of contiguous sequences encoding mutated peptides connected by linker sequences (see Fig. 6). Coding sequences are selected from non-synonymous mutations and always have a codon inserted for the mutated amino acid flanked by regions of 30 to 75 base pairs from the context of the original sequence. The linker sequence encodes amino acids that are preferably not processed by the cellular antigen processing machinery.

In vitro транскрибируемые конструкты основаны на векторе pST1-A120, содержащем T7-промотор, тандем бета-глобулиновой 3’ UTR последовательности и 120 п.о. поли(А) хвост, которые был показаны как увеличивающие стабильность и трансляционную эффективность РНК, способность кодируемого антигена стимулировать Т-клетки (Holtkamp S. et al., Blood 2006; PMID: 16940422). Кроме того, были вставлены фрагмент сигнального пептида MHC класса I и трансмембранный и цитозольный домены, включая стоп-кодон (сигнал направленной миграции MHC класса I или MITD), фланкированные полилинкерной последовательностью для клонирования эпитопов (Kreiter S. et al., J. Immunol., 180: 309-318, 2008). Было показано, что последние увеличивают презентацию антигена, тем самым усиливая экспансию антигенспецифичных CD8+ и CD4+ T-клеток и улучшая эффекторные функции.The in vitro transcribed constructs are based on the pST1-A120 vector containing the T7 promoter, a tandem beta-globulin 3' UTR sequence, and a 120 bp poly(A) tail, which have been shown to increase the stability and translational efficiency of RNA, the ability of the encoded antigen to stimulate T cells (Holtkamp S. et al., Blood 2006; PMID: 16940422). In addition, a fragment of the MHC class I signal peptide and transmembrane and cytosolic domains were inserted, including a stop codon (MHC class I or MITD directed migration signal), flanked by a polylinker sequence for epitope cloning (Kreiter S. et al., J. Immunol. , 180: 309-318, 2008). The latter have been shown to increase antigen presentation, thereby enhancing the expansion of antigen-specific CD8+ and CD4+ T cells and improving effector functions.

Для первой проверки концепции, использовались биэпитопные векторы, т.е. кодирующие один полипептид, содержащий два мутированных эпитопа. Кодон-оптимизированные последовательности, кодирующие (i) мутированный эпитоп из 20-50 аминокислот, (ii) глицин/серин-богатый линкер, (iii) второй мутированный эпитоп из 20-50 аминокислот, и (iv) дополнительный глицин/серин-богатый линкер, фланкированный соответствующими участками распознавания рестрикционными эндонуклеазами, для клонирования в конструкт на основе pST1, описанный выше - были спроектированы и синтезированы коммерческим поставщиком («Geneart», Регенсбург, Германия). После проверки последовательности, их клонировали в векторный каркас на основе pST1 для получения конструктов, как изображено на фиг. 6.For the first proof of concept, bi-epitope vectors were used, i.e. encoding one polypeptide containing two mutated epitopes. Codon-optimized sequences encoding (i) a mutated epitope of 20-50 amino acids, (ii) a glycine/serine-rich linker, (iii) a second mutated epitope of 20-50 amino acids, and (iv) an additional glycine/serine-rich linker , flanked by appropriate restriction endonuclease recognition sites for cloning into the pST1 construct described above, were designed and synthesized by a commercial vendor (Geneart, Regensburg, Germany). After sequence verification, they were cloned into a pST1-based vector framework to obtain constructs as shown in FIG. 6.

Плазмиды на основе pST1-A120, описанные выше, были линеаризованы рестрикционной эндонуклеазой класса IIs. ДНК линеаризованных плазмид очищали экстракцией фенол/хлороформом и осаждением этанолом. Количество линеаризованной векторной ДНК оценивали спектрофотометрически и подвергали in vitro транскрипции фактически также, как описано у Pokrovskaya and Gurevich (1994, Anal. Biochem. 220: 420-423). Для получения РНК с соответствующим образом модифицированными 5'-кэпирующими структурами в реакцию транскрипции был добавлен кэпирующий аналог. В реакциях GTP присутствовал в концентрации 1,5 мМ, тогда как кэпирующий аналог присутствовал в концентрации 6,0 мМ. Все другие NTP присутствовали в концентрации 7,5 мМ. В конце реакции транскрипции линеаризованную векторную ДНК расщепляли 0,1 Ед./мкл TURBO ДНКазы («Ambion», Аустин/Техас, США) в течение 15 минут при 37°C. РНК очищали из этих реакций с помощью набора «MEGAclear Kit» («Ambion», Аустин/Техас, США) согласно протоколу изготовителя. Концентрацию и количество РНК оценивали спектрофотометрически и анализировали на «Bioanalyzer 2100» («Agilent», Санта-Клара, Калифорния, США).The pST1-A120 based plasmids described above were linearized with class IIs restriction endonuclease. The DNA of the linearized plasmids was purified by phenol/chloroform extraction and ethanol precipitation. The amount of linearized vector DNA was assessed spectrophotometrically and subjected to in vitro transcription in virtually the same way as described by Pokrovskaya and Gurevich (1994, Anal. Biochem. 220: 420-423). To obtain RNA with appropriately modified 5'-capping structures, a capping analog was added to the transcription reaction. In the reactions, GTP was present at a concentration of 1.5 mM, while the capping analog was present at a concentration of 6.0 mM. All other NTPs were present at 7.5 mM. At the end of the transcription reaction, the linearized vector DNA was digested with 0.1 U/μl of TURBO DNase (Ambion, Austin/Texas, USA) for 15 minutes at 37°C. RNA was purified from these reactions using the MEGAclear Kit (Ambion, Austin/Texas, USA) according to the manufacturer's protocol. The concentration and amount of RNA was estimated spectrophotometrically and analyzed on a Bioanalyzer 2100 (Agilent, Santa Clara, CA, USA).

Для проверки того, что последовательность, в которую включена мутированная аминокислота, и которая фланкирована как по 5'- так и по 3'-концу линкерной последовательностью, может быть процессирована, презентирована и распознана антиген-специфичными Т-клетками, мы использовали Т-клетки из вакцинированных пептидом мышей в качестве эффекторных клеток. В «IFNγ ELISpot» мы протестировали способность Т-клеток, индуцированных пептидной вакцинацией, как описано выше, распознавать клетки-мишени (дендритные клетки костного мозга, BMDC), активированные либо пептидом (2 мкг/мл, в течение 2 часов при 37°C и 5% CO2) либо трансфецированные РНК (20 мкг, полученной, как описано выше) с помощью электропорации. Как пояснено примером на фиг. 7, для мутации 12 и 30 (см. таблицу 2) мы можем наблюдать, что РНК-конструкт способен привести к возникновению эпитопа, распознаваемого специфичными по мутации Т-клетками. We used T from mice vaccinated with the peptide as effector cells. In the IFNγ ELISpot, we tested the ability of T cells induced by peptide vaccination as described above to recognize target cells (bone marrow dendritic cells, BMDC) activated with either the peptide (2 μg/mL, for 2 hours at 37°C and 5% CO 2 ) or transfected RNA (20 µg, prepared as described above) by electroporation. As illustrated by the example in FIG. 7, for mutations 12 and 30 (see Table 2), we can observe that the RNA construct is able to give rise to an epitope recognized by mutation-specific T cells.

С представленными данными мы могли бы продемонстрировать, что РНК, кодирующая полинеоэпитоп, включая глицин/серин богатый линкер может быть транслирована и процессирована в антигенпрезентирующих клетках, что приводит к презентации корректного эпитопа, который распознается антиген-специфичными Т-клетками. With the data presented, we could demonstrate that an RNA encoding a polyneoepitope including a glycine/serine rich linker can be translated and processed in antigen-presenting cells, resulting in the presentation of the correct epitope that is recognized by antigen-specific T cells.

Пример 6. Проектирование вакцины с полинеоэпитопом - Необходимость линкераExample 6 Polyneoepitope Vaccine Design - Need for a Linker

РНК-конструкт с полинеоэпитопом содержит каркасный конструкт, в который помещено множество пептидов, кодируемых соматическими мутациями, соединенных с последовательностью линкерного пептида. В дополнение к оптимизации кодонов и повышению стабильности РНК и трансляционной эффективности каркасом, одно воплощение РНК вакцины с полинеоэпитопом включает линкеры, спроектированные для увеличения презентации MHC I и II класса антигенных пептидов и уменьшения презентации вредных эпитопов.The polyneoepitope RNA construct contains a scaffold construct containing a plurality of peptides encoded by somatic mutations linked to a linker peptide sequence. In addition to optimizing codons and improving RNA stability and translational efficiency of the scaffold, one embodiment of the polyneoepitope RNA vaccine includes linkers designed to increase the presentation of MHC class I and II antigenic peptides and reduce the presentation of detrimental epitopes.

Линкер: последовательность линкера была спроектирована для соединения множества содержащих мутации пептидов. Линкер должен позволять образование и презентацию мутированного эпитопа, при этом мешая образованию вредных эпитопов, таких как те, что образованы стыком между соседними пептидами или между линкерной последовательностью и эндогенными пептидами. Эти «соединительные» эпитопы могут не только конкурировать с целевыми эпитопами за презентацию на клеточной поверхности, снижая эффективность вакцины, но также могут приводить к нежелательной аутоиммунной реакции. Таким образом, мы разработали линкерную последовательность для того, чтобы а) избежать образования «соединительных» пептидов, которые связываются с молекулами MHC, b) избежать образования «соединительных» пептидов протеасомальным процессированием, с) осуществить эффективную трансляцию и процессирование протеосомой.Linker: The linker sequence has been designed to connect multiple mutated peptides. The linker should allow the formation and presentation of the mutated epitope while interfering with the formation of detrimental epitopes such as those formed by the junction between adjacent peptides or between the linker sequence and endogenous peptides. These "junction" epitopes may not only compete with the target epitopes for cell surface presentation, reducing vaccine efficacy, but may also lead to an unwanted autoimmune reaction. Thus, we designed the linker sequence in order to a) avoid the formation of "junction" peptides that bind to MHC molecules, b) avoid the formation of "junction" peptides by proteasomal processing, c) achieve efficient translation and processing by the proteasome.

Для того чтобы избежать образования «соединительных» пептидов, которые связываются с молекулами MHC, мы сравнивали различные линкерные последовательности. Глицин, например, ингибирует сильное связывание в связывающей бороздке MHC [Abastado JP. et al., J Immunol. 1993 Oct 1;151(7): 3569-75]. Мы проверили множество последовательностей линкеров и множество длин линкеров и рассчитали количество «соединительных» пептидов, которые связывают молекулы MHC. Мы использовали инструменты программного обеспечения «Immune Epitope Database» (IEDB, http://www.immuneepitope.org/) для расчета вероятности того, что данная пептидная последовательность содержит лиганд, который будет связывать молекулы MHC класса I. In order to avoid the formation of "connector" peptides that bind to MHC molecules, we compared different linker sequences. Glycine, for example, inhibits strong binding in the binding groove of the MHC [Abastado JP. et al., J Immunol. 1993 Oct 1;151(7): 3569-75]. We tested many linker sequences and many linker lengths and calculated the number of "connector" peptides that bind MHC molecules. We used the Immune Epitope Database (IEDB, http://www.immuneepitope.org/) software tools to calculate the probability that a given peptide sequence contains a ligand that will bind MHC class I molecules.

В модели B16, мы идентифицировали 102 экспрессируемых несинонимичных соматических мутации, которые, согласно прогнозу, будут презентироваться на молекуле MHC класса I. Используя 50 подтвержденных мутаций, мы путем вычислений спроектировали различные вакцинные продукты, при этом либо не использовали линкеры, либо использовали линкеры различных длин, и рассчитали количество вредных «соединительных» пептидов с помощью алгоритма IEDB (фиг. 8).In model B16, we identified 102 expressed non-synonymous somatic mutations that were predicted to be presented on the MHC class I molecule. Using 50 confirmed mutations, we calculated various vaccine products using either no linkers or different linker lengths. , and calculated the number of detrimental "junction" peptides using the IEDB algorithm (Fig. 8).

В таблице 5 показаны результаты нескольких различных линкеров, различных длин линкеров, и результаты без линкера и с пятью линкерами. Количество MHC-связывающих соединяющих пептидов находится в диапазоне от 2 до 91 для прогнозируемых данных для 9 ак и 10 ак эпитопов (вверху и внизу). Размер линкера влияет на количество соединяющих пептидов (внизу). Для этой последовательности наименьшие 9 ак эпитопы спрогнозированы для 7 ак линкерной последовательности GGSGGGG.Table 5 shows the results of several different linkers, various linker lengths, and results with no linker and with five linkers. The number of MHC binding bridging peptides ranges from 2 to 91 for predicted data for 9 aa and 10 aa epitopes (top and bottom). Linker size affects the number of linking peptides (bottom). For this sequence, the smallest 9 aa epitopes were predicted for the 7 aa linker sequence GGSGGGG.

Линкер 1 и Линкер 2, используемые в конструктах полинеоэпитопной РНК-вакцины, протестированной экспериментально (см. ниже) также имеют выгодно низкое количество прогнозируемых соединяющих неоэпитопов. Это справедливо для прогнозов 9-меров и 10-меров.Linker 1 and Linker 2 used in the experimentally tested polyneoepitope RNA vaccine constructs (see below) also have advantageously low predicted linking neoepitopes. This is true for 9-measure and 10-measure predictions.

Это говорит о том, что последовательность линкера критически важна для образования плохих MHC-связывающих эпитопов. Более того, длина линкерной последовательности влияет на количество плохих MHC-связывающих эпитопов. Мы обнаружили, что последовательности, которые являются G-богатыми, препятствуют образованию MHC-связывающих лигандов. This suggests that the linker sequence is critical for the formation of poor MHC-binding epitopes. Moreover, the length of the linker sequence affects the number of bad MHC-binding epitopes. We found that sequences that are G-rich prevent the formation of MHC-binding ligands.

Таблица 3. Влияние Линкера (10 ак эпитопы)Table 3. Linker effect (10 aa epitopes)

Спрогнозированное количество плохих эпитопов, определенных как эпитопы, связывающиеся с MHC класса I, которые содержат соединяющие последовательности, для каждого пептидного линкера. Здесь рассматриваются 10 аминокислотные эпитопы. Глицин-богатые линкеры содержат меньше всего «соединительных» эпитопов.The predicted number of bad epitopes, defined as class I MHC-binding epitopes that contain bridging sequences, for each peptide linker. 10 amino acid epitopes are considered here. Glycine-rich linkers contain the fewest "connecting" epitopes.

Figure 00000007
Figure 00000007

Таблица 4. Влияние части Линкера (9 ак эпитопы)Table 4. Effect of the Linker part (9 aa epitopes)

Спрогнозированое количество плохих эпитопов, определенных как эпитопы, связывающиеся с MHC класса I, которые содержат соединительные последовательности, для каждого пептидного линкера. Здесь рассматриваются 9 аминокислотные эпитопы. Глицин-богатые линкеры содержат меньше всего «соединительных» эпитопов.The predicted number of bad epitopes, defined as MHC class I binding epitopes that contain junction sequences, for each peptide linker. 9 amino acid epitopes are considered here. Glycine-rich linkers contain the fewest "connecting" epitopes.

Figure 00000008
Figure 00000008

Таблица 5. Влияние Части ЛинкераTable 5. Influence of the Linker Part

Спрогнозированое количество плохих эпитопов, определенных как эпитопы, связывающиеся с MHC класса I, которые содержат соединительные последовательности, для каждого пептидного линкера. Здесь рассматриваются 9 аминокислотные эпитопы. Вверху: количество 9 ак соединительных эпитопов без линкера и с 5 различными линкерами. Посередине: количество 100 ак соединительных эпитопов без линкера и с 5 различными линкерами. Внизу: количество 99 ак соединительных эпитопов для похожих линкеров различной длины. Глицин-богатые линкеры содержат меньше всего соединительных эпитопов.The predicted number of bad epitopes, defined as MHC class I binding epitopes that contain junction sequences, for each peptide linker. 9 amino acid epitopes are considered here. Top: number of 9 aa junction epitopes without a linker and with 5 different linkers. Middle: number of 100 aa junction epitopes without linker and with 5 different linkers. Bottom: Number of 99 aa junction epitopes for similar linkers of various lengths. Glycine-rich linkers contain the fewest connecting epitopes.

Figure 00000009
Figure 00000009

Figure 00000010
Figure 00000010

Для того чтобы избежать протеосомального процессирования, в результате которой могут образоваться «соединительные» пептиды, мы исследовали применение различных аминокислот в линкере. Глицин-богатые последовательности ухудшают протеосомальное процессирование [Hoyt MA et al. (2006). EMBO J 25 (8): 1720–9; Zhang M. and Coffino P. (2004) J Biol Chem 279 (10): 8635–41]. Таким образом, действие глицин-богатых линкерных последовательностей основано на минимизации количества линкер-содержащих пептидов, которые могут быть процессированы протеасомой.In order to avoid proteosomal processing, which may result in the formation of "junction" peptides, we investigated the use of different amino acids in the linker. Glycine-rich sequences impair proteosomal processing [Hoyt MA et al. (2006). EMBO J 25(8): 1720–9; Zhang M. and Coffino P. (2004) J Biol Chem 279 (10): 8635–41]. Thus, the action of glycine-rich linker sequences is based on minimizing the amount of linker-containing peptides that can be processed by the proteasome.

Линкер должен позволять содержащим мутации пептидам эффективно транслироваться и процессироваться протеасомой. Аминокислоты глицин и серин являются гибкими [Schlessinger A and Rost B., Proteins. 2005 Oct 1;61(1):115-26]; их включение в линкеры приводит к получению более гибкого белка. Мы включили глицин и серин в линкер для увеличения гибкости белка, который должен позволить более эффективно транслировать и процессировать протеасомой, что в свою очередь позволяет дать лучший доступ к кодируемым антигенным пептидам. The linker must allow the mutated peptides to be efficiently translated and processed by the proteasome. The amino acids glycine and serine are flexible [Schlessinger A and Rost B., Proteins. 2005 Oct 1;61(1):115-26]; their incorporation into linkers results in a more flexible protein. We included glycine and serine in the linker to increase the flexibility of the protein, which should allow for more efficient translation and processing by the proteasome, which in turn allows better access to encoded antigenic peptides.

Таким образом, линкер должен быть глицин богатым для того, чтобы препятствовать связыванию с MHC плохих эпитопов; должен препятствовать способности протеасомы процессировать линкерные пептиды, что может быть осуществлено включением глицина; и должен быть гибким для увеличения доступа к пептидам, содержащим мутации, что может быть осуществлено через комбинацию аминокислот глицина и серина. Следовательно, в одном воплощении вакцинного конструкта изобретения, последовательности GGSGGGGSGG и GGSGGGSGGS предпочтительно включены в качестве линкерных последовательностей. Thus, the linker must be glycine rich in order to prevent bad epitopes from binding to the MHC; should interfere with the ability of the proteasome to process linker peptides, which can be done by incorporating glycine; and should be flexible to increase access to peptides containing mutations, which can be done through a combination of the amino acids glycine and serine. Therefore, in one embodiment of the vaccine construct of the invention, the sequences GGSGGGGSGG and GGSGGGSGGS are preferably included as linker sequences.

Пример 7. РНК-вакцина с полинеоэпитопом Example 7 Polyneoepitope RNA Vaccine

РНК-конструкты с полинеоэпитопом основаны на векторе pST1-A120, содержащем T7 промотор, тандем 3' UTR последовательности бета-глобина и 120 п.о. поли(А) хвоста, которые, как было показано, увеличивают стабильность и трансляционную эффективность РНК, тем самым усиливая способность кодируемого антигена стимулировать Т-клетки ((Holtkamp S. et al., Blood 2006; PMID: 16940422). Кроме того, были вставлены фрагмент сигнального пептида MHC класса I и трансмембранных и цитозольных доменов включая стоп-кодон (сигнал направленной миграции MHC класса I или MITD) фланкированный полилинкерной последовательностью для клонирования эпитопов (Kreiter S. et al., J. Immunol., 180: 309-318, 2008). Было показано, что последний увеличивает презентацию антигена, тем самым усиливая экспансию антигенспецифичных CD8+ и CD4+ T-клеток и улучшая эффекторные функции.The polyneoepitope RNA constructs are based on the pST1-A120 vector containing the T7 promoter, the 3'UTR tandem beta-globin sequence, and 120 bp. tail poly(A), which have been shown to increase the stability and translational efficiency of RNA, thereby enhancing the ability of the encoded antigen to stimulate T cells ((Holtkamp S. et al., Blood 2006; PMID: 16940422). In addition, there have been inserted a fragment of the MHC class I signal peptide and transmembrane and cytosolic domains including a stop codon (MHC class I signal migration or MITD) flanked by a polylinker sequence for epitope cloning (Kreiter S. et al., J. Immunol., 180: 309-318 , 2008) The latter has been shown to increase antigen presentation, thereby enhancing the expansion of antigen-specific CD8+ and CD4+ T cells and improving effector functions.

Для получения РНК-конструктов с полинеоэпитопом для 50 идентифицированных и проверенных мутаций B16F10, были созданы 3 РНК-конструкта. Конструкты состоят из кодоноптимизированных последовательностей, кодирующих (i) мутированный эпитоп из 25 аминокислот, (ii) глицин/серин-богатый линкер, (iii) повторы последовательности мутированного эпитопа, за которыми следуют глицин/серин-богатый линкер. Цепь последовательностей, содержащих мутированный эпитоп, и линкеры фланкированы подходящими участками распознавания эндонуклеазами рестрикции для клонирования в конструкт на основе pST1, как описано выше. Вакцинные конструкты были спроектированы и синтезированы «GENEART». После проверки последовательности, их клонировали в векторный каркас на основе pST1 для получения вакцинных конструктов с РНК полинеоэпитопом.To obtain RNA constructs with a polyneoepitope for 50 identified and tested B16F10 mutations, 3 RNA constructs were generated. The constructs consist of codon-optimized sequences encoding (i) a mutated 25 amino acid epitope, (ii) a glycine/serine rich linker, (iii) repeats of the mutated epitope sequence followed by a glycine/serine rich linker. The chain of sequences containing the mutated epitope and the linkers are flanked by suitable restriction endonuclease recognition sites for cloning into a pST1-based construct as described above. The vaccine constructs were designed and synthesized by GENEART. After sequence verification, they were cloned into a pST1-based vector scaffold to obtain vaccine constructs with an RNA polyneoepitope.

Описание клинического методаDescription of the clinical method

Клиническое применение будет охватывать следующие стадии: Clinical application will cover the following stages:

- Подходящие пациенты должны дать согласие на ДНК-анализ секвенированием следующего поколения.- Eligible patients must consent to DNA analysis by next generation sequencing.

- Образец опухоли, полученный в ходе рутинных диагностических процедур (залитая в парафин, фиксированная формалином ткань) и клетки периферической крови будут получены и использованы для анализа мутаций, как описано.- A tumor sample obtained during routine diagnostic procedures (paraffin-embedded, formalin-fixed tissue) and peripheral blood cells will be obtained and used for mutation analysis as described.

- Обнаруженные мутации будут подтверждены- Detected mutations will be confirmed

- На основании этого будет спроектирована приоритетизированная вакцина. Для РНК-вакцин синезом генов и клонированием будет получен эталонный плазмидный шаблон.- Based on this, a prioritized vaccine will be designed. For RNA vaccines, a reference plasmid template will be obtained by gene synthesis and cloning.

- Плазмиды будут использованы для получения РНК клинической чистоты, контроля качества и получения РНК-вакцины.- Plasmids will be used to obtain clinical grade RNA, quality control and RNA vaccine.

- Вакцинный лекарственный продукт будет послан в соответствующий центр проведения испытаний для клинического применения.- The vaccine drug product will be sent to the appropriate testing center for clinical use.

- РНК-вакцина может быть использована в качестве неупакованной вакцины в буферной смеси или может быть инкапсулирована в наночастицы или липосомы для прямой инъекции, например, в лимфоузлы, п.к., в.в., в.м. В ином случае РНК-вакцина может быть использована для трансфекции in vitro например, дендритных клеток для адоптивного переноса.- The RNA vaccine can be used as a bulk vaccine in a buffer mixture or can be encapsulated in nanoparticles or liposomes for direct injection, for example, into the lymph nodes, s.c., i.v., im. Alternatively, an RNA vaccine can be used to transfect in vitro, for example, dendritic cells for adoptive transfer.

Весь клинический процесс займет меньше чем 6 недель. «Лаг-фаза» между информированным согласием пациента и доступностью лекарственного средства будет тщательно урегулирована протоколом клинического исследования, включая разрешение на продолжение проведения режима стандартного лечения до того, как исследовательский продукт будет доступен. The entire clinical process will take less than 6 weeks. The "lag phase" between patient informed consent and drug availability will be carefully regulated by the clinical trial protocol, including permission to continue the standard treatment regimen until the investigational product is available.

Пример 8. Идентификация опухолевых мутаций и использование их для опухолевой вакцинацииExample 8. Identification of tumor mutations and their use for tumor vaccination

Мы применили NGS-ресеквенирование экзома для обнаружения мутаций в клеточной линии мышиной меланомы B16F10 и идентифицировали 962 несинонимичные соматических точечных мутации, 563 - в экспрессируемых генах. Потенциальные ведущие мутации происходят в генах классических опухолевых супрессоров (Pten, Trp53, Tp63, Pml) и генах, вовлеченных в протоонкогенные сигнальные пути, которые контролируют клеточную пролиферацию (например, Mdm1, Pdgfra), клеточную адгезию и миграцию (e.g. Fdz7, Fat1) или апоптоз (Casp9). Более того, B16F10 накапливает мутации в Aim1 и Trrap, которые ранее были описаны как часто изменяемые в человеческой меланоме.We used exome NGS resequencing to detect mutations in the B16F10 mouse melanoma cell line and identified 962 non-synonymous somatic point mutations, 563 in expressed genes. Potential lead mutations occur in classical tumor suppressor genes (Pten, Trp53, Tp63, Pml) and genes involved in proto-oncogenic signaling pathways that control cell proliferation (eg, Mdm1, Pdgfra), cell adhesion and migration (e.g. Fdz7, Fat1) or apoptosis (Casp9). Moreover, B16F10 accumulates mutations in Aim1 and Trrap that have previously been described as frequently altered in human melanoma.

Иммуногенность и специфичность 50 проверенных мутаций были проверены с помощью мышей C57BL/6, иммунизированных длинными пептидами, кодирующими мутированные эпитопы. Одна треть (16/50) их была показана как иммуногенная. Их них, 60% проявляет иммунные ответы предпочтительно направленные против мутированной последовательности по сравнению с последовательностью дикого типа.The immunogenicity and specificity of the 50 tested mutations were tested using C57BL/6 mice immunized with long peptides encoding the mutated epitopes. One third (16/50) of them were shown to be immunogenic. Of these, 60% exhibit immune responses preferentially directed against the mutated sequence over the wild-type sequence.

Мы протестировали гипотезу в моделях опухолевых трансплантов. Иммунизация пептидами наделяет in vivo опухолевым контролем в защитных и терапевтических условиях, квалифицируя мутированные эпитопы, содержащие одиночные аминокислотные замены, в качестве эффективных вакцин.We tested the hypothesis in tumor transplant models. Immunization with peptides confers in vivo tumor control under protective and therapeutic conditions, qualifying mutated epitopes containing single amino acid substitutions as effective vaccines.

ЖивотныеAnimals

Мыши C57BL/6 («Jackson Laboratories») содержались в соответствии с федеральной политикой и политикой штата о проведении исследований на животных при университете Майнца.C57BL/6 mice (Jackson Laboratories) were maintained in accordance with federal and state animal research policies at the University of Mainz.

КлеткиCells

Клеточная линия меланомы B16F10 была приобретена в 2010 году в Американской коллекции типовых культур (номер продукта: ATCC CRL-6475, номер лота: 58078645). Ранние (3-й, 4-й) пассажи клеток использовали в опухолевых экспериментах. Клетки тестировали стандартным образом на Micoplasma. Повторную аутентификацию клеток после получения не проводили.The B16F10 melanoma cell line was purchased in 2010 from the American Type Culture Collection (Product Number: ATCC CRL-6475, Lot Number: 58078645). Early (3rd, 4th) cell passages were used in tumor experiments. Cells were tested in a standard manner for Mycoplasma. Cells were not re-authenticated after receipt.

Секвенирование следующего поколенияNext generation sequencing

Экстракция нуклеиновых кислот и приготовление образцов: ДНК и РНК из большого количества клеток B16F10 и ДНК и ткани хвоста C57BL/6 экстрагировали трижды с помощью набора «Qiagen DNeasy Blood and Tissue kit» (для ДНК) и набора «Qiagen RNeasy Micro kit» (для РНК).Nucleic acid extraction and sample preparation: DNA and RNA from a large number of B16F10 cells and C57BL/6 tail DNA and tissue were extracted three times using the Qiagen DNeasy Blood and Tissue kit (for DNA) and the Qiagen RNeasy Micro kit (for RNA).

Секвенирование ДНК экзома: Захват экзома для ресеквенирования ДНК осуществляли трижды с помощью теста для захвата на основе раствора «Agilent Sure-Select mouse» (Gnirke A et al., Nat Biotechnol 2009;27:182-9), разработанном для захвата всех кодирующих мышиные белки областей. 3 μг очищенной геномной ДНК (гДНК) фрагментировали до 150-200 п.о. с помощью ультразвукового устройства «Covaris S2». Концы фрагментов достраивали, фосфорилировали по 5' и аденилировали по 3' согласно инструкциям производителя. Парные концевые адаптеры «Illumina» лигировали к гДНК фрагментам с использованием молярного соотношения адаптеров к гДНК 10:1. Обогащенные последовательности для предварительного захвата и проточной кюветы добавляли с помощью праймеров «Illumina PE PCR 1.0» и «2.0» в ходе 4 циклов ПЦР. 500 нг лигированных с адаптером обогащенных ПЦР фрагментов гДНК гибридизовали с РНК-библиотекой биотинилированных приманок цельного мышиного экзома «SureSelect» фирмы «Agilent» в течение 24 часов при 65 °C. Гибридизованные комплексы гДНК/РНК-приманка удаляли с помощью покрытых стрептавидином магнитных микросфер, и РНК-приманки отщепляли в ходе элюции в элюционном буфере «SureSelect». Эти элюированные гДНК фрагменты амплифицировали ПЦР после захвата в течение 10 циклов. Библиотеки гДНК с обогащенным экзомом кластеризовали на «cBot» с помощью набора «Truseq SR cluster kit v2.5» при использовании 7 pM, и 50 п.о. секвенировали на «Illumina HiSeq2000» с помощью набора «Truseq SBS kit-HS 50 bp».Exome DNA sequencing: Exome capture for DNA resequencing was performed three times with an Agilent Sure-Select mouse solution capture assay (Gnirke A et al., Nat Biotechnol 2009;27:182-9) designed to capture all mouse coding region proteins. 3 μg of purified genomic DNA (gDNA) was fragmented to 150-200 bp. using the ultrasonic device "Covaris S2". The ends of the fragments were completed, phosphorylated at 5' and adenylated at 3' according to the manufacturer's instructions. Paired Illumina end adapters were ligated to the gDNA fragments using a molar ratio of adapters to gDNA of 10:1. Enriched sequences for pre-capture and flow cell were added with primers "Illumina PE PCR 1.0" and "2.0" during 4 cycles of PCR. 500 ng of adapter-ligated PCR-enriched gDNA fragments were hybridized with Agilent's SureSelect RNA library of biotinylated whole mouse exome baits for 24 hours at 65°C. The hybridized gDNA/bait RNA complexes were removed with streptavidin-coated magnetic beads, and the bait RNA was cleaved during elution in SureSelect elution buffer. These eluted gDNA fragments were PCR amplified after capture for 10 cycles. Exome-enriched gDNA libraries were clustered on cBot using the Truseq SR cluster kit v2.5 using 7 pM, and 50 bp. sequenced on Illumina HiSeq2000 using Truseq SBS kit-HS 50 bp.

Генная экспрессия на основе РНК, профилирование «транскриптома» (RNA-Seq): Библиотеки «mRNA-seq cDNA» с штрих-кодом готовили в трех повторах, из 5 мкг общей РНК (модифицированный протокол «Illumina mRNA-seq»). мРНК выделяли с помощью магнитных микросфер «Seramag Oligo(dT)» («Thermo Scientific») и фрагментировали с помощью дивалентных катионов и нагревания. Полученные фрагменты (160-220 н.о.) преобразовывали в кДНК с помощью случайных праймеров и «SuperScriptII» («Invitrogen») с последующим синтезом второй цепи при использовании ДНК-полимеразы I и РНКазы H. Проводили репарацию концов кДНК в, и затем их фосфорилировали по 5' и аденилировали по 3' согласно инструкциям производителя. 3'-концевые одиночные T-перекрывающие, специфичные для «Illumina multiplex» адаптеры лигировали с помощью T4 ДНК-лигазы в молярном соотношении адаптера к кДНК-вставке 10:1. кДНК-библиотеки очищали и отбирали по размеру 200-220 п.о. (гель «E-Gel 2% SizeSelect», «Invitrogen»). Обогащение, добавление последовательностей «Illumina» для индексирования из шести оснований и последовательностей для проточной кюветы осуществляли ПЦР с использованием ДНК-полимеразы «Phusion» («Finnzymes»). Все очистки вплоть до этой стадии осуществляли в 1,8х объеме магнитных микросфер «AgencourtAMPure XP». Все контроли качества осуществляли с помощью теста «Qubit HS» от «Invitrogen» и размер фрагментов определяли с помощью теста «HS DNA» на «Bioanalyzer 2100» от «Agilent». Библиотеки RNA-Seq с штрих-кодами кластеризовали и секвенировали как описано выше. RNA-based Gene Expression, "Transcriptome" Profiling (RNA-Seq): Barcoded "mRNA-seq cDNA" libraries were prepared in triplicate, from 5 μg of total RNA (modified Illumina mRNA-seq protocol). mRNA was isolated using "Seramag Oligo(dT)" (Thermo Scientific) magnetic microspheres and fragmented using divalent cations and heating. The resulting fragments (160–220 nt) were converted into cDNA using random primers and SuperScriptII (Invitrogen), followed by the synthesis of the second strand using DNA polymerase I and RNase H. The cDNA ends were repaired in, and then they were phosphorylated at 5' and adenylated at 3' according to the manufacturer's instructions. 3' single T-overlapping "Illumina multiplex" specific adapters were ligated with T4 DNA ligase in a molar ratio of adapter to cDNA insert of 10:1. cDNA libraries were purified and selected by size 200-220 bp. (gel "E-Gel 2% SizeSelect", "Invitrogen"). Enrichment, addition of six base Illumina indexing sequences and flow cell sequences was performed by PCR using Phusion DNA polymerase (Finnzymes). All purifications up to this stage were carried out in 1.8x the volume of magnetic microspheres "AgencourtAMPure XP". All quality controls were performed using the Qubit HS test from Invitrogen and the size of the fragments was determined using the HS DNA test on a Bioanalyzer 2100 from Agilent. Barcoded RNA-Seq libraries were clustered and sequenced as described above.

Анализ данных NGS, экспрессия генов: Считанные выходные данные последовательностей образцов РНК предварительно обрабатывали согласно стандартному протоколу «Illumina», включая фильтрование для считанных данных низкого качества. Считанные данные последовательностей выравнивали по эталонной геномной последовательности mm9 (Waterston RH et al., Nature 2002;420:520-62) с помощью «bowtie» (версия 0.12.5) (Langmead B et al., Genome Biol 2009;10:R25). Для выравнивания генома разрешались два несовпадения и записывалось только лучшее выравнивание («-v2 –best»); для выравниваний транскриптома использовали параметры по умолчанию. Считанные данные, невыравниваемые по геномной последовательности, выравнивали по базе данных последовательностей всех возможных экзон-экзонных соединений транскриптов RefSeq (Pruitt KD et al., Nucleic Acids Res 2007;35:D61-D65). Значения экспрессии определяли по пересечению координат считывания с теми из транскриптов RefSeq, на которые приходились считанные данные по перекрывающемуся экзону и соединению, и нормализовали по единицам экспрессии RPKM (количество ридов, на килобазу экзонной модели на миллион картированных ридов) (Mortazavi A et al., Nat Methods 2008;5:621-8). NGS Data Analysis, Gene Expression: The readouts of the RNA sample sequences were preprocessed according to the standard Illumina protocol, including filtering for low quality readouts. Read sequence data were aligned to the mm9 reference genomic sequence (Waterston RH et al., Nature 2002;420:520-62) with a bowtie (version 0.12.5) (Langmead B et al., Genome Biol 2009;10:R25 ). For genome alignment, two mismatches were resolved and only the best alignment (“-v2 –best” was recorded); default parameters were used for transcriptome alignments. Readouts, not genomic sequence aligned, were aligned with the sequence database of all possible exon-exon junctions of RefSeq transcripts (Pruitt KD et al., Nucleic Acids Res 2007;35:D61-D65). Expression values were determined by the intersection of the read coordinates with those of the RefSeq transcripts that accounted for the overlapped exon and junction read data and normalized to RPKM expression units (number of reads, per exon model kilobase per million mapped reads) (Mortazavi A et al., Nat Methods 2008;5:621-8).

Анализ данных NGS, обнаружение соматических мутаций: Соматические мутации идентифицировали, как описано в Примере 9. 50 нуклеотидные односторонние риды выравнивали по референсному мышиному геному mm9 с помощью «bwa» (параметры по умолчанию, версия 0.5.8c) (Li H and Durbin R, Bioinformatics 2009;25:1754-60). Неоднозначные риды, картированные во многих местах генома, удаляли. Мутации идентифицировали с помощью трех программ: «samtools» (версия 0.1.8) (Li H, Bioinformatics 2011;27:1157-8), «GATK» (версия 1.0.4418) (McKenna A et al, Genome Res 2010;20:1297-303), и «SomaticSniper» (http://genome.wustl.edu/software/somaticsniper) (Ding L et al., Hum Mol Genet 2010;19:R188-R196). Потенциальным вариациям, идентифицированным во всех трех повторах B16F10, присваивалось доверительное значение «частоты ложных результатов» (FDR) (см. также пример 9).Analysis of NGS data, detection of somatic mutations: Somatic mutations were identified as described in Example 9. 50 bp one-sided reads were aligned to the reference mouse mm9 genome using "bwa" (default parameters, version 0.5.8c) (Li H and Durbin R, Bioinformatics 2009;25:1754-60). Ambiguous reads mapped at many locations in the genome were removed. Mutations were identified using three programs: "samtools" (version 0.1.8) (Li H, Bioinformatics 2011;27:1157-8), "GATK" (version 1.0.4418) (McKenna A et al, Genome Res 2010;20 :1297-303), and "SomaticSniper" (http://genome.wustl.edu/software/somaticsniper) (Ding L et al., Hum Mol Genet 2010;19:R188-R196). Potential variations identified in all three B16F10 repeats were assigned a false positive rate (FDR) value (see also example 9).

Отбор, проверка и функция мутацийSelection, validation and function of mutations

Выбор: Для отбора мутации должны удовлетворять следующим критериям: (i) присутствуют во всех трех повторах B16F10 и отсутствуют во всех трех повторах C57BL/6, (ii) FDR ≤0,05, (iii) гомогенность в C57BL/6, (iv) встречаются в транскрипте RefSeq, и (v) вызывают несинонимичные изменения, которые могут быть подсчитаны как достоверная мутация. Отбор для проверки и тестирования иммуногенности требует, чтобы мутации являлись экспрессируемыми генами (медианное значение RPKM по репликам >10).Selection: For selection, mutations must meet the following criteria: (i) present in all three B16F10 repeats and absent in all three C57BL/6 repeats, (ii) FDR ≤0.05, (iii) homogeneity in C57BL/6, (iv) occur in the RefSeq transcript, and (v) cause non-synonymous changes that can be counted as a significant mutation. Selection for screening and testing for immunogenicity requires the mutations to be expressed genes (median replicate RPKM >10).

Проверка: Мутации в ДНК классифицировали как проверенные, если они подтверждались секвенированием по Сенгеру или ридами B16F10 RNA-Seq. Все отобранные варианты амплифицировали из 50 нг ДНК клеток B16F10 или ткани хвоста C57BL/6 с помощью фланкирующих праймеров, продукты визуализировали («QIAxcel system», «Qiagen») и очищали (набор для очистки «QIAquick PCR Purification Kit», «Qiagen»). Ампликон ожидаемого размера вырезали из геля, очищали («QIAquick Gel Extraction Kit», «Qiagen») и секвенировали по Сенгеру («Eurofins MWG Operon», Эберсберг, Германия), с прямым праймером, использованным для амплификации ПЦР.Verification: DNA mutations were classified as verified if they were confirmed by Sanger sequencing or B16F10 RNA-Seq reads. All selected variants were amplified from 50 ng of B16F10 cell DNA or C57BL/6 tail tissue using flanking primers, the products were visualized (QIAxcel system, Qiagen) and purified (QIAquick PCR Purification Kit, Qiagen) . An amplicon of the expected size was excised from the gel, purified (QIAquick Gel Extraction Kit, Qiagen) and Sanger sequenced (Eurofins MWG Operon, Ebersberg, Germany), with a forward primer used for PCR amplification.

Функциональное воздействие: Программы «SIFT» (Kumar P et al., Nat Protoc 2009;4:1073-81) и «POLYPHEN-2» (Adzhubei IA et al., Nat Methods 2010;7:248-9), которые прогнозируют функциональную значимость аминокислоты в функции белка на основании расположения белковых доменов и межвидовой консервативности последовательностей, использовали для оценки воздействия выбранных мутаций. Инструменты «Ingenuity IPA» использовали для логического выведения функции гена.Functional Impact: SIFT (Kumar P et al., Nat Protoc 2009;4:1073-81) and POLYPHEN-2 (Adzhubei IA et al., Nat Methods 2010;7:248-9) programs that predict the functional significance of the amino acid in protein function, based on the arrangement of protein domains and interspecies sequence conservatism, was used to assess the impact of selected mutations. Ingenuity IPA tools were used to infer the function of the gene.

Синтетические пептиды и адъювантыSynthetic peptides and adjuvants

Все пептиды, включая овальбумин класса I (OVA258-265), класса II (OVA class II330-338), нуклеопротеин гриппа (Inf-NP366-374), нуклеопротеин вируса везикулярного стоматита (VSV-NP52-59) и родственный тирозиназе белок 2 (Trp2180-188) приобрели в «Jerini Peptide Technologies» (Берлин, Германия). Синтетические пептиды были длиной 27 аминокислот с мутированной аминокислотой (MUT) или аминокислотой дикого типа (WT) в положении 14. Полиинозиновую:полицитидиловую кислоту (поли(I:C), InvivoGen) использовали в качестве подкожно инъецируемого адъюванта. MHC-Пентамер специфичный к пептиду Inf-NP366-374, приобрели у «ProImmune Ltd.».All peptides, including class I ovalbumin (OVA 258-265 ), class II (OVA class II 330-338 ), influenza nucleoprotein (Inf-NP 366-374 ), vesicular stomatitis virus nucleoprotein (VSV-NP 52-59 ) and related tyrosinase protein 2 (Trp2 180-188 ) was purchased from Jerini Peptide Technologies (Berlin, Germany). Synthetic peptides were 27 amino acids long with a mutated amino acid (MUT) or wild-type amino acid (WT) at position 14. Polyinosinic:polycytidylic acid (poly(I:C), InvivoGen) was used as the subcutaneously injectable adjuvant. MHC-Pentamer specific for Inf-NP 366-374 peptide was purchased from ProImmune Ltd..

Иммунизация мышейImmunization of mice

Самок мышей C57BL/6 одного возраста инъецировали подкожно 100 мкг пептида и 50 мкг поли(I:C), приготовленных в PBS (200 мкл общий объем) в бок между последним ребром и тазом (5 мышей на группу). Каждую группу иммунизировали в день 0 и в день 7 пептидами, кодирующими два различных пептида, один пептид в каждый бок. Двенадцать дней после исходной инъекции мышей забивали и выделяли спленоциты для иммунологического тестирования. Female C57BL/6 mice of the same age were injected subcutaneously with 100 μg of the peptide and 50 μg of poly(I:C) prepared in PBS (200 μl total volume) in the flank between the last rib and pelvis (5 mice per group). Each group was immunized on day 0 and day 7 with peptides encoding two different peptides, one peptide in each side. Twelve days after the initial injection, mice were sacrificed and splenocytes were isolated for immunological testing.

В ином случае, совпадающих по возрасту самок мышей C57BL/6инъецировали внутривенно 20 мкг in vitro транскрибированной РНК, приготовленной с 20 мкл 2Lipofectamine™ RNAiMAX» («Invitrogen») в PBS в общем инъецируемом объеме 200 мкл (3 мыши на группу). Каждую группу иммунизировали в день 0, 3, 7, 14 и 18. Через двадцать три дня после первой инъекции мышей забивали и выделяли спленоциты для иммунологического тестирования. ДНК-последовательности, представляющие одну (моноэпитоп), две (биэпитоп) или 16 мутаций (полиэпитоп) конструировали с использованием 50 аминокислот (ак) с мутацией в положении 25 ак (биэпитоп) или с использованием 27 ак с мутацией в положении 14 (моно- и полиэпитоп), разделяли глицин/сериновым линкером из 9 ак и клонировали в каркас pST1-2BgUTR-A120 (Holtkamp et al., Blood 2006;108:4009-17). In vitro транскрипция с этой матрицы и очистка ранее были описаны (Kreiter et al., Cancer Immunol Immunother 2007;56:1577-87). Otherwise, age-matched female C57BL/6 mice were intravenously injected with 20 µg of in vitro transcribed RNA prepared with 20 µl of 2Lipofectamine™ RNAiMAX (Invitrogen) in PBS in a total injection volume of 200 µl (3 mice per group). Each group was immunized on days 0, 3, 7, 14 and 18. Twenty-three days after the first injection, mice were sacrificed and splenocytes were isolated for immunological testing. DNA sequences representing one (monoepitope), two (biepitope), or 16 mutations (polyepitope) were constructed using 50 amino acids (aa) with a mutation at position 25 aa (biepitope) or using 27 aa with a mutation at position 14 (mono- and polyepitope), separated by a 9-aa glycine/serine linker and cloned into the pST1-2BgUTR-A120 framework (Holtkamp et al., Blood 2006;108:4009-17). In vitro transcription from this template and purification have previously been described (Kreiter et al., Cancer Immunol Immunother 2007;56:1577-87).

Иммуноферментный спот-анализImmunoassay spot analysis

Иммуноферментный спот-анализ (ELISPOT) (Kreiter S et al., Cancer Res 2010;70:9031-40) и образование сингенных дендритных клеток из костного мозга (BMDC) в качестве стимуляторов ранее были описаны (Lutz MB et al., J Immunol Methods 1999;223:77-92). BMDC либо активировали пептидом (2 мкг/мл), либо трансфицировали in vitro транскрибированной (IVT) РНК, кодирующей указанную мутацию или контрольную РНК (eGFP-RNA). Последовательности, представляющие две мутации, каждая содержащая 50 аминокислот с мутацией в положении 25 и отделенная глицин/сериновым линкером из 9 ак, клонировали в каркас pST1-2BgUTR-A120 (Holtkamp S et al., Blood 2006;108:4009-17). In vitro транскрипция с этого матрицы и очистка ранее были описаны (Kreiter S et al., Cancer Immunol Immunother 2007;56:1577-87). Для анализа 5 × 104 BMDC, моделированных пептидом или РНК, коинкубировали с 5 × 105 свежевыделенных спленоцитов в титрационном микропланшете, покрытом анти-IFN-γ антителом (10 μг/мл, клон AN18; «Mabtech»). Через 18 часов при 37°C, секрецию цитокинов детектировали с помощью анти-IFN-γ антитела (клон R4-6A2; «Mabtech»). Количество пятен подсчитывали и анализировали с помощью «ImmunoSpot® S5 Versa ELISPOT Analyzer», программного обеспечения «IImmunoCapture™ Image Acquisition» и программного обеспечения «ImmunoSpot® Analysis» версии 5. Статистический анализ осуществляли с помощью критерия Стьюдента и критерия Манна-Уинтни (непараметрический критерий). Ответы считались значимыми, если либо тест давал p-значение <0,05, либо среднее количество пятен составляло >30 пятен/5x105 эффекторных клеток. Реактивности оценивали по среднему количество пятен (-: <30; +: >30; ++: >50; +++ >200 пятен/лунку).Enzyme-linked immunosorbent assay (ELISPOT) (Kreiter S et al., Cancer Res 2010;70:9031-40) and bone marrow-derived syngeneic dendritic cells (BMDC) generation as stimulants have previously been described (Lutz MB et al., J Immunol Methods 1999;223:77-92). BMDCs were either activated with the peptide (2 μg/ml) or transfected with in vitro transcribed (IVT) RNA encoding the indicated mutation or control RNA (eGFP-RNA). Sequences representing two mutations, each containing 50 amino acids with a mutation at position 25 and separated by a 9 aa glycine/serine linker, were cloned into the pST1-2BgUTR-A120 framework (Holtkamp S et al., Blood 2006;108:4009-17). In vitro transcription from this template and purification have previously been described (Kreiter S et al., Cancer Immunol Immunother 2007;56:1577-87). For analysis, 5 x 10 4 BMDCs modeled with peptide or RNA were co-incubated with 5 x 10 5 freshly isolated splenocytes in a microtiter plate coated with anti-IFN-γ antibody (10 μg/ml, clone AN18; Mabtech). After 18 hours at 37° C., cytokine secretion was detected with an anti-IFN-γ antibody (clone R4-6A2; Mabtech). The number of spots was counted and analyzed using ImmunoSpot® S5 Versa ELISPOT Analyzer, IImmunoCapture™ Image Acquisition software and ImmunoSpot® Analysis software version 5. ). Responses were considered significant if either the test gave a p-value of <0.05 or the mean number of spots was >30 spots/5x10 5 effector cells. Reactivity was assessed by the average number of spots (-: <30; +: >30; ++: >50; +++ >200 spots/well).

Анализ внутриклеточных цитокиновAnalysis of intracellular cytokines

Аликвоты спленоцитов, полученных для анализа «ELISPOT» подвергали анализу выработки цитокинов посредством внутриклеточной проточной цитометрии. С этой целью 2 x 106 спленоцитов на образец помещали в 96-луночный планшет в культуральную среду (RPMI + 10% FCS), обогащенную ингибитором аппарата Гольджи Брефелдином A (10 µг/мл). Клетки из каждого животного повторно стимулировали в течение 5 часов при 37°C 2 x 105 BMDC, активированных пептидом. После инкубации клетки отмывали PBS, ресуспендировали в 50 мкл PBS и окрашивали внеклеточно следующими анти-мышиными антителами в течение 20 минут при 4°C: анти-CD4 FITC, анти-CD8 APC-Cy7 («BD Pharmingen»). После инкубации клетки отмывали PBS и затем ресуспендировали в 100 мкл раствора «Cytofix/Cytoperm» («BD Bioscience») в течение 20 мин. при 4°C для пермеабилизации внешней мембраны. После пермеабилизации клетки омывали буфером «Perm/Wash-Buffer» («BD Bioscience»), ресуспендировали в 50 мкл/образец в буфере «Perm/Wash-Buffer» («BD Bioscience»), и окрашивали внутриклеточного следующими анти-мышиными антителами в течение 30 минут при 4°C: анти-IFN- γ PE, анти-TNF-α PE-Cy7, анти-IL2 APC («BD Pharmingen»). После отмывки буфером «Perm/Wash-Buffer» клетки ресуспендировали в PBS, содержащем 1% параформальдегида для анализа проточной цитометрией. Образцы анализировали с помощью цитометра «BD FACSCanto™ II» и «FlowJo» (версия 7.6.3).Aliquots of splenocytes obtained for the "ELISPOT" assay were subjected to cytokine production analysis by intracellular flow cytometry. To this end, 2 x 10 6 splenocytes per sample were placed in a 96-well plate in culture medium (RPMI + 10% FCS) enriched with the Golgi apparatus inhibitor Brefeldin A (10 µg/ml). Cells from each animal were re-stimulated for 5 hours at 37° C. with 2 x 10 5 BMDC activated with the peptide. After incubation, cells were washed with PBS, resuspended in 50 μl PBS, and extracellularly stained with the following anti-mouse antibodies for 20 minutes at 4°C: anti-CD4 FITC, anti-CD8 APC-Cy7 (BD Pharmingen). After incubation, cells were washed with PBS and then resuspended in 100 µl of Cytofix/Cytoperm solution (BD Bioscience) for 20 min. at 4°C to permeabilize the outer membrane. After permeabilization, cells were washed with Perm/Wash-Buffer (BD Bioscience), resuspended in 50 µl/sample in Perm/Wash-Buffer (BD Bioscience), and stained intracellularly with the following anti-mouse antibodies in for 30 minutes at 4°C: anti-IFN-γ PE, anti-TNF-α PE-Cy7, anti-IL2 APC (BD Pharmingen). After washing with Perm/Wash-Buffer, cells were resuspended in PBS containing 1% paraformaldehyde for flow cytometry analysis. Samples were analyzed using a BD FACSCanto™ II cytometer and FlowJo (version 7.6.3).

Модель опухоли меланомы B16B16 melanoma tumor model

Для экспериментов по опухолевой вакцинации 7,5 × 104 клеток меланомы B16F10 инокулировали п.к. в бока мышей C57BL/6. В профилактическом режиме, иммунизацию пептидом, специфичным для мутации, осуществляли за 4 дня перед и через 2 и 9 дней после инокуляции опухоли. В терапевтическом эксперименте пептидную вакцину вводили через 3 и 10 дней после инъекции опухоли. Размеры опухолей измеряли каждые три дня и умерщвляли мышей, при достижении опухолями диаметра 15 мм. For tumor vaccination experiments, 7.5×10 4 B16F10 melanoma cells were inoculated sc. in the flanks of C57BL/6 mice. In a prophylactic regimen, immunization with the mutation-specific peptide was performed 4 days before and 2 and 9 days after tumor inoculation. In a therapeutic experiment, the peptide vaccine was administered 3 and 10 days after tumor injection. Tumor sizes were measured every three days and mice were sacrificed when the tumors reached a diameter of 15 mm.

В ином случае для экспериментов по вакцинации против опухоли в бока одновозрастных самок мышей C57BL/6 инокулировали п.к. 1 × 105 клеток меланомы B16F10. Вакцинацию пептидом осуществляли на 3, 10 и 17 день после инокуляции опухоли 100 мкг пептида и 50 мкг поли(I:C) приготовленных в PBS (общий объем 200 мкл), инъецированных подкожно в бок межу последним ребром и тазом. Иммунизации РНК осуществляли с помощью 20 мкг in vitro траскрибированных кодирующих мутацию РНК, приготовленных с 20 мкл «Lipofectamine™ RNAiMAX» («Invitrogen») в PBS с общим инъецируемым объемом 200 мкл. В качестве контроля одну группу животных инъецировали «RNAiMAX» («Invitrogen») в PBS. Животных иммунизировали на 3, 6, 10, 17 и 21 день после инокуляцию опухоли. Размеры опухолей измеряли каждые три дня с помощью штангенциркуля и умерщвляли мышей, когда диаметр опухолей достигал 15 мм. Otherwise, for tumor vaccination experiments, the flanks of coeval female C57BL/6 mice were inoculated sc. 1 x 10 5 B16F10 melanoma cells. Peptide vaccination was performed on days 3, 10 and 17 after tumor inoculation with 100 μg of peptide and 50 μg of poly(I:C) prepared in PBS (total volume 200 μl) injected subcutaneously in the flank between the last rib and pelvis. RNA immunizations were performed with 20 μg of in vitro transcribed mutation-encoding RNA prepared with 20 μl of Lipofectamine™ RNAiMAX (Invitrogen) in PBS for a total injection volume of 200 μl. As a control, one group of animals were injected with RNAiMAX (Invitrogen) in PBS. Animals were immunized 3, 6, 10, 17 and 21 days after tumor inoculation. Tumor sizes were measured every three days with a caliper and mice were sacrificed when the tumor diameter reached 15 mm.

Идентификация несинонимичных мутаций в мышиной меланоме B16F10. Identification of nonsynonymous mutations in B16F10 murine melanoma.

Наша задача заключалась в идентификации потенциально иммуногенных соматических точечных мутаций в мышиной меланоме B16F10 с помощью NGS, и в тестировании их на предмет in vivo иммуногенности пептидной вакцинацией мышей и измерением вызванных Т-клеточных ответов с помощью анализа «ELISPOT» (фиг. 9А). Мы секвенировали экзомы фонового генома дикого типа C57BL/6 и клеток B16F10, каждый трижды выделенный и захваченный. Для каждого образца было получено больше чем 100 миллионов односторонних ридов длиной 50 нуклеотидов. Из них 80% выровнялись уникально на мышином геноме mm9, а 49% выровнялись на мишени, что демонстрирует удачное обогащение мишени и приводит к более чем 20 кратному перекрытию 70% нуклеотидов-мишеней в каждом из трех образцов. RNA-Seq клеток B16F10, также профилированные в трех повторах, образовали 30 миллионов односторонних ридов длиной 50 нуклеотидов, из которых 80% выровнялись на мышином транскриптоме. Our goal was to identify potentially immunogenic somatic point mutations in B16F10 murine melanoma by NGS, and to test them for in vivo immunogenicity by peptide vaccination of mice and measurement of induced T cell responses using the "ELISPOT" assay (Fig. 9A). We sequenced wild type C57BL/6 background genome and B16F10 cell exomes, each isolated and captured in triplicate. For each sample, more than 100 million single-sided reads of 50 nucleotides were obtained. Of these, 80% aligned uniquely on the mm9 mouse genome and 49% aligned on the target, demonstrating successful target enrichment and resulting in over 20-fold overlap of 70% of the target nucleotides in each of the three samples. RNA-Seq of B16F10 cells, also profiled in triplicate, generated 30 million 50-bp one-sided reads, of which 80% aligned on the mouse transcriptome.

Риды ДНК (захват экзома) из B16F10 и C57BL/6 анализировали для идентификации соматических мутаций. Анализ вариации числа копий (Sathirapongsasuti JF et al., Bioinformatics 2011;27:2648-54) продемонстрировал амплификации и делеции ДНК в B16F10, включая гомозиготоную делецию опухолевого супрессора Cdkn2a (ингибитор 2A циклин-зависимой киназы, p16Ink4A). Фокусируясь на точечных мутациях для идентификации возможных иммуногенных мутаций, мы идентифицировали 3570 соматических точечных мутаций при FDR ≤ 0,05 (фиг. 9B). Наиболее частым классом мутаций являлись транзиции C>T / G>A, как правило, являющиеся результатом воздействия ультрафиолетового излучения (Pfeifer GP et al., Mutat Res 2005;571:19-31). Из этих соматических мутаций, 1392 произошли в транскриптах, со 126 мутациями в нетранслированных областях. Из 1266 мутаций в кодирующих областях, 962 вызвали несинонимичные изменения в белках, а 563 из них произошли в экспрессируемых генах (фиг. 9В).DNA reads (exome capture) from B16F10 and C57BL/6 were analyzed to identify somatic mutations. Copy number variation analysis (Sathirapongsasuti JF et al., Bioinformatics 2011;27:2648-54) demonstrated DNA amplifications and deletions in B16F10, including a homozygous deletion of the tumor suppressor Cdkn2a (cyclin-dependent kinase 2A inhibitor, p16Ink4A). Focusing on point mutations to identify possible immunogenic mutations, we identified 3570 somatic point mutations at FDR ≤ 0.05 (Fig. 9B). The most common class of mutations were C>T / G>A transitions, usually resulting from exposure to ultraviolet radiation (Pfeifer GP et al., Mutat Res 2005;571:19-31). Of these somatic mutations, 1392 occurred in transcripts, with 126 mutations in untranslated regions. Of the 1266 mutations in coding regions, 962 caused non-synonymous changes in proteins, and 563 of these occurred in expressed genes (Fig. 9B).

Присвоение идентифицированных мутаций генам-носителям и проверкаAssignment of identified mutations to carrier genes and verification

Примечательно, что многие из мутировавших генов (962 гена, содержащих несинонимичные соматические точечные мутации), ранее были ассоциированы с фенотипами злокачественных опухолей. Мутации были обнаружены в известных генах-опухолевых супрессорах, включая Pten, Trp53 (также называемом p53), и Tp63. В Trp53, наиболее известном опухолевом супрессоре (Zilfou JT et al., Cold Spring Harb Perspect Biol 2009;1:a001883), мутация аспарагина в аспарагиновую кислоту в положении 127 (p.N127D) расположена в ДНК-связывающем домене и согласно прогнозу «SIFT» изменяет функцию. Pten содержит две мутации (p.A39V, p.T131P), которые обе согласно прогнозу оказывают вредное воздействие на функцию белка. Показано, что мутация p.T131P, соседствующая с мутацией (p.R130M), снижает активность фосфатазы (Dey N et al., Cancer Res 2008;68:1862-71). Более того, мутации были обнаружены в генах, ассоциированных с сигнальными путями восстановления ДНК, таких как Brca2 (белок рака молочной железы 2, раннее возникновение), Atm (белок мутирующий при телеангиоэктатической атаксии), Ddb1 (специфичный для повреждений ДНК-связывающий белок 1) и Rad9b (RAD9, гомолог B). Более того, мутации происходят в других ассоциированных с опухолями генах, включая Aim1 (опухолевый супрессор «Отсутствующий при меланоме 1»), Flt1 (онкоген Vegr1, fms-родственная тирозинкиназа 1), Pml (опухолевый супрессор «промиелоцитарный лейкоз»), Fat1 («опухолевый супрессор FAT, гомолог 1»), Mdm1 (TP53 связывающий ядерный белок), Mta3 (ассоциированное с метастазированием семейство 1, представитель 3), и Alk (рецепторная тирозинкиназа анапластической лимфомы). Мы обнаружили мутацию p.S144F в Pdgfra (рецепторе тромбоцитарного фактора роста, альфа полипептиде), связанной с клеточной мембраной рецепторной тирозинкиназе сигнального пути MAPK/ERK, ранее идентифицированной в опухолях (Verhaak RG et al., Cancer Cell 2010;17:98-110). Мутация произошла в p.L222V в Casp9 (касапаза 9, апоптоз-связанная цистеиновая пептидаза). CASP9 протеолитически расщепляет поли(ADP-рибоза)полимеразу (PARP), регулирует апоптоз, и был связана с нескольких злокачественными новообразованиями (Hajra KM et al., Apoptosis 2004;9:691-704). Мутации, которые мы обнаружили, потенциально могут вносить вклад в передачу сигнала PARP и апоптотическую передачу сигнала. Наиболее интересно то, что мутации не были обнаружены в Braf, c-Kit, Kras или Nras. Однако мутации были идентифицированы в Rassf7 (RAS-ассоциированном белке) (p.S90R), Ksr1 (киназа-супрессор ras 1) (p.L301V) и Atm (PI3K сигнальный путь) (p.K91T), которые все согласно прогнозу оказывают значимое воздействие на функцию белка. Trrap (белок, ассоциированный с доменом трансформации/транскрипции) был идентифицирован ранее в этом году в образцах человеческой меланомы в качестве новой потенциальной мишени в меланомах (Wei X et al., Nat Genet 2011;43:442-6). В B16F10, мутация в Trrap происходит в p.K2783R и согласно прогнозу нарушает перекрывание FAT домена киназы, родственной фоссфатидилинозитокиназе (PIK). It is noteworthy that many of the mutated genes (962 genes containing non-synonymous somatic point mutations) were previously associated with malignant tumor phenotypes. Mutations have been found in known tumor suppressor genes, including Pten, Trp53 (also called p53), and Tp63. In Trp53, the best known tumor suppressor (Zilfou JT et al., Cold Spring Harb Perspect Biol 2009;1:a001883), the asparagine to aspartic acid mutation at position 127 (p.N127D) is located in the DNA-binding domain and predicted by "SIFT » changes the function. Pten contains two mutations (p.A39V, p.T131P), both of which are predicted to have deleterious effects on protein function. Mutation p.T131P adjacent to mutation (p.R130M) has been shown to reduce phosphatase activity (Dey N et al., Cancer Res 2008;68:1862-71). Moreover, mutations have been found in genes associated with DNA repair signaling pathways such as Brca2 (breast cancer protein 2, early onset), Atm (telangiectatic ataxia mutant protein), Ddb1 (damage-specific DNA-binding protein 1) and Rad9b (RAD9 homologue B). Moreover, mutations occur in other tumor-associated genes, including Aim1 (tumor suppressor "Absent in melanoma 1"), Flt1 (Vegr1 oncogene, fms-related tyrosine kinase 1), Pml (tumor suppressor "promyelocytic leukemia"), Fat1 (" tumor suppressor FAT, homologue 1"), Mdm1 (TP53 nuclear binding protein), Mta3 (metastasis-associated family 1, member 3), and Alk (anaplastic lymphoma receptor tyrosine kinase). We found a p.S144F mutation in Pdgfra (platelet growth factor receptor, alpha polypeptide) associated with the cell membrane receptor tyrosine kinase MAPK/ERK signaling pathway previously identified in tumors (Verhaak RG et al., Cancer Cell 2010;17:98-110 ). A mutation occurred in p.L222V in Casp9 (casapase 9, apoptosis-associated cysteine peptidase). CASP9 proteolytically cleaves poly(ADP-ribose) polymerase (PARP), regulates apoptosis, and has been associated with several malignancies (Hajra KM et al., Apoptosis 2004;9:691-704). The mutations we found could potentially contribute to PARP signaling and apoptotic signaling. Most interestingly, no mutations were found in Braf, c-Kit, Kras or Nras. However, mutations have been identified in Rassf7 (RAS-associated protein) (p.S90R), Ksr1 (ras 1 suppressor kinase) (p.L301V), and Atm (PI3K signaling pathway) (p.K91T), which are all predicted to have a significant effect on protein function. Trrap (transformation/transcription domain associated protein) was identified earlier this year in human melanoma samples as a new potential target in melanomas (Wei X et al., Nat Genet 2011;43:442-6). In B16F10, a mutation in Trrap occurs in p.K2783R and is predicted to disrupt the FAT domain overlap of the phosphatidylinositokinase-related kinase (PIK).

Из 962 несинонимичных мутаций, идентифицированных с помощью NGS, мы выбрали 50 мутаций, включая 41 с FDR < 0,05, для проверки на основе ПЦР и тестирования иммуногенности. Критериями отбора были расположение в экспрессируемом гене (RPKM > 10) и прогнозируемая иммуногенность. Примечательно, что мы были способны проверить все 50 мутаций (таблица 6, фиг. 9В).Of the 962 non-synonymous mutations identified by NGS, we selected 50 mutations, including 41 with FDR < 0.05, for PCR-based validation and immunogenicity testing. Selection criteria were location in the expressed gene (RPKM > 10) and predicted immunogenicity. Remarkably, we were able to test all 50 mutations (Table 6, Fig. 9B).

Figure 00000011
Figure 00000011

Figure 00000012
Figure 00000012

На фиг. 9С показано расположение хромосом B16F10, плотность генов, экспрессия генов, мутации и отфильтрованные мутации (внутренние кольца). In FIG. 9C shows B16F10 chromosome arrangement, gene density, gene expression, mutations, and filtered mutations (inner rings).

In vivo тестирование иммуногенности с помощью представляющими мутации длинными пептидамиIn vivo immunogenicity testing with mutation-representing long peptides

Для обеспечения антигенов для тестирования иммуногенности этих мутаций мы использовали длинные пептиды, которые имеют много различных преимуществ по сравнению с другими пептидами для иммунизации (Melief CJ and van der Burg SH, Nat Rev Cancer 2008;8:351-60). Длинные пептиды способны индуцировать антигенспецифичные CD8+ а также CD4+ Т-клетки (Zwaveling S et al., Cancer Res 2002;62:6187-93; Bijker MS et al., J Immunol 2007;179:5033-40). Более того, длинные пептиды требуют процессирования для того, чтобы быть представленными на молекулах MHC. Такое поглощение наиболее эффективно осуществляется дендритными клетками, которые являются оптимальными для праймирования мощного Т-клеточного ответа. Подготовленные пептиды, напротив, не требуют обрезания и экзогенно загружаются на все клетки, экспрессирующие молекулы MHC, включая неактивированные В- и Т-клетки, что приводит к индукции толерантности и фратрицида (Toes RE et al., J Immunol 1996;156:3911-8; Su MW et al., J Immunol 1993;151:658-67). Для каждой из 50 проверенных мутаций мы разработали пептиды длиной 27 аминокислот, в которых в центре расположена мутантная аминокислота или аминокислота дикого типа. Таким образом, любой потенциальный эпитоп MHC класса I и II, длиной 8-14 аминокислот, несущий мутацию, может быть процессирован из этого пептида-предшественника. В качестве адъюванта для вакцинации пептидом мы использовали поли(I:C), который как известно стимулирует перекрестную презентацию и увеличивает эффективность вакцины (Datta SK et al., J Immunol 2003;170:4102-10; Schulz O et al., Nature 2005;433:887-92). 50 мутаций тестировали in vivo в мышах для индукции Т-клеток. Интересно, что 16 из 50 кодирующих мутацию пептидов были обнаружены как вызывающие иммунные ответы в иммунизированных мышах. Индуцированные Т-клетки, демонстрировали различные паттерны реактивности (таблица 7). To provide antigens for testing the immunogenicity of these mutations, we used long peptides that have many different advantages over other immunization peptides (Melief CJ and van der Burg SH, Nat Rev Cancer 2008;8:351-60). Long peptides are able to induce antigen-specific CD8+ as well as CD4+ T cells (Zwaveling S et al., Cancer Res 2002;62:6187-93; Bijker MS et al., J Immunol 2007;179:5033-40). Moreover, long peptides require processing in order to be presented on MHC molecules. Such uptake is most efficiently carried out by dendritic cells, which are optimal for priming a potent T cell response. Prepared peptides, in contrast, do not require clipping and are exogenously loaded onto all cells expressing MHC molecules, including non-activated B and T cells, resulting in the induction of tolerance and fratricide (Toes RE et al., J Immunol 1996;156:3911- 8; Su MW et al., J Immunol 1993;151:658-67). For each of the 50 mutations tested, we designed peptides that are 27 amino acids long and have the mutant or wild-type amino acid at the center. Thus, any potential MHC class I and II epitope, 8-14 amino acids long, carrying a mutation can be processed from this precursor peptide. As an adjuvant for peptide vaccination, we used poly(I:C), which is known to stimulate cross-presentation and increase vaccine efficacy (Datta SK et al., J Immunol 2003;170:4102-10; Schulz O et al., Nature 2005 ;433:887-92). 50 mutations were tested in vivo in mice to induce T cells. Interestingly, 16 out of 50 mutation-encoding peptides were found to elicit immune responses in immunized mice. Induced T cells showed different reactivity patterns (Table 7).

Таблица 7. Сводка Т-клеточных реактивностей, определенных после вакцинации пептидом, кодирующим мутацию. Статистический анализ осуществляли с помощью критерия Стьюдента и критерия Манна-Уитни (непараметрический критерий). Ответы рассматривались как значимые, если либо тест давал p-значение <0,05, либо среднее количество пятен составляло >30 пятен/5x105 эффекторных клеток. Реактивности оценивали по среднему количеству пятен -: <30; +: >30; ++: >50; +++ >200 пятен/лунку).Table 7. Summary of T cell reactivities determined after vaccination with the peptide encoding the mutation. Statistical analysis was performed using Student's t-test and Mann-Whitney test (non-parametric test). Responses were considered significant if either the test gave a p-value of <0.05 or the mean number of spots was >30 spots/5x10 5 effector cells. Reactivity was assessed by the average number of spots -: <30; +: >30; ++: >50; +++ >200 spots/well).

Figure 00000013
Figure 00000013

Двенадцать пептидов индуцирующих иммунных ответ, преимущественно являются мутантным эпитопом. Это подтверждено на примере мышей, иммунизированных мутациями 30 (MUT30, Kif18b) и 36 (MUT36, Plod2) (фиг. 10A). Анализ «ELISPOT» выявил сильные зависимые от мутации иммунные ответы без перекрестной реактивности против пептида дикого типа или несвязанного контрольного пептида (VSV-NP). С пятью пептидами включая мутации 05 (MUT05, Eef2) и 25 (MUT25, Plod2) (фиг. 10A), были получены иммунные ответы со сравнимым распознаванием как мутантного пептида, так и дикого типа пептида. Основная часть мутантных пептидов была не способна индуцировать значимые Т-клеточные ответы, что подтверждается примером мутаций 01 (MUT01, Fzd7), 02 (MUT02, Xpot), и 07 (MUT07, Trp53). Иммунные ответы, индуцированные некоторыми из обнаруженных мутаций, находились в диапазоне иммуногенности (500 пятен/5x105 клеток), полученном на мышах, иммунизированных в качестве положительного контроля описанным эпитопом MHC класса I из опухолевого антигена мышиной меланомы, родственного тирозиназе белка 2 (Trp2180-188, фиг. 10A) (Bloom MB et al., Exp Med 1997;185:453-9; Schreurs MW et al. Cancer Res 2000;60:6995-7001). Для отобранных пептидов, которые индуцируют сильный зависимый от мутации Т-клеточный ответ, мы подтвердили иммунное распознавание независимым подходом. Вместо длинных пептидов, для считывания иммунологических данных использовали in vitro транскрибированную РНК (IVT RNA), кодирующую фрагменты мутантных пептидов MUT17, MUT30 и MUT44. BMDC, трансфецированные кодирующей мутацию РНК или нерелевантной РНК, выполняли функцию антигенпрезентирующих клеток (APC) в анализе «ELISPOT», при этом спленоциты иммунизированных мышей выполняли функцию популяции эффекторных клеток. BMDC, трансфецированные мРНК, кодирующими MUT17, MUT30 и MUT44, специфично и сильно распознавались спленоцитами мышей, иммунизированными соответствующими длинными пептидами (фиг. 10В). Была задокументирована значимо более низкая реактивность против контрольных РНК-трансфецированных BMDC, что вероятно обусловлено неспецифической активацией BMDC одноцепочечной РНК (критерий Стьюдента; MUT17: p = 0,0024, MUT30: p = 0,0122, MUT44: p = 0,0075). Эти данные подтверждают, что индуцированные специфичные относительно мутации Т-клетки эффективно распознают эндогенно процессированные эпитопы. Две мутации, которые индуцируют предпочтительное распознавание мутантных эпитопов, находятся в генах Actn4 и Kif18b. Соматическая мутация в ACTN4 (актинин, альфа 4) p.F835V находится в кальций-связывающем белковом домене «EF-hand». Хотя как «SIFT» так и «POLYPHEN» прогнозируют значительное влияние этой мутации на функцию белка, ген не является известным онкогеном. Однако специфичные к мутации Т-клетки против ACTN4 недавно были ассоциированы с положительным исходом для пациентов (Echchakir H et al., Cancer Res 2001;61:4078-83). KIF18B (представитель семейства кинезина, 18B) является кинезином со способностью передвижения по микротрубочкам и способностью связывать АТФ и нуклеотиды, который вовлечен в регуляцию деления клеток (Lee YM et al., Gene 2010;466:16-25) (фиг. 10C). Последовательность ДНК в положении, кодируемом p.K739 является гомогенной в референсной C57BL/6, при этом риды ДНК из B16F10 выявили гетерозиготную соматическую мутацию. Оба нуклеотида детектировались в ридах 16F10 RNA-Seq и были подтверждены секвенированием по Сэнгеру. KIF18B ранее не был ассоциирован со злокачественным опухолевым фенотипом. Мутация p.K739N не локализована в известном функциональном или консервативном белковом домене (фиг. 10С, внизу) и таким образом, наиболее вероятно является ведомой, чем ведущей мутацией. Эти примеры подтверждают утрату корреляции между способностью индуцировать мутационно-распознаваемый иммунный ответ и функциональную или иммунологическую релевантность. Twelve immune response inducing peptides are predominantly mutant epitopes. This was confirmed in mice immunized with mutations 30 (MUT30, Kif18b) and 36 (MUT36, Plod2) (FIG. 10A). The "ELISPOT" assay revealed strong mutation-dependent immune responses with no cross-reactivity against wild-type peptide or unbound control peptide (VSV-NP). With five peptides including mutations 05 (MUT05, Eef2) and 25 (MUT25, Plod2) (FIG. 10A), immune responses were generated with comparable recognition of both the mutant peptide and the wild-type peptide. Most of the mutant peptides were unable to induce significant T cell responses, as evidenced by the example of mutations 01 (MUT01, Fzd7), 02 (MUT02, Xpot), and 07 (MUT07, Trp53). The immune responses induced by some of the mutations found were in the range of immunogenicity (500 spots/5x10 5 cells) obtained in mice immunized as a positive control with the described class I MHC epitope from the mouse melanoma tumor antigen tyrosinase-related protein 2 (Trp2180-188 , Fig. 10A) (Bloom MB et al., Exp Med 1997;185:453-9; Schreurs MW et al. Cancer Res 2000;60:6995-7001). For selected peptides that induce a strong mutation-dependent T cell response, we validated immune recognition by an independent approach. Instead of long peptides, in vitro transcribed RNA (IVT RNA) encoding fragments of the mutant peptides MUT17, MUT30, and MUT44 was used to read immunological data. BMDCs transfected with the mutated RNA or irrelevant RNA acted as antigen-presenting cells (APC) in the ELISPOT assay, with immunized mouse splenocytes acting as the effector cell population. BMDCs transfected with mRNAs encoding MUT17, MUT30 and MUT44 were specifically and strongly recognized by mouse splenocytes immunized with the respective long peptides (FIG. 10B). Significantly lower reactivity against control RNA-transfected BMDCs was documented, likely due to non-specific BMDC activation of single-stranded RNA (Student's t-test; MUT17: p = 0.0024, MUT30: p = 0.0122, MUT44: p = 0.0075). These data confirm that induced mutation-specific T cells effectively recognize endogenously processed epitopes. Two mutations that induce preferential recognition of mutant epitopes are in the Actn4 and Kif18b genes. The somatic mutation in ACTN4 (actinin, alpha 4) p.F835V is located in the calcium-binding protein domain "EF-hand". Although both SIFT and POLYPHEN predict a significant impact of this mutation on protein function, the gene is not a known oncogene. However, anti-ACTN4 mutation-specific T cells have recently been associated with a positive patient outcome (Echchakir H et al., Cancer Res 2001;61:4078-83). KIF18B (a member of the kinesin family, 18B) is a kinesin with microtubule migration and ATP and nucleotide binding that is involved in the regulation of cell division (Lee YM et al., Gene 2010;466:16-25) (Fig. 10C). The DNA sequence at the position encoded by p.K739 is homogeneous in reference C57BL/6, while DNA reads from B16F10 revealed a heterozygous somatic mutation. Both nucleotides were detected in 16F10 RNA-Seq reads and were confirmed by Sanger sequencing. KIF18B has not previously been associated with a malignant tumor phenotype. The p.K739N mutation is not located in a known functional or conserved protein domain (FIG. 10C, bottom) and is thus more likely to be a guide rather than a master mutation. These examples confirm the loss of correlation between the ability to induce a mutation-recognized immune response and functional or immunological relevance.

In vivo оценка противоопухолевой активности вакцинных кандидатовIn vivo evaluation of antitumor activity of vaccine candidates

Для оценки будут ли иммунные ответы, вызываемые in vivo транслироваться в противоопухолевые эффекты в мышах, несущих опухоли, мы выбрали в качестве примеров MUT30 (мутация в Kif18b) и MUT44. Было показано, что эти мутации индуцируют сильную иммунную реакцию, предпочтительно против мутированного пептида и могут быть эндогенно процессированы (фиг. 10А, В). Терапевтический потенциал вакцинации мутантными пептидами исследовали иммунизацией мышей либо MUT30, либо MUT44 и адъювантом через 3 и 10 дней после прививки 7,5x105 B16F10. Рост опухолей ингибировался вакцинациями обоими пептидами, по сравнению с контрольной группой (фиг. 11А). Поскольку B16F10 является очень агрессивно растущей опухолью, мы также протестировали защитные иммунные ответы. Мышей иммунизировали пептидом MUT30, инокулировали п.к. 7,5x105 клеток B16F10 через 4 дня и повторно стимулировали MUT30 через 2 и 9 дней после заражения опухолью. Наблюдали полную защиту от опухоли и выживание 40% мышей, обработанных MUT30, при этом все мыши в контрольной группе умерли в течение 44 дней (фиг. 11В, слева). У тех из мышей, у которых опухоли развились, несмотря на иммунизацию MUT30, рост опухолей был медленней, из-за удлинения медианы выживания на 6 дней по сравнению с контрольной группой (фиг. 11В, справа). Эти данные предполагают, что вакцинация всего лишь против одной мутации способна наделить противоопухолевыми эффектами.To assess whether immune responses elicited in vivo would be translated into antitumor effects in tumor-bearing mice, we selected MUT30 (a mutation in Kif18b) and MUT44 as examples. These mutations have been shown to induce a strong immune response, preferably against the mutated peptide, and can be endogenously processed (FIGS. 10A, B). The therapeutic potential of vaccination with mutant peptides was investigated by immunizing mice with either MUT30 or MUT44 and adjuvant 3 and 10 days after inoculation with 7.5x10 5 B16F10. Tumor growth was inhibited by vaccinations with both peptides compared to the control group (FIG. 11A). Because B16F10 is a very aggressive tumor, we also tested protective immune responses. Mice were immunized with the MUT30 peptide and inoculated sc. 7.5x10 5 B16F10 cells 4 days later and re-stimulated with MUT30 2 and 9 days after tumor challenge. Complete tumor protection and survival of 40% of mice treated with MUT30 was observed, with all mice in the control group dying within 44 days (FIG. 11B, left). In those mice that developed tumors despite MUT30 immunization, tumor growth was slower due to a median survival of 6 days longer than the control group (FIG. 11B, right). These data suggest that vaccination against just one mutation can confer antitumor effects.

Иммунизация РНК, кодирующими мутации.Immunization of RNA encoding mutations.

50 проверенных мутаций из клеточной линии меланомы B16F10 использовали для конструирования различных РНК-вакцин. ДНК-последовательности, представляющие одну (моноэпитоп), две (биэпитоп) или 16 различных мутаций (полиэпитоп), конструировали с использованием 50 аминокислот (ак) с мутацией в положении 25 (биэпитоп) или с использованием 27 ак с мутацией в положении 14 (моно- и полиэпитоп) и отделяли с помощью глицин/серинового линкера длиной 9 ак. Эти конструкты клонировали в каркас pST1-2BgUTR-A120 для in vitro транскрипции мРНК (Holtkamp et al., Blood 2006;108:4009-17). The 50 tested mutations from the B16F10 melanoma cell line were used to construct various RNA vaccines. DNA sequences representing one (monoepitope), two (biepitope), or 16 different mutations (polyepitope) were constructed using 50 amino acids (aa) with a mutation at position 25 (biepitope) or using 27 aa with a mutation at position 14 (mono - and polyepitope) and separated using a glycine/serine linker 9 aa long. These constructs were cloned into the pST1-2BgUTR-A120 framework for in vitro mRNA transcription (Holtkamp et al., Blood 2006;108:4009-17).

Для проверки in vivo способности индуцировать Т-клеточные ответы против различных РНК-вакцин группы из трех мышей C57BL/6 иммунизировали составом РНК с липофектамином «RNAiMAX» с последующей внутривенной инъекцией. После 5 иммунизаций мышей умерщвляли и анализировали спленоциты на предмет специфичных к мутациям Т-клеточным ответам путем окрашивания внутриклеточных цитокинов и анализа «IFN-γ ELISPOT» после повторной стимуляции соответствующим пептидом, кодирующим мутацию или контрольным пептидом (VSV-NP). To test in vivo ability to induce T-cell responses against various RNA vaccines, groups of three C57BL/6 mice were immunized with RNAi formulation with RNAiMAX lipofectamine followed by intravenous injection. After 5 immunizations, mice were sacrificed and splenocytes were analyzed for mutation-specific T-cell responses by intracellular cytokine staining and "IFN-γ ELISPOT" analysis after re-stimulation with the appropriate mutation-encoding peptide or control peptide (VSV-NP).

На фиг. 12 показан один пример для каждого вакцинного дизайна. В верхней строке мышей вакцинировали РНК с моноэпитопом, кодирующим MUT30 (мутация в Kif18b), который индуцирует MUT30-специфичные CD4+ Т-клетки (см. примерный график FACS). В средней строке диаграмма и график FACS демонстрируют индукцию MUT08-специфичных (мутация в Ddx23) CD4+ Т-клеток после иммунизации биэпитопом, кодирующим MUT33 и MUT08. В нижней строке мышей иммунизировали с полиэпитопом, кодирующим 16 различных мутаций, включая MUT08, MUT33 и MUT27 (см. таблицу 8). Диаграмма и график FACS иллюстрируют, что MUT27 реактивные Т-клетки имеют CD8 фенотип. In FIG. 12 shows one example for each vaccine design. In the top row, mice were vaccinated with an RNA with a monoepitope encoding MUT30 (mutation in Kif18b) that induces MUT30-specific CD4+ T cells (see sample FACS plot). In the middle row, the FACS diagram and graph demonstrate the induction of MUT08-specific (mutation in Ddx23) CD4+ T cells after immunization with a biepitope encoding MUT33 and MUT08. Bottom line, mice were immunized with a polyepitope encoding 16 different mutations including MUT08, MUT33 and MUT27 (see Table 8). FACS chart and plot illustrate that MUT27 reactive T cells have CD8 phenotype.

Таблица 8. Обзор мутаций и названий генов, кодируемых моно-, би- и полиэпитопные РНК-вакциныTable 8. Overview of mutations and gene names encoded by mono-, bi-, and polyepitope RNA vaccines

Figure 00000014
Figure 00000014

Такой же полиэпитоп использовали для получения данных, представленных на фиг. 13. Диаграмма демонстрирует данные ELISPOT после повторной стимуляции спленоцитов контрольным (VSV-NP), MUT08, MUT27 и MUT33 пептидами, доказывая, что вакцина с полиэпитопом может индуцировать специфический Т-клеточные ответы против некоторых различных мутаций. The same polyepitope was used to obtain the data presented in FIG. 13. The diagram shows ELISPOT data after re-stimulation of splenocytes with control (VSV-NP), MUT08, MUT27 and MUT33 peptides, proving that the polyepitope vaccine can induce specific T cell responses against several different mutations.

В совокупности данные демонстрируют возможность индукции специфичных к мутации Т-клеток с помощью моно-, би- и полиэпитопов. Более того, данные демонстрируют индукцию CD4+ и CD8+ Т-клеток и индукцию некоторых различных специфичностей из одного конструкта. Taken together, the data demonstrate the ability to induce mutation-specific T cells with mono-, bi-, and polyepitopes. Moreover, the data demonstrate the induction of CD4 + and CD8 + T cells and the induction of some different specificities from a single construct.

Иммунизация модельными эпитопамиImmunization with model epitopes

Для дальнейшего описания дизайна полиэпитопной РНК-вакцины конструировали последовательности ДНК, в которые включены пять различных известных модельных эпитопов, в том числе один эпитоп MHC класса II (овальбумин класса I (SIINFEKL), класса II (OVA класса II), нуклеопротеин гриппа (Inf-NP), нуклеопротеин вируса везикулярного стоматита (VSV-NP) и родственный тирозиназе белок 2 (Trp2)). Эпитопы были разделены таким же глицин/сериновым линкером длиной 9 ак, что и использованный для мутантного полиэпитопа. Эти конструкты клонировали в каркас pST1-2BgUTR-A120 для in vitro транскрипции мРНК. To further describe the design of the polyepitope RNA vaccine, DNA sequences were constructed that included five different known model epitopes, including one MHC class II epitope (class I ovalbumin (SIINFEKL), class II (OVA class II), influenza nucleoprotein (Inf- NP), vesicular stomatitis virus nucleoprotein (VSV-NP), and tyrosinase-related protein 2 (Trp2)). The epitopes were separated by the same 9 aa glycine/serine linker used for the mutant polyepitope. These constructs were cloned into the pST1-2BgUTR-A120 framework for in vitro mRNA transcription.

In vitro транскрибированные РНК использовали для вакцинации пяти мышей C57BL/6 внутриузловой иммунизацией (четыре иммунизации по 20 мкг РНК в паховые лимфоузлы). Через пять дней после иммунизации собирали для анализа из мышей образцы крови и спленоцитов. Фиг. 14А демонстрирует анализ «IFN-γ ELISPOT» спленоцитов, повторно стимулированных указанными пептидами. Ясно видно, что все три эпитопа MHC класса I (SIINFEKL, Trp2 и VSV-NP) индуцируют очень большое количество антиген-специфичных CD8+ T-клеток. Также эпитоп OVA класса II (эпитоп MHC класса II) индуцирует сильный CD4+ Т-клеточный ответ. Четвертый эпитоп MHC класса I анализировали окрашиванием Inf-NP-специфичных CD8+ Т-клеток флуоресцентно меченным пентамерным MHC-пептидным комплексом (Пентамером) (фиг. 14B).In vitro transcribed RNAs were used to vaccinate five C57BL/6 mice with intranodal immunization (four immunizations of 20 μg RNA in the inguinal lymph nodes). Five days after immunization, blood and splenocyte samples were collected from mice for analysis. Fig. 14A shows an "IFN-γ ELISPOT" analysis of splenocytes restimulated with the indicated peptides. It is clearly seen that all three MHC class I epitopes (SIINFEKL, Trp2 and VSV-NP) induce very large numbers of antigen-specific CD8 + T cells. Also, an OVA class II epitope (MHC class II epitope) induces a strong CD4 + T cell response. The fourth MHC class I epitope was analyzed by staining Inf-NP-specific CD8 + T cells with a fluorescently labeled pentameric MHC-peptide complex (Pentamer) (FIG. 14B).

Эти данные доказывают, что полиэпитопный дизайн с использованием глицин/серинового линкера для отделения различных иммуногенных эпитопов MHC класса I и класса II, способен индуцировать специфичные Т-клетки против каждого кодируемого эпитопа, вне зависимости от иммунодоминирования.These data prove that a polyepitope design using a glycine/serine linker to separate different MHC class I and class II immunogenic epitopes is able to induce specific T cells against each encoded epitope, regardless of immunodominance.

Противоопухолевый ответ после терапии кодирующей мутации полиэпитопной РНК-вакцинойAntitumor response after coding mutation therapy with a polyepitope RNA vaccine

Такой же полиэпитоп, иммуногенность которого была проанализирована на фиг. 13, был использован для исследования противоопухолевой активности кодирующих мутации РНК против опухолевых клеток B16F10. В частности, группы мышей C57BL/6 (n=10) подкожно инокулировали 1 x 105 клеток меланомы B16F10 в бок. На 3, 6, 10, 17 и 21 дни мышей иммунизировали полиэпитопной РНК с помощью реактива для липосомальной трансфекции. Контрольную группу инъецировали только липосомами.The same polyepitope whose immunogenicity was analyzed in FIG. 13 was used to investigate the antitumor activity of mutation-encoding RNAs against B16F10 tumor cells. Specifically, groups of C57BL/6 mice (n=10) were subcutaneously inoculated with 1 x 10 5 B16F10 melanoma cells in the flank. On days 3, 6, 10, 17 and 21, mice were immunized with polyepitope RNA using a liposomal transfection reagent. The control group was injected with liposomes only.

Фиг. 21 демонстрирует кривые выживания групп, раскрывая значимо улучшенное медианное выживание в течение 27 дней, с 1 из 10 мышей, выжившей без опухоли, по сравнению с 18, 5 днями медианного выживания в контрольной группе.Fig. 21 shows group survival curves, revealing significantly improved median survival at 27 days, with 1 in 10 mice surviving without tumor, compared to 18.5 days of median survival in the control group.

Противоопухолевый ответ после терапии комбинацией мутантного и нормального пептидаAntitumor response after therapy with a combination of mutant and normal peptide

Противоопухолевую активность проверенных мутаций оценивали в терапевтическом in vivo опухолевом эксперименте с использованием MUT30 в качестве пептидной вакцины. В частности, группы мышей C57BL/6 (n=8) подкожно инокулировали 1 x 105 клеток меланомы B16F10 в бок. В дни 3, 10 и 17 мышей иммунизировали пептидами MUT30, родственным тирозиназе белком 2 (Trp2180-188) с использованием полиI:C в качестве адъюванта, или комбинацией обоих пептидов. Trp2 является известным эпитопом CD8+, экспрессируемым клетками меланомы B16F10.The antitumor activity of the tested mutations was evaluated in an in vivo therapeutic tumor experiment using MUT30 as a peptide vaccine. Specifically, groups of C57BL/6 mice (n=8) were subcutaneously inoculated with 1 x 10 5 B16F10 melanoma cells in the flank. On days 3, 10 and 17, mice were immunized with MUT30 peptides, tyrosinase-related protein 2 (Trp2 180-188 ) using polyI:C as an adjuvant, or a combination of both peptides. Trp2 is a known CD8 + epitope expressed by B16F10 melanoma cells.

Фиг. 15А демонстрирует средний рост опухолей в группах. Можно ясно увидеть, что до дня 28 рост опухолей почти полностью ингибирован в группе, которая была иммунизирована комбинацией известного CD8+ T-клеточного эпитопа и индуцирующего СD4+ T-клетки MUT30. Известный эпитоп Trp2 отдельно не достаточен для обеспечения хорошего противоопухолевого эффекта в данных условиях, но в начале эксперимента обе группы с одиночной терапией (MUT30 и Trp2) все еще обеспечивают ингибирование опухолевого роста в сравнении с необработанной группой вплоть до 25 дня. Эти данные подкрепляются кривыми выживания, показанными на фиг. 15В. Ясно видно, что медиана выживания повышается у мышей, инъецированных одиночными пептидами, с 1/8 мышей выживших в группе, вакцинированных Trp2. Кроме того, группа, обработанная обоими пептидами демонстрирует еще более лучшую медиану выживания с 2/8 выживших мышей. Fig. 15A shows the average growth of tumors in groups. It can be clearly seen that up to day 28, tumor growth was almost completely inhibited in the group that was immunized with the combination of the known CD8 + T cell epitope and the CD4 + T cell inducing MUT30. The known Trp2 epitope alone is not sufficient to provide a good antitumor effect under these conditions, but at the start of the experiment, both single therapy groups (MUT30 and Trp2) still provide tumor growth inhibition compared to the untreated group up to day 25. These data are supported by the survival curves shown in Fig. 15V. It is clearly seen that the median survival is increased in mice injected with single peptides, with 1/8 of the mice surviving in the Trp2 vaccinated group. In addition, the group treated with both peptides showed an even better median survival with 2/8 mice surviving.

В совокупности оба эпитопа действуют синергично при обеспечении сильного противоопухолевого эффекта. Together, both epitopes act synergistically to provide a strong antitumor effect.

Пример 9. Среда для достоверной детекции соматических мутаций и применение к клеткам меланомы B16-F10Example 9 Medium for Reliable Detection of Somatic Mutations and Application to B16-F10 Melanoma Cells

NGS объективен, поскольку позволяет осуществить высокопроизводительное обнаружение вариаций в целом геноме или целевых областях, таких как кодирующие белки экзоны. NGS is objective because it allows high-throughput detection of variations in the whole genome or target regions such as protein-coding exons.

Однако, несмотря на революционность, платформа NGS все еще склонна к ошибкам, ведущим к ошибочному прогнозу вариаций. Более того, качество результатов зависит от параметров экспериментального дизайна и методологий анализа. Хотя прогнозы вариаций, как правило, включают баллы, разработанные для того, чтобы отличить истинные вариации от ошибок, практичность этих баллов не полностью понятна, как и их интерпретация в отношении оптимизации экспериментов. Это особенно верно при сравнении состояния тканей, например, при сравнении опухоли и нормальной ткани, на предмет соматических мутаций. Как следствие, исследователи вынуждены полагаться на личный опыт, чтобы определить параметры эксперимента и произвольные пороги фильтрации для выбора мутаций.However, despite being revolutionary, the NGS platform is still prone to errors leading to misprediction of variations. Moreover, the quality of the results depends on the experimental design parameters and analysis methodologies. Although predictions of variation typically include scores designed to distinguish between true variation and error, the practicality of these scores is not fully understood, nor is their interpretation in relation to the optimization of experiments. This is especially true when comparing the state of tissues, for example when comparing tumor and normal tissue, for somatic mutations. As a consequence, researchers are forced to rely on personal experience to determine experimental parameters and arbitrary filtering thresholds for selecting mutations.

Наше исследование нацелено на а) создание среды для сопоставления параметров и способов идентификации соматических мутаций и b), назначения значения достоверности выявленным мутациям. Мы трижды отсеквенировали образцы из мышей C57BL/6 и клеточной линии меланомы B16-F10. С помощью этих данных мы получили частоту ложноположительных результатов для соматических мутаций, меру, которую мы затем использовали для оценки существующего программного обеспечения для обнаружения мутаций и для оценки лабораторных протоколов.Our study is aimed at a) creating an environment for comparing parameters and methods for identifying somatic mutations and b) assigning a confidence value to the identified mutations. We sequenced samples three times from C57BL/6 mice and the B16-F10 melanoma cell line. From this data, we derived the false positive rate for somatic mutations, a measure that we then used to evaluate existing mutation detection software and to evaluate laboratory protocols.

Различные экспериментальные и алгоритмические факторы вносят вклад в частоту ложноположительных результатов для вариаций, обнаруженных NGS [Nothnagel, M. et al., Hum. Genet. 2011 Feb 23 [Epub ahead of print]]. Источники ошибок включают артефакты ПЦР, ошибки при затравке [Hansen, K.D., et al., Nucleic. Acids. Res. 38, e131 (2010); Taub, M.A. et al., Genome Med. 2, 87 (2010)] и направленное обогащение [Bainbridge, M.N. et al., Genome Biol. 11, R62 (2010)], эффекты последовательностей [Nakamura, K. et al., Acids Res.(2011) впервые опубликовано онлайн 16 мая 2011 года doi:10.1093/nar/gkr344], прогнозы оснований, вызывающие ошибки последовательности [Kircher, M. et al., Genome Biol. 10, R83 (2009). Epub 2009 Aug 14] и выравнивание ридов [Lassmann, T. et al., Bioinformatics 27, 130–131 (2011)], вызывая изменчивость в покрытии и ошибки секвенирования, которые влияют на дальнейший анализ, например, прогноз вариантов вокруг вставок-делеций [Li, H., Bioinformatics 27, 1157-1158 (2011)].Various experimental and algorithmic factors contribute to the false positive rate for variations detected by NGS [Nothnagel, M. et al., Hum. Genet. 2011 Feb 23 [Epub ahead of print]]. Sources of errors include PCR artifacts, primer errors [Hansen, K.D., et al., Nucleic. Acids. Res. 38, e131 (2010); Taub, M.A. et al., Genome Med. 2, 87 (2010)] and targeted enrichment [Bainbridge, M.N. et al., Genome Biol. 11, R62 (2010)], sequence effects [Nakamura, K. et al., Acids Res.(2011) first published online May 16, 2011 doi:10.1093/nar/gkr344], base predictions causing sequence errors [Kircher, M. et al., Genome Biol. 10, R83 (2009). Epub 2009 Aug 14] and read alignment [Lassmann, T. et al., Bioinformatics 27, 130–131 (2011)], causing variability in coverage and sequencing errors that affect further analysis, such as prediction of variants around insert-deletions [Li, H., Bioinformatics 27, 1157-1158 (2011)].

Для указания вклада различных источников ошибок в прогноз соматических мутаций общая статистическая модель не была описана; только индивидуальные аспекты охвачены без удаления всех систематических ошибок. Недавние вычислительные способы измерения ожидаемого количества прогнозов ложно положительных мутаций включают использование соотношения перехода/трансверсии набора вариаций [Zhang, Z., Gerstein, M., Nucleic Acids Res 31, 5338-5348 (2003); DePristo, M.A. et al., Nature Genetics 43, 491–498 (2011)], машинное обучение [DePristo, M.A. et al., Nature Genetics 43, 491–498 (2011)] и ошибки наследования при работе с семейными геномами [Ewen, K.R. et al., Am. J. Hum. Genet. 67, 727-736 (2000)] или объединенными образцами [Druley, T.E. et al., Nature Methods 6, 263 - 265 (2009); Bansal, V., Bioinformatics 26, 318-324 (2010)]. В целях оптимизации Druley et al. [Druley, T.E. et al., Nature Methods 6, 263 - 265 (2009)] полагались на короткие фрагменты плазмидной последовательности, которые, однако, могут не быть репрезентативными для образца. Для набора однонуклеотидных вариаций (SNV) и выбранных экспериментов, сравнение с SNV, идентифицированными другими методами осуществимо [Van Tassell, C.P. et al., Nature Methods 5, 247 - 252 (2008)] но трудно оценимо в рамках новых соматических мутаций.To indicate the contribution of various error sources to the prediction of somatic mutations, a general statistical model has not been described; only individual aspects are covered without removing all systematic errors. Recent computational methods for measuring the expected number of false positive mutation predictions include using the variation set transition/transversion ratio [Zhang, Z., Gerstein, M., Nucleic Acids Res 31, 5338-5348 (2003); DePristo, M.A. et al., Nature Genetics 43, 491–498 (2011)], machine learning [DePristo, M.A. et al., Nature Genetics 43, 491–498 (2011)] and inheritance errors when working with familial genomes [Ewen, K.R. et al., Am. J. Hum. Genet. 67, 727-736 (2000)] or pooled samples [Druley, T.E. et al., Nature Methods 6, 263-265 (2009); Bansal, V., Bioinformatics 26, 318-324 (2010)]. For optimization purposes, Druley et al. [Druley, T.E. et al., Nature Methods 6, 263 - 265 (2009)] relied on short fragments of the plasmid sequence, which, however, may not be representative of the sample. For a set of single nucleotide variations (SNVs) and selected experiments, comparison with SNVs identified by other methods is feasible [Van Tassell, C.P. et al., Nature Methods 5, 247 - 252 (2008)] but difficult to assess in terms of new somatic mutations.

Используя проект секвенирования экзома в качестве примера, мы предлагаем рассчитать частоту ложноположительных результатов (FDR) только на основании данных NGS. Способ не только применим к выбору и приоритизации диагностических и терапевтических мишеней, но также поддерживает разработку алгоритмов и способов, позволяя нам определить достоверные рекомендации для похожих экспериментов. Using the exome sequencing project as an example, we propose to calculate the false positive rate (FDR) from NGS data alone. The method is not only applicable to the selection and prioritization of diagnostic and therapeutic targets, but also supports the development of algorithms and methods, allowing us to determine valid recommendations for similar experiments.

Для обнаружения мутаций, ДНК из ткани хвоста трех мышей C57BL/6 (black6) (из одного выводка) и ДНК из клеток меланомы B16-F10 (B16), в трех повторах, индивидуально обогащали по белок-кодирующим экзонам («Agilent Sure Select Whole Mouse Exome»), с получением в итоге 6 образцов. РНК экстрагировали из клеток В16 трижды. Одноконцевые 50 нт (1x50 нт) и двухконцевые 100 нт (2х100 нт) риды получали на «Illumina HiSeq 2000». Каждый образец загружали в индивидуальную дорожку, что в среднем дает 104 миллиона ридов на дорожку. ДНК-риды выравнивали по референсному мышиному геному с помощью «bwa» [Li, H. Durbin, R., Bioinformatics 25, 1754-1760 (2009)], а РНК-риды выравнивали с помощью «bowtie» [Langmead, B. et al., Genome Biol. 10, R25 (2009)]. Среднее покрытие для 97% целевых областей в библиотеках 1х50 нт составило 38, а эксперименты 2х100 нт дали среднее покрытие для 98% целевых областей равное 165.To detect mutations, DNA from the tail tissue of three C57BL/6 (black6) mice (from the same litter) and DNA from B16-F10 (B16) melanoma cells, in triplicate, were individually enriched for protein-coding exons (Agilent Sure Select Whole Mouse Exome"), resulting in a total of 6 samples. RNA was extracted from B16 cells three times. Single-ended 50 nt (1 x 50 nt) and double-ended 100 nt (2 x 100 nt) reads were prepared on an Illumina HiSeq 2000. Each sample was loaded into an individual lane, resulting in an average of 104 million reads per lane. DNA-reads were aligned to the reference mouse genome using "bwa" [Li, H. Durbin, R., Bioinformatics 25, 1754-1760 (2009)], and RNA-reads were aligned using "bowtie" [Langmead, B. et al., Genome Biol. 10, R25 (2009)]. The average coverage for 97% of the target areas in the 1x50 nt libraries was 38, and the 2x100 nt experiments gave an average coverage for 98% of the target areas of 165.

Соматические вариации независимо идентифицировали с помощью пакетов программного обеспечения «SAMtools» [Li, H. et al., Bioinformatics 25, 2078-2079 (2009)], «GATK» [DePristo, M.A. et al., Nature Genetics 43, 491–498 (2011)] и «SomaticSNiPer» [Ding, L. et al., Hum. Mol. Genet (2010) впервые опубликовано он-лайн 15 сентября 2010 года] (фиг. 16) сравнением однонуклеотидных вариаций, обнаруженных в образцах B16, с соответствующими локусами в образцах black6 (клетки B16 изначально были получены из мышей black6). Потенциальные мутации фильтровали согласно рекомендациям авторов соответствующего программного обеспечения («SAMtools» и «GATK») или отбором соответствующего нижнего порога для соматического балла «SomaticSNiPer», соответственно.Somatic variations were independently identified using software packages "SAMtools" [Li, H. et al., Bioinformatics 25, 2078-2079 (2009)], "GATK" [DePristo, M.A. et al., Nature Genetics 43, 491–498 (2011)] and "SomaticSNiPer" [Ding, L. et al., Hum. Mol. Genet (2010) first published online September 15, 2010] (Fig. 16) comparing single nucleotide variations found in B16 samples with corresponding loci in black6 samples (B16 cells were originally derived from black6 mice). Potential mutations were filtered according to the recommendations of the authors of the respective software ("SAMtools" and "GATK") or by selecting the appropriate lower threshold for the somatic score "SomaticSNiPer", respectively.

Для получения частоты ложноположительных результатов (FDR) при обнаружении мутаций, вначале мы осуществили пересечение участков мутаций и получили 1355 высококачественных соматических мутаций в качестве консенсуса среди всех трех программ (фиг. 17). Однако наблюдаемые различия в результатах примененных программных инструментов являются существенными. Для того чтобы избежать ошибочных выводов, мы разработали способ назначения FDR каждой мутации с помощью реплик. Технические повторы образца должны давать идентичные результаты, и любая детектируемая мутация в данном сравнении «сам против себя» является ложно положительной. Таким образом, для определения частоты ложноположительных результатов при детекции соматических мутаций в опухолевом образце относительно нормального образца («сравнение с опухолью»), мы может использовать технический повтор нормального образца в качестве эталона для оценки количества ложно положительных результатов.To obtain the false positive rate (FDR) for mutation detection, we first crossed mutation sites and obtained 1355 high quality somatic mutations as a consensus among all three programs (Fig. 17). However, the observed differences in the results of the applied software tools are significant. In order to avoid erroneous conclusions, we have developed a way to assign FDR to each mutation using replicas. Technical replicates of a sample should produce identical results, and any detectable mutation in a given self-versus-self comparison is a false positive. Thus, in order to determine the false positive rate of detecting somatic mutations in a tumor sample relative to a normal sample (“tumor comparison”), we can use the technical replicate of a normal sample as a benchmark for estimating the number of false positives.

На фиг. 18А продемонстрированы примеры вариаций, обнаруженных в данных black6/B16, включая соматическую мутацию (слева), несоматическую вариацию относительно эталона (посередине), и возможные ложно положительные результаты (справа). Каждая соматическая мутация может быть ассоциирована с баллом качества Q. Количество ложно положительных результатов при сравнении с опухолью указывает на несколько ложно положительных результатов при сравнении «сам против себя». Таким образом, для данной мутации с баллом качества Q, детектируемым при сравнении с опухолью, мы оцениваем частоту ложноположительных результатов вычислением соотношения мутаций, обнаруженных при сравнении «сам против себя», с баллом Q или лучше к общему количеству мутаций, обнаруженных при сравнении с опухолью, с баллом Q или лучше.In FIG. 18A shows examples of variation found in black6/B16 data, including somatic mutation (left), non-somatic variation relative to reference (middle), and possible false positives (right). Each somatic mutation can be associated with a Q quality score. The number of false positives compared with a tumor indicates several false positives when compared self-versus-self. Thus, for a given mutation with a Q quality score detected when compared to the tumor, we estimate the false positive rate by calculating the ratio of mutations found in the self-versus-self comparison with a Q score or better to the total number of mutations found in the comparison with the tumor. , with a Q score or better.

Трудности возникают при определении Q, так как большинство сред детекции мутаций вычисляют несколько баллов качества. Здесь мы применяем классификатор «случайный лес» [Breiman, L., Statist. Sci. 16, 199-231 (2001)] для объединения множества баллов в один балл качества Q. Мы ссылаемся на раздел методов для подробностей относительно деталей балла качества и вычислений FDR.Difficulties arise in determining Q, since most mutation detection environments calculate several quality scores. Here we use the random forest classifier [Breiman, L., Statist. sci. 16, 199-231 (2001)] to combine multiple scores into a single Q quality score. We refer to the methods section for details on the details of the quality score and FDR calculations.

Потенциальная систематическая ошибка оценки в сравнении способов заключается в разном покрытии; мы, таким образом, нормализуем частоту ложноположительных результатов для покрытия: A potential estimation bias in method comparisons is due to different coverage; we thus normalize the false positive rate to cover:

Figure 00000015
Figure 00000015

Мы вычисляем общее покрытие путем подсчета всех оснований референсного генома, которые покрываются как опухолевым так и нормальным образцом или обоими образцами «сам против себя», соответственно. We calculate total coverage by counting all bases of the reference genome that are covered by both the tumor and normal samples, or both self-versus-self samples, respectively.

Путем оценки количества ложноположительных и положительных результатов при каждой частоте ложноположительных результатов FDR (см. способы), мы получили кривые соотношений правильного и ложного обнаружения сигналов (ROC) и рассчитали AUC (площадь под кривой) для каждой способа обнаружения мутаций, что, таким образом, позволило осуществить сравнение стратегий выявления мутаций (фиг. 18В). By estimating the number of false positives and positives at each FDR false positive rate (see methods), we generated true/false detection ratio (ROC) curves and calculated the AUC (area under the curve) for each mutation detection method, thus allowed comparison of mutation detection strategies (FIG. 18B).

Более того, отбор эталонных данных может повлиять на расчет FDR. С помощью доступных данных black6/B16 возможно создать 18 триплетов (комбинаций black6 vs. black6 и black6 vs. b16). При сравнении полученных распределений FDR для наборов соматических мутаций, результаты являются согласуемые (фиг. 18B). Moreover, the selection of reference data may affect the FDR calculation. With the available black6/B16 data it is possible to create 18 triplets (black6 vs. black6 and black6 vs. b16 combinations). When comparing the resulting FDR distributions for sets of somatic mutations, the results are consistent (Fig. 18B).

Используя это определение частоты ложноположительных результатов, мы получили стандартную среду для оценки влияния множества экспериментальных и алгоритмических параметров на полученный набор соматических мутаций. Затем мы применили эту среду для изучения влияния программных инструментов, покрытия, двухконцевого секвенирования и количества технических реплик на идентификацию соматических мутаций. Using this definition of the false positive rate, we have obtained a standard environment for assessing the influence of a variety of experimental and algorithmic parameters on the resulting set of somatic mutations. We then applied this environment to study the effect of software tools, coverage, double-ended sequencing, and the number of technical cues on the identification of somatic mutations.

Во-первых, выбор программного инструмента оказывает четкое воздействие на идентифицированные соматические мутации (фиг. 19А). В протестированных данных «SAMtools» дал наиболее сильное обогащение истинных положительных результатов в наборе соматических мутаций, ранжированных по FDR. Однако следует отметить, что все инструменты предлагают много параметров и баллов качества для индивидуальных мутаций. Здесь, мы использовали настройки по умолчанию, указанные разработчиками алгоритма; мы ожидаем, что параметры могут быть оптимизированы и подчеркиваем, что определенная здесь среда FDR разработана для проведения и оценки такой оптимизации. First, the choice of software tool has a clear impact on the identified somatic mutations (FIG. 19A). In the data tested, "SAMtools" gave the strongest enrichment in true positives in the FDR-ranked set of somatic mutations. However, it should be noted that all tools offer many parameters and quality scores for individual mutations. Here, we have used the default settings specified by the developers of the algorithm; we expect that the parameters can be optimized and emphasize that the FDR environment defined here is designed to perform and evaluate such optimization.

Для описанного эксперимента секвенирования B16 мы секвенировали каждый образец в индивидуальной проточной кювете и достигли 38-кратного среднего покрытия оснований целевой области для индивидуальных образцов. Однако это покрытие не нужно для получения одинаково хорошего набора соматических мутаций, что может снизить затраты. К тому же влияние глубины покрытия на полногеномную детекцию SNV недавно обсуждалось [Ajay, S.S. et al., Genome Res. 21, 1498-1505 (2011)]. Для изучения эффекта покрытия на данных захвата экзонов, мы уменьшили количество выровненных по последовательностям ридов для каждой библиотеки 1/50 нт для получения примерного покрытия 5, 10 и 20 раз, соответственно, и затем повторно применили алгоритмы прогнозирования мутаций. Как и ожидалось, более высокое покрытие приводит к лучшему (т.е. с меньшим количеством ложноположительных результатов) набору соматических мутаций, несмотря на то, что улучшение с 20-кратного покрытия до максимального покрытия является незначительным (фиг. 19В). For the described B16 sequencing experiment, we sequenced each sample in an individual flow cell and achieved a 38-fold average base coverage of the target region for the individual samples. However, this coverage is not needed to obtain an equally good set of somatic mutations, which can reduce costs. In addition, the effect of coverage depth on genome-wide detection of SNV has recently been discussed [Ajay, S.S. et al., Genome Res. 21, 1498-1505 (2011)]. To study the effect of coverage on exon capture data, we reduced the number of sequence-aligned reads for each library by 1/50 nt to obtain an approximate coverage of 5, 10, and 20 times, respectively, and then reapplied the mutation prediction algorithms. As expected, higher coverage results in a better (ie, fewer false positives) set of somatic mutations, although the improvement from 20-fold coverage to maximum coverage is not significant (FIG. 19B).

Несложно смоделировать и оценить различные экспериментальные параметры с помощью доступных данных и среды. При сравнении дубликатов с трипликатами, оказалось, что трипликаты не несут пользы по сравнению с дубликатами (фиг. 19С), хотя дубликаты несут явное улучшение по сравнению с исследованием вообще без реплик. По показателю соотношения соматических мутаций в данных наборах, мы видим обогащение при FDR 5% с 24,2% для прогона без реплик до 71,2% для дубликатов и 85,8% для трипликатов. Несмотря на обогащение, использование перекрытия трипликатов удаляет больше мутаций с низким FDR, чем с высоким FDR, на что указывает более низкий ROC AUC и смещение кривой влево (фиг. 19С): специфичность немного повышается за счет более низкой чувствительности. It is easy to model and evaluate various experimental parameters with the available data and environment. When comparing duplicates with triplicates, triplicates were found to be of no benefit over duplicates (FIG. 19C), although duplicates showed a clear improvement over a study with no replicas at all. In terms of the ratio of somatic mutations in these sets, we see an enrichment at FDR 5% from 24.2% for the no-replica run to 71.2% for duplicates and 85.8% for triplicates. Despite enrichment, the use of triplicate overlap removed more low FDR mutations than high FDR mutations, as indicated by a lower ROC AUC and a curve shift to the left (FIG. 19C): specificity is slightly improved by lower sensitivity.

Дополнительно секвенированная 2х100 нт библиотека была использована для моделирования 1х100, двух 2х50, и двух 1х50 нт библиотек, соответственно, путем in silicio удаления второго рида и/или 3’ и 5’ концов ридов, что дает, в общем, 5 смоделированных библиотек. Эти библиотеки сравнивали с использованием вычисленных FDR спрогнозированных мутаций (фиг. 19D). Несмотря на намного более высокое среднее покрытие (больше чем 77 против 38), соматические мутации, обнаруженные с помощью 2x50 5’ и 1х100 нт библиотек имеют более низкие ROC AUC и, таким образом, худшее распределение FDR, чем у 1x50 нт библиотеки. Это происходит из-за накопления мутаций с высоким FDR в областях с низким уровнем покрытия, поскольку наборы мутаций с низким FDR являются очень похожими. Следствие заключается в том, что оптимальная длина секвенирования либо должна быть незначительной, чтобы секвенируемые основания концентрировались вокруг последовательностей зондов захвата (что, тем не менее, потенциально приводит к потере информации о соматическом статусе мутаций в непокрытых областях), либо должна быть близкой к длине фрагмента (2х100 нт = 200 нт общая длина для ~250 нт фрагментов в нашем случае), эффективно заполняя просветы в покрытии. Этот вывод также поддержан ROC AUC 2x50 нт 3’ библиотеки (смоделированной с помощью только 3'-концов 2х100 нт библиотеки), которое выше, чем ROC AUC 2х50 нт 5' библиотеки (смоделированной с помощью только 5' концов 2х100 нт библиотеки), несмотря на более низкое качество оснований в 3'-концах ридов.An additional 2 x 100 nt sequenced library was used to simulate 1 x 100, two 2 x 50, and two 1 x 50 nt libraries, respectively, by in silicio removal of the second read and/or the 3' and 5' ends of the reads, giving a total of 5 simulated libraries. These libraries were compared using calculated FDR predicted mutations (FIG. 19D). Despite a much higher mean coverage (greater than 77 vs 38), somatic mutations detected with 2x50 5' and 1x100 nt libraries have lower ROC AUCs and thus worse FDR distribution than the 1x50 nt library. This is due to the accumulation of high FDR mutations in areas of low coverage since the sets of low FDR mutations are very similar. The implication is that the optimal sequencing length should either be small so that sequenced bases concentrate around the capture probe sequences (which nevertheless potentially leads to loss of information about the somatic status of mutations in uncovered regions), or should be close to the fragment length. (2x100 nt = 200 nt total length for ~250 nt fragments in our case), effectively filling gaps in the coating. This conclusion is also supported by the ROC AUC of the 2x50 nt 3' library (modeled with only the 3' ends of the 2x100 nt library), which is higher than the ROC AUC of the 2x50 nt 5' library (modeled with only the 5' ends of the 2x100 nt library), despite to lower base quality at the 3' ends of the reads.

Эти наблюдения позволяют нам определить лучшие практические процедуры для обнаружения соматических мутаций. Среди всех оцененных параметров, 20-кратное покрытие в обоих образцах, и использование технического дубликата, позволяют достигнуть близких к оптимальным результатов в этих относительно гомогенных образцах, и это с учетом затрат. 1х50 нт библиотека, дающая примерно 100 миллионов ридов, по всей видимости, является наиболее прагматичным выбором для достижения данного покрытия. Это верно для всех возможных пар наборов данных. Мы ретроспективно применили эти настройки параметров, без использования дополнительного фильтрования для прогноза сырых вариантов, и рассчитали FDR для 50 выбранных мутаций из пересечения всех трех способов, как показано на фиг. 17. Все мутации были подтверждены комбинацией повторного секвенирования по Сэнгеру и ридами последовательностей B16-RNA-Seq. 44 из числа этих мутаций могли бы быть обнаружены с помощью 5% порога FDR (фиг. 20). В качестве отрицательного контроля мы повторно секвенировали локусы 44 спрогнозированных мутаций с высокими значениями FDR (> 50%) и проверили соответствующие последовательности в данных RNA-Seq. Мы обнаружили, что 37 из этих мутаций не подтверждаются, помимо того, что оставшиеся семь локусов потенциальных мутаций не покрывались ридами RNA-Seq и не были получены в реакции секвенирования.These observations allow us to determine the best practice procedures for the detection of somatic mutations. Among all the parameters evaluated, 20x coverage in both samples, and the use of a technical duplicate, achieve near-optimal results in these relatively homogeneous samples, and this is cost-adjusted. A 1x50 nt library, with approximately 100 million reads, appears to be the most pragmatic choice for achieving this coverage. This is true for all possible pairs of datasets. We applied these parameter settings retrospectively, without using additional filtering to predict crude variants, and calculated the FDR for 50 selected mutations from the intersection of all three methods, as shown in FIG. 17. All mutations were confirmed by a combination of Sanger resequencing and B16-RNA-Seq sequence reads. 44 of these mutations could be detected using a 5% FDR threshold (FIG. 20). As a negative control, we resequenced the loci of 44 predicted mutations with high FDR values (>50%) and checked the corresponding sequences in the RNA-Seq data. We found that 37 of these mutations were not confirmed, in addition to the fact that the remaining seven potential mutation loci were not covered by RNA-Seq reads and were not generated in the sequencing reaction.

Хотя мы показали применение среды по четырем конкретным вопросам, она отнюдь не ограничивается этими параметрами, и может быть применена для изучения влияния всех экспериментальных или алгоритмических параметров, например, влияния программного обеспечения для выравнивания, выбора системы мер для мутаций, или выбора оборудования для отбора экзома.Although we have shown the application of the environment in four specific questions, it is by no means limited to these parameters, and can be applied to study the influence of all experimental or algorithmic parameters, for example, the influence of software for alignment, the choice of scoring system for mutations, or the choice of exome selection equipment. .

Мы осуществили все эксперименты на наборе экспериментов с клетками меланомы В16; однако, способ не ограничен этими данными. Единственное требование заключается в доступности эталонного набора данных «сам против себя», что означает, что, по меньшей мере, один технический повтор неопухолевого образца должен быть получен для каждого нового протокола. Хотя наши эксперименты указывают на то, что способ надежен относительно выбора технического повтора в определенных пределах, что означает, что повтор не обязательно необходим в каждом одиночном эксперименте. Однако способ требует, чтобы различные показатели качества были сравнимыми между эталонным набором данных и оставшимися наборами данных.We performed all experiments on a set of experiments with B16 melanoma cells; however, the method is not limited to these data. The only requirement is that a self-versus-self reference dataset be available, which means that at least one technical replicate of a non-tumor sample must be obtained for each new protocol. Although our experiments indicate that the method is reliable with respect to the choice of technical repetition within certain limits, which means that repetition is not necessarily necessary in every single experiment. However, the method requires that the various quality measures be comparable between the reference dataset and the remaining datasets.

В рамках данного вклада мы инициировали использование статистической среды для детекции соматических мутаций с учетом частоты ложноположительных результатов. Эта среда не только применима для выбора диагностических или терапевтических мишеней, но также позволяет осуществить общее сравнение экспериментальных и расчетных стадий протокола на сгенерированных квазидостоверных данных. Здесь мы применили эту идею для того, чтобы осуществлять протокольные решения в отношении программных инструментов, покрытия, реплик, а также секвенирования парных концов. As part of this contribution, we initiated the use of a statistical environment for the detection of somatic mutations, taking into account the frequency of false positive results. This environment is not only applicable for the selection of diagnostic or therapeutic targets, but also allows a general comparison of the experimental and calculated steps of the protocol on the generated quasi-valid data. Here, we have applied this idea in order to implement protocol decisions regarding software tools, coverage, replicas, as well as paired-end sequencing.

СпособыWays

Захват и секвенирование библиотекиLibrary capture and sequencing

Секвенирование следующего поколения, ДНК-секвенирование: Захват экзома для ресеквенирования ДНК осуществляли с помощью теста для захвата на основе раствора «Agilent Sure-Select» [Gnirke, A., et al., Nat. Biotechnol. 27, 182-189 (2009)], в данном случае настроенном на захват всех известных мышиных экзонов.Next generation sequencing, DNA sequencing: Exome capture for DNA resequencing was performed using an Agilent Sure-Select solution-based capture assay [Gnirke, A., et al., Nat. Biotechnol. 27, 182-189 (2009)], in this case configured to capture all known mouse exons.

3 мкг очищенной геномной ДНК фрагментировали до 150-200 н.о. с помощью ультразвукового устройства «Covaris S2». Концы фрагментов гДНК достраивали с помощью T4 ДНК-полимеразы, фрагмента Кленова и фосфорилировали по 5' c помощью T4-полинуклеотидкиназы. гДНК-фрагменты с тупыми концами 3’-аденилировали с использованием фрагмента Кленова (от 3’ к 5’, экзо минус). С помощью T4 ДНК-лигазы 3’-концевые одиночные T-перекрывающиеся парные концевые адаптеры «Illumina» лигировали с гДНК-фрагментами при молярном соотношении адаптера к вставке геномной ДНК 10:1. Лигированные с адаптерами фрагменты гДНК обогащали, добавляли последовательности, специфичные для предварительного захвата и проточной кюветы, с помощью праймеров «Illumina PE PCR 1.0» и «2.0» и полимеразы «Herculase II» («Agilent») в течение 4 циклов ПЦР.3 μg of purified genomic DNA was fragmented to 150-200 bp. using the ultrasonic device "Covaris S2". The ends of the gDNA fragments were completed with T4 DNA polymerase, a Klenow fragment, and phosphorylated at 5' with T4 polynucleotide kinase. Blunt-ended gDNA fragments were 3'-adenylated using a Klenow fragment (3' to 5', exo minus). Using T4 DNA ligase, Illumina 3' single T-overlapping paired end adapters were ligated to gDNA fragments at a molar ratio of adapter to genomic DNA insert of 10:1. The gDNA fragments ligated with adapters were enriched, sequences specific for pre-capture and flow cell were added using Illumina PE PCR 1.0 and 2.0 primers and Herculase II polymerase (Agilent) during 4 PCR cycles.

500 нг лигированных с адаптером обогащенных ПЦР-фрагментов гДНК гибридизовали с РНК-библиотекой биотинилированных приманок цельного мышиного экзома «SureSelect» фирмы «Agilent» в течение 24 часов при 65°C. Гибридизованные комплексы гДНК/РНК-приманка удаляли с помощью покрытых стрептавидином магнитных микросфер. Комплексы гДНК/РНК-приманка отмывали и РНК-приманки отщепляли в ходе элюции в элюционном буфере «SureSelect», оставляя захваченные обогащенные ПЦР фрагменты гДНК с лигированными адаптерами. Фрагменты гДНК амплифицировали ПЦР после захвата с помощью ДНК-полимеразы «Herculase II» (Agilent) и праймеров «SureSelect GA» в течение 10 циклов.500 ng of adapter-ligated enriched PCR gDNA fragments were hybridized with Agilent's SureSelect Biotinylated Whole Mouse Exome Biotinylated Bait RNA Library for 24 hours at 65°C. Hybridized gDNA/bait RNA complexes were removed using streptavidin-coated magnetic microspheres. The gDNA/bait RNA complexes were washed out and the bait RNAs were cleaved during elution in SureSelect elution buffer, leaving the captured PCR-enriched gDNA fragments with ligated adapters. The gDNA fragments were amplified by PCR after capture with Herculase II DNA polymerase (Agilent) and SureSelect GA primers for 10 cycles.

Очистки осуществляли в 1,8х объеме магнитных микросфер «AMPure XP» («Agencourt»). Для контролей качества мы использовали тест «Qubit HS» от «Invitrogen», а размер фрагментов определяли с помощью теста «HS DNA» на «Bioanalyzer 2100» от «Agilent».Purifications were performed in 1.8x the volume of AMPure XP magnetic microspheres (Agencourt). For quality controls, we used the Qubit HS test from Invitrogen, and the fragment size was determined using the HS DNA test on a Bioanalyzer 2100 from Agilent.

Обогащенные экзомами библиотеки гДНК кластеризовали на «cBot» с помощью набора «Truseq SR cluster kit v2.5» с использованием 7 pM и секвенировали на «Illumina HiSeq200» с помощью набора «Truseq SBS».Exome-enriched gDNA libraries were clustered on cBot using the Truseq SR cluster kit v2.5 using 7 pM and sequenced on Illumina HiSeq200 using the Truseq SBS kit.

Анализ данных экзомаExome data analysis

Риды последовательностей выравнивали с помощью «bwa» (версия 0.5.8c) [Li, H. Durbin, R., Bioinformatics 25, 1754-1760 (2009)] при использовании настроек по умолчанию на референсной сборке мышиного генома mm9 [Mouse Genome Sequencing Consortium, Nature 420, 520-562 (2002)]. Неоднозначные риды - риды, которые картируются во многих местах генома согласно выходным данным «bwa» - были удалены. Оставшиеся выравнивания сортировали, индексировали и преобразовывали в бинарный и сжатый формат (BAM), и баллы качества ридов преобразовывали из стандартного для «Illumina» «phred+64» в стандартные баллы качества Сэнгера с помощью сценариев оболочки.Sequence reads were aligned with "bwa" (version 0.5.8c) [Li, H. Durbin, R., Bioinformatics 25, 1754-1760 (2009)] using the default settings on the mouse genome mm9 reference assembly [Mouse Genome Sequencing Consortium , Nature 420, 520-562 (2002)]. Ambiguous reads - reads that map to many places in the genome according to the "bwa" output - have been removed. The remaining alignments were sorted, indexed, and converted to binary and compressed format (BAM), and the read quality scores were converted from the standard Illumina "phred+64" quality scores to the standard Sanger quality scores using shell scripts.

Для каждой из секвенируемых дорожек идентифицировали мутации с помощью трех компьютерных программ: «SAMtools pileup» (версия 0.1.8) [Li, H. et al., Bioinformatics 25, 2078-2079 (2009)], «GATK» (версия 1.0.4418) [DePristo, M.A. et al., Nature Genetics 43, 491–498 (2011)], и «SomaticSniper» [Ding, L. et al., Hum. Mol. Genet (2010) впервые опубликовано онлайн 15 сентября 2010 года]. Для «SAMtools» использовали рекомендованные авторами настройки и критерии фильтра (http://sourceforge.net/apps/mediawiki/SAMtools/index.php?title=SAM_FAQ; обращение в сентябре 2011), включая фильтрацию первого круга, максимальное покрытие 200. Для второго круга фильтрации «SAMtools» минимальный балл качества вставки-делеции составлял 50, минимальное качество точечной мутации составляло 30. Для присваивания мутаций с помощью «GATK» мы следовали разработанным авторами указаниям с наработанными рекомендациями, которые представлены в пользовательском руководстве «GATK» (http://www.broadinstitute.org/gsa/wiki/index.php/The_Genome_Analysis_Toolkit; обращение в октябре 2010 года). Для каждого образца осуществляли локальное повторное выравнивание вокруг участков вставки-делеции с последующей рекалибровкой качества оснований. Модуль «UnifiedGenotyper» применяли к полученным в результате файлам с данными выравнивания. При необходимости известные полиморфизмы dbSNP [Sherry, S.T. et al., Nucleic Acids Res. 29, 308-311 (2009)] (версия 128 для mm9) дополняли индивидуальные стадии. Стадия рекалибровки балла варианта была опущена и заменена жесткой фильтрацией. Для присваивания мутаций с помощью «SomaticSniper» использовали параметры по умолчанию, а в дальнейшем рассматривали только прогнозируемые мутации с «соматическим баллом» равным 30 или больше. Кроме того, для каждого потенциально мутированного локуса мы требовали ненулевого покрытия в нормальной ткани и удаляли все мутации, расположенные в повторных последовательностях, как определено «RepeatMasker» из «UCSC Genome Browser» для сборки мышиного генома mm9 [Fujita, P.A. et al., Nucleic Acids Res. 39, 876-882 (2011)].Mutations were identified for each of the sequenced lanes using three computer programs: "SAMtools pileup" (version 0.1.8) [Li, H. et al., Bioinformatics 25, 2078-2079 (2009)], "GATK" (version 1.0. 4418) [DePristo, M.A. et al., Nature Genetics 43, 491–498 (2011)], and "SomaticSniper" [Ding, L. et al., Hum. Mol. Genet (2010) first published online September 15, 2010]. For "SAMtools" we used the settings and filter criteria recommended by the authors (http://sourceforge.net/apps/mediawiki/SAMtools/index.php?title=SAM_FAQ; accessed September 2011), including filtering the first round, the maximum coverage is 200. For In the second round of SAMtools filtering, the minimum insertion-deletion quality score was 50, and the minimum point mutation quality was 30. To assign mutations using GATK, we followed the best practices developed by the authors and presented in the GATK User Guide (http: //www.broadinstitute.org/gsa/wiki/index.php/The_Genome_Analysis_Toolkit; accessed October 2010). For each sample, a local realignment around insertion-deletion sites was performed followed by recalibration of base quality. The "UnifiedGenotyper" module was applied to the resulting alignment data files. Known dbSNP polymorphisms [Sherry, S.T. et al., Nucleic Acids Res. 29, 308-311 (2009)] (version 128 for mm9) complemented the individual stages. The variant score recalibration step was omitted and replaced with hard filtering. SomaticSniper used default parameters to assign mutations, and then only predicted mutations with a "somatic score" of 30 or greater were considered. In addition, for each potentially mutated locus, we required non-null coverage in normal tissue and removed all mutations located in repeat sequences as determined by the "RepeatMasker" of the "UCSC Genome Browser" for the assembly of the mouse mm9 genome [Fujita, P.A. et al., Nucleic Acids Res. 39, 876-882 (2011)].

РНК-Seq RNA-Seq

Библиотеки mRNA-seqcDNA с штрихкодами получали из 5 мкг общей РНК с помощью модифицированной версии протокола «Illumina mRNA-seq». мРНК выделяли с помощью магнитных микросфер «SeramagOligo(dT)» («Thermo Scientific»). Выделенную мРНК фрагментировали с помощью дивалентных катионов и нагревания, что приводило к получению фрагментов в диапазоне 160-200 нуклеотидов. Фрагментированную мРНК преобразовывали в кДНК с помощью случайных праймеров и «SuperScriptII» («Invitrogen») с последующим синтезом второй цепи с использованием полимеразы I и РНКазы H. Концы кДНК достраивали с помощью T4 ДНК-полимеразы, фрагмента Кленова и фосфорилировали по 5'-концам с помощью T4 полинуклеотидкиназы. кДНК-фрагменты с тупыми концами 3’-аденилировали с использованием фрагмента Кленова (от 3’ к 5’ экзо минус). С помощью T4 ДНК-лигазы 3’-концевые одиночные Т-перекрывающие мультиплекс-специфичные адаптеры «Illumina» лигировали с кДНК-фрагментами. кДНК-библиотеки очищали и отбирали по размеру 300 п.о. с помощью геля «E-Gel 2 % SizeSelect gel» («Invitrogen»). Обогащение, добавление последовательностей «Illumina» для индексирования из шести оснований и последовательностей для проточной кюветы осуществляли ПЦР с использованием ДНК-полимеразы «Phusion» («Finnzymes»). Очистки осуществляли в 1,8 х объеме магнитных микросфер «AMPure XP».Barcoded mRNA-seqcDNA libraries were generated from 5 µg of total RNA using a modified version of the Illumina mRNA-seq protocol. mRNA was isolated using SeramagOligo(dT) magnetic microspheres (Thermo Scientific). The isolated mRNA was fragmented using divalent cations and heating, resulting in fragments in the range of 160-200 nucleotides. Fragmented mRNA was converted into cDNA using random primers and SuperScriptII (Invitrogen), followed by second strand synthesis using polymerase I and RNase H. The cDNA ends were completed using T4 DNA polymerase, Klenow fragment and phosphorylated at the 5' ends using T4 polynucleotide kinase. Blunt-ended cDNA fragments were 3'-adenylated using a Klenow fragment (3' to 5' exo minus). Using T4 DNA ligase, 3'-terminal single T-overlapping Illumina multiplex-specific adapters were ligated to cDNA fragments. cDNA libraries were purified and sized to 300 bp. using E-Gel 2% SizeSelect gel (Invitrogen). Enrichment, addition of six base Illumina indexing sequences and flow cell sequences was performed by PCR using Phusion DNA polymerase (Finnzymes). Purifications were performed in 1.8 x the volume of AMPure XP magnetic microspheres.

Библиотеки RNA-seq с штрихкодами кластеризовали на «cBot» с помощью набора «Truseq SR cluster kit v2.5» с использованием 7 pM и секвенировали на «Illumina HiSeq200» с помощью набора «Truseq SBS».Barcoded RNA-seq libraries were clustered on cBot using the Truseq SR cluster kit v2.5 using 7 pM and sequenced on Illumina HiSeq200 using the Truseq SBS kit.

Сырые выходные данные HiSeq обрабатывали согласно стандартному протоколу «Illumina», включая удаление ридов низкого качества и разуплотнение. Риды последовательностей затем выравнивали по референсной геномной последовательности [Mouse Genome Sequencing Consortium, Nature 420, 520-562 (2002)] с помощью «bowtie» [Langmead, B. et al., Genome Biol. 10, R25 (2009)]. Координаты выравнивания сравнивали с координатами экзонов транскриптов RefSeq [Pruitt, K.D. et al., Nucleic Acids Res. 33, 501-504 (2005)] и для каждого транскрипта записывали количества перекрывающих выравниваний. Риды последовательностей, которые не выравнивались с геномной последовательностью, выравнивали относительно базы данных всех возможных экзон-экзонных соединяющих последовательностей транскриптов RefSeq [Pruitt, K.D. et al., Nucleic Acids Res. 33, 501-504 (2005)]. Координаты выравнивания сравнивали с координатами экзонов RefSeq и координатами соединений, риды подсчитывали, и нормализовали относительно RPKM (количество ридов, которые картируются на килобазу нуклеотидов транскрипта на миллион картированных ридов) [Mortazavi, A. et al., Nat. Methods 5, 621-628 (2008)]) для каждого транскрипта.Raw HiSeq output was processed according to standard Illumina protocol, including low quality read removal and decompression. The sequence reads were then aligned to the reference genomic sequence [Mouse Genome Sequencing Consortium, Nature 420, 520-562 (2002)] with a bowtie [Langmead, B. et al., Genome Biol. 10, R25 (2009)]. Alignment coordinates were compared with exon coordinates of RefSeq transcripts [Pruitt, K.D. et al., Nucleic Acids Res. 33, 501-504 (2005)] and the number of overlapping alignments was recorded for each transcript. Sequence reads that did not align with the genomic sequence were aligned against a database of all possible exon-exon bridging sequences of RefSeq transcripts [Pruitt, K.D. et al., Nucleic Acids Res. 33, 501-504 (2005)]. Alignment coordinates were compared with RefSeq exon coordinates and junction coordinates, reads were counted, and normalized to RPKM (number of reads that map per kilobase of transcript nucleotides per million reads mapped) [Mortazavi, A. et al., Nat. Methods 5, 621-628 (2008)]) for each transcript.

Проверка SNVSNV check

Мы выбрали SNV для проверки ресеквенированием по Сэнгеру и по РНК. Идентифицировали SNV, которые были спрогнозированы всеми тремя программами, которые были несинонимичными и которые были обнаружены в транскриптах, имеющих минимум 10 RPKM. Среди них мы выбрали 50 с наиболее высокими баллами качества SNP, предоставляемые программами. В качестве отрицательного контроля, выбрали 44 SNV, которые имели FDR 50% или больше, которые присутствовали только на одном образце клеточной линии, и которые прогнозировались только одной программой, присваивающей мутации. С помощью ДНК выбранные варианты проверяли амплификацией ПЦР областей, с использованием 50 нг ДНК, с последующим секвенированием по Сенгеру («Eurofins MWG Operon», Эберсберг, Германия). Реакции были удачны для 50 и 32 локусов положительных и отрицательных контролей, соответственно. Проверку также осуществили изучением опухолевых ридов РНК-Seq.We selected SNV for Sanger and RNA resequencing. SNVs were identified that were predicted by all three programs that were non-synonymous and that were found in transcripts having a minimum of 10 RPKM. Among them, we selected 50 with the highest SNP quality scores provided by the programs. As a negative control, 44 SNVs were selected that had an FDR of 50% or greater, that were present in only one cell line sample, and that were predicted by only one mutation assignment program. Using DNA, the selected variants were verified by PCR amplification of the regions using 50 ng of DNA, followed by Sanger sequencing (Eurofins MWG Operon, Ebersberg, Germany). Reactions were successful for 50 and 32 loci of positive and negative controls, respectively. Validation was also carried out by examining RNA-Seq tumor reads.

Расчет FDR и машинное самообучениеFDR Calculation and Machine Learning

Вычисления Балла Качества «Случайный Лес»: Широко применяемые алгоритмы обозначения мутаций (DePristo, M.A. et al., Nature Genetics 43, 491–498 (2011), Li, H. et al., Bioinformatics 25, 2078-2079 (2009), Ding, L. et al., Hum. Mol. Genet (2010) впервые опубликовано он-лайн 15 сентября 2010 года) выдают множественные баллы, которые все потенциально влияют на качество прогноза мутаций. Они включают, без ограничения перечисленным, качество представляющего интерес основания, присвоенное инструментом, качество выравнивания по этой позиции, количество ридов, охватывающих эту позицию, или балл различия между двумя геномами, сравниваемыми в этой позиции. Для вычисления частоты ложноположительных результатов нам требуется упорядочивание мутаций, однако это неосуществимо напрямую для всех мутаций, поскольку мы можем иметь противоречащую информацию из различных баллов качества."Random Forest" Quality Score Calculations: Commonly Used Mutation Designation Algorithms (DePristo, M.A. et al., Nature Genetics 43, 491–498 (2011), Li, H. et al., Bioinformatics 25, 2078-2079 (2009), Ding, L. et al., Hum. Mol. Genet (2010) first published online September 15, 2010) provide multiple scores that all potentially affect the quality of mutation prediction. These include, but are not limited to, the quality of the base of interest assigned by the instrument, the quality of the alignment at that position, the number of reads spanning that position, or the difference score between two genomes compared at that position. To calculate the false positive rate, we need ordering of mutations, however this is not directly feasible for all mutations because we may have conflicting information from different quality scores.

Мы используем следующую стратегию для достижения полного упорядочивания. На первом этапе, мы применяем очень строгое определение превосходства, предполагая, что мутация имеет лучшее качество, чем другая, если и только если она превосходит во всех категориях. Так что набор качественных признаков S=(s1,…,sn) предпочтительней T = (t1, ..., tn), что обозначается как S>T, если si > ti для всех i=1,…,n. Мы определили промежуточный FDR (IFDR) следующим образомWe use the following strategy to achieve full ordering. In the first step, we apply a very strict definition of superiority, assuming that a mutation is of better quality than another if and only if it is superior in all categories. So the set of qualitative features S=(s 1 ,…,s n ) is preferable to T = (t 1 , ..., t n ), which is denoted as S>T, if s i > t i for all i=1, …,n. We have defined an intermediate FDR (IFDR) as follows

Figure 00000016
Figure 00000016

Тем не менее, мы рассматриваем IFDR только как промежуточный шаг, поскольку во многих тесно связанных случаях сравнение не является возможным, и мы, таким образом, не извлекаем выгоду из огромного количества доступных данных. Таким образом, мы воспользовались преимуществом хорошего обобщающего свойства регрессии «случайный лес» [Breiman, L., Statist. Sci. 16, 199-231 (2001)] и натренировали «случайный лес», реализованный в R (R Development Core Team. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria, 2010, Liaw, A., Wiener, M., R News 2, 18-22 (2002)).However, we consider IFDR only as an intermediate step because in many closely related cases comparison is not possible and we thus do not benefit from the vast amount of data available. Thus, we have taken advantage of the good generalizing property of the random forest regression [Breiman, L., Statist. sci. 16, 199-231 (2001)] and trained a "random forest" implemented in R (R Development Core Team. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria, 2010, Liaw, A ., Wiener, M., R News 2, 18-22 (2002)).

Для m мутаций на входе с n свойствами качества каждая, был определен диапазон значений для каждого свойства и вплоть до p значений были отобраны с равномерным интервалом из этого диапазона; если набор значений свойства качества меньше, чем р, то этот набор использовался вместо отобранного набора. Затем создаются все возможные комбинации отобранных или отсортированных значений качества, что приводит к максимуму pn точек данных в n-мерном пространстве качества. Случайный образец, включающий 1% этих точек, и соответствующие значения IFDR использовали в качестве прогностического фактора и ответа, соответственно, для тренировки «случайного леса».For m input mutations with n quality properties each, a range of values for each property was determined and up to p values were sampled at even intervals from that range; if the quality property value set is less than p, then that set was used instead of the selected set. All possible combinations of selected or sorted quality values are then created, resulting in a maximum of p n data points in an n-dimensional quality space. A random sample including 1% of these points and the corresponding IFDR values were used as predictor and response, respectively, for random forest training.

Полученный балл регрессии является нашим обобщенным баллом качества Q; его можно рассматривать как локально взвешенную комбинацией отдельных баллов качества. Он позволяет провести прямое сравнение по одному значению любых двух мутаций и вычислить актуальную частоту ложноположительных результатов: The resulting regression score is our generalized quality score Q; it can be thought of as being locally weighted by a combination of individual quality scores. It allows you to make a direct comparison on a single value of any two mutations and calculate the current false positive rate:

Figure 00000017
Figure 00000017

Для тренировки модели «случайный лес», использованной для получения результатов в данном исследовании, мы рассчитали IFDR образца по соматическим мутациям всех образцов перед отбором случайного 1% подмножества. Это позволяет картировать общее доступное пространство качества до значений FDR. Мы использовали свойства качества «качество SNP», «глубина покрытия», «качество консенсуса» и «качество картирования RMS» («SAMtools», P = 20); «качество SNP», «глубина покрытия», «достоверность варианта/нефильтрованная глубина» и «качество картирования RMS» («GATK», P = 20); или «качество SNP», «глубина покрытия», «качество консенсуса», «качество картирования RMS» и «соматический балл» («SomaticSNiPer», P = 12), соответственно. Различные значения p обеспечивают размер набора сравнимой величины.To train the random forest model used to generate the results in this study, we calculated the IFDR of a sample from the somatic mutations of all samples before selecting a random 1% subset. This allows the total available quality space to be mapped to FDR values. We used the quality properties "SNP quality", "coverage depth", "consensus quality", and "RMS mapping quality" ("SAMtools", P = 20); 'SNP quality', 'coverage depth', 'variant confidence/unfiltered depth' and 'RMS mapping quality' ('GATK', P = 20); or "SNP quality", "coverage depth", "consensus quality", "RMS mapping quality", and "somatic score" ("SomaticSNiPer", P = 12), respectively. Different values of p provide a set size of comparable magnitude.

Вычисление общего покрытия: Количество возможных прогнозов мутаций может ввести основную системную ошибку в определение частоты ложноположительных результатов. Только если у нас есть такое же количество возможных мест мутаций, происходящих при нашем сравнении опухоли и нашем сравнении «сам против себя», количество прогнозируемых мутаций сопоставимо и может служить в качестве основы для вычисления частоты ложноположительных результатов. Для коррекции этой потенциальной систематической ошибки мы применили соотношение общего покрытия. В качестве общего покрытия мы определили количество оснований с покрытием, по меньшей мере, в одном из двух образцов, которые используются для назначения мутаций. Мы рассчитали общее покрытие индивидуально для опухолевого сравнения, а также для сравнения «сам против себя».Total Coverage Calculation: The number of possible mutation predictions can introduce a major bias in determining the false positive rate. Only if we have the same number of possible mutation sites occurring in our tumor comparison and our self-versus-self comparison is the number of predicted mutations comparable and can serve as the basis for calculating the false positive rate. To correct for this potential bias, we applied the total coverage ratio. As a total coverage, we determined the number of coated bases in at least one of the two samples that are used to assign mutations. We calculated total coverage individually for tumor comparisons as well as for self-versus-self comparisons.

Оценка ROCROC score

Кривые соотношений правильного и ложного обнаружения сигналов (Receiver operating characteristic, ROC) и соответствующая площадь под кривой (area under curve, AUC) пригодны для организации классификаторов и визуализации их эффективности [Fawcett, T., Pattern Recogn. Lett. 27, 861–874 (2006)]. Мы расширили эту концепцию для оценки эффективности экспериментальных и вычислительных процедур. Однако построение диаграмм ROC требует знания всех истинных положительных и ложноположительных (TP и FP) примеров в наборе данных, информации, которая, как правило, не представлена, и которую трудно получить для данных, полученных высокопроизводительным подходом (таких, как данные NGS). Таким образом, мы используем вычисленные FDR для оценки соответствующих уровней TP и FP и для построения графика ROC и для расчета AUC. Центральная идея заключается в том, что FDR одиночной мутации в наборе данных дает долю того, сколько данная мутация вносит в сумму мутаций TP/FP, соответственно. Также для перечня случайных назначений TP и FP, полученные значения ROC AUC будут равны 0,5 в нашем способе, что указывает на полностью случайный прогноз. Мы начали с двумя условиями:The curves of the ratios of correct and false detection of signals (Receiver operating characteristic, ROC) and the corresponding area under the curve (area under curve, AUC) are suitable for organizing classifiers and visualizing their effectiveness [Fawcett, T., Pattern Recogn. Lett. 27, 861–874 (2006)]. We have extended this concept to evaluate the effectiveness of experimental and computational procedures. However, ROC plotting requires knowledge of all true positive and false positive (TP and FP) examples in the data set, information that is typically not represented and is difficult to obtain for high-throughput data (such as NGS data). Thus, we use the calculated FDRs to estimate the respective TP and FP levels and to plot the ROC and calculate the AUC. The central idea is that the FDR of a single mutation in a data set gives a fraction of how much that mutation contributes to the sum of TP/FP mutations, respectively. Also for a list of random TP and FP assignments, the resulting ROC AUC values will be 0.5 in our method, indicating a completely random prediction. We started with two conditions:

Figure 00000018
[1]
Figure 00000018
[one]

иand

Figure 00000019
[2]
Figure 00000019
[2]

с FPR и TPR представляющие собой необходимые ложноположительные и истинно положительные соотношения, соответственно, для данной мутации, определяя соответствующую точку в пространстве ROC. [1] и [2] могут быть перегруппированы в with FPR and TPR representing the necessary false positive and true positive ratios, respectively, for a given mutation, defining the appropriate point in ROC space. [1] and [2] can be rearranged into

Figure 00000020
[3]
Figure 00000020
[3]

иand

Figure 00000021
[4]
Figure 00000021
[four]

Для получения расчетной кривой ROC, мутации в наборе данных сортировали по FDR и для каждой мутации наносилась точка на график в суммарных значениях в пределах этой мутации, разделенных на сумму все значений TPR и TPR, соответственно. AUC рассчитана суммированием площадей всех идущих подряд трапезоидов между кривой и осью x.To obtain the estimated ROC curve, the mutations in the dataset were sorted by FDR and for each mutation a point was plotted in the total values within that mutation divided by the sum of all TPR and TPR values, respectively. AUC is calculated by summing the areas of all consecutive trapezoids between the curve and the x-axis.

--->--->

СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ SEQUENCE LIST

<110> BioNTech AG et al.<110> BioNTech AG et al.

<120> INDIVIDUALIZED VACCINES FOR CANCER<120> INDIVIDUALIZED VACCINES FOR CANCER

<130> 674-75PCT<130> 674-75PCT

<150> PCT/EP2011/002576<150> PCT/EP2011/002576

<151> 2011-05-24<151> 2011-05-24

<150> PCT/EP2012/000006<150> PCT/EP2012/000006

<151> 2012-01-02<151> 2012-01-02

<160> 39 <160> 39

<170> PatentIn version 3.5<170>PatentIn version 3.5

<210> 1<210> 1

<211> 15<211> 15

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<220><220>

<221> REPEAT<221> REPEAT

<222> (1)..(3)<222> (1)..(3)

<223> Portion of sequence repeated a times, wherein a is independently <223> Portion of sequence repeated a times, while a is independently

a number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, a number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,

13, 14, 15, 16, 17, 18, 19, or 20 13, 14, 15, 16, 17, 18, 19, or 20

<220><220>

<221> REPEAT<221> REPEAT

<222> (4)..(6)<222> (4)..(6)

<223> Portion of sequence repeated b times, wherein b is independently <223> Portion of sequence repeated b times, while b is independently

a number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, a number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,

13, 14, 15, 16, 17, 18, 19, or 20 13, 14, 15, 16, 17, 18, 19, or 20

<220><220>

<221> REPEAT<221> REPEAT

<222> (7)..(9)<222> (7)..(9)

<223> Portion of sequence repeated c times, wherein c is independently <223> Portion of sequence repeated c times, while c is independently

a number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, a number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,

13, 14, 15, 16, 17, 18, 19, or 20 13, 14, 15, 16, 17, 18, 19, or 20

<220><220>

<221> REPEAT<221> REPEAT

<222> (10)..(12)<222> (10)..(12)

<223> Portion of sequence repeated d times, wherein d is independently <223> Portion of sequence repeated d times, when d is independently

a number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, a number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,

13, 14, 15, 16, 17, 18, 19, or 20 13, 14, 15, 16, 17, 18, 19, or 20

<220><220>

<221> REPEAT<221> REPEAT

<222> (13)..(15)<222> (13)..(15)

<223> Portion of sequence repeated e times, wherein e is independently <223> Portion of sequence repeated e times, while e is independently

a number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, a number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,

13, 14, 15, 16, 17, 18, 19, or 20 13, 14, 15, 16, 17, 18, 19, or 20

<220><220>

<221> MISC_FEATURE<221> MISC_FEATURE

<222> (1)..(15)<222> (1)..(15)

<223> a + b + c + d + e are different from 0 and preferably are 2 or <223> a + b + c + d + e are different from 0 and preferably are 2 or

more, 3 or more, 4 or more or 5 or more more, 3 or more, 4 or more or 5 or more

<400> 1<400> 1

Gly Gly Ser Gly Ser Ser Gly Gly Gly Ser Ser Gly Gly Ser Gly Gly Gly Ser Gly Ser Ser Gly Gly Gly Ser Ser Gly Gly Ser Gly

1 5 10 15 1 5 10 15

<210> 2<210> 2

<211> 9<211> 9

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 2<400> 2

Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 fifteen

<210> 3<210> 3

<211> 8<211> 8

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Epitope sequence<223> Epitope sequence

<400> 3<400> 3

Ser Ile Ile Asn Phe Glu Lys Leu Ser Ile Ile Asn Phe Glu Lys Leu

1 5 fifteen

<210> 4<210> 4

<211> 30<211> 30

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Mutated peptide sequence<223> Mutated peptide sequence

<400> 4<400> 4

Ser Pro Ser Lys Pro Ser Phe Gln Glu Phe Val Asp Trp Glu Asn Val Ser Pro Ser Lys Pro Ser Phe Gln Glu Phe Val Asp Trp Glu Asn Val

1 5 10 15 1 5 10 15

Ser Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Leu Pro Ser Ser Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Leu Pro Ser

20 25 30 20 25 30

<210> 5<210> 5

<211> 30<211> 30

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Wildtype peptide sequence<223> Wildtype peptide sequence

<400> 5<400> 5

Ser Pro Ser Lys Pro Ser Phe Gln Glu Phe Val Asp Trp Glu Lys Val Ser Pro Ser Lys Pro Ser Phe Gln Glu Phe Val Asp Trp Glu Lys Val

1 5 10 15 1 5 10 15

Ser Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Leu Pro Ser Ser Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Leu Pro Ser

20 25 30 20 25 30

<210> 6<210> 6

<211> 27<211> 27

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Mutated peptide sequence<223> Mutated peptide sequence

<400> 6<400> 6

Thr Pro Pro Pro Glu Glu Ala Met Pro Phe Glu Phe Asn Gly Pro Ala Thr Pro Pro Pro Glu Glu Ala Met Pro Phe Glu Phe Asn Gly Pro Ala

1 5 10 15 1 5 10 15

Gln Gly Asp His Ser Gln Pro Pro Leu Gln Val Gln Gly Asp His Ser Gln Pro Pro Leu Gln Val

20 25 20 25

<210> 7<210> 7

<211> 27<211> 27

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Wildtype peptide sequence<223> Wildtype peptide sequence

<400> 7<400> 7

Thr Pro Pro Pro Glu Glu Ala Met Pro Phe Glu Phe Asn Glu Pro Ala Thr Pro Pro Pro Glu Glu Ala Met Pro Phe Glu Phe Asn Glu Pro Ala

1 5 10 15 1 5 10 15

Gln Gly Asp His Ser Gln Pro Pro Leu Gln Val Gln Gly Asp His Ser Gln Pro Pro Leu Gln Val

20 25 20 25

<210> 8<210> 8

<211> 27<211> 27

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Mutated peptide sequence<223> Mutated peptide sequence

<400> 8<400> 8

Arg Val Thr Cys Asn Arg Ala Gly Glu Lys His Cys Phe Ser Ser Asn Arg Val Thr Cys Asn Arg Ala Gly Glu Lys His Cys Phe Ser Ser Asn

1 5 10 15 1 5 10 15

Glu Ala Ala Arg Asp Phe Gly Gly Ala Ile Gln Glu Ala Ala Arg Asp Phe Gly Gly Ala Ile Gln

20 25 20 25

<210> 9<210> 9

<211> 27<211> 27

<212> PRT<212> PRT

<213> Wildtype peptide sequence<213> Wildtype peptide sequence

<400> 9<400> 9

Arg Val Thr Cys Asn Arg Ala Gly Glu Lys His Cys Phe Thr Ser Asn Arg Val Thr Cys Asn Arg Ala Gly Glu Lys His Cys Phe Thr Ser Asn

1 5 10 15 1 5 10 15

Glu Ala Ala Arg Asp Phe Gly Gly Ala Ile Gln Glu Ala Ala Arg Asp Phe Gly Gly Ala Ile Gln

20 25 20 25

<210> 10<210> 10

<211> 27<211> 27

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Mutated peptide sequence<223> Mutated peptide sequence

<400> 10<400> 10

Phe Arg Arg Lys Ala Phe Leu His Trp Tyr Thr Gly Glu Ala Met Asp Phe Arg Arg Lys Ala Phe Leu His Trp Tyr Thr Gly Glu Ala Met Asp

1 5 10 15 1 5 10 15

Glu Met Glu Phe Thr Glu Ala Glu Ser Asn Met Glu Met Glu Phe Thr Glu Ala Glu Ser Asn Met

20 25 20 25

<210> 11<210> 11

<211> 27<211> 27

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Wildtype peptide sequence<223> Wildtype peptide sequence

<400> 11<400> 11

Phe Arg Arg Lys Ala Phe Leu His Trp Tyr Thr Gly Glu Gly Met Asp Phe Arg Arg Lys Ala Phe Leu His Trp Tyr Thr Gly Glu Gly Met Asp

1 5 10 15 1 5 10 15

Glu Met Glu Phe Thr Glu Ala Glu Ser Asn Met Glu Met Glu Phe Thr Glu Ala Glu Ser Asn Met

20 25 20 25

<210> 12<210> 12

<211> 27<211> 27

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Mutated peptide sequence<223> Mutated peptide sequence

<400> 12<400> 12

Pro Ser Lys Pro Ser Phe Gln Glu Phe Val Asp Trp Glu Asn Val Ser Pro Ser Lys Pro Ser Phe Gln Glu Phe Val Asp Trp Glu Asn Val Ser

1 5 10 15 1 5 10 15

Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Leu Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Leu

20 25 20 25

<210> 13<210> 13

<211> 27<211> 27

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Wildtype peptide sequence<223> Wildtype peptide sequence

<400> 13<400> 13

Pro Ser Lys Pro Ser Phe Gln Glu Phe Val Asp Trp Glu Lys Val Ser Pro Ser Lys Pro Ser Phe Gln Glu Phe Val Asp Trp Glu Lys Val Ser

1 5 10 15 1 5 10 15

Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Leu Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Leu

20 25 20 25

<210> 14<210> 14

<211> 27<211> 27

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Mutated peptide sequence<223> Mutated peptide sequence

<400> 14<400> 14

His Leu Thr Gln Gln Leu Asp Thr Tyr Ile Leu Lys Asn Val Val Ala His Leu Thr Gln Gln Leu Asp Thr Tyr Ile Leu Lys Asn Val Val Ala

1 5 10 15 1 5 10 15

Phe Ser Arg Thr Asp Lys Tyr Arg Gln Leu Pro Phe Ser Arg Thr Asp Lys Tyr Arg Gln Leu Pro

20 25 20 25

<210> 15<210> 15

<211> 27<211> 27

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Wildtype peptide sequence<223> Wildtype peptide sequence

<400> 15<400> 15

His Leu Thr Gln Gln Leu Asp Thr Tyr Ile Leu Lys Asn Phe Val Ala His Leu Thr Gln Gln Leu Asp Thr Tyr Ile Leu Lys Asn Phe Val Ala

1 5 10 15 1 5 10 15

Phe Ser Arg Thr Asp Lys Tyr Arg Gln Leu Pro Phe Ser Arg Thr Asp Lys Tyr Arg Gln Leu Pro

20 25 20 25

<210> 16<210> 16

<211> 27<211> 27

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Mutated peptide sequence<223> Mutated peptide sequence

<400> 16<400> 16

Cys Gly Thr Ala Phe Phe Ile Asn Phe Ile Ala Ile Tyr His His Ala Cys Gly Thr Ala Phe Phe Ile Asn Phe Ile Ala Ile Tyr His His Ala

1 5 10 15 1 5 10 15

Ser Arg Ala Ile Pro Phe Gly Thr Met Val Ala Ser Arg Ala Ile Pro Phe Gly Thr Met Val Ala

20 25 20 25

<210> 17<210> 17

<211> 27<211> 27

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Wildtype peptide sequence<223> Wildtype peptide sequence

<400> 17<400> 17

Cys Gly Thr Ala Phe Phe Ile Asn Phe Ile Ala Ile Tyr Tyr His Ala Cys Gly Thr Ala Phe Phe Ile Asn Phe Ile Ala Ile Tyr Tyr His Ala

1 5 10 15 1 5 10 15

Ser Arg Ala Ile Pro Phe Gly Thr Met Val Ala Ser Arg Ala Ile Pro Phe Gly Thr Met Val Ala

20 25 20 25

<210> 18<210> 18

<211> 7<211> 7

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 18<400> 18

Gly Gly Ser Gly Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly

1 5 fifteen

<210> 19<210> 19

<211> 10<211> 10

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 19<400> 19

Thr Ser Leu Asn Ala Leu Leu Asn Ala His Thr Ser Leu Asn Ala Leu Leu Asn Ala His

1 5 10 1 5 10

<210> 20<210> 20

<211> 10<211> 10

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 20<400> 20

Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser

1 5 10 1 5 10

<210> 21<210> 21

<211> 10<211> 10

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 21<400> 21

Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly

1 5 10 1 5 10

<210> 22<210> 22

<211> 10<211> 10

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 22<400> 22

Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

1 5 10 1 5 10

<210> 23<210> 23

<211> 10<211> 10

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 23<400> 23

Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly

1 5 10 1 5 10

<210> 24<210> 24

<211> 9<211> 9

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 24<400> 24

Thr Ser Leu Asn Ala Leu Leu Asn Ala Thr Ser Leu Asn Ala Leu Leu Asn Ala

1 5 fifteen

<210> 25<210> 25

<211> 9<211> 9

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 25<400> 25

Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser

1 5 fifteen

<210> 26<210> 26

<211> 9<211> 9

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 26<400> 26

Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly

1 5 fifteen

<210> 27<210> 27

<211> 9<211> 9

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 27<400> 27

Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly

1 5 fifteen

<210> 28<210> 28

<211> 5<211> 5

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 28<400> 28

Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

1 5 fifteen

<210> 29<210> 29

<211> 6<211> 6

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 29<400> 29

Gly Gly Ser Gly Gly Gly Gly Gly Ser Gly Gly Gly

1 5 fifteen

<210> 30<210> 30

<211> 7<211> 7

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 30<400> 30

Gly Gly Ser Gly Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly

1 5 fifteen

<210> 31<210> 31

<211> 8<211> 8

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 31<400> 31

Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Ser Gly Gly Gly Gly Ser

1 5 fifteen

<210> 32<210> 32

<211> 10<211> 10

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Linker sequence<223> Link sequence

<400> 32<400> 32

Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser

1 5 10 1 5 10

<210> 33<210> 33

<211> 14<211> 14

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Oligonucleotide<223> Oligonucleotide

<400> 33<400> 33

ggaaactttt tccc 14ggaaactttttccc 14

<210> 34<210> 34

<211> 21<211> 21

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Oligonucleotide<223> Oligonucleotide

<400> 34<400> 34

ccggggaaac tttttcccag t 21ccggggaaac ttttttcccag t 21

<210> 35<210> 35

<211> 21<211> 21

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Oligonucleotide<223> Oligonucleotide

<400> 35<400> 35

ccggggaaac gttttcccag t 21ccggggaaac gttttcccag t 21

<210> 36<210> 36

<211> 60<211> 60

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Artificial construct<223> Artificial construct

<400> 36<400> 36

Asn Thr Thr Phe Asn Val Ser Glu Glu Ser Pro Ser Lys Pro Ser Phe Asn Thr Thr Phe Asn Val Ser Glu Glu Ser Pro Ser Lys Pro Ser Phe

1 5 10 15 1 5 10 15

Gln Glu Phe Val Asp Trp Glu Asn Val Ser Pro Glu Leu Asn Ser Thr Gln Glu Phe Val Asp Trp Glu Asn Val Ser Pro Glu Leu Asn Ser Thr

20 25 30 20 25 30

Asp Gln Pro Phe Leu Pro Ser Ala Pro Val Phe Ile Phe Thr Lys Gly Asp Gln Pro Phe Leu Pro Ser Ala Pro Val Phe Ile Phe Thr Lys Gly

35 40 45 35 40 45

Arg Lys Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Arg Lys Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

50 55 60 50 55 60

<210> 37<210> 37

<211> 60<211> 60

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Artificial construct<223> Artificial construct

<400> 37<400> 37

Tyr Phe Val Leu Tyr Lys Pro Pro Pro Lys Asp Asn Ile Pro Ala Leu Tyr Phe Val Leu Tyr Lys Pro Pro Pro Lys Asp Asn Ile Pro Ala Leu

1 5 10 15 1 5 10 15

Val Glu Glu Tyr Leu Glu Arg Gly Asn Phe Val Ala Asn Asp Leu Asp Val Glu Glu Tyr Leu Glu Arg Gly Asn Phe Val Ala Asn Asp Leu Asp

20 25 30 20 25 30

Trp Leu Leu Ala Leu Pro His Asp Lys Phe Trp Cys Gln Val Ile Phe Trp Leu Leu Ala Leu Pro His Asp Lys Phe Trp Cys Gln Val Ile Phe

35 40 45 35 40 45

Asp Glu Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Asp Glu Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser

50 55 60 50 55 60

<210> 38<210> 38

<211> 60<211> 60

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Artificial construct<223> Artificial construct

<400> 38<400> 38

Phe Glu Gln Leu Ser Glu Ser Ala Lys Glu Glu Leu Ile Asn Phe Lys Phe Glu Gln Leu Ser Glu Ser Ala Lys Glu Glu Leu Ile Asn Phe Lys

1 5 10 15 1 5 10 15

Arg Lys Arg Val Ala Ala Phe Gln Lys Asn Leu Ile Glu Met Ser Glu Arg Lys Arg Val Ala Ala Phe Gln Lys Asn Leu Ile Glu Met Ser Glu

20 25 30 20 25 30

Leu Glu Ile Lys His Ala Arg Asn Asn Val Ser Leu Leu Gln Ser Cys Leu Glu Ile Lys His Ala Arg Asn Asn Val Ser Leu Leu Gln Ser Cys

35 40 45 35 40 45

Ile Asp Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Ile Asp Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

50 55 60 50 55 60

<210> 39<210> 39

<211> 60<211> 60

<212> PRT<212> PRT

<213> Artificial Sequence<213> Artificial Sequence

<220><220>

<223> Artificial construct<223> Artificial construct

<400> 39<400> 39

Thr Gly Ala Ser Pro Gly Leu Gly Ala Tyr Thr Pro Pro Pro Glu Glu Thr Gly Ala Ser Pro Gly Leu Gly Ala Tyr Thr Pro Pro Pro Glu Glu

1 5 10 15 1 5 10 15

Ala Met Pro Phe Glu Phe Asn Gly Pro Ala Gln Gly Asp His Ser Gln Ala Met Pro Phe Glu Phe Asn Gly Pro Ala Gln Gly Asp His Ser Gln

20 25 30 20 25 30

Pro Pro Leu Gln Val Pro Asp Leu Ala Pro Gly Gly Pro Glu Ala Leu Pro Pro Leu Gln Val Pro Asp Leu Ala Pro Gly Gly Pro Glu Ala Leu

35 40 45 35 40 45

Val Pro Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Val Pro Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser

50 55 60 50 55 60

<---<---

Claims (47)

1. Способ получения индивидуализированной вакцины для применения при лечении или профилактики рака, включающей эффективное количество рекомбинантного полиэпитопного полипептида, содержащего основанные на мутациях неоэпитопы, которые являются результатом специфичных для рака соматических мутаций в образце рака пациента, имеющего рак, или нуклеиновой кислоты, кодирующей указанный полиэпитопный полипептид, где основанные на мутациях неоэпитопы сшиты вместе посредством пептидных связей или линкеров, включающий стадии:1. A method of obtaining an individualized vaccine for use in the treatment or prevention of cancer, comprising an effective amount of a recombinant polyepitope polypeptide containing mutation-based neoepitopes that result from cancer-specific somatic mutations in a cancer sample of a patient having cancer, or a nucleic acid encoding said polyepitope a polypeptide wherein mutation-based neoepitopes are linked together via peptide bonds or linkers, comprising the steps of: (А) идентификации специфичных для рака соматических мутаций в образце рака пациента, имеющего рак, с получением сигнатуры раковых мутаций пациента, включающей стадии(A) identifying cancer-specific somatic mutations in a cancer sample of a patient having cancer to obtain a signature of the patient's cancer mutations, comprising the steps (i) получения информации о последовательности нуклеиновой кислоты путем секвенирования геномной ДНК и/или РНК образца рака пациента, имеющего рак,(i) obtaining nucleic acid sequence information by sequencing the genomic DNA and/or RNA of a cancer sample of a patient having cancer, (ii) получения информации о последовательности референсной нуклеиновой кислоты путем секвенирования геномной ДНК и/или РНК нормальных нераковых клеток,(ii) obtaining information about the reference nucleic acid sequence by sequencing the genomic DNA and/or RNA of normal non-cancerous cells, иand (iii) сравнения информации о последовательности нуклеиновой кислоты из образца рака, полученной на стадии ((A)(i)), с информацией о последовательности референсной нуклеиновой кислоты, полученной на стадии ((A)(ii));(iii) comparing the nucleic acid sequence information from the cancer sample obtained in step ((A)(i)) with the reference nucleic acid sequence information obtained in step ((A)(ii)); (iv) идентификации отличий в последовательности согласно стадии ((A)(iii)) и идентификации специфичных для рака соматических мутаций в образце рака пациента, имеющего рак; и(iv) identifying differences in sequence according to step ((A)(iii)) and identifying cancer-specific somatic mutations in a cancer sample from a patient having cancer; and (B) получения вакцины, характерной чертой которой является сигнатура раковых мутаций, полученная на стадии (А), включающей стадии (B) obtaining a vaccine, the characteristic feature of which is the signature of cancer mutations obtained in stage (A), including the stages (i) получения рекомбинантного полиэпитопного полипептида или нуклеиновой кислоты, кодирующей указанный полиэпитопный полипептид, где рекомбинантный полиэпитопный полипептид содержит основанные на мутации неоэпитопы, содержащие мутации, идентифицированные на стадии ((A)(iv)), причем основанные на мутациях неоэпитопы сшиты вместе посредством пептидных связей или линкеров;(i) obtaining a recombinant polyepitope polypeptide or a nucleic acid encoding said polyepitope polypeptide, wherein the recombinant polyepitope polypeptide comprises mutation-based neoepitopes containing the mutations identified in step ((A)(iv)), wherein the mutation-based neoepitopes are fused together by peptide bonds or linkers; (ii) получения вакцины, содержащей эффективное количество рекомбинантного полиэпитопного полипептида или нуклеиновой кислоты, полученных на стадии ((B)(i)).(ii) obtaining a vaccine containing an effective amount of the recombinant polyepitope polypeptide or nucleic acid obtained in step ((B)(i)). 2. Способ по п. 1, где стадия (А) идентификации специфичных для рака соматических мутаций включает идентификацию сигнатуры раковых мутаций экзома одной или нескольких раковых клеток.2. The method of claim 1, wherein step (A) of identifying cancer-specific somatic mutations comprises identifying a signature of cancer mutations in the exome of one or more cancer cells. 3. Способ по п. 1 или 2, где стадия (А) идентификации специфичных для рака соматических мутаций включает секвенирование генома одной клетки из одной или нескольких раковых клеток.3. The method of claim 1 or 2, wherein step (A) of identifying cancer-specific somatic mutations comprises sequencing a single cell genome from one or more cancer cells. 4. Способ по п. 3, где раковые клетки представляют собой циркулирующие раковые клетки.4. The method of claim 3 wherein the cancer cells are circulating cancer cells. 5. Способ по любому из пп. 1-4, где стадия (А) идентификации специфичных для рака соматических мутаций включает применение секвенирования следующего поколения (NGS).5. The method according to any one of paragraphs. 1-4, wherein step (A) of identifying cancer-specific somatic mutations involves the use of next generation sequencing (NGS). 6. Способ по любому из пп. 1-5, где нормальные нераковые клетки получены от указанного пациента, имеющего рак.6. The method according to any one of paragraphs. 1-5 wherein normal non-cancerous cells are obtained from said patient having cancer. 7. Способ по любому из пп. 1-6, где информация о последовательности референсной нуклеиновой кислоты получена из клеток зародышевой линии.7. The method according to any one of paragraphs. 1-6, where the reference nucleic acid sequence information is derived from germline cells. 8. Способ по любому из пп. 1-6, где информация о последовательности референсной нуклеиновой кислоты получена из геномной ДНК зародышевой линии, полученной из мононуклеарных клеток периферической крови (PBMC).8. The method according to any one of paragraphs. 1-6, where reference nucleic acid sequence information is derived from germline genomic DNA derived from peripheral blood mononuclear cells (PBMCs). 9. Способ по п. 7 или 8, где указанный образец рака происходит из первичной опухоли, и где стадия (А) идентификации специфичных для рака соматических мутаций далее включает стадии:9. The method of claim 7 or 8, wherein said cancer pattern originates from a primary tumor, and wherein step (A) of identifying cancer-specific somatic mutations further comprises the steps of: ((iii)(a)) обеспечения филогенетического дерева специфичных для рака соматических мутаций, где информацию о последовательности референсной нуклеиновой кислоты, полученной на стадии (ii), используют для создания основы дерева,((iii)(a)) providing a phylogenetic tree of cancer-specific somatic mutations, where information about the sequence of the reference nucleic acid obtained in step (ii) is used to create the basis of the tree, ((iii)(b)) воспроизводства наследственных последовательностей, где наследственные последовательности являются последовательностями узлов около корня филогенетического дерева, содержащего первичные базальные мутации, причем первичные базальные мутации являются самыми ранними мутациями, о которых предсказано, что они существуют в первичном раке, и((iii)(b)) reproducing ancestral sequences, where the ancestral sequences are the sequences of nodes near the root of the phylogenetic tree containing the primary basal mutations, the primary basal mutations being the earliest mutations predicted to exist in the primary cancer, and ((iii)(c)) выбора первичных базальных мутаций из наследственных последовательностей, идентифицированных на стадии ((iii)(b)).((iii)(c)) selecting primary basal mutations from the inherited sequences identified in step ((iii)(b)). 10. Способ по любому из пп. 1-9, где стадию (A) идентификации специфичных к раку соматических мутаций повторяют по меньшей мере дважды.10. The method according to any one of paragraphs. 1-9, where step (A) of identifying cancer-specific somatic mutations is repeated at least twice. 11. Способ по любому из пп. 1-10, содержащий дополнительную стадию определения пригодности идентифицированных мутаций в эпитопах для противораковой вакцинации, где последующие стадии включают одну или несколько из следующих: 11. The method according to any one of paragraphs. 1-10, containing the additional step of determining the suitability of identified mutations in epitopes for cancer vaccination, where subsequent steps include one or more of the following: (i) оценку того, расположены ли идентифицированные мутации в известных или предcказанных презентированных на MHC эпитопах,(i) assessing whether the identified mutations are located in known or predicted MHC-presented epitopes, (ii) тестирование in vitro и/или in silico, находятся ли идентифицированные мутации на презентированных на MHC эпитопах, и(ii) testing in vitro and/or in silico whether the identified mutations are on the epitopes presented on the MHC, and (iii) тестирование in vitro, будут ли рассматриваемые мутированные эпитопы сами по себе или будучи экспрессированными антигенпрезентирующими клетками способны стимулировать Т-клетки пациента, имеющие желаемую специфичность.(iii) in vitro testing whether the mutated epitopes in question, by themselves or when expressed by antigen presenting cells, would be capable of stimulating the patient's T cells having the desired specificity. 12. Способ по п. 11, где на стадии (ii) тестирование in vitro и/или in silico, находятся ли идентифицированные мутации на презентированных на MHC эпитопах, предусматривает тестирование, являются ли мутации частью пептидных последовательностей, которые процессируются в и/или презентируются в качестве MHC презентированных эпитопов.12. The method of claim 11, wherein in step (ii) testing in vitro and/or in silico whether the identified mutations are on the epitopes presented on the MHC involves testing whether the mutations are part of the peptide sequences that are processed into and/or presented as MHC presented epitopes. 13. Способ по п. 11 или 12, где на стадии (iii) мутированные эпитопы находятся в контексте своих природных последовательностей и фланкированы аминокислотными последовательностями, которые также фланкируют указанные эпитопы в природном белке.13. The method of claim 11 or 12, wherein in step (iii) the mutated epitopes are in the context of their natural sequences and are flanked by amino acid sequences that also flank said epitopes in the natural protein. 14. Способ по любому из пп. 1-13, где полиэпитопный полипептид предпочтительно содержит до 30 неоэпитопов, основанных на мутациях.14. The method according to any one of paragraphs. 1-13, where the polyepitope polypeptide preferably contains up to 30 neoepitopes based on mutations. 15. Способ по любому из пп. 1-14, где полиэпитопный полипептид дополнительно включает эпитопы, не содержащие специфичные для рака соматические мутации, которые экспрессируются раковыми клетками.15. The method according to any one of paragraphs. 1-14, wherein the polyepitope polypeptide further comprises epitopes not containing cancer-specific somatic mutations that are expressed by cancer cells. 16. Способ по любому из пп. 1-15, где эпитопы при образовании вакцинной последовательности представлены в контексте своей природной последовательности.16. The method according to any one of paragraphs. 1-15, where the epitopes in the formation of the vaccine sequence are presented in the context of their natural sequence. 17. Способ по п. 16, где вакцинная последовательность имеет длину 30 аминокислот.17. The method of claim 16 wherein the vaccine sequence is 30 amino acids long. 18. Способ по любому из пп. 1-17, где неоэпитопы, эпитопы и/или вакцинные последовательности располагаются по системе голова к хвосту.18. The method according to any one of paragraphs. 1-17, where neoepitopes, epitopes and/or vaccine sequences are arranged head to tail. 19. Способ по любому из пп. 1-13, где указанная нуклеиновая кислота, кодирующая указанный полиэпитопный полипептид, представляет собой РНК, и указанная вакцина представляет собой РНК-вакцину.19. The method according to any one of paragraphs. 1-13, wherein said nucleic acid encoding said polyepitopic polypeptide is RNA and said vaccine is an RNA vaccine. 20. Способ по п. 19, где закодированный нуклеиновой кислотой полиэпитопный полипептид предпочтительно содержит вплоть до 30 основанных на мутациях неоэпитопов.20. The method of claim 19, wherein the polyepitope polypeptide encoded by the nucleic acid preferably contains up to 30 mutation-based neoepitopes. 21. Способ по п. 20, где закодированный нуклеиновой кислотой полиэпитопный полипептид также содержит эпитопы, не содержащие опухолеспецифичные соматические мутации, которые экспрессируются раковыми клетками.21. The method of claim 20, wherein the nucleic acid-encoded polyepitopic polypeptide also contains epitopes that do not contain tumor-specific somatic mutations that are expressed by cancer cells. 22. Способ по любому из пп. 20 и 21, где эпитопы находятся в контексте своей природной последовательности так, что образуют последовательность, кодируемую последовательностью РНК вакцины.22. The method according to any one of paragraphs. 20 and 21, where the epitopes are in the context of their natural sequence so as to form the sequence encoded by the vaccine RNA sequence. 23. Способ по п. 22, где длина полиэпитопной полипептидной последовательности, кодируемой последовательностью РНК-вакцины, составляет 30 аминокислот.23. The method of claim 22, wherein the length of the polyepitopic polypeptide sequence encoded by the RNA vaccine sequence is 30 amino acids. 24. Способ по любому из пп. 1-13 или 19-23, где неоэпитопы, эпитопы в полиэпитопном полипептиде и/или полиэпитопной полипептидной последовательности, кодируемой последовательностью РНК-вакцины, связаны голова к хвосту.24. The method according to any one of paragraphs. 1-13 or 19-23, where neoepitopes, epitopes in a polyepitope polypeptide and/or a polyepitope polypeptide sequence encoded by an RNA vaccine sequence, are linked head to tail. 25. Способ по любому из пп. 1-18, где вакцина представляет собой профилактическую и/или терапевтическую вакцину.25. The method according to any one of paragraphs. 1-18, where the vaccine is a prophylactic and/or therapeutic vaccine. 26. Способ по п. 1, отличающийся тем, что эпитопы, презентированные МНС, представляют собой эпитопы, презентированные МНС класса II, которые способны вызывать ответ хелперных Т-клеток CD4+ против клеток, экспрессирующих антигены, от которых происходят эпитопы, презентированные МНС, и необязательно эпитопы, презентированные МНС класса I, которые способны вызывать ответ Т-клеток CD8+ против клеток, экспрессирующих антигены, от которых происходят эпитопы, презентированные МНС.26. The method of claim 1, wherein the MHC-presented epitopes are class II MHC-presented epitopes that are capable of eliciting a CD4+ helper T cell response against cells expressing the antigens from which the MHC-presented epitopes originate, and optionally MHC class I presented epitopes that are capable of eliciting a CD8+ T cell response against cells expressing antigens from which the MHC presented epitopes are derived. 27. Индивидуализированная вакцина для применения при лечении или профилактики рака, которую получают способом по любому из пп. 1-26.27. Individualized vaccine for use in the treatment or prevention of cancer, which is obtained by the method according to any one of paragraphs. 1-26. 28. Индивидуализированная вакцина для применения при лечении или профилактики рака, включающая эффективное количество рекомбинантного полиэпитопного полипептида, включающего основанные на мутациях неоэпитопы, причем указанные неоэпитопы являются результатом специфичных для рака соматических мутаций в образце рака пациента, имеющего рак, причем основанные на мутациях неоэпитопы сшиты вместе посредством пептидных связей или линкеров, или включающая нуклеиновую кислоту, кодирующую указанный полиэпитопный полипептид.28. A personalized vaccine for use in the treatment or prevention of cancer, comprising an effective amount of a recombinant polyepitope polypeptide comprising mutation-based neoepitopes, said neoepitopes being the result of cancer-specific somatic mutations in a cancer sample of a patient having cancer, the mutation-based neoepitopes being cross-linked together via peptide bonds or linkers, or comprising a nucleic acid encoding said polyepitopic polypeptide. 29. Вакцина по п. 28, где указанный полиэпитопный полипептид дополнительно включает эпитопы, не содержащие специфичные для рака соматические мутации, которые экспрессируются раковыми клетками.29. The vaccine of claim 28, wherein said polyepitopic polypeptide further comprises epitopes that do not contain cancer-specific somatic mutations that are expressed by cancer cells. 30. Способ лечения пациента, имеющего рак, включающий стадии:30. A method for treating a patient with cancer, comprising the steps of: (a) проведения способа по любому из пп. 1-26 для получения индивидуализированной противораковой вакцины по п. 27, или получения индивидуализированной противораковой вакцины по любому из пп. 28, 29, и (a) carrying out the method according to any one of paragraphs. 1-26 to obtain an individualized cancer vaccine according to claim 27, or to obtain an individualized cancer vaccine according to any one of paragraphs. 28, 29, and (b) введения указанной вакцины пациенту.(b) administering said vaccine to a patient.
RU2017133613A 2011-05-24 2012-05-23 Individualized anti-tumor vaccines RU2779946C2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EPPCT/EP2011/002576 2011-05-24
EPPCT/EP2012/000006 2012-01-02
EP2012000006 2012-01-02

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2013157150A Division RU2670745C9 (en) 2011-05-24 2012-05-23 Individualised vaccines for cancer

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2022124067A Division RU2022124067A (en) 2011-05-24 2022-09-12 INDIVIDUALIZED ANTI-TUMOR VACCINES

Publications (3)

Publication Number Publication Date
RU2017133613A RU2017133613A (en) 2019-02-08
RU2017133613A3 RU2017133613A3 (en) 2020-12-10
RU2779946C2 true RU2779946C2 (en) 2022-09-15

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997040156A1 (en) * 1996-04-19 1997-10-30 The Government Of The United States Of America, Represented By The Secretary, Department Of Health And Human Services Mutated ras peptides for generation of cd8+ cytotoxic t lymphocytes
WO1999034015A2 (en) * 1997-12-24 1999-07-08 Imperial Cancer Research Technology Limited Polymorphisms within the rsk-3 gene related to cancer and methods of diagnosis, prognosis, and treatment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997040156A1 (en) * 1996-04-19 1997-10-30 The Government Of The United States Of America, Represented By The Secretary, Department Of Health And Human Services Mutated ras peptides for generation of cd8+ cytotoxic t lymphocytes
WO1999034015A2 (en) * 1997-12-24 1999-07-08 Imperial Cancer Research Technology Limited Polymorphisms within the rsk-3 gene related to cancer and methods of diagnosis, prognosis, and treatment

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PARMIANI G. et al., Unique human tumor antigens: immunobiology and use in clinical trials // The Journal of Immunology. - 2007. - Vol. 178. - No. 4. - P. 1975-1979. RAMMENSEE H. G. et al., Towards patient-specific tumor antigen selection for vaccination // Immunological reviews. - 2002. - Vol. 188. - No. 1. - P. 164-176. *
RAHMA O. E. et al., A pilot clinical trial testing mutant von Hippel-Lindau peptide as a novel immune therapy in metastatic renal cell carcinoma // Journal of translational medicine. - 2010. - Vol. 8. - Art. 8. *

Similar Documents

Publication Publication Date Title
JP7297715B2 (en) Personalized vaccines for cancer
AU2020230292B2 (en) Individualized vaccines for cancer
EP3892295B1 (en) Individualized vaccines for cancer
RU2779946C2 (en) Individualized anti-tumor vaccines
NZ617217B2 (en) Individualized vaccines for cancer
NZ718326B2 (en) Individualized vaccines for cancer