RU2781083C2 - Options, compositions, and methods for use of homing-endonuclease pd-1 - Google Patents

Options, compositions, and methods for use of homing-endonuclease pd-1 Download PDF

Info

Publication number
RU2781083C2
RU2781083C2 RU2019110065A RU2019110065A RU2781083C2 RU 2781083 C2 RU2781083 C2 RU 2781083C2 RU 2019110065 A RU2019110065 A RU 2019110065A RU 2019110065 A RU2019110065 A RU 2019110065A RU 2781083 C2 RU2781083 C2 RU 2781083C2
Authority
RU
Russia
Prior art keywords
cell
seq
variant
polypeptide
gene
Prior art date
Application number
RU2019110065A
Other languages
Russian (ru)
Other versions
RU2019110065A (en
RU2019110065A3 (en
Inventor
Джасдип МАНН
Джоэл ГАЙ
Джордан ДЖАРДЖУР
Джой ЧЖАН
Original Assignee
2сэвэнти био, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 2сэвэнти био, Инк. filed Critical 2сэвэнти био, Инк.
Priority claimed from PCT/US2017/050774 external-priority patent/WO2018049226A1/en
Publication of RU2019110065A publication Critical patent/RU2019110065A/en
Publication of RU2019110065A3 publication Critical patent/RU2019110065A3/ru
Application granted granted Critical
Publication of RU2781083C2 publication Critical patent/RU2781083C2/en

Links

Images

Abstract

FIELD: biotechnology.
SUBSTANCE: invention relates to the field of biotechnology, in particular to polypeptide containing variant I-OnuI of homing-endonuclease (HE), as well as to polynucleotide encoding it. A vector containing the above-mentioned polynucleotide is also disclosed. The invention also relates to a cell containing the above-mentioned polypeptide or polynucleotide, as well as to a composition containing the above-mentioned cell.
EFFECT: invention is effective for adoptive cell therapy.
16 cl, 24 dwg, 2 tbl, 14 ex

Description

ПЕРЕКРЕСТНЫЕ ССЫЛКИ НА РОДСТВЕННЫЕ ЗАЯВКИCROSS REFERENCES TO RELATED APPLICATIONS

Настоящая заявка испрашивает приоритет согласно §119 (e) Раздела 35 Свода законов США на основании предварительной заявки на патент США №62/414 279, поданной 28 октября 2016 г., и предварительной заявки на патент США №62/385 079, поданной 8 сентября 2016 г., каждая из которых в полном объеме включена в настоящую заявку посредством ссылки.This application claims priority under 35 U.S.C. §119(e) based on U.S. Provisional Application No. 62/414,279 filed October 28, 2016 and U.S. Provisional Application No. 62/385,079 filed September 8 2016, each of which is incorporated herein by reference in its entirety.

ЗАЯВЛЕНИЕ ОТНОСИТЕЛЬНО ПЕРЕЧНЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙSTATEMENT REGARDING THE SEQUENCE LISTING

Перечень последовательностей, связанный с данной заявкой, предоставлен в текстовом формате вместо бумажной копии и тем самым включен посредством ссылки в данное описание. Название текстового файла, содержащего перечень последовательностей, - BLBD_076_02WO_ST25.txt. Размер текстового файла составляет 266 кБ, он был создан 8 сентября 2017 года и подан в электронном виде через EFS-Web одновременно с подачей данного описания.The sequence listing associated with this application is provided in text format instead of a paper copy and is hereby incorporated by reference into this specification. The name of the text file containing the sequence listing is BLBD_076_02WO_ST25.txt. The text file is 266 kB in size and was created on September 8, 2017 and submitted electronically via EFS-Web at the same time as this description was submitted.

Уровень техникиState of the art

Область техникиTechnical field

Настоящее изобретение относится к улучшенным композициям для редактирования генома. В частности, изобретение относится к вариантам нуклеаз, композициям и способам их применения для редактирования гена запрограммированной клеточной гибели человека 1 (PD-1).The present invention relates to improved genome editing compositions. In particular, the invention relates to nuclease variants, compositions, and methods of using them to edit the human programmed cell death 1 (PD-1) gene.

Описание предшествующего уровня техникиDescription of the Prior Art

Глобальное бремя рака удвоилось в период между 1975 и 2000 годами. Рак является второй по значимости причиной заболеваемости и смертности во всем мире, с приблизительно 14,1 миллиона новых случаев заболевания и 8,2 миллиона смертей от рака с 2012 году. Наиболее распространенными видами рака являются рак молочной железы, рак легких и бронхов, рак простаты, рак толстой и прямой кишки, рак мочевого пузыря, меланома кожи, неходжкинская лимфома, рак щитовидной железы, рак почки и почечной лоханки, рак эндометрия, лейкоз и рак поджелудочной железы. Увеличение числа новых случаев заболевания раком прогнозируется до 22 миллионов в течение следующих двух десятилетий.The global burden of cancer doubled between 1975 and 2000. Cancer is the second leading cause of morbidity and mortality worldwide, with approximately 14.1 million new cases and 8.2 million cancer deaths since 2012. The most common cancers are breast cancer, lung and bronchial cancer, prostate cancer, colon and rectal cancer, bladder cancer, skin melanoma, non-Hodgkin's lymphoma, thyroid cancer, kidney and renal pelvis cancer, endometrial cancer, leukemia, and pancreatic cancer. glands. An increase in the number of new cancer cases is projected to reach 22 million over the next two decades.

Иммунная система играет ключевую роль в выявлении и борьбе с раком человека. Большинство трансформированных клеток быстро обнаруживаются иммунными стражами и разрушаются посредством активации антиген-специфических Т-клеток через клонально экспрессируемые Т-клеточные рецепторы (TCR). Соответственно, рак можно считать иммунологическим расстройством, неспособностью иммунной системы выработать необходимый противоопухолевый ответ для устойчивого подавления и устранения заболевания. В целях более эффективной борьбы с раком определенные иммунотерапевтические вмешательства, разработанные в последние несколько десятилетий, были специально направлены на повышение Т- клеточного иммунитета. Эти методы лечения приводили только к спорадическим случаям ремиссии заболевания и не имели существенного общего успеха. Более поздние методы лечения, с применением молекул, нацеленных на моноклональные антитела, которые ингибируют активацию Т-клеток, такие как CTLA-4 или PD-1, показали более существенный противоопухолевый эффект; однако эти методы лечения также ассоциированы с существенной токсичностью из-за системной иммунной активации.The immune system plays a key role in detecting and fighting human cancer. Most transformed cells are quickly detected by immune sentinels and destroyed through the activation of antigen-specific T cells through clonally expressed T cell receptors (TCRs). Accordingly, cancer can be considered an immunological disorder, the inability of the immune system to develop the necessary antitumor response to sustainably suppress and eliminate the disease. In order to more effectively fight cancer, certain immunotherapeutic interventions developed in the past few decades have been specifically directed at enhancing T-cell immunity. These treatments have only resulted in sporadic disease remissions and have not had significant overall success. More recent therapies using molecules that target monoclonal antibodies that inhibit T cell activation, such as CTLA-4 or PD-1, have shown a more significant antitumor effect; however, these treatments are also associated with significant toxicity due to systemic immune activation.

Совсем недавно были изучены и испытаны на ранних стадиях клинических испытаний стратегии адоптивной клеточной иммунотерапии, основанные на выделении, модификации, экспансии и реинфузии Т-клеток. Т-клетки часто являются эффекторными клетками выбора для иммунотерапии рака благодаря их избирательному распознаванию и мощным эффекторным механизмам. Эти методы лечения продемонстрировали смешанные показатели успеха, но у небольшого числа пациентов наблюдалась длительная ремиссия, что указывает на пока еще не реализованный потенциал для иммунотерапии на основе Т-клеток.More recently, adoptive cellular immunotherapy strategies based on the isolation, modification, expansion and reinfusion of T cells have been studied and tested in early clinical trials. T cells are often the effector cells of choice for cancer immunotherapy due to their selective recognition and powerful effector mechanisms. These therapies have shown mixed success rates, but a small number of patients have experienced long-term remission, indicating an as-yet untapped potential for T cell-based immunotherapy.

Успешное распознавание антигенов, ассоциированных с опухолевыми клетками, цитолитическими Т-клетками инициирует направленный лизис опухоли и лежит в основе любого эффективного подхода иммунотерапии рака. Инфильтрирующие опухоль Т-клетки (TIL) экспрессируют TCR, специфически направленные на опухоль-ассоциированные антигены; тем не менее, наличие значительного количества TIL ограничено только несколькими видами рака человека. Сконструированные Т-клеточные рецепторы (TCR) и химерные антигенные рецепторы (CAR) потенциально увеличивают применимость иммунотерапии на основе Т-клеток для многих видов рака и других иммунных нарушений.Successful recognition of tumor cell-associated antigens by cytolytic T cells initiates targeted tumor lysis and underpins any effective cancer immunotherapy approach. Tumor-infiltrating T cells (TILs) express TCRs specifically targeting tumor-associated antigens; however, the presence of significant amounts of TIL is limited to only a few human cancers. Engineered T cell receptors (TCRs) and chimeric antigen receptors (CARs) have the potential to increase the utility of T cell immunotherapy for many cancers and other immune disorders.

Кроме того, современные сконструированные Т-клетки все еще регулируются сложным иммунодепрессивным микроокружением, которое состоит из раковых клеток, воспалительных клеток, стромальных клеток и цитокинов. Среди этих компонентов раковые клетки, воспалительные клетки и супрессивные цитокины регулируют фенотип и функцию Т-клеток. В совокупности микроокружение опухоли заставляет Т-клетки терминально дифференцироваться в истощенные Т-клетки.In addition, today's engineered T cells are still regulated by a complex immunosuppressive microenvironment that consists of cancer cells, inflammatory cells, stromal cells, and cytokines. Among these components, cancer cells, inflammatory cells, and suppressive cytokines regulate T cell phenotype and function. Collectively, the tumor microenvironment causes T cells to terminally differentiate into depleted T cells.

Истощение Т-клеток - это состояние дисфункции Т-клеток в хронической среде, которое характеризуется повышенной экспрессией ингибирующих рецепторов или усилением их сигналов; снижением выработки эффекторных цитокинов; и уменьшением способности выживать и устранять рак. Истощенные Т-клетки также демонстрируют потерю функции иерархическим образом: снижение выработки IL-2 и способность к уничтожению ex vivo теряются на ранней стадии истощения, выработка TNF-α теряется на промежуточной стадии, а выработка IFN-γ и GzmB теряются на поздней стадии истощения. Большинство Т-клеток в микроокружении опухоли дифференцируются в истощенные Т-клетки, теряют способность устранять рак и в конечном итоге выводятся из игры.T cell depletion is a state of T cell dysfunction in a chronic environment that is characterized by increased expression of inhibitory receptors or an increase in their signals; decreased production of effector cytokines; and a decrease in the ability to survive and eliminate cancer. Depleted T cells also show loss of function in a hierarchical manner: decreased IL-2 production and ex vivo killing capacity are lost in the early depletion stage, TNF-α production is lost in the intermediate stage, and IFN-γ and GzmB production are lost in the late depletion stage. Most T cells in the tumor microenvironment differentiate into depleted T cells, lose their ability to eliminate the cancer, and are eventually eliminated from the game.

Белок запрограммированной гибели клеток 1 (PD-1) экспрессируется на Т-клетках и опосредует иммуносупрессию путем связывания с иммуносупрессивными факторами, например, PD-L1 и PD-L2, присутствующими в микроокружении опухоли. Экспрессия PD-L1 и PD-L2 коррелирует с прогнозом при некоторых злокачественных опухолях человека. Сигнальный путь PD-L1/PD-1 является одним из важных регуляторных путей истощения Т-клеток. PD-L1 широко экспрессируется в раковых клетках и стромальных клетках, а блокада PD-L1/PD-1 с помощью моноклональных антител усиливает противоопухолевую функцию Т-клеток. PD-L2 также связывается с PD-1 и отрицательно регулирует функцию Т-клеток.Programmed cell death protein 1 (PD-1) is expressed on T cells and mediates immunosuppression by binding to immunosuppressive factors such as PD-L1 and PD-L2 present in the tumor microenvironment. Expression of PD-L1 and PD-L2 correlates with prognosis in some human cancers. The PD-L1/PD-1 signaling pathway is one of the important regulatory pathways for T cell depletion. PD-L1 is widely expressed in cancer cells and stromal cells, and blockade of PD-L1/PD-1 by monoclonal antibodies enhances the antitumor function of T cells. PD-L2 also binds to PD-1 and negatively regulates T cell function.

Краткое описаниеShort description

В целом настоящее изобретение относится, в частности, к композициям, содержащим варианты хоминг-эндонуклеазы и megaTAL, которые расщепляют сайт-мишень в гене PD-1 человека, и способам их применения.In general, the present invention relates in particular to compositions containing homing endonuclease and megaTAL variants that cleave a target site in the human PD-1 gene, and methods of using them.

В различных вариантах реализации настоящее изобретение, в частности, предусматривает полипептид, содержащий вариант хоминг-эндонуклеазы (HE), который расщепляет сайт-мишень в гене запрограммированной гибели клеток человека 1 (PD-1).In various embodiments, the present invention specifically provides a polypeptide comprising a homing endonuclease (HE) variant that cleaves a target site in the human programmed cell death 1 (PD-1) gene.

В частных вариантах реализации вариант HE представляет собой вариант LAGLIDADG хоминг-эндонуклеазы (LHE).In particular embodiments, the HE variant is a homing endonuclease (LHE) LAGLIDADG variant.

В некоторых вариантах реализации указанный полипептид содержит биологически активный фрагмент указанного варианта HE.In some embodiments, said polypeptide comprises a biologically active fragment of said HE variant.

В некоторых вариантах реализации в указанном биологически активном фрагменте отсутствуют 1, 2, 3, 4, 5, 6, 7 или 8 N-концевых аминокислот по сравнению с соответствующей HE дикого типа.In some embodiments, the biologically active fragment lacks 1, 2, 3, 4, 5, 6, 7, or 8 N-terminal amino acids compared to the corresponding wild-type HE.

В дополнительных вариантах реализации в биологически активном фрагменте отсутствуют 4 N-концевые аминокислоты по сравнению с соответствующей HE дикого типа.In further embodiments, the biologically active fragment lacks the 4 N-terminal amino acids compared to the corresponding wild-type HE.

В некоторых вариантах реализации в биологически активном фрагменте отсутствуют 8 N-концевых аминокислот по сравнению с соответствующей HE дикого типа.In some embodiments, the biologically active fragment is missing 8 N-terminal amino acids compared to the corresponding wild-type HE.

В частных вариантах реализации в биологически активном фрагменте отсутствуют 1, 2, 3, 4 или 5 С-концевых аминокислот по сравнению с соответствующей HE дикого типа.In particular embodiments, the biologically active fragment lacks 1, 2, 3, 4, or 5 C-terminal amino acids compared to the corresponding wild-type HE.

В частных вариантах реализации в биологически активном фрагменте отсутствует С-концевая аминокислота по сравнению с соответствующей HE дикого типа.In particular embodiments, the biologically active fragment lacks a C-terminal amino acid compared to the corresponding wild-type HE.

В некоторых вариантах реализации в биологически активном фрагменте отсутствуют 2 С-концевые аминокислоты по сравнению с соответствующей HE дикого типа.In some embodiments, the biologically active fragment lacks 2 C-terminal amino acids compared to the corresponding wild-type HE.

В дополнительных вариантах реализации вариант HE представляет собой вариант LHE, выбранный из группы, состоящей из: I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-ScuMI, I-SmaMI, I-SscMI и I-Vdi141I.In further embodiments, the HE variant is an LHE variant selected from the group consisting of: I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I- HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-ScuMI, I-SmaMI, I-SscMI and I-Vdi141I.

В частных вариантах реализации вариант HE представляет собой вариант LHE, выбранный из группы, состоящей из: I-CpaMI, I-HjeMI, I-OnuI, I-PanMI и SmaMI.In particular embodiments, the HE variant is an LHE variant selected from the group consisting of: I-CpaMI, I-HjeMI, I-OnuI, I-PanMI, and SmaMI.

В дополнительных вариантах реализации вариант HE представляет собой вариант I-OnuI LHE.In further embodiments, the HE variant is the I-OnuI LHE variant.

В дополнительных вариантах реализации вариант HE содержит одну или более аминокислотных замен на поверхностном участке распознавания ДНК в положениях аминокислот, выбранных из группы, состоящей из: 19, 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 59, 68, 70, 72, 75, 76 77, 78, 80, 82, 168, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 195, 197, 199, 201, 203, 223, 225, 227, 229, 231, 232, 234, 236, 238 и 240 аминокислотной последовательности I-OnuI LHE, представленной в SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In additional embodiments, the HE variant contains one or more amino acid substitutions at the surface DNA recognition site at amino acid positions selected from the group consisting of: 19, 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 59, 68, 70, 72, 75, 76 77, 78, 80, 82, 168, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193 , 195, 197, 199, 201, 203, 223, 225, 227, 229, 231, 232, 234, 236, 238 and 240 of the I-OnuI LHE amino acid sequence shown in SEQ ID NOs: 1-5, or corresponding biologically active fragment.

В частных вариантах реализации вариант HE содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или даже более предпочтительно по меньшей мере 40 или более аминокислотных замен в интерфейсе распознавания ДНК в положениях аминокислот, выбранных из группы, состоящей из: 19, 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 59, 68, 70, 72, 75, 76 77, 78, 80, 82, 168, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 195, 197, 199, 201, 203, 223, 225, 227, 229, 231, 232, 234, 236, 238 и 240 аминокислотной последовательности I-OnuI LHE, представленной в SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In particular embodiments, the HE variant contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more amino acid substitutions in the DNA recognition interface at amino acid positions selected from the group consisting of: 19, 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 59, 68, 70, 72, 75, 76 77 , 78, 80, 82, 168, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 195, 197, 199, 201, 203, 223, 225, 227, 229, 231, 232 , 234, 236, 238 and 240 amino acid sequence of I-OnuI LHE, presented in SEQ ID NO: 1-5, or the corresponding biologically active fragment.

В частных вариантах реализации вариант HE расщепляет сайт-мишень экзона 5 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или даже более предпочтительно по меньшей мере 40 или более аминокислотных замен по меньшей мере в одной положении, выбранном из группы положений, состоящей из положений: 26, 28, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 59, 68, 70, 72, 75, 76, 78, 80, 138, 143, 159, 168, 178, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 197, 199, 201, 203, 207, 223, 224, 225, 227, 229, 232, 236 и 238 любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In particular embodiments, the HE variant cleaves the target site of exon 5 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more amino acids. substitutions in at least one position selected from the group of positions consisting of positions: 26, 28, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 59, 68, 70, 72 , 75, 76, 78, 80, 138, 143, 159, 168, 178, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 197, 199, 201, 203, 207, 223 , 224, 225, 227, 229, 232, 236 and 238 any of SEQ ID NOs: 1-5, or the corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 5 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более, или все из следующих аминокислотных замен: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40K, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, S72R, N75S, A76Y, S78K, K80R, L138M, T143N, S159P, F168L, E178D, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, S201M, T203G, K207R, Y223R, I224T, K225R, K229I, F232K, D236E и V238E любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant cleaves the target site of exon 5 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more, or all of the following amino acid substitutions: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40K, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, S72R, N75S, A76Y, S78K K80R, L138M, T143N, S159P, F168L, E1788D, C180H, F182G, N184I, I186A, S188RR, K189R, S190P, K191A, L192S, G193P, K197R, V199RA, S201M, T203G, K207M, K207M, K207M, K207M, T203G, K207M, T203G, K207M. , K229I, F232K, D236E and V238E any of SEQ ID NOs: 1-5, or the corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 5 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более, или все из следующих аминокислотных замен: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40K, E42R, G44R, Q46E, T48D, V68K, A70Y, S72Q, N75S, A76Y, S78K, K80R, L138M, T143N, S159P, F168L, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, T203G, K207R, Y223R, K225R, K229I, F232K, D236E и V238E любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant cleaves the target site of exon 5 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more, or all of the following amino acid substitutions: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40K, E42R, G44R, Q46E, T48D, V68K, A70Y, S72Q, N75S, A76Y, S78K, K80R, L138M, T143N , S159P, F168L, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, T203G, K207R, Y223R, K225R, K229I, F236K IDE and any of V236K IDE NO: 1-5, or the corresponding biologically active fragment.

В частных вариантах реализации вариант HE расщепляет сайт-мишень экзона 5 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или даже более предпочтительно, по меньшей мере 40 или более, или все следующих аминокислотных замен: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72R, N75S, A76Y, K80R, L138M, T143N, S159P, F168L, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, T203G, K207R, Y223R, I224T, K225R, K229I, F232K, D236E и V238E любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In particular embodiments, the HE variant cleaves the target site of exon 5 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more or all of the following amino acid substitutions: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72R, N75S, A76Y, K80R, L138M T143N, S159P, F168L, C180H, F182G, N184I, I186A, S188RR, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, T207G, K207R, Y223R, I224T, K229KA, K229K any of SEQ ID NOs: 1-5, or the corresponding biologically active fragment.

В дополнительных вариантах реализации вариант HE расщепляет сайт-мишень экзона 5 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более, или все из следующих аминокислотных замен: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, N75S, A76Y, K80R, L138M, T143N, S159P, F168L, E178D, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, T203G, K207R, Y223R, I224T, K225R, K229I, F232K, D236E и V238E любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In additional embodiments, the HE variant cleaves the target site of exon 5 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more, or all of the following amino acid substitutions: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, N75S, A76Y, K80R, L138M, T143N S159P, F168L, E1788D, C180H, F182G, N184I, I186A, S188RR, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, K207R, Y223R, I224T, K229KA, K229K any of SEQ ID NOs: 1-5, or the corresponding biologically active fragment.

В дополнительных вариантах реализации вариант HE расщепляет сайт-мишень экзона 5 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или даже более предпочтительно, по меньшей мере 40 или более, или все из следующих аминокислотных замен: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, N75S, A76Y, K80R, L138M, T143N, S159P, F168L, E178D, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, T203G, K207R, Y223R, K225R, F232K, D236E и V238E любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In additional embodiments, the HE variant cleaves the target site of exon 5 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more or all of the following amino acid substitutions: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, N75S, A76Y, K80R, L138M, T143N, S159P, F168L, E178D, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, T203G, K207R, Y223R, K225R, F232K, D236E и V238E любой from SEQ ID NO: 1-5, or the corresponding biologically active fragment.

В частных вариантах реализации вариант HE расщепляет сайт-мишень экзона 5 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или даже более предпочтительно, по меньшей мере 40 или более, или все из следующих аминокислотных замен: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, N75S, A76Y, K80R, L138M, T143N, S159P, F168L, E178D, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201M, T203G, Y223R, K225R, F232K, D236E и V238E любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In particular embodiments, the HE variant cleaves the target site of exon 5 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more or all of the following amino acid substitutions: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, N75S, A76Y, K80R, L138M, T143N, S159P, F168L, E178D, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201M, T203G, Y223R, K232KE any of SE2, F233R ID NO: 1-5, or the corresponding biologically active fragment.

В частных вариантах реализации вариант HE расщепляет сайт-мишень экзона 1 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или даже более предпочтительно по меньшей мере 40 или более аминокислотных замен по меньшей мере в одной позиции, выбранной из группы позиций, состоящей из позиций: 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 68, 70, 72, 75, 76, 78, 80, 100, 132, 138, 143, 155, 159, 178, 180, 184, 186, 189, 190, 191, 192, 193, 195, 201, 203, 207, 223, 225, 227, 232, 236, 238 и 240 любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In particular embodiments, the HE variant cleaves the target site of exon 1 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more amino acids. substitutions in at least one position selected from the group of positions consisting of positions: 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 68, 70, 72 , 75, 76, 78, 80, 100, 132, 138, 143, 155, 159, 178, 180, 184, 186, 189, 190, 191, 192, 193, 195, 201, 203, 207, 223, 225 , 227, 232, 236, 238 and 240 any of SEQ ID NOs: 1-5, or the corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 1 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или даже более предпочтительно по меньшей мере 40 или более аминокислотных замен по меньшей мере в одной позиции, выбранной из группы позиций, состоящей из позиций: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, V37G, G38R, S40H, E42R, G44S, Q46A, Q46T, T48V, T48M, V68I, V68S, A70T, A70Y, A70L, S72D, S72N, N75R, N75H, A76Y, S78R, S78T, K80R, K80C, K80E, K80V, T82F, T82Y, I100V, V132A, L138M, T143N, S155G, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и T240E любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant cleaves the target site of exon 1 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more amino acids. substitutions in at least one position selected from the group of positions consisting of positions: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, V37G, G38R, S40H, E42R, G44S, Q46A, Q46T, T48V, T48M , V68I, V68S, A70T, A70Y, A70L, S72D, S72N, N75R, N75H, A76Y, S78R, S78T, K80R, K80C, K80E, K80V, T82F, T82Y, I100V, V132A, L138M, T143N, S155G, E18DP , C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R and T240E any of SEQ ID NOs: 1-5 biologically active fragment.

В дополнительных вариантах реализации вариант HE расщепляет сайт-мишень экзона 1 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или даже более предпочтительно, по меньшей мере 40 или более из, или все из следующих аминокислотных замен: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46A, T48V, V68I, A70T, S72D, N75R, A76Y, S78R, K80R, I100V, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и T240E любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In additional embodiments, the HE variant cleaves the target site of exon 1 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of or all of the following amino acid substitutions: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46A, T48V, V68I, A70T, S72D, N75R, A76Y, S78R K80R, I100V, L138M, T143N, S159P, E1788D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223R, K225Y, K2277G, F2326R, F2326r, K227G any of SEQ ID NOs: 1-5, or the corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 1 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или даже более предпочтительно, по меньшей мере 40 или более из, или все из следующих аминокислотных замен: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, V37G, G38R, S40H, E42R, G44S, Q46T, T48V, V68I, A70T, S72D, N75R, A76Y, S78R, K80C, I100V, V132A, L138M, T143N, S155G, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и T240E любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant cleaves the target site of exon 1 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of or all of the following amino acid substitutions: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, V37G, G38R, S40H, E42R, G44S, Q46T, T48V, V68I, A70T, S72D, N75R, A76Y , S78R, K80C, I100V, V132A, L138M, T143N, S155G, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R , D236Q, V238R and T240E any of SEQ ID NOs: 1-5, or the corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 1 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или даже более предпочтительно, по меньшей мере 40 или более из, или все из следующих аминокислотных замен: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48M, V68I, A70T, S72N, N75H, A76Y, S78T, K80R, I100V, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и T240E любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant cleaves the target site of exon 1 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of or all of the following amino acid substitutions: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48M, V68I, A70T, S72N, N75H, A76Y, S78T K80R, I100V, L138M, T143N, S159P, E1788D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223R, K225Y, K2277G, F2326R, F2326r, K227G any of SEQ ID NOs: 1-5, or the corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 1 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или даже более предпочтительно, по меньшей мере 40 или более из, или все из следующих аминокислотных замен: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48M, V68S, A70Y, S72N, N75H, A76Y, K80E, T82F, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и T240E любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant cleaves the target site of exon 1 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of or all of the following amino acid substitutions: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48M, V68S, A70Y, S72N, N75H, A76Y, K80E , T82F, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, T230QR, any of the SEQ ID NO: 1-5, or the corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 1 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или даже более предпочтительно, по меньшей мере 40 или более из, или все из следующих аминокислотных замен: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48M, V68S, A70L, S72N, N75H, A76Y, K80V, T82Y, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и T240E любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant cleaves the target site of exon 1 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of or all of the following amino acid substitutions: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48M, V68S, A70L, S72N, N75H, A76Y, K80V . SEQ ID NO: 1-5, or the corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 1 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или даже более предпочтительно по меньшей мере 40 или более из, или все из следующих аминокислотных замен: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37G, G38R, S40H, E42R, G44S, Q46T, T48M, V68S, A70T, S72N, N75H, A76Y, K80V, T82Y, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и T240E любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant cleaves the target site of exon 1 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of , or all of the following amino acid substitutions: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37G, G38R, S40H, E42R, G44S, Q46T, T48M, V68S, A70T, S72N, N75H, A76Y, K80V, T82Y, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D23R Q : 1-5, or the corresponding biologically active fragment.

В частных вариантах реализации вариант HE расщепляет сайт-мишень экзона 2 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более аминокислотных замен в по меньшей мере одной позиции, выбранной из группы позиций, состоящей из позиций: 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 41, 42, 44, 46, 48, 68, 70, 72, 74, 75, 76, 78, 80, 82, 116, 138, 143, 159, 168, 178, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 195, 199, 203, 207, 225, 227, 229, 232, 236 и 238 любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In particular embodiments, the HE variant cleaves the target site of exon 2 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more amino acids. substitutions in at least one position selected from the group of positions consisting of positions: 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 41, 42, 44, 46, 48, 68 , 70, 72, 74, 75, 76, 78, 80, 82, 116, 138, 143, 159, 168, 178, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 195 , 199, 203, 207, 225, 227, 229, 232, 236 and 238 any of SEQ ID NOs: 1-5, or the corresponding biologically active fragment.

В дополнительных вариантах реализации вариант HE расщепляет сайт-мишень экзона 2 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или даже более предпочтительно по меньшей мере 40 или более аминокислотных замен по меньшей мере в одной позиции, выбранной из группы позиций, состоящей из позиций: S24C, L26Q, R28Y, R28H, R30S, N32V, N32L, K34N, K34R, S35N, S35T, S36R, V37S, V37T, G38R, G38K, S40R, T41A, E42R, G44S, G44R, Q46E, Q46A, T48E, V68I, A70N, S72I, D74N, N75T, N75R, A76S, A76R, S78R, K80S, T82G, T82R, V116L, L138M, T143N, S159P, F168L, E178D, C180N, F182Y, N184H, I186K, K189G, S190R, K191T, L192T, G193R, Q195Y, V199R, T203A, T203S, K207R, K225N, K225T, K227W, K227S, K229A, K229P, F232R, W234A, W234D, D236E и V238R любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In additional embodiments, the HE variant cleaves the target site of exon 2 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more amino acids. substitutions in at least one position selected from the group of positions consisting of positions: S24C, L26Q, R28Y, R28H, R30S, N32V, N32L, K34N, K34R, S35N, S35T, S36R, V37S, V37T, G38R, G38K, S40R . , C180N, F182Y, N184H, I186K, K189G, S190R, K191T, L192T, G193R, Q195Y, V199R, T203A, T203S, K207R, K225N, K225T, K227W, K227S, K229A, K229P, F232R, W234A, W234D, D236E и V238R any of SEQ ID NOs: 1-5, or the corresponding biologically active fragment.

В частных вариантах реализации вариант HE расщепляет сайт-мишень экзона 2 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более из, или все из следующих аминокислотных замен: L26Q, R28Y, R30S, N32V, K34N, S35N, S36R, V37S, G38R, S40R, T41A, E42R, G44R, Q46A, T48E, A70N, S72I, N75T, A76S, S78R, K80S, T82G, L138M, T143N, S159P, F168L, E178D, C180N, F182Y, N184H, I186K, K189G, S190R, K191T, L192T, G193R, Q195Y, V199R, T203A, K207R, K225N, K227W, K229A, F232R, W234A, D236E и V238R любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In particular embodiments, the HE variant cleaves the PD-1 exon 2 target site and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of , or all of the following amino acid substitutions: L26Q, R28Y, R30S, N32V, K34N, S35N, S36R, V37S, G38R, S40R, T41A, E42R, G44R, Q46A, T48E, A70N, S72I, N75T, A76S, S78R, K80S, T82G, L138M, T143N, S159P, F168L, E178D, C180N, F182Y, N184H, I186K, K189G, S190R, K191T, L192T, G193R, Q195Y, V199R, T203A, K207R, K225N, K227W, K229A, F232R, W234A, D236E и V238R any of SEQ ID NOs: 1-5, or the corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 2 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более из, или все из следующих аминокислотных замен: S24C, R28H, N32L, K34R, S35T, V37T, G38K, S40R, E42R, G44S, Q46E, T48E, V68I, A70N, S72I, D74N, N75R, A76R, S78R, K80S, T82R, V116L, L138M, T143N, S159P, F168L, E178D, C180N, F182Y, N184H, I186K, K189G, S190R, K191T, L192T, G193R, Q195Y, V199R, T203S, K207R, K225T, K227S, K229P, F232R, W234D, D236E и V238R любой из SEQ ID NO: 1-5, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant cleaves the target site of exon 2 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of , or all of the following amino acid substitutions: S24C, R28H, N32L, K34R, S35T, V37T, G38K, S40R, E42R, G44S, Q46E, T48E, V68I, A70N, S72I, D74N, N75R, A76R, S78R, K80S, T82R, V116L, L138M, T143N, S159P, F168L, E178D, C180N, F182Y, N184H, I186K, K189G, S190R, K191T, L192T, G193R, Q195Y, V199R, T203S, K207R, K225T, K227S, K229P, F232R, W234D, D236E и V238R any of SEQ ID NOs: 1-5, or the corresponding biologically active fragment.

В дополнительных вариантах реализации вариант HE содержит аминокислотную последовательность, которая по меньшей мере на 80%, предпочтительно, по меньшей мере на 85%, более предпочтительно, по меньшей мере на 90% или даже более предпочтительно, по меньшей мере на 95%, идентична аминокислотной последовательности, представленной в любой из SEQ ID NO: 6-14, 60-63 или ее соответствующий биологически активный фрагмент.In additional embodiments, the HE variant contains an amino acid sequence that is at least 80%, preferably at least 85%, more preferably at least 90%, or even more preferably at least 95% identical to the amino acid the sequence presented in any of SEQ ID NO: 6-14, 60-63 or its corresponding biologically active fragment.

В частных вариантах реализации вариант HE содержит аминокислотную последовательность, представленную в SEQ ID NO: 6, или соответствующий биологически активный фрагмент.In private embodiments, the HE variant contains the amino acid sequence shown in SEQ ID NO: 6 or a corresponding biologically active fragment.

В частных вариантах реализации вариант HE содержит аминокислотную последовательность, представленную в SEQ ID NO: 7, или соответствующий биологически активный фрагмент.In private embodiments, the HE variant contains the amino acid sequence shown in SEQ ID NO: 7 or the corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE содержит аминокислотную последовательность, представленную в SEQ ID NO: 8, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant contains the amino acid sequence shown in SEQ ID NO: 8 or a corresponding biologically active fragment.

В частных вариантах реализации вариант HE содержит аминокислотную последовательность, представленную в SEQ ID NO: 9, или соответствующий биологически активный фрагмент.In private embodiments, the HE variant contains the amino acid sequence shown in SEQ ID NO: 9 or a corresponding biologically active fragment.

В частных вариантах реализации вариант HE содержит аминокислотную последовательность, представленную в SEQ ID NO: 10, или соответствующий биологически активный фрагмент.In private embodiments, the HE variant contains the amino acid sequence shown in SEQ ID NO: 10 or a corresponding biologically active fragment.

В частных вариантах реализации вариант HE содержит аминокислотную последовательность, представленную в SEQ ID NO: 11, или соответствующий биологически активный фрагмент.In private embodiments, the HE variant contains the amino acid sequence shown in SEQ ID NO: 11 or a corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE содержит аминокислотную последовательность, представленную в SEQ ID NO: 12, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant contains the amino acid sequence shown in SEQ ID NO: 12 or a corresponding biologically active fragment.

В частных вариантах реализации вариант HE содержит аминокислотную последовательность, представленную в SEQ ID NO: 13, или соответствующий биологически активный фрагмент.In private embodiments, the HE variant contains the amino acid sequence shown in SEQ ID NO: 13 or a corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE содержит аминокислотную последовательность, представленную в SEQ ID NO: 14, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant contains the amino acid sequence shown in SEQ ID NO: 14 or a corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE содержит аминокислотную последовательность, представленную в SEQ ID NO: 60, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant contains the amino acid sequence shown in SEQ ID NO: 60 or a corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE содержит аминокислотную последовательность, представленную в SEQ ID NO: 61, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant contains the amino acid sequence shown in SEQ ID NO: 61 or a corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE содержит аминокислотную последовательность, представленную в SEQ ID NO: 62, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant contains the amino acid sequence shown in SEQ ID NO: 62 or a corresponding biologically active fragment.

В некоторых вариантах реализации вариант HE содержит аминокислотную последовательность, представленную в SEQ ID NO: 63, или соответствующий биологически активный фрагмент.In some embodiments, the HE variant contains the amino acid sequence shown in SEQ ID NO: 63 or a corresponding biologically active fragment.

В частных вариантах реализации полипептид связывает полинуклеотидную последовательность, представленную в SEQ ID NO: 25.In particular embodiments, the polypeptide binds the polynucleotide sequence shown in SEQ ID NO: 25.

В частных вариантах реализации полипептид связывает полинуклеотидную последовательность, представленную в SEQ ID NO: 30.In particular embodiments, the polypeptide binds the polynucleotide sequence shown in SEQ ID NO: 30.

В частных вариантах реализации полипептид связывает полинуклеотидную последовательность, представленную в SEQ ID NO: 35.In particular embodiments, the polypeptide binds the polynucleotide sequence shown in SEQ ID NO: 35.

В дополнительных вариантах реализации полипептид дополнительно содержит ДНК-связывающий домен.In further embodiments, the polypeptide further comprises a DNA binding domain.

В некоторых вариантах реализации ДНК-связывающий домен выбран из группы, состоящей из: ДНК-связывающего домена TALE и ДНК-связывающего домена «цинковые пальцы».In some embodiments, the DNA binding domain is selected from the group consisting of: the TALE DNA binding domain and the zinc fingers DNA binding domain.

В некоторых вариантах реализации ДНК-связывающий домен TALE содержит от приблизительно 9,5 областей повторов TALE до приблизительно 15,5 областей повторов TALE.In some embodiments, a TALE DNA binding domain contains from about 9.5 TALE repeat regions to about 15.5 TALE repeat regions.

В дополнительных вариантах реализации ДНК-связывающий домен TALE связывает полинуклеотидную последовательность в гене PD-1.In further embodiments, the TALE DNA binding domain binds a polynucleotide sequence within the PD-1 gene.

В частных вариантах реализации ДНК-связывающий домен TALE связывает полинуклеотидную последовательность, представленную в SEQ ID NO: 26.In particular embodiments, the TALE DNA binding domain binds the polynucleotide sequence shown in SEQ ID NO: 26.

В некоторых вариантах реализации полипептид связывает и расщепляет полинуклеотидную последовательность, представленную в SEQ ID NO: 27.In some embodiments, the polypeptide binds and cleaves the polynucleotide sequence shown in SEQ ID NO: 27.

В частных вариантах реализации ДНК-связывающий домен TALE связывает полинуклеотидную последовательность, представленную в SEQ ID NO: 31.In particular embodiments, the TALE DNA binding domain binds the polynucleotide sequence shown in SEQ ID NO: 31.

В некоторых вариантах реализации полипептид связывает и расщепляет полинуклеотидную последовательность, представленную в SEQ ID NO: 32.In some embodiments, the polypeptide binds and cleaves the polynucleotide sequence shown in SEQ ID NO: 32.

В частных вариантах реализации ДНК-связывающий домен TALE связывает полинуклеотидную последовательность, представленную в SEQ ID NO: 36.In particular embodiments, the TALE DNA binding domain binds the polynucleotide sequence shown in SEQ ID NO: 36.

В определенных вариантах реализации полипептид связывает и расщепляет полинуклеотидную последовательность, представленную в SEQ ID NO: 37.In certain embodiments, the polypeptide binds and cleaves the polynucleotide sequence shown in SEQ ID NO: 37.

В некоторых вариантах реализации ДНК-связывающий домен «цинковые пальцы» содержит 2, 3, 4, 5, 6, 7 или 8 мотивов «цинковые пальцы».In some embodiments, the zinc finger DNA binding domain contains 2, 3, 4, 5, 6, 7, or 8 zinc finger motifs.

В дополнительных вариантах реализации полипептид дополнительно содержит пептидный линкер и фермент, изменяющий структуру концов, или соответствующий биологически активный фрагмент.In further embodiments, the polypeptide further comprises a peptide linker and an end restructuring enzyme or an appropriate biologically active fragment.

В частных вариантах реализации полипептид дополнительно содержит вирусный саморасщепляемый пептид 2А и фермент, изменяющий структуру концов, или соответствующий биологически активный фрагмент.In private embodiments, the polypeptide further comprises a viral self-cleaving peptide 2A and an end-reversing enzyme or a corresponding biologically active fragment.

В дополнительных вариантах реализации фермент, изменяющий структуру концов, или соответствующий биологически активный фрагмент обладает 5'-3'-экзонуклеазной, 5'-3' щелочной экзонуклеазной, 3'-5', 5'-flap-экзонуклеазной, геликазной или матрично-независимой ДНК-полимеразной активностью.In additional embodiments, the end-reversing enzyme or corresponding biologically active fragment has a 5'-3'-exonuclease, 5'-3' alkaline exonuclease, 3'-5', 5'-flap exonuclease, helicase, or template-independent DNA polymerase activity.

В частных вариантах реализации фермент, изменяющий структуру концов, содержит белок Trex2 или соответствующий биологически активный фрагмент.In private embodiments, the end-altering enzyme comprises the Trex2 protein or an appropriate biologically active fragment.

В некоторых вариантах реализации полипептид содержит аминокислотную последовательность, представленную в любой из SEQ ID NO: 15-23 и 64, или соответствующий биологически активный фрагмент.In some embodiments, the polypeptide contains the amino acid sequence shown in any of SEQ ID NOs: 15-23 and 64, or a corresponding biologically active fragment.

В дополнительных вариантах реализации полипептид содержит аминокислотную последовательность, представленную в SEQ ID NO: 15, или соответствующий биологически активный фрагмент.In additional embodiments, the implementation of the polypeptide contains the amino acid sequence presented in SEQ ID NO: 15, or the corresponding biologically active fragment.

В частных вариантах реализации полипептид содержит аминокислотную последовательность, представленную в SEQ ID NO: 16, или соответствующий биологически активный фрагмент.In private embodiments, the polypeptide contains the amino acid sequence shown in SEQ ID NO: 16, or the corresponding biologically active fragment.

В различных вариантах реализации полипептид содержит аминокислотную последовательность, представленную в SEQ ID NO: 17, или соответствующий биологически активный фрагмент.In various embodiments, the polypeptide contains the amino acid sequence shown in SEQ ID NO: 17, or the corresponding biologically active fragment.

В частных вариантах реализации полипептид содержит аминокислотную последовательность, представленную в SEQ ID NO: 18, или соответствующий биологически активный фрагмент.In private embodiments, the polypeptide contains the amino acid sequence shown in SEQ ID NO: 18, or the corresponding biologically active fragment.

В частных вариантах реализации полипептид содержит аминокислотную последовательность, представленную в SEQ ID NO: 19, или соответствующий биологически активный фрагмент.In private embodiments, the polypeptide contains the amino acid sequence shown in SEQ ID NO: 19, or the corresponding biologically active fragment.

В некоторых вариантах реализации полипептид содержит аминокислотную последовательность, представленную в SEQ ID NO: 20, или соответствующий биологически активный фрагмент.In some embodiments, the polypeptide contains the amino acid sequence shown in SEQ ID NO: 20 or a corresponding biologically active fragment.

В некоторых вариантах реализации полипептид содержит аминокислотную последовательность, представленную в SEQ ID NO: 21, или соответствующий биологически активный фрагмент.In some embodiments, the polypeptide contains the amino acid sequence shown in SEQ ID NO: 21 or a corresponding biologically active fragment.

В дополнительных вариантах реализации полипептид содержит аминокислотную последовательность, представленную в SEQ ID NO: 22, или соответствующий биологически активный фрагмент.In additional embodiments, the implementation of the polypeptide contains the amino acid sequence presented in SEQ ID NO: 22, or the corresponding biologically active fragment.

В дополнительных вариантах реализации полипептид содержит аминокислотную последовательность, представленную в SEQ ID NO: 23, или соответствующий биологически активный фрагмент.In additional embodiments, the implementation of the polypeptide contains the amino acid sequence shown in SEQ ID NO: 23, or the corresponding biologically active fragment.

В дополнительных вариантах реализации полипептид содержит аминокислотную последовательность, представленную в SEQ ID NO: 64, или соответствующий биологически активный фрагмент.In additional embodiments, the polypeptide comprises the amino acid sequence shown in SEQ ID NO: 64 or a corresponding biologically active fragment.

В дополнительных вариантах реализации полипептид, рассматриваемый в настоящей заявке, содержит аминокислотную последовательность, представленную в SEQ ID NO: 24, или соответствующий биологически активный фрагмент.In additional embodiments, the implementation of the polypeptide considered in this application contains the amino acid sequence presented in SEQ ID NO: 24, or the corresponding biologically active fragment.

В других вариантах реализации полипептид расщепляет ген PD-1 человека на полинуклеотидной последовательности, представленной в SEQ ID NO: 25, 27, 30, 32, 35 или 37.In other embodiments, the polypeptide cleaves the human PD-1 gene at the polynucleotide sequence shown in SEQ ID NOS: 25, 27, 30, 32, 35, or 37.

В различных вариантах реализации настоящее изобретение, в частности, предусматривает полинуклеотид, кодирующий полипептид, рассматриваемый в настоящей заявке.In various embodiments, the present invention specifically provides a polynucleotide encoding a polypeptide contemplated in this application.

В частных вариантах реализации настоящее изобретение, в частности, предусматривает мРНК, кодирующую полипептид, рассматриваемый в настоящей заявке.In particular embodiments of the present invention, in particular, provides mRNA encoding the polypeptide discussed in this application.

В частных вариантах реализации мРНК содержит последовательность, представленную в SEQ ID NO: 40-42 и 65-68.In private embodiments, the mRNA contains the sequence shown in SEQ ID NOs: 40-42 and 65-68.

В различных вариантах реализации настоящее изобретение предусматривает, в частности, кДНК, кодирующую полипептид, рассматриваемый в настоящей заявке.In various embodiments, the present invention provides, in particular, cDNA encoding the polypeptide discussed in this application.

В определенных вариантах реализации настоящее изобретение, в частности,предусматривает вектор, содержащий полинуклеотид, кодирующий полипептид, рассматриваемый в настоящей заявке.In certain embodiments of the present invention, in particular, provides a vector containing a polynucleotide encoding a polypeptide discussed in this application.

В различных вариантах реализации настоящее изобретение, в частности, предусматривает клетку, содержащую полипептид, рассматриваемый в настоящей заявке.In various embodiments, the present invention specifically provides a cell containing the polypeptide discussed in this application.

В некоторых вариантах реализации настоящее изобретение, в частности, предусматривает клетку, содержащую полинуклеотид, кодирующий полипептид, рассматриваемый в настоящей заявке.In some embodiments, the present invention specifically provides a cell containing a polynucleotide encoding a polypeptide contemplated in this application.

В различных вариантах реализации настоящее изобретение, в частности, предусматривает клетку, содержащую вектор, рассматриваемый в настоящей заявке.In various embodiments, the present invention specifically provides a cell containing the vector discussed in this application.

В дополнительных вариантах настоящее изобретение, в частности, предусматривает клетку, содержащую одну или более модификаций генома, введенных полипептидом, рассматриваемым в настоящей заявке.In additional embodiments, the present invention specifically provides a cell containing one or more genome modifications introduced by the polypeptide discussed in this application.

В частных вариантах реализации клетка содержит полинуклеотид, кодирующий один или более группы, состоящей из: энхансера иммунопотенции, демпфера иммуносупрессивного сигнала или сконструированного рецептора антигена.In particular embodiments, the cell contains a polynucleotide encoding one or more groups consisting of: an immunopotentiation enhancer, an immunosuppressive signal damper, or an engineered antigen receptor.

В некоторых вариантах реализации полинуклеотид дополнительно содержит промотор РНК-полимеразы II, функционально связанный с полинуклеотидом, кодирующим энхансер иммунопотенции, демпфер иммуносупрессивного сигнала или сконструированный рецептор антигена.In some embodiments, the polynucleotide further comprises an RNA polymerase II promoter operably linked to a polynucleotide encoding an immunopotentiation enhancer, an immunosuppressive signal damper, or an engineered antigen receptor.

В частных вариантах реализации промотор РНК-полимеразы II выбран из группы, состоящей из короткого промотора EF1α, длинного промотора EF1α, локуса ROSA 26 человека, промотора убиквитина C (UBC), промотора фосфоглицераткиназы-1 (PGK), энхансера цитомегаловируса/промотора β-актина курицы (CAG), промотора β-актина и энхансера вируса миелопролиферативной саркомы с делецией опосредующего отрицательную регуляцию участка, с заменой на праймер-связывающий сайт из dl587rev (MND).In particular embodiments, the RNA polymerase II promoter is selected from the group consisting of EF1α short promoter, EF1α long promoter, human ROSA 26 locus, ubiquitin C (UBC) promoter, phosphoglycerate kinase-1 (PGK) promoter, cytomegalovirus enhancer/β-actin promoter chicken (CAG), promoter of β-actin and enhancer of myeloproliferative sarcoma virus with a deletion of the downregulatory site, with a replacement for the primer-binding site from dl587rev (MND).

В некоторых вариантах реализации полинуклеотид дополнительно кодирует один или более саморасщепляемых вирусных пептидов, функционально связанных, рассеянных между и/или фланкирующих энхансер иммунопотенции, демпфер иммуносупрессивного сигнала или сконструированный рецептор антигена.In some embodiments, the polynucleotide further encodes one or more self-cleaving viral peptides operably linked, interspersed between, and/or flanking an immunopotentiation enhancer, an immunosuppressive signal damper, or an engineered antigen receptor.

В некоторых вариантах реализации саморасщепляемый вирусный пептид представляет собой пептид 2А.In some embodiments, the self-cleaving viral peptide is a 2A peptide.

В определенных вариантах реализации полинуклеотид дополнительно содержит гетерологичный сигнал полиаденилирования.In certain embodiments, the polynucleotide further comprises a heterologous polyadenylation signal.

В некоторых вариантах реализации демпфер иммуносупрессивного сигнала включает ферментативную функцию, которая противодействует иммуносупрессорному фактору.In some embodiments, an immunosuppressive signal damper includes an enzymatic function that counteracts an immunosuppressive factor.

В некоторых вариантах реализации демпфер иммуносупрессивного сигнала включает кинурениназную активность.In some embodiments, the immunosuppressive signal damper includes kynureninase activity.

В частных вариантах реализации демпфер иммуносупрессивного сигнала содержит: экзодомен, который связывает иммуносупрессивный фактор, причем, необязательно, указанный экзодомен представляет собой антитело или его антигенсвязывающий фрагмент; экзодомен, который связывает иммуносупрессивный фактор и трансмембранный домен; или экзодомен, который связывает иммуносупрессивный фактор, трансмембранный домен и модифицированный эндодомен, который не способен трансдуцировать иммуносупрессивные сигналы в клетку.In particular embodiments, the immunosuppressive signal damper comprises: an exodomain that binds an immunosuppressive factor, optionally said exodomain being an antibody or an antigen-binding fragment thereof; an exodomain that binds an immunosuppressive factor and a transmembrane domain; or an exodomain that binds an immunosuppressive factor, a transmembrane domain, and a modified endodomain that is unable to transduce immunosuppressive signals into the cell.

В некоторых вариантах реализации демпфер иммуносупрессивного сигнала представляет собой доминантный отрицательный рецептор TGFβRII.In some embodiments, the immunosuppressive signal damper is a dominant negative TGFβRII receptor.

В некоторых вариантах реализации энхансер иммунопотенции выбран из группы, состоящей из: молекулы биспецифического Т-клеточного активатора (BiTE), иммуноопотенцирующего фактора и флип-рецептора.In some embodiments, the immunopotentiator enhancer is selected from the group consisting of: a bispecific T cell activator (BiTE) molecule, an immunopotentiating factor, and a flip receptor.

В частных вариантах реализации иммунопотенцирующий фактор выбран из группы, состоящей из цитокина, хемокина, цитотоксина, рецептора цитокина и их вариантов.In particular embodiments, the immunopotentiating factor is selected from the group consisting of a cytokine, a chemokine, a cytotoxin, a cytokine receptor, and variants thereof.

В частных вариантах реализации рецептор цитокина выбран из группы, состоящей из рецептора IL-2, рецептора IL-7, рецептора IL-12, рецептора IL-15, рецептора IL-18 и рецептора IL-21.In particular embodiments, the cytokine receptor is selected from the group consisting of IL-2 receptor, IL-7 receptor, IL-12 receptor, IL-15 receptor, IL-18 receptor, and IL-21 receptor.

В предпочтительном варианте реализации клетка содержит полинуклеотид, кодирующий рецептор цитокина, выбранный из группы, состоящей из рецептора IL-2, рецептора IL-7, рецептора IL-12, рецептора IL-15, рецептора IL-18, и рецептора IL-21, функционально связанный с эндогенным промотором PD-1.In a preferred embodiment, the cell comprises a polynucleotide encoding a cytokine receptor selected from the group consisting of an IL-2 receptor, an IL-7 receptor, an IL-12 receptor, an IL-15 receptor, an IL-18 receptor, and an IL-21 receptor, functionally associated with the endogenous PD-1 promoter.

В другом предпочтительном варианте реализации клетка содержит полинуклеотид, кодирующий рецептор цитокина IL-12, функционально связанный с эндогенным промотором PD-1.In another preferred embodiment, the cell contains a polynucleotide encoding an IL-12 cytokine receptor operably linked to an endogenous PD-1 promoter.

В частных вариантах реализации цитокин выбран из группы, состоящей из IL-2, IL-7, IL-12, IL-15, IL-18 и IL-21.In particular embodiments, the cytokine is selected from the group consisting of IL-2, IL-7, IL-12, IL-15, IL-18 and IL-21.

В предпочтительном варианте реализации клетка содержит полинуклеотид, кодирующий цитокин, выбранный из группы, состоящей из IL-2, IL-7, IL-12, IL-15, IL-18 и IL-21, функционально связанных с эндогенным промотором PD-1.In a preferred embodiment, the cell contains a polynucleotide encoding a cytokine selected from the group consisting of IL-2, IL-7, IL-12, IL-15, IL-18 and IL-21 operably linked to the endogenous PD-1 promoter.

В другом предпочтительном варианте реализации клетка содержит полинуклеотид, кодирующий IL-12, функционально связанный с эндогенным промотором PD-1.In another preferred embodiment, the cell contains a polynucleotide encoding IL-12 operably linked to an endogenous PD-1 promoter.

В дополнительных вариантах реализации флип-рецептор содержит экзодомен PD-1 и трансмембранный домен; и эндодомен из CD28, CD134, CD137, CD278 и/или CD3ζ, слитые в рамке с C-концевым концом трансмембранного домена PD-1.In further embodiments, the flip receptor comprises a PD-1 exodomain and a transmembrane domain; and an endodomain of CD28, CD134, CD137, CD278 and/or CD3ζ fused in frame to the C-terminal end of the PD-1 transmembrane domain.

В определенных вариантах реализации, флип-рецептор содержит экзодомен PD-1; трансмембранный домен, выделенный из полипептида CD3, CD4, CD8α, CD28, CD134 или CD137; и эндодомен из CD28, CD134, CD137, CD278 и/или CD3ζ, слитые в рамке с C-концевым концом экзодомена PD-1.In certain embodiments, the flip receptor comprises a PD-1 exodomain; a transmembrane domain isolated from a CD3, CD4, CD8α, CD28, CD134 or CD137 polypeptide; and an endodomain of CD28, CD134, CD137, CD278 and/or CD3ζ fused in frame to the C-terminal end of the PD-1 exodomain.

В частных вариантах реализации флип-рецептор содержит экзодомен PD-1; а также трансмембранный домен и эндодомен, выделенные из полипептида CD3, CD4, CD8α, CD28, CD134 или CD137, слитые в рамке с C-концевым концом экзодомена PD-1.In private embodiments, the flip receptor contains a PD-1 exodomain; as well as a transmembrane domain and an endodomain isolated from a CD3, CD4, CD8α, CD28, CD134, or CD137 polypeptide fused in frame to the C-terminal end of the PD-1 exodomain.

В дополнительных вариантах реализации сконструированный рецептор антигена выбран из группы, состоящей из: сконструированного TCR, CAR, Daric или дзетакина.In further embodiments, the engineered antigen receptor is selected from the group consisting of: engineered TCR, CAR, Daric, or zetakin.

В частных вариантах сконструированный рецептор не встроен в ген PD-1.In particular embodiments, the engineered receptor is not integrated into the PD-1 gene.

В некоторых вариантах реализации полинуклеотид, кодирующий один или более из: энхансера иммунопотенции, демпфера иммуносупрессивного сигнала или сконструированного рецептора антигена, встроен в ген PD-1.In some embodiments, a polynucleotide encoding one or more of an immunopotentiation enhancer, an immunosuppressive signal damper, or an engineered antigen receptor is inserted into the PD-1 gene.

В других вариантах реализации матрица донорной репарации, содержащая полинуклеотид, кодирующий один или более из: энхансера иммунопотенции, демпфера иммуносупрессивного сигнала или сконструированный рецептор антигена, встроен в ген PD-1 в сайте двухцепочечного разрыва ДНК, введенном посредством полипептида, рассматриваемого в настоящей заявке.In other embodiments, a donor repair template comprising a polynucleotide encoding one or more of an immunopotentiation enhancer, an immunosuppressive signal damper, or an engineered antigen receptor is inserted into the PD-1 gene at a DNA double-strand break site introduced by the polypeptide of this application.

В частных вариантах реализации донорная матрица репарации, содержащая полинуклеотид, кодирующий цитокин, выбранный из группы, состоящей из IL-2, IL-7, IL-12, IL-15, IL-18 и IL-21, встроена в PD-1 ген в сайте двухцепочечного разрыва ДНК, введенном полипептидом, рассматриваемым в настоящей заявке. В предпочтительных вариантах реализации цитокин встроен в ген PD-1 в функциональной связи с эндогенным промотором PD-1.In particular embodiments, a donor repair template containing a polynucleotide encoding a cytokine selected from the group consisting of IL-2, IL-7, IL-12, IL-15, IL-18, and IL-21 is inserted into the PD-1 gene. at the DNA double-strand break site introduced by the polypeptide of the present application. In preferred embodiments, the cytokine is inserted into the PD-1 gene in operable association with the endogenous PD-1 promoter.

В частных вариантах реализации донорная матрица репарации, содержащая полинуклеотид, кодирующий цитокин IL-12, встроена в ген PD-1 в сайте двухцепочечного разрыва ДНК, введенном полипептидом, рассматриваемым в настоящей заявке. В предпочтительных вариантах реализации цитокин IL-12 встроен в ген PD-1 в функциональной связи с эндогенным промотором PD-1.In particular embodiments, a repair donor template containing a polynucleotide encoding the cytokine IL-12 is inserted into the PD-1 gene at the DNA double-strand break site introduced by the polypeptide of this application. In preferred embodiments, the IL-12 cytokine is inserted into the PD-1 gene in operable association with the endogenous PD-1 promoter.

В частных вариантах реализации донорная матрица репарации содержит полинуклеотид, кодирующий рецептор цитокина, выбранный из группы, состоящей из рецептора IL-2, рецептора IL-7, рецептора IL-12, рецептора IL-15, рецептора IL-18 и рецептора IL-21, встроена в ген PD-1 в сайте двухцепочечного разрыва ДНК, введенном полипептидом, рассматриваемым в настоящей заявке. В предпочтительных вариантах цитокиновый рецептор встроен в ген PD-1 в функциональной связи с эндогенным промотором PD-1.In particular embodiments, the donor repair template contains a polynucleotide encoding a cytokine receptor selected from the group consisting of an IL-2 receptor, an IL-7 receptor, an IL-12 receptor, an IL-15 receptor, an IL-18 receptor, and an IL-21 receptor, inserted into the PD-1 gene at the DNA double-strand break site introduced by the polypeptide of the present application. In preferred embodiments, the cytokine receptor is inserted into the PD-1 gene in operable association with the endogenous PD-1 promoter.

В частных вариантах реализации донорная матрица репарации, содержащая полинуклеотид, кодирующий рецептор цитокина IL-12, встроена в ген PD-1 в сайте двухцепочечного разрыва ДНК, введенном полипептидом, рассматриваемым в настоящей заявке. В предпочтительных вариантах реализации рецептор цитокинов IL-12 встроен в ген PD-1 в функциональной связи с эндогенным промотором PD-1.In particular embodiments, a repair donor template containing a polynucleotide encoding the IL-12 cytokine receptor is inserted into the PD-1 gene at a DNA double-strand break site introduced by the polypeptide of the present application. In preferred embodiments, the IL-12 cytokine receptor is inserted into the PD-1 gene in operable association with the endogenous PD-1 promoter.

В некоторых вариантах реализации клетка представляет собой гемопоэтическую клетку.In some embodiments, the cell is a hematopoietic cell.

В дополнительных вариантах реализации клетка представляет собой Т-клетку.In further embodiments, the cell is a T cell.

В частных вариантах реализации клетка представляет собой клетку CD3+, CD4+и/или CD8+.In particular embodiments, the cell is a CD3+, CD4+, and/or CD8+ cell.

В частных вариантах реализации клетка представляет собой иммунную эффекторную клетку.In particular embodiments, the cell is an immune effector cell.

В других вариантах реализации клетка представляет собой цитотоксический Т-лимфоцит (ЦТЛ), инфильтрирующий опухоль лимфоцит (TIL) или хелперную Т-клетку.In other embodiments, the cell is a cytotoxic T lymphocyte (CTL), a tumor infiltrating lymphocyte (TIL), or a helper T cell.

В некоторых вариантах реализации клетка представляет собой природный киллер (NK) или T-клетку природный киллер (NKT).In some embodiments, the cell is a natural killer (NK) or natural killer T (NKT) cell.

В частных вариантах реализации источником клеток являются мононуклеарные клетки периферической крови, костный мозг, ткань лимфатических узлов, пуповинная кровь, ткань тимуса, ткань из места инфекции, асцит, плевральный выпот, ткань селезенки или опухоль.In particular embodiments, the cell source is peripheral blood mononuclear cells, bone marrow, lymph node tissue, cord blood, thymus tissue, tissue from the site of infection, ascites, pleural effusion, spleen tissue, or tumor.

В частных вариантах реализации настоящее изобретение предусматривает, в частности, совокупность клеток, содержащих одну или более клеток, рассматриваемых в настоящей заявке.In private embodiments, the present invention provides, in particular, a set of cells containing one or more of the cells discussed in this application.

В различных вариантах реализации настоящее изобретение предусматривает, в частности, композицию, содержащую одну или более клеток, рассматриваемых в настоящей заявке.In various embodiments, the present invention provides, in particular, a composition containing one or more of the cells discussed in this application.

В определенных вариантах реализации настоящее изобретение предусматривает, в частности, композицию, содержащую одну или более клеток, рассматриваемых в настоящей заявке, и физиологически приемлемый носитель.In certain embodiments, the present invention provides, in particular, a composition containing one or more of the cells discussed in this application, and a physiologically acceptable carrier.

В различных вариантах реализации настоящее изобретение предусматривает, в частности, способ редактирования гена PD-1 человека в клетке, включающий введение полинуклеотида, кодирующего полипептид, рассматриваемый в настоящей заявке, в клетку, при котором экспрессия данного полипептида создает разрыв двойной цепи в сайте-мишени в гене PD-1 человека.In various embodiments, the present invention provides, in particular, a method for editing a human PD-1 gene in a cell, comprising introducing a polynucleotide encoding a polypeptide contemplated in this application into a cell, in which the expression of this polypeptide creates a double strand break at a target site in human PD-1 gene.

В некоторых вариантах реализации настоящее изобретение, в частности, предусматривает способ редактирования гена PD-1 человека в клетке, включающий: введение полинуклеотида, кодирующего полипептид, рассматриваемый в настоящей заявке, в клетку, при котором экспрессия данного полипептида создает двухцепочечный разрыв в сайте-мишени в гене PD-1 человека, причем указанный разрыв репарируется негомологичным соединением концов (NHEJ).In some embodiments, the present invention specifically provides a method for editing a human PD-1 gene in a cell, comprising: introducing a polynucleotide encoding a polypeptide of the present application into the cell, wherein expression of the polypeptide creates a double-strand break at a target site in the human PD-1 gene, said gap being repaired by non-homologous end joining (NHEJ).

В некоторых вариантах реализации настоящее изобретение, в частности, предусматривает способ редактирования гена PD-1 человека в клетке, включающий введение полинуклеотида, кодирующего полипептид, рассматриваемый в настоящей заявке, и донорной матрицы репарации в клетку, при котором экспрессия полипептида создает двухцепочечный разрыв в сайте-мишени в гене PD-1 человека, и донорная матрица репарации включается в ген PD-1 человека посредством гомологичной репарации (HDR) в сайте двухцепочечного разрыва (DSB).In some embodiments, the present invention specifically provides a method for editing a human PD-1 gene in a cell, comprising introducing a polynucleotide encoding a polypeptide of the present application and a repair donor template into the cell, wherein expression of the polypeptide creates a double-strand break at the site- targets in the human PD-1 gene, and the repair donor template is incorporated into the human PD-1 gene via homologous repair (HDR) at a double-strand break site (DSB).

В других вариантах реализации клетка представляет собой гемопоэтическую клетку.In other embodiments, the cell is a hematopoietic cell.

В частных вариантах реализации клетка представляет собой Т-клетку.In particular embodiments, the cell is a T cell.

В частных вариантах реализации клетка представляет собой клетку CD3+, CD4+и/или CD8+.In particular embodiments, the cell is a CD3 + , CD4 + and/or CD8 + cell.

В определенных вариантах реализации клетка представляет собой иммунную эффекторную клетку.In certain embodiments, the cell is an immune effector cell.

В некоторых вариантах реализации клетка представляет собой цитотоксический Т-лимфоцит (ЦТЛ), инфильтрирующий опухоль лимфоцит (TIL) или хелперную Т-клетку.In some embodiments, the cell is a cytotoxic T lymphocyte (CTL), a tumor infiltrating lymphocyte (TIL), or a helper T cell.

В частных вариантах реализации клетка представляет собой клетку природный киллер (NK) или T-клетку природный киллер (NKT).In particular embodiments, the cell is a natural killer (NK) cell or a natural killer T (NKT) cell.

В некоторых вариантах реализации источником клеток являются мононуклеарные клетки периферической крови, костный мозг, ткань лимфатических узлов, пуповинная кровь, ткань тимуса, ткань из места инфекции, асцит, плевральный выпот, ткань селезенки или опухоль.In some embodiments, the cell source is peripheral blood mononuclear cells, bone marrow, lymph node tissue, cord blood, thymus tissue, tissue from the site of infection, ascites, pleural effusion, spleen tissue, or tumor.

В частных вариантах реализации полинуклеотид, кодирующий полипептид, представляет собой мРНК.In particular embodiments, the polynucleotide encoding the polypeptide is an mRNA.

В дополнительных вариантах реализации в клетку вводят полинуклеотид, кодирующий 3'-5' экзонуклеазу.In further embodiments, a polynucleotide encoding a 3'-5' exonuclease is introduced into the cell.

В некоторых вариантах реализации в клетку вводят полинуклеотид, кодирующий Trex2 или соответствующий биологически активный фрагмент.In some embodiments, a polynucleotide encoding Trex2 or a corresponding biologically active fragment is introduced into the cell.

В других вариантах реализации донорная матрица репарации кодирует ген PD-1 или его часть, содержащую одну или более мутаций по сравнению с геном PD-1 дикого типа.In other embodiments, the donor repair template encodes a PD-1 gene or a portion thereof containing one or more mutations compared to the wild-type PD-1 gene.

В частных вариантах реализации донорная матрица репарации кодирует один или более из: энхансера иммунопотенции, демпфера иммуносупрессивного сигнала или сконструированного рецептора антигена.In particular embodiments, the donor repair template encodes one or more of an immunopotentiation enhancer, an immunosuppressive signal damper, or an engineered antigen receptor.

В дополнительных вариантах реализации донорная матрица репарации дополнительно содержит промотор РНК-полимеразы II, функционально связанный с энхансером иммунопотенции, демпфером иммуносупрессивного сигнала или сконструированным рецептором антигена.In further embodiments, the donor repair template further comprises an RNA polymerase II promoter operably linked to an immunopotentiation enhancer, immunosuppressive signal damper, or engineered antigen receptor.

В других вариантах промотор РНК-полимеразы II выбран из группы, состоящей из короткого промотора EF1α, длинного промотора EF1α, локуса ROSA 26 человека, промотора убиквитина C (UBC), промотора фосфоглицераткиназы-1 (PGK), энхансера цитомегаловируса/промотора β-актина курицы (CAG), промотора β-актина и энхансера вируса миелопролиферативной саркомы с делецией опосредующего отрицательную регуляцию участка, с заменой на праймер-связывающий сайт из dl587rev (MND).In other embodiments, the RNA polymerase II promoter is selected from the group consisting of EF1α short promoter, EF1α long promoter, human ROSA 26 locus, ubiquitin C (UBC) promoter, phosphoglycerate kinase-1 (PGK) promoter, cytomegalovirus enhancer/chicken β-actin promoter (CAG), promoter of β-actin and enhancer of myeloproliferative sarcoma virus with a deletion of the downregulatory site, with a replacement for the primer-binding site from dl587rev (MND).

В определенных вариантах реализации донорная матрица репарации дополнительно кодирует один или более саморасщепляемых вирусных пептидов, функционально связанных, рассеянных между и/или фланкирующих энхансер иммунопотенции, демпфер иммуносупрессивного сигнала или сконструированный рецептор антигена.In certain embodiments, the donor repair template further encodes one or more self-cleaving viral peptides operably linked, interspersed between, and/or flanking an immunopotentiation enhancer, an immunosuppressive signal damper, or an engineered antigen receptor.

В дополнительных вариантах реализации саморасщепляемый вирусный пептид представляет собой пептид 2А.In further embodiments, the self-cleaving viral peptide is a 2A peptide.

В некоторых вариантах реализации донорная матрица репарации дополнительно содержит гетерологичный сигнал полиаденилирования.In some embodiments, the repair donor matrix further comprises a heterologous polyadenylation signal.

В некоторых вариантах реализации демпфер иммуносупрессивного сигнала включает ферментативную функцию, которая противодействует иммуносупрессорному фактору.In some embodiments, an immunosuppressive signal damper includes an enzymatic function that counteracts an immunosuppressive factor.

В других вариантах реализации демпфер иммуносупрессивного сигнала включает кинурениназную активность.In other embodiments, the immunosuppressive signal damper includes kynureninase activity.

В частных вариантах реализации демпфер иммуносупрессивного сигнала содержит: экзодомен, который связывает иммуносупрессивный фактор, причем, необязательно, указанный экзодомен представляет собой антитело или его антигенсвязывающий фрагмент; экзодомен, который связывает иммуносупрессивный фактор и трансмембранный домен; или экзодомен, который связывает иммуносупрессивный фактор, трансмембранный домен и модифицированный эндодомен, который не способен трансдуцировать иммуносупрессивные сигналы в клетку.In particular embodiments, the immunosuppressive signal damper comprises: an exodomain that binds an immunosuppressive factor, optionally said exodomain being an antibody or an antigen-binding fragment thereof; an exodomain that binds an immunosuppressive factor and a transmembrane domain; or an exodomain that binds an immunosuppressive factor, a transmembrane domain, and a modified endodomain that is unable to transduce immunosuppressive signals into the cell.

В дополнительных вариантах реализации демпфер иммуносупрессивного сигнала представляет собой доминантный отрицательный рецептор TGFβRII.In further embodiments, the immunosuppressive signal damper is a dominant negative TGFβRII receptor.

В некоторых вариантах реализации энхансер иммунопотенции выбран из группы, состоящей из: молекулы биспецифического Т-клеточного активатора (BiTE), иммуноопотенцирующего фактора и флип-рецептора.In some embodiments, the immunopotentiator enhancer is selected from the group consisting of: a bispecific T cell activator (BiTE) molecule, an immunopotentiating factor, and a flip receptor.

В других вариантах реализации иммунопотенцирующий фактор выбран из группы, состоящей из цитокина, хемокина, цитотоксина, рецептора цитокина и их вариантов.In other embodiments, the immunopotentiating factor is selected from the group consisting of a cytokine, a chemokine, a cytotoxin, a cytokine receptor, and variants thereof.

В частных вариантах реализации иммунопотенцирующий фактор выбран из группы, состоящей из цитокина, хемокина, цитотоксина, рецептора цитокина и их вариантов.In particular embodiments, the immunopotentiating factor is selected from the group consisting of a cytokine, a chemokine, a cytotoxin, a cytokine receptor, and variants thereof.

В частных вариантах реализации рецептор цитокина выбран из группы, состоящей из рецептора IL-2, рецептора IL-7, рецептора IL-12, рецептора IL-15, рецептора IL-18 и рецептора IL-21.In particular embodiments, the cytokine receptor is selected from the group consisting of IL-2 receptor, IL-7 receptor, IL-12 receptor, IL-15 receptor, IL-18 receptor, and IL-21 receptor.

В предпочтительном варианте реализации клетка содержит полинуклеотид, кодирующий рецептор цитокина, выбранный из группы, состоящей из рецептора IL-2, рецептора IL-7, рецептора IL-12, рецептора IL-15, рецептора IL-18, и рецептора IL-21, функционально связанный с эндогенным промотором PD-1.In a preferred embodiment, the cell comprises a polynucleotide encoding a cytokine receptor selected from the group consisting of an IL-2 receptor, an IL-7 receptor, an IL-12 receptor, an IL-15 receptor, an IL-18 receptor, and an IL-21 receptor, functionally associated with the endogenous PD-1 promoter.

В другом предпочтительном варианте реализации клетка содержит полинуклеотид, кодирующий рецептор цитокина IL-12, функционально связанный с эндогенным промотором PD-1.In another preferred embodiment, the cell contains a polynucleotide encoding an IL-12 cytokine receptor operably linked to an endogenous PD-1 promoter.

В частных вариантах реализации цитокин выбран из группы, состоящей из IL-2, IL-7, IL-12, IL-15, IL-18 и IL-21.In particular embodiments, the cytokine is selected from the group consisting of IL-2, IL-7, IL-12, IL-15, IL-18 and IL-21.

В предпочтительном варианте реализации клетка содержит полинуклеотид, кодирующий цитокин, выбранный из группы, состоящей из IL-2, IL-7, IL-12, IL-15, IL-18 и IL-21, функционально связанных с эндогенным промотором PD-1.In a preferred embodiment, the cell contains a polynucleotide encoding a cytokine selected from the group consisting of IL-2, IL-7, IL-12, IL-15, IL-18 and IL-21 operably linked to the endogenous PD-1 promoter.

В другом предпочтительном варианте реализации клетка содержит полинуклеотид, кодирующий IL-12, функционально связанный с эндогенным промотором PD-1.In another preferred embodiment, the cell contains a polynucleotide encoding IL-12 operably linked to an endogenous PD-1 promoter.

В частных вариантах реализации флип-рецептор содержит экзодомен PD-1 и трансмембранный домен; и эндодомен из CD28, CD134, CD137, CD278 и/или CD3ζ, слитые в рамке с C-концевым концом трансмембранного домена PD-1.In private embodiments, the flip receptor contains a PD-1 exodomain and a transmembrane domain; and an endodomain of CD28, CD134, CD137, CD278 and/or CD3ζ fused in frame to the C-terminal end of the PD-1 transmembrane domain.

В дополнительных вариантах реализации, флип-рецептор содержит экзодомен PD-1; трансмембранный домен, выделенный из полипептида CD3, CD4, CD8α, CD28, CD134 или CD137; и эндодомен из CD28, CD134, CD137, CD278 и/или CD3ζ, слитые в рамке с C-концевым концом экзодомена PD-1.In further embodiments, the flip receptor comprises a PD-1 exodomain; a transmembrane domain isolated from a CD3, CD4, CD8α, CD28, CD134 or CD137 polypeptide; and an endodomain of CD28, CD134, CD137, CD278 and/or CD3ζ fused in frame to the C-terminal end of the PD-1 exodomain.

В других вариантах реализации, флип-рецептор содержит экзодомен PD-1; а также трансмембранный домен и эндодомен, выделенные из полипептида CD3, CD4, CD8α, CD28, CD134 или CD137, слитые в рамке с C-концевым концом экзодомена PD-1.In other embodiments, the flip receptor comprises a PD-1 exodomain; as well as a transmembrane domain and an endodomain isolated from a CD3, CD4, CD8α, CD28, CD134, or CD137 polypeptide fused in frame to the C-terminal end of the PD-1 exodomain.

В дополнительных вариантах реализации сконструированный рецептор антигена выбран из группы, состоящей из: сконструированного TCR, CAR, Daric или дзетакина.In further embodiments, the engineered antigen receptor is selected from the group consisting of: engineered TCR, CAR, Daric, or zetakin.

В дополнительных вариантах реализации, донорная матрица репарации содержит 5'-гомологичное плечо, гомологичное 5'-последовательности гена PD-1 человека DSB, и 3'- гомологичное плечо, гомологичное 3'-последовательности гена PD-1 человека DSB.In further embodiments, the donor repair template comprises a 5' homologous arm homologous to the 5' human DSB PD-1 gene sequence and a 3' homologous arm homologous to the 3' human PD-1 DSB gene sequence.

В частных вариантах реализации длины 5'- и 3'-гомологичных плеч выбраны независимо от приблизительно 100 до приблизительно 2500 п.н.In private embodiments, the lengths of the 5' and 3' homologous arms are independently chosen from about 100 to about 2500 bp.

В некоторых вариантах реализации длины 5'- и 3'-гомологичных плеч независимо выбраны от приблизительно 600 до приблизительно 1500 п.н.In some embodiments, the lengths of the 5' and 3' homologous arms are independently selected from about 600 to about 1500 bp.

В некоторых вариантах 5'-гомологичное плечо составляет приблизительно 1500 п.н., а 3'- гомологичное плечо составляет приблизительно 1000 п.н.In some embodiments, the 5' homologous arm is about 1500 bp and the 3' homologous arm is about 1000 bp.

В некоторых вариантах реализации 5'-гомологичное плечо составляет приблизительно 600 п.н., а 3'-гомологичное плечо составляет приблизительно 600 п.н.In some embodiments, the 5' homologous arm is approximately 600 bp and the 3' homologous arm is approximately 600 bp.

В частных вариантах реализации для введения донорной матрицы репарации в клетку используют вирусный вектор.In private embodiments, a viral vector is used to introduce the donor repair template into the cell.

В дополнительных вариантах реализации вирусный вектор представляет собой рекомбинантный адено-ассоциированный вирусный вектор (rAAV) или ретровирус.In further embodiments, the viral vector is a recombinant adeno-associated viral vector (rAAV) or a retrovirus.

В других вариантах реализации, указанный rAAV имеет один или более ITR из AAV2.In other embodiments, said rAAV has one or more ITRs from AAV2.

В некоторых вариантах реализации rAAV имеет серотип, выбранный из группы, состоящей из: AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9 и AAV10.In some embodiments, rAAV has a serotype selected from the group consisting of: AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, and AAV10.

В дополнительных вариантах реализации, rAAV имеет серотип AAV2 или AAV6.In additional implementations, rAAV has the serotype AAV2 or AAV6.

В некоторых вариантах реализации ретровирус представляет собой лентивирус.In some embodiments, the retrovirus is a lentivirus.

В частных вариантах реализации лентивирус является дефицитным по интегразе лентивирусом (IDLV).In particular embodiments, the lentivirus is an integrase-deficient lentivirus (IDLV).

В различных вариантах реализации настоящее изобретение, в частности, предусматривает способ лечения, предотвращения или ослабления по меньшей мере одного симптома рака, инфекционного заболевания, аутоиммунного заболевания, воспалительного заболевания и иммунодефицита или состояния, ассоциированного с ними, включающий введение субъекту эффективного количества композиции, рассматриваемой в настоящей заявке.In various embodiments, the present invention specifically provides a method of treating, preventing, or alleviating at least one symptom of cancer, an infectious disease, an autoimmune disease, an inflammatory disease, and an immunodeficiency or condition associated therewith, comprising administering to a subject an effective amount of a composition contemplated in this application.

В различных вариантах реализации настоящее изобретение, в частности, предусматривает способ лечения солидного рака, включающий введение субъекту эффективного количества композиции, рассматриваемой в настоящей заявке.In various embodiments, the present invention specifically provides a method of treating solid cancer comprising administering to a subject an effective amount of a composition of the present application.

В других вариантах реализации, солидный рак включает рак печени, рак поджелудочной железы, рак легких, рак молочной железы, рак яичников, рак предстательной железы, рак яичка, рак мочевого пузыря, рак мозга, саркому, рак головы и шеи, рак кости, рак щитовидной железы, рак почки или рак кожи.In other embodiments, solid cancer includes liver cancer, pancreatic cancer, lung cancer, breast cancer, ovarian cancer, prostate cancer, testicular cancer, bladder cancer, brain cancer, sarcoma, head and neck cancer, bone cancer, cancer thyroid, kidney cancer, or skin cancer.

В различных вариантах реализации настоящее изобретение, в частности, предусматривает способ лечения гематологического злокачественного заболевания, включающий введение субъекту эффективного количества композиции, рассматриваемой в настоящей заявке.In various embodiments, the present invention specifically provides a method of treating a hematological malignancy comprising administering to a subject an effective amount of a composition of the present application.

В дополнительных вариантах реализации, указанное гематологическое злокачественное заболевание представляет собой лейкоз, лимфому или множественную миелому.In further embodiments, said hematologic malignancy is leukemia, lymphoma, or multiple myeloma.

Краткое описание нескольких видов чертежейBrief description of several types of drawings

Фигура 1A. Схема, иллюстрирующая положения домена IgV и мотивов ITIM и ITSM PD-1 относительно положения сайта-мишени megaTAL в экзоне.Figure 1A. Diagram illustrating the positions of the IgV domain and the ITIM and ITSM motifs of PD-1 relative to the position of the megaTAL target site in the exon.

Фигура 1B. Ген PD-1 и последовательность сайта-мишень в мотиве ITSM, кодируемого экзоном 5 (SEQ ID NO: 106 - 108), выделен мотив центральный-4 HE, расположенный в кодоне для остатка фосфотирозина ITSM в положении 248.Figure 1B. The PD-1 gene and target site sequence in the ITSM motif encoded by exon 5 (SEQ ID NO: 106 - 108) isolated the central-4 HE motif located in the codon for the ITSM phosphotyrosine residue at position 248.

Фигура 2. I-OnuI был перепрограммирован посредством конструирования NTD (N-концевой домен) и CTD (С-концевой домен) для химерных «полу-сайтов» (SEQ ID NO: 109 и 110) с помощью двух раундов сортировки с последующим слиянием перепрограммированных доменов (SEQ ID NO: 111) и скрининга на полный экзон PD-1 5 сайт-мишень, чтобы изолировать полностью перепрограммированное HE.Figure 2. I-OnuI was reprogrammed by constructing NTD (N-terminal domain) and CTD (C-terminal domain) for chimeric "semi-sites" (SEQ ID NOS: 109 and 110) using two rounds of sorting followed by fusion of the reprogrammed domains (SEQ ID NO: 111) and screening for the full exon of the PD-1 5 target site to isolate the fully reprogrammed HE.

Фигура 3A. Первоначальный скрининг варианта экзона 5 гена PD-1 на активность в анализе по хромосомному репортеру.Figure 3A. Initial screening of the exon 5 variant of the PD-1 gene for activity in a chromosomal reporter assay.

Фигура 3B. Вариант HE PD-1 (PD-1.ITSM.ex5_RD1_CV3-08) обладал умеренными свойствами аффинности связывания ДНК при измерении путем равновесного титрования субстрата.Figure 3B. The HE PD-1 variant (PD-1.ITSM.ex5_RD1_CV3-08) had moderate DNA binding affinity properties as measured by equilibrium substrate titration.

Фигура 4. Вторичный скрининг HE PD-1 на активность в анализе по хромосомному репортеру после выделения улучшенных вариантов из сортировки потока на основе дисплея случайным образом мутагенизированной библиотеки вариантов PD-1.ITSM.ex5_RD1_CV3-08, выполненной при более строгих условиях расщеплении и аффинности для выделения вариантов с улучшенной активностью.Figure 4. Secondary screening of HE PD-1 for activity in the chromosomal reporter assay following isolation of improved variants from stream sorting based on display of a randomly mutagenized library of PD-1.ITSM.ex5_RD1_CV3-08 variants performed under more stringent cleavage and affinity conditions for isolating variants with improved activity.

Фигура 5. Результаты анализа бисульфитного секвенирования экзона 5 PD-1 (SEQ ID NO: 112) в активированных первичных Т-клетках человека для определения статуса метилирования мотивов CpG (SEQ ID NO: 113), присутствующих в экзоне 5 HE PD-1.Figure 5. Results of bisulfite sequencing analysis of exon 5 of PD-1 (SEQ ID NO: 112) in activated primary human T cells to determine the methylation status of CpG motifs (SEQ ID NO: 113) present in exon 5 of HE PD-1.

Фигура 6. Результаты анализа аффинности связывания и расщепления ДНК для варианта HE PD-1.ITSM.ex5_RD5_CV23MK по сравнению с частично и полностью метилированными субстратами экзона 5 PD-1.Figure 6. DNA binding and cleavage affinity analysis results for the PD-1.ITSM.ex5_RD5_CV23MK HE variant compared to partially and fully methylated PD-1 exon 5 substrates.

Фигура 7A. Совместная доставка megaTAL PD-1.ITSM.ex5_RD5_CV23MK в T-клетки вместе с TREX2 редактирует локус-мишень на уровне приблизительно 60%, согласно измерениям анализом TIDE.Figure 7A. Co-delivery of megaTAL PD-1.ITSM.ex5_RD5_CV23MK to T cells along with TREX2 edits the target locus at approximately 60% as measured by TIDE analysis.

Фигура 7B. Распределение инделов по консенсусному мотиву PD-1 ITSM при расщеплении megaTAL PD-1.ITSM.ex5_RD5_CV23MK в присутствии Trex2.Figure 7B. Distribution of indels according to the PD-1 ITSM consensus motif during cleavage of megaTAL PD-1.ITSM.ex5_RD5_CV23MK in the presence of Trex2.

Фигура 8. Результаты профилирования центральной-4 специфичности экзона 5 HE PD-1.Figure 8. Results of HE PD-1 exon 5 central-4 specificity profiling.

Фигура 9A. Схема, иллюстрирующая положения доменов IgV, ITIM и ITSM PD-1 относительно положения экзонов 1, 2 и 5.Figure 9A. Diagram illustrating the positions of the IgV, ITIM, and ITSM PD-1 domains relative to the positions of exons 1, 2, and 5.

Фигура 9B. Ген PD-1 и местоположение сайта-мишени в экзонах 1 (SEQ ID NO: 114 - 116), 2 (SEQ ID NO: 117-119) и 5 (SEQ ID NO: 106-108).Figure 9B. PD-1 gene and target site location in exons 1 (SEQ ID NO: 114-116), 2 (SEQ ID NO: 117-119) and 5 (SEQ ID NO: 106-108).

Фигура 10. Результаты анализов хромосомных репортеров после сортировки потока на основе дисплея в отношении каталитической активности для первоначально перепрограммированного I-OnuI, нацеленного на экзон 1 PD-1 (PD-1.ile3.exon1_RD1_B1, верхняя панель); обогащение PD-1.ile3.exon1_RD1_B1 путем мутагенизации и скрининга в более жестких каталитических условиях для выявления мутаций, которые способствуют расщеплению мишени, для выявления более активных вариантов (PD-1.ile3.exon1_RD2_B1H8 и PD-1.ile3.exon1_RD2_B1G2, средние панели); и первоначально перепрограммированного I-OnuI, нацеленного на экзон 2 PD-1 (PD-1.IgV.exon2_RD1_G5, нижняя панель). Результаты показаны для нуклеазы в присутствии Trex2 (левые панели) и отформатированы в виде megaTAL (правые панели).Figure 10. Results of chromosomal reporter assays after stream sorting based on display for catalytic activity for initially reprogrammed I-OnuI targeting exon 1 of PD-1 (PD-1.ile3.exon1_RD1_B1, upper panel); enrichment of PD-1.ile3.exon1_RD1_B1 by mutagenization and screening under more stringent catalytic conditions to identify mutations that promote target cleavage to identify more active variants (PD-1.ile3.exon1_RD2_B1H8 and PD-1.ile3.exon1_RD2_B1G2, middle panels ); and originally reprogrammed I-OnuI targeting PD-1 exon 2 (PD-1.IgV.exon2_RD1_G5, bottom panel). Results are shown for nuclease in the presence of Trex2 (left panels) and formatted as megaTAL (right panels).

Фигура 11A. Величины аффинности связывания ДНК для вариантов PD-1.ile3.exon1_RD2_B1H8 и PD-1.IgV.exon2_RD1_G5 при измерении путем равновесного титрования субстрата с применением их соответствующих последовательностей-мишеней.Figure 11A. DNA binding affinity values for the PD-1.ile3.exon1_RD2_B1H8 and PD-1.IgV.exon2_RD1_G5 variants as measured by equilibrium substrate titration using their respective target sequences.

Фигура 11B. Сравнение активности расщепления ДНК среди обогащенных по специфичности нуклеаз PD-1.ile3.exon1 (RD2_B1G2, RD3_B1G2C4, RD3_B1G2C11, RD3_B1G2C5) в отношении 64 ДНК-мишеней, с вариациями в парах оснований -8, -7 и -6. Теплокарта представляет коэфициент не-расщепления: медианные значения расщепления получены из точечных графиков.Figure 11B. Comparison of DNA cleavage activity among specificity-rich PD-1.ile3.exon1 nucleases (RD2_B1G2, RD3_B1G2C4, RD3_B1G2C11, RD3_B1G2C5) against 64 target DNAs, with variations in base pairs -8, -7 and -6. The heat map represents the non-split coefficient: the median split values are obtained from the scatter plots.

Фигура 12. Результаты анализа бисульфитного секвенирования экзона 1 (SEQ ID NO: 120) и экзона 2 (SEQ ID NO: 122) PD-1 в активированных первичных Т-клетках человека (левые панели), демонстрирующие, что мотив CpG экзона 1 PD-1 (SEQ ID NO: 121) остается неметилированным, в то время как мотивы CpG экзона 2 PD-1 (SEQ ID NO: 123) метилированы. Фигура 12 также показывает, что PD-1.IgV.exon2_RD1_G5 эффективно расщеплял и неметилированный, и метилированный сайт-мишень (правая верхняя и правая нижняя панели, соответственно).Figure 12. Results of bisulfite sequencing analysis of exon 1 (SEQ ID NO: 120) and exon 2 (SEQ ID NO: 122) of PD-1 in activated primary human T cells (left panels), demonstrating that the CpG motif of exon 1 of PD- 1 (SEQ ID NO: 121) remains unmethylated, while the CpG motifs of exon 2 of PD-1 (SEQ ID NO: 123) are methylated. Figure 12 also shows that PD-1.IgV.exon2_RD1_G5 efficiently cleaves both the unmethylated and methylated target site (top right and bottom right panels, respectively).

Фигура 13A. Поверхностная экспрессия PD-1 в CAR Т-клетках, электропорированных пустым носителем, CFP, megaTALCCR5, megaTALPD-1.ITSM.ex5_RD5_CV23MK или megaTAL PD-1.ile3.exon1_RD2_B1H8, а затем стимулированных пустым носителем или форбол-12-миристат 13-ацетатом (PMA)/иономицином (P/I).Figure 13A. Surface expression of PD-1 in CAR T cells electroporated with blank vehicle, CFP, megaTALCCR5, megaTALPD-1.ITSM.ex5_RD5_CV23MK or megaTAL PD-1.ile3.exon1_RD2_B1H8 and then stimulated with blank vehicle or phorbol-12-myristate 13-acetate (PMA)/ionomycin (P/I).

Фигура 13B. Поверхностная экспрессия PD-1 в Т-клетках, электропорированных усовершенствованными версиями megaTAL PD-1.ile3.exon1 (RD2_B1G2, RD3_ B1G2C4, RD3_B1G2C11, RD3_B1G2C5)Figure 13B. Surface expression of PD-1 in T cells electroporated with improved versions of megaTAL PD-1.ile3.exon1 (RD2_B1G2, RD3_B1G2C4, RD3_B1G2C11, RD3_B1G2C5)

Фигура 14. Одновременная доставка megaTAL PD-1.ITSM.ex5_RD5_CV23MK и megaTAL PD-1.ile3.exon1_RD2_B1H8 с Trex2 или без него значительно снижает экспрессию PD-1 на клеточной поверхности.Figure 14. Simultaneous delivery of megaTAL PD-1.ITSM.ex5_RD5_CV23MK and megaTAL PD-1.ile3.exon1_RD2_B1H8 with or without Trex2 significantly reduces cell surface expression of PD-1.

Фигура 15A. Анти-BCMA CAR T-клетки, электропорированные мРНК, кодирующей megaTAL PD-1.ITSM.ex5_RD5_CV23MK или PD-1.ile3.exon1_RD2_B1H8, показывают пониженное PD-L1-опосредованное подавление цитокинов по сравнению с анти-BCMA CAR T-клетками, электропорированными пустым носителем или мРНК, кодирующей megaTAL CFP или CCR5.Figure 15A. Anti-BCMA CAR T cells electroporated with mRNA encoding megaTAL PD-1.ITSM.ex5_RD5_CV23MK or PD-1.ile3.exon1_RD2_B1H8 show reduced PD-L1-mediated cytokine suppression compared to anti-BCMA CAR T cells electroporated blank carrier or mRNA encoding megaTAL CFP or CCR5.

Фигура 15B. Анти-BCMA CAR T-клетки, электропорированные мРНК, кодирующей megaTAL PD-1.ITSM.ex5_RD5_CV23MK или PD-1.ile3.exon1_RD2_B1H8, показывают пониженное PD-L1-опосредованное подавление цитокинов по сравнению с анти-BCMA CAR T-клетками, электропорированными пустым носителем или мРНК кодирующей каталитически неактивный TCRα- megaTAL (необработанные). Добавление антитела PD-1 к культурам отменяет супрессию цитокинов в анти-BCMA CAR T-клетках, электропорированных пустым носителем, или мРНК, кодирующей каталитически неактивный megaTAL TCRα.Figure 15B. Anti-BCMA CAR T cells electroporated with mRNA encoding megaTAL PD-1.ITSM.ex5_RD5_CV23MK or PD-1.ile3.exon1_RD2_B1H8 show reduced PD-L1-mediated cytokine suppression compared to anti-BCMA CAR T cells electroporated blank carrier or mRNA encoding catalytically inactive TCRα-megaTAL (raw). Addition of PD-1 antibody to cultures abolishes cytokine suppression in anti-BCMA CAR T cells electroporated with blank media or mRNA encoding catalytically inactive megaTAL TCRα.

Фигура 16A. Стратегия введения различных кассет экспрессий (GFP, верхняя панель; анти-CD19 CAR, средняя панель и анти-BCMA CAR, нижняя панель) в экзон 1 PD-1 путем гомологичной рекомбинации.Figure 16A. Strategy for introducing different expression cassettes (GFP, upper panel; anti-CD19 CAR, middle panel and anti-BCMA CAR, lower panel) into exon 1 of PD-1 by homologous recombination.

Фигура 16B. Репрезентативные результаты анализов проточной цитометрии для определения долговременной экспрессии хромосомно интегрированных кассет в Т-клетках, обработанных megaTAL PD-1.ile3.exon1_RD2_B1H8 и rAAV-нацеленными векторами, содержащими кассету экспрессии GFP, анти-CD19 CAR или анти-BCMA CAR.Figure 16B. Representative results of flow cytometry assays to determine long-term expression of chromosomally integrated cassettes in T cells treated with megaTAL PD-1.ile3.exon1_RD2_B1H8 and rAAV-targeted vectors containing the GFP expression cassette, anti-CD19 CAR, or anti-BCMA CAR.

Фигура 17. Стратегия введения репортерного гена mCherry в стартовый кодон PD-1 в экзоне 1 и анализ с помощью проточной цитометрии экспрессии mCherry в Т-клетках, электропорированных пустым носителем или megaTAL PD-1.ile3.exon1_RD2_B1H8 и трансдуцированных пустым носителем или нацеленным на rAAV вектором, кодирующим mCherry как в присутствии, так и в отсутствие 24 часовой обработки PMA/иономицином.Figure 17. Strategy for introducing the mCherry reporter gene at the PD-1 start codon in exon 1 and flow cytometry analysis of mCherry expression in T cells electroporated with blank vehicle or megaTAL PD-1.ile3.exon1_RD2_B1H8 and transduced with blank vehicle or targeted to rAAV a vector encoding mCherry both in the presence and absence of a 24 hour PMA/ionomycin treatment.

Фигура 18. Стратегия введения кассеты экспрессии MND-промотор-BFP в мотив ITSM в экзоне 5 PD-1 и проточная цитометрия для анализа экспрессии BFP в Т-клетках, электропорированных пустым носителем или PD-1.ITSM.ex5_RD5_CV23MK и трансдуцированных пустым носителем или нацеленным на rAAV вектором, содержащим кассету экспрессии pMND-BFP.Figure 18. Strategy for introducing the MND-promoter-BFP expression cassette into the ITSM motif in exon 5 of PD-1 and flow cytometry to analyze BFP expression in T cells electroporated with blank vehicle or PD-1.ITSM.ex5_RD5_CV23MK and transduced with blank vehicle or targeted on rAAV with a vector containing the pMND-BFP expression cassette.

Фигура 19. Стратегия введения кассеты экспрессии MND-промотор-BFP в мотив ITSM в экзоне 5 PD-1 и анализ методом проточной цитометрии для экспрессии PD-1 и BFP в Т-клетках, электропорированных пустым носителем или PD-1.ITSM.ex5_RD5_CV23MK megaTAL и трансдуцированных пустым носителем или нацеленным на rAAV вектором, содержащим кассету экспрессии pMND-BFP.Figure 19. Strategy for introducing the MND-promoter-BFP expression cassette into the ITSM motif in exon 5 of PD-1 and flow cytometry analysis for PD-1 and BFP expression in T cells electroporated with blank vehicle or PD-1.ITSM.ex5_RD5_CV23MK megaTAL and transduced with a blank carrier or an rAAV-targeted vector containing the pMND-BFP expression cassette.

Фигура 20. Стратегия введения кассеты экспрессии MND-промотор-BFP в мотив ITSM в экзоне 5 PD-1, когда гомологичные плечи содержат одиночные нуклеотидные полиморфизмы (SNP) (верхняя панель). На нижней панели показан анализ проточной цитометрии Т-клеток, электропорированных megaTAL PD-1.ITSM.ex5_RD5_CV23MK и трансдуцированных нацеленным на rAAV вектором, содержащим кассету экспрессии pMND-BFP с гомологичными плечами дикого типа, причем 5'-гомологичное плечо содержит SNP, или 3'-гомологичное плечо содержит SNP.Figure 20. Strategy for introducing the MND-promoter-BFP expression cassette into the ITSM motif in exon 5 of PD-1 when the homologous arms contain single nucleotide polymorphisms (SNPs) (upper panel). The bottom panel shows flow cytometry analysis of T cells electroporated with megaTAL PD-1.ITSM.ex5_RD5_CV23MK and transduced with an rAAV-targeted vector containing a pMND-BFP expression cassette with wild-type homologous arms, with the 5' homologous arm containing SNPs, or 3 The '-homologous arm contains a SNP.

Фигура 21. Стратегия введения кассеты экспрессии MND-промотор-PD-1.CD28 флип-рецептор в мотив ITSM в экзоне 5 PD-1 и анализ с помощью проточной цитометрии экспрессии PD-1 и BFP в Т-клетках, электропорированных пустым носителем или megaTAL PD- 1.ITSM.ex5_RD5_CV23MK и трансдуцированных пустым носителем или нацеленным на rAAV вектором, содержащим кассету экспрессии pMND-PD-1.CD28- флип-рецептор.Figure 21. Strategy for introducing the MND-promoter-PD-1.CD28 flip receptor expression cassette into the ITSM motif in exon 5 of PD-1 and analysis by flow cytometry of PD-1 and BFP expression in T cells electroporated with blank vehicle or megaTAL PD-1.ITSM.ex5_RD5_CV23MK and transduced with an empty carrier or an rAAV-targeted vector containing the pMND-PD-1.CD28 flip receptor expression cassette.

Фигура 22. Стратегия создания крупномасштабной делеции в гене PD-1 путем доставки кассеты megaTAL PD-1.ITSM.ex5_RD5_CV23MK и rAAV, содержащей гомологичные плечи на расстоянии более т.п.н. в направлении против хода транскрипции от экзона 5 сайта-мишени.Figure 22. Strategy for creating a large-scale deletion in the PD-1 gene by delivering the megaTAL PD-1.ITSM.ex5_RD5_CV23MK and rAAV cassette containing homologous arms over a kbp apart. upstream from exon 5 of the target site.

Фигура 23. Стратегия встраивания цитокина в ген PD-1, когда экспрессия находится под контролем эндогенного промотора PD-1 (верхняя панель). После 24 часов обработки PMA/иономицином анти-BCMA CAR T-клетки, электропорированные мРНК megaTAL PD-1 и трансдуцированные rAAV, кодирующим IL-12, показали пониженную экспрессию PD-1 по сравнению с клетками, обработанными контролем (нижняя панель).Figure 23. Cytokine insertion strategy into the PD-1 gene when expression is under the control of the endogenous PD-1 promoter (upper panel). After 24 hours of PMA/ionomycin treatment, anti-BCMA CAR T cells electroporated with megaTAL PD-1 mRNA and transduced with rAAV encoding IL-12 showed reduced expression of PD-1 compared to control-treated cells (lower panel).

Фигура 24A. После 24-часовой обработки PMA/иономицином анти-BCMA CAR T-клетки, электропорированные мРНК megaTAL PD-1 и трансдуцированные rAAV, кодирующим IL-12, показали повышенную выработку IL-12 по сравнению с клетками, обработанными контролем (левая панель). Анти-BCMA CAR T-клетки, электропорированные мРНК PD-1 и трансдуцированные rAAV, кодирующим IL-12, и культивируемые в присутствии клеток-мишеней K562-BCMA, показали повышенную выработку IL-12 по сравнению с клетками, обработанными контролем (правая панель).Figure 24A. After 24 hours of PMA/ionomycin treatment, anti-BCMA CAR T cells electroporated with megaTAL PD-1 mRNA and transduced with rAAV encoding IL-12 showed increased production of IL-12 compared to control-treated cells (left panel). Anti-BCMA CAR T cells electroporated with PD-1 mRNA and transduced with rAAV encoding IL-12 and cultured in the presence of K562-BCMA target cells showed increased IL-12 production compared to control-treated cells (right panel) .

Фигура 24B. Результаты анализа серийной стимуляции. Клетки K52-BCMA и анти-BCMA CAR T-клетки смешивали, культивировали в течение 7 дней и добавляли дополнительные клетки-мишени K562-BCMA для имитации повторной стимуляции. После рестимуляции анти-BCMA CAR T-клетки, обработанные рекомбинантным IL-12 или обработанные как megaTAL PD-1, так и матрицей HDR IL-12, показали повышенную выработку IFNγ и цитотоксичность по сравнению с клетками, обработанными контролем.Figure 24B. Results of the analysis of serial stimulation. K52-BCMA cells and anti-BCMA CAR T cells were mixed, cultured for 7 days, and additional K562-BCMA target cells were added to mimic restimulation. After restimulation with anti-BCMA CAR, T cells treated with recombinant IL-12 or treated with both megaTAL PD-1 and HDR IL-12 matrix showed increased IFNγ production and cytotoxicity compared to control-treated cells.

КРАТКОЕ ОПИСАНИЕ ИДЕНТИФИКАТОРОВ ПОСЛЕДОВАТЕЛЬНОСТЕЙSUMMARY OF SEQUENCE IDENTIFIERS

SEQ ID NO: 1 - аминокислотная последовательность хоминг-эндонуклеазы I-OnuI дикого типа LAGLIDADG (LHE).SEQ ID NO: 1 - Amino acid sequence of wild-type homing endonuclease I-OnuI LAGLIDADG (LHE).

SEQ ID NO: 2 - аминокислотная последовательность LHE I-OnuI дикого типа.SEQ ID NO: 2 - Wild type LHE I-OnuI amino acid sequence.

SEQ ID NO: 3 - аминокислотная последовательность биологически активного фрагмента LHE I-OnuI дикого типа.SEQ ID NO: 3 - amino acid sequence of the biologically active wild-type LHE I-OnuI fragment.

SEQ ID NO: 4 - аминокислотная последовательность биологически активного фрагмента LHE I-OnuI дикого типа.SEQ ID NO: 4 - amino acid sequence of the biologically active wild-type LHE I-OnuI fragment.

SEQ ID NO: 5 - аминокислотная последовательность биологически активного фрагмента LHE I-OnuI дикого типа.SEQ ID NO: 5 - Amino acid sequence of the biologically active wild-type LHE I-OnuI fragment.

SEQ ID NO: 6 - аминокислотная последовательность варианта LHE I-OnuI, перепрограммированного для связывания и расщепления сайта-мишени в гене PD-1 человека.SEQ ID NO: 6 - Amino acid sequence of LHE I-OnuI variant reprogrammed to bind and cleave a target site in the human PD-1 gene.

SEQ ID NO: 7 - аминокислотная последовательность варианта LHE I-OnuI, перепрограммированного для связывания и расщепления сайта-мишени в гене PD-1 человека.SEQ ID NO: 7 - Amino acid sequence of LHE I-OnuI variant reprogrammed to bind and cleave a target site in the human PD-1 gene.

SEQ ID NO: 8 - аминокислотная последовательность варианта LHE I-OnuI, перепрограммированного для связывания и расщепления сайта-мишени в гене PD-1 человека.SEQ ID NO: 8 - Amino acid sequence of LHE I-OnuI variant reprogrammed to bind and cleave a target site in the human PD-1 gene.

SEQ ID NO: 9 - аминокислотная последовательность варианта LHE I-OnuI, перепрограммированного для связывания и расщепления сайта-мишени в гене PD-1 человека.SEQ ID NO: 9 - Amino acid sequence of LHE I-OnuI variant reprogrammed to bind and cleave a target site in the human PD-1 gene.

SEQ ID NO: 10 - аминокислотная последовательность варианта LHE I-OnuI, перепрограммированного для связывания и расщепления сайта-мишени в гене PD-1 человека.SEQ ID NO: 10 is the amino acid sequence of the LHE I-OnuI variant reprogrammed to bind and cleave a target site in the human PD-1 gene.

SEQ ID NO: 11 - аминокислотная последовательность варианта LHE I-OnuI, перепрограммированного для связывания и расщепления сайта-мишени в гене PD-1 человека.SEQ ID NO: 11 - Amino acid sequence of LHE I-OnuI variant reprogrammed to bind and cleave a target site in the human PD-1 gene.

SEQ ID NO: 12 - аминокислотная последовательность варианта LHE I-OnuI, перепрограммированного для связывания и расщепления сайта-мишени в гене PD-1 человека.SEQ ID NO: 12 - Amino acid sequence of LHE I-OnuI variant reprogrammed to bind and cleave a target site in the human PD-1 gene.

SEQ ID NO: 13 - аминокислотная последовательность варианта LHE I-OnuI, перепрограммированного для связывания и расщепления сайта-мишени в гене PD-1 человека.SEQ ID NO: 13 is the amino acid sequence of the LHE I-OnuI variant reprogrammed to bind and cleave a target site in the human PD-1 gene.

SEQ ID NO: 14 - аминокислотная последовательность варианта LHE I-OnuI, перепрограммированного для связывания и расщепления сайта-мишени в гене PD-1 человека.SEQ ID NO: 14 - Amino acid sequence of LHE I-OnuI variant reprogrammed to bind and cleave a target site in the human PD-1 gene.

SEQ ID NO: 15 - аминокислотная последовательность megaTAL, которая связывает и расщепляет сайт-мишень в гене PD-1 человека.SEQ ID NO: 15 - Amino acid sequence of megaTAL that binds and cleaves a target site in the human PD-1 gene.

SEQ ID NO: 16 - аминокислотная последовательность megaTAL, которая связывает и расщепляет сайт-мишень в гене PD-1 человека.SEQ ID NO: 16 - Amino acid sequence of megaTAL that binds and cleaves a target site in the human PD-1 gene.

SEQ ID NO: 17 - аминокислотная последовательность megaTAL, которая связывает и расщепляет сайт-мишень в гене PD-1 человека.SEQ ID NO: 17 - Amino acid sequence of megaTAL that binds and cleaves a target site in the human PD-1 gene.

SEQ ID NO: 18 - аминокислотная последовательность megaTAL, которая связывает и расщепляет сайт-мишень в гене PD-1 человека.SEQ ID NO: 18 - Amino acid sequence of megaTAL that binds and cleaves a target site in the human PD-1 gene.

SEQ ID NO: 19 - аминокислотная последовательность megaTAL, которая связывает и расщепляет сайт-мишень в гене PD-1 человека.SEQ ID NO: 19 - Amino acid sequence of megaTAL that binds and cleaves a target site in the human PD-1 gene.

SEQ ID NO: 20 - аминокислотная последовательность megaTAL, которая связывает и расщепляет сайт-мишень в гене PD-1 человека.SEQ ID NO: 20 - Amino acid sequence of megaTAL that binds and cleaves a target site in the human PD-1 gene.

SEQ ID NO: 21 - аминокислотная последовательность megaTAL, которая связывает и расщепляет сайт-мишень в гене PD-1 человека.SEQ ID NO: 21 - Amino acid sequence of megaTAL that binds and cleaves a target site in the human PD-1 gene.

SEQ ID NO: 22 - аминокислотная последовательность megaTAL, которая связывает и расщепляет сайт-мишень в гене PD-1 человека.SEQ ID NO: 22 - Amino acid sequence of megaTAL that binds and cleaves a target site in the human PD-1 gene.

SEQ ID NO: 23 - аминокислотная последовательность megaTAL, которая связывает и расщепляет сайт-мишень в гене PD-1 человека.SEQ ID NO: 23 - Amino acid sequence of megaTAL that binds and cleaves a target site in the human PD-1 gene.

SEQ ID NO: 24 - аминокислотная последовательность, кодирующая мышиный Trex2.SEQ ID NO: 24 - Amino acid sequence encoding mouse Trex2.

SEQ ID NO: 25 - сайт-мишень варианта LHE I-OnuI в экзоне 5 гена PD-1 человека.SEQ ID NO: 25 - Target site of the LHE I-OnuI variant in exon 5 of the human PD-1 gene.

SEQ ID NO: 26 - сайт-мишень ДНК-связывающего домена TALE в экзоне 5 гена PD-1 человека.SEQ ID NO: 26 - Target site of the TALE DNA-binding domain in exon 5 of the human PD-1 gene.

SEQ ID NO: 27 - сайт-мишень megaTAL в экзоне 5 гена PD-1 человека.SEQ ID NO: 27 - MegaTAL target site in exon 5 of the human PD-1 gene.

SEQ ID NO: 28 - сайт-мишень варианта I-OnuI LHE N-концевого домена в экзоне 5 гена PD-1 человека.SEQ ID NO: 28 - Target site of the I-OnuI LHE variant of the N-terminal domain in exon 5 of the human PD-1 gene.

SEQ ID NO: 29 - сайт-мишень варианта I-OnuI LHE C-концевого домена в экзоне 5 гена PD-1 человека.SEQ ID NO: 29 - Target site of the I-OnuI LHE variant of the C-terminal domain in exon 5 of the human PD-1 gene.

SEQ ID NO: 30 - сайт-мишень варианта I-OnuI LHE в экзоне 1 гена PD-1 человека.SEQ ID NO: 30 - Target site of the I-OnuI LHE variant in exon 1 of the human PD-1 gene.

SEQ ID NO: 31 - сайт-мишень ДНК-связывающего домена TALE в экзоне 1 гена PD-1 человека.SEQ ID NO: 31 - Target site of the TALE DNA-binding domain in exon 1 of the human PD-1 gene.

SEQ ID NO: 32 - сайт-мишень megaTAL в экзоне 1 гена PD-1 человека.SEQ ID NO: 32 - MegaTAL target site in exon 1 of the human PD-1 gene.

SEQ ID NO: 33 - сайт-мишень варианта I-OnuI LHE N-концевого домена в экзоне 1 гена PD-1 человека.SEQ ID NO: 33 - Target site of the I-OnuI LHE variant of the N-terminal domain in exon 1 of the human PD-1 gene.

SEQ ID NO: 34 - сайт-мишень варианта I-OnuI LHE C-концевого домена в экзоне 1 гена PD-1 человека.SEQ ID NO: 34 - Target site of the I-OnuI LHE variant of the C-terminal domain in exon 1 of the human PD-1 gene.

SEQ ID NO: 35 - сайт-мишень варианта I-OnuI LHE в экзоне 2 гена PD-1 человека.SEQ ID NO: 35 - Target site of the I-OnuI LHE variant in exon 2 of the human PD-1 gene.

SEQ ID NO: 36 - сайт-мишень ДНК-связывающего домена TALE в экзоне 2 гена PD-1 человека.SEQ ID NO: 36 - Target site of the TALE DNA-binding domain in exon 2 of the human PD-1 gene.

SEQ ID NO: 37 - сайт-мишень megaTAL в экзоне 2 гена PD-1 человека.SEQ ID NO: 37 - MegaTAL target site in exon 2 of the human PD-1 gene.

SEQ ID NO: 38 - сайт-мишень варианта I-OnuI LHE N-концевого домена в экзоне 2 гена PD-1 человека.SEQ ID NO: 38 - Target site of the I-OnuI LHE variant of the N-terminal domain in exon 2 of the human PD-1 gene.

SEQ ID NO: 39 - сайт-мишень варианта I-OnuI LHE C-концевого домена в экзоне 2 гена PD-1 человека.SEQ ID NO: 39 - Target site of the I-OnuI LHE variant of the C-terminal domain in exon 2 of the human PD-1 gene.

SEQ ID NO: 40 - мРНК, кодирующая megaTAL PD-1.SEQ ID NO: 40 - mRNA encoding megaTAL PD-1.

SEQ ID NO: 41 - мРНК, кодирующая megaTAL PD-1.SEQ ID NO: 41 - mRNA encoding megaTAL PD-1.

SEQ ID NO: 42 - мРНК, кодирующая megaTAL PD-1.SEQ ID NO: 42 - mRNA encoding megaTAL PD-1.

SEQ ID NO: 43 - мРНК, кодирующая мышиный белок Trex2.SEQ ID NO: 43 - mRNA encoding mouse Trex2 protein.

SEQ ID NO: 44 - полинуклеотидная последовательность, кодирующая нацеленный на rAAV вектор с гомологичными плечами PD-1, и кассета экспрессии pMND-BFP-SV40polyA.SEQ ID NO: 44 - Polynucleotide sequence encoding rAAV targeting vector with homologous arms PD-1 and expression cassette pMND-BFP-SV40polyA.

SEQ ID NO: 45 - полинуклеотид, кодирующий 5'-гомологичное плечо SEQ ID NO: 44.SEQ ID NO: 45 - polynucleotide encoding the 5' homologous arm of SEQ ID NO: 44.

SEQ ID NO: 46 - полинуклеотид, кодирующий 3'-гомологичное плечо SEQ ID NO: 44.SEQ ID NO: 46 - polynucleotide encoding the 3' homologous arm of SEQ ID NO: 44.

SEQ ID NO: 47 - полинуклеотидная последовательность, кодирующая нацеленный на rAAV вектор с гомологичными плечами PD-1, и кассета экспрессии pMND-BFP-SV40polyA. Плечо 3' содержит одиночный нуклеотидный полиморфизм (SNP) относительно геномной последовательности дикого типа.SEQ ID NO: 47 - Polynucleotide sequence encoding rAAV targeting vector with homologous arms PD-1 and expression cassette pMND-BFP-SV40polyA. Arm 3' contains a single nucleotide polymorphism (SNP) relative to the wild-type genomic sequence.

SEQ ID NO: 48 - полинуклеотидная последовательность, кодирующая нацеленный на rAAV вектор с гомологичными плечами PD-1, и кассета экспрессии pMND-BFP-SV40polyA. Плечо 5' содержит одиночный нуклеотидный полиморфизм (SNP) относительно геномной последовательности дикого типа.SEQ ID NO: 48 - Polynucleotide sequence encoding rAAV targeting vector with homologous arms PD-1 and expression cassette pMND-BFP-SV40polyA. The 5' arm contains a single nucleotide polymorphism (SNP) relative to the wild-type genomic sequence.

SEQ ID NO: 49 - полинуклеотид, кодирующий 5'- гомологичное плечо SEQ ID NO: 48.SEQ ID NO: 49 - polynucleotide encoding the 5' homologous arm of SEQ ID NO: 48.

SEQ ID NO: 50 - полинуклеотид, кодирующий 3'- гомологичное плечо SEQ ID NO: 47.SEQ ID NO: 50 - polynucleotide encoding the 3' homologous arm of SEQ ID NO: 47.

SEQ ID NO: 51 - полинуклеотидная последовательность, кодирующая вектор, нацеленный на rAAV, с кассетой экспрессии pMND-PD-1.CD28. переключающий рецептор SV40polyA.SEQ ID NO: 51 - Polynucleotide sequence encoding rAAV targeting vector with pMND-PD-1.CD28 expression cassette. switch receptor SV40polyA.

SEQ ID NO: 52 - полинуклеотидная последовательность, кодирующая нацеленный на rAAV вектор с гомологичными плечами PD-1, и кассету экспрессии pMND-BFP.SV40polyA с 5'-гомологичным плечом ~1,3 т.п.н. в обратном направлении от мотива ITSM в экзоне 5 PD-1.SEQ ID NO: 52 - Polynucleotide sequence encoding rAAV-targeted vector with homologous arms PD-1 and expression cassette pMND-BFP.SV40polyA with 5' homologous arm ~1.3 kb. in the opposite direction from the ITSM motif in exon 5 of PD-1.

SEQ ID NO: 53 - полинуклеотидная последовательность, кодирующая нацеленный на rAAV вектор с гомологичными плечами PD-1, и кассету экспрессии pMND-GFP-SV40polyA.SEQ ID NO: 53 - Polynucleotide sequence encoding rAAV targeting vector with homologous arms PD-1 and expression cassette pMND-GFP-SV40polyA.

SEQ ID NO: 54 - полинуклеотид, кодирующий 5'-гомологичное плечо SEQ ID NO: 53.SEQ ID NO: 54 - polynucleotide encoding the 5' homologous arm of SEQ ID NO: 53.

SEQ ID NO: 55 - полинуклеотид, кодирующий 3'-гомологичное плечо SEQ ID NO: 53.SEQ ID NO: 55 - polynucleotide encoding the 3' homologous arm of SEQ ID NO: 53.

SEQ ID NO: 56 - полинуклеотидная последовательность, кодирующая нацеленный на rAAV вектор с гомологичными плечами PD-1, и кассету экспрессии pMND-анти-CD19 CAR-SV40polyA.SEQ ID NO: 56 - Polynucleotide sequence encoding rAAV targeting vector with homologous arms PD-1 and pMND-anti-CD19 expression cassette CAR-SV40polyA.

SEQ ID NO: 57 - полинуклеотидная последовательность, кодирующая нацеленный на rAAV вектор с гомологичными плечами PD-1, и кассету экспрессии pMND-анти-BCMA CAR-SV40polyA.SEQ ID NO: 57 - Polynucleotide sequence encoding rAAV targeting vector with homologous arms PD-1 and pMND-anti-BCMA expression cassette CAR-SV40polyA.

SEQ ID NO: 58 - полинуклеотидная последовательность, кодирующая нацеленный на rAAV вектор с гомологичными плечами PD-1, и кДНК, кодирующая mCherry.SEQ ID NO: 58 - Polynucleotide sequence encoding rAAV targeting vector with homologous arms PD-1 and cDNA encoding mCherry.

SEQ ID NO: 60 - аминокислотная последовательность варианта LHE I-OnuI, перепрограммированного для связывания и расщепления сайта-мишени в гене PD-1 человекаSEQ ID NO: 60 - Amino acid sequence of LHE I-OnuI variant reprogrammed to bind and cleave a target site in the human PD-1 gene

SEQ ID NO: 61 - аминокислотная последовательность варианта LHE I-OnuI, перепрограммированного для связывания и расщепления сайта-мишени в гене PD-1 человекаSEQ ID NO: 61 - Amino acid sequence of LHE I-OnuI variant reprogrammed to bind and cleave a target site in the human PD-1 gene

SEQ ID NO: 62 - аминокислотная последовательность варианта LHE I-OnuI, перепрограммированного для связывания и расщепления сайта-мишени в гене PD-1 человекаSEQ ID NO: 62 - Amino acid sequence of LHE I-OnuI variant reprogrammed to bind and cleave a target site in the human PD-1 gene

SEQ ID NO: 63 - аминокислотная последовательность варианта LHE I-OnuI, перепрограммированного для связывания и расщепления сайта-мишени в гене PD-1 человекаSEQ ID NO: 63 - Amino acid sequence of LHE I-OnuI variant reprogrammed to bind and cleave a target site in the human PD-1 gene

SEQ ID NO: 64 - аминокислотная последовательность megaTAL, которая связывает и расщепляет сайт-мишень в гене PD-1 человекаSEQ ID NO: 64 - Amino acid sequence of megaTAL that binds and cleaves a target site in the human PD-1 gene

SEQ ID NO: 65 - мРНК, кодирующая megaTAL PD-1SEQ ID NO: 65 - mRNA encoding megaTAL PD-1

SEQ ID NO: 66 - мРНК, кодирующая megaTAL PD-1SEQ ID NO: 66 - mRNA encoding megaTAL PD-1

SEQ ID NO: 67 - мРНК, кодирующая megaTAL PD-1SEQ ID NO: 67 - mRNA encoding megaTAL PD-1

SEQ ID NO: 68 - мРНК, кодирующая megaTAL PD-1SEQ ID NO: 68 - mRNA encoding megaTAL PD-1

SEQ ID NO: 69-79 - аминокислотные последовательности различных линкеров.SEQ ID NO: 69-79 - amino acid sequences of various linkers.

SEQ ID NO: 80-104 - аминокислотные последовательности сайтов расщепления протеазой и сайтов расщепления саморасщепляемого полипептида.SEQ ID NO: 80-104 - amino acid sequences of protease cleavage sites and self-cleaving polypeptide cleavage sites.

В приведенных выше последовательностях символ X, где он присутствует, обозначает любую аминокислоту или отсутствие аминокислоты.In the above sequences, the symbol X, where present, denotes any amino acid or the absence of an amino acid.

Подробное описаниеDetailed description

A. ОБЗОРA. OVERVIEW

Настоящее изобретение в целом относится, в частности, к улучшенным композициям для редактирования генома и способам их применения. Без привязки к какой-либо конкретной теории, композиции для редактирования генома, рассматриваемые в различных вариантах реализации, можно использовать для предотвращения или лечения рака, инфекционного заболевания, аутоиммунного заболевания, воспалительного заболевания и иммунодефицита или состояния, ассоциированного с ними, или для облегчения по меньшей мере одного их симптома. Одним из ограничений или проблем, которые являются слабым местом существующей адоптивной клеточной терапии, является гипореактивность иммунных эффекторных клеток вследствие истощения, опосредованного микроокружением опухоли. Истощенные Т-клетки имеют уникальную молекулярную сигнатуру, которая заметно отличается от наивных, эффекторных Т-клеток или Т-клеток памяти. Истощенные Т-клетки определяются как Т-клетки со снижением экспрессии цитокинов и эффекторной функции. PD-1 является маркером истощения Т-клеток; повышенная экспрессия PD-1 ассоциирована со снижением пролиферации Т-клеток и снижением выработки IL-2, TNF и IFN-γ.The present invention generally relates, in particular, to improved genome editing compositions and methods for their use. Without wishing to be bound by any particular theory, the genome editing compositions contemplated in various embodiments can be used to prevent or treat cancer, an infectious disease, an autoimmune disease, an inflammatory disease, and an immunodeficiency or a condition associated therewith, or to alleviate at least at least one of their symptoms. One limitation or problem that is a weak point of current adoptive cell therapy is the hyporeactivity of immune effector cells due to depletion mediated by the tumor microenvironment. Depleted T cells have a unique molecular signature that is markedly different from naïve, effector, or memory T cells. Depleted T cells are defined as T cells with reduced cytokine expression and effector function. PD-1 is a marker of T cell depletion; overexpression of PD-1 is associated with reduced T cell proliferation and reduced production of IL-2, TNF and IFN-γ.

В частных вариантах реализации рассматриваемые в настоящей заявке иммунные эффекторные клетки с отредактированным геномом становятся более устойчивыми к истощению за счет устранения, уменьшения или подавления экспрессии и/или передачи сигналов PD-1.In particular embodiments, the genome-edited immune effector cells of the present application become more resistant to depletion by eliminating, reducing, or downregulating PD-1 expression and/or signaling.

Композиции и способы редактирования генома, рассматриваемые в различных вариантах реализации, содержат варианты нуклеаз, предназначенные для связывания и расщепления сайта-мишени в гене запрограммированной клеточной гибели 1 (PD-1). Варианты нуклеазы, рассматриваемые в частных вариантах реализации могут быть применены для введения двухцепочечного разрыва в целевую полинуклеотидную последовательность, которая может быть подвернута репарации негомологичным соединением концов (NHEJ) в отсутствие полинуклеотидной матрицы, например, донорной матрицы репарации, или гомологичной направленной репарацией (HDR), т.е. гомологичной рекомбинацией, в присутствии донорной матрицы репарации. Варианты нуклеазы, рассматриваемые в некоторых вариантах реализации, также могут быть сконструированы в виде никаз, генерирующих одноцепочечные разрывы ДНК, которые могут быть репарированы с использованием механизма клеточного эксцизионной репарации оснований (BER) или гомологичной рекомбинации в присутствии донорной матрицы репарации. NHEJ является допускающим ошибки процессом, который часто приводит к образованию небольших инсерций и делеций, которые нарушают функцию генов. Гомологичная рекомбинация требует гомологичной ДНК в качестве матрицы для репарации и может быть использована для создания неограниченного разнообразия модификаций, определяемых введением донорной ДНК, содержащей желаемую последовательность на сайте-мишени, фланкированную с обеих сторон последовательностями, несущими гомологию с областями, фланкирующими сайт-мишень.Genome editing compositions and methods contemplated in various embodiments comprise nuclease variants designed to bind and cleave a target site in the programmed cell death 1 (PD-1) gene. Nuclease variants contemplated in particular embodiments can be used to introduce a double-strand break in a target polynucleotide sequence that can be repaired by non-homologous end joining (NHEJ) in the absence of a polynucleotide template, such as a repair donor template, or homologous directed repair (HDR), those. homologous recombination, in the presence of a donor repair template. Nuclease variants contemplated in some embodiments can also be engineered as nicases that generate single-stranded DNA breaks that can be repaired using a cellular base excision repair (BER) mechanism or homologous recombination in the presence of a donor repair template. NHEJ is an error-prone process that often results in small insertions and deletions that impair gene function. Homologous recombination requires homologous DNA as a template for repair and can be used to create an unlimited variety of modifications defined by the introduction of a donor DNA containing the desired sequence at the target site, flanked on both sides by sequences bearing homology to the regions flanking the target site.

В одном предпочтительном варианте реализации рассматриваемые в настоящей заявке композиции для редактирования генома содержат вариант хоминг-эндонуклеазы или megaTAL, который нацелен на ген PD-1 человека.In one preferred embodiment, the genome editing compositions contemplated herein comprise a homing endonuclease or megaTAL variant that targets the human PD-1 gene.

В одном предпочтительном варианте реализации рассматриваемые в настоящей заявке композиции для редактирования генома содержат вариант хоминг-эндонуклеазы или megaTAL и фермент, изменяющий структуру концов, например Trex2.In one preferred embodiment, the genome editing compositions contemplated herein comprise a homing endonuclease or megaTAL variant and an end restructuring enzyme such as Trex2.

В различных вариантах реализации рассматриваются клетки с отредактированным геномом. Клетки с отредактированным геномом содержат отредактированный ген PD-1, причем стратегия редактирования предназначена для уменьшения или устранения экспрессии PD-1 и/или кооптирования PD-1, чтобы он действовал в качестве доминантного отрицательного, путем экспрессии внеклеточного лиганд-связывающего домена PD-1, при нарушении его способности трансдуцировать иммуносупрессивные внутриклеточные сигналы.In various embodiments, genome-edited cells are contemplated. Genome-edited cells contain an edited PD-1 gene, wherein the editing strategy is designed to reduce or eliminate PD-1 expression and/or co-opt PD-1 to act as a dominant negative by expressing the extracellular ligand-binding domain of PD-1, in violation of its ability to transduce immunosuppressive intracellular signals.

В различных вариантах реализации создают разрыв ДНК в сайте-мишени гена PD-1 в Т-клетке, например, в иммунной эффекторной клетке, и NHEJ концов расщепленной геномной последовательности может привести к появлению клетки практически без экспрессии PD-1 и, предпочтительно, Т-клетки, в которой отсутствует или практически отсутствует функциональная экспрессия и/или передача сигналов PD-1, например, отсутствует способность увеличивать истощение Т-клеток. Без привязки к какой-либо конкретной теории, Т-клетки, у которых отсутствует функциональная экспрессия PD-1, более устойчивы к иммуносупрессии и истощению Т-клеток и, следовательно, более устойчивы и терапевтически эффективны.In various embodiments, a DNA break is created at the target site of the PD-1 gene in a T cell, such as an immune effector cell, and the NHEJ ends of the cleaved genomic sequence can result in a cell with little or no expression of PD-1 and preferably T- a cell that lacks or substantially lacks functional expression and/or signaling of PD-1, eg lacks the ability to increase T cell depletion. Without wishing to be bound by any particular theory, T cells that lack functional PD-1 expression are more resistant to immunosuppression and T cell depletion and therefore more resistant and therapeutically effective.

В различных других вариантах реализации предусмотрена донорная матрица для репарации расщепленной геномной последовательности PD-1. Ген PD-1 репарируют с помощью последовательности указанной матрицы путем гомологичной рекомбинации в сайте разрыва ДНК. В частных вариантах реализации матрица репарации содержит полинуклеотидную последовательность, которая нарушает и предпочтительно существенно снижает или устраняет функциональную экспрессию PD-1.In various other embodiments, a donor template is provided for the repair of a cleaved PD-1 genomic sequence. The PD-1 gene is repaired using the sequence of the specified template by homologous recombination at the DNA break site. In particular embodiments, the repair template contains a polynucleotide sequence that disrupts, and preferably substantially reduces or abolishes, functional expression of PD-1.

В частных вариантах реализации ген PD-1 репарируют с помощью матрицы, кодирующей экзодомен PD-1 с повышенной аффинностью к его лигандам.In particular embodiments, the PD-1 gene is repaired with a template encoding a PD-1 exodomain with increased affinity for its ligands.

В частных вариантах реализации ген PD-1 репарируют полинуклеотидом, кодирующим энхансер иммунопотенции, демпфер иммуносупрессивного сигнала или сконструированный рецептор антигена.In particular embodiments, the PD-1 gene is repaired with a polynucleotide encoding an immunopotentiation enhancer, an immunosuppressive signal damper, or an engineered antigen receptor.

В частных вариантах реализации ген PD-1 репарируют полинуклеотидом, кодирующим энхансер иммунопотенции, демпфер иммуносупрессивного сигнала или сконструированный рецептор антигена, и вводят в ген PD-1 для кооптирования эндогенного промотора PD-1 с целью транскрипционного контроля экспрессии энхансера иммунопотенции, демпфера иммуносупрессивного сигнала или сконструированного рецептора антигена.In particular embodiments, the PD-1 gene is repaired with a polynucleotide encoding an immunopotentiation enhancer, immunosuppressive signal damper, or engineered antigen receptor and introduced into the PD-1 gene to co-opt the endogenous PD-1 promoter for transcriptional control of expression of the immunopotentiation enhancer, immunosuppressive signal damper, or engineered antigen receptor. antigen receptor.

В предпочтительных вариантах реализации композиции генома и способы для редактирования, рассматриваемые в настоящей заявке, используют для редактирования гена PD-1 человека.In preferred embodiments, the genome compositions and editing methods discussed herein are used to edit the human PD-1 gene.

Соответственно, способы и композиции, рассматриваемые в настоящей заявке, представляют собой принципиальное улучшение по сравнению с существующими адаптивными клеточными методами лечения.Accordingly, the methods and compositions contemplated in this application represent a fundamental improvement over existing adaptive cellular therapies.

В практике частных вариантов реализации будут использованы, если не указано иное, традиционные методы химии, биохимии, органической химии, молекулярной биологии, микробиологии, рекомбинантной ДНК, генетики, иммунологии и клеточной биологии, которые известны специалистам в данной области, многие из которых описаны ниже с целью иллюстрации. Такие методики подробно описаны в литературе. Смотрите, например, Sambrook, et al., Molecular Cloning: A Laboratory Manual (3rd Edition, 2001); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Maniatis et al., Molecular Cloning: A Laboratory Manual (1982); Ausubel et al., Current Protocols in Molecular Biology (John Wiley and Sons, updated July 2008); Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Greene Pub. Associates and Wiley-Interscience; Glover, DNA Cloning: A Practical Approach, vol. I & II (IRL Press, Oxford, 1985); Anand, Techniques for the Analysis of Complex Genomes, (Academic Press, New York, 1992); Transcription and Translation (B. Hames & S. Higgins, Eds., 1984); Perbal, A Practical Guide to Molecular Cloning (1984); Harlow and Lane, Antibodies, (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1998) Current Protocols in Immunology Q. E. Coligan, A. M. Kruisbeek, D. H. Margulies, E. M. Shevach and W. Strober, eds., 1991); Annual Review of Immunology; а также работы в журналах, таких как Advances in Immunology.In the practice of private embodiments, unless otherwise indicated, conventional methods of chemistry, biochemistry, organic chemistry, molecular biology, microbiology, recombinant DNA, genetics, immunology and cell biology, which are known to specialists in this field, many of which are described below with purpose of illustration. Such techniques are described in detail in the literature. See, for example, Sambrook, et al., Molecular Cloning: A Laboratory Manual (3rd Edition, 2001); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Maniatis et al., Molecular Cloning: A Laboratory Manual (1982); Ausubel et al., Current Protocols in Molecular Biology (John Wiley and Sons, updated July 2008); Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Greene Pub. Associates and Wiley-Interscience; Glover, DNA Cloning: A Practical Approach, vol. I & II (IRL Press, Oxford, 1985); Anand, Techniques for the Analysis of Complex Genomes, (Academic Press, New York, 1992); Transcription and Translation (B. Hames & S. Higgins, Eds., 1984); Perbal, A Practical Guide to Molecular Cloning (1984); Harlow and Lane, Antibodies, (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1998) Current Protocols in Immunology Q. E. Coligan, A. M. Kruisbeek, D. H. Margulies, E. M. Shevach and W. Strober, eds., 1991); Annual Review of Immunology; as well as contributions to journals such as Advances in Immunology.

B. ОПРЕДЕЛЕНИЯB. DEFINITIONS

Если не указано иное, все технические и научные термины, используемые в настоящей заявке, имеют то же значение, которое обычно понимают специалисты в области техники, к которой относится изобретение. Хотя при практическом применении или испытании частных вариантов реализации могут использоваться любые способы и материалы, подобные или эквивалентные тем, которые описаны в настоящей заявке, в настоящей заявке описаны предпочтительные варианты реализации композиций, способов и материалов. Для целей настоящего изобретения ниже определены следующие термины.Unless otherwise indicated, all technical and scientific terms used in this application have the same meaning as generally understood by experts in the field of technology to which the invention pertains. Although any methods and materials similar or equivalent to those described in this application can be used in the practice or testing of particular embodiments, this application describes the preferred embodiments of the compositions, methods and materials. For the purposes of the present invention, the following terms are defined below.

Определенные и неопределенные артикли используются в настоящей заявке для обозначения одного или более чем одного (то есть по меньшей мере одного или одного или нескольких) грамматического объекта. Например, «элемент» обозначает один элемент или один или более элементов.The definite and indefinite articles are used in this application to refer to one or more than one (ie at least one or one or more) grammatical entities. For example, "element" means one element or one or more elements.

Использование альтернативных вариантов (например, «или») следует понимать как означающее либо один, либо оба, либо любую комбинацию данных альтернативных вариантов.The use of alternatives (eg, "or") should be understood to mean either one or both, or any combination of these alternatives.

Термин «и/или» следует понимать как означающий либо один, либо оба альтернативных варианта.The term "and/or" should be understood to mean either one or both of the alternatives.

Используемый в настоящей заявке термин «приблизительно» или «около» относится к количеству, уровню, значению, числу, частоте, проценту, размеру, габариту, количеству, весу или длине, которые варьируются на 15%, 10%, 9. %, 8%, 7%, 6%, 5%, 4%, 3%, 2% или 1% относительно контрольного количества, уровня, значения, числа, частоты, процента, размера, габарита, количества, веса или длины. В одном варианте реализации термин «приблизительно» или «около» относится к диапазону количества, уровня, значения, числа, частоты, процента, габарита, размера, количества, веса или длины ±15%, ±10%, ±9%, ±8%, ±7%, ±6%, ±5%, ±4%, ±3%, ±2% или ±1% относительно эталонной величины, уровня, значения, числа, частоты, процента, габарита, размера, количества, веса или длины.As used herein, the term "about" or "about" refers to an amount, level, value, number, frequency, percentage, size, dimension, amount, weight, or length that varies by 15%, 10%, 9.%, 8 %, 7%, 6%, 5%, 4%, 3%, 2%, or 1% relative to the control amount, level, value, number, frequency, percentage, size, dimension, amount, weight, or length. In one embodiment, the term "about" or "about" refers to a range of amount, level, value, number, frequency, percentage, size, size, amount, weight, or length of ±15%, ±10%, ±9%, ±8 %, ±7%, ±6%, ±5%, ±4%, ±3%, ±2%, or ±1% of Reference, Level, Value, Number, Frequency, Percent, Size, Size, Quantity, Weight or length.

В одном варианте реализации диапазон, например от 1 до 5, от приблизительно 1 до 5 или от приблизительно 1 до приблизительно 5, относится к каждому числовому значению, охватываемому этим диапазоном. Например, в одном неограничивающем и исключительно иллюстративном варианте реализации диапазон от 1 до 5 эквивалентен выражению 1, 2, 3, 4, 5; или 1.0, 1.5, 2.0, 2.5, 3.0, 3.5, 4.0, 4.5, или 5.0; или 1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.9, 3.0, 3.1, 3.2, 3.3, 3.4, 3.5, 3.6, 3.7, 3.8, 3.9, 4.0, 4.1, 4.2, 4.3, 4.4, 4.5, 4.6, 4.7, 4.8, 4.9, или 5.0.In one embodiment, a range, such as 1 to 5, about 1 to 5, or about 1 to about 5, refers to each numeric value covered by that range. For example, in one non-limiting and purely illustrative implementation, the range from 1 to 5 is equivalent to the expression 1, 2, 3, 4, 5; or 1.0, 1.5, 2.0, 2.5, 3.0, 3.5, 4.0, 4.5, or 5.0; or 1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.9, 3.0, 3.1, 3.2, 3.3, 3.4 , 3.5, 3.6, 3.7, 3.8, 3.9, 4.0, 4.1, 4.2, 4.3, 4.4, 4.5, 4.6, 4.7, 4.8, 4.9, or 5.0.

Используемый в настоящей заявке термин «по существу» относится к количеству, уровню, значению, числу, частоте, проценту, размеру, габариту, количеству, весу или длине, которые составляют 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или выше по сравнению с эталонной величиной, уровнем, значением, числом, частотой, процентом, габаритом, размером, количеством, весом или длиной. В одном варианте реализации «по существу, то же самое» относится к количеству, уровню, значению, числу, частоте, проценту, габариту, размеру, количеству, весу или длине, которые производят эффект, например, физиологический эффект, который приблизительно такой же, как эталонная величина, уровень, значение, число, частота, процент, габарит, размер, количество, вес или длина.As used herein, the term "substantially" refers to an amount, level, value, number, frequency, percentage, size, dimension, amount, weight, or length that is 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or higher than the reference value, level, value, number, frequency, percentage, gauge, size, quantity, weight, or length. In one embodiment, "substantially the same" refers to an amount, level, value, number, frequency, percentage, size, size, amount, weight, or length that produces an effect, such as a physiological effect that is approximately the same as as reference value, level, value, number, frequency, percentage, dimension, size, quantity, weight, or length.

Во всем описании, если контекст не требует иного, слова «содержать», «содержит» и «содержащий» будут пониматься как подразумевающие включение указанного этапа или элемента или группы этапов или элементов, но не исключение какого-либо другого этапа или элемента или группы этапов или элементов. Термин «состоящий из» означает включающий все и ограниченный всем, что следует за фразой «состоящий из». Таким образом, фраза «состоящий из» означает, что перечисленные элементы являются обязательными или необходимыми и что никакие другие элементы присутствовать не могут. Термин «состоящий в основном из» означает включающий любые элементы, перечисленных после фразы, и ограниченный другими элементами, которые не мешают или способствуют активности или действию, указанным в описании для перечисленных элементов. Таким образом, фраза «состоящий в основном из» указывает на то, что перечисленные элементы являются обязательными или необходимыми, но другие элементы, которые существенным образом влияют на активность или действие перечисленных элементов, отсутствуют.Throughout the description, unless the context otherwise requires, the words "comprise", "comprises" and "comprising" will be understood to mean the inclusion of a specified step or element or group of steps or elements, but not the exclusion of any other step or element or group of steps. or elements. The term "consisting of" means inclusive of and limited to everything following the phrase "consisting of". Thus, the phrase "consisting of" means that the listed elements are mandatory or necessary and that no other elements may be present. The term "consisting essentially of" means including any of the elements listed after the phrase, and limited to other elements that do not interfere with or contribute to the activity or action specified in the description for the listed elements. Thus, the phrase "consisting primarily of" indicates that the listed elements are mandatory or necessary, but that there are no other elements that significantly affect the activity or operation of the listed elements.

Ссылка по всему описанию на «один вариант реализации», «вариант реализации», «частный вариант реализации», «связанный вариант реализации», «некоторый вариант реализации», «дополнительный вариант реализации» или «другой вариант реализации» или их комбинации означает, что конкретный признак, структура или характеристика, описанные в связи с этим вариантом реализации, включены по меньшей мере в один вариант реализации. Таким образом, появления вышеупомянутых фраз в различных местах в настоящем описании не обязательно все относятся к одному и тому же варианту реализации. Кроме того, конкретные признаки, структуры или характеристики могут быть объединены любым подходящим способом в одном или нескольких вариантах реализации. Также понятно, что положительное включение признака в одном варианте реализации служит основанием для исключения указанного признака в частном варианте реализации.Reference throughout the specification to "one implementation", "an implementation", "a particular implementation", "a related implementation", "some implementation", "an additional implementation", or "another implementation", or combinations thereof means, that a particular feature, structure, or characteristic described in connection with that embodiment is included in at least one embodiment. Thus, the occurrences of the above phrases in various places in the present specification do not necessarily all refer to the same embodiment. In addition, particular features, structures, or characteristics may be combined in any suitable manner in one or more embodiments. It is also understood that the positive inclusion of a feature in one embodiment warrants the exclusion of said feature in a particular implementation.

Термин «ex vivo» обычно относится к действиям, которые происходят вне организма, таким как эксперименты или измерения, проводимые в или на живых тканях в искусственной среде вне организма, предпочтительно с минимальным изменением естественных условий. В частных вариантах реализации процедуры «ex vivo» включают живые клетки или ткани, взятые из организма и культивируемые или изменяемые в лабораторном аппарате, обычно в стерильных условиях и обычно в течение нескольких часов или приблизительно до 24 часов, но в том числе до 48 или 72 часа, в зависимости от обстоятельств. В некоторых вариантах реализации такие ткани или клетки можно собирать и замораживать, а затем размораживать для обработки ex vivo. Эксперименты или процедуры в области культивирования тканей, которые длятся дольше, чем несколько дней, с использованием живых клеток или тканей, как правило, считаются «in vitro», хотя в некоторых вариантах реализации указанный термин может использоваться взаимозаменяемо с «ex vivo».The term "ex vivo" generally refers to activities that take place outside the body, such as experiments or measurements performed in or on living tissues in an artificial environment outside the body, preferably with minimal alteration of natural conditions. In particular embodiments, ex vivo procedures include living cells or tissues taken from the body and cultured or modified in a laboratory apparatus, usually under sterile conditions and usually for several hours or up to about 24 hours, but including up to 48 or 72 hours. hours, depending on the circumstances. In some embodiments, such tissues or cells can be harvested and frozen and then thawed for ex vivo processing. Tissue culture experiments or procedures that last longer than a few days using living cells or tissues are generally considered "in vitro", although the term may be used interchangeably with "ex vivo" in some embodiments.

Термин «in vivo» в целом относится к деятельности, которая происходит внутри организма. В одном варианте реализации клеточные геномы являются сконструированными, отредактированными или модифицированными in vivo.The term "in vivo" generally refers to activities that take place within the body. In one embodiment, the implementation of cellular genomes are designed, edited or modified in vivo.

Термины «усиливать» или «способствовать» или «увеличивать», «расширять» или «потенцировать» обычно относятся к способности варианта нуклеазы, композиции для редактирования генома или клетки с отредактированным геномом, рассматриваемых в настоящей заявке, производить или вызывать больший ответ (то есть, физиологический ответ) по сравнению с ответом, вызванным пустым носителем или контролем. Измеримый ответ может включать в себя увеличение каталитической активности, аффинности связывания, устойчивости, цитолитической активности и/или повышение провоспалительных цитокинов, среди прочих эффектов, очевидных из понимания в данной области техники и описания в настоящей заявке. «Увеличенное» или «расширенное» количество обычно представляет собой «статистически значимое» количество и может включать увеличение в 1,1, 1,2, 1,5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30 или более раз (например, 500, 1000 раз) (включая все целые числа и десятичные знаки между ними и выше 1, например, 1,5, 1,6, 1,7, 1,8 и т.д.) по сравнению с ответом, производимым пустым носителем или контролем.The terms "enhance" or "facilitate" or "increase", "expand" or "potentiate" generally refer to the ability of the nuclease variant, genome-editing composition, or genome-edited cell contemplated herein to produce or elicit a greater response (i.e. , physiological response) compared to the response elicited by vehicle blank or control. A measurable response may include an increase in catalytic activity, binding affinity, stability, cytolytic activity, and/or an increase in pro-inflammatory cytokines, among other effects evident from the understanding in the art and the description in this application. An "increased" or "expanded" amount is usually a "statistically significant" amount and may include an increase of 1.1, 1.2, 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10 , 15, 20, 30 or more times (e.g. 500, 1000 times) (including all integers and decimals in between and above 1, e.g. 1.5, 1.6, 1.7, 1.8, etc. .e) compared to the response produced by blank vehicle or control.

Термины «уменьшать» или «снижать» или «сокращать» или «ослаблять» или «ингибировать», или «подавлять» или «амортизировать» обычно обозначают способность варианта нуклеазы, композиции для редактирования генома или клетки с отредактированным геномом, рассматриваемых в настоящей заявке, вызывает, производить или вызывать меньший ответ (то есть физиологический ответ) по сравнению с ответом, вызванным пустым носителем, либо контролем. Измеримый ответ может включать в себя снижение нецелевой связывающей аффинности, нецелевой специфичности расщепления, истощения Т-клеток и тому подобного. «Уменьшенное» или «сниженное» количество обычно представляет собой «статистически значимое» количество и может включать уменьшение в 1,1, 1,2, 1,5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15., 20, 30 или более раз (например, 500, 1000 раз) (включая все целые и десятичные знаки между ними и выше 1, например, 1,5, 1,6, 1,7, 1,8 и т.д.) по сравнению с ответом (эталонный ответ), производимый пустым носителем или контролем.The terms "reduce" or "reduce" or "reduce" or "attenuate" or "inhibit" or "suppress" or "absorb" generally refers to the ability of the nuclease variant, genome-editing composition, or genome-edited cell contemplated herein to elicits, produces, or elicits a smaller response (i.e., a physiological response) compared to the response elicited by the blank vehicle or control. A measurable response may include a reduction in off-target binding affinity, off-target cleavage specificity, T cell depletion, and the like. A "reduced" or "reduced" amount is usually a "statistically significant" amount and may include a reduction of 1.1, 1.2, 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10 , 15., 20, 30 or more times (e.g. 500, 1000 times) (including all integers and decimal places in between and above 1, e.g. 1.5, 1.6, 1.7, 1.8, etc. .e) compared to the response (reference response) produced by blank vehicle or control.

Термины «поддерживать», «сохранять», «поддержание», «без изменений», «без существенных изменений» или «без существенного уменьшения» обычно обозначают способность варианта нуклеазы, композиции для редактирования генома или клетки с отредактированным геномом, рассматриваемых в настоящей заявке, производит, производить или вызывать по существу сходный или сопоставимый физиологический ответ (т.е. эффекты в направлении по ходу транскрипции) по сравнению с ответом, вызванным либо пустым носителем, либо контролем. Сравнимый ответ - это ответ, который существенно не отличается или не отличается измеримо от контрольного ответа.The terms "maintain", "maintain", "maintain", "no change", "no significant change" or "no significant reduction" generally refer to the ability of the nuclease variant, genome-editing composition or genome-edited cell contemplated herein to produces, produces, or elicits a substantially similar or comparable physiological response (ie, downstream effects) as compared to a response elicited by either a blank vehicle or a control. A comparable response is a response that is not significantly different or does not differ measurably from a control response.

Термины «специфическая аффинность связывания» или «специфически связывает», или «специфически связанный», или «специфическое связывание», или «специфически нацеленный», используемые в настоящей заявке, описывают связывание одной молекулы с другой, например, ДНК-связывающий домен полипептида, связывающегося с ДНК, с большей аффинностью связывания, чем фоновое связывание. Домен связывания «специфически связывается» с сайтом-мишенью, если он связывается с сайтом-мишенью или связывается с ним с аффинностью или Ka (т.е. равновесной константой ассоциации конкретного связывающего взаимодействия с единицами 1/M) величиной, например, больше или равной приблизительно 105 М-1. В некоторых вариантах реализации связывающий домен связывается с сайтом-мишенью с Ka, больше или равной приблизительно 106 M-1, 107 M-1, 108 M-1, 109 M-1, 1010 M-1, 1011 M-1, 1012 M-1 или 1013 M-1. Связывающие домены «с высокой аффинностью» обозначают связывающие домены с Ka величиной по меньшей мере 107 M-1, по меньшей мере 108 M-1, по меньшей мере 109 M-1, по меньшей мере 1010 M-1, по меньшей мере 1011 M-1, по меньшей мере 1012 M-1, по меньшей мере 1013 M-1, или больше.The terms "specific binding affinity" or "specifically binds" or "specifically bound" or "specific binding" or "specifically targeted" as used in this application describe the binding of one molecule to another, for example, the DNA-binding domain of a polypeptide, binding to DNA, with a higher binding affinity than background binding. A binding domain "specifically binds" to a target site if it binds to or binds to the target site with an affinity or K a (i.e., the equilibrium association constant of a particular binding interaction with units of 1/M) of a value, e.g., greater than or equal to approximately 105 M -1 . In some embodiments, the binding domain binds to a target site with a K a greater than or equal to approximately 10 6 M -1 , 10 7 M -1 , 10 8 M -1 , 10 9 M -1 , 10 10 M -1 , 10 11 M -1 , 10 12 M -1 or 10 13 M -1 . "High affinity" binding domains refer to binding domains with a K a value of at least 10 7 M -1 , at least 10 8 M -1 , at least 10 9 M -1 , at least 10 10 M -1 , at least 10 11 M -1 , at least 10 12 M -1 , at least 10 13 M -1 , or more.

В альтернативном варианте аффинность может быть определена как константа диссоциации равновесия (Kd) конкретного связывающего взаимодействия с единицами M (например, от 10-5 M до 10-13 M, или менее). Аффинность вариантов нуклеазы, включающих один или более ДНК-связывающих доменов для сайтов-мишеней ДНК, рассматриваемых в частных вариантах реализации может быть легко определена с применением общепринятых методов, например, представления на поверхности дрожжевых клеток, или анализа ассоциации связывания или анализа замещения с использованием меченых лигандов.Alternatively, affinity can be defined as the equilibrium dissociation constant (K d ) of a particular binding interaction with M units (eg, 10 -5 M to 10 -13 M, or less). The affinity of nuclease variants comprising one or more DNA-binding domains for DNA target sites considered in particular embodiments can be easily determined using conventional methods, such as surface presentation on yeast cells, or binding association analysis or displacement analysis using labeled ligands.

В одном варианте реализации аффинность специфического связывания приблизительно в 2 раза больше, чем фоновое связывание, приблизительно в 5 раз больше, чем фоновое связывание, приблизительно в 10 раз больше, чем фоновое связывание, приблизительно в 20 раз больше, чем фоновое связывание, приблизительно в 50 раз больше, чем фоновое связывание, приблизительно в 100 раз больше, чем фоновое связывание, или приблизительно в 1000 раз больше, чем фоновое связывание, или еще больше.In one embodiment, specific binding affinity is about 2 times background binding, about 5 times background binding, about 10 times background binding, about 20 times background binding, about 50 times more than background binding, about 100 times more than background binding, or about 1000 times more than background binding, or even more.

Термины «избирательно связывает» или «избирательно связанный, или «избирательное связывание», или «избирательно нацеленный» описывают преимущественное связывание одной молекулы с молекулой-мишенью (целевое связывание) в присутствии множества внецелевых молекул. В частных вариантах реализации HE или megaTAL избирательно связывают сайт целевого связывания ДНК приблизительно в 5, 10, 15, 20, 25, 50, 100 или 1000 раз чаще, чем HE или megaTAL связывают сайт связывания внецелевой ДНК.The terms "selectively binds" or "selectively bound" or "selectively bound" or "selectively targeted" describe the preferential binding of one molecule to a target molecule (target binding) in the presence of a plurality of off-target molecules. In particular embodiments, HE or megaTAL selectively binds to a target DNA binding site approximately 5, 10, 15, 20, 25, 50, 100, or 1000 times more likely than HE or megaTAL to bind to an off-target DNA binding site.

«Целевой» относится к последовательности сайта-мишени."Target" refers to the sequence of the target site.

«Вне-целевой» относится к последовательности, аналогичной, но не идентичной последовательности сайта-мишени."Off-target" refers to a sequence that is similar, but not identical to the sequence of the target site.

«Сайт-мишень» или «целевая последовательность» представляет собой последовательность хромосомной или внехромосомной нуклеиновой кислоты, которая определяет часть нуклеиновой кислоты, которую связывающая молекула будет связывать и/или расщеплять, при условии наличия достаточных условий для связывания и/или расщепления. При упоминании полинуклеотидной последовательности или SEQ ID NO со ссылкой только на одну цепь сайта-мишени или последовательности-мишени, следует понимать, что эти сайт-мишень или последовательность-мишень, связанные и/или расщепленные вариантом нуклеазы, являются двухцепочечными и содержат эталонную последовательность и ее комплемент. В предпочтительном варианте сайт-мишень представляет собой последовательность в гене PD-1 человека.A "target site" or "target sequence" is a chromosomal or extrachromosomal nucleic acid sequence that defines the portion of the nucleic acid that the binding molecule will bind and/or cleave, provided there are sufficient conditions for binding and/or cleavage. When referring to a polynucleotide sequence or SEQ ID NO with reference to only one strand of a target site or target sequence, it should be understood that the target site or target sequence linked and/or cleaved by a variant nuclease is double-stranded and contains a reference sequence and her complement. In a preferred embodiment, the target site is a sequence in the human PD-1 gene.

«Рекомбинация» относится к процессу обмена генетической информацией между двумя полинуклеотидами, включая, помимо прочего, захват доноров негомологичным соединением концов (NHEJ) и гомологичную рекомбинацию. Для целей настоящего изобретения термин «гомологичная рекомбинация (HR)» относится к специализированной форме такого обмена, который имеет место, например, во время репарации двухцепочечных разрывов в клетках посредством механизмов гомологичной репарации (HDR). Указанный процесс требует гомологии нуклеотидной последовательности, использует «донорную» молекулу в качестве матрицы для восстановления «целевой» молекулы (то есть той, которая испытала двухцепочечный разрыв) и в разных вариантах известен как «генная конверсия без кроссовера» или «генная конверсия короткого тракта», потому что он приводит к передаче генетической информации от донора к мишени. Без привязки к какой-либо конкретной теории, такой перенос может включать коррекцию несоответствия гетеродуплексной ДНК, которая образуется между поврежденной мишенью и донором, и/или «синтез-зависимый отжиг цепи», при котором используют донор для ресинтеза генетической информации. которая станет частью цели и/или связанных процессов. Такая специализированная HR часто приводит к изменению последовательности молекулы-мишени, так что часть или вся последовательность донорного полинуклеотида включается в полинуклеотид-мишень."Recombination" refers to the process of exchanging genetic information between two polynucleotides, including, but not limited to, non-homologous end-joining (NHEJ) donor capture and homologous recombination. For the purposes of the present invention, the term "homologous recombination (HR)" refers to a specialized form of such an exchange that occurs, for example, during the repair of double-strand breaks in cells through homologous repair (HDR) mechanisms. This process requires nucleotide sequence homology, uses a "donor" molecule as a template to repair the "target" molecule (i.e., the one that has experienced a double-strand break), and is variously known as "no crossover gene conversion" or "short tract gene conversion" because it results in the transfer of genetic information from the donor to the target. Without wishing to be bound by any particular theory, such transfer may involve correcting the heteroduplex DNA mismatch that forms between the damaged target and the donor, and/or "synthesis dependent strand annealing", which uses the donor to resynthesize genetic information. that will become part of the goal and/or related processes. Such specialized HR often results in a change in the sequence of the target molecule such that part or all of the donor polynucleotide sequence is incorporated into the target polynucleotide.

Термин «NHEJ» или «негомологичное соединение концов» относится к разрешению двухцепочечного разрыва в отсутствие донорной матрицы репарации или гомологичной последовательности. NHEJ может привести к инсерциям и делециям на месте разрыва. NHEJ опосредуется несколькими суб-путями, каждый из которых имеет явные мутационные последствия. Классический путь NHEJ (cNHEJ) требует комплекса KU/DNA-PKcs/Lig4/XRCC4, снова лигирует концы вместе с минимальным процессингом и часто приводит к точной репарации разрыва. Альтернативные пути NHEJ (altNHEJ) также активны в разрешении разрывов дцДНК, но эти пути являются значительно более мутагенными и часто приводят к неточной репарации разрыва, отмеченной инсерциями и делециями. Без привязки к какой-либо конкретной теории, предполагается, что модификация разрывов дцДНК ферментами, изменяющими структуру концов, такими как, например, экзонуклеазы, например, Trex2, может увеличить вероятность неточной репарации.The term "NHEJ" or "non-homologous end joining" refers to the resolution of a double strand break in the absence of a repair donor template or homologous sequence. NHEJ can lead to insertions and deletions at the site of the break. NHEJ is mediated by several sub-pathways, each of which has clear mutational consequences. The classic NHEJ (cNHEJ) pathway requires the KU/DNA-PKcs/Lig4/XRCC4 complex, re-ligates the ends together with minimal processing, and often results in accurate tear repair. Alternative NHEJ pathways (altNHEJ) are also active in resolving dsDNA breaks, but these pathways are significantly more mutagenic and often result in inaccurate break repair marked by insertions and deletions. Without wishing to be bound by any particular theory, it is believed that modification of dsDNA breaks with end-reshaping enzymes, such as, for example, exonucleases such as Trex2, may increase the likelihood of inaccurate repair.

«Расщепление» относится к разрушению ковалентного остова молекулы ДНК. Расщепление может быть инициировано различными способами, включая, среди прочего, ферментативный или химический гидролиз фосфодиэфирной связи. Возможно как одноцепочечное расщепление и двухцепочечное расщепление. Двухцепочечное расщепление может происходить в результате двух отдельных событий одноцепочечного расщепления. Расщепление ДНК может привести к образованию либо тупых концов, либо ступенчатых концов. В некоторых вариантах реализации полипептиды и варианты нуклеаз, например варианты хоминг-эндонуклеазы, megaTAL и др., рассматриваемые в настоящей заявке, используются для направленного двухцепочечного расщепления ДНК. Сайты распознавания эндонуклеазного расщепления могут находиться на любой цепи ДНК."Cleavage" refers to the destruction of the covalent backbone of the DNA molecule. Cleavage can be initiated in a variety of ways, including, but not limited to, enzymatic or chemical hydrolysis of the phosphodiester bond. Possible as single strand cleavage and double strand cleavage. Double-strand cleavage can occur as a result of two separate single-strand cleavage events. DNA cleavage can result in either blunt ends or stepped ends. In some embodiments, polypeptides and nuclease variants, such as homing endonuclease variants, megaTAL, and others, discussed in this application, are used for directed double-stranded DNA cleavage. Recognition sites for endonuclease cleavage can be on any strand of DNA.

«Экзогенная» молекула - это молекула, которая обычно не присутствует в клетке, но которая вводится в клетку одним или несколькими генетическими, биохимическими или другими методами. Типичные экзогенные молекулы включают, среди прочего, небольшие органические молекулы, белок, нуклеиновую кислоту, углевод, липид, гликопротеин, липопротеин, полисахарид, любое модифицированное производное вышеуказанных молекул или любой комплекс, включающий одну или более вышеуказанных молекул. Способы введения экзогенных молекул в клетки известны специалистам в данной области и включают, среди прочего, липид-опосредованный перенос (т.е. липосомы, включая нейтральные и катионные липиды), электропорацию, прямую инъекцию, слияние клеток, бомбардировка частицами, наночастицы биополимера, соосаждение фосфата кальция, DEAE-декстран-опосредованный перенос и опосредованный вирусным вектором переносом.An "exogenous" molecule is one that is not normally present in a cell, but that is introduced into the cell by one or more genetic, biochemical, or other methods. Typical exogenous molecules include, among others, small organic molecules, protein, nucleic acid, carbohydrate, lipid, glycoprotein, lipoprotein, polysaccharide, any modified derivative of the above molecules, or any complex comprising one or more of the above molecules. Methods for introducing exogenous molecules into cells are known to those skilled in the art and include, among others, lipid-mediated transfer (i.e., liposomes including neutral and cationic lipids), electroporation, direct injection, cell fusion, particle bombardment, biopolymer nanoparticles, co-precipitation calcium phosphate, DEAE-dextran mediated transfer and viral vector mediated transfer.

«Эндогенная» молекула - это молекула, которая обычно присутствует в конкретной клетке на определенной стадии развития в определенных условиях окружающей среды. Дополнительно эндогенные молекулы могут включать белки.An "endogenous" molecule is one that is normally present in a particular cell at a particular developmental stage under certain environmental conditions. Additionally, endogenous molecules may include proteins.

«Ген» относится к области ДНК, кодирующей продукт гена, а также ко всем областям ДНК, которые регулируют выработку продукта гена, независимо от того, соседствуют ли такие регуляторные последовательности с кодирующими и/или транскрибируемыми последовательностями. Ген содержит, среди прочего, промоторные последовательности, энхансеры, сайленсеры, инсуляторы, граничные элементы, терминаторы, последовательности полиаденилирования, посттранскрипционные ответные элементы, трансляционные регуляторные последовательности, такие как сайты связывания рибосом и внутренние сайты входа рибосом, источники репликации, сайты прикрепления матрицы и области локусов контроля."Gene" refers to the DNA region encoding the gene product, as well as all DNA regions that regulate the production of the gene product, whether or not such regulatory sequences are adjacent to coding and/or transcribed sequences. The gene contains, among others, promoter sequences, enhancers, silencers, insulators, boundary elements, terminators, polyadenylation sequences, post-transcriptional response elements, translational regulatory sequences such as ribosome binding sites and internal ribosome entry sites, origins of replication, template attachment sites, and regions loci of control.

«Экспрессия гена» относится к преобразованию информации, содержащейся в гене, в продукт гена. Продукт гена может быть прямым продуктом транскрипции гена (например, мРНК, тРНК, рРНК, антисмысловая РНК, рибозима, структурная РНК или РНК любого другого типа) или белком, полученным путем трансляции мРНК. Продукты гена также включают РНК, которые модифицированы такими процессами, как кэппирование, полиаденилирование, метилирование и редактирование, и белками, модифицированными, например, метилированием, ацетилированием, фосфорилированием, убиквитинированием, АДФ-рибозилированием, миристилированием и гликозилированием."Gene expression" refers to the transformation of the information contained in a gene into a gene product. A gene product may be a direct transcription product of a gene (eg, mRNA, tRNA, rRNA, antisense RNA, ribozyme, structural RNA, or any other type of RNA) or a protein obtained by translation of an mRNA. Gene products also include RNAs that are modified by processes such as capping, polyadenylation, methylation, and editing, and proteins modified by, for example, methylation, acetylation, phosphorylation, ubiquitination, ADP-ribosylation, myristylation, and glycosylation.

Используемый в настоящей заявке термин «сконструированный» или «генетически модифицированный» относится к хромосомному или внехромосомному добавлению дополнительного генетического материала в форме ДНК или РНК к общему генетическому материалу в клетке. Генетические модификации могут быть нацеленными или не нацеленными на конкретный сайт в геноме клетки. В одном варианте реализации генетическая модификация является сайт-специфичной. В другом варианте реализации генетическая модификация не является сайт-специфичной.Used in this application, the term "engineered" or "genetically modified" refers to the chromosomal or extrachromosomal addition of additional genetic material in the form of DNA or RNA to the total genetic material in the cell. Genetic modifications may or may not target a specific site in the cell's genome. In one embodiment, the genetic modification is site-specific. In another embodiment, the genetic modification is not site-specific.

Используемый в настоящей заявке термин «редактирование генома» относится к замене, делеции и/или введению генетического материала в сайт-мишень в геноме клетки, которые восстанавливают, исправляют, нарушают и/или модифицируют экспрессию и/или функцию гена или продукта гена. Редактирование генома, предлагаемое в частных вариантах реализации включает в себя введение одного или нескольких вариантов нуклеазы в клетку для генерирования повреждений ДНК на или вблизи от сайта-мишени в геноме клетки, необязательно в присутствии донорной матрицы репарации.As used herein, the term "genome editing" refers to the replacement, deletion, and/or introduction of genetic material at a target site in the genome of a cell that restores, repairs, disrupts, and/or modifies the expression and/or function of a gene or gene product. Genome editing provided in particular embodiments involves introducing one or more nuclease variants into a cell to generate DNA damage at or near a target site in the cell's genome, optionally in the presence of a repair donor template.

Используемый в настоящей заявке термин «генная терапия» относится к введению дополнительного генетического материала в общий генетический материал в клетке, которое восстанавливает, корректирует или модифицирует экспрессию гена или продукта гена, либо с целью экспрессии терапевтического полипептида. В частных вариантах реализации введение генного материала в геном клетки путем редактирования генома, которое восстанавливает, корректирует, нарушает или изменяет экспрессию гена или продукта гена, либо с целью экспрессии терапевтического полипептида считается генной терапией.As used herein, the term "gene therapy" refers to the introduction of additional genetic material into the total genetic material in a cell that restores, corrects, or modifies the expression of a gene or gene product, or for the purpose of expressing a therapeutic polypeptide. In particular embodiments, the introduction of genetic material into the genome of a cell by genome editing that restores, corrects, disrupts, or alters the expression of a gene or gene product, or for the purpose of expressing a therapeutic polypeptide, is considered gene therapy.

«Иммунное расстройство» относится к заболеванию, которое вызывает реакцию иммунной системы. В частных вариантах реализации термин «иммунное расстройство» относится к раку, болезни «трансплантат против хозяина», аутоиммунному заболеванию или иммунодефициту. В одном варианте реализации иммунные нарушения охватывают инфекционное заболевание."Immune disorder" refers to a disease that causes an immune system response. In particular embodiments, the term "immune disorder" refers to cancer, graft-versus-host disease, autoimmune disease, or immunodeficiency. In one embodiment, immune disorders encompass an infectious disease.

Используемый в настоящей заявке термин «рак» обычно относится к классу заболеваний или состояний, при которых аномальные клетки делятся без контроля и могут проникать в близлежащие ткани.As used herein, the term "cancer" generally refers to a class of diseases or conditions in which abnormal cells divide out of control and can invade nearby tissues.

Используемый в настоящей заявке термин «злокачественный» относится к раку, при котором группа опухолевых клеток демонстрирует одно или более из: неконтролируемого роста (т.е. деления за рамки нормальных пределов), инвазии (то есть вторжения в соседние ткани и их разрушения) и метастазирования (т.е. распространение в другие участки тела через лимфу или кровь).As used herein, the term "malignant" refers to a cancer in which a group of tumor cells exhibits one or more of: uncontrolled growth (i.e., dividing beyond normal limits), invasion (i.e., invasion of and destruction of adjacent tissues), and metastasis (i.e. spread to other parts of the body through the lymph or blood).

Используемый в настоящей заявке термин «метастазирование» относится к распространению рака из одной части тела в другую. Опухоль, образованная распространяющимися клетками, называется «метастатическая опухоль» или «метастаз». Метастатическая опухоль содержит клетки, подобные клеткам в исходной (первичной) опухоли.Used in this application, the term "metastasis" refers to the spread of cancer from one part of the body to another. A tumor formed by spreading cells is called a "metastatic tumor" or "metastasis". A metastatic tumor contains cells similar to those in the original (primary) tumor.

Используемый в настоящей заявке термин «доброкачественный» или «незлокачественный» относится к опухолям, которые могут увеличиваться в размерах, но не распространяться на другие части тела. Доброкачественные опухоли самоограничены и обычно не проникают в другие участки и не метастазируют.Used in this application, the term "benign" or "non-cancerous" refers to tumors that may increase in size, but not spread to other parts of the body. Benign tumors are self-limited and usually do not invade other sites or metastasize.

«Раковая клетка» или «опухолевая клетка» относится к отдельной клетке ракового роста или ткани. «Опухоль», как правило, относится к отеку или поражению, образованному аномальным ростом клеток, которые могут быть доброкачественными, предзлокачественными или злокачественными. Большинство видов рака образуют опухоли, но некоторые, например, лейкемия, не обязательно образуют опухоли. Для тех видов рака, которые образуют опухоли, термины рак (раковая клетка) и опухоль (опухолевая клетка) используются взаимозаменяемо. Количество опухоли у индивидуума представляет собой «опухолевую нагрузку», которое можно измерить как количество, объем или вес опухоли."Cancer cell" or "tumor cell" refers to a single cell of a cancerous growth or tissue. "Tumor" generally refers to an edema or lesion formed by abnormal growth of cells, which may be benign, premalignant, or malignant. Most cancers form tumors, but some, such as leukemia, do not necessarily form tumors. For those cancers that form tumors, the terms cancer (cancer cell) and tumor (tumor cell) are used interchangeably. The amount of tumor in an individual is the "tumor burden", which can be measured as the number, volume or weight of the tumor.

Термин «болезнь трансплантат против хозяина» или «БТПХ» относится к осложнениям, которые могут возникнуть после трансплантации клетки, ткани или солидного органа. БТПХ может возникнуть после трансплантации стволовых клеток или костного мозга, при которой трансплантированные донорские клетки атакуют тело реципиента трансплантата. Острая БТПХ у людей возникает в течение приблизительно 60 дней после трансплантации и приводит к поражению кожи, печени и кишечника под действием цитолитических лимфоцитов. Хроническая БТПХ возникает позже и представляет собой системное аутоиммунное заболевание, которое поражает главным образом кожу, что приводит к поликлональной активации В-клеток и гиперпродукции Ig и аутоантител. Болезнь «трансплантат против хозяина» трансплантата солидного органа (SOT-БТПХ) встречается в двух формах. Более распространенным типом является опосредованное антителами, при котором антитела донора с группой крови O атакуют эритроциты реципиента у реципиентов с группой крови A, B или AB, что приводит к легким преходящим гемолитическим анемиям. Вторая форма SOT-БТПХ представляет собой клеточный тип, ассоциированный с высокой смертностью, когда донорские Т-клетки вызывают иммунологическую атаку против иммунологически несовместимой ткани хозяина, чаще всего на коже, печени, желудочно-кишечном тракте и костном мозге, что приводит к осложнениям в этих органах.The term "graft-versus-host disease" or "GVHD" refers to complications that can occur after transplantation of a cell, tissue, or solid organ. GVHD can occur after a stem cell or bone marrow transplant, in which the transplanted donor cells attack the transplant recipient's body. Acute GVHD in humans occurs within approximately 60 days after transplantation and results in damage to the skin, liver, and intestines by cytolytic lymphocytes. Chronic GVHD occurs later and is a systemic autoimmune disease that primarily affects the skin, resulting in polyclonal B-cell activation and overproduction of Ig and autoantibodies. Solid organ transplant graft-versus-host disease (SOT-GVHD) occurs in two forms. The more common type is antibody-mediated, in which antibodies from a donor with blood type O attack the recipient's red blood cells in recipients with blood type A, B, or AB, resulting in mild transient hemolytic anemias. The second form of SOT-GVHD is a cell type associated with high mortality, where donor T cells mount an immunological attack against immunologically incompatible host tissue, most commonly in the skin, liver, gastrointestinal tract, and bone marrow, leading to complications in these organs.

Термин «трансплантат против лейкоза» или «GVL» относится к иммунному ответу на клетки лейкоза человека посредством иммунных клеток, присутствующих в трансплантированной ткани донора, такой как костный мозг или периферическая кровь.The term "anti-leukemia graft" or "GVL" refers to an immune response to human leukemia cells by immune cells present in transplanted donor tissue, such as bone marrow or peripheral blood.

«Аутоиммунное заболевание» относится к заболеванию, при котором организм производит иммуногенный ответ (т.е. ответ иммунной системы) на некоторую составляющую своей собственной ткани. Другими словами, иммунная система теряет способность распознавать какую-то ткань или систему в организме как «собственные» и нацеливается на нее и атакует ее, как если бы она была чужеродной. Иллюстративные примеры аутоиммунных заболеваний включают, среди прочего: артрит, воспалительное заболевание кишечника, тиреоидит Хашимото, болезнь Грейвса, волчанку, рассеянный склероз, ревматический артрит, гемолитическую анемию, антииммунный тиреоидит, системную красную волчанку, целиакию, болезнь Крона, колит, диабет, склеродермию, псориаз и тому подобное."Autoimmune disease" refers to a disease in which the body mounts an immunogenic response (ie, immune system response) against some part of its own tissue. In other words, the immune system loses the ability to recognize some tissue or system in the body as "self" and targets and attacks it as if it were foreign. Illustrative examples of autoimmune diseases include, but are not limited to: arthritis, inflammatory bowel disease, Hashimoto's thyroiditis, Graves' disease, lupus, multiple sclerosis, rheumatoid arthritis, hemolytic anemia, anti-immune thyroiditis, systemic lupus erythematosus, celiac disease, Crohn's disease, colitis, diabetes, scleroderma, psoriasis and the like.

«Иммунодефицит» означает состояние пациента, иммунная система которого была нарушена в результате заболевания или применения химикатов. Это состояние делает систему дефицитной по количеству и типу клеток крови, необходимых для защиты от инородных субстанций. Состояния или заболевания иммунодефицита известны в данной области и включают, например, СПИД (синдром приобретенного иммунодефицита), SCID (заболевание тяжелого комбинированного иммунодефицита), селективный дефицит IgA, общий вариабельный иммунодефицит, Х-сцепленную агаммаглобулинемию, хроническую гранулематозную болезнь, гипер-IgM синдром Вискотта-Олдрича (WAS) и диабет."Immunodeficiency" means the condition of a patient whose immune system has been compromised as a result of disease or exposure to chemicals. This condition makes the system deficient in the number and type of blood cells needed to protect against foreign substances. Immune deficiency conditions or diseases are known in the art and include, for example, AIDS (acquired immunodeficiency syndrome), SCID (severe combined immunodeficiency disease), selective IgA deficiency, common variable immunodeficiency, X-linked agammaglobulinemia, chronic granulomatous disease, hyper-IgM Wiskott syndrome -Aldrich (WAS) and diabetes.

«Инфекционное заболевание» относится к заболеванию, которое может передаваться от человека к человеку или от организма к организму и вызывается микробным или вирусным агентом (например, вирусом простуды). Инфекционные заболевания известны в данной области и включают, например, гепатит, заболевания, передаваемые половым путем (например, хламидиоз, гонорея), туберкулез, ВИЧ/СПИД, дифтерию, гепатит B, гепатит C, холеру и грипп."Infectious disease" refers to a disease that can be transmitted from person to person or from body to body and is caused by a microbial or viral agent (eg, the common cold virus). Infectious diseases are known in the art and include, for example, hepatitis, sexually transmitted diseases (eg, chlamydia, gonorrhea), tuberculosis, HIV/AIDS, diphtheria, hepatitis B, hepatitis C, cholera, and influenza.

Используемые в настоящей заявке термины «индивидуум» и «субъект» часто используются взаимозаменяемо и относятся к любому животному, у которого проявляется симптом иммунного нарушения, которое можно лечить с помощью вариантов нуклеазы, композиций для редактирования генома, векторов для генной терапии, векторов для редактирования генома, клеток с отредактированным геномом, и других способов, рассматриваемые в настоящей заявке. Подходящие субъекты (например, пациенты) включают лабораторных животных (таких как мышь, крыса, кролик или морская свинка), сельскохозяйственных животных и домашних животных (таких как кошка или собака). Включены приматы, не являющиеся человеком и, предпочтительно, люди. Типичными субъектами являются пациенты-люди, у которых был диагностировано иммунное расстройство или есть риск его развития.As used herein, the terms "individual" and "subject" are often used interchangeably and refer to any animal that exhibits a symptom of an immune disorder that can be treated with nuclease variants, genome editing compositions, gene therapy vectors, genome editing vectors. , genome-edited cells, and other methods contemplated in this application. Suitable subjects (eg, patients) include laboratory animals (such as a mouse, rat, rabbit, or guinea pig), farm animals, and pets (such as a cat or dog). Non-human primates and preferably humans are included. Typical subjects are human patients who have been diagnosed with an immune disorder or are at risk of developing one.

Используемый в настоящей заявке термин «пациент» относится к субъекту, у которого диагностировано иммунное расстройство, которое можно лечить с помощью вариантов нуклеазы, композиций для редактирования генома, векторов для генной терапии, векторов для редактирования генома, клеток с отредактированным геномом и других рассматриваемые в настоящей заявке способов.As used herein, the term "patient" refers to a subject diagnosed with an immune disorder that can be treated with nuclease variants, genome editing compositions, gene therapy vectors, genome editing vectors, genome edited cells, and others contemplated herein. application methods.

Используемый в настоящей заявке термин «лечение» или «лечить» включает любое полезное или желательное воздействие на симптомы или патологию заболевания или патологического состояния и может включать даже минимальное снижение одного или нескольких измеримых маркеров заболевания или состояния, которое лечат, например, рака, БТПХ, инфекционных заболеваний, аутоиммунных заболеваний, воспалительных заболеваний и иммунодефицита. Лечение может включать задержку прогрессирования заболевания или состояния. «Лечение» не обязательно указывает на полное искоренение или излечение заболевания или состояния или ассоциированных с ним симптомов.As used herein, the term "treatment" or "treat" includes any beneficial or desirable effect on the symptoms or pathology of the disease or condition, and may include even a minimal reduction in one or more measurable markers of the disease or condition being treated, e.g., cancer, GVHD, infectious diseases, autoimmune diseases, inflammatory diseases and immunodeficiency. Treatment may include delaying the progression of the disease or condition. "Treatment" does not necessarily indicate the complete eradication or cure of a disease or condition or its associated symptoms.

Используемые в настоящей заявке термины «предотвращать» и подобные слова, такие как «предотвращение», «предотвращенный», «профилактика» и т.д., указывают на подход к предотвращению, ингибированию или уменьшению вероятности возникновения или рецидива заболевания или состояния, например, рака, БТПХ, инфекционных заболеваний, аутоиммунных заболеваний, воспалительных заболеваний и иммунодефицита. Это также относится к задержке появления или рецидива заболевания или состояния или к задержке появления или повторения симптомов указанного заболевания или состояния. Используемый в настоящей заявке термин «предотвращение» и подобные слова также включает в себя снижение интенсивности, эффекта, симптомов и/или бремени заболевания или состояния до начала или рецидива указанного заболевания или состояния.As used in this application, the terms "prevent" and similar words such as "prevention", "prevented", "prevention", etc. indicate an approach to preventing, inhibiting or reducing the likelihood of occurrence or recurrence of a disease or condition, for example, cancer, GVHD, infectious diseases, autoimmune diseases, inflammatory diseases and immunodeficiency. It also refers to delaying the onset or recurrence of a disease or condition, or delaying the onset or recurrence of symptoms of said disease or condition. As used herein, the term "prevention" and similar words also includes reducing the intensity, effect, symptoms and/or burden of a disease or condition prior to the onset or recurrence of said disease or condition.

Используемое в настоящей заявке выражение «облегчение по меньшей мере одного симптома» относится к уменьшению одного или нескольких симптомов заболевания или состояния, от которого лечат субъекта, например, рака, БТПХ, инфекционного заболевания, аутоиммунного заболевания, воспалительного заболевания и иммунодефицита. В частных вариантах реализации заболеванием или состоянием, подвергаемым лечению, является рак, при котором один или более облегчаемых симптомов включают, среди прочего, слабость, усталость, одышку, склонность к кровоподтекам и кровотечению, частые инфекции, увеличенные лимфатические узлы, вздутый или болезненный живот (из-за увеличенных органов брюшной полости), боль в костях или суставах, переломы, незапланированную потерю веса, плохой аппетит, ночную потливость, постоянную легкую лихорадку и снижение мочеиспускания (из-за нарушения функции почек)).As used herein, the expression "alleviation of at least one symptom" refers to the reduction of one or more symptoms of the disease or condition for which the subject is being treated, for example, cancer, GVHD, infectious disease, autoimmune disease, inflammatory disease, and immunodeficiency. In particular embodiments, the disease or condition being treated is cancer, in which one or more relieved symptoms include, but are not limited to, weakness, fatigue, shortness of breath, tendency to bruise and bleed, frequent infections, swollen lymph nodes, bloated or painful abdomen ( due to enlarged abdominal organs), bone or joint pain, fractures, unplanned weight loss, poor appetite, night sweats, persistent mild fever, and decreased urination (due to impaired kidney function)).

Используемый в настоящей заявке термин «количество» относится к «количеству, эффективному» или «эффективному количеству» варианта нуклеазы, композиции для редактирования генома или клеток с отредактированным геномом, достаточному для достижения полезного или желаемого профилактического или терапевтического результата, включая клинические результаты.As used herein, the term "amount" refers to an "amount effective" or "effective amount" of a nuclease variant, genome-editing composition, or genome-edited cells sufficient to achieve a beneficial or desired prophylactic or therapeutic result, including clinical results.

«Профилактически эффективное количество» относится к количеству варианта нуклеазы, композиции для редактирования генома или клеток с отредактированным геномом, достаточному для достижения желаемого профилактического результата. Как правило, но не обязательно, так как профилактическая доза используется у субъектов до заболевания или на более ранней стадии заболевания, профилактически эффективное количество меньше терапевтически эффективного количества.A "prophylactically effective amount" refers to an amount of the nuclease variant, genome-editing composition, or genome-edited cells sufficient to achieve the desired prophylactic result. Typically, but not necessarily, since a prophylactic dose is used in subjects prior to or at an earlier stage of the disease, the prophylactically effective amount is less than the therapeutically effective amount.

«Терапевтически эффективное количество» варианта нуклеазы, композиции для редактирования генома или клеток с отредактированным геномом может варьироваться в зависимости от таких факторов, как статус заболевания, возраст, пол и вес индивидуума, а также способность вызывать желаемый ответ у этого индивидуума. Терапевтически эффективным также является количество, при котором любые токсические или вредные эффекты перевешиваются терапевтически полезными эффектами. Термин «терапевтически эффективное количество» включает количество, которое эффективно для «лечения» субъекта (например, пациента). Когда указывается терапевтическое количество, точное количество композиций, рассматриваемых в частных вариантах реализации подлежащее введению, может быть определено врачом с учетом спецификации и с учетом индивидуальных различий в возрасте, весе, размере опухоли, степени инфекция или метастазирования, а также состояния пациента (субъекта).The "therapeutically effective amount" of the nuclease variant, genome editing composition, or genome edited cells may vary depending on factors such as disease status, age, sex, and weight of the individual, and the ability to elicit the desired response in that individual. A therapeutically effective amount is also one in which any toxic or deleterious effects are outweighed by the therapeutically beneficial effects. The term "therapeutically effective amount" includes an amount that is effective to "treat" a subject (eg, patient). When a therapeutic amount is indicated, the precise amount of compositions contemplated in particular embodiments to be administered may be determined by the clinician, taking into account the specification and taking into account individual differences in age, weight, tumor size, degree of infection or metastasis, as well as the condition of the patient (subject).

C. ВАРИАНТЫ НУКЛЕАЗЫC. NUCLEASE VARIANTS

Варианты нуклеазы, рассматриваемые в настоящей заявке в частных вариантах реализации пригодны для геномного редактирования сайта-мишени в гене PD-1 и содержат один или более ДНК-связывающих доменов и один или более доменов расщепления ДНК (например, один или более доменов эндонуклеазы и/или экзонуклеазы) и, необязательно, один или более линкеров, рассматриваемых в настоящей заявке. Термины «перепрограммированная нуклеаза», «сконструированная нуклеаза» или «вариант нуклеазы» используются взаимозаменяемо и относятся к нуклеазе, содержащей один или более ДНК-связывающих доменов и один или более доменов расщепления ДНК, причем такая нуклеаза была разработана и/или модифицирована из родительской или встречающейся в природе нуклеазы, для связывания и расщепления двухцепочечной последовательности-мишени ДНК в гене PD-1.The nuclease variants contemplated herein in particular embodiments are suitable for genomic editing of a target site in the PD-1 gene and contain one or more DNA-binding domains and one or more DNA cleavage domains (e.g., one or more endonuclease and/or exonuclease) and, optionally, one or more linkers considered in this application. The terms "reprogrammed nuclease", "engineered nuclease" or "nuclease variant" are used interchangeably and refer to a nuclease containing one or more DNA-binding domains and one or more DNA cleavage domains, and such a nuclease has been designed and/or modified from a parent or a naturally occurring nuclease to bind and cleave a double-stranded DNA target sequence in the PD-1 gene.

В частных вариантах реализации вариант нуклеазы связывает и расщепляет последовательность-мишень в экзоне 5 гена PD-1, предпочтительно в SEQ ID NO: 25 в экзоне 5 гена PD-1 и более предпочтительно в последовательности «ATAC» в SEQ ID NO: 25 в экзоне 5 гена PD-1.In particular embodiments, the nuclease variant binds and cleaves a target sequence in exon 5 of the PD-1 gene, preferably SEQ ID NO: 25 in exon 5 of the PD-1 gene, and more preferably in the "ATAC" sequence in SEQ ID NO: 25 in exon 5 gene PD-1.

В частных вариантах реализации вариант нуклеазы связывает и расщепляет последовательность-мишень в экзоне 1 гена PD-1, предпочтительно с SEQ ID NO: 30 в экзоне 1 гена PD-1 и более предпочтительно в последовательности «ATCC» в SEQ ID NO: 30 в экзоне 1 гена PD-1.In particular embodiments, a variant nuclease binds and cleaves a target sequence in exon 1 of the PD-1 gene, preferably at SEQ ID NO: 30 in exon 1 of the PD-1 gene, and more preferably at "ATCC" in SEQ ID NO: 30 in exon 1 PD-1 gene.

В частных вариантах реализации вариант нуклеазы связывает и расщепляет последовательность-мишень в экзоне 2 гена PD-1, предпочтительно при SEQ ID NO: 35 в экзоне 2 гена PD-1 и более предпочтительно в последовательности «ACTT» в SEQ ID NO: 35 в экзоне 2 гена PD-1.In particular embodiments, a variant nuclease binds and cleaves a target sequence in exon 2 of the PD-1 gene, preferably at SEQ ID NO: 35 in exon 2 of the PD-1 gene, and more preferably at "ACTT" in SEQ ID NO: 35 in exon 2 PD-1 genes.

Такой вариант нуклеазы может быть сконструирован и/или модифицирован из встречающейся в природе нуклеазы или из предшествующего варианта нуклеазы. Варианты нуклеазы, рассматриваемые в частных вариантах реализации могут дополнительно содержать один или более дополнительных функциональных доменов, например, ферментативный домен конечного процессинга фермента, изменяющего структуру концов, который демонстрирует 5'-3'-экзонуклеазную, 5'-3'-щелочную экзонуклеазную, 3'-5'- экзонуклеазную (например, Trex2), 5'-flap-эндонуклеазную, геликазную, матрично-зависимую ДНК-полимеразную или матрично-независимую ДНК-полимеразнную активность.Such a nuclease variant may be constructed and/or modified from a naturally occurring nuclease or from a prior nuclease variant. Nuclease variants contemplated in particular embodiments may further comprise one or more additional functional domains, e.g., the end-processing enzymatic domain of an end-reversing enzyme that exhibits a 5'-3'-exonuclease, 5'-3'-basic exonuclease, 3 '-5' exonuclease (eg Trex2), 5'-flap endonuclease, helicase, template dependent DNA polymerase or template independent DNA polymerase activity.

Иллюстративные примеры вариантов нуклеаз, которые связывают и расщепляют последовательность-мишень в гене PD-1, включают, среди прочего, варианты хоминг-эндонуклеазы (мегануклеазы) и megaTAL.Illustrative examples of nuclease variants that bind and cleave a target sequence in the PD-1 gene include, among others, homing endonuclease (meganuclease) and megaTAL variants.

1. Варианты хоминг-эндонуклеазы (мегануклеазы)1. Homing endonuclease (meganuclease) variants

В различных вариантах реализации хоминг-эндонуклеазу или мегануклеазу перепрограммируют для введения двухцепочечного разрыва (DSB) в сайт-мишень в гене PD-1. В частных вариантах реализации вариант хоминг-эндонуклеазы вводит двухцепочечный разрыв в экзоне 5 гена PD-1, предпочтительно в SEQ ID NO: 25 в экзоне 5 гена PD-1 и более предпочтительно в последовательности «ATAC» в SEQ ID NO: 25 в экзоне 5 гена PD-1. В частных вариантах реализации вариант хоминг-эндонуклеазы вводит двухцепочечный разрыв в экзоне 1 гена PD-1, предпочтительно в SEQ ID NO: 30 в экзоне 1 гена PD-1 и более предпочтительно в последовательности «ATCC» в SEQ ID NO: 30 в экзоне 1 гена PD-1. В частных вариантах реализации вариант хоминг-эндонуклеазы вводит двухцепочечный разрыв в экзоне 2 гена PD-1, предпочтительно в SEQ ID NO: 35 в экзоне 2 гена PD-1 и более предпочтительно в последовательности «ACTT» в SEQ ID NO: 35 в экзоне 2 гена PD-1.In various embodiments, the homing endonuclease or meganuclease is reprogrammed to introduce a double strand break (DSB) at a target site in the PD-1 gene. In particular embodiments, a homing endonuclease variant introduces a double-strand break in exon 5 of the PD-1 gene, preferably in SEQ ID NO: 25 in exon 5 of the PD-1 gene, and more preferably in the "ATAC" sequence in SEQ ID NO: 25 in exon 5 gene PD-1. In particular embodiments, a homing endonuclease variant introduces a double-strand break in exon 1 of the PD-1 gene, preferably in SEQ ID NO: 30 in exon 1 of the PD-1 gene, and more preferably in the "ATCC" sequence in SEQ ID NO: 30 in exon 1 gene PD-1. In particular embodiments, a homing endonuclease variant introduces a double-strand break in exon 2 of the PD-1 gene, preferably in SEQ ID NO: 35 in exon 2 of the PD-1 gene, and more preferably in the "ACTT" sequence in SEQ ID NO: 35 in exon 2 gene PD-1.

Термины «хоминг-эндонуклеаза» и «мегануклеаза» используются взаимозаменяемо и относятся к естественным хоминг-эндонуклеазам, которые распознают сайты расщепления 12-45 пар нуклеотидоа и обычно группируются в пять семейств на основе мотивов последовательности и структуры: LAGLIDADG, GIY-YIG HNH, бокс His-Cys и PD-(D/E)XK.The terms "homing endonuclease" and "meganuclease" are used interchangeably and refer to natural homing endonucleases that recognize cleavage sites of 12-45 nucleotide pairs and are generally grouped into five families based on sequence and structure motifs: LAGLIDADG, GIY-YIG HNH, box His-Cys and PD-(D/E)XK.

Термины «эталонная хоминг-эндонуклеаза» или «эталонная мегануклеаза» относятся к дикому типу хоминг-эндонуклеазы или хоминг-эндонуклеазе, встречающейся в природе. В одном варианте реализации «эталонная хоминг-эндонуклеаза» относится к хоминг-эндонуклеазе дикого типа, которая была модифицирована для увеличения базальной активности.The terms "reference homing endonuclease" or "reference meganuclease" refer to wild-type homing endonuclease or homing endonuclease found in nature. In one embodiment, a "reference homing endonuclease" refers to a wild-type homing endonuclease that has been modified to increase basal activity.

Термины «сконструированная хоминг-эндонуклеаза», «перепрограммированная хоминг-эндонуклеаза», «вариант хоминг-эндонуклеазы», «сконструированная мегануклеаза», «перепрограммированная мегануклеаза» или «вариант мегануклеазы» относятся к хоминг-эндонуклеазе, содержащей один или больше ДНК-связывающих доменов и один или более доменов расщепления ДНК, причем указанная хоминг-эндонуклеаза была сконструирована и/или модифицирована из родительской или природной хоминг-эндонуклеазы для связывания и расщепления последовательности-мишени ДНК в гене PD-1. Вариант хоминг-эндонуклеазы может быть сконструирован и/или модифицирован из природной хоминг-эндонуклеазы или из другого варианта хоминг-эндонуклеазы. Варианты хоминг-эндонуклеазы, рассматриваемые в частных вариантах реализации могут дополнительно содержать один или более дополнительных функциональных доменов, например, ферментативный домен конечного процессинга фермента, изменяющего структуру концов, который демонстрирует 5'-3'-экзонуклеазную, 5'-3'-щелочную экзонуклеазную, 3'-5'-экзонуклеазную (например, Trex2), 5'-flap-эндонуклеазную, геликазную, матрично-зависимую ДНК-полимеразную или матрично-независимую ДНК-полимеразнную активность.The terms “engineered homing endonuclease,” “reprogrammed homing endonuclease,” “variant homing endonuclease,” “engineered meganuclease,” “reprogrammed meganuclease,” or “variant meganuclease” refer to a homing endonuclease containing one or more DNA-binding domains. and one or more DNA cleavage domains, wherein said homing endonuclease has been engineered and/or modified from a parental or natural homing endonuclease to bind and cleave a target DNA sequence within the PD-1 gene. A homing endonuclease variant may be constructed and/or modified from a natural homing endonuclease or from another homing endonuclease variant. Homing endonuclease variants contemplated in particular embodiments may further comprise one or more additional functional domains, e.g. , 3'-5'-exonuclease (eg, Trex2), 5'-flap-endonuclease, helicase, template-dependent DNA polymerase or template-independent DNA polymerase activity.

Варианты хоминг-эндонуклеазы (HE) не существуют в природе и могут быть получены с помощью технологии рекомбинантной ДНК или случайного мутагенеза. Варианты HE могут быть получены путем внесения одного или нескольких аминокислотных изменений, например, мутации, замены, добавления или удаления одной или нескольких аминокислот во встречающихся в природе HE или варианте HE. В частных вариантах реализации вариант HE содержит одну или более аминокислотных замен в интерфейсе распознавания ДНК.Homing endonuclease (HE) variants do not exist in nature and can be generated using recombinant DNA technology or random mutagenesis. HE variants can be generated by making one or more amino acid changes, such as mutation, substitution, addition or deletion of one or more amino acids in a naturally occurring HE or HE variant. In particular embodiments, the HE variant contains one or more amino acid substitutions in the DNA recognition interface.

Варианты HE, рассматриваемые в частных вариантах реализации могут, кроме того, включать один или более линкеров и/или дополнительных функциональных доменов, например, ферментативный домен конечного процессинга фермента, изменяющего структуру концов, который демонстрирует 5'-3'-экзонуклеазную, 5'-3'-щелочную экзонуклеазную, 3'-5'- экзонуклеазную (например, Trex2), 5'-flap-эндонуклеазную, геликазную, матрично-зависимую ДНК-полимеразную или матрично-независимую ДНК-полимеразнную активность. В частных вариантах реализации варианты HE вводят в Т-клетку ферментом, изменяющим концы концов, который демонстрирует 5'-3'-экзонуклеазную, 5'-3'-щелочную экзонуклеазную, 3'-5'-экзонуклеазную (например, Trex2), 5'-flap-эндонуклеазную, геликазную, матрично-зависимую ДНК-полимеразную или матрично-независимую ДНК-полимеразнную активность. Вариант HE и фермент 3'-процессинга могут быть введены по отдельности, например, в разных векторах или в отдельных мРНК, или вместе, например, в виде слитого белка или в полицистронной конструкции, разделенной вирусным саморасщепляемым пептидом или элементом IRES.Variants of HE contemplated in particular embodiments may further include one or more linkers and/or additional functional domains, e.g. 3'-alkaline exonuclease, 3'-5'-exonuclease (for example, Trex2), 5'-flap-endonuclease, helicase, template-dependent DNA polymerase or template-independent DNA polymerase activity. In particular embodiments, HE variants are introduced into the T cell with a terminating enzyme that exhibits a 5'-3'-exonuclease, 5'-3'-alkaline exonuclease, 3'-5'-exonuclease (e.g., Trex2), 5 '-flap-endonuclease, helicase, template-dependent DNA polymerase or template-independent DNA polymerase activity. The HE variant and the 3' processing enzyme can be introduced separately, eg in different vectors or separate mRNAs, or together, eg as a fusion protein or in a polycistronic construct separated by a viral self-cleaving peptide or IRES element.

Термины «интерфейс распознавания ДНК» относится к аминокислотным остаткам HE, которые взаимодействуют с основаниями-мишенями нуклеиновых кислот, а также к непосредственно примыкающим остаткам. Для каждой НЕ интерфейс распознавания ДНК включает в себя обширную сеть контактов боковая цепь-боковая цепь и боковая цепь-ДНК, большинство из которых обязательно уникальны для распознавания конкретной последовательности-мишени нуклеиновой кислоты. Таким образом, аминокислотная последовательность интерфейса распознавания ДНК, соответствующая конкретной последовательности нуклеиновой кислоты, значительно варьируется и является признаком любого природного варианта или варианта HE. В качестве неограничивающего примера, вариант HE, рассматриваемый в частных вариантах реализации может быть получен путем конструирования библиотек вариантов HE, в которых один или более аминокислотных остатков, локализованных в интерфейсе распознавания ДНК природной HE (или ранее созданного варианта HE), варьируются. Библиотеки могут быть подвергнуты скринингу на целевую активность расщепления против каждой предсказанного сайта-мишени PD-1 с помощью анализов расщепления (см., например, Jarjour et al., 2009. Nuc. Acids Res. 37(20): 6871-6880).The terms "DNA recognition interface" refers to HE amino acid residues that interact with target nucleic acid bases as well as immediately adjacent residues. For each NOT, the DNA recognition interface includes an extensive network of side-chain-to-side-chain and side-chain-to-DNA contacts, most of which are necessarily unique to recognize a particular nucleic acid target sequence. Thus, the amino acid sequence of the DNA recognition interface corresponding to a particular nucleic acid sequence varies greatly and is a feature of any natural or HE variant. As a non-limiting example, a HE variant considered in particular embodiments can be generated by constructing HE variant libraries in which one or more amino acid residues located at the DNA recognition interface of native HE (or a previously generated HE variant) are varied. Libraries can be screened for target cleavage activity against each predicted PD-1 target site using cleavage assays (see, for example, Jarjour et al., 2009. Nuc. Acids Res. 37(20): 6871-6880).

Хоминг-эндонуклеазы LAGLIDADG (LHE) являются наиболее хорошо изученным семейством хоминг-эндонуклеаз, кодируются в основном у архей и в органеллярной ДНК зеленых водорослей и грибов и обладают самой высокой общей специфичностью распознавания ДНК. LHE содержат один или два каталитических мотива LAGLIDADG на цепочку белка и функционируют как гомодимеры или одноцепочечные мономеры соответственно. Структурные исследования белков LAGLIDADG выявили высококонсервативную структуру ядра (Stoddard 2005), характеризующуюся складкой αββαββα, причем мотив LAGLIDADG принадлежит первой спирали указанной складки. Высокоэффективное и специфичное расщепление LHE представляет собой каркас белка для получения новых высокоспецифичных эндонуклеаз. Однако генное конструирование LHE для связывания и расщепления неприродного или неканонического сайта-мишени требуют выбора подходящего каркаса LHE, исследования локуса-мишени, выбора предполагаемых сайтов-мишеней и обширного изменения LHE для изменения точек контакта. и специфичности расщепления ее ДНК, до двух третей позиций пар нуклеотидов в сайте-мишени.Homing endonucleases LAGLIDADG (LHE) are the best studied family of homing endonucleases, encoded mainly in archaea and in the organelle DNA of green algae and fungi, and have the highest overall DNA recognition specificity. LHEs contain one or two LAGLIDADG catalytic motifs per protein chain and function as homodimers or single chain monomers, respectively. Structural studies of LAGLIDADG proteins revealed a highly conserved nuclear structure (Stoddard 2005) characterized by the αββαββα fold, with the LAGLIDADG motif belonging to the first helix of this fold. Highly efficient and specific cleavage of LHE provides a protein scaffold to generate new highly specific endonucleases. However, LHE gene engineering to bind and cleave a non-natural or non-canonical target site requires the selection of an appropriate LHE scaffold, exploration of the target locus, selection of putative target sites, and extensive alteration of the LHE to change the contact points. and the specificity of its DNA cleavage, up to two-thirds of the base pair positions at the target site.

В одном варианте реализации LHE, из которых могут быть сконструированы перепрограммированные LHE или варианты LHE, включают, среди прочего, I-CreI и I-SceI.In one embodiment, LHEs from which reprogrammed LHEs or variants of LHEs can be constructed include, but are not limited to, I-CreI and I-SceI.

Иллюстративные примеры LHE, из которых могут быть сконструированы перепрограммированные LHE или варианты LHE, включают, среди прочего, I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-ScuMI, I-SmaMI, I-SscMI и I-Vdi141I.Illustrative examples of LHEs from which reprogrammed LHEs or LHE variants can be constructed include, among others, I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I- CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I- OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-ScuMI, I-SmaMI, I-SscMI and I-Vdi141I.

В одном варианте реализации перепрограммированная LHE или вариант LHE выбраны из группы, состоящей из: варианта I-CpaMI, варианта I-HjeMI, варианта I-OnuI, варианта I-PanMI и варианта I-SmaMI.In one embodiment, the reprogrammed LHE or LHE variant is selected from the group consisting of: I-CpaMI variant, I-HjeMI variant, I-OnuI variant, I-PanMI variant, and I-SmaMI variant.

В одном варианте реализации перепрограммированная LHE или вариант LHE представляет собой вариант I-OnuI. См., например, SEQ ID NO: 6-14 и 60-63.In one embodiment, the reprogrammed LHE or LHE variant is an I-OnuI variant. See, for example, SEQ ID NOs: 6-14 and 60-63.

В одном варианте реализации перепрограммированные LHE I-OnuI или варианты I-OnuI, нацеленные на ген PD-1, были сконструированы из природного I-OnuI или его биологически активного фрагмента (SEQ ID NO: 1-5). В предпочтительном варианте реализации перепрограммированные LHE I-OnuI или варианты I-OnuI, нацеленные на ген PD-1 человека, были сконструированы из существующего варианта I-OnuI. В одном варианте реализации, перепрограммированные LHE I-OnuI были сконструированы против сайта-мишени гена PD-1 человека, указанного в SEQ ID NO: 25. В одном варианте реализации, перепрограммированные LHE I-OnuI OnuI были сконструированы против сайта-мишени гена PD-1 человека, указанного в SEQ ID NO: 30. В одном варианте реализации перепрограммированные I-OnuI LHE были сконструированы против сайта-мишени гена PD-1 человека, указанного в SEQ ID NO: 35.In one embodiment, reprogrammed I-OnuI LHEs or I-OnuI variants targeting the PD-1 gene were constructed from natural I-OnuI or a biologically active fragment thereof (SEQ ID NOS: 1-5). In a preferred embodiment, reprogrammed I-OnuI LHEs or I-OnuI variants targeting the human PD-1 gene were constructed from an existing I-OnuI variant. In one embodiment, the reprogrammed LHE I-OnuI were engineered against the target site of the human PD-1 gene set forth in SEQ ID NO: 25. In one embodiment, the reprogrammed LHE I-OnuI OnuI were engineered against the target site of the PD-1 gene. 1 of the human indicated in SEQ ID NO: 30. In one embodiment, reprogrammed I-OnuI LHEs were engineered against the target site of the human PD-1 gene indicated in SEQ ID NO: 35.

В частном варианте реализации перепрограммированные I-OnuI LHE или вариант I-OnuI, который связывает и расщепляет ген PD-1 человека, содержит одну или более аминокислотных замен в интерфейсе распознавания ДНК. В частных вариантах реализацииI-OnuI LHE, который связывает и расщепляет ген PD-1 человека, содержит последовательность по меньшей мере на 70% по меньшей мере на 71%, по меньшей мере на 72%, по меньшей мере на 73%, по меньшей мере на 74%, по меньшей мере на 75%, по меньшей мере на 76%, по меньшей мере на 77%, по меньшей мере на 78%, по меньшей мере на 79%, по меньшей мере на 80%, по меньшей мере на 81%, по меньшей мере на 82%, по меньшей мере на 83%, по меньшей мере 8 на 4%, по меньшей мере на 85%, по меньшей мере на 86%, по меньшей мере на 87%, по меньшей мере на 88%, по меньшей мере на 89%, по меньшей мере на 90%, по меньшей мере на 91%, по меньшей мере на 92%, по меньшей мере на 93%, по меньшей мере на 94%, по меньшей мере на 95% по меньшей мере на 96%, по меньшей мере на 97%, по меньшей мере на 98% или по меньшей мере на 99% идентичную последовательности интерфейса распознавания ДНК I-OnuI (Taekuchi et al. 2011. Proc Natl Acad Sci USA 2011 Aug 9; 108 (32): 13077-13082) или варианта I-OnuI LHE, указанных в любой из SEQ ID NO: 6-14 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In a particular embodiment, the reprogrammed I-OnuI LHE or I-OnuI variant that binds and cleaves the human PD-1 gene contains one or more amino acid substitutions in the DNA recognition interface. In particular embodiments, the I-OnuI LHE that binds and cleaves the human PD-1 gene contains at least 70% sequence, at least 71%, at least 72%, at least 73%, at least 74%, at least 75%, at least 76%, at least 77%, at least 78%, at least 79%, at least 80%, at least 81%, at least 82%, at least 83%, at least 8% 4%, at least 85%, at least 86%, at least 87%, at least 88%, at least 89%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95 % at least 96%, at least 97%, at least 98%, or at least 99% identical to the I-OnuI DNA recognition interface sequence (Taekuchi et al. 2011. Proc Natl Acad Sci USA 2011 Aug 9; 108 (32): 13077-13082) or option I-OnuI LHE, specified in any of SEQ ID NO: 6-14 and 60-63, their biologically active fragments and/or their additional options.

В одном варианте реализации I-OnuI LHE, который связывает и расщепляет ген PD-1 человека, содержит последовательность, по меньшей мере на 70%, более предпочтительно, по меньшей мере на 80%, более предпочтительно, по меньшей мере на 85%, более предпочтительно, по меньшей мере на 90%, более предпочтительно, по меньшей мере на 95%, более предпочтительно, по меньшей мере на 97%, более предпочтительно, по меньшей мере на 99% идентичную последовательности области контакта распознавания ДНК I-OnuI (Taekuchi et al. 2011. Proc Natl Acad Sci U. S. A. 2011 Aug 9; 108(32): 13077-13082) или варианта I-OnuI LHE, указанных в любой из SEQ ID NO: 6-14 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In one embodiment, the I-OnuI LHE that binds and cleaves the human PD-1 gene contains the sequence for at least 70%, more preferably at least 80%, more preferably at least 85%, more preferably at least 90%, more preferably at least 95%, more preferably at least 97%, more preferably at least 99% sequence identical to the I-OnuI DNA recognition contact region (Taekuchi et al 2011. Proc Natl Acad Sci U. S. A. 2011 Aug 9;108(32): 13077-13082) or the I-OnuI LHE variant listed in any of SEQ ID NOs: 6-14 and 60-63, biologically active fragments thereof, and /or their additional options.

В частном варианте реализации вариант LHE I-OnuI, который связывает и расщепляет ген PD-1 человека, содержит одну или более аминокислотных замен или модификаций в интерфейсе распознавания ДНК I-OnuI, указанных в любой из SEQ ID NO: 1-14 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In a particular embodiment, the LHE I-OnuI variant that binds and cleaves the human PD-1 gene contains one or more amino acid substitutions or modifications in the I-OnuI DNA recognition interface as set forth in any of SEQ ID NOs: 1-14 and 60- 63, their biologically active fragments and/or their additional variants.

В частном варианте реализации вариант LHE I-OnuI, который связывает и расщепляет ген PD-1 человека, содержит одну или более аминокислотных замен или модификаций в интерфейсе распознавания ДНК, в частности в субмотивах, расположенных в позициях 24-50, 68. 82, 180-203 и 223-240 I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 6-14 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In a particular embodiment, the LHE I-OnuI variant that binds and cleaves the human PD-1 gene contains one or more amino acid substitutions or modifications in the DNA recognition interface, particularly in submotifs located at positions 24-50, 68. 82, 180 -203 and 223-240 I-OnuI (SEQ ID NOs: 1-5) or the I-OnuI variant specified in any of SEQ ID NOs: 6-14 and 60-63, biologically active fragments thereof and/or additional variants thereof .

В частном варианте реализации I-OnuI LHE, который связывает и расщепляет ген PD-1 человека, содержит одну или более аминокислотных замен или модификаций в интерфейсе распознавания ДНК в положениях аминокислот, выбранных из группы, состоящей из: 19, 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 68, 70, 72, 75, 76 77, 78, 80, 82, 168, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 195, 197, 199, 201, 203, 223, 225, 227, 229, 231, 232, 234, 236, 238 и 240 в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 6-14 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In a particular embodiment, the I-OnuI LHE that binds and cleaves the human PD-1 gene contains one or more amino acid substitutions or modifications in the DNA recognition interface at amino acid positions selected from the group consisting of: 19, 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 68, 70, 72, 75, 76 77, 78, 80, 82, 168, 180, 182, 184, 186 , 188, 189, 190, 191, 192, 193, 195, 197, 199, 201, 203, 223, 225, 227, 229, 231, 232, 234, 236, 238 and 240 in I-OnuI (SEQ ID NO : 1-5) or the I-OnuI variant specified in any of SEQ ID NOs: 6-14 and 60-63, their biologically active fragments and/or their additional variants.

В частном варианте реализации вариант LHE I-OnuI, который связывает и расщепляет ген PD-1 человека, содержит 5, 10, 15, 20, 25, 30, 35 или 40 или более аминокислотных замен или модификаций в интерфейсе распознавания ДНК. в частности, в субмотивах, расположенных в положениях 24-50, 68-82, 180-203 и 223-240 I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID №: 6-14 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In a particular embodiment, an LHE I-OnuI variant that binds and cleaves the human PD-1 gene contains 5, 10, 15, 20, 25, 30, 35, or 40 or more amino acid substitutions or modifications in the DNA recognition interface. in particular, in submotives located at positions 24-50, 68-82, 180-203 and 223-240 I-OnuI (SEQ ID NO: 1-5) or the I-OnuI variant specified in any of SEQ ID no: 6-14 and 60-63, biologically active fragments thereof and/or additional variants thereof.

В частном варианте реализации вариант LHE I-OnuI, который связывает и расщепляет ген PD-1 человека, содержит 5, 10, 15, 20, 25, 30, 35 или 40 или более аминокислотных замен или модификаций в интерфейсе распознавания ДНК. В положениях аминокислот, выбранных из группы, состоящей из: 19, 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 59, 68, 70, 72, 75, 76 77, 78, 80, 82, 168, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 195, 197, 199, 201, 203, 223, 225, 227, 229, 231, 232, 234, 236, 238 и 240 в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 6-14 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In a particular embodiment, an LHE I-OnuI variant that binds and cleaves the human PD-1 gene contains 5, 10, 15, 20, 25, 30, 35, or 40 or more amino acid substitutions or modifications in the DNA recognition interface. At amino acid positions selected from the group consisting of: 19, 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 59, 68, 70, 72 , 75, 76 77, 78, 80, 82, 168, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 195, 197, 199, 201, 203, 223, 225, 227, 229, 231, 232, 234, 236, 238 and 240 in I-OnuI (SEQ ID NOs: 1-5) or the I-OnuI variant listed in any of SEQ ID NOs: 6-14 and 60-63, their biologically active fragments and/or their additional variants.

В одном варианте реализации вариант LHE I-OnuI, который связывает и расщепляет ген PD-1 человека, содержит одну или более аминокислотных замен или модификаций в дополнительных положениях, расположенных где-либо в пределах всей последовательности I-OnuI. Остатки, которые могут быть замещены и/или модифицированы, включают, среди прочего, аминокислоты, которые связываются с нуклеиновой кислотой-мишенью или которые взаимодействуют с основной цепью нуклеиновой кислоты или с нуклеотидными основаниями, непосредственно или через молекулу воды. В одном неограничивающем примере рассматриваемый в настоящей заявке вариант LHE I-OnuI, который связывает и расщепляет ген PD-1 человека, содержит одну или более замен и/или модификаций, предпочтительно по меньшей мере 5, предпочтительно по меньшей мере 10, предпочтительно по меньшей мере 15, предпочтительно по меньшей мере 20, более предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 30, еще более предпочтительно по меньшей мере 35 или даже более предпочтительно по меньшей мере 40 или более аминокислотных замен по меньшей мере в одном положении, выбранном из группы положений, состоящей из положений: 26, 28, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 59, 68, 70, 72, 75, 76, 78, 80, 138, 143, 159, 168, 178, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 197, 199, 201, 203, 207, 223, 224, 225, 227, 229, 232, 236 и 238 в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 6-14 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In one embodiment, the LHE I-OnuI variant that binds and cleaves the human PD-1 gene contains one or more amino acid substitutions or modifications at additional positions located anywhere within the entire I-OnuI sequence. Residues that can be substituted and/or modified include, among others, amino acids that bind to the target nucleic acid or that interact with the nucleic acid backbone or with nucleotide bases, either directly or via a water molecule. In one non-limiting example, the LHE I-OnuI variant considered herein, which binds and cleaves the human PD-1 gene, contains one or more substitutions and/or modifications, preferably at least 5, preferably at least 10, preferably at least 15, preferably at least 20, more preferably at least 25, more preferably at least 30, even more preferably at least 35, or even more preferably at least 40 or more amino acid substitutions at least one position selected from group of positions, consisting of positions: 26, 28, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 59, 68, 70, 72, 75, 76, 78, 80, 138 , 143, 159, 168, 178, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 197, 199, 201, 203, 207, 223, 224, 225, 227, 229, 232 , 236 and 238 in I-OnuI (SEQ ID NOs: 1-5) or the I-OnuI variant listed in any of SEQ ID NOs: 6-14 and 60-63, their biologically active fragments and/or their additional options.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 5 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или еще более предпочтительно, по меньшей мере 40 или более из следующих аминокислотных замен: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40K, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, S72R, N75S, A76Y, S78K, K80R, L138M, T143N, S159P, F168L, E178D, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, S201M, T203G, K207R, Y223R, I224T, K225R, K229I, F232K, D236E и V238E в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, к указанный в любой из SEQ ID NO: 6-10, их биологически активные фрагменты и/или их дополнительные варианты.In some embodiments, the HE variant cleaves the target site of exon 5 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40K, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, S72R, N75S, A76Y, S78K K80R, L138M, T143N, S159P, F168L, E1788D, C180H, F182G, N184I, I186A, S188RR, K189R, S190P, K191A, L192S, G193P, K197R, V199RA, S201M, T203G, K207M, K207M, K207M, K207M, T203G, K207M, T203G, K207M. , K229I, F232K, D236E and V238E in I-OnuI (SEQ ID NOs: 1-5) or the I-OnuI variant specified in any of SEQ ID NOs: 6-10, their biologically active fragments and/or their additional variants .

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 5 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или даже более предпочтительно, по меньшей мере 40 или более из следующих аминокислотных замен: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40K, E42R, G44R, Q46E, T48D, V68K, A70Y, S72Q, N75S, A76Y, S78K, K80R, L138M, T143N, S159P, F168L, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, T203G, K207R, Y223R, K225R, K229I, F232K, D236E и V238E в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 6-10, их биологически активные фрагменты и/или их дополнительные варианты.In some embodiments, the HE variant cleaves the target site of exon 5 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40K, E42R, G44R, Q46E, T48D, V68K, A70Y, S72Q, N75S, A76Y, S78K, K80R, L138M, T143N , S159P, F168L, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, T203G, K207R, Y223R, K225R, K229I, V2362E (SEQ ID NOs: 1-5) or the I-OnuI variant specified in any of SEQ ID NOs: 6-10, their biologically active fragments and/or their additional variants.

В частных вариантах реализации вариант HE расщепляет сайт-мишень экзона 5 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или еще более предпочтительно, по меньшей мере 40 или более из следующих аминокислотных замен: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72R, N75S, A76Y, K80R, L138M, T143N, S159P, F168L, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, T203G, K207R, Y223R, I224T, K225R, K229I, F232K, D236E и V238E в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 6-10, их биологически активные фрагменты и/или их дополнительные варианты.In particular embodiments, the HE variant cleaves the target site of exon 5 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72R, N75S, A76Y, K80R, L138M, T143N , S159P, F168L, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, T203G, K207R, Y223R, I224T, K225R, K2329I -OnuI (SEQ ID NOs: 1-5) or the I-OnuI variant specified in any of SEQ ID NOs: 6-10, their biologically active fragments and/or their additional variants.

В дополнительных вариантах реализации, вариант HE расщепляет сайт-мишень экзона 5 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более из следующих аминокислотных замен: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, N75S, A76Y, K80R, L138M, T143N, S159P, F168L, E178D, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, T203G, K207R, Y223R, I224T, K225R, K229I, F232K, D236E и V238E в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 6-10, их биологически активные фрагменты и/или их дополнительные варианты.In additional embodiments, the HE variant cleaves the target site of exon 5 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, N75S, A76Y, K80R, L138M, T143N, S159P , F168L, E178D, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, T203G, K207R, Y223R, I224T, K225R, K2329I -OnuI (SEQ ID NOs: 1-5) or the I-OnuI variant specified in any of SEQ ID NOs: 6-10, their biologically active fragments and/or their additional variants.

В других вариантах реализации, вариант HE расщепляет сайт-мишень экзона 5 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более из следующих аминокислотных замен: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, N75S, A76Y, K80R, L138M, T143N, S159P, F168L, E178D, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, T203G, K207R, Y223R, K225R, F232K, D236E и V238E в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 6-10, их биологически активные фрагменты и/или их дополнительные варианты.In other embodiments, the HE variant cleaves the target site of exon 5 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, N75S, A76Y, K80R, L138M, T143N, S159P , F168L, E178D, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201A, T203G, K207R, Y223R, K225R, F232K, D236E in IQ ID NOs: 1-5) or the I-OnuI variant specified in any of SEQ ID NOs: 6-10, their biologically active fragments and/or their additional variants.

В частных вариантах реализации вариант HE расщепляет сайт-мишень экзона 5 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более из следующих аминокислотных замен: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, N75S, A76Y, K80R, L138M, T143N, S159P, F168L, E178D, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201M, T203G, Y223R, K225R, F232K, D236E и V238E в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 6-10, их биологически активные фрагменты и/или их дополнительные варианты.In particular embodiments, the HE variant cleaves the target site of exon 5 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: L26Q, R28E, N32V, K34P, S35N, S36I, V37P, G38R, S40R, E42R, G44R, Q46E, T48D, N59D, V68K, A70Y, S72Q, N75S, A76Y, K80R, L138M, T143N, S159P, F168L, E178D, C180H, F182G, N184I, I186A, S188R, K189R, S190P, K191A, L192S, G193P, Q197R, V199R, S201M, T203G, Y223R, K225R, F232K, D236E and V238E 1-5) or an I-OnuI variant as set forth in any of SEQ ID NOs: 6-10, biologically active fragments thereof, and/or additional variants thereof.

В частных вариантах реализации вариант HE расщепляет сайт-мишень экзона 1 PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или еще более предпочтительно, по меньшей мере 40 или более аминокислотных замен по меньшей мере в одной позиций, выбранной из группы позиций, состоящей из позиций: 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 68, 70, 72, 75, 76, 78, 80, 100, 132, 138, 143, 155, 159, 178, 180, 184, 186, 189, 190, 191, 192, 193, 195, 201, 203, 207, 223, 225, 227, 232, 236, 238 и 240 в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 11-12 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In particular embodiments, the HE variant cleaves the target site of exon 1 of PD-1 and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more amino acid substitutions at at least one position selected from the group of positions consisting of positions: 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 42, 44, 46, 48, 68, 70, 72, 75, 76, 78, 80, 100, 132, 138, 143, 155, 159, 178, 180, 184, 186, 189, 190, 191, 192, 193, 195, 201, 203, 207, 223, 225, 227, 232, 236, 238 and 240 in I-OnuI (SEQ ID NOs: 1-5) or the I-OnuI variant listed in any of SEQ ID NOs: 11-12 and 60-63, their biologically active fragments and/or their additional variants.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 1 гена PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более из следующих аминокислотных замен: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46A, Q46T, T48V, V68I, A70T, S72D, N75R, A76Y, S78R, K80R, K80C, I100V, V132A, L138M, T143N, S155G, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и T240E в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 11-12 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In some embodiments, the HE variant cleaves the target site of exon 1 of the PD-1 gene and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46A, Q46T, T48V, V68I, A70T, S72D, N75R, A76Y, S78R, K80R, K80C I100V, V132A, L138M, T143N, S155g, S159P, E1780S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227H, K2227H, K2227H, K2227H, K22227H, K225YUA, K2227H, K22227H, K225 and T240E in I-OnuI (SEQ ID NOs: 1-5) or the I-OnuI variant specified in any of SEQ ID NOs: 11-12 and 60-63, biologically active fragments thereof, and/or additional variants thereof.

В других вариантах реализации, вариант HE расщепляет сайт-мишень экзона 1 гена PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более из следующих аминокислотных замен: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46A, T48V, V68I, A70T, S72D, N75R, A76Y, S78R, K80R, I100V, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и T240E в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 11-12 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In other embodiments, the HE variant cleaves the target site of exon 1 of the PD-1 gene and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46A, T48V, V68I, A70T, S72D, N75R, A76Y, S78R, K80R, I100V, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D2386Q (in SEQ ID NOs: 1-5) or the I-OnuI variant specified in any of SEQ ID NOs: 11-12 and 60-63, their biologically active fragments and/or their additional variants.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 1 гена PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более из следующих аминокислотных замен: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48V, V68I, A70T, S72D, N75R, A76Y, S78R, K80C, I100V, V132A, L138M, T143N, S155G, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и T240E в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 11-12 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In some embodiments, the HE variant cleaves the target site of exon 1 of the PD-1 gene and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48V, V68I, A70T, S72D, N75R, A76Y, S78R, K80C, I100V, V132A , L138M, T143N, S155G, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K22R7G, V236G, V23QE -OnuI (SEQ ID NOs: 1-5) or the I-OnuI variant specified in any of SEQ ID NOs: 11-12 and 60-63, their biologically active fragments and/or their additional variants.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 1 гена PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более из следующих аминокислотных замен: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48M, V68I, A70T, S72N, N75H, A76Y, S78T, K80R, I100V, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и T240E в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 11-12 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In some embodiments, the HE variant cleaves the target site of exon 1 of the PD-1 gene and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48M, V68I, A70T, S72N, N75H, A76Y, S78T, K80R, I100V, L138M , T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D23 R ID NOs: 1-5) or the I-OnuI variant specified in any of SEQ ID NOs: 11-12 and 60-63, their biologically active fragments and/or their additional variants.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 1 гена PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более из следующих аминокислотных замен: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48M, V68S, A70L, S72N, N75H, A76Y, K80V, T82Y, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и T240E в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 11-12 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In some embodiments, the HE variant cleaves the target site of exon 1 of the PD-1 gene and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48M, V68S, A70L, S72N, N75H, A76Y, K80V, T82Y, L138M, T143N , S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R and T240E in ID : 1-5) or the I-OnuI variant specified in any of SEQ ID NOs: 11-12 and 60-63, their biologically active fragments and/or their additional variants.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 1 гена PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более из следующих аминокислотных замен: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37G, G38R, S40H, E42R, G44S, Q46T, T48M, V68S, A70T, S72N, N75H, A76Y, K80V, T82Y, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и T240E в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 11-12 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In some embodiments, the HE variant cleaves the target site of exon 1 of the PD-1 gene and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37G, G38R, S40H, E42R, G44S, Q46T, T48M, V68S, A70T, S72N, N75H, A76Y, K80V, T82Y, L138M, T143N , S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R and T240E in ID : 1-5) or the I-OnuI variant specified in any of SEQ ID NOs: 11-12 and 60-63, their biologically active fragments and/or their additional variants.

В некоторых вариантах реализации вариант HE расщепляет сайт-мишень экзона 1 гена PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно по меньшей мере 25, более предпочтительно по меньшей мере 35 или еще более предпочтительно по меньшей мере 40 или более из следующих аминокислотных замен: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48M, V68S, A70Y, S72N, N75H, A76Y, K80E, T82F, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и T240E в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 11-12 и 60-63, их биологически активные фрагменты и/или их дополнительные варианты.In some embodiments, the HE variant cleaves the target site of exon 1 of the PD-1 gene and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48M, V68S, A70Y, S72N, N75H, A76Y, K80E, T82F, L138M, T143N , S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R and T240E in ID : 1-5) or the I-OnuI variant specified in any of SEQ ID NOs: 11-12 and 60-63, their biologically active fragments and/or their additional variants.

В частных вариантах реализации вариант HE расщепляет сайт-мишень экзона 2 гена PD-1 и содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или даже более предпочтительно, по меньшей мере 40 или более аминокислотных замен по меньшей мере в одной позиция, выбранная из группы позиций, состоящей из позиций: 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 41, 42, 44, 46, 48, 68, 70, 72, 74, 75, 76, 78, 80, 82, 116, 138, 143, 159, 168, 178, 180, 182, 184, 186, 188, 189, 190, 191, 192, 193, 195, 199, 203, 207, 225, 227, 229, 232, 236 и 238 в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 13-14, их биологически активные фрагменты и/или их дополнительные варианты.In particular embodiments, the HE variant cleaves the target site of exon 2 of the PD-1 gene and contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more amino acid substitutions in at least one position selected from the group of positions consisting of positions: 24, 26, 28, 30, 32, 34, 35, 36, 37, 38, 40, 41, 42, 44, 46 , 48, 68, 70, 72, 74, 75, 76, 78, 80, 82, 116, 138, 143, 159, 168, 178, 180, 182, 184, 186, 188, 189, 190, 191, 192 , 193, 195, 199, 203, 207, 225, 227, 229, 232, 236 and 238 in I-OnuI (SEQ ID NOs: 1-5) or the I-OnuI variant listed in any of SEQ ID NO: 13 -14, their biologically active fragments and/or their additional variants.

В дополнительных вариантах реализации, вариант HE содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или даже более предпочтительно, по меньшей мере 40 или более из следующих аминокислотных замен: S24C, L26Q, R28Y, R28H, R30S, N32V, N32L, K34N, K34R, S35N, S35T, S36R, V37S, V37T, G38R, G38K, S40R, T41A, E42R, G44S, G44R, Q46E, Q46A, T48E, V68I, A70N, S72I, D74N, N75T, N75R, A76S, A76R, S78R, K80S, T82G, T82R, V116L, L138M, T143N, S159P, F168L, E178D, C180N, F182Y, N184H, I186K, K189G, S190R, K191T, L192T, G193R, Q195Y, V199R, T203A, T203S, K207R, K225N, K225T, K227W, K227S, K229A, K229P, F232R, W234A, W234D, D236E и V238R в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 13-14, их биологически активные фрагменты и/или их дополнительные варианты.In further embodiments, the HE variant contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: S24C, L26Q, R28Y, R28H, R30S, N32V, N32L, K34N, K34R, S35N, S35T, S36R, V37S, V37T, G38R, G38K, S40R, T41A, E42R, G44S, G44R, Q46E, Q46A, T48E, V68I, A70N, S72I, D74N, N75T, N75R, A76S, A76R, S78R, K80S, T82G, T82R, V116L, L138M, T143N, S159P, F168L, E178D, C180N, F182Y, N184H, I186K, K189G, S193, Q195Y, V199R, T203A, T203S, K207R, K225N, K225T, K227W, K227S, K229A, K229P, F232R, W234A, W234D, D236E and V238R in I-OnuI (SEQ ID NO: 1-5) or I-OnuI option, specified in any of SEQ ID NO: 13-14, their biologically active fragments and/or their additional variants.

В частных вариантах реализации вариант HE содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или даже более предпочтительно, по меньшей мере 40 или более из следующих аминокислотных замен: L26Q, R28Y, R30S, N32V, K34N, S35N, S36R, V37S, G38R, S40R, T41A, E42R, G44R, Q46A, T48E, A70N, S72I, N75T, A76S, S78R, K80S, T82G, L138M, T143N, S159P, F168L, E178D, C180N, F182Y, N184H, I186K, K189G, S190R, K191T, L192T, G193R, Q195Y, V199R, T203A, K207R, K225N, K227W, K229A, F232R, W234A, D236E и V238R в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 13-14, их биологически активные фрагменты и/или их дополнительные варианты.In particular embodiments, the HE variant contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: L26Q, R28Y . , C180N, F182Y, N184H, I186K, K189G, S190R, K191T, L192T, G193R, Q195Y, V199R, T203A, K207R, K225N, K227W, K229A, F232R, W234A, D236E and V238R in I-OnuI (ID: NO 1 -5) or the I-OnuI variant specified in any of SEQ ID NOs: 13-14, their biologically active fragments and/or their additional variants.

В некоторых вариантах вариант HE содержит по меньшей мере 5, по меньшей мере 15, предпочтительно, по меньшей мере 25, более предпочтительно, по меньшей мере 35 или даже более предпочтительно, по меньшей мере 40 или более из следующих аминокислотных замен: S24C, R28H, N32L, K34R, S35T, V37T, G38K, S40R, E42R, G44S, Q46E, T48E, V68I, A70N, S72I, D74N, N75R, A76R, S78R, K80S, T82R, V116L, L138M, T143N, S159P, F168L, E178D, C180N, F182Y, N184H, I186K, K189G, S190R, K191T, L192T, G193R, Q195Y, V199R, T203S, K207R, K225T, K227S, K229P, F232R, W234D, D236E и V238R в I-OnuI (SEQ ID NO: 1-5) или вариант I-OnuI, указанный в любой из SEQ ID NO: 13-14, их биологически активные фрагменты и/или их дополнительные варианты.In some embodiments, the HE variant contains at least 5, at least 15, preferably at least 25, more preferably at least 35, or even more preferably at least 40 or more of the following amino acid substitutions: S24C, R28H, N32L, K34R, S35T, V37T, G38K, S40R, E42R, G44S, Q46E, T48E, V68I, A70N, S72I, D74N, N75R, A76R, S78R, K80S, T82R, V116L, L138M, T143N, S159P, F178D, E1 C180N, F182Y, N184H, I186K, K189G, S190R, K191T, L192T, G193R, Q195Y, V199R, T203S, K207R, K225T, K227S, K229P, F232R, W234D, D236E and V238R in I-OnuI (SEQ 5) or the I-OnuI variant specified in any of SEQ ID NOs: 13-14, their biologically active fragments and/or their additional variants.

В частных вариантах реализации вариант I-OnuI LHE, который связывает и расщепляет ген PD-1 человека, содержит аминокислотную последовательность, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90% или даже более предпочтительно по меньшей мере на 95% идентична аминокислотной последовательности, указанной в любой из SEQ ID NO: 6-14 и 60-63, или соответствующий биологически активный фрагмент.In particular embodiments, the I-OnuI LHE variant that binds and cleaves the human PD-1 gene contains an amino acid sequence that is at least 80%, preferably at least 85%, more preferably at least 90%, or even more preferably at least 95% identical to the amino acid sequence specified in any of SEQ ID NOs: 6-14 and 60-63, or the corresponding biologically active fragment.

В частных вариантах реализации вариант I-OnuI LHE содержит аминокислотную последовательность, представленную в любой из SEQ ID NO: 6-14 и 60-63, или соответствующий биологически активный фрагмент.In private embodiments, the I-OnuI LHE variant contains the amino acid sequence shown in any of SEQ ID NOs: 6-14 and 60-63, or a corresponding biologically active fragment.

В частных вариантах реализации вариант I-OnuI LHE содержит аминокислотную последовательность, представленную в SEQ ID NO: 6, или соответствующий биологически активный фрагмент.In private embodiments, the I-OnuI LHE variant contains the amino acid sequence shown in SEQ ID NO: 6 or a corresponding biologically active fragment.

В частных вариантах реализации вариант I-OnuI LHE содержит аминокислотную последовательность, представленную в SEQ ID NO: 7, или соответствующий биологически активный фрагмент.In private embodiments, the I-OnuI LHE variant contains the amino acid sequence shown in SEQ ID NO: 7 or a corresponding biologically active fragment.

В частных вариантах реализации вариант I-OnuI LHE содержит аминокислотную последовательность, представленную в SEQ ID NO: 8, или соответствующий биологически активный фрагмент.In private embodiments, the I-OnuI LHE variant contains the amino acid sequence shown in SEQ ID NO: 8 or a corresponding biologically active fragment.

В частных вариантах реализации вариант I-OnuI LHE содержит аминокислотную последовательность, представленную в SEQ ID NO: 9, или соответствующий биологически активный фрагмент.In private embodiments, the I-OnuI LHE variant contains the amino acid sequence shown in SEQ ID NO: 9 or a corresponding biologically active fragment.

В частных вариантах реализации вариант I-OnuI LHE содержит аминокислотную последовательность, представленную в SEQ ID NO: 10, или соответствующий биологически активный фрагмент.In private embodiments, the I-OnuI LHE variant contains the amino acid sequence shown in SEQ ID NO: 10 or a corresponding biologically active fragment.

В частных вариантах реализации вариант I-OnuI LHE содержит аминокислотную последовательность, представленную в SEQ ID NO: 11, или соответствующий биологически активный фрагмент.In private embodiments, the I-OnuI LHE variant contains the amino acid sequence shown in SEQ ID NO: 11 or a corresponding biologically active fragment.

В частных вариантах реализации вариант I-OnuI LHE содержит аминокислотную последовательность, представленную в SEQ ID NO: 12, или соответствующий биологически активный фрагмент.In private embodiments, the I-OnuI LHE variant contains the amino acid sequence shown in SEQ ID NO: 12 or a corresponding biologically active fragment.

В частных вариантах реализации вариант I-OnuI LHE содержит аминокислотную последовательность, представленную в SEQ ID NO: 13, или соответствующий биологически активный фрагмент.In private embodiments, the I-OnuI LHE variant contains the amino acid sequence shown in SEQ ID NO: 13 or a corresponding biologically active fragment.

В частных вариантах реализации вариант I-OnuI LHE содержит аминокислотную последовательность, представленную в SEQ ID NO: 14, или соответствующий биологически активный фрагмент.In private embodiments, the I-OnuI LHE variant contains the amino acid sequence shown in SEQ ID NO: 14 or a corresponding biologically active fragment.

В частных вариантах реализации вариант I-OnuI LHE содержит аминокислотную последовательность, представленную в SEQ ID NO: 60, или соответствующий биологически активный фрагмент.In private embodiments, the I-OnuI LHE variant contains the amino acid sequence shown in SEQ ID NO: 60 or a corresponding biologically active fragment.

В частных вариантах реализации вариант I-OnuI LHE содержит аминокислотную последовательность, представленную в SEQ ID NO: 61, или соответствующий биологически активный фрагмент.In private embodiments, the I-OnuI LHE variant contains the amino acid sequence shown in SEQ ID NO: 61 or a corresponding biologically active fragment.

В частных вариантах реализации вариант I-OnuI LHE содержит аминокислотную последовательность, представленную в SEQ ID NO: 62, или соответствующий биологически активный фрагмент.In private embodiments, the I-OnuI LHE variant contains the amino acid sequence shown in SEQ ID NO: 62 or a corresponding biologically active fragment.

В частных вариантах реализации вариант I-OnuI LHE содержит аминокислотную последовательность, представленную в SEQ ID NO: 63, или соответствующий биологически активный фрагмент.In private embodiments, the I-OnuI LHE variant contains the amino acid sequence shown in SEQ ID NO: 63 or a corresponding biologically active fragment.

MegaTALMegaTAL

В различных вариантах реализации megaTAL, содержащий вариант хоминг-эндонуклеазы, перепрограммирован для введения двухцепочечного разрыва (DSB) в сайт-мишень в гене PD-1. В частных вариантах реализации megaTAL вводит DSB в экзон 5 гена PD-1, предпочтительно в SEQ ID NO: 27 в экзон 5 гена PD-1 и более предпочтительно в последовательности «ATAC» в SEQ ID NO: 27 в экзон 5 гена PD-1. В частных вариантах реализации megaTAL вводит двухцепочечный разрыв в экзон 1 гена PD-1, предпочтительно в SEQ ID NO: 32 в экзон 1 гена PD-1, и более предпочтительно в последовательности «ATCC» в SEQ ID NO: 32 в экзон 1 гена PD-1. В частных вариантах реализации megaTAL вводит двухцепочечный разрыв в экзон 2 гена PD-1, предпочтительно в SEQ ID NO: 37 в экзон 2 гена PD-1 и более предпочтительно в последовательности «ACTT» в SEQ ID NO: 37 в экзон 2 гена PD-1.In various embodiments, megaTAL containing a homing endonuclease variant is reprogrammed to introduce a double strand break (DSB) at a target site in the PD-1 gene. In particular embodiments, megaTAL introduces DSB in exon 5 of the PD-1 gene, preferably in SEQ ID NO: 27 in exon 5 of the PD-1 gene, and more preferably in the "ATAC" sequence in SEQ ID NO: 27 in exon 5 of the PD-1 gene . In particular embodiments, megaTAL introduces a double strand break in exon 1 of the PD-1 gene, preferably in SEQ ID NO: 32 in exon 1 of the PD-1 gene, and more preferably in the "ATCC" sequence in SEQ ID NO: 32 in exon 1 of the PD gene -one. In particular embodiments, megaTAL introduces a double strand break in exon 2 of the PD-1 gene, preferably in SEQ ID NO: 37 in exon 2 of the PD-1 gene, and more preferably in the "ACTT" sequence in SEQ ID NO: 37 in exon 2 of the PD- gene. one.

Термин «megaTAL» относится к полипептиду, содержащему связывающий домен ДНК TALE и вариант хоминг-эндонуклеазы, который связывает и расщепляет последовательность-мишень ДНК в гене PD-1 и необязательно содержит один или более линкеров и/или дополнительных функциональных доменов, например, ферментативный домен конечного процессинга фермента, изменяющего структуру концов, который демонстрирует 5'-3'-экзонуклеазную, 5'-3'-щелочную экзонуклеазную, 3'-5'-экзонуклеазную (например, Trex2), 5'-flap-эндонуклеазную, геликазную, матрично-зависимую ДНК-полимеразную или матрично-независимую ДНК-полимеразную активность.The term "megaTAL" refers to a polypeptide comprising a TALE DNA binding domain and a homing endonuclease variant that binds and cleaves a target DNA sequence in the PD-1 gene and optionally contains one or more linkers and/or additional functional domains, e.g., an enzymatic domain final processing of an end-reversing enzyme that exhibits 5'-3'-exonuclease, 5'-3'-alkaline exonuclease, 3'-5'-exonuclease (e.g. Trex2), 5'-flap endonuclease, helicase, template -dependent DNA polymerase or template-independent DNA polymerase activity.

В частных вариантах реализации megaTAL может быть введен в клетку вместе с ферментом, изменяющий структуру концов, который демонстрирует 5'-3'-экзонуклеазную, 5'-3'-щелочную экзонуклеазную, 3'-5'-экзонуклеазную (например, Trex2), 5'-flap-эндонуклеазную, геликазную, матрично-зависимую ДНК-полимеразную или матрично-независимую ДНК-полимеразнную активность. MegaTAL и 3'-процессинговый фермент могут быть введены отдельно, например, в разных векторах или отдельных мРНК, или вместе, например, в виде слитого белок или в полицистронной конструкции, отделенной вирусным саморасщепляемым пептидом или элементом IRES.In particular embodiments, megaTAL can be introduced into the cell along with an end-reversing enzyme that exhibits a 5'-3'-exonuclease, 5'-3'-alkaline exonuclease, 3'-5'-exonuclease (e.g., Trex2), 5'-flap-endonuclease, helicase, template-dependent DNA polymerase or template-independent DNA polymerase activity. MegaTAL and the 3' processing enzyme can be administered separately, eg in separate vectors or separate mRNAs, or together, eg as a fusion protein or in a polycistronic construct separated by a viral self-cleaving peptide or IRES element.

«ДНК-связывающий домен TALE» - это ДНК-связывающая часть эффекторов, подобных активаторам транскрипции (TALE или TAL-эффекторы), которые имитируют транскрипционный активаторы растений для манипулирования транскриптомом растения (см., например, Kay et al., 2007. Science 318: 648-651). ДНК-связывающие домены TALE, рассматриваемые в частных вариантах реализации являются сконструированно сконструированными de novo или из естественных TALE, например, AvrBs3 из Xanthomonas campestris pv. vesicatoria, Xanthomonas gardneri, Xanthomonas translucens, Xanthomonas axonopodis, Xanthomonas perforans, Xanthomonas alfalfa, Xanthomonas citri, Xanthomonas euvesicatoria и Xanthomonas oryzae и brg11 и hpx17 из Ralstonia solanacearum. Иллюстративные примеры белков TALE для получения и конструирования ДНК-связывающих доменов раскрыты в патенте США №9019767 и цитированных в нем ссылках, все из которых включены в настоящее описание в качестве ссылки во всей их полноте.A "TALE DNA binding domain" is a DNA binding portion of transcription activator-like effectors (TALE or TAL effectors) that mimic plant transcription activators to manipulate the plant transcriptome (see, for example, Kay et al., 2007. Science 318 : 648-651). TALE DNA binding domains contemplated in particular embodiments are engineered de novo or from naturally occurring TALEs, eg AvrBs3 from Xanthomonas campestris pv. vesicatoria, Xanthomonas gardneri, Xanthomonas translucens, Xanthomonas axonopodis, Xanthomonas perforans, Xanthomonas alfalfa, Xanthomonas citri, Xanthomonas euvesicatoria and Xanthomonas oryzae and brg11 and hpx17 from Ralstonia solanacearum. Illustrative examples of TALE proteins for the production and construction of DNA binding domains are disclosed in US Pat. No. 9,019,767 and the references cited therein, all of which are incorporated herein by reference in their entirety.

В частных вариантах реализации megaTAL содержит ДНК-связывающий домен TALE, содержащий одну или более повторяющихся единиц, которые участвуют в связывании ДНК-связывающего домена TALE с соответствующей последовательностью ДНК-мишени. Одна «повторяющаяся единица» (также называемая «повтор») обычно имеет длину 33-35 аминокислот.Каждая повторяющаяся единица ДНК-связывающего домена TALE содержит 1 или 2 ДНК-связывающих остатка, составляющих вариабельный ди-остаток повторения (RVD), обычно в положениях 12 и/или 13 повтора. Естественный (канонический) код для распознавания ДНК этих ДНК-связывающих доменов TALE был определен таким образом, что последовательность HD в положениях 12 и 13 приводит к связыванию с цитозином (C), NG связывается с T, NI с A, NN связывается с G или A, и NG связывается с T. В некоторых случаях предусмотрены неканонические (нетипичные) RVD.In particular embodiments, megaTAL comprises a TALE DNA binding domain containing one or more repeat units that are involved in binding the TALE DNA binding domain to the corresponding target DNA sequence. A single "repeating unit" (also called a "repeat") is typically 33-35 amino acids long. Each repeating unit of the TALE DNA-binding domain contains 1 or 2 DNA-binding residues constituting a repeat variable di-residue (RVD), usually at positions 12 and/or 13 repetitions. The natural (canonical) code for DNA recognition of these TALE DNA-binding domains has been defined such that the HD sequence at positions 12 and 13 results in binding to cytosine (C), NG binds to T, NI to A, NN binds to G, or A, and NG binds to T. In some cases, non-canonical (atypical) RVDs are provided.

Иллюстративные примеры неканонических RVD, подходящих для использования в конкретных megaTAL, рассмотренных в частных вариантах реализации включают, среди прочего, HH, KH, NH, NK, NQ, RH, RN, SS, NN, SN, KN для распознавания гуанина (G); NI, KI, RI, HI, SI для распознавания аденина (A); NG, HG, KG, RG для распознавания тимина (T); RD, SD, HD, ND, KD, YG для распознавания цитозина (C); NV, HN для распознавания A или G; и H*, HA, KA, N*, NA, NC, NS, RA, S* для распознавания A или T или G или C, где (*) означает, что аминокислота в положении 13 отсутствует.Дополнительные иллюстративные примеры RVD, подходящих для использования, в частности, в megaTAL, рассматриваемых в частных вариантах реализации дополнительно включают в себя примеры, приведенные в патенте США №8614092, который включен посредством ссылки во всей своей полноте.Illustrative examples of non-canonical RVDs suitable for use in specific megaTALs discussed in particular embodiments include, among others, HH, KH, NH, NK, NQ, RH, RN, SS, NN, SN, KN for guanine (G) recognition; NI, KI, RI, HI, SI for adenine recognition (A); NG, HG, KG, RG for thymine recognition (T); RD, SD, HD, ND, KD, YG for cytosine recognition (C); NV, HN for A or G recognition; and H*, HA, KA, N*, NA, NC, NS, RA, S* for A or T or G or C recognition, where (*) means that the amino acid at position 13 is missing. for use in particular in megaTAL, considered in particular implementation options further include the examples given in US patent No. 8614092, which is incorporated by reference in its entirety.

В частных вариантах реализации megaTAL, рассматриваемый в настоящей заявке, содержит ДНК-связывающий домен TALE, содержащий от 3 до 30 повторяющихся единиц. В некоторых случаях megaTAL состоит из 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 повторяющихся единиц ДНК-связывающего домена TALE. В предпочтительном варианте реализации megaTAL, рассматриваемый в настоящей заявке, содержит связывающий домен ДНК TALE, содержащий 5-15 повторяющихся единиц, более предпочтительно, 7-15 повторяющихся единиц, более предпочтительно, 9-15 повторяющихся единиц, и, более предпочтительно, 9, 10, 11, 12, 13, 14 или 15 повторяющихся единиц.In private embodiments, the megaTAL discussed in this application contains a TALE DNA-binding domain containing from 3 to 30 repeating units. In some cases, megaTAL consists of 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, or 30 repeat units of the TALE DNA-binding domain. In a preferred embodiment, the implementation of megaTAL, considered in this application, contains a DNA binding domain TALE containing 5-15 repeat units, more preferably 7-15 repeat units, more preferably 9-15 repeat units, and more preferably 9, 10 , 11, 12, 13, 14 or 15 repeating units.

В частных вариантах реализации megaTAL, рассматриваемый в настоящей заявке, содержит ДНК-связывающий домен TALE, содержащий от 3 до 30 повторяющихся единиц, и дополнительную одиночную усеченную повторяющуюся единицу TALE, содержащую 20 аминокислот, расположенных на С-конце набора повторяющихся единиц TALE, т.е. дополнительную повторяющуюся единицу С-концевого пол-ДНК-связывающего домена TALE (аминокислоты от -20 до -1 С-кэп, раскрытые ниже в настоящей заявке). Таким образом, рассматриваемый в настоящей заявке megaTAL содержит ДНК-связывающий домен TALE, содержащий от 3,5 до 30,5 повторяющихся единиц. В некоторых случаях megaTAL содержит 3,5, 4,5, 5,5, 6,5, 7,5, 8,5, 9,5, 10,5, 11,5, 12,5, 13,5, 14,5, 15,5, 16,5, 17,5, 18,5, 19,5, 20,5, 21,5, 22,5, 23,5, 24,5, 25,5, 26,5, 27,5, 28,5, 29,5 или 30,5 повторяющихся единиц ДНК-связывающего домена TALE. В предпочтительном варианте реализации megaTAL, рассматриваемый в настоящей заявке, содержит ДНК-связывающий домен TALE, содержащий 5,5-15,5 повторяющихся единиц, более предпочтительно 7,5-15,5 повторяющихся единиц, более предпочтительно 9,5-15,5 повторяющихся единиц и более предпочтительно 9,5, 10,5, 11,5, 12,5, 13,5, 14,5 или 15,5 повторяющихся единиц.In particular embodiments, the megaTAL considered in this application contains a TALE DNA-binding domain containing from 3 to 30 repeat units, and an additional single truncated TALE repeat unit containing 20 amino acids located at the C-terminus of the TALE repeat unit set, i.e. e. an additional repeating unit of the C-terminal half-DNA-binding domain of TALE (amino acids from -20 to -1 C-cap, disclosed below in this application). Thus, considered in this application megaTAL contains a DNA-binding domain TALE containing from 3.5 to 30.5 repeating units. In some cases, megaTAL contains 3.5, 4.5, 5.5, 6.5, 7.5, 8.5, 9.5, 10.5, 11.5, 12.5, 13.5, 14 .5, 15.5, 16.5, 17.5, 18.5, 19.5, 20.5, 21.5, 22.5, 23.5, 24.5, 25.5, 26.5 , 27.5, 28.5, 29.5, or 30.5 repeat units of the TALE DNA-binding domain. In a preferred embodiment, the implementation of megaTAL, considered in this application, contains a TALE DNA-binding domain containing 5.5-15.5 repeat units, more preferably 7.5-15.5 repeat units, more preferably 9.5-15.5 repeating units and more preferably 9.5, 10.5, 11.5, 12.5, 13.5, 14.5 or 15.5 repeating units.

В частных вариантах реализации megaTAL содержит эффекторную структуру TAL, содержащую полипептид «N-концевой домен (NTD)», один или более повторяющихся доменов/единиц TALE, полипептид «C-концевой домен (CTD)» и вариант хоминг-эндонуклеазы. В некоторых вариантах реализации NTD, повторы TALE и/или домены CTD принадлежат к одному и тому же биологическому виду. В других вариантах реализации один или более доменов NTD, TALE и/или CTD относятся к разным видам.In particular embodiments, megaTAL comprises a TAL effector structure comprising an N-terminal domain (NTD) polypeptide, one or more TALE repeat domains/units, a C-terminal domain (CTD) polypeptide, and a homing endonuclease variant. In some embodiments of the NTD, the TALE repeats and/or the CTD domains belong to the same species. In other embodiments, one or more of the NTD, TALE, and/or CTD domains are of different species.

Используемый в настоящей заявке термин «полипептид N-концевого домена (NTD)» относится к последовательности, которая фланкирует N-концевой участок или фрагмент встречающегося в природе ДНК-связывающего домена TALE. Последовательность NTD, если она присутствует, может иметь любую длину, пока повторяющиеся единицы ДНК-связывающего домена TALE сохраняют способность связывать ДНК. В частных вариантах реализации полипептид NTD содержит по меньшей мере от 120 до по меньшей мере 140 или более аминокислот, N-концевых по отношению к ДНК-связывающему домену TALE (0 представляет собой аминокислоту 1 большинства N-концевых повторяющихся единиц). В частных вариантах реализации полипептид NTD содержит по меньшей мере приблизительно 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139 или по меньшей мере 140 аминокислот, N-концевых к ДНК-связывающему домену TALE. В одном варианте реализации megaTAL, рассматриваемый в настоящей заявке, содержит полипептид NTD по меньшей мере с приблизительно аминокислотами от+1 до+122 и по меньшей мере приблизительно от+1 до+137 белка TALE Xanthomonas (0 представляет собой аминокислоту 1 наиболее N-концевой повторяющейся единицы). В частных вариантах реализации полипептид NTD содержит по меньшей мере приблизительно 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136 или 137 аминокислот, N-концевых по отношению к ДНК-связывающему домену TALE белка TALE Xanthomonas. В одном варианте реализации megaTAL, рассматриваемый в настоящей заявке, содержит полипептид NTD по меньшей мере с аминокислотами от+1 до+121 белка TALE Ralstonia (0 представляет собой аминокислоту 1 наиболее N-концевой повторяющейся единицы). В частных вариантах реализации полипептид NTD содержит по меньшей мере приблизительно 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136 или 137 аминокислот, N-концевых по отношению к ДНК-связывающему домену TALE белка TALE Ralstonia.As used herein, the term "N-terminal domain (NTD) polypeptide" refers to a sequence that flanks the N-terminal region or fragment of the naturally occurring DNA-binding domain of TALE. The NTD sequence, if present, may be of any length, as long as the repeat units of the TALE DNA-binding domain retain the ability to bind DNA. In particular embodiments, the NTD polypeptide contains at least 120 to at least 140 or more amino acids N-terminal to the TALE DNA-binding domain (0 is amino acid 1 of most N-terminal repeat units). In particular embodiments, the NTD polypeptide comprises at least about 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139 or at least 140 amino acids N-terminal to the DNA-binding domain of TALE. In one embodiment, megaTAL as contemplated herein comprises an NTD polypeptide with at least about +1 to +122 amino acids and at least about +1 to +137 amino acids of the Xanthomonas TALE protein (0 is amino acid 1 of the most N-terminal repeating unit). In particular embodiments, the NTD polypeptide contains at least about 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, or 137 amino acids N-terminal to DNA-binding domain TALE of the Xanthomonas TALE protein. In one embodiment, megaTAL as contemplated herein comprises an NTD polypeptide with at least amino acids +1 to +121 of the Ralstonia TALE protein (0 is amino acid 1 of the most N-terminal repeat unit). In particular embodiments, the NTD polypeptide contains at least about 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, or 137 amino acids, N-terminal relation to the DNA-binding domain TALE of the Ralstonia TALE protein.

Используемый в настоящей заявке термин «полипептид С-концевого домена (CTD)» относится к последовательности, которая фланкирует С-концевой участок или фрагмент встречающегося в природе ДНК-связывающего домена TALE. Последовательность CTD, если она присутствует, может иметь любую длину до тех пор, пока повторяющиеся единицы TALE ДНК-связывающего домена сохраняют способность связывать ДНК. В частных вариантах реализации полипептид CTD содержит по меньшей мере от 20 до по меньшей мере 85 или более аминокислот, С-концевых по отношению к последнему полному повтору ДНК-связывающего домена TALE (первые 20 аминокислот представляют собой полу-повторяющуюся единицу, С-концевую к последней полной С-концевой повторяющейся единице). В частных вариантах реализации полипептид CTD содержит по меньшей мере приблизительно 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 443, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, или по меньшей мере 85 аминокислот, С-концевых по отношению к последнему полному повтору ДНК-связывающего домена TALE. В одном варианте реализации megaTAL, рассматриваемый в настоящей заявке, содержит полипептид CTD, содержащий по меньшей мере аминокислоты приблизительно от -20 до -1 белка TALE Xanthomonas (-20 представляет собой аминокислоту 1 полу-повторяющейся единицы, С-концевую к последней полной С-концевой повторяющейся единице). В частных вариантах реализации полипептид CTD содержит по меньшей мере приблизительно 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, или 1 аминокислоту, С-концевых по отношению к последнему полному повтору ДНК-связывающего домена TALE белка Xanthomonas. В одном варианте реализации megaTAL, рассматриваемый в настоящей заявке, содержит полипептид CTD, содержащий по меньшей мере аминокислоты приблизительно от -20 до -1 белка TALE Ralstonia (-20 представляет собой аминокислоту 1 полу-повторяющейся единицы, С-концевую к последней полной С-концевой повторяющейся единице). В частных вариантах реализации полипептид CTD содержит по меньшей мере приблизительно 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, или 1 аминокислоту, С-концевую к последнему полному повтору ДНК-связывающего домена TALE белка TALE Ralstonia.As used herein, the term "C-terminal domain (CTD) polypeptide" refers to a sequence that flanks the C-terminal region or fragment of the naturally occurring DNA-binding domain of TALE. The CTD sequence, if present, may be of any length as long as the TALE repeat units of the DNA binding domain retain the ability to bind DNA. In particular embodiments, the CTD polypeptide contains at least 20 to at least 85 or more amino acids C-terminal to the last complete repeat of the TALE DNA-binding domain (the first 20 amino acids are a semi-repeating unit, C-terminal to last complete C-terminal repeat unit). In particular embodiments, the CTD polypeptide contains at least about 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 , 40, 41, 42, 443, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 , 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, or at least 85 amino acids, C- terminal with respect to the last complete repeat of the TALE DNA-binding domain. In one embodiment, the implementation of megaTAL, considered in this application, contains a CTD polypeptide containing at least amino acids approximately from -20 to -1 of the Xanthomonas TALE protein (-20 is amino acid 1 of the semi-repeating unit, C-terminal to the last complete C- terminal repeating unit). In particular embodiments, the CTD polypeptide contains at least about 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, or 1 amino acid, C-terminal to the last complete repeat of the Xanthomonas TALE DNA-binding domain. In one embodiment, the implementation of megaTAL, considered in this application, contains a CTD polypeptide containing at least amino acids approximately from -20 to -1 of the Ralstonia TALE protein (-20 is amino acid 1 of the semi-repeating unit, C-terminal to the last complete C- terminal repeating unit). In particular embodiments, the CTD polypeptide contains at least about 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, or 1 amino acid, C-terminal to the last complete repeat of the TALE DNA-binding domain of the Ralstonia TALE protein.

В частных вариантах реализации megaTAL, рассматриваемый в настоящей заявке, содержит слитый полипептид, содержащий ДНК-связывающий домен TALE, сконструированный для связывания последовательности-мишени, хоминг-эндонуклеазу, перепрограммированную для связывания и расщепления последовательности-мишени, и, необязательно, полипептид NTD и/или CTD, необязательно связанные друг с другом одним или несколькими линкерными полипептидами, рассматриваемыми в другом месте настоящей заявки. Без привязки к какой-либо конкретной теории, предполагается, что megaTAL, содержащий ДНК-связывающий домен TALE и, необязательно, полипептид NTD и/или CTD, слит с линкерным полипептидом, который затем слит с вариантом хоминг-эндонуклеазы. Таким образом, ДНК-связывающий домен TALE связывает последовательность-мишень ДНК, которая находится в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15 нуклеотидов от последовательности-мишени, связанной ДНК-связывающим доменом варианта хоминг-эндонуклеазы. Таким образом, рассматриваемые в настоящей заявке megaTAL увеличивают специфичность и эффективность редактирования генома.In private embodiments, the megaTAL discussed in this application contains a fusion polypeptide containing a TALE DNA-binding domain designed to bind a target sequence, a homing endonuclease reprogrammed to bind and cleave the target sequence, and optionally an NTD polypeptide and/ or CTD optionally linked to each other by one or more linker polypeptides discussed elsewhere in this application. Without wishing to be bound by any particular theory, it is believed that megaTAL containing the TALE DNA binding domain and optionally an NTD and/or CTD polypeptide is fused to a linker polypeptide which is then fused to a homing endonuclease variant. Thus, the TALE DNA-binding domain binds a DNA target sequence that is within 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, or 15 nucleotides of the sequence target bound by the DNA-binding domain of the homing endonuclease variant. Thus, the megaTALs contemplated herein increase the specificity and efficiency of genome editing.

В одном варианте реализации megaTAL содержит вариант хоминг-эндонуклеазы и ДНК-связывающий домен TALE, который связывает нуклеотидную последовательность, которая находится в пределах приблизительно 2, 3, 4, 5 или 6 нуклеотидов, предпочтительно, на 2 или 4 нуклеотида в направлении против хода транскрипции от сайта связывания перепрограммированной хоминг-эндонуклеазы.In one embodiment, megaTAL contains a homing endonuclease variant and a TALE DNA binding domain that binds a nucleotide sequence that is within about 2, 3, 4, 5, or 6 nucleotides, preferably 2 or 4 nucleotides upstream. from the binding site of the reprogrammed homing endonuclease.

В одном варианте реализации, megaTAL содержит вариант хоминг- эндонуклеазы и ДНК-связывающий домен TALE, который связывает нуклеотидную последовательность, указанную в SEQ ID NO: 26, которая находится на расстоянии 5 нуклеотидов в направлении против хода транскрипции нуклеотидной последовательности, связанной и расщепленной вариантом хоминг-эндонуклеазы (SEQ ID NO: 25). В предпочтительных вариантах реализации последовательность-мишень megaTAL представляет собой SEQ ID NO: 27.In one embodiment, megaTAL comprises a homing endonuclease variant and a TALE DNA binding domain that binds the nucleotide sequence shown in SEQ ID NO: 26, which is 5 nucleotides upstream of the nucleotide sequence linked and cleaved by the homing variant. -endonuclease (SEQ ID NO: 25). In preferred embodiments, the megaTAL target sequence is SEQ ID NO: 27.

В одном варианте реализации, megaTAL содержит вариант хоминг- эндонуклеазы и ДНК-связывающий домен TALE, который связывает нуклеотидную последовательность, указанную в SEQ ID NO: 31, которая находится на расстоянии 2 нуклеотида в направлении против транскрипции от нуклеотидной последовательности, связанной и расщепленной вариантом хоминг-эндонуклеазы (SEQ ID NO: 30). В предпочтительных вариантах реализации последовательность-мишень megaTAL представляет собой SEQ ID NO: 32.In one embodiment, megaTAL contains a homing endonuclease variant and a TALE DNA binding domain that binds the nucleotide sequence shown in SEQ ID NO: 31, which is 2 nucleotides upstream from the nucleotide sequence bound and cleaved by the homing variant. -endonuclease (SEQ ID NO: 30). In preferred embodiments, the megaTAL target sequence is SEQ ID NO: 32.

В одном варианте реализации, megaTAL содержит вариант хоминг- эндонуклеазы и ДНК-связывающий домен TALE, который связывает нуклеотидную последовательность, указанную в SEQ ID NO: 36, которая находится на расстоянии 5 нуклеотидов в направлении против транскрипции от нуклеотидной последовательности, связанной с нуклеотидной последовательностью, связанной и расщепленной вариантом хоминг-эндонуклеазы (SEQ ID NO: 35). В предпочтительных вариантах реализации целевая последовательность megaTAL представляет собой SEQ ID NO: 37.In one embodiment, megaTAL contains a homing endonuclease variant and a TALE DNA binding domain that binds the nucleotide sequence shown in SEQ ID NO: 36, which is 5 nucleotides upstream of the nucleotide sequence associated with the nucleotide sequence, associated and cleaved variant of homing endonuclease (SEQ ID NO: 35). In preferred embodiments, the megaTAL target sequence is SEQ ID NO: 37.

В частных вариантах реализации megaTAL, рассматриваемый в настоящей заявке, содержит одну или более повторяющихся единиц ДНК-связывающего TALE и вариант LHE, сконструированный или перепрограммированный из LHE, выбранной из группы, состоящей из: I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-ScuMI, I-SmaMI, I-SscMI, I-Vdi141I и их варианты или предпочтительно I-CpaMI, I-HjeMI, I-OnuI, I-PanMI, SmaMI и их варианты или, более предпочтительно, I-OnuI и его варианты.In private embodiments, the implementation of megaTAL, considered in this application, contains one or more repeating units of DNA-binding TALE and an LHE variant constructed or reprogrammed from an LHE selected from the group consisting of: I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I- GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-ScuMI, I- SmaMI, I-SscMI, I-Vdi141I and variants thereof, or preferably I-CpaMI, I-HjeMI, I-OnuI, I-PanMI, SmaMI and variants thereof, or more preferably I-OnuI and variants thereof.

В частных вариантах реализации megaTAL рассматриваемый в настоящей заявке, содержит NTD, одну или более повторяющихся единиц ДНК-связывающего TALE, CTD и вариант LHE, выбранный из группы, состоящей из: I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-ScuMI, I-SmaMI, I-SscMI, I-Vdi141I и их варианты или предпочтительно I-CpaMI, I-HjeMI, I-OnuI, I-PanMI, SmaMI и их варианты, или более предпочтительно I-OnuI и его варианты.In private embodiments, the implementation of megaTAL considered in this application contains NTD, one or more repeating units of DNA-binding TALE, CTD and an LHE variant selected from the group consisting of: I-AabMI, I-AaeMI, I-AniI, I-ApaMI , I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I -GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI , I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-ScuMI, I-SmaMI, I -SscMI, I-Vdi141I and variants thereof, or preferably I-CpaMI, I-HjeMI, I-OnuI, I-PanMI, SmaMI and variants thereof, or more preferably I-OnuI and variants thereof.

В частных вариантах реализации megaTAL, рассматриваемый в настоящей заявке, содержит NTD, от приблизительно 9,5 до приблизительно 15,5 повторяющихся единиц ДНК-связывающего TALE, и вариант LHE, выбранный из группы, состоящей из: I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I-EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I-ScuMI, I-SmaMI, I-SscMI, I-Vdi141I и их варианты или предпочтительно I-CpaMI, I-HjeMI, I-OnuI, I-PanMI, SmaMI и их варианты, или более предпочтительно I-OnuI и его варианты.In private embodiments, the implementation of megaTAL, considered in this application, contains NTD, from about 9.5 to about 15.5 repeating units of DNA-binding TALE, and an LHE variant selected from the group consisting of: I-AabMI, I-AaeMI, I-AniI, I-ApaMI, I-CapIII, I-CapIV, I-CkaMI, I-CpaMI, I-CpaMII, I-CpaMIII, I-CpaMIV, I-CpaMV, I-CpaV, I-CraMI, I- EjeMI, I-GpeMI, I-GpiI, I-GzeMI, I-GzeMII, I-GzeMIII, I-HjeMI, I-LtrII, I-LtrI, I-LtrWI, I-MpeMI, I-MveMI, I-NcrII, I-Ncrl, I-NcrMI, I-OheMI, I-OnuI, I-OsoMI, I-OsoMII, I-OsoMIII, I-OsoMIV, I-PanMI, I-PanMII, I-PanMIII, I-PnoMI, I- ScuMI, I-SmaMI, I-SscMI, I-Vdi141I and variants thereof, or preferably I-CpaMI, I-HjeMI, I-OnuI, I-PanMI, SmaMI and variants thereof, or more preferably I-OnuI and variants thereof.

В частных вариантах реализации MegaTAL, рассматриваемый в настоящей заявке, содержит NTD длиной от приблизительно 122 аминокислот до 137 аминокислот, приблизительно 9,5, приблизительно 10,5, приблизительно 11,5, приблизительно 12,5, приблизительно 13,5, приблизительно 14,5 или приблизительно 15,5 повторяющихся единиц связывания, CTD длиной от приблизительно 20 аминокислот до приблизительно 85 аминокислот и вариант LHE I-OnuI. В частных вариантах реализации любой из, два из или все из NTD, ДНК-связывающего домена и CTD могут быть сконструированы из одного и того же биологического вида или разных видов в любой подходящей комбинации.In particular embodiments, the implementation of MegaTAL, considered in this application, contains NTD length from about 122 amino acids to 137 amino acids, about 9.5, about 10.5, about 11.5, about 12.5, about 13.5, about 14, 5 or about 15.5 repeat binding units, a CTD of about 20 amino acids to about 85 amino acids in length, and an LHE I-OnuI variant. In particular embodiments, any, two or all of the NTD, DNA binding domain, and CTD may be constructed from the same species or from different species in any suitable combination.

В частных вариантах реализации megaTAL, рассматриваемый в настоящей заявке, содержит аминокислотную последовательность, указанную в любой из SEQ ID NO: 15-23 и 64.In private embodiments, the implementation of megaTAL, considered in this application, contains the amino acid sequence specified in any of SEQ ID NOS: 15-23 and 64.

В некоторых вариантах реализации megaTAL, рассматриваемый в настоящей заявке, закодирован последовательностью мРНК, представленной в любой из SEQ ID NO: 40-42 и 65-68.In some embodiments, the implementation of megaTAL, considered in this application, is encoded by the mRNA sequence presented in any of SEQ ID NO: 40-42 and 65-68.

В частных вариантах реализации рассматриваемый в настоящей заявке слитый белок megaTAL-Trex2 содержит аминокислотную последовательность, представленную в SEQ ID NO: 24.In particular embodiments, the megaTAL-Trex2 fusion protein of this application comprises the amino acid sequence shown in SEQ ID NO: 24.

В некоторых вариантах реализации megaTAL содержит ДНК-связывающий домен TALE, а вариант LHE I-OnuI связывает и расщепляет нуклеотидную последовательность, указанную в SEQ ID NO: 27. В частных вариантах реализации megaTAL, который связывает и расщепляет нуклеотидную последовательность, указанную в SEQ ID. NO: 27 содержит аминокислотную последовательность, представленную в любой из SEQ ID NO: 15-19.In some embodiments, megaTAL contains the TALE DNA-binding domain and the LHE I-OnuI variant binds and cleaves the nucleotide sequence shown in SEQ ID NO: 27. In particular embodiments, megaTAL that binds and cleaves the nucleotide sequence shown in SEQ ID. NO: 27 contains the amino acid sequence shown in any of SEQ ID NOs: 15-19.

В некоторых вариантах реализации megaTAL содержит ДНК-связывающий домен TALE, а вариант I-OnuI LHE связывает и расщепляет нуклеотидную последовательность, указанную в SEQ ID NO: 32. В частных вариантах реализации megaTAL, который связывает и расщепляет нуклеотидную последовательность, указанную в SEQ ID NO: 32, содержит аминокислотную последовательность, представленную в любой из SEQ ID NO: 20-21 и 64.In some embodiments, megaTAL contains the TALE DNA-binding domain and the I-OnuI LHE variant binds and cleaves the nucleotide sequence shown in SEQ ID NO: 32. In particular embodiments, megaTAL that binds and cleaves the nucleotide sequence shown in SEQ ID NO: : 32, contains the amino acid sequence shown in any of SEQ ID NOs: 20-21 and 64.

В некоторых вариантах реализации megaTAL содержит ДНК-связывающий домен TALE, а вариант LHE I-OnuI связывает и расщепляет нуклеотидную последовательность, указанную в SEQ ID NO: 37. В частных вариантах реализации megaTAL связывает и расщепляет нуклеотидную последовательность, указанную в SEQ ID. NO: 37, содержит аминокислотную последовательность, представленную в любой из SEQ ID NO: 22-23.In some embodiments, megaTAL contains the TALE DNA-binding domain and the LHE I-OnuI variant binds and cleaves the nucleotide sequence shown in SEQ ID NO: 37. In particular embodiments, megaTAL binds and cleaves the nucleotide sequence shown in SEQ ID. NO: 37 contains the amino acid sequence shown in any of SEQ ID NOs: 22-23.

2. Ферменты, изменяющие структуру концов2. Enzymes that change the structure of the ends

Композиции и способы редактирования генома, рассматриваемые в частных вариантах реализации включают редактирование клеточных геномов с использованием варианта нуклеазы и одной или нескольких копий фермента, изменяющего структуру концов. В частных вариантах реализации один полинуклеотид кодирует вариант хоминг-эндонуклеазы и фермент, изменяющий структуру концов, разделенные линкером, саморасщепляемой пептидной последовательностью, например, последовательностью 2A, или последовательностью IRES. В частных вариантах реализации композиции для редактирования генома содержат полинуклеотид, кодирующий вариант нуклеазы, и отдельный полинуклеотид, кодирующий фермент, изменяющий структуру концов. В частных вариантах реализации композиции для редактирования генома содержат полинуклеотид, кодирующий фермент варианта хоминг-эндонуклеазы, изменяющий структуру концов одного слитого полипептида, в дополнение к тандемной копии фермента, изменяющего структуру концов, разделенные саморасщепляемым пептидом.Genome editing compositions and methods contemplated in particular embodiments include editing cellular genomes using a variant nuclease and one or more copies of an end-altering enzyme. In particular embodiments, one polynucleotide encodes a homing endonuclease variant and a restructuring enzyme separated by a linker, a self-cleaving peptide sequence, such as a 2A sequence, or an IRES sequence. In particular embodiments, genome-editing compositions comprise a polynucleotide encoding a nuclease variant and a single polynucleotide encoding an end-reshaping enzyme. In particular embodiments, the genome editing compositions comprise a polynucleotide encoding a homing endonuclease variant enzyme that restructures the ends of a single fusion polypeptide, in addition to a tandem copy of the restructuring enzyme separated by a self-cleaving peptide.

Термин «фермент, изменяющий структуру концов» относится к ферменту, который модифицирует открытые концы полинуклеотидной цепи. Полинуклеотид может представлять собой двухцепочечную ДНК (дцДНК), одноцепочечную ДНК (оцДНК), РНК, двухцепочечные гибриды ДНК и РНК и синтетическую ДНК (например, содержащие основания, отличные от A, C, G и T). Фермент, изменяющий положение концов, может модифицировать открытые концы полинуклеотидной цепи путем добавления одного или нескольких нуклеотидов, удаления одного или нескольких нуклеотидов, удаления или модификации фосфатной группы и/или удаления или модификации гидроксильной группы. Фермент, изменяющий расположение концов, может модифицировать концы на сайтах разреза эндонуклеазой или на концах, создаваемых другими химическими или механическими средствами, такими как сдвиг (например, посредством прохождения через иглу малого калибра, нагревание, обработка ультразвуком, обработка в барабане с мини-шариками и распыление), ионизирующее излучение, ультрафиолетовое излучение, кислородные радикалы, химический гидролиз и химиотерапевтические агенты.The term "end restructuring enzyme" refers to an enzyme that modifies the open ends of a polynucleotide chain. The polynucleotide can be double-stranded DNA (dsDNA), single-stranded DNA (ssDNA), RNA, double-stranded DNA/RNA hybrids, and synthetic DNA (eg, those containing bases other than A, C, G, and T). An end-reversing enzyme can modify the open ends of a polynucleotide chain by adding one or more nucleotides, removing one or more nucleotides, removing or modifying a phosphate group, and/or removing or modifying a hydroxyl group. The end-reversing enzyme can modify the ends at endonuclease cut sites or at ends created by other chemical or mechanical means such as shearing (e.g., through a fine needle, heat, sonication, mini-bead drumming, and spray), ionizing radiation, ultraviolet radiation, oxygen radicals, chemical hydrolysis and chemotherapeutic agents.

В частных вариантах реализации композиции и способы редактирования генома, рассматриваемые в частных вариантах реализации включают редактирование клеточных геномов с использованием варианта хоминг-эндонуклеазы или megaTAL и фермента, изменяющего структуру концов ДНК.In particular embodiments, genome editing compositions and methods contemplated in particular embodiments include editing cellular genomes using a variant of homing endonuclease or megaTAL and a DNA end restructuring enzyme.

Термин «фермент, изменяющий структуру концов ДНК» относится к ферменту, который модифицирует открытые концы ДНК. Фермент, изменяющий структуру концов ДНК, может модифицировать тупые концы или ступенчатые концы («липкие» 5'- или 3'-концы). Фермент ДНК, изменяющий структуру концов, может модифицировать одноцепочечную или двухцепочечную ДНК. Фермент, изменяющий структуру концов ДНК, может модифицировать концы на сайтах разреза эндонуклеазой или на концах, генерируемых другими химическими или механическими средствами, такими как сдвиг (например, сдвиг (например, посредством прохождения через иглу малого калибра, нагревание, обработка ультразвуком, обработка в барабане с мини-шариками и распыление), ионизирующее излучение, ультрафиолетовое излучение, кислородные радикалы, химический гидролиз и химиотерапевтические агенты. ДНК-фермент, изменяющий структуру концов, может модифицировать открытые концы ДНК, добавляя один или более нуклеотидов, удаляя один или более нуклеотидов, удаляя или модифицируя фосфатную группу и/или удаляя или модифицируя гидроксильную группу.The term "DNA end restructuring enzyme" refers to an enzyme that modifies the open ends of DNA. An enzyme that restructures DNA ends can modify blunt ends or stepped ends ("sticky" 5' or 3' ends). The DNA end restructuring enzyme can modify single-stranded or double-stranded DNA. The DNA end restructuring enzyme can modify the ends at endonuclease cut sites or at ends generated by other chemical or mechanical means, such as shearing (e.g., shearing (e.g., by passing through a fine needle, heat, sonication, drumming). beads and spray), ionizing radiation, ultraviolet radiation, oxygen radicals, chemical hydrolysis, and chemotherapeutic agents.DNA end-reshaping enzyme can modify the open ends of DNA by adding one or more nucleotides, deleting one or more nucleotides, removing or modifying the phosphate group and/or removing or modifying the hydroxyl group.

Иллюстративные примеры ферментов, изменяющих структуру концов ДНК, подходящих для применения в частных вариантах реализации, рассматриваемые в настоящей заявке, включают, среди прочего: 5'-3' экзонуклеазы, 5'-3' щелочные экзонуклеазы, 3'-5' экзонуклеазы, 5' flap-эндонуклеазы, геликазы, фосфатазы, гидролазы и матрично-независимые ДНК-полимеразы.Illustrative examples of DNA end restructuring enzymes suitable for use in particular embodiments contemplated herein include, but are not limited to: 5'-3' exonucleases, 5'-3' alkaline exonucleases, 3'-5' exonucleases, 5 'flap endonucleases, helicases, phosphatases, hydrolases, and template-independent DNA polymerases.

Другие иллюстративные примеры ферментов, изменяющих структуру концов ДНК, подходящих для применения в частных вариантах реализации, рассматриваемые в настоящей заявке, включают, среди прочего, Trex2, Trex1, Trex1 без трансмембранного домена, Apollo, Artemis, DNA2, Exo1, ExoT, ExoIII, Fen1, Fan1, MreII, Rad2, Rad9, TdT (терминальная дезоксинуклеотидилтрансфераза), PNKP, RecE, RecJ, RecQ, лямбда-экзонуклеаза, Sox, ДНК-полимераза Vaccinia, экзонуклеаза I, экзонуклеаза III, экзонуклеаза VII, NDK1, NDK5, NDK7, NDR, NDR7, NRK T7-экзонуклеаза Gene 6, белок интеграции вируса миелобластоза птиц (IN), Bloom, антарктическая фосфатаза, щелочная фосфатаза, полинуклеотидкиназа (PNK), ApeI, нуклеаза бобов мунг, Hex1, TTRAP (TDP2), Sgs1, Sae2, CUP, Pol мю, Pol лямбда, MUS81, EME1, EME2, SLX1, SLX4 и UL-12.Other illustrative examples of DNA end restructuring enzymes suitable for use in particular embodiments contemplated herein include, but are not limited to, Trex2, Trex1, Trex1 without a transmembrane domain, Apollo, Artemis, DNA2, Exo1, ExoT, ExoIII, Fen1 , Fan1, MreII, Rad2, Rad9, TdT (terminal deoxynucleotidyl transferase), PNKP, RecE, RecJ, RecQ, lambda exonuclease, Sox, Vaccinia DNA polymerase, exonuclease I, exonuclease III, exonuclease VII, NDK1, NDK5, NDK7, NDR , NDR7, NRK T7 exonuclease Gene 6, avian myeloblastosis virus (IN) integration protein, Bloom, Antarctic phosphatase, alkaline phosphatase, polynucleotide kinase (PNK), ApeI, mung bean nuclease, Hex1, TTRAP (TDP2), Sgs1, Sae2, CUP , Pol Mu, Pol Lambda, MUS81, EME1, EME2, SLX1, SLX4 and UL-12.

В частных вариантах реализации композиции для редактирования генома и способы редактирования клеточных геномов, рассматриваемые в настоящей заявке, включают полипептиды, содержащие вариант хоминг-эндонуклеазы или megaTAL и экзонуклеазу. Термин «экзонуклеаза» относится к ферментам, которые расщепляют фосфодиэфирные связи на конце полинуклеотидной цепи посредством реакции гидролиза, разрушающей фосфодиэфирные связи на 3' или 5' конце.In particular embodiments, genome editing compositions and methods for editing cellular genomes contemplated herein include polypeptides containing a homing endonuclease or megaTAL variant and an exonuclease. The term "exonuclease" refers to enzymes that cleave phosphodiester bonds at the end of a polynucleotide chain through a hydrolysis reaction that breaks phosphodiester bonds at the 3' or 5' end.

Иллюстративные примеры экзонуклеаз, подходящих для применения в частных вариантах реализации, рассматриваемых в настоящей заявке, включают, среди прочего: hExoI, ExoI дрожжей, E.coli ExoI, hTREX2, TREX2 мыши, крысиный TREX2, hTREX1, TREX1 мыши, TREX1 крысы и Rat TREX1.Illustrative examples of exonucleases suitable for use in the particular embodiments discussed herein include, among others: hExoI, Yeast ExoI, E. coli ExoI, hTREX2, mouse TREX2, rat TREX2, hTREX1, mouse TREX1, rat TREX1, and Rat TREX1 .

В частных вариантах реализации ДНК-фермент, изменяющий структуру концов, представляет собой экзонуклеазу от 3' до 5', предпочтительно Trex 1 или Trex2, более предпочтительно Trex2 и еще более предпочтительно Trex2 человека или мыши.In particular embodiments, the end-reversing DNA enzyme is a 3' to 5' exonuclease, preferably Trex 1 or Trex2, more preferably Trex2, and even more preferably human or mouse Trex2.

B. Сайты-мишениB. Target sites

Варианты нуклеазы, рассматриваемые в частных вариантах реализации могут быть предназначены для связывания с любой подходящей последовательностью-мишенью и могут иметь новую специфичность связывания по сравнению с природной нуклеазой. В частных вариантах реализации сайт-мишень представляет собой регуляторную область гена, включая, среди прочего, промоторы, энхансеры, репрессорные элементы и тому подобное. В частных вариантах реализации сайт-мишень представляет собой кодирующую область гена или сайт сплайсинга. В некоторых вариантах реализации нуклеазные варианты предназначены для подавления или снижения экспрессии гена. В частных вариантах реализации нуклеазный вариант и донорная матрица репарации могут быть предназначены для репарации или удаления желаемой целевой последовательности.Nuclease variants contemplated in particular embodiments may be designed to bind to any suitable target sequence and may have new binding specificity compared to the native nuclease. In particular embodiments, the target site is a regulatory region of a gene, including but not limited to promoters, enhancers, repressor elements, and the like. In private embodiments, the target site is a coding region of a gene or a splicing site. In some embodiments, nuclease variants are designed to suppress or reduce gene expression. In particular embodiments, the nuclease variant and the repair donor template may be designed to repair or remove the desired target sequence.

В различных вариантах варианты нуклеазы связывают и расщепляют последовательность-мишень в гене рецептора запрограммированной смерти 1 (PD-1). PD-1 также упоминается как рецептора запрограммированной смерти клеток 1 (PDCD1), восприимчивости к системной красной волчанке 2 (SLEB2), CD279, HPD1, PD1, HPD-L и HSLE1. PD-1 является членом семейства костимулирующих рецепторов B7/CD28. Молекула PD-1 состоит из внеклеточного лигандсвязывающего домена IgV, трансмембранного домена и внутриклеточного домена, который имеет потенциальные сайты фосфорилирования, расположенные с ингибирующим мотивом на основе иммунного тирозина (ITIM) и ингибирующим мотивом на основе иммунорецепторного тирозинового ингибирующего рецептора (ITSM). PD-1 представляет собой ингибирующий корецептор, экспрессируемый на Т-клетках, Tregs, истощенных Т-клетках, В-клетках, активированных моноцитах, дендритных клетках (DC), клетках естественных киллеров (NK) и клетках естественных киллерах T (NKT). PD-1 отрицательно регулирует активацию Т-клеток посредством связывания с его лигандами, запрограммированным лигандом смерти 1 (PD-L1) и запрограммированным лигандом смерти 2 (PD-L2). Связывание PD-1 ингибирует пролиферацию Т-клеток и выработку интерферона-γ (IFN-γ), фактора некроза опухоли-α и IL-2 и снижает выживаемость Т-клеток. Экспрессия PD-1 является отличительной чертой «истощенных» Т-клеток, которые испытали высокий уровень стимуляции. Указанное состояние истощения, которое возникает во время хронических инфекций и рака, характеризуется дисфункцией Т-клеток, что приводит к недостаточному контролю инфекций и опухолей.In various embodiments, nuclease variants bind and cleave a target sequence in the programmed death receptor 1 (PD-1) gene. PD-1 is also referred to as programmed cell death receptor 1 (PDCD1), susceptibility to systemic lupus erythematosus 2 (SLEB2), CD279, HPD1, PD1, HPD-L, and HSLE1. PD-1 is a member of the B7/CD28 costimulatory receptor family. The PD-1 molecule consists of an IgV extracellular ligand-binding domain, a transmembrane domain, and an intracellular domain that has potential phosphorylation sites located with an immune tyrosine inhibitory motif (ITIM) and an immunoreceptor tyrosine inhibitory receptor (ITSM) inhibitory motif. PD-1 is an inhibitory co-receptor expressed on T cells, Tregs, depleted T cells, B cells, activated monocytes, dendritic cells (DC), natural killer (NK) cells and natural killer T (NKT) cells. PD-1 negatively regulates T cell activation through binding to its ligands, programmed death ligand 1 (PD-L1) and programmed death ligand 2 (PD-L2). Binding of PD-1 inhibits T cell proliferation and production of interferon-γ (IFN-γ), tumor necrosis factor-α, and IL-2 and reduces T cell survival. Expression of PD-1 is a hallmark of "depleted" T cells that have experienced a high level of stimulation. This state of exhaustion, which occurs during chronic infections and cancer, is characterized by T-cell dysfunction resulting in poor control of infections and tumors.

В частных вариантах реализации вариант хоминг-эндонуклеазы или megaTAL вводит двухцепочечный разрыв (DSB) в сайт-мишень в гене PD-1. В частных вариантах реализации вариант хоминг-эндонуклеазы или megaTAL вводит DSB в экзоне 5 гена PD-1, предпочтительно в SEQ ID NO: 25 (или SEQ ID NO: 27) в экзоне 5 гена PD-1, и более предпочтительно в последовательности «ATAC» в SEQ ID NO: 25 (или SEQ ID NO: 27) в экзоне 5 гена PD-1.In particular embodiments, a variant of homing endonuclease or megaTAL introduces a double strand break (DSB) at a target site in the PD-1 gene. In particular embodiments, a homing endonuclease or megaTAL variant introduces DSB in exon 5 of the PD-1 gene, preferably in SEQ ID NO: 25 (or SEQ ID NO: 27) in exon 5 of the PD-1 gene, and more preferably in the sequence "ATAC » in SEQ ID NO: 25 (or SEQ ID NO: 27) in exon 5 of the PD-1 gene.

В предпочтительном варианте реализации вариант хоминг-эндонуклеазы или megaTAL расщепляет двухцепочечную ДНК и вводит DSB в полинуклеотидную последовательность, представленную в SEQ ID NO: 25 или 27.In a preferred embodiment, a homing endonuclease or megaTAL variant cleaves double stranded DNA and introduces DSB into the polynucleotide sequence shown in SEQ ID NO: 25 or 27.

В частных вариантах реализации вариант хоминг-эндонуклеазы или megaTAL вводит DSB в экзоне 1 гена PD-1, предпочтительно в SEQ ID NO: 30 (или SEQ ID NO: 32) в экзоне 1 гена PD-1, и более предпочтительно в последовательности «ATCC» в SEQ ID NO: 30 (или SEQ ID NO: 32) в экзоне 1 гена PD-1.In particular embodiments, a homing endonuclease or megaTAL variant introduces DSB in exon 1 of the PD-1 gene, preferably in SEQ ID NO: 30 (or SEQ ID NO: 32) in exon 1 of the PD-1 gene, and more preferably in the sequence "ATCC » in SEQ ID NO: 30 (or SEQ ID NO: 32) in exon 1 of the PD-1 gene.

В предпочтительном варианте реализации вариант хоминг-эндонуклеазы или megaTAL расщепляет двухцепочечную ДНК и вводит DSB в полинуклеотидную последовательность, представленную в SEQ ID NO: 30 или 32.In a preferred embodiment, a homing endonuclease or megaTAL variant cleaves double stranded DNA and introduces DSB into the polynucleotide sequence shown in SEQ ID NO: 30 or 32.

В частных вариантах реализации вариант хоминг-эндонуклеазы или megaTAL вводит DSB в экзоне 2 гена PD-1, предпочтительно в SEQ ID NO: 35 (или SEQ ID NO: 37) в экзоне 2 гена PD-1, и более предпочтительно в последовательности «ACTT» в SEQ ID NO: 35 (или SEQ ID NO: 37) в экзоне 2 гена PD-1.In particular embodiments, a homing endonuclease or megaTAL variant introduces DSB in exon 2 of the PD-1 gene, preferably in SEQ ID NO: 35 (or SEQ ID NO: 37) in exon 2 of the PD-1 gene, and more preferably in the sequence "ACTT » in SEQ ID NO: 35 (or SEQ ID NO: 37) in exon 2 of the PD-1 gene.

В предпочтительном варианте реализации вариант хоминг-эндонуклеазы или megaTAL расщепляет двухцепочечную ДНК и вводит DSB в полинуклеотидную последовательность, представленную в SEQ ID NO: 35 или 37.In a preferred embodiment, a homing endonuclease or megaTAL variant cleaves double stranded DNA and introduces DSB into the polynucleotide sequence shown in SEQ ID NO: 35 or 37.

В предпочтительном варианте реализации ген PD-1 представляет собой ген PD-1 человека.In a preferred embodiment, the PD-1 gene is a human PD-1 gene.

C. Донорные матрицы репарацииC. Donor repair matrices

Для введения DSB в последовательность-мишень могут быть использованы варианты нуклеазы; DSB может быть репарирован с помощью механизмов гомологичной репарации (HDR) в присутствии одного или нескольких донорной матрицы репарации.Nuclease variants can be used to introduce DSB into the target sequence; DSB can be repaired using homologous repair (HDR) mechanisms in the presence of one or more donor repair templates.

В различных вариантах реализации донорная матрица репарации содержит один или более полинуклеотидов, кодирующих энхансер иммунопотенции, демпфер иммуносупрессивного сигнала или сконструированный рецептор антигена.In various embodiments, the repair donor template contains one or more polynucleotides encoding an immunopotentiation enhancer, an immunosuppressive signal damper, or an engineered antigen receptor.

В различных вариантах реализации предполагается, что введение в клетку сконструированной нуклеазы в присутствии множества донорных матриц репарации, независимо кодирующих энхансеры иммунопотенции и/или демпферы иммуносупрессивного сигнала, нацеленные на различные иммуносупрессивные пути, дает Т-клетки с отредактированным геномом с повышенной терапевтической эффективностью и жизнестойкостью. Например, в частных вариантах реализации изобретения предпочтительными могут быть энхансеры иммунопотенции или демпферы иммуносупрессивного сигнала, нацеленные на комбинации путей PD-1, LAG-3, CTLA-4, TIM3, IL-10R, TIGIT и TGFβRII.In various embodiments, administration of engineered nuclease into a cell in the presence of multiple donor repair templates independently encoding immunopotentiation enhancers and/or immunosuppressive signal dampers targeting different immunosuppressive pathways is contemplated to produce genome-edited T cells with increased therapeutic efficacy and viability. For example, in particular embodiments, immunopotentiation enhancers or immunosuppressive signal dampers targeting combinations of the PD-1, LAG-3, CTLA-4, TIM3, IL-10R, TIGIT, and TGFβRII pathways may be preferred.

В частных вариантах реализации донорную матрицу репарации используют для вставки последовательности в геном. В частных предпочтительных вариантах донорную матрицу репарации используют для репарации или модификации последовательности в геноме.In particular embodiments, a repair donor template is used to insert the sequence into the genome. In particular preferred embodiments, a repair donor template is used to repair or modify a sequence in the genome.

В различных вариантах реализации донорную матрицу репарации вводят в гемопоэтическую клетку, например Т-клетку, путем трансдукции клетки вектором адено-ассоциированного вируса (AAV), ретровируса, например, лентивируса, IDLV и т.д., вируса простого герпеса, аденовируса или вируса коровьей оспы, содержащим донорную матрицу репарации.In various embodiments, a repair donor template is introduced into a hematopoietic cell, such as a T cell, by transducing the cell with an adeno-associated virus (AAV) vector, a retrovirus, such as lentivirus, IDLV, etc., herpes simplex virus, adenovirus, or bovine virus. smallpox containing a donor repair matrix.

В частных вариантах реализации донорная матрица репарации содержит одно или более плеч гомологии, которые фланкируют сайт DSB.In particular embodiments, the donor repair template contains one or more homology arms that flank the DSB site.

Используемый в настоящей заявке термин «гомологичные плечи» относится к нуклеотидной последовательности в донорной матрице репарации, которая идентична или почти идентична последовательности ДНК, фланкирующей разрыв ДНК, введенный нуклеазой в сайте-мишени. В одном варианте реализации донорная матрица репарации содержит 5'-гомологичное плечо, которое содержит нуклеотидную последовательность, которая идентична или почти идентична последовательности ДНК 5' сайта разрыва ДНК. В одном варианте реализации донорная матрица репарации содержит 3'-гомологичное плечо, которое содержит нуклеотидную последовательность, которая идентична или почти идентична последовательности ДНК 3' сайта разрыва ДНК. В предпочтительном варианте реализации донорная матрица репарации содержит 5'-гомологичное плечо и 3'-гомологичное плечо. Донорная матрица репарации может содержать гомологию с геномной последовательностью, непосредственно примыкающей к сайту DSB, или гомологию с геномной последовательностью в пределах любого количества пар оснований из сайта DSB. В одном варианте реализации донорная матрица репарации содержит нуклеотидную последовательность, которая гомологична геномной последовательности длиной приблизительно 5 п.н., приблизительно 10 п.н., приблизительно 25 п.н., приблизительно 50 п.н., приблизительно 100 п.н., приблизительно 250 п.н., приблизительно 500 п.н., приблизительно 1000 п.н., приблизительно 2500 п.н., приблизительно 5000 п.н., приблизительно 10000 п.н.или более, включая любую промежуточную длину гомологичной последовательности.As used herein, the term "homologous arms" refers to a nucleotide sequence in the donor repair template that is identical or nearly identical to the DNA sequence flanking the DNA break introduced by the nuclease at the target site. In one embodiment, the repair donor template contains a 5' homologous arm that contains a nucleotide sequence that is identical or nearly identical to the DNA sequence of the 5' DNA break site. In one embodiment, the repair donor template contains a 3' homologous arm that contains a nucleotide sequence that is identical or nearly identical to the DNA sequence of the 3' DNA break site. In a preferred embodiment, the repair donor template contains a 5' homologous arm and a 3' homologous arm. The repair donor template may contain homology to a genomic sequence immediately adjacent to the DSB site, or homology to a genomic sequence within any number of base pairs from the DSB site. In one embodiment, the repair donor template contains a nucleotide sequence that is homologous to a genomic sequence of about 5 bp, about 10 bp, about 25 bp, about 50 bp, about 100 bp. , approximately 250 bp, approximately 500 bp, approximately 1000 bp, approximately 2500 bp, approximately 5000 bp, approximately 10000 bp or more, including any intermediate homologous length sequences.

Иллюстративные примеры подходящих длин гомологичных плеч, рассматриваемых в частных вариантах реализации могут быть выбраны независимо и включают, среди прочего: гомологичные плечи длиной приблизительно 100 п.н., приблизительно 200 п.н., приблизительно 300 п.н., приблизительно 400 п.н., приблизительно 500 п.н., приблизительно 600 п.н., приблизительно 700 п.н., приблизительно 800 п.н., приблизительно 900 п.н., приблизительно 1000 п.н., приблизительно 1100 п.н., приблизительно 1200 п.н., приблизительно 1300 п.н., приблизительно 1400 п.н., приблизительно 1500 п.н., приблизительно 1600 п.н., приблизительно 1700 п.н., приблизительно 1800 п.н., приблизительно 1900 приблизительно 2000 п.н., приблизительно 2100 п.н., приблизительно 2200 п.н., приблизительно 2300 п.н., приблизительно 2400 п.н., приблизительно 2500 п.н., приблизительно 2600 п.н., приблизительно 2700 п.н., приблизительно 2800 п.н., приблизительно 2900 п.н. или приблизительно 3000 п.н., или больше, включая все промежуточные длины гомологичных плеч.Illustrative examples of suitable lengths of homologous arms considered in particular embodiments can be independently selected and include, among others: homologous arms about 100 bp long, about 200 bp long, about 300 bp long, about 400 bp long. about 500 bp, about 600 bp, about 700 bp, about 800 bp, about 900 bp, about 1000 bp, about 1100 bp ., about 1200 bp, about 1300 bp, about 1400 bp, about 1500 bp, about 1600 bp, about 1700 bp, about 1800 bp , approximately 1900 approximately 2000 bp, approximately 2100 bp, approximately 2200 bp, approximately 2300 bp, approximately 2400 bp, approximately 2500 bp, approximately 2600 bp ., about 2700 bp, about 2800 bp, about 2900 bp or approximately 3000 bp or more, including all intermediate lengths of homologous arms.

Дополнительные иллюстративные примеры подходящей длины гомологичного плеча включают, среди прочего: от приблизительно 100 до приблизительно 3000 п.н., от приблизительно 200 до приблизительно 3000 п.н., от приблизительно 300 до приблизительно 3000 п.н., от приблизительно 400 до приблизительно 3000 п.н., приблизительно 500 от приблизительно 3000 до приблизительно 2500 п.н., от приблизительно 500 до приблизительно 2500 п.н., от приблизительно 500 до приблизительно 2000 п.н., от приблизительно 750 до приблизительно 2000 п.н., от приблизительно 750 до приблизительно 1500 п.н. или от приблизительно 1000 до приблизительно 1500 п.н., включая все промежуточные длины гомологичных плеч.Additional illustrative examples of suitable homologous arm length include, among others: about 100 to about 3000 bp, about 200 to about 3000 bp, about 300 to about 3000 bp, about 400 to about 3000 bp, about 500 about 3000 to about 2500 bp, from about 500 to about 2500 bp, from about 500 to about 2000 bp, from about 750 to about 2000 bp ., from about 750 to about 1500 b.p. or from about 1000 to about 1500 bp, including all intermediate lengths of homologous arms.

В частном варианте реализации длины 5'- и 3'-гомологичных плечи независимо выбраны от приблизительно 500 до приблизительно 1500 п.н. В одном варианте реализации 5'-гомологичное плечо имеет длину приблизительно 1500 п.н., а 3'-гомологичное плечо имеет длину приблизительно 1000 п.н. В одном варианте реализации 5' гомологичное плечо имеет длину от 200 до 600 п.н., а гомологичное плечо имеет длину от 200 до 600 п.н. В одном варианте реализации 5'-гомологичное плечо имеет длину приблизительно 200 п.н., а 3'-гомологичное плечо имеет длину приблизительно 200 п.н. В одном варианте 5'гомологичное плечо имеет длину приблизительно 300 п.н., а 3'-гомологичное плечо имеет длину приблизительно 300 п.н. В одном варианте реализации 5'-гомологичное плечо имеет длину приблизительно 400 п.н., а 3'-гомологичное плечо имеет длину приблизительно 400 п.н. В одном варианте 5'гомологичное плечо имеет длину приблизительно 500 п.н., а 3'-гомологичное плечо имеет длину приблизительно 500 п.н. В одном варианте реализации 5'-гомологичное плечо имеет длину приблизительно 600 п.н., а 3'-гомологичное плечо имеет длину приблизительно 600 п.н.In a particular embodiment, the lengths of the 5' and 3' homologous arms are independently selected from about 500 to about 1500 bp. In one embodiment, the 5' homologous arm is about 1500 bp long and the 3' homologous arm is about 1000 bp long. In one embodiment, the 5' homologous arm is 200 to 600 bp in length and the homologous arm is 200 to 600 bp in length. In one embodiment, the 5' homologous arm is about 200 bp long and the 3' homologous arm is about 200 bp long. In one embodiment, the 5' homologous arm is about 300 bp long and the 3' homologous arm is about 300 bp long. In one embodiment, the 5' homologous arm is about 400 bp long and the 3' homologous arm is about 400 bp long. In one embodiment, the 5' homologous arm is about 500 bp long and the 3' homologous arm is about 500 bp long. In one embodiment, the 5' homologous arm is about 600 bp long and the 3' homologous arm is about 600 bp long.

Донорная матрица репарации может, кроме того, содержать один или более полинуклеотидов, таких как промоторы и/или энхансеры, нетранслируемые области (UTR), последовательности Козака, сигналы полиаденилирования, дополнительные сайты ферментов рестрикции, множественные сайты клонирования, участки внутренней посадки рибосомы (IRES), сайты узнавания рекомбиназы. (например, сайты LoxP, FRT и Att), терминирующие кодоны, сигналы терминации транскрипции и полинуклеотиды, кодирующие саморасщепляемые полипептиды, метки эпитопа, рассматриваемые в других местах настоящей заявки.The repair donor template may further comprise one or more polynucleotides such as promoters and/or enhancers, untranslated regions (UTRs), Kozak sequences, polyadenylation signals, additional restriction enzyme sites, multiple cloning sites, internal ribosome entry sites (IRES) , recombinase recognition sites. (eg, LoxP, FRT, and Att sites), termination codons, transcription termination signals, and polynucleotides encoding self-cleaving polypeptides, epitope tags, as discussed elsewhere in this application.

В одном варианте реализации донорная матрица репарации содержит полинуклеотид, содержащий ген PD-1, или его часть, и предназначена для введения одной или нескольких мутаций в геномную последовательность PD-1 таким образом, чтобы экспрессировать продукт мутантного гена PD-1. В одном варианте реализации мутант PD-1 обладает сниженным связыванием лиганда и/или уменьшением внутриклеточной передачи сигналов.In one embodiment, the donor repair template contains a polynucleotide containing the PD-1 gene, or a portion thereof, and is designed to introduce one or more mutations into the PD-1 genomic sequence so as to express the product of the mutated PD-1 gene. In one embodiment, the PD-1 mutant has reduced ligand binding and/or reduced intracellular signaling.

В различных вариантах реализации донорная матрица репарации содержит 5'-гомологичное плечо, промотор РНК-полимеразы II, один или более полинуклеотидов, кодирующих энхансер иммунопотенции, демпфер иммуносупрессивного сигнала или рецептор сконструированного антигена и 3'-гомологичное плечо.In various embodiments, the repair donor template comprises a 5' homologous arm, an RNA polymerase II promoter, one or more polynucleotides encoding an immunopotentiator enhancer, an immunosuppressive signal damper, or an engineered antigen receptor, and a 3' homologous arm.

В различных вариантах реализации сайт-мишень модифицирован донорной матрицей репараций, содержащей 5'-гомологичное плечо, один или более полинуклеотидов, кодирующих саморасщепляемый вирусный пептид, например, T2A, энхансер иммунопотенции, демпфер иммуносупрессивного сигнала или рецептор сконструированного антигена, необязательно поли(А)-сигнал или саморасщепляемый пептид, и 3'-гомологичное плечо, причем экспрессия одного или нескольких полинуклеотидов регулируется эндогенным промотором PD-1.In various embodiments, the target site is modified with a repair donor template comprising a 5' homologous arm, one or more polynucleotides encoding a self-cleaving viral peptide, e.g. a signal or self-cleaving peptide; and a 3' homologous arm, wherein the expression of one or more polynucleotides is regulated by the endogenous PD-1 promoter.

1. Энхансеры иммунопотенции1. Enhancers of immunopotency

В частных вариантах реализации рассматриваемые в настоящей заявке иммунные эффекторные клетки с отредактированным геномом делаются более активными и/или устойчивыми к иммуносупрессивным факторам путем введения DSB в ген PD-1 в присутствии донорной матрицы репарации, кодирующей энхансер иммунопотенции. Используемый в настоящей заявке термин «энхансер иммунопотенции» относится к не встречающимся в природе молекулам, которые стимулируют и/или потенцируют активацию и/или функцию Т-клеток, иммунопотенцирующим факторам и не встречающимся в природе полипептидам, которые преобразуют иммуносупрессивные сигналы из микроокружения опухоли в иммуностимулирующий сигнал в Т-клетке или других иммунных клетках.In particular embodiments, the genome-edited immune effector cells contemplated herein are made more active and/or resistant to immunosuppressive factors by introducing DSB into the PD-1 gene in the presence of a donor repair template encoding an immunopotentiator enhancer. As used herein, the term "immunopotency enhancer" refers to non-naturally occurring molecules that stimulate and/or potentiate T cell activation and/or function, immunopotentiating factors, and non-naturally occurring polypeptides that convert immunosuppressive signals from the tumor microenvironment into an immunostimulatory one. signal in a T cell or other immune cells.

В частных вариантах реализации энхансер иммунопотенции выбран из группы, состоящей из молекулы биспецифического Т-клеточного активатора (BiTE); иммуностимулирующего фактора, включая, среди прочего, цитокины, хемокины, цитотоксины и/или рецепторы цитокинов; и флип-рецептор.In particular embodiments, the immunopotentiator enhancer is selected from the group consisting of a bispecific T cell activator (BiTE) molecule; an immunostimulatory factor including, but not limited to, cytokines, chemokines, cytotoxins, and/or cytokine receptors; and flip receptor.

В некоторых вариантах реализации энхансер иммунопотенции, иммунопотенцирующий фактор или флип-рецептор представляют собой слитые полипептиды, содержащие домен дестабилизации белка.In some embodiments, the immunopotentiator enhancer, immunopotentiating factor, or flip receptor are fusion polypeptides containing a protein destabilization domain.

a. Молекулы биспецифического Т-клеточного активатора (BiTE)a. Bispecific T-cell activator (BiTE) molecules

В частных вариантах реализации рассматриваемые в настоящей заявке иммунные эффекторные клетки с отредактированным геномом становятся более эффективными при помощи введения DSB в ген PD-1 в присутствии донорной матрицы репарации, кодирующей молекулы биспецифического Т-клеточного активатора (BiTE). Молекулы BiTE представляют собой молекулы из двух частей, содержащие первый связывающий домен, который связывает антиген-мишень, линкер или спейсер, рассматриваемый в другом месте настоящей заявки, и второй связывающий домен, который связывает стимулирующую или костимулирующую молекулу на иммунной эффекторной клетке. Первый и второй связывающий домены могут быть независимо выбраны из лигандов, рецепторов, антител или их антигенсвязывающих фрагментов, лектинов и углеводов.In particular embodiments, the genome-edited immune effector cells of the present application are made more effective by introducing DSB into the PD-1 gene in the presence of a donor repair template encoding bispecific T-cell activator (BiTE) molecules. BiTE molecules are two-part molecules containing a first binding domain that binds a target antigen, linker or spacer discussed elsewhere in this application and a second binding domain that binds a stimulatory or co-stimulatory molecule on an immune effector cell. The first and second binding domains can be independently selected from ligands, receptors, antibodies or antigen-binding fragments thereof, lectins, and carbohydrates.

В частных вариантах реализации первый и второй связывающие домены представляют собой антиген-связывающий домены.In particular embodiments, the first and second binding domains are antigen binding domains.

В частных вариантах реализации первый и второй связывающие домены представляют собой антитела или их антигенсвязывающие фрагменты. В одном варианте реализации первый и второй связывающие домены представляют собой одноцепочечные вариабельные фрагменты (scFv).In particular embodiments, the first and second binding domains are antibodies or antigen-binding fragments thereof. In one embodiment, the first and second binding domains are single chain variable fragments (scFv).

Иллюстративные примеры антигенов-мишеней, которые могут распознаваться и связываться первым связывающим доменом в частных вариантах реализации, включают, среди прочего: рецептор альфа-фолата, 5T4, интегрин αvβ6, BCMA, B7-H3, B7-H6, CAIX, CD16, CD19, CD20, CD22, CD30, CD33, CD44, CD44v6, CD44v7/8, CD70, CD79a, CD79b, CD123, CD138, CD171, CEA, CSPG4, EGFR, семейство EGFR включая ErbB2 (HER2), EGFRvIII, EGP2, EGP40, EPCAM, EphA2, EpCAM, FAP, фетальный AchR, FRα, GD2, GD3, Glypican-3 (GPC3), HLA-A1+MAGE1, HLA-A2+MAGE1, HLA-A3+MAGE1, HLA-A1+NY-ESO-1, HLA-A2+NY-ESO-1, HLA-A3+NY-ESO-1, IL-11Rα, IL-13Rα2, Лямбда, Lewis-Y, Каппа, Мезотелин, Muc1, Muc16, NCAM, лиганды NKG2D, NY-ESO-1, PRAME, PSCA, PSMA, ROR1, SSX, сурвивин, TAG72, TEMs, VEGFR2 и WT-1.Illustrative examples of target antigens that can be recognized and bound by the first binding domain in particular embodiments include, but are not limited to: alpha folate receptor, 5T4, αvβ6 integrin, BCMA, B7-H3, B7-H6, CAIX, CD16, CD19, CD20, CD22, CD30, CD33, CD44, CD44v6, CD44v7/8, CD70, CD79a, CD79b, CD123, CD138, CD171, CEA, CSPG4, EGFR, EGFR family including ErbB2 (HER2), EGFRvIII, EGP2, EGP40, EPCAM, EphA2, EpCAM, FAP, Fetal AchR, FRα, GD2, GD3, Glypican-3 (GPC3), HLA-A1+MAGE1, HLA-A2+MAGE1, HLA-A3+MAGE1, HLA-A1+NY-ESO-1, HLA-A2+NY-ESO-1, HLA-A3+NY-ESO-1, IL-11Rα, IL-13Rα2, Lambda, Lewis-Y, Kappa, Mesothelin, Muc1, Muc16, NCAM, NKG2D ligands, NY-ESO -1, PRAME, PSCA, PSMA, ROR1, SSX, survivin, TAG72, TEMs, VEGFR2 and WT-1.

Другие иллюстративные варианты реализации антигенов-мишеней включают комплексы MHC-пептид, необязательно в которых пептид процессирован из альфа-фолатного рецептора, 5T4, интегрина αvβ6, BCMA, B7-H3, B7-H6, CAIX, CD16, CD19, CD20, CD22, CD30, CD33, CD44, CD44v6, CD44v7/8, CD70, CD79a, CD79b, CD123, CD138, CD171, CEA, CSPG4, EGFR, семейства EGFR включая ErbB2 (HER2), EGFRvIII, EGP2, EGP40, EPCAM, EphA2, EpCAM, FAP, фетального AchR, FRα, GD2, GD3, Glypican-3 (GPC3), MAGE1, NY-ESO-1, IL-11Rα, IL-13Rα2, Лямбда, Lewis-Y, Каппа, Мезотелин, Muc1, Muc16, NCAM, лиганды NKG2D, PRAME, PSCA, PSMA, ROR1, SSX, сурвивин, TAG72, TEMs, VEGFR2 и WT-1.Other exemplary target antigen embodiments include MHC-peptide complexes, optionally wherein the peptide is processed from alpha-folate receptor, 5T4, αvβ6 integrin, BCMA, B7-H3, B7-H6, CAIX, CD16, CD19, CD20, CD22, CD30 , CD33, CD44, CD44v6, CD44v7/8, CD70, CD79a, CD79b, CD123, CD138, CD171, CEA, CSPG4, EGFR, EGFR families including ErbB2 (HER2), EGFRvIII, EGP2, EGP40, EPCAM, EphA2, EpCAM, FAP , Fetal AchR, FRα, GD2, GD3, Glypican-3 (GPC3), MAGE1, NY-ESO-1, IL-11Rα, IL-13Rα2, Lambda, Lewis-Y, Kappa, Mesothelin, Muc1, Muc16, NCAM, ligands NKG2D, PRAME, PSCA, PSMA, ROR1, SSX, survivin, TAG72, TEMs, VEGFR2 and WT-1.

Иллюстративные примеры стимулирующих или костимулирующих молекул на эффекторных клетках иммунитета, распознаваемых и связываемых вторым связывающим доменом в частных вариантах реализации, включают, среди прочего: CD3γ, CD3δ, CD3ε, CD3ζ, CD28, CD134, CD137 и CD278.Illustrative examples of stimulatory or costimulatory molecules on immune effector cells recognized and bound by the second binding domain in particular embodiments include, but are not limited to: CD3γ, CD3δ, CD3ε, CD3ζ, CD28, CD134, CD137, and CD278.

В частных вариантах реализации DSB в гене PD-1 индуцируют сконструированной нуклеазой, а донорную матрицу репарации, содержащую BiTE, вводят в клетку и встраивают в ген PD-1 путем гомологичной рекомбинации.In particular embodiments, DSB in the PD-1 gene is induced with a engineered nuclease, and a repair donor template containing BiTE is introduced into the cell and inserted into the PD-1 gene by homologous recombination.

b. Иммунопотенцирующие факторыb. Immunopotentiating factors

В частных вариантах реализации рассматриваемые в настоящей заявке иммунные эффекторные клетки с отредактированным геномом становятся более активными за счет увеличения иммунопотенцирующих факторов либо в клетках с отредактированным геномом, либо в клетках в микроокружении опухоли. «Иммунопотенцирующие факторы» относятся к конкретным цитокинам, хемокинам, цитотоксинам и рецепторам цитокинов, которые усиливают иммунный ответ в иммунных эффекторных клетках. В одном варианте реализации Т-клетки сконструированы путем введения DSB в ген PD-1 в присутствии донорной матрицы репарации, кодирующей рецептор цитокина, хемокина, цитотоксина или цитокина.In particular embodiments, the genome-edited immune effector cells contemplated herein become more active by increasing immunopotentiating factors either in the genome-edited cells or in cells in the tumor microenvironment. "Immunopotentiating factors" refers to specific cytokines, chemokines, cytotoxins, and cytokine receptors that enhance the immune response in immune effector cells. In one embodiment, T cells are constructed by introducing a DSB into the PD-1 gene in the presence of a donor repair template encoding a cytokine, chemokine, cytotoxin, or cytokine receptor.

В частных вариантах реализации донорная матрица репарации кодирует цитокин, выбранный из группы, состоящей из: IL-2, инсулина, IFN-γ, IL-7, IL-21, IL-10, IL-12, IL-15 и TNF-α.In particular embodiments, the donor repair template encodes a cytokine selected from the group consisting of: IL-2, insulin, IFN-γ, IL-7, IL-21, IL-10, IL-12, IL-15, and TNF-α .

В предпочтительном варианте реализации донорная матрица репарации кодирует цитокин, выбранный из группы, состоящей из IL-2, IL-7, IL-12, IL-15, IL-18 и IL-21, который будучи встроен в сайт-мишень в гене PD-1, функционально связывает цитокин с эндогенным промотором PD-1, тем самым помещая транскрипционный контроль цитокина под контроль эндогенного промотора PD-1.In a preferred embodiment, the donor repair template encodes a cytokine selected from the group consisting of IL-2, IL-7, IL-12, IL-15, IL-18, and IL-21, which when inserted into a target site in the PD gene -1 operably links the cytokine to the endogenous PD-1 promoter, thereby placing the cytokine's transcriptional control under the control of the endogenous PD-1 promoter.

В другом предпочтительном варианте реализации донорная матрица репарации кодирует IL-12, который, будучи встроен в сайт-мишень в гене PD-1, функционально связывает цитокин с эндогенным промотором PD-1, тем самым помещая транскрипционный контроль цитокина под контроль эндогенного промотора PD-1.In another preferred embodiment, the donor repair template encodes IL-12 which, when inserted into a target site in the PD-1 gene, operably links the cytokine to the endogenous PD-1 promoter, thereby placing the transcriptional control of the cytokine under the control of the endogenous PD-1 promoter. .

В частных вариантах реализации донорная матрица репарации кодирует хемокин, выбранный из группы, состоящей из: MIP-1α, MIP-1β, MCP-1, MCP-3 и RANTES.In particular embodiments, the donor repair template encodes a chemokine selected from the group consisting of: MIP-1α, MIP-1β, MCP-1, MCP-3, and RANTES.

В частных вариантах реализации донорная матрица репарации кодирует цитотоксин, выбранный из группы, состоящей из перфорина, гранзима A и гранзима B.In particular embodiments, the donor repair template encodes a cytotoxin selected from the group consisting of perforin, granzyme A, and granzyme B.

В частных вариантах реализации донорная матрица репарации кодирует рецептор цитокина, выбранный из группы, состоящей из: рецептора IL-2, рецептора IL-7, рецептора IL-12, рецептора IL-15 и рецептора IL-21.In particular embodiments, the donor repair template encodes a cytokine receptor selected from the group consisting of: IL-2 receptor, IL-7 receptor, IL-12 receptor, IL-15 receptor, and IL-21 receptor.

В предпочтительном варианте реализации донорная матрица репарации кодирует рецептор цитокина, выбранный из группы, состоящей из рецептора IL-2, рецептора IL-7, рецептора IL-12, рецептора IL-15, рецептора IL-18 и рецептора IL-21, который, будучи встроен в сайт-мишень в гене PD-1 функционально связывает рецептор цитокинов с эндогенным промотором PD-1, тем самым помещая транскрипционный контроль рецептора цитокинов под контроль эндогенного PD- 1 промоутер.In a preferred embodiment, the repair donor template encodes a cytokine receptor selected from the group consisting of an IL-2 receptor, an IL-7 receptor, an IL-12 receptor, an IL-15 receptor, an IL-18 receptor, and an IL-21 receptor, which, being inserted into a target site in the PD-1 gene operably links the cytokine receptor to the endogenous PD-1 promoter, thereby placing transcriptional control of the cytokine receptor under the control of the endogenous PD-1 promoter.

В другом предпочтительном варианте реализации донорная матрица репарации кодирует рецептор IL-12, который, будучи встроен в сайт-мишень в гене PD-1, оперативно связывает рецептор цитокина с эндогенным промотором PD-1, тем самым помещая транскрипционный контроль рецептора цитокинов под контроль эндогенного под контролем эндогенного промотора PD-1.In another preferred embodiment, the donor repair template encodes an IL-12 receptor that, when inserted into a target site in the PD-1 gene, operably binds the cytokine receptor to the endogenous PD-1 promoter, thereby placing cytokine receptor transcriptional control under endogenous control. control of the endogenous PD-1 promoter.

c. Флип-рецепторыc. Flip receptors

В других вариантах реализации донорная матрица репарации кодирует флип-рецептор или его часть. Используемый в настоящей заявке термин «флип-рецептор» относится к не встречающемуся в природе полипептиду, который преобразует иммуносупрессивные сигналы из микроокружения опухоли в иммуностимулирующий сигнал в Т-клетке. В частных вариантах реализации «флип-рецептор PD-1» относится к полипептиду, который содержит экзодомен PD-1 или связывающий домен лиганда или его вариант, трансмембранный домен и эндодомен, который трансдуцирует иммуностимулирующий сигнал в Т-клетку. В частных вариантах реализации «флип-рецептор PD-1» относится к полипептиду, который содержит экзодомен PD-1 или связывающий домен лиганда или его вариант, трансмембранный домен PD-1 и эндодомен, который трансдуцирует иммуностимулирующий сигнал в Т-клетку. В частных вариантах реализации «флип-рецептор PD-1» относится к полипептиду, который содержит экзодомен PD-1 или связывающий домен лиганда или его вариант и трансмембранный домен и эндодомен из белка, который трансдуцирует иммуностимулирующий сигнал в Т-клетку. В некоторых вариантах реализации вариант экзодомена PD-1 обладает повышенной аффинностью связывания с PD-L1 и/или PD-L2.In other embodiments, the donor repair template encodes a flip receptor, or a portion thereof. As used herein, the term "flip receptor" refers to a non-naturally occurring polypeptide that converts immunosuppressive signals from the tumor microenvironment into an immunostimulatory signal in a T cell. In particular embodiments, "PD-1 flip receptor" refers to a polypeptide that contains a PD-1 exodomain or ligand binding domain or variant thereof, a transmembrane domain, and an endodomain that transduces an immunostimulatory signal into a T cell. In particular embodiments, "PD-1 flip receptor" refers to a polypeptide that contains a PD-1 exodomain or ligand binding domain or variant thereof, a PD-1 transmembrane domain, and an endodomain that transduces an immunostimulatory signal into a T cell. In particular embodiments, "PD-1 flip receptor" refers to a polypeptide that contains a PD-1 exodomain or ligand binding domain or variant thereof and a transmembrane domain and an endodomain from a protein that transduces an immunostimulatory signal into a T cell. In some embodiments, the PD-1 exodomain variant has increased binding affinity for PD-L1 and/or PD-L2.

В одном варианте реализации трансмембрана выделена из CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD5, CD8α, CD9, CD 16, CD22, CD27, CD28, CD33, CD37, CD45, CD64, CD80, CD86, CD 134, CD137, CD152, CD154, AMN и PD-1.In one embodiment, the transmembrane is isolated from CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD5, CD8α, CD9, CD 16, CD22, CD27, CD28, CD33, CD37, CD45, CD64, CD80, CD86, CD 134, CD137, CD152 , CD154, AMN and PD-1.

В одном варианте реализации трансмембрана выделена из CD4, CD8α, CD8β, CD27, CD28, CD134, CD137, полипептида CD3, рецептора IL-2, рецептора IL-7, рецептора IL-12, рецептора IL-15 или рецептора IL- 21.In one embodiment, the transmembrane is isolated from CD4, CD8α, CD8β, CD27, CD28, CD134, CD137, CD3 polypeptide, IL-2 receptor, IL-7 receptor, IL-12 receptor, IL-15 receptor, or IL-21 receptor.

В одном варианте реализации эндодомен выделен из рецептора IL-2, рецептора IL-7, рецептора IL-12, рецептора IL-15 или рецептора IL-21.In one embodiment, the endodomain is isolated from an IL-2 receptor, an IL-7 receptor, an IL-12 receptor, an IL-15 receptor, or an IL-21 receptor.

В одном варианте реализации донорная матрица репарации содержит флип-рецептор PD-1, содержит экзодомен или связывающий домен лиганда PD-1, трансмембранный домен и один или более внутриклеточных костимулирующих сигнальных доменов и/или первичных сигнальных доменов. Трансмембранные и эндодомены могут быть выделены из одного и того же белка или разных белков.In one embodiment, the repair donor matrix comprises a PD-1 flip receptor, an exodomain or PD-1 ligand binding domain, a transmembrane domain, and one or more intracellular co-stimulatory signaling domains and/or primary signaling domains. Transmembrane and endodomains can be isolated from the same protein or different proteins.

В одном варианте реализации донорная матрица репарации содержит флип-рецептор PD-1, содержит экзодомен или лиганд связывающий домен PD-1, трансмембранный домен PD-1 и один или более внутриклеточных костимуляторных сигнальных доменов и/или первичных сигнальных доменов.In one embodiment, the repair donor matrix comprises a PD-1 flip receptor, a PD-1 exodomain or ligand binding domain, a PD-1 transmembrane domain, and one or more intracellular co-stimulatory signaling domains and/or primary signaling domains.

2. Демпферы иммуносупрессивного сигнала2. Immunosuppressive signal dampers

Одним из ограничений или проблем, которые являются слабым местом существующей адоптивной клеточной терапии, является гипореактивность иммунных эффекторных клеток вследствие истощения, опосредованного микроокружением опухоли. Истощенные Т-клетки имеют уникальную молекулярную сигнатуру, которая заметно отличается от наивных, эффекторных Т-клеток или Т-клеток памяти. Истощенные Т-клетки определяются как Т-клетки со снижением экспрессии цитокинов и эффекторной функции.One limitation or problem that is a weak point of current adoptive cell therapy is the hyporeactivity of immune effector cells due to depletion mediated by the tumor microenvironment. Depleted T cells have a unique molecular signature that is markedly different from naïve, effector, or memory T cells. Depleted T cells are defined as T cells with reduced cytokine expression and effector function.

В частных вариантах реализации рассматриваемые в настоящей заявке иммунные эффекторные клетки с отредактированным геномом становятся более устойчивыми к истощению за счет снижения или демпфирования передачи сигналов иммунодепрессивными факторами. В одном варианте реализации Т-клетки сконструированы путем введения DSB в ген PD-1 в присутствии донорной матрицы репарации, кодирующей демпфер иммуносупрессивного сигнала.In particular embodiments, the genome-edited immune effector cells of the present application become more resistant to depletion by reducing or damping signaling by immunosuppressive factors. In one embodiment, T cells are constructed by introducing a DSB into the PD-1 gene in the presence of a donor repair template encoding an immunosuppressive signal damper.

Используемый в настоящей заявке термин «демпфер иммуносупрессивного сигнала» относится к не встречающемуся в природе полипептиду, который уменьшает передачу иммуносупрессивных сигналов из микроокружения опухоли в Т-клетку. В одном варианте реализации «демпфер иммуносупрессивного сигнала» представляет собой антитело или его антигенсвязывающий фрагмент, который связывает иммуносупрессивный фактор. В предпочтительных вариантах реализации «демпфер иммуносупрессивного сигнала» относится к полипептиду, который оказывает супрессивный, демпфирующий или доминирующий отрицательный эффект на конкретный иммуносупрессивный фактор или путь передачи сигнала, поскольку демпфер содержит экзодомен, который связывает иммуносупрессивный фактор и, необязательно, трансмембранный домен, и, необязательно, модифицированный эндодомен (например, внутриклеточный сигнальный домен).As used herein, the term "immunosuppressive signal damper" refers to a non-naturally occurring polypeptide that reduces the transmission of immunosuppressive signals from the tumor microenvironment to the T cell. In one embodiment, an "immunosuppressive signal damper" is an antibody, or antigen-binding fragment thereof, that binds an immunosuppressive factor. In preferred embodiments, an "immunosuppressive signal damper" refers to a polypeptide that has a suppressive, damping, or dominant negative effect on a particular immunosuppressive factor or signal transduction pathway, since the damper contains an exodomain that binds the immunosuppressive factor and optionally a transmembrane domain, and optionally , modified endodomain (eg, intracellular signaling domain).

В частных вариантах реализации экзодомен представляет собой внеклеточный связывающий домен, который распознает и связывает и иммуносупрессивный фактор.In private embodiments, the exodomain is an extracellular binding domain that recognizes and binds an immunosuppressive factor.

В частных вариантах реализации такой модифицированный эндодомен мутирован для уменьшения или ингибирования иммуносупрессивных сигналов. Подходящие стратегии мутации включают, среди прочего, замену, добавление или делецию аминокислоты. Подходящие мутации дополнительно включают, среди прочего, укорочение эндодомена для удаления сигнальных доменов, мутацию эндодоменов для удаления остатков, важных для активности сигнального мотива, и мутацию эндодоменов для блокировки циклирования рецепторов. В частных вариантах реализации эндодомен, когда он присутствует, не трансдуцирует иммуносупрессивные сигналы или обладает существенно сниженной способностью трансдуцировать иммуносупрессивные сигналы.In particular embodiments, such a modified endodomain is mutated to reduce or inhibit immunosuppressive signals. Suitable mutation strategies include, inter alia, substitution, addition or deletion of an amino acid. Suitable mutations further include, but are not limited to, shortening the endodomain to remove signaling domains, mutating endodomains to remove residues important for signaling motif activity, and mutating endodomains to block receptor cycling. In particular embodiments, the endodomain, when present, does not transduce immunosuppressive signals or has a substantially reduced ability to transduce immunosuppressive signals.

Таким образом, в некоторых вариантах реализации демпфер иммуносупрессивного сигнала действует как поглотитель для одного или нескольких иммуносупрессивных факторов из микроокружения опухоли и ингибирует соответствующие пути передачи иммуносупрессивных сигналов в Т-клетке.Thus, in some embodiments, the immunosuppressive signal damper acts as a scavenger for one or more immunosuppressive factors from the tumor microenvironment and inhibits the appropriate immunosuppressive signaling pathways in the T cell.

Один иммуносупрессивный сигнал опосредован катаболизмом триптофана. Катаболизм триптофана индоламиновой 2,3-диоксигеназой (IDO) в раковых клетках приводит к выработке кинуренинов, которые, как было показано, оказывают иммуносупрессивное действие на Т-клетки в микроокружении опухоли. См. например, Platten et al. (2012) Cancer Res. 72(21):5435-40.One immunosuppressive signal is mediated by tryptophan catabolism. Tryptophan catabolism by indolamine 2,3-dioxygenase (IDO) in cancer cells results in the production of kynurenins, which have been shown to have an immunosuppressive effect on T cells in the tumor microenvironment. See, for example, Platten et al. (2012) Cancer Res. 72(21):5435-40.

В одном варианте реализации донорная матрица репарации содержит фермент с кинурениназной активностью.In one embodiment, the repair donor matrix contains an enzyme with kynureninase activity.

Иллюстративные примеры ферментов, обладающих кинурениназной активностью, подходящих для применения в частных вариантах реализации, включают, среди прочего, L-кинуренингидролазу.Illustrative examples of enzymes having kynureninase activity suitable for use in private embodiments include, among others, L-kynurenine hydrolase.

В одном варианте реализации донорная матрица репарации содержит один или более полинуклеотидов, кодирующих демпфер иммуносупрессивного сигнала, который уменьшает или блокирует передачу иммуносупрессивных сигналов, опосредованную иммуносупрессивным фактором.In one embodiment, the donor repair template contains one or more polynucleotides encoding an immunosuppressive signal damper that reduces or blocks immunosuppressive signaling mediated by an immunosuppressive factor.

Иллюстративные примеры иммуносупрессивных факторов, на которые нацелены демпферы иммуносупрессивного сигнала, рассматриваемые в частных вариантах реализации включают, среди прочего: лиганд запрограммированной смерти 1 (PD-L1), лиганд запрограммированной смерти 2 (PD-L2), трансформирующий фактор роста β (TGFβ), макрофагальный колониестимулирующий фактор 1 (M-CSF1), родственный фактору некроза опухоли лиганд, индуцирующий апоптоз (TRAIL), рецептор-связывающий раковый антиген, экспрессированный на лиганде клеток SiSo (RCAS1), лиганд Fas (FasL), CD47, интерлейкин-4 (IL-4), интерлейкин-6 (IL-6), интерлейкин-8 (IL-8), интерлейкин-10 (IL-10) и интерлейкин-13 (IL-13).Illustrative examples of immunosuppressive factors targeted by immunosuppressive signal dampers contemplated in particular embodiments include, but are not limited to: programmed death ligand 1 (PD-L1), programmed death ligand 2 (PD-L2), transforming growth factor β (TGFβ), macrophage colony-stimulating factor 1 (M-CSF1), tumor necrosis factor-related apoptosis-inducing ligand (TRAIL), cancer receptor-binding antigen expressed on cell ligand SiSo (RCAS1), Fas ligand (FasL), CD47, interleukin-4 (IL -4), interleukin-6 (IL-6), interleukin-8 (IL-8), interleukin-10 (IL-10) and interleukin-13 (IL-13).

В различных вариантах реализации демпфер иммуносупрессивного сигнала содержит антитело или его антигенсвязывающий фрагмент, который связывает иммуносупрессивный фактор.In various embodiments, the immunosuppressive signal damper comprises an antibody, or an antigen-binding fragment thereof, that binds an immunosuppressive factor.

В различных вариантах реализации демпфер иммуносупрессивного сигнала содержит экзодомен, который связывает иммуносупрессивный фактор.In various embodiments, the immunosuppressive signal damper comprises an exodomain that binds an immunosuppressive factor.

В частных вариантах реализации демпфер иммуносупрессивного сигнала содержит экзодомен, который связывает иммуносупрессивный фактор и трансмембранный домен.In particular embodiments, the immunosuppressive signal damper comprises an exodomain that binds the immunosuppressive factor and the transmembrane domain.

В другом варианте реализации демпфер иммуносупрессивного сигнала содержит экзодомен, который связывает иммуносупрессивный фактор, трансмембранный домен и модифицированный эндодомен, который не трансдуцирует или который обладает существенно сниженной способностью трансдуцировать иммуносупрессивные сигналы.In another embodiment, the immunosuppressive signal damper comprises an exodomain that binds an immunosuppressive factor, a transmembrane domain, and a modified endodomain that does not transduce or that has a substantially reduced ability to transduce immunosuppressive signals.

Используемый в настоящей заявке термин «экзодомен» относится к антиген-связывающему домену. В одном варианте реализации экзодомен представляет собой внеклеточный лиганд-связывающий домен иммуносупрессивного рецептора, который трансдуцирует иммуносупрессивные сигналы из микроокружения опухоли в Т-клетку. В частных вариантах реализации «экзодомен» относится к внеклеточному лиганд- связывающему домену рецептора, который содержит иммунорецепторный тирозиновый ингибирующий мотив (ITIM) и/или иммунорецепторный мотив переключения тирозина (ITSM).Used in this application, the term "exodomain" refers to the antigen-binding domain. In one embodiment, the exodomain is an extracellular ligand-binding domain of an immunosuppressive receptor that transduces immunosuppressive signals from the tumor microenvironment into a T cell. In particular embodiments, "exodomain" refers to the extracellular ligand-binding domain of a receptor that contains an immunoreceptor tyrosine inhibitory motif (ITIM) and/or an immunoreceptor tyrosine switch motif (ITSM).

Иллюстративные примеры экзодоменов, подходящих для применения в частных вариантах реализации демпферов иммуносупрессивного сигнала, включают, среди прочего, антитела или их антигенсвязывающие фрагменты или внеклеточные лиганд-связывающие домены, выделенные из следующих полипептидов: белок запрограммированной гибели клеток 1 (PD-1), белок гена активации лимфоцитов 3 (LAG-3), домен Т-клеточного иммуноглобулина и белок 3 муцинового домена (TIM3), антиген 4 цитотоксических Т лимфоцитов 4 (CTLA-4), B- и T-лимфоцитарный аттенюатор (BTLA), иммуноглобулин Т-клеток и иммунорецепторный домен ингибирующий мотива на основе тирозина (TIGIT), рецептор II трансформирующего фактора роста β (TGFβRII), рецептор макрофагального колониестимулирующего фактора 1 (CSF1R), рецептор интерлейкина 4 (IL4R), рецептор интерлейкина 6 (IL6R), рецептор хемокина (мотив C-X-C) 1 (CXCR1), рецептор 2 хемокина (мотив C-X-C) (CXCR2), субъединица альфа-рецептора интерлейкина 10 (IL10R), субъединица рецептора интерлейкина 13 альфа-2 (IL13Rα2), рецептор к апоптоз-индуцирующему лиганду семейства TNF (TRAILR1), рецептор-связывающий раковый антиген, экспрессируемый на клетках SiSo (RCAS1R), и рецептор гибели на поверхности клетки Fas (FAS).Illustrative examples of exodomains suitable for use in particular embodiments of immunosuppressive signal dampers include, among others, antibodies or antigen-binding fragments or extracellular ligand-binding domains isolated from the following polypeptides: programmed cell death protein 1 (PD-1), gene protein lymphocyte activation 3 (LAG-3), immunoglobulin T-cell domain and mucin domain protein 3 (TIM3), cytotoxic T-lymphocyte antigen 4 4 (CTLA-4), B- and T-lymphocyte attenuator (BTLA), T-cell immunoglobulin and immunoreceptor domain inhibitory motif tyrosine (TIGIT), transforming growth factor β receptor II (TGFβRII), macrophage colony stimulating factor 1 receptor (CSF1R), interleukin 4 receptor (IL4R), interleukin 6 receptor (IL6R), chemokine receptor (C-X-C motif ) 1 (CXCR1), chemokine receptor 2 (C-X-C motif) (CXCR2), interleukin 10 receptor alpha subunit (IL10R), interleukin 13 receptor subunit alpha-2 (IL13Rα2), TNF family apoptosis-inducing ligand receptor (TRAILR1), SiSo cell-expressed cancer antigen receptor-binding (RCAS1R), and cell surface death receptor Fas (FAS).

В одном варианте реализации экзодомен содержит внеклеточный лиганд-связывающий домен рецептора, выбранный из группы, состоящей из: PD-1, LAG-3, TIM3, CTLA-4, IL10R, TIGIT, CSF1R и TGFβRII.In one embodiment, the exodomain comprises an extracellular ligand-binding receptor domain selected from the group consisting of: PD-1, LAG-3, TIM3, CTLA-4, IL10R, TIGIT, CSF1R, and TGFβRII.

В частных вариантах реализации может быть использован ряд трансмембранных доменов. Иллюстративные примеры трансмембранных доменов, подходящих для применения в частных вариантах реализации демпферов иммуносупрессивного сигнала, рассматриваемых в частных вариантах реализации включают, среди прочего, трансмембранные домены следующих белков: альфа- или бета-цепь рецептора Т-клеток, CDδ, CD3ε, CDγ, CD3ζ, CD4, CD5, CD8α, CD9, CD 16, CD22, CD27, CD28, CD33, CD37, CD45, CD64, CD80, CD86, CD 134, CD137, CD152, CD154 и PD-1.In private embodiments, a number of transmembrane domains may be used. Illustrative examples of transmembrane domains suitable for use in particular embodiments of immunosuppressive signal dampers contemplated in particular embodiments include, but are not limited to, transmembrane domains of the following proteins: T cell receptor alpha or beta chain, CDδ, CD3ε, CDγ, CD3ζ, CD4, CD5, CD8α, CD9, CD 16, CD22, CD27, CD28, CD33, CD37, CD45, CD64, CD80, CD86, CD 134, CD137, CD152, CD154 and PD-1.

В частных вариантах реализации рассматриваемая в настоящей заявке адоптивная клеточная терапия включает в себя демпфер иммуносупрессивного сигнала, который ингибирует или блокирует трансдукцию иммуносупрессивных сигналов TGFβ из микроокружения опухоли через TGFβRII. В одном варианте реализации демпфер иммуносупрессивного сигнала содержит экзодомен, который содержит связывание внеклеточного лиганда TGFβRII, трансмембранный домен TGFβRII и усеченный нефункциональный эндодомен TGFβRII. В другом варианте реализации демпфер иммуносупрессивного сигнала содержит экзодомен, который содержит связывание внеклеточного лиганда TGFβRII, трансмембранный домен TGFβRII и не имеет эндодомена.In particular embodiments, the adoptive cell therapy contemplated herein comprises an immunosuppressive signal damper that inhibits or blocks the transduction of TGFβ immunosuppressive signals from the tumor microenvironment via TGFβRII. In one embodiment, the immunosuppressive signal damper comprises an exodomain that contains TGFβRII extracellular ligand binding, a TGFβRII transmembrane domain, and a truncated non-functional TGFβRII endodomain. In another embodiment, the immunosuppressive signal damper comprises an exodomain that contains TGFβRII extracellular ligand binding, a TGFβRII transmembrane domain, and no endodomain.

3. Сконструированные антигенные рецепторы3. Engineered antigen receptors

В частных вариантах реализации рассматриваемые в настоящей заявке иммунные эффекторные клетки с отредактированным геномом содержат сконструированный антигенный рецептор. В одном варианте реализации Т-клетки сконструированы сконструированным способом путем введения DSB в один или более генов PD-1 в присутствии донорной матрицы репарации, кодирующей сконструированный антигенный рецептор.In particular embodiments, the genome-edited immune effector cells contemplated herein comprise an engineered antigen receptor. In one embodiment, the T cells are engineered by introducing a DSB into one or more PD-1 genes in the presence of a donor repair template encoding the engineered antigen receptor.

В частных вариантах реализации сконструированный антигенный рецептор представляет собой сконструированный рецептор Т-клеток (TCR), химерный антигенный рецептор (CAR), рецептор Daric или его компоненты или химерный рецептор цитокинов.In particular embodiments, the engineered antigen receptor is a T cell engineered receptor (TCR), a chimeric antigen receptor (CAR), a Daric receptor or components thereof, or a chimeric cytokine receptor.

a. Сконструированные TCRa. Engineered TCRs

В частных вариантах реализации рассматриваемые в настоящей заявке с отредактированным геномом иммунные эффекторные клетки содержат сконструированный TCR. В одном варианте реализации Т-клетки сконструированы путем введения DSB в один или более генов PD-1 в присутствии донорной матрицы репарации, кодирующей сконструированный TCR. В частном варианте реализации сконструированный TCR вставляют в DSB в одном гене PD-1. В другом варианте альфа-цепь сконструированного TCR вставляют в DSB в одном гене PD-1, а бета-цепь сконструированного TCR вставляют в DSB в другом гене PD-1.In particular embodiments, the genome-edited immune effector cells contemplated herein comprise an engineered TCR. In one embodiment, T cells are constructed by introducing a DSB into one or more PD-1 genes in the presence of a donor repair template encoding the engineered TCR. In a particular embodiment, the engineered TCR is inserted into a DSB in one PD-1 gene. In another embodiment, the engineered TCR alpha chain is inserted into a DSB in one PD-1 gene and the engineered TCR beta chain is inserted into a DSB in another PD-1 gene.

В одном варианте реализации сконструированные T-клетки, рассматриваемые в настоящей заявке, содержат сконструированный TCR, который не встроен в ген PD-1, и один или более из: демпфера иммуносупрессивного сигнала, флип-рецептора, альфа- и/или бета-цепи сконструированного Т-клеточного рецептора (TCR), химерного антигенного рецептора (CAR), рецептора Daric или его компонентов или химерного цитокинового рецептора вставляют в DSB в одном или нескольких генах PD-1.In one embodiment, the engineered T cells of this application comprise an engineered TCR that is not integrated into the PD-1 gene and one or more of: an immunosuppressive signal damper, a flip receptor, an alpha and/or beta chain of the engineered A T cell receptor (TCR), a chimeric antigen receptor (CAR), the Daric receptor or components thereof, or a chimeric cytokine receptor is inserted into the DSB at one or more PD-1 genes.

Встречающиеся в природе рецепторы Т-клеток содержат две субъединицы: субъединицу альфа-цепи и бета-цепи, каждая из которых является уникальным белком, продуцируемым в результате рекомбинации в геноме каждой Т-клетки. Библиотеки TCR могут быть подвергнуты скринингу на их селективность к конкретным антигенам-мишеням. Таким образом, природные TCR, которые обладают высокой авидностью и реактивностью по отношению к антигенам-мишеням, могут быть отобраны, клонированы и впоследствии введены в популяцию Т-клеток, используемых для адоптивной иммунотерапии.Naturally occurring T cell receptors contain two subunits, an alpha chain subunit and a beta chain subunit, each of which is a unique protein produced by recombination in the genome of each T cell. TCR libraries can be screened for their selectivity for specific target antigens. Thus, natural TCRs that have high avidity and reactivity towards target antigens can be selected, cloned and subsequently introduced into the T cell population used for adoptive immunotherapy.

В одном варианте реализации Т-клетки модифицируют путем введения донорной матрицы репарации, содержащей полинуклеотид, кодирующий субъединицу TCR в DSB в одном или нескольких генах PD-1, причем указанная субъединица TCR обладает способностью образовывать TCR, которые придают специфичность Т-клеткам против опухолевых клеток, экспрессирующих антиген-мишень. В частных вариантах реализации эти субъединицы имеют одну или более аминокислотных замен, делеций, инсерций или модификаций по сравнению с встречающейся в природе субъединицей, при условии, что субъединицы сохраняют способность образовывать TCR и наделяют трансфицированные T-клетки способностью хоминга в направлении клеток-мишеней, и участвуют в иммунологически релевантной передаче сигналов цитокинов. Эти сконструированные TCR предпочтительно также связывают клетки-мишени, демонстрируя соответствующий опухоль-ассоциированный пептид с высокой авидностью, и необязательно обеспечивают эффективное уничтожение клеток-мишеней, презентирующих соответствующий пептид in vivo.In one embodiment, T cells are modified by introducing a repair donor template containing a polynucleotide encoding a TCR subunit of the DSB in one or more PD-1 genes, said TCR subunit having the ability to form TCRs that confer specificity for T cells against tumor cells, expressing the target antigen. In particular embodiments, these subunits have one or more amino acid substitutions, deletions, insertions, or modifications compared to the naturally occurring subunit, provided that the subunits retain the ability to form TCRs and confer the ability of the transfected T cells to hom to target cells, and involved in immunologically relevant cytokine signaling. These engineered TCRs preferably also bind target cells, displaying the respective tumor-associated peptide with high avidity, and optionally ensure efficient killing of target cells presenting the respective peptide in vivo.

Нуклеиновые кислоты, кодирующие сконструированный TCR, предпочтительно выделяют из их естественного контекста во (встречающейся в природе) хромосоме Т-клетки и могут быть встроены в подходящие векторы, как описано в другом месте настоящей заявки. Как нуклеиновые кислоты, так и векторы, которые их содержат, могут быть перенесены в клетку, предпочтительно в Т-клетку в частных вариантах реализации. Такие модифицированные Т-клетки затем способны экспрессировать одну или более цепей TCR, кодируемых трансдуцированной нуклеиновой кислотой или нуклеиновыми кислотами. В предпочтительных вариантах реализации сконструированный TCR представляет собой экзогенный TCR, потому что он введен в T-клетки, которые обычно не экспрессируют данный конкретный TCR. Существенным аспектом этих сконструированных TCR является то, что он обладает высокой авидностью к опухолевому антигену, представленному основным комплексом гистосовместимости (MHC) или аналогичным иммунологическим компонентом. В отличие от сконструированного TCR, CAR сконструированы так, чтобы связывать целевые антигены MHC-независимым способом.Nucleic acids encoding the engineered TCR are preferably isolated from their natural context on the (naturally occurring) chromosome of the T cell and can be inserted into suitable vectors as described elsewhere in this application. Both the nucleic acids and the vectors that contain them can be transferred into a cell, preferably a T cell in particular embodiments. Such modified T cells are then capable of expressing one or more TCR strands encoded by the transduced nucleic acid or nucleic acids. In preferred embodiments, the engineered TCR is an exogenous TCR because it is introduced into T cells that do not normally express that particular TCR. An essential aspect of these engineered TCRs is that it has high avidity for a tumor antigen represented by a major histocompatibility complex (MHC) or similar immunological component. Unlike engineered TCR, CARs are engineered to bind target antigens in an MHC-independent manner.

TCR может быть экспрессирован дополнительными полипептидами, присоединенными к аминоконцевой или карбоксил-концевой части альфа-цепи или бета-цепи по настоящему изобретению TCR, если только присоединенный дополнительный полипептид не влияет на способность альфа-цепи или бета-цепи сформировать функциональный Т-клеточный рецептор и MHC-зависимое распознавание антигена.The TCR may be expressed by additional polypeptides attached to the amino-terminal or carboxyl-terminal portion of the alpha or beta chain of the present TCR unless the attached additional polypeptide interferes with the ability of the alpha or beta chain to form a functional T cell receptor and MHC-dependent antigen recognition.

Антигены, которые распознаются сконструированным TCR, рассматриваемыми в частных вариантах реализации, включают, среди прочего, антигены рака, включая антигены как при гематологическом раке, так и в солидных опухолях. Иллюстративные антигены включают, среди прочего, альфа-фолатный рецептор, альфа-фолатный рецептор, 5T4, интегрин αvβ6, BCMA, B7-H3, B7-H6, CAIX, CD19, CD20, CD22, CD30, CD33, CD44, CD44v6, CD44v7/8, CD70, CD79a, CD79b, CD123, CD138, CD171, CEA, CSPG4, EGFR, семейство EGFR включая ErbB2 (HER2), EGFRvIII, EGP2, EGP40, EPCAM, EphA2, EpCAM, FAP, фетальный AchR, FRα, GD2, GD3, глипикан-3 (GPC3), HLA-A1+MAGE1, HLA-A2+MAGE1, HLA-A3+MAGE1, HLA-A1+NY-ESO-1, HLA-A2+NY-ESO-1, HLA-A3+NY-ESO-1, IL-11Rα, IL-13Rα2, лямбда, Lewis-Y, Каппа, мезотелин, Muc1, Muc16, NCAM, лиганды NKG2D, NY-ESO-1, PRAME, PSCA, PSMA, ROR1, SSX, сурвивин, TAG72, TEMs, VEGFR2 и WT-1.Antigens that are recognized by the engineered TCR considered in particular embodiments include, among others, cancer antigens, including antigens in both hematologic cancer and solid tumors. Illustrative antigens include, among others, alpha folate receptor, alpha folate receptor, 5T4, αvβ6 integrin, BCMA, B7-H3, B7-H6, CAIX, CD19, CD20, CD22, CD30, CD33, CD44, CD44v6, CD44v7/ 8, CD70, CD79a, CD79b, CD123, CD138, CD171, CEA, CSPG4, EGFR, EGFR family including ErbB2 (HER2), EGFRvIII, EGP2, EGP40, EPCAM, EphA2, EpCAM, FAP, Fetal AchR, FRα, GD2, GD3 , glypican-3 (GPC3), HLA-A1+MAGE1, HLA-A2+MAGE1, HLA-A3+MAGE1, HLA-A1+NY-ESO-1, HLA-A2+NY-ESO-1, HLA-A3+ NY-ESO-1, IL-11Rα, IL-13Rα2, lambda, Lewis-Y, Kappa, mesothelin, Muc1, Muc16, NCAM, NKG2D ligands, NY-ESO-1, PRAME, PSCA, PSMA, ROR1, SSX, survivin , TAG72, TEMs, VEGFR2 and WT-1.

В одном варианте реализации донорная матрица репарации содержит полинуклеотид, кодирующий промотор РНК-полимеразы II или первый саморасщепляемый вирусный пептид, и полинуклеотид, кодирующий альфа-цепь и/или бета-цепь сконструированного TCR, встроенного в один модифицированный и/или нефункциональный ген PD-1.In one embodiment, the repair donor template comprises a polynucleotide encoding an RNA polymerase II promoter or a first self-cleaving viral peptide and a polynucleotide encoding the alpha and/or beta chain of an engineered TCR inserted into a single modified and/or non-functional PD-1 gene. .

В одном варианте реализации донорная матрица репарации содержит полинуклеотид, кодирующий промотор РНК-полимеразы II или первый саморасщепляемый вирусный пептид, и полинуклеотид, кодирующий альфа-цепь и бета-цепь сконструированного TCR, встроенные в один модифицированный и/или нефункциональный ген PD-1.In one embodiment, the repair donor template comprises a polynucleotide encoding an RNA polymerase II promoter or a first self-cleaving viral peptide and a polynucleotide encoding an engineered TCR alpha chain and beta chain inserted into a single modified and/or non-functional PD-1 gene.

В частном варианте реализации донорная матрица репарации содержит в направлении от 5' до 3', полинуклеотид, кодирующий первый саморасщепляемый вирусный пептид, полинуклеотид, кодирующий альфа-цепь сконструированного TCR, полинуклеотид, кодирующий второй саморасщепляемый вирусный пептид, и полинуклеотид, кодирующий бета-цепь сконструированного TCR, встроенные в один модифицированный и/или нефункциональный ген PD-1. В таком случае другой ген PD-1 может быть функциональным или может иметь пониженную функцию или быть лишенным функциональности посредством DSB и репарации методом NHEJ. В одном варианте реализации другой ген PD-1 был модифицирован сконструированной нуклеазой, рассматриваемой в настоящей заявке, и может иметь пониженную функцию или быть лишенным функциональности.In a particular embodiment, the repair donor template comprises, in the 5' to 3' direction, a polynucleotide encoding the first self-cleaving viral peptide, a polynucleotide encoding the alpha chain of the engineered TCR, a polynucleotide encoding the second self-cleaving viral peptide, and a polynucleotide encoding the beta chain of the engineered TCR. TCRs inserted into a single modified and/or non-functional PD-1 gene. In such a case, the other PD-1 gene may be functional, or may be down-functional or de-functionalized by DSB and NHEJ repair. In one embodiment, another PD-1 gene has been modified with the engineered nuclease of this application and may have reduced or no functionality.

В определенном варианте реализации оба гена PD-1 модифицированы и имеют пониженную функцию или являются нефункциональными: первый модифицированный ген PD-1 содержит нуклеиновую кислоту, включающую полинуклеотид, кодирующий первый саморасщепляемый вирусный пептид, и полинуклеотид, кодирующий альфа-цепь сконструированный TCR, а второй модифицированный ген PD-1 содержит полинуклеотид, кодирующий второй саморасщепляемый вирусный пептид, и полинуклеотид, кодирующий бета-цепь сконструированного TCR.In a certain embodiment, both PD-1 genes are modified and have reduced function or are non-functional: the first modified PD-1 gene contains a nucleic acid comprising a polynucleotide encoding a first self-cleaving viral peptide and a polynucleotide encoding an engineered TCR alpha chain, and a second modified the PD-1 gene contains a polynucleotide encoding a second self-cleaving viral peptide and a polynucleotide encoding the engineered TCR beta chain.

b. Химерные антигенные рецепторы (CAR)b. Chimeric antigen receptors (CAR)

В частных вариантах реализации сконструированные иммунные эффекторные клетки, рассматриваемые в настоящей заявке, содержат один или более химерных антигенных рецепторов (CAR). В одном варианте реализации Т-клетки сконструированы путем введения DSB в один или более генов PD-1 в присутствии донорной матрицы репарации, кодирующей CAR. В частном варианте реализации CAR вставляют в DSB в одном гене PD-1.In private embodiments, the engineered immune effector cells contemplated herein comprise one or more chimeric antigen receptors (CARs). In one embodiment, T cells are constructed by introducing DSB into one or more PD-1 genes in the presence of a donor repair template encoding CAR. In a particular embodiment, CARs are inserted into the DSB in one PD-1 gene.

В одном варианте реализации сконструированные T-клетки, рассматриваемые в настоящей заявке, содержат CAR, который не встроен в ген PD-1 и одно или более из: демпфера иммуносупрессивного сигнала, флип-рецептора, альфа- и/или бета-цепи сконструированного Т-клеточного рецептора (TCR), химерного цитокинового рецептора (CAR), рецептора Daric или их компонентов или химерный антигенный рецептор встроен в DSB в одном или нескольких генах PD-1.In one embodiment, the engineered T cells of this application contain a CAR that is not integrated into the PD-1 gene and one or more of: an immunosuppressive signal damper, a flip receptor, an engineered T-alpha and/or beta chain. a cellular receptor (TCR), a chimeric cytokine receptor (CAR), a Daric receptor or components thereof, or a chimeric antigen receptor is integrated into the DSB in one or more PD-1 genes.

В различных вариантах реализации Т-клетки с отредактированным геномом экспрессируют CAR, которые перенаправляют цитотоксичность на опухолевые клетки. CAR представляют собой молекулы, которые сочетают основанную на антителах специфичность к антигену-мишени (например, опухолевому антигену) с внутриклеточным доменом, активирующим рецептор Т-клеток, чтобы генерировать химерный белок, который проявляет специфическую противоопухолевую клеточную иммунную активность. Используемый в настоящей заявке термин «химерный» указывает, что белок состоит из частей разных белков или ДНК различного происхождения.In various embodiments, genome-edited T cells express CARs that redirect cytotoxicity to tumor cells. CARs are molecules that combine antibody-based specificity for a target antigen (eg, tumor antigen) with an intracellular T cell receptor activating domain to generate a chimeric protein that exhibits specific antitumor cellular immune activity. Used in this application, the term "chimeric" indicates that the protein consists of parts of different proteins or DNA of different origin.

В различных вариантах реализации CAR содержит внеклеточный домен, который связывается со специфическим антигеном-мишенью (также называемым связывающим доменом или антигенспецифическим связывающим доменом), трансмембранным доменом и внутриклеточным сигнальным доменом. Основными характеристиками CAR являются их способность перенаправлять специфичность иммунных эффекторных клеток, тем самым вызывая пролиферацию, выработку цитокинов, фагоцитоз или выработку молекул, которые могут опосредовать клеточную гибель экспрессирующей антиген клетки-мишени независимым от главного комплекса гистосовместимости (MHC) способом, используя способности к специфическому нацеливанию на клетку моноклональных антител, растворимых лигандов или клетко-специфических корецепторов.In various embodiments, the CAR contains an extracellular domain that binds to a specific target antigen (also called a binding domain or an antigen-specific binding domain), a transmembrane domain, and an intracellular signaling domain. The main characteristics of CARs are their ability to redirect the specificity of immune effector cells, thereby inducing proliferation, cytokine production, phagocytosis, or the production of molecules that can mediate cell death of an antigen-expressing target cell in a major histocompatibility complex (MHC) independent manner using specific targeting abilities. on the cell of monoclonal antibodies, soluble ligands or cell-specific co-receptors.

В частных вариантах реализации CAR содержат внеклеточный связывающий домен, который специфически связывается с полипептидом-мишенью, например, антигеном-мишенью, экспрессируемым в опухолевой клетке. Используемые в настоящей заявке термины «связывающий домен», «внеклеточный домен», «внеклеточный связывающий домен», «антиген-связывающий домен», «антигенспецифический связывающий домен» и «внеклеточный антигенспецифический связывающий домен» используются взаимозаменяемо и обозначают химерный рецептор, например, CAR или Daric, со способностью специфически связываться с рассматриваемым антигеном-мишенью. Связывающий домен может содержать любой белок, полипептид, олигопептид или пептид, который обладает способностью специфически распознавать и связываться с биологической молекулой (например, рецептором клеточной поверхности или опухолевым белком, липидом, полисахаридом или другой целевой молекулой клеточной поверхности, или его компонентом). Связывающий домен включает любой встречающийся в природе синтетический, полусинтетический или рекомбинантно полученный связывающий партнер для рассматриваемой биологической молекулы.In particular embodiments, CARs comprise an extracellular binding domain that specifically binds to a target polypeptide, eg, a target antigen expressed in a tumor cell. As used herein, the terms "binding domain", "extracellular domain", "extracellular binding domain", "antigen binding domain", "antigen-specific binding domain", and "extracellular antigen-specific binding domain" are used interchangeably and refer to a chimeric receptor, e.g., CAR or Daric, with the ability to specifically bind to the target antigen in question. The binding domain may comprise any protein, polypeptide, oligopeptide, or peptide that has the ability to specifically recognize and bind to a biological molecule (e.g., a cell surface receptor or tumor protein, lipid, polysaccharide, or other target cell surface molecule, or component thereof). The binding domain includes any naturally occurring synthetic, semi-synthetic or recombinantly produced binding partner for the biological molecule in question.

В частных вариантах реализации внеклеточный связывающий домен содержит антитело или его антигенсвязывающий фрагмент.In particular embodiments, the extracellular binding domain comprises an antibody or an antigen-binding fragment thereof.

Термин «антитело» относится к связывающему агенту, который представляет собой полипептид, содержащий по меньшей мере вариабельную область легкой или тяжелой цепи иммуноглобулина, которая специфически распознает и связывает эпитоп антигена-мишени, такого как пептид, липид, полисахарид или нуклеиновая кислота, содержащая антигенный детерминант, например, распознаваемые иммунной клеткой. Антитела включают антигенсвязывающие фрагменты, например, Camel Ig (антитело верблюдовых или его фрагмент VHH), Ig NAR, фрагменты Fab, фрагменты Fab', фрагменты F(ab)' 2, фрагменты F(ab)'3, Fv, одноцепочечный вариабельный фрагмент антитела Fv («scFv»), бис-scFv, (scFv) 2, миниантитело, диатело, триатело, тетратело, стабилизированный дисульфидом белок Fv («dsFv») и однодоменное антитело (sdAb, Nanobody) или другие соответствующие фрагменты антител. Термин также включает сконструированные формы, такие как химерные антитела (например, гуманизированные мышиные антитела), гетероконъюгатные антитела (такие как биспецифичные антитела) и их антигенсвязывающие фрагменты. См. также, Pierce Catalog and Handbook, 1994-1995 (Pierce Chemical Co., Rockford, IL); Kuby, J., Immunology, 3rd Ed., W. H. Freeman & Co., New York, 1997.The term "antibody" refers to a binding agent that is a polypeptide containing at least an immunoglobulin light or heavy chain variable region that specifically recognizes and binds an epitope of a target antigen, such as a peptide, lipid, polysaccharide, or nucleic acid containing an antigenic determinant. , for example, recognized by an immune cell. Antibodies include antigen-binding fragments, e.g., Camel Ig (camelid antibody or VHH fragment thereof), NAR Ig, Fab fragments, Fab' fragments, F(ab)'2 fragments, F(ab)'3 fragments, Fv, single chain variable antibody fragment Fv ("scFv"), bis-scFv, (scFv) 2, minibody, diabody, triatebody, tetrabody, disulfide stabilized Fv protein ("dsFv") and single domain antibody (sdAb, Nanobody) or other appropriate antibody fragments. The term also includes engineered forms such as chimeric antibodies (eg, humanized mouse antibodies), heteroconjugate antibodies (such as bispecific antibodies), and antigen-binding fragments thereof. See also, Pierce Catalog and Handbook, 1994-1995 (Pierce Chemical Co., Rockford, IL); Kuby, J., Immunology, 3rd Ed., W. H. Freeman & Co., New York, 1997.

В одном предпочтительном варианте реализации связывающий домен представляет собой scFv.In one preferred embodiment, the binding domain is scFv.

В другом предпочтительном варианте реализации связывающий домен представляет собой антитело верблюдовых.In another preferred embodiment, the binding domain is a camelid antibody.

В частных вариантах реализации CAR содержит внеклеточный домен, который связывает антиген, выбранный из группы, состоящей из: рецептора альфа-фолата, 5T4, интегрина αvβ6, BCMA, B7-H3, B7-H6, CAIX, CD16, CD19, CD20, CD22, CD30, CD33, CD44, CD44v6, CD44v7/8, CD70, CD79a, CD79b, CD123, CD138, CD171, CEA, CSPG4, EGFR, семейства EGFR включая ErbB2 (HER2), EGFRvIII, EGP2, EGP40, EPCAM, EphA2, EpCAM, FAP, фетального AchR, FRα, GD2, GD3, глипикана-3 (GPC3), HLA-A1+MAGE1, HLA-A2+MAGE1, HLA-A3+MAGE1, HLA-A1+NY-ESO-1, HLA-A2+NY-ESO-1, HLA-A3+NY-ESO-1, IL-11Rα, IL-13Rα2, Лямбда, Lewis-Y, Каппа, мезотелина, Muc1, Muc16, NCAM, лигандов NKG2D, NY-ESO-1, PRAME, PSCA, PSMA, ROR1, SSX, сурвивина, TAG72, TEMs, VEGFR2 и WT-1.In particular embodiments, the CAR contains an extracellular domain that binds an antigen selected from the group consisting of: alpha folate receptor, 5T4, αvβ6 integrin, BCMA, B7-H3, B7-H6, CAIX, CD16, CD19, CD20, CD22, CD30, CD33, CD44, CD44v6, CD44v7/8, CD70, CD79a, CD79b, CD123, CD138, CD171, CEA, CSPG4, EGFR, EGFR families including ErbB2 (HER2), EGFRvIII, EGP2, EGP40, EPCAM, EphA2, EpCAM, FAP, fetal AchR, FRα, GD2, GD3, glypican-3 (GPC3), HLA-A1+MAGE1, HLA-A2+MAGE1, HLA-A3+MAGE1, HLA-A1+NY-ESO-1, HLA-A2+ NY-ESO-1, HLA-A3+NY-ESO-1, IL-11Rα, IL-13Rα2, Lambda, Lewis-Y, Kappa, mesothelin, Muc1, Muc16, NCAM, NKG2D ligands, NY-ESO-1, PRAME , PSCA, PSMA, ROR1, SSX, Survivin, TAG72, TEMs, VEGFR2 and WT-1.

В частных вариантах реализации CAR содержат внеклеточный связывающий домен, например антитело или его антигенсвязывающий фрагмент, который связывает антиген, причем указанный антиген представляет собой комплекс MHC-пептид, такой как комплекс MHC класса I-пептид или комплекс MHC класса II -пептид.In particular embodiments, CARs comprise an extracellular binding domain, such as an antibody or antigen-binding fragment thereof, that binds an antigen, said antigen being an MHC-peptide complex, such as an MHC class I-peptide complex or an MHC class II-peptide complex.

В некоторых случаях CAR содержат остатки линкера между различными доменами. «Связывающая последовательность вариабельных областей» представляет собой аминокислотную последовательность, которая связывает вариабельную область тяжелой цепи с вариабельной областью легкой цепи и обеспечивает функцию спейсера, совместимую с взаимодействием двух связывающих доменов, так что полученный полипептид сохраняет специфическую аффинность связывания с той же молекулой-мишенью, что и антитело, которое содержит те же вариабельные области легкой и тяжелой цепи. В частных вариантах реализации CAR содержат один, два, три, четыре или пять или более линкеров. В частных вариантах реализации длина линкера составляет от приблизительно 1 до приблизительно 25 аминокислот, от приблизительно 5 до приблизительно 20 аминокислот или от приблизительно 10 до приблизительно 20 аминокислот или любую промежуточную длину аминокислот.В некоторых вариантах реализации длина линкера составляет 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22 23, 24, 25 или более аминокислот.In some cases, CARs contain linker residues between different domains. A "variable region binding sequence" is an amino acid sequence that links a heavy chain variable region to a light chain variable region and provides a spacer function compatible with the interaction of two binding domains such that the resulting polypeptide retains a specific binding affinity for the same target molecule that and an antibody that contains the same light and heavy chain variable regions. In private embodiments, CARs contain one, two, three, four, or five or more linkers. In particular embodiments, the linker length is from about 1 to about 25 amino acids, from about 5 to about 20 amino acids, or from about 10 to about 20 amino acids, or any intermediate amino acid length. In some embodiments, the linker length is 1, 2, 3, 4 , 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22 23, 24, 25 or more amino acids.

В частных вариантах реализации за связывающим доменом CAR следует один или более «спейсерных доменов», т.е. областей, которые перемещает антиген связывающий домен прочь от поверхности эффекторных клеток, чтобы обеспечить надлежащий межклеточный контакт, связывание антигена и активацию (Patel et al., Gene Therapy, 1999; 6: 412-419). Спейсерный домен может быть получен из природного, синтетического, полусинтетического или рекомбинантного источника. В некоторых случаях спейсерный домен представляет собой часть иммуноглобулина, включая, среди прочего, одну или более константных областей тяжелой цепи, например, CH2 и CH3. Спейсерный домен может включать аминокислотную последовательность встречающейся в природе шарнирной области иммуноглобулина или измененную шарнирную область иммуноглобулина.In particular embodiments, the CAR binding domain is followed by one or more "spacer domains", ie. regions that move the antigen binding domain away from the surface of effector cells to allow proper intercellular contact, antigen binding and activation (Patel et al., Gene Therapy, 1999; 6: 412-419). The spacer domain can be derived from a natural, synthetic, semi-synthetic or recombinant source. In some instances, the spacer domain is part of an immunoglobulin, including but not limited to one or more heavy chain constant regions, such as CH2 and CH3. The spacer domain may include the amino acid sequence of a naturally occurring immunoglobulin hinge region or an altered immunoglobulin hinge region.

В одном варианте спейсерный домен содержит CH2 и CH3 иммуноглобулина IgG1, IgG4, или IgD.In one embodiment, the spacer domain contains the CH2 and CH3 of an IgG1, IgG4, or IgD immunoglobulin.

В одном варианте реализации связывающий домен CAR связан с одним или несколькими «шарнирными доменами», которые играют свою роль в помещении антиген-связывающего домена вдали от поверхности эффекторных клеток, чтобы обеспечить надлежащий межклеточный контакт, связывание антигена и активацию. CAR обычно содержит один или более шарнирных доменов между связывающим доменом и трансмембранным доменом (TM). Шарнирный домен может быть получен из природного, синтетического, полусинтетического или рекомбинантного источника. Шарнирный домен может включать аминокислотную последовательность встречающейся в природе шарнирной области иммуноглобулина или измененную шарнирную область иммуноглобулина.In one embodiment, the CAR binding domain is associated with one or more "hinge domains" that play their role in positioning the antigen binding domain away from the surface of effector cells to ensure proper intercellular contact, antigen binding, and activation. A CAR typically contains one or more hinge domains between the binding domain and the transmembrane domain (TM). The hinge domain can be obtained from a natural, synthetic, semi-synthetic or recombinant source. The hinge domain may include the amino acid sequence of a naturally occurring immunoglobulin hinge region or an altered immunoglobulin hinge region.

Иллюстративные шарнирные домены, подходящие для использования в CAR, описанных в настоящей заявке, включают шарнирную область, полученную из внеклеточных областей мембранных белков типа 1, таких как CD8α и CD4, которые могут быть шарнирными областями дикого типа из этих молекул или могут быть изменены. В другом варианте шарнирный домен содержит шарнирную область CD8α.Exemplary hinge domains suitable for use in the CARs described herein include a hinge region derived from extracellular regions of type 1 membrane proteins such as CD8α and CD4, which may be wild-type hinge regions from these molecules or may be altered. In another embodiment, the hinge domain contains the CD8α hinge region.

В одном варианте реализации шарнир представляет собой шарнир PD-1 или шарнир CD152.In one embodiment, the hinge is a PD-1 hinge or a CD152 hinge.

«Трансмембранный домен» представляет собой часть CAR, которая объединяет внеклеточную связывающую часть и внутриклеточный сигнальный домен и прикрепляет CAR к плазматической мембране иммунной эффекторной клетки. Домен ТМ может быть получен из природного, синтетического, полусинтетического или рекомбинантного источника.The "transmembrane domain" is the portion of the CAR that integrates the extracellular binding portion and the intracellular signaling domain and anchors the CAR to the plasma membrane of an immune effector cell. The TM domain may be derived from a natural, synthetic, semi-synthetic, or recombinant source.

Иллюстративные домены ТМ могут быть получены из (то есть содержат по меньшей мере трансмембранную область (-и)) альфа- или бета-цепи рецептора Т-клеток, CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD5, CD8α, CD9, CD 16, CD22, CD27, CD28, CD33, CD37, CD45, CD64, CD80, CD86, CD 134, CD137, CD152, CD154, AMN θ PD-1.Exemplary TM domains can be derived from (i.e., contain at least the transmembrane region(s)) T cell receptor alpha or beta chain, CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD5, CD8α, CD9, CD 16 , CD22, CD27, CD28, CD33, CD37, CD45, CD64, CD80, CD86, CD134, CD137, CD152, CD154, AMN θ PD-1.

В одном варианте реализации CAR содержит домен TM, полученный из CD8α. В другом варианте реализации рассматриваемый в настоящей заявке CAR содержит домен TM, полученный из CD8α, и короткий олиго- или полипептидный линкер, предпочтительно длиной 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 аминокислот, который связывает домен TM и домен внутриклеточной сигнализации CAR. Особенно подходящим линкером является глицин-сериновый линкер.In one embodiment, the CAR contains a TM domain derived from CD8α. In another embodiment, the CAR under consideration herein comprises a CD8α-derived TM domain and a short oligo- or polypeptide linker, preferably 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 amino acids long, that binds a TM domain; and a CAR intracellular signaling domain. A particularly suitable linker is a glycine-serine linker.

В частных вариантах реализации CAR содержит внутриклеточный сигнальный домен. Термин «внутриклеточный сигнальный домен» относится к части CAR, которая участвует в передаче сообщения об эффективном связывании CAR с антигеном-мишенью во внутреннюю часть иммунной эффекторной клетки, чтобы вызвать функцию эффекторных клеток, например, активацию, выработку цитокинов, пролиферацию и цитотоксическую активность, включая высвобождение цитотоксических факторов в CAR-связанную клетку-мишень или другие клеточные ответы, вызванные связыванием антигена с внеклеточным доменом CAR.In particular embodiments, the CAR contains an intracellular signaling domain. The term "intracellular signaling domain" refers to the portion of the CAR that is involved in relaying the message of effective binding of the CAR to the target antigen to the interior of the immune effector cell to induce effector cell function, such as activation, cytokine production, proliferation, and cytotoxic activity, including release of cytotoxic factors into the CAR-bound target cell or other cellular responses caused by antigen binding to the extracellular domain of CAR.

Термин «эффекторная функция» относится к специализированной функции клетки. Например, эффекторной функцией Т-клетки может быть цитолитическая активность или помощь или активность, включая секрецию цитокина. Таким образом, термин «внутриклеточный сигнальный домен» относится к части белка, которая трансдуцирует сигнал эффекторной функции и которая направляет клетку на выполнение специализированной функции. Хотя обычно можно использовать весь внутриклеточный сигнальный домен, во многих случаях нет необходимости использовать весь домен. В той степени, в которой используется усеченная часть внутриклеточного сигнального домена, такая усеченная часть может использоваться вместо всего домена, при условии, что она трансдуцирует сигнал эффекторной функции. Термин «внутриклеточный сигнальный домен» включает в себя любую усеченную часть внутриклеточного сигнального домена, достаточную для трансформации сигнала эффекторной функции.The term "effector function" refers to a specialized function of a cell. For example, the effector function of a T cell may be cytolytic activity or help or activity, including the secretion of a cytokine. Thus, the term "intracellular signaling domain" refers to the portion of a protein that transduces an effector function signal and that directs the cell to perform a specialized function. Although it is usually possible to use the entire intracellular signaling domain, in many cases it is not necessary to use the entire domain. To the extent that a truncated portion of the intracellular signaling domain is used, such truncated portion may be used instead of the entire domain, provided that it transduces an effector function signal. The term "intracellular signaling domain" includes any truncated portion of an intracellular signaling domain sufficient to transform an effector function signal.

Известно, что сигналов, генерируемых только через TCR, недостаточно для полной активации Т-клетки и что также необходим вторичный или костимулирующий сигнал. Таким образом, можно сказать, что активация Т-клеток опосредуется двумя различными классами внутриклеточных сигнальных доменов: первичными сигнальными доменами, которые инициируют антиген-зависимую первичную активацию через TCR (например, комплекс TCR/CD3), и костимулирующими сигнальными доменами, которые действуют антиген-независимым образом обеспечивая вторичный или костимулирующий сигнал. В предпочтительных вариантах реализации CAR содержит внутриклеточный сигнальный домен, который содержит один или более «костимулирующих сигнальных доменов» и «первичный сигнальный домен».It is known that signals generated only through the TCR are not sufficient for complete T cell activation and that a secondary or co-stimulatory signal is also required. Thus, T cell activation can be said to be mediated by two distinct classes of intracellular signaling domains: primary signaling domains that initiate antigen-dependent primary activation via the TCR (e.g., the TCR/CD3 complex), and costimulatory signaling domains that act on antigen- independently providing a secondary or costimulatory signal. In preferred embodiments, the CAR contains an intracellular signaling domain that contains one or more "co-stimulatory signaling domains" and a "primary signaling domain".

Первичные сигнальные домены регулируют первичную активацию комплекса TCR либо стимулирующим, либо ингибирующим образом. Первичные сигнальные домены, которые действуют стимулирующим образом, могут содержать сигнальные мотивы, известные как иммунорецепторные мотивы активации на основе тирозина или ITAM.Primary signaling domains regulate the primary activation of the TCR complex in either a stimulatory or inhibitory manner. Primary signaling domains that act in a stimulatory manner may contain signaling motifs known as tyrosine-based immunoreceptor activation motifs or ITAMs.

Иллюстративные примеры ITAM, содержащих первичные сигнальные домены, подходящие для использования в CAR, рассматриваемых в частных вариантах реализации включают в себя домены, полученные из FcRγ, FcRβ, CD3γ, CD3δ, CD3ε, CD3ζ, CD22, CD79a, CD79b и CD66d. В частных предпочтительных вариантах реализации CAR содержит первичный сигнальный домен CD3ζ и один или более костимуляторных сигнальных доменов. Внутриклеточные первичные сигнальные и костимулирующие сигнальные домены могут быть связаны в любом порядке в тандеме с карбоксильным концом трансмембранного домена.Illustrative examples of ITAMs containing primary signaling domains suitable for use in CARs considered in particular embodiments include domains derived from FcRγ, FcRβ, CD3γ, CD3δ, CD3ε, CD3ζ, CD22, CD79a, CD79b, and CD66d. In particular preferred embodiments, the CAR comprises a CD3ζ primary signaling domain and one or more co-stimulatory signaling domains. The intracellular primary signaling and costimulatory signaling domains may be linked in any order in tandem with the carboxyl terminus of the transmembrane domain.

В частных вариантах реализации CAR содержит один или более костимуляторных сигнальных доменов для усиления эффективности и экспансии Т-клеток, экспрессирующих рецепторы CAR. Используемый в настоящей заявке термин «костимуляторный сигнальный домен» или «костимуляторный домен» относится к внутриклеточному сигнальному домену костимулирующей молекулы.In particular embodiments, the CAR contains one or more co-stimulatory signaling domains to enhance the efficiency and expansion of T cells expressing CAR receptors. As used herein, the term "costimulatory signaling domain" or "costimulatory domain" refers to the intracellular signaling domain of a costimulatory molecule.

Иллюстративные примеры таких костимулирующих молекул, подходящих для использования в CAR, рассматриваемых в частных вариантах реализации включают TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, CARD11, CD2, CD7, CD27, CD28, CD30, CD40, CD54 (ICAM), CD83, CD134 (OX40), CD137 (4-1BB), CD278 (ICOS), DAP10, LAT, NKD2C, SLP76, TRIM и ZAP70. В одном варианте реализации CAR содержит один или более костимуляторных сигнальных доменов, выбранных из группы, состоящей из CD28, CD137 и CD134, и первичного сигнального домена CD3ζ.Illustrative examples of such co-stimulatory molecules suitable for use in CAR, considered in particular embodiments, include TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, CARD11, CD2, CD7, CD27, CD28, CD30, CD40, CD54 (ICAM), CD83, CD134 (OX40), CD137 (4-1BB), CD278 (ICOS), DAP10, LAT, NKD2C, SLP76, TRIM and ZAP70. In one embodiment, the CAR contains one or more co-stimulatory signaling domains selected from the group consisting of CD28, CD137, and CD134 and a CD3ζ primary signaling domain.

В различных вариантах реализации CAR содержит: внеклеточный домен, который связывает антиген, выбранный из группы, состоящей из: BCMA, CD19, CSPG4, PSCA, ROR1 и TAG72; трансмембранный домен, выделенный из полипептида, выбранного из группы, состоящей из: CD4, CD8α, CD154 и PD-1; один или более внутриклеточных костимулирующих сигнальных доменов, выделенных из полипептида, выбранного из группы, состоящей из: CD28, CD134 и CD137; и сигнальный домен, выделенный из полипептида, выбранного из группы, состоящей из: FcRγ, FcRβ, CD3γ, CD3δ, CD3ε, CD3ζ, CD22, CD79a, CD79b и CD66d.In various embodiments, the CAR contains: an extracellular domain that binds an antigen selected from the group consisting of: BCMA, CD19, CSPG4, PSCA, ROR1, and TAG72; a transmembrane domain isolated from a polypeptide selected from the group consisting of: CD4, CD8α, CD154 and PD-1; one or more intracellular co-stimulatory signaling domains derived from a polypeptide selected from the group consisting of: CD28, CD134 and CD137; and a signal domain isolated from a polypeptide selected from the group consisting of: FcRγ, FcRβ, CD3γ, CD3δ, CD3ε, CD3ζ, CD22, CD79a, CD79b and CD66d.

c. Рецепторы Daricc. Daric receptors

В частных вариантах сконструированные иммунные эффекторные клетки содержит один или более рецепторов Daric. Используемый в настоящей заявке термин «рецептор Daric» относится к многоцепочечному сконструированному антигенному рецептору. В одном варианте реализации Т-клетки сконструированы путем введения DSB в один или более генов PD-1 в присутствии донорной матрицы репарации, кодирующей один или более компонентов Daric. В частном варианте реализации Daric или один или более его компонентов встроен в DSB в одном гене PD-1.In particular embodiments, the engineered immune effector cells contain one or more Daric receptors. The term "Daric receptor" as used herein refers to a multi-chain engineered antigen receptor. In one embodiment, T cells are constructed by introducing DSB into one or more PD-1 genes in the presence of a donor repair template encoding one or more Daric components. In a particular embodiment, Daric or one or more of its components is integrated into the DSB in a single PD-1 gene.

В одном варианте реализации сконструированные Т-клетки содержат Daric, который не встроен в ген PD-1, и одно или более из следующего: демпфер иммуносупрессивного сигнала, флип-рецептор, альфа- и/или бета-цепь сконструированного Т-клеточного рецептора (TCR), химерный антигенный рецептор (CAR), или рецептор Daric или его компоненты встроены в DSB в одном или нескольких генах PD-1.In one embodiment, engineered T cells contain Daric, which is not integrated into the PD-1 gene, and one or more of the following: immunosuppressive signal damper, flip receptor, engineered T cell receptor (TCR) alpha and/or beta chain ), a chimeric antigen receptor (CAR), or the Daric receptor or components thereof are integrated into the DSB in one or more PD-1 genes.

Иллюстративные примеры структур и компонентов Daric раскрыты в публикации РСТ №WO2015/017214 и публикации патента США №20150266973, каждая из которых включена в настоящую заявку посредством ссылки во всей своей полноте.Illustrative examples of Daric structures and components are disclosed in PCT Publication No. WO2015/017214 and US Patent Publication No. 20150266973, each of which is incorporated herein by reference in its entirety.

В одном варианте реализации донорная матрица репарации содержит следующие компоненты Daric: сигнальный полипептид, содержащий первый домен мультимеризации, первый трансмембранный домен и один или более внутриклеточных костимулирующих сигнальных доменов и/или первичных сигнальных доменов; и связывающий полипептид, содержащий связывающий домен, второй домен и мультимеризации, необязательно, второй трансмембранный домен. Функциональный Daric содержит мостиковый фактор, который способствует образованию рецепторного комплекса Daric на поверхности клетки, причем мостиковый фактор, ассоциирован с и расположен между доменами мультимеризации сигнального полипептида и связывающего полипептида.In one embodiment, the donor repair matrix contains the following Daric components: a signal polypeptide comprising a first multimerization domain, a first transmembrane domain, and one or more intracellular co-stimulatory signaling domains and/or primary signaling domains; and a binding polypeptide comprising a binding domain, a second multimerization domain, and optionally a second transmembrane domain. Functional Daric contains a bridging factor that promotes the formation of the Daric receptor complex on the cell surface, the bridging factor being associated with and located between the multimerization domains of the signal polypeptide and the binding polypeptide.

В частных вариантах реализации первый и второй домены мультимеризации ассоциируются с мостиковым фактором, выбранным из группы, состоящей из: рапамицина или его рапалога, кумермицина или его производного, гиббереллина или его производного, абсцизовой кислоты (ABA) или ее производного, метотрексат или его производное, циклоспорина А или его производного, FKCsA или его производного, триметоприма (Tmp) - синтетического лиганда для FKBP (SLF) или его производного и любой их комбинации.In particular embodiments, the first and second multimerization domains are associated with a bridging factor selected from the group consisting of: rapamycin or its rapalogue, cumermycin or its derivative, gibberellin or its derivative, abscisic acid (ABA) or its derivative, methotrexate or its derivative, cyclosporin A or its derivative, FKCsA or its derivative, trimethoprim (Tmp) - a synthetic ligand for FKBP (SLF) or its derivative, and any combination thereof.

Иллюстративные примеры аналогов рапамицина (рапалогов) включают аналоги, раскрытые в патенте США №. 6649595, причем структуры этих рапалогов включены в настоящее описание в качестве ссылки во всей их полноте. В некоторых случаях мостиковым фактором является рапалог с существенно сниженным иммуносупрессивным эффектом по сравнению с рапамицином. «Существенно сниженный иммуносупрессивный эффект» относится к рапалогу, обладающему иммуносупрессивным эффектом по меньшей мере в 0,1-0,005 раза меньшим, чем иммуносупрессивный эффект, наблюдаемый или ожидаемый для эквимолярного количества рапамицина, измеряемого либо клинически, либо в соответствующем in vitro (например, ингибирование T-клеточной пролиферации) или in vivo суррогате иммунодепрессивной активности человека. В одном варианте реализации «существенно сниженный иммуносупрессивный эффект» относится к рапалогу, имеющему значение EC 50 в таком анализе in vitro, которое по меньшей мере в 10-250 раз превышает значение EC 50, наблюдаемое для рапамицина в том же анализе.Illustrative examples of rapamycin analogs (rapalogues) include those disclosed in US Patent No. 6649595, and the structures of these rapalogues are included in the present description by reference in their entirety. In some cases, the bridging factor is rapalogue with a significantly reduced immunosuppressive effect compared to rapamycin. "Significantly reduced immunosuppressive effect" refers to rapalogue having an immunosuppressive effect at least 0.1-0.005 times less than the immunosuppressive effect observed or expected for an equimolar amount of rapamycin, measured either clinically or in an appropriate in vitro (e.g., inhibition of T cell proliferation) or an in vivo surrogate for human immunosuppressive activity. In one embodiment, "significantly reduced immunosuppressive effect" refers to rapalogue having an EC 50 value in such an in vitro assay that is at least 10-250 times the EC 50 value observed for rapamycin in the same assay.

Другие иллюстративные примеры рапалогов включают, среди прочего, эверолимус, новолимус, пимекролимус, ридафоролимус, такролимус, темсиролимус, умиролимус и зотаролимус.Other illustrative examples of rapalogues include, among others, everolimus, novolimus, pimecrolimus, ridaforolimus, tacrolimus, temsirolimus, umirolimus, and zotarolimus.

В некоторых случаях изобретения домены мультимеризации будут ассоциироваться с мостиковым фактором, являющимся рапамицином или его рапалогом. Например, первый и второй домены мультимеризации представляют собой пару, выбранную из FKBP и FRB. Домены FRB представляют собой полипептидные области (белковые «домены»), которые способны образовывать трехчастный комплекс с белком FKBP и рапамицином или его рапалогом. Домены FRB присутствуют во многих встречающихся в природе белках, включая белки mTOR (также упоминаемые в литературе как FRAP, RAPT1 или RAFT) человека и других видов; дрожжевые белки, включая Tor1 и Tor2; и гомолог Candida FRAP. Информация о нуклеотидных последовательностях, клонировании и других аспектах этих белков уже известна в данной области. Например, регистрационный номер последовательности белка для mTOR человека - номер доступа GenBank №L34075.1 (Brown et al., Nature 369:756, 1994).In some instances of the invention, the multimerization domains will be associated with a bridging factor that is rapamycin or its rapalogue. For example, the first and second multimerization domains are a pair selected from FKBP and FRB. FRB domains are polypeptide regions (protein "domains") that are capable of forming a tripartite complex with the FKBP protein and rapamycin or its rapalogue. FRB domains are present in many naturally occurring proteins, including mTOR proteins (also referred to in the literature as FRAP, RAPT1, or RAFT) from humans and other species; yeast proteins, including Tor1 and Tor2; and homologue of Candida FRAP. Information about the nucleotide sequences, cloning and other aspects of these proteins is already known in the art. For example, the protein sequence accession number for human mTOR is GenBank Accession No. L34075.1 (Brown et al., Nature 369:756, 1994).

Домены FRB, подходящие для применения в частных вариантах реализации, рассматриваемых в настоящей заявке, как правило содержат по меньшей мере от приблизительно 85 до приблизительно 100 аминокислотных остатков. В некоторых вариантах изобретения аминокислотная последовательность FRB для применения в слитых белках по настоящему изобретению будет содержать последовательность из 93 аминокислот от Ile-2021 до Lys-2113 и мутацию T2098L, основанную на аминокислотной последовательности GenBank, номер доступа L34075. 1. Домен FRB для использования в Daric, рассматриваемый в частных вариантах реализации, будет способен связываться с комплексом белка FKBP, связанного с рапамицином или его рапалогом. В некоторых случаях пептидная последовательность домена FRB содержит (а) встречающуюся в природе пептидную последовательность, охватывающую по меньшей мере указанную 93-аминокислотную область человеческого mTOR или соответствующие области гомологичных белков; (b) вариант встречающегося в природе FRB, в котором до приблизительно десяти аминокислот, или от приблизительно 1 до приблизительно 5 аминокислот, или от приблизительно 1 до приблизительно 3 аминокислот, или в некоторых вариантах реализации только одна аминокислота встречающегося в природе пептид была удалена, вставлена или замещена; или (c) пептид, кодируемый молекулой нуклеиновой кислоты, способной селективно гибридизоваться с молекулой ДНК, кодирующей встречающийся в природе домен FRB, или последовательностью ДНК, которая была бы способна, если бы не вырожденность генетического кода, избирательно гибридизоваться с молекулой ДНК, кодирующей встречающийся в природе домен FRB.FRB domains suitable for use in the private embodiments discussed herein typically contain at least about 85 to about 100 amino acid residues. In some embodiments, the FRB amino acid sequence for use in the fusion proteins of the present invention will comprise the 93 amino acid sequence Ile-2021 to Lys-2113 and the T2098L mutation based on the GenBank amino acid sequence accession number L34075. 1. The FRB domain for use in Daric, contemplated in particular embodiments, will be capable of binding to the FKBP protein complex associated with rapamycin or its rapalogue. In some cases, the peptide sequence of the FRB domain contains (a) a naturally occurring peptide sequence spanning at least the specified 93-amino acid region of human mTOR or corresponding regions of homologous proteins; (b) a variant of a naturally occurring FRB in which up to about ten amino acids, or from about 1 to about 5 amino acids, or from about 1 to about 3 amino acids, or in some embodiments, only one amino acid of the naturally occurring peptide has been removed, inserted or substituted; or (c) a peptide encoded by a nucleic acid molecule capable of selectively hybridizing to a DNA molecule encoding a naturally occurring FRB domain, or a DNA sequence that would, were it not for the degeneracy of the genetic code, selectively hybridizing to a DNA molecule encoding a naturally occurring FRB domain. nature of the FRB domain.

FKBP (FK506-связывающие белки) представляют собой цитозольные рецепторы макролидов, такие как FK506, FK520 и рапамицин, и являются высоко консервативными для всех биологических видов. FKBP представляют собой белки или белковые домены, которые способны связываться с рапамицином или его рапалогом и дополнительно образовывать трехчастный комплекс с FRB-содержащим белком или слитым белком. Домен FKBP может также упоминаться как «рапамицин-связывающий домен». Информация, касающаяся нуклеотидных последовательностей, клонирования и других аспектов различных видов FKBP, известна в данной области (см., например, Staendart et al., Nature 346: 671, 1990 (FKBP12 человека); Kay, Biochem. J. 314: 361, 1996). Гомологичные белки FKBP у других видов млекопитающих, у дрожжей и у других организмов также известны в данной области и могут быть использованы в слитых белках, раскрытых в настоящей заявке. Домен FKBP, рассматриваемый в частных вариантах реализации, будет способен связываться с рапамицином или его рапалогом и участвовать в трехчастном комплексе с FRB-содержащим белком (что может быть определено любыми способами, прямыми или косвенными, для обнаружения такого связывания).FKBPs (FK506 binding proteins) are cytosolic macrolide receptors such as FK506, FK520 and rapamycin and are highly conserved across species. FKBPs are proteins or protein domains that are capable of binding to rapamycin or its rapalogue and additionally forming a tripartite complex with an FRB-containing protein or fusion protein. The FKBP domain may also be referred to as the "rapamycin binding domain". Information regarding nucleotide sequences, cloning, and other aspects of various FKBP species is known in the art (see, for example, Staendart et al., Nature 346: 671, 1990 (human FKBP12); Kay, Biochem. J. 314: 361, 1996). Homologous FKBP proteins from other mammalian species, yeast and other organisms are also known in the art and can be used in the fusion proteins disclosed in this application. The FKBP domain, considered in particular embodiments, will be able to bind to rapamycin or its rapalogue and participate in a tripartite complex with an FRB-containing protein (which can be determined by any means, direct or indirect, to detect such binding).

Иллюстративные примеры доменов FKBP, подходящих для использования в Daric, рассматриваемых в частных вариантах реализации включают, среди прочего: встречающуюся в природе пептидную последовательность FKBP, предпочтительно выделенную из человеческого белка FKBP12 (номер в GenBank AAA58476.1) или пептидную последовательность, выделенную из него, из FKBP другого человека, из FKBP мыши или другого млекопитающего или из FKBP какого-либо другого животного, дрожжевого или грибкового происхождения; вариант встречающейся в природе последовательности FKBP, в которой до приблизительно десяти аминокислот, или от приблизительно 1 до приблизительно 5 аминокислот, или от приблизительно 1 до приблизительно 3 аминокислот, или в некоторых вариантах реализации только одна аминокислота встречающегося в природе пептида была удалена, вставлена или заменена; или пептидную последовательность, кодируемую молекулой нуклеиновой кислоты, способной селективно гибридизоваться с молекулой ДНК, кодирующей встречающийся в природе FKBP, или последовательностью ДНК, которая была бы способна, если бы не вырожденность генетического кода, избирательно гибридизоваться с молекулой ДНК, кодирующей встречающийся в природе домен FKBP.Illustrative examples of FKBP domains suitable for use in Daric, considered in particular embodiments, include, among others: a naturally occurring FKBP peptide sequence, preferably isolated from the human FKBP12 protein (GenBank number AAA58476.1) or a peptide sequence isolated from it, from FKBP of another human, from FKBP of a mouse or other mammal, or from FKBP of any other animal, yeast or fungal origin; a variant of a naturally occurring FKBP sequence in which up to about ten amino acids, or from about 1 to about 5 amino acids, or from about 1 to about 3 amino acids, or in some embodiments, only one amino acid of the naturally occurring peptide has been deleted, inserted, or replaced ; or a peptide sequence encoded by a nucleic acid molecule capable of selectively hybridizing to a DNA molecule encoding a naturally occurring FKBP domain, or a DNA sequence that would, were it not for the degeneracy of the genetic code, selectively hybridizing to a DNA molecule encoding a naturally occurring FKBP domain .

Другие иллюстративные примеры пар доменов мультимеризации, подходящих для использования в Daric, рассматриваемых в частных вариантах реализации включают, среди прочего, домены из FKBP и FRB, FKBP и кальцинейрина, FKBP и циклофилина, FKBP и бактериального DHFR, кальцинейрина и циклофилина, PYL1 и ABI1 или GIB1 и GAI, или их варианты.Other illustrative examples of multimerization domain pairs suitable for use in Daric, considered in particular embodiments, include, among others, domains from FKBP and FRB, FKBP and calcineurin, FKBP and cyclophilin, FKBP and bacterial DHFR, calcineurin and cyclophilin, PYL1 and ABI1 or GIB1 and GAI, or variants thereof.

В других вариантах реализации анти-мостиковый фактор блокирует ассоциацию сигнального полипептида и связывающего полипептида с мостиковым фактором. Например, циклоспорин или FK506 могут быть использованы в качестве анти-мостиковых факторов для титрования рапамицина и, следовательно, для остановки передачи сигналов, поскольку связан только один мультимеризационный домен. В некоторых случаях анти-мостиковым фактором (например, циклоспорин, FK506) является иммуносупрессивный агент.Например, иммуносупрессивный анти-мостиковый фактор может использоваться для блокирования или минимизации функции компонентов Daric, рассматриваемых в частных вариантах реализации и в то же время ингибировать или блокировать нежелательный или патологический воспалительный ответ в клинических условиях.In other embodiments, the anti-bridge factor blocks the association of the signal polypeptide and the binding polypeptide with the bridging factor. For example, cyclosporine or FK506 can be used as anti-bridge factors to titrate rapamycin and therefore stop signaling because only one multimerization domain is bound. In some instances, the anti-bridge factor (eg, cyclosporine, FK506) is an immunosuppressive agent. pathological inflammatory response in the clinical setting.

В одном варианте реализации первый домен мультимеризации содержит FRB T2098L, второй домен мультимеризации содержит FKBP12, а мостиковым фактором является рапалог AP21967.In one embodiment, the first multimerization domain contains FRB T2098L, the second multimerization domain contains FKBP12, and the bridging factor is rapalogue AP21967.

В другом варианте реализации первый домен мультимеризации содержит FRB, второй домен мультимеризации содержит FKBP12, а фактор связывания представляет собой рапамицин, темсиролимус или эверолимус.In another embodiment, the first multimerization domain contains FRB, the second multimerization domain contains FKBP12, and the binding factor is rapamycin, temsirolimus, or everolimus.

В частных вариантах реализации сигнальный полипептид содержит первый трансмембранный домен и связывающий полипептид содержит второй трансмембранный домен или GPI-якорь. Иллюстративные примеры первого и второго трансмембранных доменов выделены из полипептида, независимо выбранного из группы, состоящей из: CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD5, CD8α, CD9, CD 16, CD22, CD27, CD28, CD33, CD37, CD45, CD64, CD80, CD86, CD 134, CD137, CD152, CD154, AMN и PD-1.In particular embodiments, the signal polypeptide comprises a first transmembrane domain and the binding polypeptide comprises a second transmembrane domain or GPI anchor. Illustrative examples of the first and second transmembrane domains are isolated from a polypeptide independently selected from the group consisting of: CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD5, CD8α, CD9, CD 16, CD22, CD27, CD28, CD33, CD37, CD45, CD64, CD80, CD86, CD134, CD137, CD152, CD154, AMN and PD-1.

В одном варианте реализации сигнальный полипептид содержит один или более внутриклеточных костимулирующих сигнальных доменов и/или первичных сигнальных доменов.In one embodiment, the signal polypeptide comprises one or more intracellular costimulatory signaling domains and/or primary signaling domains.

Иллюстративные примеры первичных сигнальных доменов, подходящих для использования в компонентах передачи сигналов Daric, рассматриваемых в частных вариантах реализации включают в себя домены, которые получены из FcRγ, FcRβ, CD3γ, CD3δ, CD3ε, CD3ζ, CD22, CD79a, CD79b и CD66d. В частных предпочтительных вариантах реализации изобретения сигнальный компонент Daric содержит первичный сигнальный домен CD3 и один или более костимуляторных сигнальных доменов. Внутриклеточные первичные сигнальные и костимулирующие сигнальные домены могут быть связаны в любом порядке в тандеме с карбоксильным концом трансмембранного домена.Illustrative examples of primary signaling domains suitable for use in Daric signaling components considered in particular embodiments include domains that are derived from FcRγ, FcRβ, CD3γ, CD3δ, CD3ε, CD3ζ, CD22, CD79a, CD79b, and CD66d. In particular preferred embodiments of the invention, the Daric signaling component comprises a primary CD3 signaling domain and one or more co-stimulatory signaling domains. The intracellular primary signaling and costimulatory signaling domains may be linked in any order in tandem with the carboxyl terminus of the transmembrane domain.

Иллюстративные примеры таких костимулирующих молекул, подходящих для использования в сигнальных компонентах Daric, рассматриваемых в частных вариантах реализации включают TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, CARD11, CD2, CD7, CD27, CD28, CD30, CD40, CD54 (ICAM), CD83, CD134 (OX40), CD137 (4-1BB), CD278 (ICOS), DAP10, LAT, NKD2C, SLP76, TRIM и ZAP70. В одном варианте реализации сигнальный компонент Daric содержит один или более костимулирующих сигнальных доменов, выбранных из группы, состоящей из CD28, CD137 и CD134, и первичного сигнального домена CD3ζ.Illustrative examples of such co-stimulatory molecules suitable for use in Daric signaling components considered in particular embodiments include TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, CARD11, CD2, CD7, CD27, CD28, CD30, CD40, CD54 (ICAM), CD83, CD134 (OX40), CD137 (4-1BB), CD278 (ICOS), DAP10, LAT, NKD2C, SLP76, TRIM and ZAP70. In one embodiment, the Daric signaling component comprises one or more co-stimulatory signaling domains selected from the group consisting of CD28, CD137 and CD134 and a CD3ζ primary signaling domain.

В частных вариантах реализации Daric-связывающий компонент содержит связывающий домен. В одном варианте реализации такой связывающий домен представляет собой антитело или его антигенсвязывающий фрагмент.In private embodiments, the Daric-binding component contains a binding domain. In one embodiment, such a binding domain is an antibody or an antigen-binding fragment thereof.

Антитело или его антигенсвязывающий фрагмент содержит, по меньшей мере вариабельную область легкой или тяжелой цепи иммуноглобулина, которая специфически распознает и связывает эпитоп антигена-мишени, такого как пептид, липид, полисахарид или нуклеиновая кислота, содержащая антигенный детерминант, например, распознаваемые иммунной клеткой. Антитела включают антигенсвязывающие фрагменты, например, Camel Ig (антитело верблюдовых или его фрагмент VHH), Ig NAR, фрагменты Fab, фрагменты Fab', фрагменты F(ab)' 2, фрагменты F(ab)'3, Fv, одноцепочечный вариабельный фрагмент антитела Fv («scFv»), бис-scFv, (scFv) 2, миниантитело, диатело, триатело, тетратело, стабилизированный дисульфидом белок Fv («dsFv») и однодоменное антитело (sdAb, Nanobody) или другие соответствующие фрагменты антител. Термин также включает сконструированные формы, такие как химерные антитела (например, гуманизированные мышиные антитела), гетероконъюгатные антитела (такие как биспецифичные антитела) и их антигенсвязывающие фрагменты. См. также, Pierce Catalog and Handbook, 1994-1995 (Pierce Chemical Co., Rockford, IL); Kuby, J., Immunology, 3rd Ed., W. H. Freeman & Co., New York, 1997.An antibody, or antigen-binding fragment thereof, comprises at least an immunoglobulin light or heavy chain variable region that specifically recognizes and binds an epitope of a target antigen, such as a peptide, lipid, polysaccharide, or nucleic acid containing an antigenic determinant, such as those recognized by an immune cell. Antibodies include antigen-binding fragments, e.g., Camel Ig (camelid antibody or VHH fragment thereof), NAR Ig, Fab fragments, Fab' fragments, F(ab)'2 fragments, F(ab)'3 fragments, Fv, single chain variable antibody fragment Fv ("scFv"), bis-scFv, (scFv) 2, minibody, diabody, triatebody, tetrabody, disulfide stabilized Fv protein ("dsFv") and single domain antibody (sdAb, Nanobody) or other appropriate antibody fragments. The term also includes engineered forms such as chimeric antibodies (eg, humanized mouse antibodies), heteroconjugate antibodies (such as bispecific antibodies), and antigen-binding fragments thereof. See also, Pierce Catalog and Handbook, 1994-1995 (Pierce Chemical Co., Rockford, IL); Kuby, J., Immunology, 3rd Ed., W. H. Freeman & Co., New York, 1997.

В одном предпочтительном варианте реализации связывающий домен представляет собой scFv.In one preferred embodiment, the binding domain is scFv.

В другом предпочтительном варианте реализации связывающий домен представляет собой антитело верблюдовых.In another preferred embodiment, the binding domain is a camelid antibody.

В частных вариантах реализации связывающий компонент Daric содержит внеклеточный домен, который связывает антиген, выбранный из группы, состоящей из: альфа-фолатного рецептора, 5T4, интегрина αvβ6, BCMA, B7-H3, B7-H6, CAIX, CD16, CD19, CD20, CD22, CD30, CD33, CD44, CD44v6, CD44v7/8, CD70, CD79a, CD79b, CD123, CD138, CD171, CEA, CSPG4, EGFR, семейства EGFR включая ErbB2 (HER2), EGFRvIII, EGP2, EGP40, EPCAM, EphA2, EpCAM, FAP, фетального AchR, FRα, GD2, GD3, глипикана-3 (GPC3), HLA-A1+MAGE1, HLA-A2+MAGE1, HLA-A3+MAGE1, HLA-A1+NY-ESO-1, HLA-A2+NY-ESO-1, HLA-A3+NY-ESO-1, IL-11Rα, IL-13Rα2, Лямбда, Lewis-Y, Каппа, мезотелина, Muc1, Muc16, NCAM, лигандов NKG2D, NY-ESO-1, PRAME, PSCA, PSMA, ROR1, SSX, сурвивина, TAG72, TEMs, VEGFR2 и WT-1.In particular embodiments, the Daric binding component comprises an extracellular domain that binds an antigen selected from the group consisting of: alpha folate receptor, 5T4, αvβ6 integrin, BCMA, B7-H3, B7-H6, CAIX, CD16, CD19, CD20, CD22, CD30, CD33, CD44, CD44v6, CD44v7/8, CD70, CD79a, CD79b, CD123, CD138, CD171, CEA, CSPG4, EGFR, EGFR families including ErbB2 (HER2), EGFRvIII, EGP2, EGP40, EPCAM, EphA2, EpCAM, FAP, Fetal AchR, FRα, GD2, GD3, Glypican-3 (GPC3), HLA-A1+MAGE1, HLA-A2+MAGE1, HLA-A3+MAGE1, HLA-A1+NY-ESO-1, HLA- A2+NY-ESO-1, HLA-A3+NY-ESO-1, IL-11Rα, IL-13Rα2, Lambda, Lewis-Y, Kappa, mesothelin, Muc1, Muc16, NCAM, NKG2D ligands, NY-ESO-1 , PRAME, PSCA, PSMA, ROR1, SSX, survivin, TAG72, TEMs, VEGFR2 and WT-1.

В одном варианте реализации связывающий компонент Daric содержит внеклеточный домен, например, антитело или его антигенсвязывающий фрагмент, который связывает комплекс MHC-пептид, такой как комплекс MHC класса I-пептид или комплекс MHC класса II-пептид.In one embodiment, the Daric binding component comprises an extracellular domain, such as an antibody or antigen-binding fragment thereof, that binds an MHC-peptide complex, such as an MHC class I-peptide complex or an MHC class II-peptide complex.

В частных вариантах реализации компоненты Daric, рассматриваемые в настоящей заявке, содержат линкер или спейсер, который соединяет два белка, полипептида, пептида, домена, области или мотива. В некоторых вариантах реализации линкер содержит от приблизительно двух до приблизительно 35 аминокислот, или от приблизительно четырех до приблизительно 20 аминокислот, или от приблизительно восьми до приблизительно 15 аминокислот, или от приблизительно 15 до приблизительно 25 аминокислот. В других вариантах реализации спейсер может иметь конкретную структуру, такую как домен антитела CH2CH3, шарнирный домен или тому подобное. В одном варианте реализации спейсер содержит домены CH2 и CH3 белков IgG1, IgG4 или IgD.In particular embodiments, the Daric components contemplated herein comprise a linker or spacer that connects two proteins, polypeptides, peptides, domains, regions, or motifs. In some embodiments, the linker contains from about two to about 35 amino acids, or from about four to about 20 amino acids, or from about eight to about 15 amino acids, or from about 15 to about 25 amino acids. In other embodiments, the spacer may have a specific structure, such as a CH2CH3 antibody domain, a hinge domain, or the like. In one embodiment, the spacer contains the CH2 and CH3 domains of an IgG1, IgG4, or IgD protein.

В частных вариантах реализации компоненты Daric, рассматриваемые в настоящей заявке, содержат один или более «шарнирных доменов», которые играют свою роль в позиционировании доменов для обеспечения надлежащего межклеточного контакта, связывания антигена и активации. Daric может содержать один или более шарнирных доменов между связывающим доменом и доменом мультимеризации и/или трансмембранным доменом (TM) или между доменом мультимеризации и трансмембранным доменом. Шарнирный домен может быть получен из природного, синтетического, полусинтетического или рекомбинантного источника. Шарнирный домен может включать аминокислотную последовательность встречающейся в природе шарнирной области иммуноглобулина или измененную шарнирную область иммуноглобулина. В частном варианте реализации шарнир представляет собой шарнир CD8α или шарнир CD4.In particular embodiments, the Daric components contemplated herein comprise one or more "hinge domains" that play a role in domain positioning for proper intercellular contact, antigen binding, and activation. Daric may contain one or more hinge domains between the binding domain and the multimerization domain and/or the transmembrane domain (TM) or between the multimerization domain and the transmembrane domain. The hinge domain can be obtained from a natural, synthetic, semi-synthetic or recombinant source. The hinge domain may include the amino acid sequence of a naturally occurring immunoglobulin hinge region or an altered immunoglobulin hinge region. In a particular embodiment, the hinge is a CD8α hinge or a CD4 hinge.

В одном варианте реализации изобретения Daric содержит сигнальный полипептид, содержащий первый домен мультимеризации FRB T2098L, трансмембранный домен CD8, костимуляторный домен 4-1BB и первичный сигнальный домен CD3ζ; связывающий полипептид содержит scFv, который связывает CD19, второй мультимеризационный домен FKBP12 и трансмембранный домен CD4; а мостиковым фактором является рапалог AP21967.In one embodiment, Daric comprises a signal polypeptide comprising the first T2098L FRB multimerization domain, CD8 transmembrane domain, 4-1BB co-stimulatory domain, and CD3ζ primary signaling domain; the binding polypeptide contains an scFv that binds CD19, the second multimerization domain of FKBP12, and the transmembrane domain of CD4; and the bridging factor is rapalogue AP21967.

В одном варианте реализации изобретения Daric содержит сигнальный полипептид, содержащий первый мультимеризационный домен FRB, трансмембранный домен CD8, костимуляторный домен 4-1BB и первичный сигнальный домен CD3ζ; связывающий полипептид содержит scFv, который связывает CD19, второй мультимеризационный домен FKBP12 и трансмембранный домен CD4; а мостиковым фактором является рапамицин, темсиролимус или эверолимус.In one embodiment, Daric comprises a signal polypeptide comprising a first FRB multimerization domain, a CD8 transmembrane domain, a 4-1BB co-stimulatory domain, and a primary CD3ζ signaling domain; the binding polypeptide contains an scFv that binds CD19, the second multimerization domain of FKBP12, and the transmembrane domain of CD4; and the bridging factor is rapamycin, temsirolimus, or everolimus.

d. Дзетакиныd. Zetakins

В частных вариантах реализации сконструированные иммунные эффекторные клетки, рассматриваемые в настоящей заявке, содержат один или более химерных рецепторов цитокинов. В одном варианте реализации Т-клетки сконструированы путем введения DSB в один или более генов PD-1 в присутствии донорной матрицы репарации, кодирующей CAR. В частном варианте реализации химерный цитокиновый рецептор встроен в DSB в одном гене PD-1.In particular embodiments, the engineered immune effector cells of this application comprise one or more chimeric cytokine receptors. In one embodiment, T cells are constructed by introducing DSB into one or more PD-1 genes in the presence of a donor repair template encoding CAR. In a particular embodiment, the chimeric cytokine receptor is inserted into the DSB in a single PD-1 gene.

В одном варианте реализации сконструированные T- клетки, рассматриваемые в настоящей заявке, содержат химерный рецептор цитокинов, который не встроен в ген PD-1 и один или более из: демпфера иммуносупрессивного сигнала, флип-рецептора, альфа- и/или бета-цепи сконструированного Т-клеточного рецептора (TCR), химерного антигенного рецептора (CAR), рецептора Daric или его компонентов, или химерный цитокиновый рецептор встроен в DSB в одном или нескольких генах PD-1.In one embodiment, the engineered T cells of this application contain a chimeric cytokine receptor that is not integrated into the PD-1 gene and one or more of: an immunosuppressive signal dampener, a flip receptor, an engineered alpha and/or beta chain. A T cell receptor (TCR), a chimeric antigen receptor (CAR), the Daric receptor or components thereof, or a chimeric cytokine receptor is integrated into the DSB in one or more PD-1 genes.

В различных вариантах реализации Т-клетки с отредактированным геномом экспрессируют химерный цитокиновый рецептор, который перенаправляет цитотоксичность на опухолевые клетки. Дзетакины представляют собой химерные трансмембранные иммунорецепторы, которые содержат внеклеточный домен, содержащий растворимый рецепторный лиганд, связанный с вспомогательной областью, способной связывать внеклеточный домен с клеточной поверхностью, трансмембранной областью и внутриклеточным сигнальным доменом. Дзетакины, когда они экспрессируются на поверхности Т-лимфоцитов, направляют активность Т-клеток на те клетки, которые экспрессируют рецептор, для которого специфичен растворимый рецепторный лиганд. Химерные иммунорецепторы дзетакинов перенаправляют антиген-специфичность Т-клеток с возможностью применения для лечения различных видов рака, в частности, через аутокринные/паракринные цитокиновые системы, используемые злокачественными опухолями человека.In various embodiments, the genome-edited T cells express a chimeric cytokine receptor that redirects cytotoxicity to tumor cells. Zetakines are chimeric transmembrane immunoreceptors that contain an extracellular domain containing a soluble receptor ligand associated with an accessory region capable of binding the extracellular domain to the cell surface, transmembrane region, and intracellular signaling domain. Zetakines, when expressed on the surface of T lymphocytes, direct T cell activity to those cells that express the receptor for which the soluble receptor ligand is specific. Zetakin chimeric immunoreceptors redirect T cell antigen specificity with potential for use in the treatment of various cancers, in particular through the autocrine/paracrine cytokine systems used by human cancers.

В частных вариантах реализации химерный цитокиновый рецептор содержит иммуносупрессивный цитокин или его связывающий цитокиновый рецептор вариант, линкер, трансмембранный домен и внутриклеточный сигнальный домен.In particular embodiments, the chimeric cytokine receptor comprises an immunosuppressive cytokine or a cytokine receptor-binding variant thereof, a linker, a transmembrane domain, and an intracellular signaling domain.

В частных вариантах реализации цитокин или его связывающий цитокиновый рецептор вариант выбирают из группы, состоящей из: интерлейкина-4 (IL-4), интерлейкина-6 (IL-6), интерлейкина-8 (IL-8), интерлейкина-10 (IL-10) и интерлейкина-13 (IL-13).In particular embodiments, the cytokine or cytokine receptor binding variant thereof is selected from the group consisting of: interleukin-4 (IL-4), interleukin-6 (IL-6), interleukin-8 (IL-8), interleukin-10 (IL -10) and interleukin-13 (IL-13).

В некоторых вариантах реализации линкер содержит домен CH2CH3, шарнирный домен или тому подобное. В одном варианте реализации линкер содержит домены CH2 и CH3 IgG1, IgG4 или IgD. В одном варианте реализации линкер содержит шарнирный домен CD8α или CD4.In some embodiments, the linker contains a CH2CH3 domain, a hinge domain, or the like. In one embodiment, the implementation of the linker contains the CH2 and CH3 domains of IgG1, IgG4 or IgD. In one embodiment, the linker contains a CD8α or CD4 hinge domain.

В частных вариантах реализации трансмембранный домен выбран из группы, состоящей из: альфа- или бета-цепи рецептора Т-клеток, CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD5, CD8α, CD9, CD 16, CD22, CD27, CD28, CD33, CD37, CD45, CD64, CD80, CD86, CD 134, CD137, CD152, CD154, AMN θ PD-1.In particular embodiments, the transmembrane domain is selected from the group consisting of: T cell receptor alpha or beta chain, CD3δ, CD3ε, CD3γ, CD3ζ, CD4, CD5, CD8α, CD9, CD 16, CD22, CD27, CD28, CD33 , CD37, CD45, CD64, CD80, CD86, CD 134, CD137, CD152, CD154, AMN θ PD-1.

Figure 00000001
Figure 00000001

ITAM, содержащего первичный сигнальный домен и/или костимуляторный домен.ITAM containing a primary signaling domain and/or a co-stimulatory domain.

В частных вариантах реализации внутриклеточный сигнальный домен выбран из группы, состоящей из: FcRγ, FcRβ, CD3γ, CD3δ, CD3ε, CD3ζ, CD22, CD79a, CD79b и CD66d.In particular embodiments, the intracellular signaling domain is selected from the group consisting of: FcRγ, FcRβ, CD3γ, CD3δ, CD3ε, CD3ζ, CD22, CD79a, CD79b, and CD66d.

В частных вариантах реализации внутриклеточный сигнальный домен выбран из группы, состоящей из: TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, CARD11, CD2, CD7, CD27, CD28, CD30, CD40, CD54 (ICAM), CD83, CD134 (OX40), CD137 (4-1BB), CD278 (ICOS), DAP10, LAT, NKD2C, SLP76, TRIM и ZAP70.In particular embodiments, the intracellular signaling domain is selected from the group consisting of: TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, CARD11, CD2, CD7, CD27, CD28, CD30, CD40, CD54 ( ICAM), CD83, CD134 (OX40), CD137 (4-1BB), CD278 (ICOS), DAP10, LAT, NKD2C, SLP76, TRIM and ZAP70.

В одном варианте реализации химерный цитокиновый рецептор содержит один или более костимуляторных сигнальных доменов, выбранных из группы, состоящей из CD28, CD137 и CD134, и первичного сигнального домена CD3ζ.In one embodiment, the chimeric cytokine receptor contains one or more co-stimulatory signaling domains selected from the group consisting of CD28, CD137, and CD134 and a CD3ζ primary signaling domain.

D. ПолипептидыD. Polypeptides

В настоящей заявке рассматриваются различные полипептиды, включая, среди прочего, варианты хоминг-эндонуклеазы, megaTAL и слитые полипептиды. В предпочтительных вариантах реализации полипептид содержит аминокислотную последовательность, представленную в SEQ ID NO: 1-24 и 60-64. «Полипептид», «полипептидный фрагмент», «пептид» и «белок» используются взаимозаменяемо, если не указано иное, и в соответствии с общепринятым значением, то есть как последовательность аминокислот.В одном варианте реализации «полипептид» включает слитые полипептиды и другие варианты. Полипептиды могут быть получены с использованием любой из множества хорошо известных рекомбинантных и/или синтетических методик. Полипептиды не ограничены конкретной длиной, например, они могут содержать полноразмерную белковую последовательность, фрагмент полноразмерного белка или слитый белок и могут включать посттрансляционные модификации полипептида, например гликозилирование, ацетилирование, фосфорилирование и тому подобное, а также другие модификации, известные в данной области техники, как встречающиеся в природе, так и не встречающиеся в природе.This application contemplates various polypeptides, including but not limited to homing endonuclease variants, megaTAL, and fusion polypeptides. In preferred embodiments, the polypeptide comprises the amino acid sequence shown in SEQ ID NOs: 1-24 and 60-64. "Polypeptide", "polypeptide fragment", "peptide", and "protein" are used interchangeably, unless otherwise indicated, and according to the conventional meaning, i.e. as an amino acid sequence. In one embodiment, "polypeptide" includes fusion polypeptides and other variants . The polypeptides can be obtained using any of a variety of well known recombinant and/or synthetic techniques. Polypeptides are not limited to a specific length, for example, they may contain a full length protein sequence, a fragment of a full length protein, or a fusion protein, and may include post-translational modifications of the polypeptide, such as glycosylation, acetylation, phosphorylation, and the like, as well as other modifications known in the art, such as found in nature and not found in nature.

Понятия «выделенный белок», «выделенный пептид» или «выделенный полипептид» и тому подобное, используемые в настоящей заявке, относятся к синтезу, выделению и/или очистке молекулы пептида или полипептида in vitro из клеточной среды и из ассоциации с другими компонентами клетки, т.е. она существенно не ассоциирована с веществами in vivo.The terms "isolated protein", "isolated peptide" or "isolated polypeptide" and the like, as used in this application, refer to the synthesis, isolation and / or purification of a peptide or polypeptide molecule in vitro from the cellular environment and from association with other components of the cell, those. it is not significantly associated with substances in vivo.

Иллюстративные примеры полипептидов, рассматриваемых в частных вариантах реализации включают, среди прочего, варианты хоминг-эндонуклеазы, megaTAL, изменяющие структуру концов нуклеазы, слитые полипептиды и их варианты.Illustrative examples of polypeptides contemplated in particular embodiments include, but are not limited to, homing endonuclease variants, megaTAL, restructuring nuclease ends, fusion polypeptides, and variants thereof.

Полипептиды включают в себя «варианты полипептидов». Варианты полипептидов могут отличаться от встречающихся в природе полипептидов заменами, делециями, добавлениями и/или инсерциями одной или нескольких аминокислот.Такие варианты могут встречаться в природе или могут быть получены синтетическим путем, например, путем модификации одной или нескольких аминокислот из вышеуказанных полипептидных последовательностей. Например, в частных вариантах реализации может быть желательно улучшить биологические свойства хоминг-эндонуклеазы, megaTAL или тому подобного, связывающих и расщепляющих сайт-мишень в гене PD-1 человека, путем введения одной или нескольких замен, делеции, добавления и/или инсерции в полипептид. В частных вариантах реализации полипептиды включают полипептиды, имеющие идентичность аминокислот по меньшей мере на приблизительно 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%,85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% с любой из эталонных последовательностей, рассматриваемых в настоящей заявке, обычно, когда указанный вариант сохраняет по меньшей мере один тип биологической активности эталонной последовательности.Polypeptides include "variant polypeptides". Variant polypeptides may differ from naturally occurring polypeptides by substitutions, deletions, additions, and/or insertions of one or more amino acids. Such variants may occur naturally or may be produced synthetically, for example, by modifying one or more amino acids from the above polypeptide sequences. For example, in particular embodiments, it may be desirable to improve the biological properties of a homing endonuclease, megaTAL, or the like, that binds and cleaves a target site in the human PD-1 gene by introducing one or more substitutions, deletions, additions, and/or insertions into the polypeptide . In particular embodiments, the polypeptides include polypeptides having at least about 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80 amino acid identity. %, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% with any of the reference sequences considered in this application, usually when the specified option retains at least one type of biological activity of the reference sequence.

Варианты полипептидов включают биологически активные «полипептидные фрагменты». Иллюстративные примеры биологически активных полипептидных фрагментов включают ДНК-связывающие домены, нуклеазные домены и тому подобное. Используемый в настоящей заявке термин «биологически активный фрагмент» или «минимально биологически активный фрагмент» относится к полипептидному фрагменту, который сохраняет по меньшей мере 100%, по меньшей мере 90%, по меньшей мере 80%, по меньшей мере 70%, по меньшей мере 60%, по меньшей мере 50%, по меньшей мере 40%, по меньшей мере 30%, по меньшей мере 20%, по меньшей мере 10% или, по меньшей мере 5% от встречающейся в природе полипептидной активности. В предпочтительных вариантах реализации биологическая активность представляет собой аффинность связывания и/или активность расщепления для последовательности-мишени. В некоторых вариантах реализации полипептидный фрагмент может содержать аминокислотную цепь длиной по меньшей мере от 5 до 1700 аминокислот.Понятно, что в некоторых вариантах реализации длина фрагментов не менее 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700 или более аминокислот.В частных вариантах реализации полипептид содержит биологически активный фрагмент варианта хоминг-эндонуклеазы. В частных вариантах реализации полипептиды, описанные в настоящей заявке, могут содержать одну или более аминокислот, обозначенных как «X». «X», если присутствует в аминокислоте SEQ ID NO, относится к любой аминокислоте. Один или более остатков «X» могут присутствовать на N- и C-концах аминокислотной последовательности, представленной в конкретных SEQ ID NO, рассматриваемых в настоящей заявке. Если аминокислоты «Х» отсутствуют, оставшаяся аминокислотная последовательность, представленная в SEQ ID NO, может считаться биологически активным фрагментом.Polypeptide variants include biologically active "polypeptide fragments". Illustrative examples of biologically active polypeptide fragments include DNA binding domains, nuclease domains, and the like. Used in this application, the term "biologically active fragment" or "minimum biologically active fragment" refers to a polypeptide fragment that retains at least 100%, at least 90%, at least 80%, at least 70%, at least at least 60%, at least 50%, at least 40%, at least 30%, at least 20%, at least 10%, or at least 5% of the naturally occurring polypeptide activity. In preferred embodiments, the biological activity is a binding affinity and/or a cleavage activity for a target sequence. In some embodiments, the polypeptide fragment may contain an amino acid chain of at least 5 to 1700 amino acids in length. It is understood that in some embodiments, fragments are at least 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 in length. , 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 , 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 150, 200, 250 . embodiments, the polypeptide contains a biologically active fragment of a homing endonuclease variant. In private embodiments, the implementation of the polypeptides described in this application may contain one or more amino acids, designated as "X". "X", if present in the amino acid of SEQ ID NO, refers to any amino acid. One or more "X" residues may be present at the N- and C-terminus of the amino acid sequence shown in the specific SEQ ID NOs contemplated herein. If "X" amino acids are missing, the remaining amino acid sequence shown in SEQ ID NO can be considered a biologically active fragment.

В частных вариантах реализации полипептид содержит биологически активный фрагмент варианта хоминг-эндонуклеазы, например, SEQ ID NO: 3-14 и 60-63, или megaTAL (SEQ ID NO: 15-23 и 64). Биологически активный фрагмент может содержать усечение N-конца и/или усечение C-конца. В частном варианте реализации биологически активный фрагмент не содержит или содержит делецию 1, 2, 3, 4, 5, 6, 7 или 8 N-концевых аминокислот варианта хоминг-эндонуклеазы по сравнению с последовательностью соответствующей хоминг-эндонуклеазы дикого типа, более предпочтительно - делецию 4 N-концевых аминокислот варианта хоминг-эндонуклеазы по сравнению с соответствующей последовательностью хоминг-эндонуклеазы дикого типа. В частном варианте реализации биологически активный фрагмент не содержит или содержит делецию 1, 2, 3, 4 или 5 С-концевых аминокислот варианта хоминг-эндонуклеазы по сравнению с соответствующей последовательностью хоминг-эндонуклеазы дикого типа, более предпочтительно делецию 2 C-концевых аминокислот варианта хоминг-эндонуклеазы по сравнению с соответствующей последовательностью хоминг-эндонуклеазы дикого типа. В частном предпочтительном варианте реализации биологически активный фрагмент не содержит или содержит делецию 4 N-концевых аминокислот и 2 C-концевых аминокислот варианта хоминг-эндонуклеазы по сравнению с соответствующей последовательностью хоминг-эндонуклеазы дикого типа.In particular embodiments, the polypeptide comprises a biologically active fragment of a homing endonuclease variant, for example, SEQ ID NOs: 3-14 and 60-63, or megaTAL (SEQ ID NOs: 15-23 and 64). The biologically active fragment may contain an N-terminal truncation and/or a C-terminal truncation. In a particular embodiment, the biologically active fragment does not contain or contains a deletion of 1, 2, 3, 4, 5, 6, 7, or 8 N-terminal amino acids of the homing endonuclease variant compared to the sequence of the corresponding wild-type homing endonuclease, more preferably the deletion The 4 N-terminal amino acids of the homing endonuclease variant compared to the corresponding wild-type homing endonuclease sequence. In a particular embodiment, the biologically active fragment does not contain or contains a deletion of the 1, 2, 3, 4, or 5 C-terminal amino acids of the homing endonuclease variant compared to the corresponding wild-type homing endonuclease sequence, more preferably a deletion of the 2 C-terminal amino acids of the homing variant α-endonuclease compared to the corresponding wild-type homing endonuclease sequence. In a particular preferred embodiment, the biologically active fragment lacks or contains a deletion of the 4 N-terminal amino acids and 2 C-terminal amino acids of the homing endonuclease variant compared to the corresponding sequence of the wild-type homing endonuclease.

В частном варианте реализации вариант I-OnuI содержит делецию 1, 2, 3, 4, 5, 6, 7 или 8 следующих N-концевых аминокислот: М, А, Y, М, S, R, R, E; и/или делецию следующих 1, 2, 3, 4 или 5 С-концевых аминокислот: R, G, S, F, V.In a private embodiment, the I-OnuI variant contains a deletion of 1, 2, 3, 4, 5, 6, 7, or 8 of the following N-terminal amino acids: M, A, Y, M, S, R, R, E; and/or deletion of the following 1, 2, 3, 4 or 5 C-terminal amino acids: R, G, S, F, V.

В частном варианте реализации вариант I-OnuI содержит делецию или замену 1, 2, 3, 4, 5, 6, 7 или 8 следующих N-концевых аминокислот: M, A, Y, M, S, R, R, E; и/или делецию или замену следующих 1, 2, 3, 4, или 5 C-концевых аминокислот: R, G, S, F, V.In a private embodiment, the I-OnuI variant contains a deletion or substitution of 1, 2, 3, 4, 5, 6, 7, or 8 of the following N-terminal amino acids: M, A, Y, M, S, R, R, E; and/or deletion or substitution of the following 1, 2, 3, 4, or 5 C-terminal amino acids: R, G, S, F, V.

В частном варианте реализации вариант I-OnuI содержит делецию 1, 2, 3, 4, 5, 6, 7 или 8 следующих N-концевых аминокислот: М, А, Y, М, S, R, R, E; и/или делецию следующих 1 или 2 С-концевых аминокислот: F, V.In a private embodiment, the I-OnuI variant contains a deletion of 1, 2, 3, 4, 5, 6, 7, or 8 of the following N-terminal amino acids: M, A, Y, M, S, R, R, E; and/or deletion of the following 1 or 2 C-terminal amino acids: F, V.

В частном варианте реализации вариант I-OnuI содержит делецию или замену 1, 2, 3, 4, 5, 6, 7, или 8 следующих N-концевых аминокислот: M, A, Y, M, S, R, R, E; и/или делецию или замену следующих 1 или 2 С-концевых аминокислот: F, V.In a private embodiment, the I-OnuI variant contains a deletion or substitution of 1, 2, 3, 4, 5, 6, 7, or 8 of the following N-terminal amino acids: M, A, Y, M, S, R, R, E; and/or deletion or substitution of the following 1 or 2 C-terminal amino acids: F, V.

Как отмечено выше, полипептиды могут быть изменены различными способами, включая замены, делеции, усечения и инсерции аминокислот.Способы таких манипуляций как правило известны в данной области. Например, варианты аминокислотной последовательности эталонного полипептида могут быть получены мутациями в ДНК. Методы мутагенеза и изменения нуклеотидных последовательностей хорошо известны в данной области. См. например, Kunkel (1985, Proc. Natl. Acad. Sci. USA. 82: 488-492), Kunkel et al., (1987, Methods in Enzymol, 154: 367-382), Патент США №4873192, Watson, J. D. et al., (Molecular Biology of the Gene, Fourth Edition, Benjamin/Cummings, Menlo Park, Calif., 1987) и ссылках, приведенных там. Руководство по подходящим аминокислотным заменам, которые не влияют на биологическую активность интересующего белка, можно найти в модели Dayhoff et al., (1978) Atlas of Protein Sequence and Structure (Natl. Biomed. Res. Found., Washington, D.C.).As noted above, polypeptides can be altered in a variety of ways, including amino acid substitutions, deletions, truncations, and insertions. Methods for such manipulations are generally known in the art. For example, variants of the amino acid sequence of a reference polypeptide can be generated by mutations in the DNA. Methods for mutagenesis and alteration of nucleotide sequences are well known in the art. See for example, Kunkel (1985, Proc. Natl. Acad. Sci. USA. 82: 488-492), Kunkel et al. , J. D. et al., (Molecular Biology of the Gene, Fourth Edition, Benjamin/Cummings, Menlo Park, Calif., 1987) and references cited there. Guidance on suitable amino acid substitutions that do not affect the biological activity of the protein of interest can be found in the model of Dayhoff et al., (1978) Atlas of Protein Sequence and Structure (Natl. Biomed. Res. Found., Washington, D.C.).

В некоторых вариантах реализации вариант будет содержать одну или более консервативных замен. «Консервативная замена» представляет собой замену аминокислоты другой аминокислотой, которая обладает сходными свойствами, так что специалист в области химии пептидов может ожидать, что вторичная структура и гидропатическая природа полипептида практически не изменятся. Модификации могут быть внесены в структуру полинуклеотидов и полипептидов, рассматриваемых в частных вариантах, причем полипептиды включают полипептиды, имеющие, по меньшей мере приблизительно и при этом получать функциональные молекулы, которые кодируют вариант или производное полипептида с желаемыми характеристиками. Когда желательно изменить аминокислотную последовательность полипептида для создания эквивалентного или даже улучшенного варианта полипептида, специалист в данной области может, например, изменить один или более кодонов кодирующей последовательности ДНК, например в соответствии с таблицей 1.In some embodiments, the variant will contain one or more conservative substitutions. A "conservative substitution" is the substitution of an amino acid for another amino acid that has similar properties, such that one skilled in the art of peptide chemistry would expect the secondary structure and hydropathic nature of the polypeptide to be substantially unchanged. Modifications can be made to the structure of polynucleotides and polypeptides considered in particular variants, and the polypeptides include polypeptides having, at least approximately, and at the same time obtain functional molecules that encode a variant or derivative of a polypeptide with the desired characteristics. When it is desired to change the amino acid sequence of a polypeptide to create an equivalent or even improved variant of the polypeptide, one skilled in the art can, for example, change one or more codons of the DNA coding sequence, for example, in accordance with Table 1.

Таблица 1 - Аминокислотные кодоныTable 1 - Amino acid codons

Figure 00000002
Руководство по определению того, какие именно аминокислотные остатки могут быть замещены, вставлены или удалены без потери биологической активности, можно найти с помощью компьютерных программ, хорошо известных в данной области, таких как программное обеспечение DNASTAR, DNA Strider, Geneious, Mac Vector или Vector NTI. Предпочтительно аминокислотные замены в вариантах белка, раскрытых в данном описании, представляют собой консервативные аминокислотные замены, то есть замены одинаково заряженных или незаряженных аминокислот.Консервативная замена аминокислот включает замену одной из семейства аминокислот, которые родственны в их боковых цепях. Встречающиеся в природе аминокислоты, как правило, делятся на четыре семейства: кислые (аспартат, глутамат), основные (лизин, аргинин, гистидин), неполярные (аланин, валин, лейцин, изолейцин, пролин, фенилаланин, метионин, триптофан) и незаряженные полярные (глицин, аспарагин, глутамин, цистеин, серин, треонин, тирозин) аминокислоты. Фенилаланин, триптофан и тирозин иногда классифицируют как ароматические аминокислоты. В пептиде или белке подходящие консервативные замены аминокислот известны специалистам в данной области и обычно могут быть сделаны без изменения биологической активности получающейся в результате молекулы. Специалисты в данной области признают, что, как правило, единичные аминокислотные замены в несущественных областях полипептида существенно не изменяют биологическую активность (см., например, Watson et al. Molecular Biology of the Gene, 4th Edition, 1987, The Benjamin/Cummings Pub. Co., p.224).
Figure 00000002
Guidance on which amino acid residues can be substituted, inserted, or removed without loss of biological activity can be found using computer programs well known in the art, such as DNASTAR, DNA Strider, Geneious, Mac Vector, or Vector NTI software. . Preferably, amino acid substitutions in the protein variants disclosed herein are conservative amino acid substitutions, that is, substitutions of identically charged or uncharged amino acids. A conservative amino acid substitution includes substitution of one of a family of amino acids that are related in their side chains. Naturally occurring amino acids are generally divided into four families: acidic (aspartate, glutamate), basic (lysine, arginine, histidine), non-polar (alanine, valine, leucine, isoleucine, proline, phenylalanine, methionine, tryptophan), and uncharged polar (glycine, asparagine, glutamine, cysteine, serine, threonine, tyrosine) amino acids. Phenylalanine, tryptophan, and tyrosine are sometimes classified as aromatic amino acids. In a peptide or protein, suitable conservative amino acid substitutions are known to those skilled in the art and can generally be made without altering the biological activity of the resulting molecule. It will be recognized by those skilled in the art that, in general, single amino acid substitutions in non-essential regions of a polypeptide do not significantly alter biological activity (see, e.g., Watson et al. Molecular Biology of the Gene, 4th Edition, 1987, The Benjamin/Cummings Pub. Co., p.224).

В одном варианте реализации, где желательна экспрессия двух или более полипептидов, полинуклеотидные последовательности, кодирующие их, могут быть разделены последовательностью IRES, как описано в другом месте в настоящей заявке.In one embodiment, where expression of two or more polypeptides is desired, the polynucleotide sequences encoding them may be separated by an IRES sequence, as described elsewhere in this application.

Полипептиды, рассматриваемые в частных вариантах реализации включают слитые полипептиды. В частных вариантах реализации предлагаются слитые полипептиды и полинуклеотиды, кодирующие слитые полипептиды. Слитые полипептиды и слитые белки обозначают полипептид, имеющий по меньшей мере два, три, четыре, пять, шесть, семь, восемь, девять или десять полипептидных сегментов.Polypeptides contemplated in particular embodiments include fusion polypeptides. In particular embodiments, fusion polypeptides and polynucleotides encoding fusion polypeptides are provided. Fusion polypeptides and fusion proteins refer to a polypeptide having at least two, three, four, five, six, seven, eight, nine, or ten polypeptide segments.

В другом варианте реализации два или более полипептида могут быть экспрессированы в виде слитого белка, который содержит одну или более последовательностей саморасщепляемых полипептидов, как описано в другом месте в настоящей заявке.In another embodiment, two or more polypeptides can be expressed as a fusion protein that contains one or more self-cleaving polypeptide sequences, as described elsewhere in this application.

В одном варианте реализации рассматриваемый в настоящей заявке слитый белок содержит один или более ДНК-связывающих доменов и одну или более нуклеаз, а также один или более линкеров и/или саморасщепляемых полипептидов.In one embodiment, the fusion protein of the present application contains one or more DNA-binding domains and one or more nucleases, as well as one or more linkers and/or self-cleaving polypeptides.

В одном варианте реализации рассматриваемый в настоящей заявке слитый белок содержит вариант нуклеазы; линкер или саморасщепляемый пептид; и фермент, изменяющий участки концов, включая, среди прочего, 5'-3' экзонуклеазу, 5'-3' щелочную экзонуклеазу и 3'-5' экзонуклеазу (например, Trex2).In one embodiment, the fusion protein of the present application contains a nuclease variant; a linker or self-cleaving peptide; and an end-altering enzyme including but not limited to 5'-3' exonuclease, 5'-3' alkaline exonuclease, and 3'-5' exonuclease (eg, Trex2).

Слитые полипептиды могут содержать один или более полипептидных доменов или сегментов, включая, среди прочего, сигнальные пептиды, проникающие в клетку пептидные домены (CPP), ДНК-связывающие домены, нуклеазные домены и т.д., метки эпитопа (например, мальтозосвязывающий белок («MBP»), глутатион-S-трансферазу (GST), HIS6, MYC, FLAG, V5, VSV-G и HA), полипептидные линкеры и сигналы расщепления полипептидов. Слитые полипептиды обычно связаны С-концом с N-концом, хотя они также могут быть связаны С-концом с С-концом, N-концом с N-концом или N-концом с С-концом. В частных вариантах реализации полипептиды слитого белка могут быть в любом порядке. Слитые полипептиды или слитые белки могут также включать консервативно модифицированные варианты, полиморфные варианты, аллели, мутанты, подпоследовательности и межвидовые гомологи, при условии, что желаемая активность слитого полипептида сохраняется. Слитые полипептиды могут быть получены методами химического синтеза или химической связью между двумя фрагментами или, как правило, могут быть получены с использованием других стандартных методик. Лигированные последовательности ДНК, содержащие слитый полипептид, функционально связаны с подходящими элементами контроля транскрипции или трансляции, как описано в другом месте в настоящей заявке.Fusion polypeptides may contain one or more polypeptide domains or segments, including, but not limited to, signal peptides, cell penetrating peptide (CPP) domains, DNA binding domains, nuclease domains, etc., epitope tags (e.g., maltose-binding protein ( "MBP"), glutathione S-transferase (GST), HIS6, MYC, FLAG, V5, VSV-G and HA), polypeptide linkers and polypeptide cleavage signals. Fusion polypeptides are usually linked C-terminus to N-terminus, although they can also be linked C-terminus to C-terminus, N-terminus to N-terminus, or N-terminus to C-terminus. In particular embodiments, the fusion protein polypeptides may be in any order. Fusion polypeptides or fusion proteins may also include conservatively modified variants, polymorphic variants, alleles, mutants, subsequences, and cross-species homologues, so long as the desired activity of the fusion polypeptide is maintained. Fusion polypeptides may be prepared by chemical synthesis or by chemical bonding between two fragments, or generally may be prepared using other standard techniques. Ligated DNA sequences containing the fusion polypeptide are operably linked to appropriate transcription or translation control elements as described elsewhere in this application.

Слитые полипептиды могут необязательно содержать линкер, который можно использовать для связывания одного или нескольких полипептидов или доменов внутри полипептида. Последовательность пептидного линкера может быть использована для разделения любых двух или более полипептидных компонентов на расстояние, достаточное для того, чтобы каждый полипептид складывался в свои соответствующие вторичные и третичные структуры так, чтобы позволить полипептидным доменам выполнять свои желаемые функции. Такая пептидная линкерная последовательность включается в слитый полипептид с использованием стандартных методик в данной области. Подходящие пептидные линкерные последовательности могут быть выбраны на основании следующих факторов: (1) их способности принимать гибкую расширенную конформацию; (2) их неспособности принимать вторичную структуру, которая могла бы взаимодействовать с функциональными эпитопами на первом и втором полипептидах; и (3) отсутствия гидрофобных или заряженных остатков, которые могли бы реагировать с полипептидными функциональными эпитопами. Предпочтительные пептидные линкерные последовательности содержат остатки Gly, Asn и Ser. Другие почти нейтральные аминокислоты, такие как Thr и Ala, также могут быть использованы в линкерной последовательности. Аминокислотные последовательности, которые можно эффективно использовать в качестве линкеров, включают последовательности, раскрытые в Maratea et al., Gene 40:39-46, 1985; Murphy et al., Proc. Natl. Acad. Sci. USA 83:8258-8262, 1986; Патент США №4,935,233 и Патент США №4,751,180. Последовательности линкеров не требуются, когда частный сегмент полипептида слияния содержит несущественные N-концевые аминокислотные области, которые можно использовать для разделения функциональных доменов и предотвращения стерического влияния. Предпочтительными линкерами обычно являются гибкие аминокислотные подпоследовательности, которые синтезируются как часть рекомбинантного слитого белка. Линкерные полипептиды могут иметь длину от 1 до 200 аминокислот, длину от 1 до 100 аминокислот или длину от 1 до 50 аминокислот, включая все целые значения между ними.Fusion polypeptides may optionally contain a linker that can be used to link one or more polypeptides or domains within the polypeptide. A peptide linker sequence can be used to separate any two or more polypeptide components by a distance sufficient for each polypeptide to fold into its respective secondary and tertiary structures so as to allow the polypeptide domains to perform their desired functions. Such a peptide linker sequence is incorporated into the fusion polypeptide using standard techniques in the art. Suitable peptide linker sequences can be selected based on the following factors: (1) their ability to adopt a flexible extended conformation; (2) their inability to adopt a secondary structure that could interact with functional epitopes on the first and second polypeptides; and (3) the absence of hydrophobic or charged residues that could react with polypeptide functional epitopes. Preferred peptide linker sequences contain Gly, Asn and Ser residues. Other nearly neutral amino acids such as Thr and Ala can also be used in the linker sequence. Amino acid sequences that can be effectively used as linkers include those disclosed in Maratea et al., Gene 40:39-46, 1985; Murphy et al., Proc. Natl. Acad. sci. USA 83:8258-8262, 1986; US Patent No. 4,935,233 and US Patent No. 4,751,180. Linker sequences are not required when the private segment of the fusion polypeptide contains non-essential N-terminal amino acid regions that can be used to separate functional domains and prevent steric influence. Preferred linkers are usually flexible amino acid subsequences that are synthesized as part of a recombinant fusion protein. Linker polypeptides can be 1 to 200 amino acids in length, 1 to 100 amino acids in length, or 1 to 50 amino acids in length, including all integers in between.

Типичные линкеры включают, среди прочего, следующие аминокислотные последовательности: глициновые полимеры (G)n; глицин-сериновые полимеры (G1-5S1-5)n, где n представляет собой целое число, величиной по меньшей мере один, два, три, четыре, или пять; глицин-аланиновые полимеры; аланин-сериновые полимеры; GGG (SEQ ID NO: 69); DGGGS (SEQ ID NO: 70); TGEKP (SEQ ID NO: 71) (см. например, Liu et al., PNAS 5525-5530 (1997)); GGRR (SEQ ID NO: 72) (Pomerantz et al. 1995, supra); (GGGGS)n где n=1, 2, 3, 4 или 5 (SEQ ID NO: 73) (Kim et al., PNAS 93, 1156-1160 (1996.); EGKSSGSGSESKVD (SEQ ID NO: 74) (Chaudhary et al., 1990, Proc. Natl. Acad. Sci. U.S.A. 87:1066-1070); KESGSVSSEQLAQFRSLD (SEQ ID NO: 75) (Bird et al., 1988, Science 242:423-426), GGRRGGGS (SEQ ID NO: 76); LRQRDGERP (SEQ ID NO: 77); LRQKDGGGSERP (SEQ ID NO: 78); LRQKD(GGGS)2ERP (SEQ ID NO: 79). В альтернативном варианте гибкие линкеры могут быть рационально разработаны с использованием компьютерной программы, способной моделировать как сайты связывания ДНК, так и сами пептиды (Desjarlais & Berg, PNAS 90:2256-2260 (1993), PNAS 91:11099-11103 (1994) или методами фагового дисплея.Typical linkers include, among others, the following amino acid sequences: glycine polymers (G) n ; glycine-serine polymers (G 1 - 5 S 1 - 5 ) n , where n is an integer of at least one, two, three, four, or five; glycine-alanine polymers; alanine-serine polymers; GGG (SEQ ID NO: 69); DGGGS (SEQ ID NO: 70); TGEKP (SEQ ID NO: 71) (see, for example, Liu et al., PNAS 5525-5530 (1997)); GGRR (SEQ ID NO: 72) (Pomerantz et al. 1995, supra); (GGGGS) n where n=1, 2, 3, 4 or 5 (SEQ ID NO: 73) (Kim et al., PNAS 93, 1156-1160 (1996.); EGKSSGSGSESKVD (SEQ ID NO: 74) (Chaudhary et al., 1990, Proc. Natl. Acad. Sci. USA 87:1066-1070); NO: 76) LRQRDGERP (SEQ ID NO: 77) LRQKDGGGSERP (SEQ ID NO: 78) LRQKD(GGGS) 2 ERP (SEQ ID NO: 79) Alternatively, flexible linkers can be intelligently designed using a computer program capable of modeling both DNA binding sites and peptides themselves (Desjarlais & Berg, PNAS 90:2256-2260 (1993), PNAS 91:11099-11103 (1994) or phage display methods.

Слитые полипептиды могут дополнительно содержать сигнал расщепления полипептида между каждым из полипептидных доменов, описанных в настоящей заявке, или между эндогенной открытой рамкой считывания и полипептидом, кодируемым донорной матрицей репарации. Кроме того, сайт расщепления полипептида может быть введен в любую линкерную пептидную последовательность. Типичные сигналы расщепления полипептидов включают сайты распознавания расщепления полипептидов, такие как сайты расщепления протеазами, сайты расщепления нуклеазами (например, сайты распознавания редких ферментов рестрикции, сайты распознавания саморасщепляемого рибозима) и саморасщепляемые вирусные олигопептиды (см. deFelipe and Ryan, 2004. Traffic, 5(8); 616-26).The fused polypeptides may further comprise a polypeptide cleavage signal between each of the polypeptide domains described herein, or between an endogenous open reading frame and a polypeptide encoded by a donor repair template. In addition, a polypeptide cleavage site can be introduced into any linker peptide sequence. Exemplary polypeptide cleavage signals include polypeptide cleavage recognition sites such as protease cleavage sites, nuclease cleavage sites (eg, rare restriction enzyme recognition sites, self-cleaving ribozyme recognition sites), and self-cleaving viral oligopeptides (see deFelipe and Ryan, 2004. Traffic, 5( 8); 616-26).

Подходящие сайты расщепления протеазами и саморасщепляемый пептид известны специалистам в данной области (см., Например, в Ryan et al., 1997. J. Gener. Virol. 78, 699-722; Scymczak et al. (2004) Nature Biotech. 5, 589-594). Типичные сайты расщепления протеазами включают, среди прочего, сайты расщепления протеазами NIa потивируса (например, протеазы вируса гравировки табака), протеазами потивируса HC, протеазами потивируса P1 (P35), протеазами биовируса NIa, протеазами, кодируемыми биовирусом RNA-2, протеазами афтовируса L, протеазами энтеровируса 2A, протеазами риновируса 2A, протеазами пикорнавируса 3C, протеазами комовируса 24K, протеазами неповируса 24K, 3C-подобной протеазой RTSV (сферический вирус риса тунгро), 3C-подобной протеазой PYVF (вирус желтой пятнистости пастернака), гепарином, тромбином, фактором Ха и энтерокиназой. Из-за высокой строгости расщепления сайты расщепления протеазой TEV (вирус гравировки табака) являются предпочтительными в одном варианте реализации, например, EXXYXQ (G/S) (SEQ ID NO: 80), например, ENLYFQG (SEQ ID NO: 81) и ENLYFQS (SEQ ID NO: 82), где X представляет собой любую аминокислоту (расщепление с помощью TEV происходит между Q и G или Q и S).Suitable protease cleavage sites and self-cleaving peptide are known to those skilled in the art (see, for example, Ryan et al., 1997. J. Gener. Virol. 78, 699-722; Scymczak et al. (2004) Nature Biotech. 5, 589-594). Exemplary protease cleavage sites include, but are not limited to, cleavage sites for potyvirus NIa proteases (e.g., tobacco etch virus proteases), potyvirus HC proteases, potyvirus P1 (P35) proteases, biovirus NIa proteases, biovirus-encoded RNA-2 proteases, aphthovirus L proteases, Enterovirus 2A proteases, Rhinovirus 2A proteases, Picornavirus 3C proteases, Comovirus 24K proteases, Nepovirus 24K proteases, RTSV 3C-like protease (spherical tungro rice virus), PYVF 3C-like protease (parsnip yellow spot virus), heparin, thrombin and enterokinase. Due to the high stringency of cleavage, TEV (tobacco etch virus) protease cleavage sites are preferred in one embodiment, e.g., EXXYXQ (G/S) (SEQ ID NO: 80), e.g. (SEQ ID NO: 82) where X is any amino acid (TEV cleavage occurs between Q and G or Q and S).

В некоторых вариантах реализации сайт саморасщепляемого полипептида содержит 2A или 2A-подобный сайт, последовательность или домен (Donnelly et al., 2001. J. Gen. Virol. 82:1027-1041). В частном варианте реализации вирусный пептид 2А представляет собой пептид афтовируса 2А, пептид потивируса 2А или пептид кардиовируса 2А.In some embodiments, the self-cleaving polypeptide site contains a 2A or 2A-like site, sequence, or domain (Donnelly et al., 2001. J. Gen. Virol. 82:1027-1041). In a particular embodiment, the 2A viral peptide is an aphthovirus 2A peptide, a potyvirus 2A peptide, or a cardiovirus 2A peptide.

В одном варианте реализации вирусный 2A-пептид выбран из группы, состоящей из: 2A-пептида вируса ящура (FMDV), 2A-пептида вируса ринита A (ERAV), 2A-пептида вируса Thosea asigna (TaV), 2A-пептида свиного тешовируса-1 (PTV-1), 2A-пептида тейловируса и 2A-пептида вируса энцефаломиокардита.In one embodiment, the viral 2A peptide is selected from the group consisting of: foot and mouth disease virus (FMDV) 2A peptide, rhinitis A virus (ERAV) 2A peptide, Thosea asigna virus (TaV) 2A peptide, porcine teshovirus 2A peptide. 1 (PTV-1), theilovirus 2A peptide and encephalomyocarditis virus 2A peptide.

Иллюстративные примеры сайтов 2А представлены в таблице 2.Illustrative examples of 2A sites are shown in Table 2.

ТАБЛИЦА 2: Типичные сайты 2А включают следующие последовательности:TABLE 2: Representative 2A sites include the following sequences:

Figure 00000003
Figure 00000003

E. ПолинуклеотидыE. Polynucleotides

В частных вариантах реализации предусмотрены полинуклеотиды, кодирующие один или более вариантов хоминг-эндонуклеазы, megaTAL, ферменты, изменяющие структуру концов и слитые полипептиды, рассматриваемые в настоящей заявке. Используемые в настоящей заявке термины «полинуклеотид» или «нуклеиновая кислота» относятся к дезоксирибонуклеиновой кислоте (ДНК), рибонуклеиновой кислоте (РНК) и гибридам ДНК/РНК. Полинуклеотиды могут быть одноцепочечными или двухцепочечными, а также рекомбинантными, синтетическими или выделенными. Полинуклеотиды включают, среди прочего: предшественник мРНК (пре-мРНК), матричную РНК (мРНК), РНК, короткую интерферирующую РНК (киРНК), короткую шпилечную РНК (кшРНК), микроРНК (миРНК), рибозимы, геномную РНК (гРНК), РНК «плюс-цепь» (РНК (+)), РНК «минус-цепь» (РНК (-)), tracrРНК, crРНК, одиночную направляющую РНК (sgРНК), синтетическую РНК, синтетическую мРНК, геномную ДНК (гДНК), амплифицированную ПЦР ДНК, комплементарную ДНК (кДНК), синтетическую ДНК или рекомбинантную ДНК. Термин «полинуклеотиды» относитс к полимерной форме нуклеотидов длиной по меньшей мере 5, по меньшей мере 10, по меньшей мере 15, по меньшей мере 20, по меньшей мере 25, по меньшей мере 30, по меньшей мере 40, по меньшей мере 50, по меньшей мере 100, по меньшей мере 200, по меньшей мере 300, по меньшей мере 400, по меньшей мере 500, по меньшей мере 1000, по меньшей мере 5000, по меньшей мере 10000 или по меньшей мере 15000 или более нуклеотидов, либо рибонуклеотидов или дезоксирибонуклеотидов, либо модифицированных форм нуклеотидов любого типа, а также все промежуточные длины. Понятно, что «промежуточные длины» в данном контексте означают любую длину между указанными значениями, такую как 6, 7, 8, 9, и т.д.., 101, 102, 103, и т.д.; 151, 152, 153, и т.д.; 201, 202, 203, и т.д. В частных вариантах реализации полинуклеотиды или варианты имеют последовательность, идентичную на по меньшей мере или приблизительно 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% с эталонной последовательностью.In particular embodiments, provided are polynucleotides encoding one or more variants of the homing endonuclease, megaTAL, end restructuring enzymes, and fusion polypeptides of the present application. As used herein, the terms "polynucleotide" or "nucleic acid" refer to deoxyribonucleic acid (DNA), ribonucleic acid (RNA), and DNA/RNA hybrids. Polynucleotides can be single or double stranded, as well as recombinant, synthetic or isolated. Polynucleotides include, but are not limited to: mRNA precursor (pre-mRNA), messenger RNA (mRNA), RNA, short interfering RNA (siRNA), short hairpin RNA (shRNA), microRNA (siRNA), ribozymes, genomic RNA (gRNA), RNA plus strand (RNA (+)), minus strand RNA (RNA (-)), tracrRNA, crRNA, single guide RNA (sgRNA), synthetic RNA, synthetic mRNA, genomic DNA (gDNA), amplified PCR DNA, complementary DNA (cDNA), synthetic DNA or recombinant DNA. The term "polynucleotides" refers to the polymeric form of nucleotides at least 5, at least 10, at least 15, at least 20, at least 25, at least 30, at least 40, at least 50 long, at least 100, at least 200, at least 300, at least 400, at least 500, at least 1000, at least 5000, at least 10000 or at least 15000 or more nucleotides or ribonucleotides or deoxyribonucleotides, or modified forms of nucleotides of any type, and all lengths in between. It is understood that "intermediate lengths" in this context means any length between the specified values, such as 6, 7, 8, 9, etc., 101, 102, 103, etc.; 151, 152, 153, etc.; 201, 202, 203, etc. In particular embodiments, the polynucleotides or variants have a sequence identity that is at least or about 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93% , 94%, 95%, 96%, 97%, 98%, 99%, or 100% with a reference sequence.

В частных вариантах реализации полинуклеотиды могут быть кодон-оптимизированными. Используемый в настоящей заявке термин «кодон-оптимизированный» относится к замене кодонов в полинуклеотиде, кодирующем полипептид, для увеличения экспрессии, стабильности и/или активности полипептида. Факторы, которые влияют на оптимизацию кодонов, включают, среди прочего, один или более из следующих: (i) вариация смещения кодонов между двумя или более организмами или генами или синтетически сконструированными таблицами смещения, (ii) вариация степени смещения кодонов в пределах организма, гена или набора генов, (iii) систематическая вариация кодонов, включая контекст, (iv) вариация кодонов в соответствии с их декодирующими тРНК, (v) вариация кодонов в соответствии с GC%, либо в целом, либо в одной позиции триплета, (vi) изменение степени сходства с эталонной последовательностью, например, встречающейся в природе последовательностью, (vii) вариация порогового значения частоты кодона, (viii) структурные свойства мРНК, транскрибируемых с последовательности ДНК, (ix) предшествующее знание о функции последовательностей ДНК, на котором должен строиться дизайн набора замещения кодонов, (x) систематическая вариация наборов кодонов для каждой аминокислоты и/или (xi) изолированное удаление ложных сайтов инициации трансляции.In particular embodiments, the polynucleotides may be codon-optimized. Used in this application, the term "codon-optimized" refers to the replacement of codons in the polynucleotide encoding the polypeptide, to increase the expression, stability and/or activity of the polypeptide. Factors that influence codon optimization include, but are not limited to, one or more of the following: (i) variation in codon bias between two or more organisms or genes or synthetically engineered bias tables, (ii) variation in the degree of codon bias within an organism, gene or a set of genes, (iii) systematic codon variation, including context, (iv) codon variation according to their decoding tRNAs, (v) codon variation according to GC%, either in total or in one triplet position, (vi) change in degree of similarity to a reference sequence, such as a naturally occurring sequence, (vii) variation in codon frequency threshold, (viii) structural properties of mRNAs transcribed from a DNA sequence, (ix) prior knowledge of the function of DNA sequences on which to base the design set of codon substitutions, (x) systematic variation of codon sets for each amino acid, and/or (xi) isolated deletion of l different translation initiation sites.

Используемый в настоящей заявке термин «нуклеотид» относится к гетероциклическому азотистому основанию в N-гликозидной связи с фосфорилированным сахаром. Понятно, что нуклеотиды включают в себя природные основания и широкий спектр принятых в данной области модифицированных оснований. Такие основания обычно расположены в положении 1' нуклеотидной сахарной группы. Нуклеотиды как правило содержат основание, сахар и фосфатную группу. В рибонуклеиновой кислоте (РНК) сахар представляет собой рибозу, а в дезоксирибонуклеиновой кислоте (ДНК) сахар представляет собой дезоксирибозу, то есть сахар, в котором отсутствует гидроксильная группа, присутствующая в рибозе. Типичные природные азотистые основания включают пурины, аденозин (A) и гуанидин (G), а также пиримидины, цитидин (C) и тимидин (T) (или в контексте РНК, урацил (U)). Атом С-1 дезоксирибозы связан с N-1 пиримидина или N-9 пурина. Нуклеотиды обычно являются моно-, ди- или трифосфатми. Нуклеотиды могут быть немодифицированными или модифицированными по сахарной, фосфатной и/или основной группе (также взаимозаменяемо именуемые «нуклеотидные аналоги», «нуклеотидные производные», «модифицированные нуклеотиды», «неприродные нуклеотиды» и «нестандартные нуклеотиды»; см., например, WO 92)./07065 и WO 93/15187). Примеры модифицированных оснований нуклеиновых кислот обобщены Limbach et al., (1994, Nucleic Acids Res. 22, 2183-2196).As used herein, the term "nucleotide" refers to a heterocyclic nitrogenous base in an N-glycosidic bond to a phosphorylated sugar. It is understood that nucleotides include natural bases and a wide range of modified bases accepted in the art. Such bases are usually located at the 1' position of the nucleotide sugar group. Nucleotides typically contain a base, a sugar, and a phosphate group. In ribonucleic acid (RNA), the sugar is ribose, and in deoxyribonucleic acid (DNA), the sugar is deoxyribose, that is, a sugar that lacks the hydroxyl group present in ribose. Representative natural nitrogenous bases include purines, adenosine (A) and guanidine (G), as well as pyrimidines, cytidine (C) and thymidine (T) (or in the context of RNA, uracil (U)). The C-1 atom of deoxyribose is linked to the N-1 of the pyrimidine or the N-9 of the purine. Nucleotides are usually mono-, di-, or triphosphates. Nucleotides may be unmodified or modified at a sugar, phosphate and/or backbone group (also referred to interchangeably as "nucleotide analogs", "nucleotide derivatives", "modified nucleotides", "non-natural nucleotides", and "non-standard nucleotides"; see, for example, WO 92)./07065 and WO 93/15187). Examples of modified nucleic acid bases are summarized by Limbach et al., (1994, Nucleic Acids Res. 22, 2183-2196).

Нуклеотид также может рассматриваться как фосфатный эфир нуклеозида, причем этерификация происходит на гидроксильной группе, присоединенной к С-5 сахара. Используемый в настоящей заявке термин «нуклеозид» относится к гетероциклическому азотистому основанию в N-гликозидной связи с сахаром. В данной области техники известно, что нуклеозиды включают природные основания, а также включают хорошо известные модифицированные основания. Такие основания обычно располагаются в положении 1' нуклеозидного сахарного фрагмента. Нуклеозиды обычно содержат основание и сахарную группу. Нуклеозиды могут быть немодифицированными или модифицированными по сахарной и/или основной группе (взаимозаменяемо именуемые «нуклеозидные аналоги», «производные нуклеозидов», «модифицированные нуклеозиды», «неприродные нуклеозиды» или «нестандартные нуклеозиды»). Как также отмечено выше, примеры модифицированных оснований нуклеиновых кислот обобщены Limbach et al., (1994, Nucleic Acids Res. 22, 2183-2196).The nucleotide can also be considered as the phosphate ester of the nucleoside, with the esterification occurring at the hydroxyl group attached to the C-5 of the sugar. As used herein, the term "nucleoside" refers to a heterocyclic nitrogenous base in an N-glycosidic bond to a sugar. Nucleosides are known in the art to include naturally occurring bases as well as well-known modified bases. Such bases are usually located at the 1' position of the nucleoside sugar moiety. Nucleosides usually contain a base and a sugar group. Nucleosides may be unmodified or modified at the sugar and/or base group (interchangeably referred to as "nucleoside analogs", "nucleoside derivatives", "modified nucleosides", "non-natural nucleosides" or "non-standard nucleosides"). As also noted above, examples of modified nucleic acid bases are summarized by Limbach et al., (1994, Nucleic Acids Res. 22, 2183-2196).

Иллюстративные примеры полинуклеотидов включают, среди прочего, полинуклеотиды, кодирующие SEQ ID NO: 1-24 и 60-64, и полинуклеотидные последовательности, представленные в SEQ ID NO: 25-59 и 65-68.Illustrative examples of polynucleotides include, among others, polynucleotides encoding SEQ ID NOs: 1-24 and 60-64 and polynucleotide sequences shown in SEQ ID NOs: 25-59 and 65-68.

В различных иллюстративных вариантах реализации, полинуклеотиды, рассматриваемые в настоящей заявке, включают, среди прочего, полинуклеотиды, кодирующие варианты хоминг-эндонуклеазы, megaTAL, ферменты, изменяющие структуру концов, слитые полипептиды, а также векторы экспрессии, вирусные векторы и транспортные плазмиды, содержащие полинуклеотиды, рассматриваемые в настоящей заявке.In various illustrative embodiments, the polynucleotides contemplated herein include, among others, polynucleotides encoding homing endonuclease variants, megaTAL, end-reversing enzymes, fusion polypeptides, and expression vectors, viral vectors, and transport plasmids containing the polynucleotides. considered in this application.

Используемые в настоящей заявке термины «вариант полинуклеотида» и «вариант» и тому подобное относятся к полинуклеотидам, демонстрирующим существенную идентичность последовательности с эталонной полинуклеотидной последовательностью, или полинуклеотидам, которые гибридизуются с эталонной последовательностью в строгих условиях, которые определены ниже. Эти термины также охватывают полинуклеотиды, которые отличаются от эталонного полинуклеотида добавлением, делецией, заменой или модификацией по меньшей мере одного нуклеотида. Соответственно, термины «вариант полинуклеотида» и «вариант» включают полинуклеотиды, в которых один или более нуклеотидов были добавлены или удалены, или модифицированы, или заменены другими нуклеотидами. В связи с этим в данной области техники хорошо известно, что в отношении эталонного полинуклеотида могут быть сделаны определенные изменения, включая мутации, добавления, делеции и замены, при которых измененный полинуклеотид сохраняет биологическую функцию или активность эталонного полинуклеотида.As used herein, the terms "polynucleotide variant" and "variant" and the like refer to polynucleotides that exhibit substantial sequence identity with a reference polynucleotide sequence, or polynucleotides that hybridize to a reference sequence under stringent conditions, as defined below. The terms also cover polynucleotides that differ from a reference polynucleotide by the addition, deletion, substitution, or modification of at least one nucleotide. Accordingly, the terms "polynucleotide variant" and "variant" include polynucleotides in which one or more nucleotides have been added or removed, or modified or replaced with other nucleotides. In this regard, it is well known in the art that certain changes can be made to a reference polynucleotide, including mutations, additions, deletions, and substitutions, in which the altered polynucleotide retains the biological function or activity of the reference polynucleotide.

В одном варианте реализации полинуклеотид содержит нуклеотидную последовательность, которая гибридизуется с нуклеотидной последовательностью-мишенью в жестких условиях. Гибридизация в «жестких условиях» описывает протоколы гибридизации, в которых нуклеотидные последовательности, по меньшей мере на 60% идентичные друг другу, остаются гибридизованными. Обычно жесткие условия выбираются так, чтобы они были приблизительно на 5°C ниже, чем температура плавления (Tm) для конкретной последовательности при определенной ионной силе и pH. Tm - это температура (при определенной ионной силе, pH и концентрации нуклеиновой кислоты), при которой 50% зондов, комплементарных последовательности-мишени, гибридизуются с последовательностью-мишенью в равновесном состоянии. Поскольку последовательности-мишени обычно присутствуют в избытке, при Tm 50% зондов занято в равновесном состоянии.In one embodiment, the polynucleotide comprises a nucleotide sequence that hybridizes to a target nucleotide sequence under stringent conditions. "Stringent condition" hybridization describes hybridization protocols in which nucleotide sequences at least 60% identical to each other remain hybridized. Generally, stringent conditions are chosen to be approximately 5° C. lower than the melting point (Tm) for a particular sequence at a particular ionic strength and pH. Tm is the temperature (at a given ionic strength, pH and nucleic acid concentration) at which 50% of the probes complementary to the target sequence hybridize to the target sequence at equilibrium. Since the target sequences are usually present in excess, at Tm 50% of the probes are occupied in the equilibrium state.

Используемые в настоящей заявке выражения «идентичность последовательности» или, например, «содержать последовательность, идентичную на 50%», относятся к той степени, в которой последовательности идентичны на основании сравнения каждого нуклеотида или на основании сравнения каждой аминокислоты в окне сравнения. Таким образом, «процент идентичности последовательности» может быть рассчитан путем сравнения двух оптимально выровненных последовательностей в окне сравнения, определения количества положений, в которых идентичное основание нуклеиновой кислоты (например, A, T, C, G, I) или идентичный аминокислотный остаток (например, Ala, Pro, Ser, Thr, Gly, Val, Leu, Ile, Phe, Tyr, Trp, Lys, Arg, His, Asp, Glu, Asn, Gln, Cys и Met) встречаются в обеих последовательностях, для получения количества совпадающих позиций, с последующим делением количества совпадающих позиций на общее количество позиций в окне сравнения (т.е. размер окна) и умножением результата на 100, чтобы получить процент идентичности последовательности. Включены нуклеотиды и полипептиды, имеющие идентичность последовательности по меньшей мере приблизительно 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% или 100% с любой из эталонных последовательностей, описанных в настоящей заявке, при этом как правило, вариант полипептида сохраняет по меньшей мере одну биологическую активность эталонного полипептида. As used herein, "sequence identity" or, for example, "comprise 50% sequence identity" refers to the extent to which sequences are identical based on a comparison of each nucleotide or based on a comparison of each amino acid in the comparison window. Thus, "percent sequence identity" can be calculated by comparing two optimally aligned sequences in a comparison window, determining the number of positions at which an identical nucleic acid base (e.g. A, T, C, G, I) or an identical amino acid residue (e.g. , Ala, Pro, Ser, Thr, Gly, Val, Leu, Ile, Phe, Tyr, Trp, Lys, Arg, His, Asp, Glu, Asn, Gln, Cys and Met) occur in both sequences to obtain the number of matches positions, then dividing the number of matching positions by the total number of positions in the comparison window (i.e. the size of the window) and multiplying the result by 100 to get the percent sequence identity. Included are nucleotides and polypeptides having a sequence identity of at least about 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% , 99% or 100% with any of the reference sequences described in this application, while as a rule, the polypeptide variant retains at least one biological activity of the reference polypeptide.

Термины, используемые для описания родственности последовательностей между двумя или более полинуклеотидами или полипептидами, включают «эталонную последовательность», «окно сравнения», «идентичность последовательности», «процент идентичности последовательности» и «существенная идентичность». «Эталонная последовательность» имеет длину по меньшей мере 12, но часто от 15 до 18 и часто по меньшей мере 25 мономерных единиц, включая нуклеотиды и аминокислотные остатки. Поскольку каждый из двух полинуклеотидов может содержать (1) последовательность (т.е. только часть полной полинуклеотидной последовательности), которая является сходной между двумя полинуклеотидами, и (2) последовательность, которая расходится между двумя полинуклеотидами, сравнения последовательностей между двумя (или более) полинуклеотидами обычно выполняются путем сравнения последовательностей двух полинуклеотидов в «окне сравнения» для выявления и сравнения локальных областей сходства последовательностей. Термин «окно сравнения» относится к концептуальному сегменту из по меньшей мере 6 смежных позиций, обычно от приблизительно 50 до приблизительно 100, более обычно от приблизительно 100 до приблизительно 150, в котором последовательность сравнивается с эталонной последовательностью из того же числа смежных позиций после того, как эти две последовательности оптимально выровнены. Окно сравнения может содержать добавления или делеции (то есть, пропуски) величиной приблизительно 20% или меньше по сравнению с эталонной последовательностью (которая не содержит добавлений или делеций) для оптимального выравнивания двух последовательностей. Оптимальное выравнивание последовательностей для выравнивания окна сравнения может быть выполнено с помощью компьютеризированных реализаций алгоритмов (GAP, BESTFIT, FASTA и TFASTA в программе Wisconsin Genetics Software Package Release 7.0, Genetics Computer Group, 575 Science Drive Madison, Висконсин, США) или визуального сравнения и наилучшего выравнивания (т.е. приводящего к наибольшей процентной гомологии в окне сравнения), полученных любым из различных выбранных методов. Также можно сослаться на семейство программ BLAST, как, например, описано Altschul et al., 1997, Nucl. Acids Res. 25:3389. Подробное обсуждение анализа последовательностей можно найти в разделе 19.3 руководства Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons Inc., 1994-1998, Chapter 15.Terms used to describe sequence relatedness between two or more polynucleotides or polypeptides include "reference sequence", "comparison window", "sequence identity", "percent sequence identity" and "substantial identity". A "reference sequence" is at least 12, but often 15 to 18, and often at least 25 monomeric units in length, including nucleotides and amino acid residues. Because each of the two polynucleotides may contain (1) a sequence (i.e., only a portion of the complete polynucleotide sequence) that is similar between the two polynucleotides, and (2) a sequence that diverges between the two polynucleotides, sequence comparisons between two (or more) polynucleotides are typically performed by comparing the sequences of two polynucleotides in a "comparison window" to identify and compare local areas of sequence similarity. The term "comparison window" refers to a conceptual segment of at least 6 contiguous positions, typically from about 50 to about 100, more typically from about 100 to about 150, in which the sequence is compared to a reference sequence of the same number of contiguous positions after how the two sequences are optimally aligned. The comparison window may contain additions or deletions (ie, gaps) of approximately 20% or less compared to the reference sequence (which contains no additions or deletions) to optimally align the two sequences. Optimal sequence alignment for comparison window alignment can be performed using computerized implementations of the algorithms (GAP, BESTFIT, FASTA, and TFASTA in Wisconsin Genetics Software Package Release 7.0, Genetics Computer Group, 575 Science Drive Madison, Wisconsin, USA) or visual comparison and best alignment (ie, leading to the highest percent homology in the comparison window) obtained by any of the various methods chosen. Reference may also be made to the BLAST family of programs, such as described by Altschul et al., 1997, Nucl. Acids Res. 25:3389. A detailed discussion of sequence analysis can be found in section 19.3 of Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons Inc., 1994-1998, Chapter 15.

Термин «выделенный полинуклеотид», используемый в настоящей заявке, относится к полинуклеотиду, который был очищен от последовательностей, фланкирующих его в естественном состоянии, например фрагмент ДНК, который был отдален из последовательностей, которые обычно соседствуют с этим фрагментом. В частных вариантах реализации термин «выделенный полинуклеотид» относится к комплементарной ДНК (кДНК), рекомбинантному полинуклеотиду, синтетическому полинуклеотиду или другому полинуклеотиду, который не существует в природе и который был создан рукой человека.The term "isolated polynucleotide" as used herein refers to a polynucleotide that has been purified from sequences that flanking it in its natural state, such as a DNA fragment that has been removed from sequences that would normally be adjacent to that fragment. In particular embodiments, the term "isolated polynucleotide" refers to complementary DNA (cDNA), recombinant polynucleotide, synthetic polynucleotide, or other polynucleotide that does not exist in nature and has been created by human hand.

В различных вариантах реализации полинуклеотид содержит мРНК, кодирующую полипептид, рассматриваемый в настоящей заявке, включая, среди прочего, вариант хоминг-эндонуклеазы, megaTAL и фермент, изменяющий структуру концов. В некоторых случаях мРНК содержит кэп, один или более нуклеотидов и поли(А) хвост.In various embodiments, the polynucleotide comprises an mRNA encoding the polypeptide of the present application, including, but not limited to, a homing endonuclease variant, megaTAL, and an end-reversing enzyme. In some cases, the mRNA contains a cap, one or more nucleotides, and a poly(A) tail.

Используемые в настоящей заявке термины «5' кэп» или «5' кэп-структура» или «5' кэп фрагмент» относятся к химической модификации, которая была встроена в 5'-конец мРНК. Кэп 5' участвует в ядерном экспорте, стабильности мРНК и трансляции.As used herein, the terms "5' cap" or "5' cap structure" or "5' cap fragment" refer to a chemical modification that has been inserted into the 5' end of an mRNA. The 5' cap is involved in nuclear export, mRNA stability and translation.

В частных вариантах реализации рассматриваемая в настоящей заявке мРНК содержит 5'- кэп, содержащий 5'-ppp-5'-трифосфатную связь между концевым остатком гуанозинового кэпа и 5'-концевым транскрибированным смысловым нуклеотидом молекулы мРНК. Указанный 5'-гуанилатный кэп затем может быть метилирован с образованием остатка N7-метилгуанилата.In private embodiments, the mRNA considered in this application contains a 5'-cap containing a 5'-ppp-5'-triphosphate bond between the terminal residue of the guanosine cap and the 5'-terminal transcribed sense nucleotide of the mRNA molecule. Said 5'-guanylate cap can then be methylated to form an N7-methyl guanylate residue.

Иллюстративные примеры 5'- кэпа, подходящего для использования в частных вариантах реализации полинуклеотидов мРНК, рассматриваемых в настоящей заявке, включают, среди прочего: неметилированные аналоги 5'-кэпа, например, G(5')ppp(5')G, G(5')ppp(5')C, G(5')ppp(5')A; метилированные аналоги 5'-кэпа, например, m7G(5')ppp(5')G, m7G(5')ppp(5')C и m7G(5')ppp(5')A; диметилированные аналоги 5'-кэпа, например, m2,7G(5')ppp(5')G, m2,7G(5')ppp(5')C и m2,7G(5')ppp(5')A; триметилированные аналоги 5'-кэпа, например, m2,2,7G(5')ppp(5')G, m2,2,7G(5')ppp(5')C и m2,2,7G(5')ppp(5')A; диметилированные симметричные аналоги 5'-кэпа, например, m7G(5')pppm7(5')G, m7G(5')pppm7(5')C и m7G(5')pppm7(5')A; и анти-обратные аналоги 5'-кэпа, например, кэп Anti-Reverse Cap Analog (ARCA), специализированные 3'O-Me-m7G(5')ppp(5')G, 2'O-Me-m7G(5')ppp(5')G, 2'O-Me-m7G(5')ppp(5')C, 2'O-Me-m7G(5')ppp(5')A, m72'd(5')ppp(5')G, m72'd(5')ppp(5')C, m72'd(5')ppp(5')A, 3'O-Me-m7G(5')ppp(5')C, 3'O-Me-m7G(5')ppp(5')A, m73'd(5')ppp(5')G, m73'd(5')ppp(5')C, m73'd(5')ppp(5')A и их тетрафосфатные производные) (см., например, Jemielity et al., RNA, 9: 1108-1122 (2003)).Illustrative examples of the 5'cap suitable for use in particular embodiments of the mRNA polynucleotides contemplated herein include, among others: unmethylated 5'cap analogs, e.g., G(5')ppp(5')G, G( 5')ppp(5')C, G(5')ppp(5')A; methylated 5'-cap analogs, e.g. m 7 G(5')ppp(5')G, m 7 G(5')ppp(5')C and m 7 G(5')ppp(5')A ; dimethyl analogs of the 5'-cap, e.g. m 2.7 G(5')ppp(5')G, m 2.7 G(5')ppp(5')C and m 2.7 G(5') ppp(5')A; trimethylated analogs of the 5'-cap , e.g. 7G (5')ppp(5')A; dimethylated symmetrical analogs of the 5'-cap, for example, m 7 G(5')pppm 7 (5')G, m 7 G(5')pppm 7 (5')C and m 7 G(5')pppm 7 ( 5')A; and anti-reverse 5'-cap analogs, e.g. Anti-Reverse Cap Analog (ARCA), specialized 3'O-Me-m 7 G(5')ppp(5')G, 2'O-Me-m 7 G(5')ppp(5')G, 2'O-Me-m 7 G(5')ppp(5')C, 2'O-Me-m 7 G(5')ppp(5' )A, m 7 2'd(5')ppp(5')G, m 7 2'd(5')ppp(5')C, m 7 2'd(5')ppp(5')A , 3'O-Me-m 7 G(5')ppp(5')C, 3'O-Me-m 7 G(5')ppp(5')A, m 7 3'd(5') ppp(5')G, m 7 3'd(5')ppp(5')C, m 7 3'd(5')ppp(5')A and their tetraphosphate derivatives) (see, for example, Jemielity et al., RNA, 9: 1108-1122 (2003)).

В частных вариантах реализации мРНК содержат 5'-кэп, который представляет собой 7-метилгуанилат («m7G») связаны через трифосфатный мостик с 5'-концом первого транскрибированного нуклеотида, что дает m7G(5')ppp(5')N, где N - любой нуклеозид.In particular embodiments, the mRNAs contain a 5' cap which is 7-methyl guanylate ("m 7 G") linked via a triphosphate bridge to the 5' end of the first transcribed nucleotide, resulting in m 7 G(5')ppp(5' )N, where N is any nucleoside.

В некоторых вариантах реализации мРНК содержат 5'- кэп, где кэп представляет собой структуру Cap0 (структуры Cap0 не имеют 2'-O-метильного остатка рибозы, присоединенной к основаниям 1 и 2), структуру Cap1 (структуры Cap1 имеют 2' -О-метильный остаток у основания 2) или структура Cap2 (структуры Cap2 имеют 2'-O-метильный остаток, присоединенный к обоим основаниям 2 и 3).In some embodiments, the mRNAs contain a 5'-cap, where the cap is a Cap0 structure (Cap0 structures do not have a 2'-O-methyl ribose residue attached to bases 1 and 2), a Cap1 structure (Cap1 structures have a 2'-O- methyl residue at base 2) or a Cap2 structure (Cap2 structures have a 2'-O-methyl residue attached to both bases 2 and 3).

В одном варианте реализации мРНК содержит кэп m7G(5')ppp(5')G.In one embodiment, the mRNA contains an m 7 G(5')ppp(5')G cap.

В одном варианте реализации мРНК содержит кэп ARCA.In one embodiment, the mRNA contains an ARCA cap.

В частных вариантах реализации рассматриваемая в настоящей заявке мРНК содержит один или более модифицированных нуклеозидов.In private embodiments, the mRNA discussed in this application contains one or more modified nucleosides.

В одном варианте реализации мРНК содержит один или более модифицированных нуклеозидов, выбранных из группы, состоящей из следующих: псевдоуридин, пиридин-4-он рибонуклеозид, 5-азауридин, 2-тио-5-азауридин, 2-тиоуридин, 4-тио-псевдоуридин, 2-тио-псевдоуридин, 5-гидроксиуридин, 3-метилуридин, 5 -карбоксиметил-уридин, 1-карбоксиметил-псевдоуридин, 5-пропинил-уридин, 1-пропинил-псевдоуридин, 5-тауринометилуридин, 1-тауринометил-псевдоуридин, 5-тауринометил-2-тио-уридин, 1-таурино метил-4-тиоуридин, 5-метил-уридин, 1-метил-псевдоуридин, 4-тио-1-метил-псевдоуридин, 2-тио-1-метил-псевдоуридин, 1-метил-1-деаза-псевдоуридин, 2-тио-1-метил-1-деаза-псевдоуридин, дигидроуридин, дигидропсевдуридин, 2-тио-дигидроуридин, 2-тио-дигидропсевдуридин, 2-метоксиуридин, 2-метокси-4-тиоуридин, 4-метокси-псевдоуридин, 4-метокси-2-тио-псевдоуридин, 5-азацитидин, псевдоизоцитидин, 3-метилцитидин, N4-ацетилцитидин, 5-формилцитидин, N4-метилцитидин, 5-гидроксиметилцитидин, 1-метил-псевдоизоизитидин, пирроло-цитидин, пирроло-псевдоизоцитидин, 2-тиоцитидин, 2-тио-5-метилцитидин, 4-тио-псевдоизоцитидин, 4-тио-1-метил-псевдоизоцитидин, 4-тио-1-метил-1-деаза-псевдоизоцитидин, 1-метил-1-деаза-псевдоизоцитидин, зебуларин, 5-аза-зебуларин, 5-метилзебуларин, 5-аза-2-тио-зебуларин, 2-тио-зебуларин, 2-метоксицитидин, 2-метокси-5-метилцитидин, 4-метокси-псевдоизоцитидин, 4-метокси-1-метил-псевдоизоцитидин, 2-аминопурин, 2,6-диаминопурин, 7-деаза-аденин, 7-деаза-8-азааденин, 7-деаза-2-аминопурин, 7-деаза-8-аза-2-аминопурин, 7-деаза-2,6-диаминопурин, 7-деаза-8-аза-2,6-диаминопурин, 1-метиладенозин, N6-метиладенозин, N6-изопентениладенозин, N6- (цис-гидроксиизопентенил) аденозин, 2-метилтио-N6-(цис-гидроксиизопентенил) аденозин, N6-глицинилкарбамоиладенозин, N6-треонилкарбамоиладенозин, 2-метилтио-N6-треонилкарбамоиладенозин, N6,N6-диметиладенозин, 7-метиладенин, 2-метилтиоаденин, 2-метоксиаденин, инозин, 1-метилинозин, виозин, вибутозин, 7-деаза-гуанозин, 7-деаза-8-аза-гуанозин, 6-тио-гуанозин, 6-тио-7-деаза-гуанозин, 6-тио-7-деаза-8-азагуанозин, 7-метилгуанозин, 6-тио-7-метилгуанозин, 7-метилинозин, 6-метоксигуанозин, 1-метилгуанозин, N2-метилгуанозин, N2,N2-диметилгуанозин, 8-оксо-гуанозин, 7-метил-8-оксо-гуанозин, 1-метил-6-тио-гуанозин, N2-метил-6-тио-гуанозин и N2,N2-диметил-6-тио-гуанозин.In one embodiment, the mRNA contains one or more modified nucleosides selected from the group consisting of the following: pseudouridine, pyridin-4-one ribonucleoside, 5-azauridine, 2-thio-5-azauridine, 2-thiouridine, 4-thio-pseudouridine . -taurinomethyl-2-thio-uridine, 1-taurinomethyl-4-thiouridine, 5-methyl-uridine, 1-methyl-pseudouridine, 4-thio-1-methyl-pseudouridine, 2-thio-1-methyl-pseudouridine, 1-methyl-1-deaza-pseudouridine, 2-thio-1-methyl-1-deaza-pseudouridine, dihydrouridine, dihydropsevduridine, 2-thio-dihydrouridine, 2-thio-dihydropsevduridine, 2-methoxyuridine, 2-methoxy-4- thiouridine, 4-methoxy-pseudouridine, 4-methoxy-2-thio-pseudouridine, 5-azacytidine, pseudoisocytidine, 3-methylcytidine, N4-acetylcytidine, 5-formylcytidine, N4-methylcytidine, 5-hydroxymethylcytidine, 1-methyl-pseudoisoisitidine, pyrrolocytide in, pyrrolo-pseudoisocytidine, 2-thiocytidine, 2-thio-5-methylcytidine, 4-thio-pseudoisocytidine, 4-thio-1-methyl-pseudoisocytidine, 4-thio-1-methyl-1-deaza-pseudoisocytidine, 1- methyl-1-deaza-pseudoisocytidine, zebularine, 5-aza-zebularine, 5-methylzebularine, 5-aza-2-thio-zebularine, 2-thio-zebularine, 2-methoxycytidine, 2-methoxy-5-methylcytidine, 4- methoxy-pseudoisocytidine, 4-methoxy-1-methyl-pseudoisocytidine, 2-aminopurine, 2,6-diaminopurine, 7-deaza-adenine, 7-deaza-8-azaadenine, 7-deaza-2-aminopurine, 7-deaza- 8-aza-2-aminopurine, 7-deaza-2,6-diaminopurine, 7-deaza-8-aza-2,6-diaminopurine, 1-methyladenosine, N6-methyladenosine, N6-isopentenyladenosine, N6-(cis-hydroxyisopentenyl ) adenosine, 2-methylthio-N6-(cis-hydroxyisopentenyl) adenosine, N6-glycinylcarbamoyladenosine, N6-threonylcarbamoyladenosine, 2-methylthio-N6-threonylcarbamoyladenosine, N6,N6-dimethyladenosine, 7-methyladenine, 2-methylthioadenine, 2-methoxyadenine, inosine, 1-methylinosine, viosine, vibutosine, 7-deaza-guanosine, 7-deaza-8-aza-guanosine, 6-thio-guanosine, 6-thio-7-deaz a-guanosine, 6-thio-7-deaza-8-azaguanosine, 7-methylguanosine, 6-thio-7-methylguanosine, 7-methylinosine, 6-methoxyguanosine, 1-methylguanosine, N2-methylguanosine, N2,N2-dimethylguanosine, 8-oxo-guanosine, 7-methyl-8-oxo-guanosine, 1-methyl-6-thio-guanosine, N2-methyl-6-thio-guanosine and N2,N2-dimethyl-6-thio-guanosine.

В одном варианте реализации мРНК содержит один или более модифицированных нуклеозидов, выбранных из группы, состоящей из следующих: псевдоуридин, пиридин-4-он-рибонуклеозид, 5-азауридин, 2-тио-5-азауридин, 2-тиоуридин, 4-тио-псевдоуридин, 2-тио-псевдоуридин, 5-гидроксиуридин, 3-метилуридин, 5 -карбоксиметил-уридин, 1-карбоксиметил-псевдоуридин, 5-пропинил-уридин, 1-пропинил-псевдоуридин, 5-тауринометилуридин, 1-тауринометил-псевдоуридин, 5-тауринометил-2-тио-уридин, 1-тауринометил-4-тиоуридин, 5-метил-уридин, 1-метил-псевдоуридин, 4-тио-1-метил-псевдоуридин, 2-тио-1-метил-псевдоуридин, 1-метил-1-деаза-псевдоуридин, 2-тио-1-метил-1-деаза-псевдоуридин, дигидроуридин, дигидропсевдоуридин, 2-тидигидроуридин, 2-тио-дигидропсевдуридин, 2-метоксиуридин, 2-метокси-4-тиоуридин, 4-метокси-псевдоуридин и 4-метокси 2-тио-псевдоуридин.In one embodiment, the mRNA contains one or more modified nucleosides selected from the group consisting of the following: pseudouridine, pyridin-4-one-ribonucleoside, 5-azauridine, 2-thio-5-azauridine, 2-thiouridine, 4-thio- pseudouridine, 2-thio-pseudouridine, 5-hydroxyuridine, 3-methyluridine, 5-carboxymethyl-uridine, 1-carboxymethyl-pseudouridine, 5-propynyluridine, 1-propynyl-pseudouridine, 5-taurinomethyluridine, 1-taurinomethyl-pseudouridine, 5-taurinomethyl-2-thio-uridine, 1-taurinomethyl-4-thiouridine, 5-methyl-uridine, 1-methyl-pseudouridine, 4-thio-1-methyl-pseudouridine, 2-thio-1-methyl-pseudouridine, 1-methyl-1-deaza-pseudouridine, 2-thio-1-methyl-1-deaza-pseudouridine, dihydrouridine, dihydropseudouridine, 2-tidihydrouridine, 2-thio-dihydropseudouridine, 2-methoxyuridine, 2-methoxy-4-thiouridine, 4-methoxy-pseudouridine and 4-methoxy-2-thio-pseudouridine.

В одном варианте реализации мРНК содержит один или более модифицированных нуклеозидов, выбранных из группы, состоящей из следующих: 5-азацитидин, псевдоизоцитидин, 3-метилцитидин, N4-ацетилцитидин, 5-формилцитидин, N4-метилцитидин, 5-гидроксиметилцитидин, 1-метил-псевдоизоцитидин, пирроло-цитидин, пирроло-псевдоизоцитидин, 2-тиоцитидин, 2-тио-5-метилцитидин, 4-тио-псевдоизоцитидин, 4-тио-1-метил-псевдоизоцитидин, 4-тио-1-метил-1-деаза-псевдоизоцитидин, 1-метил-1-деаза-псевдоизоцитидин, зебуларин, 5-аза-зебуларин, 5-метилзебуларин, 5-аза-2-тио-зебуларин, 2-тио-зебуларин, 2-метоксицитидин, 2-метокси-5-метилцитидин, 4-метокси- псевдоизоцитидин и 4-метокси-1-метилпсевдоизоцитидин.In one embodiment, the mRNA contains one or more modified nucleosides selected from the group consisting of the following: 5-azacytidine, pseudoisocytidine, 3-methylcytidine, N4-acetylcytidine, 5-formylcytidine, N4-methylcytidine, 5-hydroxymethylcytidine, 1-methyl- pseudoisocytidine, pyrrolocytidine, pyrrolo-pseudoisocytidine, 2-thiocytidine, 2-thio-5-methylcytidine, 4-thio-pseudoisocytidine, 4-thio-1-methyl-pseudoisocytidine, 4-thio-1-methyl-1-deaza- pseudoisocytidine, 1-methyl-1-deaza-pseudoisocytidine, zebularine, 5-aza-zebularine, 5-methylzebularine, 5-aza-2-thio-zebularine, 2-thio-zebularine, 2-methoxycytidine, 2-methoxy-5- methylcytidine, 4-methoxy-pseudoisocytidine and 4-methoxy-1-methylpseudoisocytidine.

В одном варианте реализации мРНК содержит один или более модифицированных нуклеозидов, выбранных из группы, состоящей из следующих: 2-аминопурин, 2,6-диаминопурин, 7-деаза-аденин, 7-деаза-8-аза-аденин, 7-деаза-2-аминопурин, 7-деаза-8-аза-2-аминопурин, 7-деаза- 2,6-диаминопурин, 7-деаза-8-аза-2,6-диаминопурин, 1-метиладенозин, N6-метиладенозин, N6-изопентениладенозин, N6- (цис-гидроксиизопентенил) аденозин, 2-метилтио-N6-(цис- гидроксиизопентенил) аденозин, N6-глицинилкарбамоиладенозин, N6-треонилкарбамоиладенозин, 2-метилтио-N6-треонилкарбамоиладенозин, N6, N6-диметиладенозин, 7-метиладенин, 2-метилтиоаденин и 2-метоксиаденин.In one embodiment, the mRNA contains one or more modified nucleosides selected from the group consisting of the following: 2-aminopurine, 2,6-diaminopurine, 7-deaza-adenine, 7-deaza-8-aza-adenine, 7-deaza- 2-aminopurine, 7-deaza-8-aza-2-aminopurine, 7-deaza-2,6-diaminopurine, 7-deaza-8-aza-2,6-diaminopurine, 1-methyladenosine, N6-methyladenosine, N6- isopentenyladenosine, N6-(cis-hydroxyisopentenyl) adenosine, 2-methylthio-N6-(cis-hydroxyisopentenyl) adenosine, N6-glycinylcarbamoyladenosine, N6-threonylcarbamoyladenosine, 2-methylthio-N6-threonylcarbamoyladenosine, N6, N6-dimethyladenosine, 7-methyladenine, 2-methylthioadenine and 2-methoxyadenine.

В одном варианте реализации мРНК содержит один или более модифицированных нуклеозидов, выбранных из группы, состоящей из следующих: инозин, 1-метилинозин, виозин, вибутозин, 7-деаза-гуанозин, 7-деаза-8-аза-гуанозин, 6-тио-гуанозин, 6-тио-7-деаза-гуанозин, 6-тио-7- деаза-8-азагуанозин, 7-метилгуанозин, 6-тио-7-метилгуанозин, 7-метилинозин, 6-метоксигуанозин, 1-метилгуанозин, N2-метилгуанозин, N2, N2-диметилгуанозин, 8-оксогуанозин, 7-метил-8-оксогуанозин, 1-метил-6-тио-гуанозин, N2-метил-6-тио-гуанозин и N2, N2-диметил-6-тио-гуанозин.In one embodiment, the mRNA contains one or more modified nucleosides selected from the group consisting of the following: inosine, 1-methylinosine, viosine, vibutosine, 7-deaza-guanosine, 7-deaza-8-aza-guanosine, 6-thio- guanosine, 6-thio-7-deaza-guanosine, 6-thio-7-deaza-8-azaguanosine, 7-methylguanosine, 6-thio-7-methylguanosine, 7-methylinosine, 6-methoxyguanosine, 1-methylguanosine, N2- methylguanosine, N2, N2-dimethylguanosine, 8-oxoguanosine, 7-methyl-8-oxoguanosine, 1-methyl-6-thio-guanosine, N2-methyl-6-thio-guanosine and N2, N2-dimethyl-6-thio- guanosine.

В одном варианте реализации мРНК содержит один или более псевдоуридинов, один или более 5-метилцитозинов и/или один или более 5-метилцитидинов.In one embodiment, the mRNA contains one or more pseudouridines, one or more 5-methylcytosines, and/or one or more 5-methylcytidines.

В одном варианте реализации мРНК содержит один или более псевдоуридинов.In one embodiment, the mRNA contains one or more pseudouridines.

В одном варианте реализации мРНК содержит один или более 5-метилцитидинов.In one embodiment, the mRNA contains one or more 5-methylcytidines.

В одном варианте реализации мРНК содержит один или более 5-метилцитозинов.In one embodiment, the mRNA contains one or more 5-methylcytosines.

В частных вариантах реализации мРНК, рассматриваемая в настоящей заявке, содержит поли(A)-хвост, помогающий защитить мРНК от деградации экзонуклеазой, стабилизировать мРНК и облегчить трансляцию. В некоторых вариантах реализации мРНК содержит 3' поли(А)-хвостовую структуру.In particular embodiments, the mRNA of this application contains a poly(A) tail to help protect the mRNA from exonuclease degradation, stabilize the mRNA, and facilitate translation. In some embodiments, the mRNA contains a 3' poly(A) tail structure.

В частных вариантах реализации длина поли(А)-хвоста составляет по меньшей мере приблизительно 10, 25, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450 или по меньшей мере приблизительно 500 или более адениновых нуклеотидов или любое промежуточное число адениновых нуклеотидов. В частных вариантах реализации длина поли(А)-хвоста составляет по меньшей мере приблизительно 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 202, 203, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274 или 275 или более адениннуклеотидов.In particular embodiments, the length of the poly(A) tail is at least about 10, 25, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, or at least about 500 or more adenine nucleotides, or any intermediate number of adenine nucleotides. In particular embodiments, the length of the poly(A) tail is at least about 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192 193 194 195 196 197 198 199 200 201 202 202 203 205 206 207 208 209 210 211 212 213 214 215 216 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274 or 275 or more adenine nucleotides.

В частных вариантах реализации длина поли(А)-хвоста составляет от приблизительно 10 до приблизительно 500 адениннуклеотидов, от приблизительно 50 до приблизительно 500 адениннуклеотидов, от приблизительно 100 до приблизительно 500 адениннуклеотидов, от приблизительно 150 до приблизительно 500 адениннуклеотидов, от приблизительно 200 до приблизительно 500 адениннуклеотидов, от приблизительно 250 до приблизительно 500 адениннуклеотидов, от приблизительно 300 до приблизительно 500 адениннуклеотидов, приблизительно 50 до приблизительно 450 адениннуклеотидов, от приблизительно 50 до приблизительно 400 адениннуклеотидов, от приблизительно 50 до приблизительно 350 адениннуклеотидов, от приблизительно 100 до приблизительно 500 адениннуклеотидов, от приблизительно 100 до приблизительно 450 адениннуклеотидов, от приблизительно 100 до приблизительно 400 адениннуклеотидов, от приблизительно 100 до приблизительно 350 адениннуклеотидов, от приблизительно 100 до приблизительно 300 адениннуклеотидов, от приблизительно 150 до приблизительно 500 адениннуклеотидов, от приблизительно 150 до приблизительно 450 адениннуклеотидов, от приблизительно 150 до приблизительно 400 адениннуклеотидов, от приблизительно 150 до приблизительно 350 адениннуклеотидов, от приблизительно 150 до приблизительно 300 адениннуклеотидов, от приблизительно 150 до приблизительно 250 адениннуклеотидов, от приблизительно 150 до приблизительно 200 адениннуклеотидов, от приблизительно 200 до приблизительно 500 адениннуклеотидов, от приблизительно 200 до приблизительно 450 адениннуклеотидов, от приблизительно 200 до приблизительно 400 адениннуклеотидов, от приблизительно 200 до приблизительно 350 адениннуклеотидов, от приблизительно 200 до приблизительно 300 адениннуклеотидов, от приблизительно 250 до приблизительно 500 адениннуклеотидов, от приблизительно 250 до приблизительно 450 адениннуклеотидов, от приблизительно 250 до приблизительно 400 адениннуклеотидов, от приблизительно 250 до приблизительно 350 адениннуклеотидов или от приблизительно 250 до приблизительно 300 адениннуклеотидов или любой промежуточный диапазон адениннуклеотидов.In particular embodiments, the length of the poly(A) tail is from about 10 to about 500 adenine nucleotides, from about 50 to about 500 adenine nucleotides, from about 100 to about 500 adenine nucleotides, from about 150 to about 500 adenine nucleotides, from about 200 to about 500 adenine nucleotides, from about 250 to about 500 adenine nucleotides, from about 300 to about 500 adenine nucleotides, from about 50 to about 450 adenine nucleotides, from about 50 to about 400 adenine nucleotides, from about 100 to about 450 adenine nucleotides, about 100 to about 400 adenine nucleotides, about 100 to about 350 adenine nucleotides, about 100 to about 300 adenine nucleotides, about 150 to about 500 adenine nucleotides, about 150 to about 450 adenine nucleotides, about 150 to about 400 adenine nucleotides, about 150 to about 350 adenine nucleotides, about 150 to about 300 adenine nucleotides, about 150 to about 250 adenine nucleotides, from about 150 to about 200 adenine nucleotides, about 200 to about 500 adenine nucleotides, about 200 to about 450 adenine nucleotides, about 200 to about 400 adenine nucleotides, about 200 to about 350 adenine nucleotides, about 200 to about 300 adenine nucleotides, from about 250 to about 500 adenine nucleotides, about 250 to about 450 adenine nucleotides, about 250 to about 400 adenine nucleotides, about 250 to about 350 adenine nucleotides otides or from about 250 to about 300 adenine nucleotides or any intermediate range of adenine nucleotides.

Термины, которые описывают ориентацию полинуклеотидов, включают: «5'» (обычно конец полинуклеотида, имеющий свободную фосфатную группу) и «3'» (обычно конец полинуклеотида, имеющий свободную гидроксильную (OH) группу). Полинуклеотидные последовательности могут быть аннотированы в ориентации «от 5' до 3'» или «от 3' до 5'». Для ДНК и мРНК цепь от 5' до 3' обозначается как «смысловая», «плюс» или «кодирующая» цепь, поскольку ее последовательность идентична последовательности пре-мРНК [за исключением урацила (U) в РНК вместо тимина (T) в ДНК]. Для ДНК и мРНК комплементарную цепь от 3' до 5', которая представляет собой цепь, транскрибируемую РНК-полимеразой, обозначают как «матричная», «антисмысловая», «минус» или «некодирующая» цепь. Используемый в настоящей заявке термин «обратная ориентация» относится к последовательности от 5' до 3', записанной в ориентации от 3' до 5', или последовательности от 3' до 5', записанной в ориентации от 5' до 3'.Terms that describe the orientation of polynucleotides include: "5'" (usually the end of the polynucleotide having a free phosphate group) and "3'" (usually the end of the polynucleotide having a free hydroxyl (OH) group). Polynucleotide sequences can be annotated in the "5' to 3'" or "3' to 5'" orientation. For DNA and mRNA, the 5' to 3' strand is referred to as the "sense", "plus" or "coding" strand because its sequence is identical to that of the pre-mRNA [except for uracil (U) in RNA instead of thymine (T) in DNA ]. For DNA and mRNA, the 3' to 5' complementary strand, which is the strand transcribed by RNA polymerase, is referred to as "template", "antisense", "minus", or "non-coding" strand. As used herein, the term "reverse orientation" refers to a 5' to 3' sequence written in a 3' to 5' orientation, or a 3' to 5' sequence written in a 5' to 3' orientation.

Термины «комплементарный» и «комплементарность» относятся к полинуклеотидам (то есть последовательности нуклеотидов), связанным правилами спаривания оснований. Например, комплементарной цепью для последовательности ДНК 5' A G T C A T G 3' будет 3' T C A G T A C 5'. Последняя последовательность часто пишется как обратный комплемент с 5'-концом слева и 3'-концом справа, 5' C A T G A C T 3'. Последовательность, которая идентична своему обратному комплементу, называется палиндромной последовательностью. Комплементарность может быть «частичной», при которой только некоторые основания нуклеиновых кислот сопоставляются в соответствии с правилами спаривания оснований. Либо между нуклеиновыми кислотами может быть «полная» комплементарность.The terms "complementary" and "complementarity" refer to polynucleotides (ie, sequences of nucleotides) linked by base pairing rules. For example, the complementary strand for the DNA sequence 5' A G T C A T G 3' would be 3' T C A G T A C 5'. The last sequence is often written as a reverse complement with a 5' end on the left and a 3' end on the right, 5' C A T G A C T 3'. A sequence that is identical to its reverse complement is called a palindromic sequence. Complementarity can be "partial" in which only some nucleic acid bases match according to base pairing rules. Or there can be "complete" complementarity between nucleic acids.

Используемый в настоящей заявке термин «кассета с нуклеиновой кислотой» или «кассета экспрессии» относится к генетическим последовательностям внутри вектора, которые могут экспрессировать РНК, а затем и полипептид. В одном варианте реализации кассета с нуклеиновой кислотой содержит представляющий интерес ген (-ы), например представляющий интерес полинуклеотид (-ы). В другом варианте реализации кассета с нуклеиновой кислотой содержит одну или более последовательностей контроля экспрессии, например, промотор, энхансер, поли(А) последовательность и представляющий интерес ген (-ы), например, представляющий интерес полинуклеотид (-ы). Векторы могут содержать 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 или более кассет с нуклеиновой кислотой. Кассета с нуклеиновой кислотой позиционно и последовательно ориентирована внутри вектора, так что нуклеиновая кислота в кассете может транскрибироваться в РНК и, при необходимости, транслироваться в белок или полипептид, подвергаться соответствующим посттрансляционным модификациям, необходимым для активности в трансформированной клетке и быть перемещенной в соответствующий компартмент для биологической активности путем нацеливания на соответствующие внутриклеточные компартменты или секреции во внеклеточные компартменты. Предпочтительно, кассета имеет 3'- и 5'-концы, адаптированные для готовой инсерции в вектор, например, она имеет сайты рестрикционной эндонуклеазы на каждом конце. В предпочтительном варианте реализации кассета с нуклеиновой кислотой содержит последовательность терапевтического гена, используемого для лечения, предотвращения или ослабления генетического нарушения. Кассета может быть удалена и вставлена в плазмиду или вирусный вектор как единое целое.As used herein, the term "nucleic acid cassette" or "expression cassette" refers to genetic sequences within a vector that can express an RNA and then a polypeptide. In one embodiment, the nucleic acid cassette contains the gene(s) of interest, eg, the polynucleotide(s) of interest. In another embodiment, the nucleic acid cassette contains one or more expression control sequences, eg, a promoter, an enhancer, a poly(A) sequence, and a gene(s) of interest, eg, a polynucleotide(s) of interest. The vectors may contain 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10 or more nucleic acid cassettes. The nucleic acid cassette is positionally and sequentially oriented within the vector so that the nucleic acid in the cassette can be transcribed into RNA and, if necessary, translated into a protein or polypeptide, undergo the appropriate post-translational modifications necessary for activity in the transformed cell, and be moved to the appropriate compartment for biological activity by targeting appropriate intracellular compartments or secretions into extracellular compartments. Preferably, the cassette has 3' and 5' ends adapted for ready insertion into the vector, for example, it has restriction endonuclease sites at each end. In a preferred embodiment, the nucleic acid cassette contains a therapeutic gene sequence used to treat, prevent, or ameliorate a genetic disorder. The cassette can be removed and inserted into a plasmid or viral vector as a whole.

Полинуклеотиды включают представляющий интерес полинуклеотид (ы). Используемый в настоящей заявке термин «представляющий интерес полинуклеотид» относится к полинуклеотиду, кодирующему полипептид или слитый полипептид или полинуклеотид, который служит в качестве матрицы для транскрипции ингибирующего полинуклеотида, как это предусмотрено в настоящей заявке.Polynucleotides include the polynucleotide(s) of interest. The term "polynucleotide of interest" as used herein refers to a polynucleotide encoding a polypeptide or a fusion polypeptide or a polynucleotide that serves as a template for transcription of an inhibitory polynucleotide as provided herein.

Кроме того, специалистам в данной области техники должно быть понятно, что в результате вырожденности генетического кода существует много нуклеотидных последовательностей, которые могут кодировать полипептид или его фрагмент варианта, как предполагается в настоящей заявке. Некоторые из этих полинуклеотидов обладают минимальной гомологией с нуклеотидной последовательностью любого нативного гена. Тем не менее, полинуклеотиды, которые варьируются вследствие различий в использовании кодонов, специально рассматриваются в частных вариантах реализации, например, полинуклеотиды, которые оптимизированы для селекции кодонов человека и/или приматов. В одном варианте реализации предусмотрены полинуклеотиды, содержащие специальные аллельные последовательности. Аллели представляют собой эндогенные полинуклеотидные последовательности, которые изменяются в результате одной или нескольких мутаций, таких как делеции, добавления и/или замены нуклеотидов.In addition, those skilled in the art will appreciate that, as a result of the degeneracy of the genetic code, there are many nucleotide sequences that can encode a polypeptide or variant fragment thereof, as contemplated herein. Some of these polynucleotides share minimal homology with the nucleotide sequence of any native gene. However, polynucleotides that vary due to differences in codon usage are specifically contemplated in particular embodiments, eg, polynucleotides that are optimized for human and/or primate codon selection. In one embodiment, polynucleotides containing specific allelic sequences are provided. Alleles are endogenous polynucleotide sequences that change as a result of one or more mutations such as deletions, additions and/or substitutions of nucleotides.

В определенном варианте реализации представляющий интерес полинуклеотид содержит донорную матрицу репарации.In a particular embodiment, the polynucleotide of interest comprises a repair donor template.

В определенном варианте реализации представляющий интерес полинуклеотид содержит ингибирующий полинуклеотид, включая, среди прочего, киРНК, миРНК, кшРНК, рибозим или другую ингибирующую РНК.In a particular embodiment, the polynucleotide of interest comprises an inhibitory polynucleotide, including, but not limited to, a siRNA, siRNA, shRNA, ribozyme, or other inhibitory RNA.

В одном варианте реализации донорная матрица репарации, содержащая ингибирующую РНК, содержит одну или более регуляторных последовательностей, таких как, например, сильный конститутивный pol III, например, промотор няРНК U6 человека или мыши, промотор H1 РНК человека и мыши или человеческий тРНК-val промотор или сильный конститутивный промотор pol II, как описано в настоящей заявке в другом месте.In one embodiment, the inhibitory RNA-containing repair donor template contains one or more regulatory sequences such as, for example, a strong constitutive pol III, such as the human or mouse U6 nRNA promoter, the human and mouse RNA H1 promoter, or the human tRNA-val promoter. or a strong constitutive pol II promoter as described elsewhere herein.

Полинуклеотиды, рассматриваемые в частных вариантах реализации независимо от длины самой кодирующей последовательности, могут быть объединены с другими последовательностями ДНК, такими как промоторы и/или энхансеры, нетранслируемые области (UTR), последовательности Козака, сигналы полиаденилирования, дополнительные сайты ферментов рестрикции, множественные сайты клонирования, участки внутренней посадки рибосомы (IRES), сайты распознавания рекомбиназы (например, сайты LoxP, FRT и Att), терминирующие кодоны, сигналы терминации транскрипции, пост-транскрипционные элементы ответа и полинуклеотиды, кодирующие саморасщепляемый полипептид, метки эпитопа, описанные в другом месте в настоящей заявке или как известно в данной области техники, так что их общая длина может значительно варьироваться. Поэтому в частных вариантах реализации предполагается, что можно использовать полинуклеотидный фрагмент практически любой длины, причем общая длина предпочтительно ограничена простотой получения и использования в предполагаемом протоколе рекомбинантной ДНК.Polynucleotides considered in particular embodiments, regardless of the length of the coding sequence itself, can be combined with other DNA sequences such as promoters and/or enhancers, untranslated regions (UTRs), Kozak sequences, polyadenylation signals, additional restriction enzyme sites, multiple cloning sites , internal ribosome entry sites (IRES), recombinase recognition sites (e.g., LoxP, FRT, and Att sites), stop codons, transcription termination signals, post-transcriptional response elements, and polynucleotides encoding a self-cleaving polypeptide, epitope tags described elsewhere in the present application or as known in the art, so that their overall length can vary considerably. Therefore, in particular embodiments, it is contemplated that a polynucleotide fragment of substantially any length can be used, the overall length being preferably limited by ease of preparation and use in the intended recombinant DNA protocol.

Полинуклеотиды могут быть получены, обработаны, экспрессированы и/или доставлены с использованием любого из множества хорошо известных методов, известных и доступных в данной области. Чтобы экспрессировать желаемый полипептид, нуклеотидная последовательность, кодирующая полипептид, может быть вставлена в соответствующий вектор. Желаемый полипептид также может быть экспрессирован путем доставки в клетку мРНК, кодирующей данный полипептид.Polynucleotides can be generated, processed, expressed and/or delivered using any of a variety of well known methods known and available in the art. To express the desired polypeptide, the nucleotide sequence encoding the polypeptide can be inserted into an appropriate vector. The desired polypeptide can also be expressed by delivering mRNA encoding the polypeptide into the cell.

Иллюстративные примеры векторов включают, среди прочего, плазмиду, автономно реплицируемые последовательности и транспонируемые элементы, например, Sleeping Beauty, PiggyBac.Illustrative examples of vectors include, among others, a plasmid, autonomously replicating sequences, and transposable elements, eg Sleeping Beauty, PiggyBac.

Дополнительные иллюстративные примеры векторов включают, без ограничения, плазмиды, фагемиды, космиды, искусственные хромосомы, такие как дрожжевая искусственная хромосома (YAC), бактериальная искусственная хромосома (BAC) или P1-производная искусственная хромосома (PAC), бактериофаги, такие как фаг лямбда или фаг М13 и вирусы животных.Additional illustrative examples of vectors include, without limitation, plasmids, phagemids, cosmids, artificial chromosomes such as yeast artificial chromosome (YAC), bacterial artificial chromosome (BAC) or P1-derived artificial chromosome (PAC), bacteriophages such as lambda phage or M13 phage and animal viruses.

Иллюстративные примеры вирусов, полезных в качестве векторов, включают, без ограничения, ретровирус (включая лентивирус), аденовирус, адено-ассоциированный вирус, герпесвирус (например, вирус простого герпеса), поксвирус, бакуловирус, вирус папилломы и паповавирус (например, SV40).Illustrative examples of viruses useful as vectors include, without limitation, retrovirus (including lentivirus), adenovirus, adeno-associated virus, herpesvirus (eg, herpes simplex virus), poxvirus, baculovirus, papillomavirus, and papovavirus (eg, SV40).

Иллюстративные примеры векторов экспрессии включают, среди прочего, векторы pClneo (Promega) для экспрессии в клетках млекопитающих; pLenti4/V5-DEST™, pLenti6/V5-DEST™ и pLenti6.2/V5-GW/lacZ (Invitrogen) для лентивирус-опосредованного переноса и экспрессии генов в клетках млекопитающих. В частных вариантах реализации кодирующие последовательности полипептидов, раскрытые в настоящей заявке, могут быть лигированы в такие векторы экспрессии для экспрессии полипептидов в клетках млекопитающих.Illustrative examples of expression vectors include, inter alia, pClneo (Promega) vectors for expression in mammalian cells; pLenti4/V5-DEST™, pLenti6/V5-DEST™ and pLenti6.2/V5-GW/lacZ (Invitrogen) for lentivirus-mediated gene transfer and expression in mammalian cells. In particular embodiments, the coding sequences for the polypeptides disclosed herein may be ligated into such expression vectors for expression of the polypeptides in mammalian cells.

В частных вариантах реализации вектор представляет собой эписомальный вектор или вектор, который поддерживается внехромосомно. Используемый в настоящей заявке термин «эписомальный» относится к вектору, который способен реплицироваться без интеграции в хромосомную ДНК хозяина и без постепенной потери из делящейся клетки-хозяина, а также означает, что указанный вектор реплицируется внехромосомно или эписомально.In particular embodiments, the vector is an episomal vector or a vector that is supported extrachromosomally. As used herein, the term "episomal" refers to a vector that is capable of replicating without integration into the host's chromosomal DNA and without gradual loss from the dividing host cell, and also means that said vector replicates extrachromosomal or episomal.

«Последовательности контроля экспрессии», «элементы контроля» или «регуляторные последовательности», присутствующие в векторе экспрессии, представляют собой такие нетранслируемые области вектора: источник репликации, кассеты отбора, промоторы, энхансеры, интроны сигналов инициации трансляции (последовательность Shine Dalgarno или последовательность Козака), посттранскрипционные регуляторные элементы, последовательность полиаденилирования, 5'- и 3'-нетранслируемые области, которые взаимодействуют с белками клетки-хозяина для осуществления транскрипции и трансляции. Такие элементы могут различаться по своей силе и специфичности. В зависимости от используемой векторной системы и хозяина может использоваться любое количество подходящих элементов транскрипции и трансляции, включая убиквитарные промоторы и индуцибельные промоторы."Expression control sequences", "control elements", or "regulatory sequences" present in an expression vector are the non-translated regions of the vector: source of replication, selection cassettes, promoters, enhancers, translation initiation signal introns (Shine Dalgarno sequence or Kozak sequence) , post-transcriptional regulatory elements, polyadenylation sequence, 5'- and 3'-untranslated regions that interact with host cell proteins to effect transcription and translation. Such elements may differ in their strength and specificity. Depending on the vector system and host used, any number of suitable transcription and translation elements may be used, including ubiquitous promoters and inducible promoters.

В частных вариантах реализации полинуклеотид содержит вектор, включая, среди прочего, векторы экспрессии и вирусные векторы. Вектор может содержать одну или более экзогенных, эндогенных или гетерологичных контрольных последовательностей, таких как промоторы и/или энхансеры. «Эндогенная контрольная последовательность» представляет собой последовательность, которая естественным образом связана с данным геном в геноме. «Экзогенная контрольная последовательность» представляет собой последовательность, которая помещается в сопоставление с геном посредством генетических манипуляций (то есть молекулярно-биологических методов), так что транскрипция указанного гена направляется связанным энхансером/промотором. «Гетерологичная контрольная последовательность» представляет собой экзогенную последовательность, которая принадлежит к другому виду, нежели генетически манипулируемая клетка. «Синтетическая» контрольная последовательность может содержать элементы еще одной эндогенной и/или экзогенной последовательности и/или последовательности, определенные in vitro или in silico, которые обеспечивают оптимальную промоторную и/или энхансерную активность для конкретной терапии.In particular embodiments, the polynucleotide comprises a vector, including but not limited to expression vectors and viral vectors. The vector may contain one or more exogenous, endogenous or heterologous control sequences such as promoters and/or enhancers. An "endogenous control sequence" is a sequence that is naturally associated with a given gene in the genome. An "exogenous control sequence" is a sequence that is placed into alignment with a gene through genetic manipulation (ie, molecular biological techniques) such that transcription of said gene is directed by an associated enhancer/promoter. A "heterologous control sequence" is an exogenous sequence that belongs to a different species than the genetically manipulated cell. A "synthetic" control sequence may contain elements of yet another endogenous and/or exogenous sequence and/or in vitro or in silico determined sequences that provide optimal promoter and/or enhancer activity for a particular therapy.

Используемый в настоящей заявке термин «промотор» относится к сайту распознавания полинуклеотида (ДНК или РНК), с которым связывается РНК-полимераза. РНК-полимераза инициирует и транскрибирует полинуклеотиды, функционально связанные с промотором. В частных вариантах реализации промоторы, функциональные в клетках млекопитающих, содержат AT-богатую область, расположенную на расстоянии приблизительно от 25 до 30 оснований в направлении против хода транскрипции от сайта, где инициируется транскрипция, и/или другую последовательность, расположенную на расстоянии от 70 до 80 оснований в направлении против хода транскрипции от начала транскрипции, область CNCAAT, где N может быть любым нуклеотидом.As used herein, the term "promoter" refers to a polynucleotide recognition site (DNA or RNA) to which RNA polymerase binds. RNA polymerase initiates and transcribes polynucleotides operably linked to a promoter. In particular embodiments, promoters functional in mammalian cells comprise an AT-rich region located approximately 25 to 30 bases upstream from the site where transcription is initiated and/or another sequence located 70 to 80 bases upstream from the start of transcription, CNCAAT region, where N can be any nucleotide.

Термин «энхансер» относится к сегменту ДНК, который содержит последовательности, способные обеспечивать усиленную транскрипцию, и в некоторых случаях способные функционировать независимо от их ориентации относительно другой контрольной последовательности. Энхансер может функционировать совместно или аддитивно с промоторами и/или другими энхансерными элементами. Термин «промотор/энхансер» относится к сегменту ДНК, который содержит последовательности, способные обеспечивать функции как промотора, так и энхансера.The term "enhancer" refers to a segment of DNA that contains sequences capable of providing enhanced transcription, and in some cases capable of functioning independently of their orientation relative to another control sequence. The enhancer may function in conjunction with or in addition to promoters and/or other enhancer elements. The term "promoter/enhancer" refers to a segment of DNA that contains sequences capable of providing both promoter and enhancer functions.

Термин «функционально связанный» относится к сопоставлению, в котором описанные компоненты находятся в взаимосвязи, позволяющей им функционировать по своему назначению. В одном варианте реализации этот термин относится к функциональной связи между последовательностью контроля экспрессии нуклеиновой кислоты (такой как промотор и/или энхансер) и второй полинуклеотидной последовательностью, например, представляющим интерес полинуклеотидом, когда последовательность контроля экспрессии направляет транскрипцию экспрессии нуклеиновой кислоты, соответствующей второй последовательности.The term "operably linked" refers to an association in which the described components are in a relationship that allows them to function as intended. In one embodiment, the term refers to a functional relationship between a nucleic acid expression control sequence (such as a promoter and/or enhancer) and a second polynucleotide sequence, e.g., a polynucleotide of interest, when the expression control sequence directs transcription of expression of the nucleic acid corresponding to the second sequence.

Используемый в настоящей заявке термин «последовательность контроля конститутивной экспрессии» относится к промотору, энхансеру или промотору/энхансеру, который длительно или непрерывно обеспечивает транскрипцию функционально связанной последовательности. Конститутивная последовательность контроля экспрессии может быть «убиквитарным» промотором, энхансером или промотором/энхансером, который обеспечивает экспрессию в широком разнообразии типов клеток и тканей, или «специфичным для клетки», «специфичным для типа клеток», «специфичным для клеточных линий» или «тканеспецифичным» промотором, э энхансером или промотором/энхансером, который обеспечивает экспрессию в ограниченном разнообразии типов клеток и тканей, соответственно.As used herein, the term "constitutive expression control sequence" refers to a promoter, enhancer, or promoter/enhancer that sustainably or continuously transcribes an operably linked sequence. A constitutive expression control sequence can be a "ubiquitous" promoter, enhancer, or promoter/enhancer that allows for expression in a wide variety of cell types and tissues, or "cell specific", "cell type specific", "cell line specific" or " "tissue-specific" promoter, enhancer or promoter/enhancer that allows expression in a limited variety of cell types and tissues, respectively.

Иллюстративные убиквитарные последовательности контроля экспрессии, подходящие для использования в частных вариантах реализации, включают, среди прочего, немедленно-ранний промотор цитомегаловируса (CMV), промотор обезьяньего вируса 40 (SV40) (например, ранний или поздний), LTR промотор вирус мышиного лейкоза Молони (MoMLV), LTR промотор вируса саркомы Рауса (RSV), промотор вируса простого герпеса (HSV) (тимидинкиназа), промоторы H5, P7.5 и P11 из вируса осповакцины, промотор короткого фактора элонгации 1-альфа (EF1a- short), промотор длинного фактора элонгации 1-альфа (EF1a-long), ранний ответ роста 1 (EGR1), ферритин H (FerH), ферритин L (FerL), глицеральдегид-3-фосфатдегидрогеназа (GAPDH), эукариотический фактор инициации трансляции 4A1 (EIF4A1), белок теплового шока 5 70 кДа (HSPA5), белок теплового шока бета 90 кДа, член 1 (HSP90B1), белок теплового шока 70 кДа (HSP70), β-кинезин (β-KIN), человеческий локус ROSA 26к (Irions et al., Nature Biotechnology 25, 1477 - 1482 (2007)), промотор убиквитина С (UBC), промотор фосфоглицерат киназы-1 (PGK), промотор энхансера цитомегаловируса/β-актина курицы (CAG), промотор β-актина и промотор энхансера вируса миелопролиферативной саркомы, с удаленным участок отрицательного контроля, с замещенным сайтом связывания праймера dl587rev (MND) (Challita et al., J Virol. 69(2):748-55 (1995)).Illustrative ubiquitary expression control sequences suitable for use in particular embodiments include, but are not limited to, cytomegalovirus (CMV) immediate-early promoter, simian virus 40 (SV40) promoter (e.g., early or late), Moloney murine leukemia virus LTR promoter ( MoMLV), Rous sarcoma virus (RSV) LTR promoter, Herpes simplex virus (HSV) promoter (thymidine kinase), H5, P7.5 and P11 promoters from vaccinia virus, short elongation factor 1-alpha (EF1a-short) promoter, long elongation factor 1-alpha (EF1a-long), early growth response 1 (EGR1), ferritin H (FerH), ferritin L (FerL), glyceraldehyde 3-phosphate dehydrogenase (GAPDH), eukaryotic translation initiation factor 4A1 (EIF4A1), protein heat shock protein 5 70 kDa (HSPA5), heat shock protein beta 90 kDa member 1 (HSP90B1), heat shock protein 70 kDa (HSP70), β-kinesin (β-KIN), human ROSA 26k locus (Irions et al., Nature Biotechnology 25, 1477-1482 (2007)), about ubiquitin C motor (UBC), phosphoglycerate kinase-1 (PGK) promoter, chicken cytomegalovirus/β-actin (CAG) enhancer promoter, β-actin promoter, and myeloproliferative sarcoma virus enhancer promoter, with negative control site removed, with primer binding site substituted dl587rev (MND) (Challita et al., J Virol. 69(2):748-55 (1995)).

В частном варианте реализации может быть желательным использовать последовательность контроля экспрессии, специфичную к клетке, типу клетки, клеточной линии или ткани, для достижения специфической для типа клеток, специфичной к линии или тканевой экспрессии желаемой полинуклеотидной последовательности (например, для экспрессии конкретной нуклеиновой кислоты, кодирующей полипептид только в определенном подмножестве типов клеток, клеточных линий или тканей или на определенных стадиях развития).In a particular embodiment, it may be desirable to use a cell, cell type, cell line, or tissue specific expression control sequence to achieve cell type, lineage, or tissue specific expression of the desired polynucleotide sequence (e.g., to express a particular nucleic acid encoding polypeptide only in a certain subset of cell types, cell lines or tissues, or at certain developmental stages).

«Условная экспрессия» в настоящей заявке может относиться к любому типу условной экспрессии, включая, среди прочего, индуцибельную экспрессию; репрессируемую экспрессию; экспрессию в клетках или тканях, имеющих конкретное физиологическое, биологическое или болезненное состояние и т.д. Это определение не предназначено для исключения специфической к типу клеток или тканей экспрессии. Некоторые варианты реализации предусматривают условную экспрессию рассматриваемого полинуклеотида, например, экспрессия контролируется путем воздействия на клетку, ткань, организм и т.д. обработки или состояния, которое вызывает экспрессию полинуклеотида или которое вызывает увеличение или уменьшение экспрессии полинуклеотида, кодируемого рассматриваемым полинуклеотидом."Conditional expression" in the present application may refer to any type of conditional expression, including, but not limited to, inducible expression; repressible expression; expression in cells or tissues having a specific physiological, biological or disease state, etc. This definition is not intended to exclude cell or tissue type specific expression. Some embodiments provide for conditional expression of the polynucleotide in question, for example, expression is controlled by acting on a cell, tissue, organism, and so on. a treatment or condition that causes the expression of a polynucleotide or that causes an increase or decrease in the expression of a polynucleotide encoded by the polynucleotide in question.

Иллюстративные примеры индуцибельных промоторов/систем включают, среди прочего, стероид-индуцибельные промоторы, такие как промоторы для генов, кодирующих глюкокортикоидные или эстрогенные рецепторы (индуцируемые обработкой соответствующим гормоном), металлотиониновый промотор (индуцируемый обработкой различными тяжелыми металлами), промотор MX-1 (индуцируемый интерфероном), мифепристон-регулируемая система GeneSwitch (Sirin et al., 2003, Gene, 323:67), индуцируемый куматом генный переключатель (WO 2002/088346), тетрациклин-зависимые регуляторные системы и т.д.Illustrative examples of inducible promoters/systems include, among others, steroid-inducible promoters such as promoters for genes encoding glucocorticoid or estrogen receptors (inducible by treatment with the appropriate hormone), metallothionein promoter (inducible by treatment with various heavy metals), MX-1 promoter (inducible interferon), mifepristone-regulated GeneSwitch system (Sirin et al., 2003, Gene, 323:67), cumat-induced gene switch (WO 2002/088346), tetracycline-dependent regulatory systems, etc.

Условная экспрессия также может быть достигнута с использованием сайт-специфической ДНК-рекомбиназы. Согласно некоторым вариантам реализации полинуклеотиды содержат по меньшей мере один (обычно два) сайт (сайта) для рекомбинации, опосредованной сайт-специфической рекомбиназой. Используемые в настоящей заявке термины «рекомбиназа» или «сайт-специфическая рекомбиназа» включают в себя эксцизивные или интегративные белки, ферменты, кофакторы или ассоциированные белки, которые участвуют в реакциях рекомбинации с участием одного или нескольких сайтов рекомбинации (например, двух, трех, четырех, пяти, шести, семи, восьми, девяти, десяти или более), которые могут быть белками дикого типа (см. Landy, Current Opinion in Biotechnology 3: 699-707 (1993)) или мутантами, производными (например, слитые белки, содержащие последовательности рекомбинационных белков или их фрагменты), фрагменты и их варианты. Иллюстративные примеры рекомбиназ, подходящих для использования В частных вариантах реализации включают, среди прочего: Cre, Int, IHF, Xis, Flp, Fis, Hin, Gin, C31, Cin, Tn3 resolvase, TndX, XerC, XerD, TnpX, Hjc, Gin, SpCCE1 и ParA.Conditional expression can also be achieved using site-specific DNA recombinase. In some embodiments, the polynucleotides contain at least one (typically two) site(s) for recombination mediated by a site-specific recombinase. As used herein, the terms "recombinase" or "site-specific recombinase" include excisive or integrative proteins, enzymes, cofactors, or associated proteins that participate in recombination reactions involving one or more recombination sites (e.g., two, three, four , five, six, seven, eight, nine, ten, or more), which may be wild-type proteins (see Landy, Current Opinion in Biotechnology 3: 699-707 (1993)) or mutants, derivatives (e.g., fusion proteins, containing sequences of recombination proteins or their fragments), fragments and their variants. Illustrative examples of recombinases suitable for use in private embodiments include, among others: Cre, Int, IHF, Xis, Flp, Fis, Hin, Gin, C31, Cin, Tn3 resolvase, TndX, XerC, XerD, TnpX, Hjc, Gin , SpCCE1 and ParA.

Полинуклеотиды могут содержать один или более сайтов рекомбинации для любой из множества сайт-специфических рекомбиназ. Следует понимать, что сайт-мишень для сайт-специфической рекомбиназы является дополнением к любому сайту (-ам), необходимому для интеграции вектора, например, ретровирусного вектора или лентивирусного вектора. Используемые в настоящей заявке термины «последовательность рекомбинации», «сайт рекомбинации» или «сайт сайт-специфической рекомбинации» относятся к конкретной нуклеотидной последовательности, которую рекомбиназа распознает и с которой связывается.Polynucleotides may contain one or more recombination sites for any of a variety of site-specific recombinases. It should be understood that the target site for a site-specific recombinase is in addition to any site(s) required for vector integration, eg a retroviral vector or a lentiviral vector. As used herein, the terms "recombination sequence", "recombination site", or "site-specific recombination site" refer to a particular nucleotide sequence that the recombinase recognizes and binds to.

Например, один сайт рекомбинации для Cre-рекомбиназы представляет собой loxP, который представляет собой последовательность из 34 пар оснований, содержащую два инвертированных повтора из 13 пар оснований (служащих сайтами связывания рекомбиназы), фланкирующих сердцевинную последовательность из 8 пар оснований (см. Фиг.1 из Sauer, B., Current Opinion in Biotechnology 5:521-527 (1994)). Другие иллюстративные сайты loxP включают, среди прочего: lox511 (Hoess et al., 1996; Bethke and Sauer, 1997), lox5171 (Lee and Saito, 1998), lox2272 (Lee and Saito, 1998), m2 (Langer et al., 2002), lox71 (Albert et al., 1995) и lox66 (Albert et al., 1995).For example, one recombination site for Cre recombinase is loxP, which is a 34 base pair sequence containing two 13 base pair inverted repeats (serving as recombinase binding sites) flanking an 8 base pair core sequence (see Figure 1 from Sauer, B., Current Opinion in Biotechnology 5:521-527 (1994)). Other exemplary loxP sites include, among others: lox511 (Hoess et al., 1996; Bethke and Sauer, 1997), lox5171 (Lee and Saito, 1998), lox2272 (Lee and Saito, 1998), m2 (Langer et al., 2002), lox71 (Albert et al., 1995) and lox66 (Albert et al., 1995).

Подходящие сайты распознавания для рекомбиназы FLP включают, среди прочего: FRT (McLeod, et al., 1996), F1, F2, F3 (Schlake and Bode, 1994), F4, F5 (Schlake and Bode, 1994), FRT(LE) (Senecoff et al., 1988), FRT(RE) (Senecoff et al., 1988).Suitable recognition sites for FLP recombinase include, among others: FRT (McLeod, et al., 1996), F 1, F 2, F 3 (Schlake and Bode, 1994), F 4, F 5 (Schlake and Bode, 1994) , FRT(LE) (Senecoff et al., 1988), FRT(RE) (Senecoff et al., 1988).

Другими примерами последовательностей распознавания являются последовательности attB, attP, attL и attR, которые распознаются рекомбиназным ферментом λ-интеграза, например, phi-c31. SSR φC31 обеспечивает рекомбинацию только между гетеротипическими сайтами attB (длиной 34 п.н.) и attP (длиной 39 п.н.) (Groth et al., 2000). attB и attP, названные по сайтам присоединения для фаговой интегразы на бактериальном и фаговом геномах соответственно, оба содержат несовершенные инвертированные повторы, которые, вероятно, связаны гомодимерами φC31 (Groth et al., 2000). Сайты продуктов, attL и attR, эффективно инертны к дальнейшей φC31-опосредованной рекомбинации (Belteki et al., 2003), что делает реакцию необратимой. Было обнаружено, что для катализирования инсерции ДНК, несущая attB, встраивается в геномный сайт attP легче, чем сайт attP в геномный сайт attB (Thyagarajan et al., 2001; Belteki et al., 2003). Таким образом, типичные стратегии помещают путем гомологичной рекомбинации «стыковочный сайт», несущий attP, в определенный локус, который затем соединяется с входящей последовательностью, несущей attB, для инсерции.Other examples of recognition sequences are the attB, attP, attL and attR sequences, which are recognized by the λ-integrase recombinase enzyme, eg phi-c31. The φC31 SSR allows recombination only between the heterotypic sites attB (34 bp long) and attP (39 bp long) (Groth et al., 2000). attB and attP, named after phage integrase attachment sites on the bacterial and phage genomes, respectively, both contain imperfect inverted repeats that are probably linked by φC31 homodimers (Groth et al., 2000). The product sites, attL and attR, are effectively inert to further φC31-mediated recombination (Belteki et al., 2003), making the reaction irreversible. It was found that, to catalyze insertion, attB-carrying DNA is inserted into the attP genomic site more easily than the attP site into the attB genomic site (Thyagarajan et al., 2001; Belteki et al., 2003). Thus, exemplary strategies place, by homologous recombination, an attP-carrying "docking site" into a specific locus, which is then fused to an incoming attB-carrying sequence for insertion.

В одном варианте реализации рассматриваемый в настоящей заявке полинуклеотид содержит донорную матрицу репарации полинуклеотида, фланкированную парой сайтов распознавания рекомбиназы. в частных вариантах реализации, репарационный матричный полинуклеотид фланкирован сайтами LoxP, сайтами FRT или сайтами att.In one embodiment, the polynucleotide of this application comprises a polynucleotide repair donor template flanked by a pair of recombinase recognition sites. in particular embodiments, the repair template polynucleotide is flanked by LoxP sites, FRT sites, or att sites.

В частных вариантах реализации полинуклеотиды, рассматриваемые в настоящей заявке, включают один или более представляющих интерес полинуклеотидов, которые кодируют один или более полипептидов. В частных вариантах, чтобы добиться эффективной трансляции каждого из множества полипептидов, полинуклеотидные последовательности могут быть разделены одной или несколькими последовательностями IRES или полинуклеотидными последовательностями, кодирующими саморасщепляемый полипептид.In private embodiments, the polynucleotides contemplated in this application include one or more polynucleotides of interest that encode one or more polypeptides. In particular embodiments, in order to achieve efficient translation of each of the plurality of polypeptides, the polynucleotide sequences may be separated by one or more IRES sequences or polynucleotide sequences encoding a self-cleaving polypeptide.

Используемый в настоящей заявке термин «участок внутренней посадки рибосомы» или «IRES» относится к элементу, который способствует прямому внутреннему входу рибосомы в инициирующий кодон, такой как ATG, цистрона (области, кодирующей белок), тем самым приводя к кап-независимой трансляции гена. См., например, Jackson et al., 1990. Trends Biochem Sci 15 (12): 477-83) и Jackson and Kaminski. 1995. RNA 1 (10): 985-1000. Примеры IRES, обычно используемых специалистами в данной области, включают в себя описанные в патенте США №6 692 736. Дополнительные примеры «IRES», известные в данной области, включают, среди прочего, IRES, получаемый из пикорнавируса (Jackson et al., 1990), и IRES, получаемый из вирусных или клеточных источников мРНК, таких как, например, белок, связывающий тяжелую цепь иммуноглобулина (BiP), фактор роста эндотелия сосудов (VEGF) (Huez et al. 1998. Mol. Cell. Biol. 18 (11): 6178-6190), фактор роста фибробластов 2 (FGF-2) и инсулиноподобный фактор роста (IGFII), фактор инициации трансляции eIF4G и дрожжевые транскрипционные факторы TFIID и HAP4, вирус энцефеломикардита (EMCV), поставляемый на рынок Novagen (Duke et al., 1992. J. Virol 66 (3): 1602-9) и VEGF IRES (Huez et al., 1998. Mol Cell Biol 18 (11): 6178-90). Также сообщалось об IRES в вирусных геномах видов Picornaviridae, Dicistroviridae и Flaviviridae и в HCV, вирусе мышиного лейкоза Friend (FrMLV) и вирусе мышиного лейкоза Moloney (MoMLV).As used herein, the term "internal ribosome entry site" or "IRES" refers to an element that facilitates direct internal entry of the ribosome into an initiation codon, such as ATG, of a cistron (protein-coding region), thereby leading to cap-independent gene translation . See, for example, Jackson et al., 1990. Trends Biochem Sci 15 (12): 477-83) and Jackson and Kaminski. 1995. RNA 1(10): 985-1000. Examples of IRES commonly used by those skilled in the art include those described in US Patent No. 6,692,736. Additional examples of "IRES" known in the art include, among others, IRES derived from picornavirus (Jackson et al., 1990 ), and IRES derived from viral or cellular mRNA sources such as, for example, immunoglobulin heavy chain binding protein (BiP), vascular endothelial growth factor (VEGF) (Huez et al. 1998. Mol. Cell. Biol. 18 ( 11): 6178-6190), fibroblast growth factor 2 (FGF-2) and insulin-like growth factor (IGFII), translation initiation factor eIF4G and yeast transcription factors TFIID and HAP4, encephalomycarditis virus (EMCV) marketed by Novagen (Duke et al., 1992. J. Virol 66 (3): 1602-9) and VEGF IRES (Huez et al., 1998. Mol Cell Biol 18 (11): 6178-90). IRES have also been reported in the viral genomes of Picornaviridae, Dicistroviridae and Flaviviridae species and in HCV, Friend mouse leukemia virus (FrMLV) and Moloney mouse leukemia virus (MoMLV).

В одном варианте реализации IRES, используемый в полинуклеотидах, рассматриваемых в настоящей заявке, представляет собой EMCV IRES.In one embodiment, the implementation of the IRES used in the polynucleotides discussed in this application is an EMCV IRES.

В частных вариантах реализации полинуклеотиды содержат полинуклеотиды, имеющие консенсусную последовательность Козака и кодирующие желаемый полипептид. Используемый в настоящей заявке термин «последовательность Козака» относится к короткой нуклеотидной последовательности, которая значительно облегчает начальное связывание мРНК с небольшой субъединицей рибосомы и увеличивает трансляцию. Консенсусная последовательность Козака представляет собой (GCC) RCCATGG (SEQ ID NO: 105), где R представляет собой пурин (A или G) (Kozak, 1986. Cell. 44(2):283-92 и Kozak, 1987. Nucleic Acids Res. 15(20):8125-48).In particular embodiments, the polynucleotides comprise polynucleotides having a Kozak consensus sequence and encoding the desired polypeptide. As used herein, the term "Kozak sequence" refers to a short nucleotide sequence that greatly facilitates the initial binding of an mRNA to a small subunit of the ribosome and increases translation. Kozak's consensus sequence is (GCC) RCCATGG (SEQ ID NO: 105) where R is a purine (A or G) (Kozak, 1986. Cell. 44(2):283-92 and Kozak, 1987. Nucleic Acids Res 15(20):8125-48).

Элементы, направляющие эффективную терминацию и полиаденилирование гетерологичных транскриптов нуклеиновых кислот, увеличивают экспрессию гетерологичных генов. Сигналы терминации транскрипции обычно находятся в прямом направлении от сигнала полиаденилирования. В частных вариантах реализации векторы содержат последовательность полиаденилирования 3 ' полинуклеотида, кодирующего полипептид, подлежащий экспрессии. Используемые в настоящей заявке термины «сайт polyA», «последовательность polyA», «сайт poly(A)» или «последовательность poly(A)» означают последовательность ДНК, которая направляет как терминацию, так и полиаденилирование растущего РНК-транскрипта с помощью РНК-полимеразы II. Последовательности полиаденилирования могут способствовать стабильности мРНК путем добавления поли (А)-хвоста к 3'-концу кодирующей последовательности и, таким образом, способствовать повышению эффективности трансляции. Эффективное полиаденилирование рекомбинантного транскрипта является желательным, поскольку транскрипты, лишенные поли(А)-хвоста, нестабильны и быстро деградируют.Иллюстративные примеры поли(А)-сигналов, которые можно использовать в векторе, включают идеальную поли(А) -последовательность (например, AATAAA, ATTAAA, AGTAAA), бычью поли(А)-последовательность гормона роста (BGHpA), кроличью β -глобин-поли(А)-последовательность (rβgpA) или другую подходящую гетерологичную или эндогенную поли(А)-последовательность, известную в данной области техники.Elements directing efficient termination and polyadenylation of heterologous nucleic acid transcripts increase the expression of heterologous genes. Transcription termination signals are usually in the forward direction from the polyadenylation signal. In particular embodiments, the vectors contain a 3' polyadenylation sequence of a polynucleotide encoding a polypeptide to be expressed. As used herein, the terms "polyA site", "polyA sequence", "poly(A) site", or "poly(A) sequence" refer to a DNA sequence that directs both termination and polyadenylation of a nascent RNA transcript by RNA- polymerase II. Polyadenylation sequences can contribute to mRNA stability by adding a poly(A) tail to the 3' end of the coding sequence and thus improve translation efficiency. Efficient polyadenylation of a recombinant transcript is desirable because transcripts lacking a poly(A) tail are unstable and rapidly degrade. , ATTAAA, AGTAAA), bovine growth hormone poly(A) sequence (BGHpA), rabbit β-globin poly(A) sequence (rβgpA), or other suitable heterologous or endogenous poly(A) sequence known in the art. technology.

В некоторых вариантах реализации полинуклеотид или клетка, несущая полинуклеотид, использует ген самоубийства, включая индуцибельный ген самоубийства, для снижения риска прямой токсичности и/или неконтролируемой пролиферации. В частных вариантах реализации ген самоубийства не является иммуногенным для хозяина, несущего указанный полинуклеотид или клетку. Определенным примером гена самоубийства, который может быть использован, является каспаза-9 или каспаза-8 или цитозин-деаминаза. Каспазу-9 можно активировать с помощью специального химического индуктора димеризации (CID).In some embodiments, the polynucleotide, or the cell carrying the polynucleotide, uses a suicide gene, including an inducible suicide gene, to reduce the risk of direct toxicity and/or uncontrolled proliferation. In particular embodiments, the suicide gene is not immunogenic to the host carrying said polynucleotide or cell. A specific example of a suicide gene that can be used is caspase-9 or caspase-8 or cytosine deaminase. Caspase-9 can be activated using a special chemical dimerization inducer (CID).

В некоторых аспектах полинуклеотиды содержат генные сегменты, которые делают генетически модифицированные клетки, рассматриваемые в настоящей заявке, восприимчивыми к отрицательному отбору in vivo. Термин «отрицательный отбор» относится к инфузированной клетке, которая может быть элиминирована в результате изменения in vivo-состояния индивидуума. Отрицательный селектируемый фенотип может быть результатом инсерции гена, который придает чувствительность вводимому агенту, например, соединению. Гены отрицательной селекции известны в данной области и включают, среди прочего: ген тимидинкиназы вируса простого герпеса типа I (HSV-I TK), который придает чувствительность к ганцикловиру; ген клеточной гипоксантинфосфрибозилтрансферазы (HPRT), ген клеточной аденинфосфорибозилтрансферазы (APRT) и ген бактериальной цитозин-деаминазы.In some aspects, the polynucleotides contain gene segments that render the genetically modified cells of the present application susceptible to negative selection in vivo. The term "negative selection" refers to an infused cell that can be eliminated as a result of a change in the in vivo state of the individual. A negative selectable phenotype may result from the insertion of a gene that confers sensitivity to the administered agent, such as a compound. Negative selection genes are known in the art and include, among others: the herpes simplex virus type I (HSV-I TK) thymidine kinase gene, which confers sensitivity to ganciclovir; a cellular hypoxanthine phosphoribosyl transferase (HPRT) gene, a cellular adenine phosphoribosyl transferase (APRT) gene, and a bacterial cytosine deaminase gene.

В некоторых вариантах реализации генетически модифицированные клетки содержат полинуклеотид, дополнительно содержащий положительный маркер, который делает возможным отбор клеток отрицательного селектируемого фенотипа in vitro. Положительный селектируемый маркер может представлять собой ген, который после введения в клетку-хозяина экспрессирует доминантный фенотип, позволяющий осуществлять положительный отбор клеток, несущих указанный ген. Гены этого типа известны в данной области и включают, среди прочего, ген гигромицин-B-фосфотрансферазы (hph), который придает устойчивость к гигромицину B, ген аминогликозид-фосфотрансферазы (neo или aph) из Tn5, который кодирует устойчивость к антибиотику G418, ген дигидрофолатредуктазы (DHFR), ген аденозиндеаминазы (ADA) и ген множественной лекарственной устойчивости (MDR).In some embodiments, the genetically modified cells comprise a polynucleotide further containing a positive marker that allows selection of cells with a negative selectable phenotype in vitro. A positive selectable marker may be a gene which, when introduced into a host cell, expresses a dominant phenotype allowing positive selection of cells carrying said gene. Genes of this type are known in the art and include, inter alia, the hygromycin B phosphotransferase (hph) gene which confers resistance to hygromycin B, the aminoglycoside phosphotransferase (neo or aph) gene from Tn5 which encodes resistance to the antibiotic G418, the gene dihydrofolate reductase (DHFR), adenosine deaminase (ADA) gene and multidrug resistance (MDR) gene.

В одном варианте реализации положительный селектируемый маркер и отрицательный селектируемый элемент связаны так, что потеря отрицательного селектируемого элемента обязательно также сопровождается потерей положительного селектируемого маркера. В частном варианте реализации положительные и отрицательные селектируемые маркеры слиты таким образом, что потеря одного обязательно ведет к потере другого. Примером слитого полинуклеотида, который дает в качестве продукта экспрессии полипептид, который обладает желаемыми положительными и отрицательными признаками отбора, описанными выше, является гибридный ген гигромицин-фосфотрансферазы тимидинкиназы (HyTK). Экспрессия указанного гена дает полипептид, который придает устойчивость к гигромицину B для положительного отбора in vitro и чувствительность к ганцикловиру для отрицательного отбора in vivo. См. также публикации PCT US91/08442 и PCT/US94/05601 автора S.D. Lupton, описывающие использование бифункциональных селектируемых слитых генов, полученных в результате слияния доминантных позитивных селектируемых маркеров с отрицательными селектируемыми маркерами.In one embodiment, the positive selectable marker and the negative selectable element are linked such that the loss of the negative selectable element is necessarily also accompanied by the loss of the positive selectable marker. In a particular embodiment, the positive and negative selectable markers are fused such that the loss of one necessarily leads to the loss of the other. An example of a fusion polynucleotide that yields as an expression product a polypeptide that has the desired positive and negative selection features described above is the thymidine kinase hygromycin phosphotransferase (HyTK) fusion gene. Expression of this gene produces a polypeptide that confers resistance to hygromycin B for positive selection in vitro and sensitivity to ganciclovir for negative selection in vivo. See also PCT Publications US91/08442 and PCT/US94/05601 by S.D. Lupton describing the use of bifunctional selectable fusion genes resulting from the fusion of dominant positive selectable markers with negative selectable markers.

Предпочтительные положительные селектируемыые маркеры происходят из генов, выбранных из группы, состоящей из hph, nco и gpt, а предпочтительные отрицательные селектируемыые маркеры происходят из генов, выбранных из группы, состоящей из цитозин-деаминазы, HSV-I TK, VZV TK, HPRT, APRT и gpt. Типичные бифункциональные селектируемые слитые гены, рассматриваемые в частных вариантах реализации включают, среди прочего, гены, в которых положительный селектируемый маркер происходит из hph или neo, а отрицательный селектируемый маркер происходит из цитозин-деаминазы или гена TK или селектируемого маркера.Preferred positive selectable markers are from genes selected from the group consisting of hph, nco and gpt and preferred negative selectable markers are from genes selected from the group consisting of cytosine deaminase, HSV-I TK, VZV TK, HPRT, APRT and gpt. Exemplary bifunctional selectable fusion genes contemplated in particular embodiments include, inter alia, genes in which the positive selectable marker is derived from hph or neo and the negative selectable marker is derived from cytosine deaminase or the TK gene or selectable marker.

В частных вариантах реализации полинуклеотиды, кодирующие один или более вариантов нуклеаз, megaTAL, ферментов, изменяющих структуру концов, или слитые полипептиды, могут быть введены в гемопоэтические клетки, например Т-клетки, как невирусными, так и вирусными способами. В частных вариантах реализации доставка одного или нескольких полинуклеотидов, кодирующих нуклеазы, и/или донорной матрицы репарации, может обеспечиваться одним и тем же способом или разными способами, и/или одним и тем же вектором или разными векторами.In particular embodiments, polynucleotides encoding one or more variants of nucleases, megaTALs, end-reversing enzymes, or fusion polypeptides can be introduced into hematopoietic cells, such as T cells, by both non-viral and viral methods. In particular embodiments, delivery of one or more nuclease-encoding polynucleotides and/or repair donor template may be provided by the same or different methods and/or the same vector or different vectors.

Термин «вектор» используется в настоящей заявке для обозначения молекулы нуклеиновой кислоты, способной переносить или транспортировать другую молекулу нуклеиновой кислоты. Перенесенная нуклеиновая кислота, как правило, связана с молекулой вектора нуклеиновой кислоты, например, встроена в нее. Вектор может включать последовательности, которые управляют автономной репликацией в клетке, или может включать последовательности, достаточные для интеграции в ДНК клетки-хозяина. В частных вариантах реализации для доставки одного или нескольких полинуклеотидов, рассматриваемых в настоящей заявке, в Т-клетку, используются невирусные векторы.The term "vector" is used in this application to refer to a nucleic acid molecule capable of transferring or transporting another nucleic acid molecule. The transferred nucleic acid is typically associated with, for example, embedded in, the nucleic acid vector molecule. The vector may include sequences that direct autonomous replication in the cell, or may include sequences sufficient to integrate into the DNA of the host cell. In private embodiments, non-viral vectors are used to deliver one or more of the polynucleotides contemplated herein to a T cell.

Иллюстративные примеры невирусных векторов включают, среди прочего, плазмиды (например, ДНК-плазмиды или РНК-плазмиды), транспозоны, космиды и бактериальные искусственные хромосомы.Illustrative examples of non-viral vectors include, among others, plasmids (eg, DNA plasmids or RNA plasmids), transposons, cosmids, and bacterial artificial chromosomes.

Иллюстративные способы невирусной доставки полинуклеотидов, рассматриваемые в частных вариантах реализации включают, среди прочего: электропорацию, сонопорацию, липофекцию, микроинъекцию, биолистику, виросомы, липосомы, иммунолипосомы, наночастицы, поликатион или конъюгаты липид:нуклеиновая кислота, «оголенную» ДНК, искусственные вирионы, DEAE-декстран-опосредованный перенос, генную пушку и тепловой шок.Exemplary methods for non-viral delivery of polynucleotides contemplated in particular embodiments include, but are not limited to: electroporation, sonoporation, lipofection, microinjection, biolisting, virosomes, liposomes, immunoliposomes, nanoparticles, polycation or lipid:nucleic acid conjugates, naked DNA, artificial virions, DEAE-dextran-mediated transfer, gene gun and heat shock.

Иллюстративные примеры систем доставки полинуклеотидов, подходящих для использования в частных вариантах реализации, рассматриваемых в настоящей заявке, включают, среди прочего, предоставленные Amaxa Biosystems, Maxcyte, Inc., BTX Molecular Delivery Systems, ThermoFisher Scientific и Copernicus Therapeutics Inc. Реагенты для липофекции имеются на рынке (например, Transfectam™ и Lipofectin™). Катионные и нейтральные липиды, которые подходят для эффективной липофекции полинуклеотидов с распознаванием рецепторов, описаны в литературе. См например, Liu et al. (2003) Gene Therapy. 10:180-187; и Balazs et al. (2011) Journal of Drug Delivery. 2011:1-12. В частных вариантах реализации также предусмотрена направленная на антитела доставка на основе неживых наноклеток, полученных из бактерий.Illustrative examples of polynucleotide delivery systems suitable for use in the particular embodiments contemplated herein include those provided by Amaxa Biosystems, Maxcyte, Inc., BTX Molecular Delivery Systems, ThermoFisher Scientific, and Copernicus Therapeutics Inc., among others. Lipofection reagents are commercially available (eg Transfectam™ and Lipofectin™). Cationic and neutral lipids that are suitable for efficient lipofection of polynucleotides with receptor recognition are described in the literature. See, for example, Liu et al. (2003) Gene Therapy. 10:180-187; and Balazs et al. (2011) Journal of Drug Delivery. 2011:1-12. In particular embodiments, antibody-targeted delivery based on non-living nanocells derived from bacteria is also contemplated.

Вирусные векторы, содержащие полинуклеотиды, рассматриваемые в частных вариантах реализации могут доставляться in vivo путем введения отдельному пациенту, обычно путем системного введения (например, внутривенной, внутрибрюшинной, внутримышечной, подкожной или внутричерепной инфузии) или местного применения, как описано ниже. В альтернативном варианте векторы могут доставляться в клетки ex vivo, например в клетки, эксплантированные от отдельного пациента (например, мобилизованная периферическая кровь, лимфоциты, аспираты костного мозга, биопсия ткани и т.д.), или универсальные донорские гематопоэтические стволовые клетки с последующей реимплантацией клетки в пациента.Viral vectors containing polynucleotides contemplated in particular embodiments can be delivered in vivo by administration to an individual patient, usually by systemic administration (eg, intravenous, intraperitoneal, intramuscular, subcutaneous, or intracranial infusion) or topical application, as described below. Alternatively, vectors can be delivered to cells ex vivo, such as cells explanted from an individual patient (e.g., mobilized peripheral blood, lymphocytes, bone marrow aspirates, tissue biopsy, etc.), or universal donor hematopoietic stem cells, followed by reimplantation cells in the patient.

В одном варианте реализации вирусные векторы, содержащие варианты нуклеазы и/или донорную матрицу репарации, вводят непосредственно в организм для трансдукции клеток in vivo. В альтернативном варианте можно вводить оголенную ДНК. Введение осуществляют любым путем, обычно используемым для введения молекулы в окончательный контакт с клетками крови или ткани, включая, без ограничения, инъекцию, инфузию, местное применение и электропорацию. Подходящие способы введения таких нуклеиновых кислот доступны и хорошо известны специалистам в данной области, и, хотя для введения конкретной композиции можно использовать более одного пути, конкретный путь часто может обеспечить более непосредственную и более эффективную реакцию, чем другой путь.In one embodiment, viral vectors containing nuclease variants and/or a repair donor template are administered directly to an organism for in vivo cell transduction. Alternatively, you can enter naked DNA. Administration is by any route commonly used to bring the molecule into final contact with blood or tissue cells, including, but not limited to, injection, infusion, topical application, and electroporation. Suitable routes for administering such nucleic acids are available and well known to those skilled in the art, and while more than one route may be used to administer a particular composition, a particular route can often provide a more immediate and more efficient response than another route.

Иллюстративные примеры вирусных векторных систем, подходящих для использования в частных вариантах реализации, рассматриваемых в настоящей заявке, включают, среди прочего, векторы адено-ассоциированного вируса (AAV), ретровирус, вируса простого герпеса, аденовируса и вируса осповакцины.Illustrative examples of viral vector systems suitable for use in the particular embodiments contemplated herein include, among others, adeno-associated virus (AAV), retrovirus, herpes simplex virus, adenovirus, and vaccinia vectors.

В различных вариантах реализации один или более полинуклеотидов, кодирующих вариант нуклеазы и/или донорную матрицу репарации, вводят в гематопоэтическую клетку, например, Т-клетку, путем трансдукции клетки рекомбинантным аденоассоциированным вирусом (rAAV), содержащим один или больше полинуклеотидов.In various embodiments, one or more polynucleotides encoding a nuclease variant and/or a repair donor template is introduced into a hematopoietic cell, such as a T cell, by transducing the cell with a recombinant adeno-associated virus (rAAV) containing one or more polynucleotides.

AAV представляет собой небольшой (~ 26 нм) дефектный по репликации вирус, в основном эписомальный, без оболочки. AAV может инфицировать как делящиеся, так и неделящиеся клетки и может встраивать свой геном в геном клетки-хозяина. Рекомбинантные AAV (rAAV) обычно состоят, как минимум, из трансгена и его регуляторных последовательностей, а также 5'- и 3'-инвертированных концевых повторов AAV (ITR). Последовательности ITR имеют длину приблизительно 145 п.н. Векторы rAAV, содержащие два ITR, имеют полезную нагрузку приблизительно 4,4 т.п.н.AAV is a small (~26 nm) replication-defective, mostly episomal, non-enveloped virus. AAV can infect both dividing and non-dividing cells and can integrate its genome into the host cell's genome. Recombinant AAVs (rAAVs) typically consist of at least a transgene and its regulatory sequences, as well as AAV 5' and 3' inverted terminal repeats (ITRs). The ITR sequences are approximately 145 bp in length. rAAV vectors containing two ITRs have a payload of approximately 4.4 kb.

Самокомплементарные векторы rAAV содержат третью ITR и упаковывают две цепи рекомбинантной части вектора, оставляя только приблизительно 2,1 т.п.н для рассматриваемых в настоящей заявке полинуклеотидов. В одном варианте реализации вектор AAV представляет собой вектор scAAV.Self-complementary rAAV vectors contain a third ITR and pack two strands of the recombinant portion of the vector, leaving only about 2.1 kb for the polynucleotides contemplated here. In one embodiment, the AAV vector is an scAAV vector.

Расширенные возможности упаковки, которые приблизительно вдвое превышают емкость упаковки rAAV (приблизительно 9 т.п.н), были достигнуты с использованием двойных векторных стратегий rAAV. Двойные векторные стратегии, полезные для получения rAAV, рассматриваемые в настоящей заявке, включают, среди прочего, сплайсинг (транс-сплайсинг), гомологичную рекомбинацию (перекрытие) или комбинацию этих двух стратегий (гибридная). В стратегии двойного AAV-транс-сплайсинга донорный сигнал сплайсинга (SD) размещают на 3'-конце 5'-половинного вектора, а акцепторный сигнал (SA) сплайсинга размещают на 5'-конце 3'- половинного вектора. При коинфицировании одной и той же клетки двойными AAV векторами и конкатемеризацией «голова к хвосту» двух половин, опосредованной инвертированным концевым повторением (ITR), транс-сплайсинг приводит к образованию зрелой мРНК и полноразмерного белка (Yan et al, 2000). Трансплайсинг успешно используется для экспрессии крупных генов в мышцах и сетчатке (Reich et al, 2003; Lai et al, 2005). В альтернативном варианте две половины большой трансгенной кассеты экспрессии, содержащейся в двойных векторах AAV, могут содержать гомологичные перекрывающиеся последовательности (на 3'-конце 5'-половинного вектора и на 5'-конце 3'-половинного вектора, перекрытие двойных AAV), что будет способствовать восстановлению одного большого генома путем гомологичной рекомбинации (Duan et al, 2001). Эта стратегия зависит от рекомбиногенных свойств трансгенных перекрывающихся последовательностей (Ghosh et al, 2006). Третья стратегия двойных AAV (гибридная) основана на добавлении высоко рекомбиногенной области от экзогенного гена (то есть, щелочной фосфатазы; Ghosh et al., 2008, Ghosh et al, 2011)) к векторам транс-сплайсинга. Указанная добавленная область располагается в прямом направлении от сигнала SD в 5'-половинном векторе и в направлении против хода транскрипции сигнала S A в 3'-половинном векторе для увеличения рекомбинации между двойными AAV.Expanded packaging capabilities that are approximately double the packaging capacity of rAAV (approximately 9 kb) have been achieved using rAAV dual vector strategies. Dual vector strategies useful for obtaining rAAV, discussed in this application include, among others, splicing (trans-splicing), homologous recombination (overlap) or a combination of these two strategies (hybrid). In the double AAV trans splicing strategy, the splicing donor (SD) signal is placed at the 3' end of the 5' half vector and the splicing acceptor (SA) signal is placed at the 5' end of the 3' half vector. When coinfecting the same cell with dual AAV vectors and head-to-tail concatemerization of the two halves mediated by inverted terminal repeat (ITR), trans-splicing results in the formation of mature mRNA and full-length protein (Yan et al, 2000). Transplication has been successfully used to express large genes in muscle and retina (Reich et al, 2003; Lai et al, 2005). Alternatively, the two halves of the large transgene expression cassette contained in the twin AAV vectors may contain homologous overlapping sequences (at the 3'end of the 5'half vector and at the 5'end of the 3'half vector, the overlap of the double AAVs) such that will promote the restoration of one large genome by homologous recombination (Duan et al, 2001). This strategy depends on the recombinogenic properties of transgenic overlapping sequences (Ghosh et al, 2006). A third double AAV strategy (hybrid) is based on the addition of a highly recombinogenic region from an exogenous gene (ie, alkaline phosphatase; Ghosh et al., 2008, Ghosh et al, 2011)) to trans-splicing vectors. This added region is located upstream of the SD signal in the 5' half vector and upstream of the S A signal in the 3' half vector to increase recombination between double AAVs.

Термины «гибридный AAV», «гибридный rAAV», «химерный AAV» или «химерный rAAV» относятся к геному rAAV, упакованному с капсидом другого серотипа AAV (и предпочтительно, другого серотипа из одного или нескольких ITR AAV), который в других случаях может упоминаться как псевдотипизированный rAAV. Например, геном rAAV типа 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 или 16 может быть инкапсидирован в капсид AAV типа 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 или 16 или его вариант, при условии, что капсид AAV и геном (и, предпочтительно, один или более ITR AAV)) имеют разные серотипы. В некоторых случаях можно псевдотипированную частицу rAAV можно обозначить как типа «x/y», где «x» указывает источник ITR, а «y» указывает серотип капсида, например, 2/5 rAAV. частица имеет ITR от AAV2 и капсид от AAV6.The terms "hybrid AAV", "hybrid rAAV", "chimeric AAV", or "chimeric rAAV" refer to the rAAV genome packaged with the capsid of another AAV serotype (and preferably another serotype from one or more AAV ITRs), which may otherwise referred to as pseudo-typed rAAV. For example, the rAAV type 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, or 16 genome can be encapsidated into an AAV type 1, 2, 3, 4 capsid. , 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, or 16, or a variant thereof, provided that the AAV capsid and genome (and preferably one or more AAV ITRs)) are different serotypes. In some cases, a pseudotyped rAAV particle can be designated as type "x/y", where "x" indicates the source of the ITR and "y" indicates the capsid serotype, for example, 2/5 rAAV. the particle has an ITR from AAV2 and a capsid from AAV6.

В частных вариантах реализации rAAV содержит ITR и капсидные последовательности, выделенные из AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV 12, AAV13, AAV 14, AAV15 и AAV16.In particular embodiments, rAAV contains ITRs and capsid sequences derived from AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV 12, AAV13, AAV 14, AAV15, and AAV16.

В некоторых вариантах реализации используется химерный rAAV, где последовательности ITR выделены из одного серотипа AAV, а последовательности капсида выделены из другого серотипа AAV. Например, rAAV с последовательностями ITR, полученными из AAV2, и капсидными последовательностями, полученными из AAV6, называют AAV2/AAV6. В частных вариантах реализации вектор rAAV может содержать ITR из AAV2 и капсидные белки из любого из AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9 или AAV10. В предпочтительном варианте реализации rAAV содержит последовательности ITR, полученные из AAV2, и капсидные последовательности, полученные из AAV6. В предпочтительном варианте реализации rAAV содержит последовательности ITR, полученные из AAV2, и капсидные последовательности, полученные из AAV2.In some embodiments, a chimeric rAAV is used, where the ITR sequences are derived from one AAV serotype and the capsid sequences are derived from another AAV serotype. For example, rAAV with ITR sequences derived from AAV2 and capsid sequences derived from AAV6 are referred to as AAV2/AAV6. In particular embodiments, the rAAV vector may comprise ITRs from AAV2 and capsid proteins from any of AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, or AAV10. In a preferred embodiment, the rAAV contains ITR sequences derived from AAV2 and capsid sequences derived from AAV6. In a preferred embodiment, the rAAV contains ITR sequences derived from AAV2 and capsid sequences derived from AAV2.

В некоторых вариантах реализации к капсидам AAV могут быть применены сконструированные и селекционные методы, чтобы сделать их более способными к трансдукции изучаемых клеток.In some embodiments, engineered and breeding techniques can be applied to AAV capsids to make them more capable of transducing the cells of interest.

Конструирование векторов rAAV, их получение и очистка описаны, например, в патентах США №№9169494; 9169492; 9012224; 8889641; 8809058; и 8784999, каждый из которых включен в настоящее описание в качестве ссылки в полном объеме.The construction of rAAV vectors, their production and purification are described, for example, in US patent No. 9169494; 9169492; 9012224; 8889641; 8809058; and 8,784,999, each of which is incorporated herein by reference in its entirety.

В различных вариантах реализации один или более полинуклеотидов, кодирующих вариант нуклеазы и/или донорную матрицу репарации, вводят в гемопоэтическую клетку путем трансдукции клетки ретровирусом, например, лентивирусом, содержащим один или более полинуклеотидов.In various embodiments, one or more polynucleotides encoding a nuclease variant and/or a repair donor template are introduced into a hematopoietic cell by transducing the cell with a retrovirus, such as a lentivirus, containing one or more polynucleotides.

Используемый в настоящей заявке термин «ретровирус» относится к РНК-вирусу, который осуществляет обратную транскрипцию своей геномной РНК в линейную двухцепочечную копию ДНК и впоследствии ковалентно интегрирует свою геномную ДНК в геном хозяина. Иллюстративные ретровирусы, подходящие для использования в частных вариантах реализации, включают, среди прочего: вирус мышиного лейкоза Молони (M-MuLV), вирус мышиной саркомы Молони (MoMSV), вирус мышиной саркомы Харви (HaMuSV), вирус опухоли молочной железы мыши (MuMTV), вирус лейкоза гиббонов (GaLV), вирус лейкоза кошек (FLV), спумавирус, вирус лейкоза мышей Френда, вирус мышиных стволовых клеток (MSCV) и вирус саркомы Рауса (RSV) и лентивирус.As used herein, the term "retrovirus" refers to an RNA virus that reverse-transcribes its genomic RNA into a linear double-stranded DNA copy and subsequently covalently integrates its genomic DNA into the host genome. Illustrative retroviruses suitable for use in particular embodiments include, but are not limited to: Moloney mouse leukemia virus (M-MuLV), Moloney mouse sarcoma virus (MoMSV), Harvey mouse sarcoma virus (HaMuSV), mouse mammary tumor virus (MuMTV) , gibbon leukemia virus (GaLV), feline leukemia virus (FLV), spumavirus, Friend mouse leukemia virus, mouse stem cell virus (MSCV) and Rous sarcoma virus (RSV) and lentivirus.

Используемый в настоящей заявке термин «лентивирус» относится к группе (или роду) сложных ретровирусов. Иллюстративные лентивирусы включают, среди прочего: ВИЧ (вирус иммунодефицита человека; включая ВИЧ типа 1 и ВИЧ типа 2); вирус висна-маеди (VMV); вирус артрита-энцефалита коз и овец (CAEV); вирус инфекционной анемии лошадей (EIAV); вирус иммунодефицита кошек (FIV); вирус иммунодефицита крупного рогатого скота (BIV); и вирус иммунодефицита обезьян (SIV). В одном варианте реализации являются предпочтительными векторные каркасные цепи на основе ВИЧ (то есть элементы цис-действующей последовательности ВИЧ).Used in this application, the term "lentivirus" refers to a group (or genus) of complex retroviruses. Exemplary lentiviruses include, among others: HIV (human immunodeficiency virus; including HIV type 1 and HIV type 2); visna maedi virus (VMV); ovine and goat arthritis-encephalitis virus (CAEV); equine infectious anemia virus (EIAV); feline immunodeficiency virus (FIV); bovine immunodeficiency virus (BIV); and simian immunodeficiency virus (SIV). In one embodiment, HIV-based vector backbone chains (ie, HIV cis-acting sequence elements) are preferred.

В различных вариантах реализации рассматриваемый в настоящей заявке лентивирусный вектор содержит один или более LTR и один или более или все из следующих вспомогательных элементов: cPPT/FLAP, сигнал упаковки Psi (Ψ), элемент экспорта, poly(A)-последовательности, и могут, необязательно, содержать WPRE или HPRE, инсуляторный элемент, селектируемый маркер и ген самоубийства клетки, как обсуждается в другом месте настоящей заявки.In various embodiments, the lentiviral vector discussed herein contains one or more LTRs and one or more or all of the following accessory elements: cPPT/FLAP, Psi (Ψ) packing signal, export element, poly(A) sequences, and may, optionally, contain a WPRE or HPRE, an insulator element, a selectable marker and a cell suicide gene, as discussed elsewhere in this application.

В частных вариантах реализации лентивирусные векторы, рассматриваемые в настоящей заявке, могут быть интегрирующим или неинтегрирующим или дефектным по интеграции лентивирусом. Используемый в настоящей заявке термин «дефектный по интеграции лентивирус» или «IDLV» относится к лентивирусу, имеющему интегразу, которая не обладает способностью интегрировать вирусный геном в геном клеток-хозяев. Некомпетентные по интеграции вирусные векторы были описаны в заявке на патент WO 2006/010834, которая полностью включена в настоящее описание посредством ссылки.In particular embodiments, the lentiviral vectors contemplated herein may be an integrating or non-integrating or integration-defective lentivirus. As used herein, the term "integration-defective lentivirus" or "IDLV" refers to a lentivirus having an integrase that does not have the ability to integrate the viral genome into the genome of host cells. Integration-incompetent viral vectors have been described in patent application WO 2006/010834, which is incorporated herein by reference in its entirety.

Иллюстративные мутации в гене pol ВИЧ-1, подходящие для снижения активности интегразы, включают, среди прочего: H12N, H12C, H16C, H16V, S81 R, D41A, K42A, H51A, Q53C, D55V, D64E, D64V, E69A, K71A, E85A, E87A, D116N, D1161, D116A, N120G, N1201, N120E, E152G, E152A, D35E, K156E, K156A, E157A, K159E, K159A, K160A, R166A, D167A, E170A, H171A, K173A, K186Q, K186T, K188T, E198A, R199c, R199T, R199A, D202A, K211A, Q214L, Q216L, Q221 L, W235F, W235E, K236S, K236A, K246A, G247W, D253A, R262A, R263A и K264H.Illustrative mutations in the HIV-1 pol gene suitable for reducing integrase activity include, among others: H12N, H12C, H16C, H16V, S81R, D41A, K42A, H51A, Q53C, D55V, D64E, D64V, E69A, K71A, E85A E87A, D116N, D1161, D116A, N120G, N120G, N120E, E152G, E152A, D35E, K156E, K156A, E157A, K159E, K159A, K160A, R1667A, E170A, E173AA, K186T, K173AA, K186T, K173AA, K186T, K173AA, K186T, K173AA, K186T, K173AA, K186T .

В одном варианте реализации ген pol с дефицитом интегразы ВИЧ-1 содержит мутацию D64V, D116I, D116A, E152G или E152A; мутации D64V, D116I и E152G; или мутации D64V, D116A и E152A.In one embodiment, the HIV-1 integrase-deficient pol gene contains the D64V, D116I, D116A, E152G, or E152A mutation; mutations D64V, D116I and E152G; or mutations D64V, D116A and E152A.

В одном варианте реализации ген pol с дефицитом интегразы ВИЧ-1 содержит мутацию D64V.In one embodiment, the HIV-1 integrase-deficient pol gene contains the D64V mutation.

Термин «длинный концевой повтор (LTR)» относится к доменам пар оснований, расположенным на концах ретровирусных ДНК, которые в контексте своей естественной последовательности являются прямыми повторами и содержат области U3, R и U5.The term "long terminal repeat (LTR)" refers to the base pair domains located at the ends of retroviral DNA, which in the context of their natural sequence are direct repeats and contain regions U3, R and U5.

Используемый в настоящей заявке термин «элемент FLAP» или «cPPT/FLAP» относится к нуклеиновой кислоте, последовательность которой включает в себя центральный полипуриновый тракт и центральные концевые последовательности (cPPT и CTS) ретровируса, например, ВИЧ-1 или ВИЧ-2. Подходящие элементы FLAP описаны в патенте США №6 682 907 и в Zennou et al., 2000, Cell, 101: 173. В другом варианте реализации лентивирусный вектор содержит элемент FLAP с одной или несколькими мутациями в элементах cPPT и/или CTS. В еще одном варианте реализации лентивирусный вектор содержит либо cPPT, либо CTS элемент.В еще одном варианте реализации лентивирусный вектор не содержит cPPT или CTS элемент.As used herein, the term "FLAP element" or "cPPT/FLAP" refers to a nucleic acid whose sequence includes the central polypurine tract and central terminal sequences (cPPT and CTS) of a retrovirus, such as HIV-1 or HIV-2. Suitable FLAP elements are described in US Pat. No. 6,682,907 and Zennou et al., 2000, Cell, 101:173. In another embodiment, the lentiviral vector contains a FLAP element with one or more mutations in the cPPT and/or CTS elements. In yet another embodiment, the lentiviral vector contains either a cPPT or a CTS element. In another embodiment, the lentiviral vector does not contain a cPPT or a CTS element.

Используемый в настоящей заявке термин «сигнал упаковки» или «последовательность упаковки» относится к последовательностям psi [Ψ], расположенным в ретровирусном геноме, которые необходимы для инсерции вирусной РНК в вирусный капсид или частицу, см., например,, Clever et al., 1995. J. of Virology, Vol.69, No. 4; pp.2101-2109.As used herein, the term "packaging signal" or "packing sequence" refers to the psi [Ψ] sequences located in the retroviral genome that are required for the insertion of viral RNA into a viral capsid or particle, see, for example, Clever et al., 1995. J. of Virology, Vol.69, No. four; pp.2101-2109.

Термин «экспортный элемент» относится к цис-действующему посттранскрипционному регуляторному элементу, который регулирует транспорт РНК-транскрипта из ядра в цитоплазму клетки. Примеры элементов экспорта РНК включают, среди прочего, элемент ответа rev (RRE) вируса иммунодефицита человека (ВИЧ) (см., например, Cullen et al., 1991. J. Virol. 65: 1053; и Cullen et al., 1991. Cell 58: 423), и посттранскрипционный регуляторный элемент вируса гепатита В (HPRE).The term "export element" refers to a cis-acting post-transcriptional regulatory element that regulates the transport of an RNA transcript from the nucleus to the cytoplasm of a cell. Examples of RNA export elements include, among others, the human immunodeficiency virus (HIV) rev response element (RRE) (see, e.g., Cullen et al., 1991. J. Virol. 65:1053; and Cullen et al., 1991. Cell 58: 423), and the hepatitis B virus post-transcriptional regulatory element (HPRE).

В частных вариантах реализации экспрессию гетерологичных последовательностей в вирусных векторах увеличивается путем встраивания посттранскрипционных регуляторных элементов, эффективных сайтов полиаденилирования и, необязательно, сигналов терминации транскрипции в векторы. Разнообразные посттранскрипционные регуляторные элементы могут повышать экспрессию гетерологичной нуклеиновой кислоты в белке, например, посттранскрипционный регуляторный элемент вируса гепатита сурка (WPRE; Zufferey et al., 1999, J. Virol., 73:2886); посттранскрипционный регуляторный элемент, присутствующий в вирусе гепатита В (HPRE) (Huang et al., Mol. Cell. Biol., 5:3864); и тому подобное (Liu et al., 1995, Genes Dev., 9:1766).In particular embodiments, the expression of heterologous sequences in viral vectors is increased by inserting post-transcriptional regulatory elements, effective polyadenylation sites, and optionally transcription termination signals into the vectors. A variety of post-transcriptional regulatory elements can increase the expression of a heterologous nucleic acid in a protein, such as the woodchuck hepatitis virus post-transcriptional regulatory element (WPRE; Zufferey et al., 1999, J. Virol., 73:2886); post-transcriptional regulatory element present in hepatitis B virus (HPRE) (Huang et al., Mol. Cell. Biol., 5:3864); and the like (Liu et al., 1995, Genes Dev., 9:1766).

Лентивирусные векторы предпочтительно содержат несколько усовершенствований в отношении безопасности в результате модификации LTR. Термин «самоинактивирующие» (SIN) векторы относятся к дефектным по репликации векторам, например, в которых правая (3') область энхансер-промотора LTR, известная как область U3, была модифицирована (например, путем делеции или замены) для предотвращения вирусной транскрипции после первого раунда вирусной репликации. Дополнительное повышение безопасности обеспечивается заменой U3-области 5'-LTR гетерологичным промотором для управления транскрипцией вирусного генома во время производства вирусных частиц. Примеры гетерологичных промоторов, которые могут быть использованы, включают, например, промоторы обезьяньего вируса 40 (SV40) (например, ранний или поздний), цитомегаловируса (CMV) (например, немедленно ранний), вируса мышиного лейкоза Молони (MoMLV), вируса саркомы Рауса (RSV) и вируса простого герпеса (HSV) (тимидинкиназа).Lentiviral vectors preferably contain several safety improvements as a result of the LTR modification. The term "self-inactivating" (SIN) vectors refers to replication-defective vectors, e.g., in which the right (3') region of the LTR enhancer promoter, known as the U3 region, has been modified (e.g., by deletion or substitution) to prevent viral transcription after first round of viral replication. An additional increase in safety is provided by replacing the U3 region of the 5'-LTR with a heterologous promoter to drive transcription of the viral genome during the production of viral particles. Examples of heterologous promoters that can be used include, for example, simian virus 40 (SV40) (e.g., early or late), cytomegalovirus (CMV) (e.g., immediate early), Moloney mouse leukemia virus (MoMLV), Rous sarcoma virus (RSV) and herpes simplex virus (HSV) (thymidine kinase).

Используемые в настоящей заявке термины «псевдотип» или «псевдотипирование» относятся к вирусу, белки вирусной оболочки которого были заменены белками другого вируса, обладающими предпочтительными характеристиками. Например, ВИЧ может быть псевдотипирован белками оболочки G-белка вируса везикулярного стоматита (VSV-G), который позволяет ВИЧ инфицировать более широкий круг клеток, поскольку белки оболочки ВИЧ (кодируемые геном env) обычно нацеливают вирус на CD4+презентирующие клетки.As used herein, the terms "pseudotype" or "pseudotyping" refer to a virus whose viral envelope proteins have been replaced with proteins from another virus that have preferred characteristics. For example, HIV can be pseudotyped by vesicular stomatitis virus G protein (VSV-G) envelope proteins, which allow HIV to infect a wider range of cells, since HIV envelope proteins (encoded by the env gene) typically target the virus to CD4 + presenting cells.

В некоторых случаях лентивирусные векторы получают в соответствии с известными способами. См например, Kutner et al., BMC Biotechnol. 2009;9:10. doi: 10.1186/1472-6750-9-10; Kutner et al. Nat. Protoc. 2009;4(4):495-505. doi: 10.1038/nprot.2009.22.In some cases, lentiviral vectors are prepared according to known methods. See, for example, Kutner et al., BMC Biotechnol. 2009;9:10. doi: 10.1186/1472-6750-9-10; Kutner et al. Nat. Protocol. 2009;4(4):495-505. doi: 10.1038/nprot.2009.22.

Согласно определенным конкретным вариантам реализации, рассматриваемым в настоящей заявке, большинство или все последовательности основной цепи вирусного вектора получены из лентивируса, например, ВИЧ-1. Однако следует понимать, что можно использовать или комбинировать множество различных источников ретровирусных и/или лентивирусных последовательностей, и могут быть приспособлены многочисленные замены и изменения в некоторых из лентивирусных последовательностей без ухудшения способности вектора переноса выполнять описанные в настоящей заявке функции. Кроме того, в данной области известно множество лентивирусных векторов, см. Naldini et al., (1996a, 1996b и 1998); Zufferey et al., (1997); Dull et al., 1998, Патенты США №6013516; и 5994136, многие из которых могут быть адаптированы для получения вирусного вектора или переносящей плазмиды, рассматриваемых в настоящей заявке.In certain specific embodiments contemplated herein, most or all of the viral vector backbone sequences are derived from a lentivirus, such as HIV-1. However, it should be understood that many different sources of retroviral and/or lentiviral sequences can be used or combined, and numerous substitutions and changes can be accommodated in some of the lentiviral sequences without compromising the transfer vector's ability to perform the functions described herein. In addition, many lentiviral vectors are known in the art, see Naldini et al., (1996a, 1996b and 1998); Zufferey et al., (1997); Dull et al., 1998, US Pat. No. 6,013,516; and 5994136, many of which can be adapted to produce the viral vector or transfer plasmid discussed in this application.

В различных вариантах реализации один или более полинуклеотидов, кодирующих вариант нуклеазы и/или донорную матрицу репарации, вводят в гемопоэтическую клетку путем трансдукции клетки аденовирусом, содержащим один или более полинуклеотидов.In various embodiments, one or more polynucleotides encoding a nuclease variant and/or a repair donor template are introduced into a hematopoietic cell by transducing the cell with an adenovirus containing one or more polynucleotides.

Векторы на основе аденовируса способны к очень высокой эффективности трансдукции во многих типах клеток и не требуют деления клеток. С такими векторами были получены высокий титр и высокий уровень экспрессии. Указанный вектор может быть получен в больших количествах в относительно простой системе. Большинство аденовирусных векторов сконструированы так, что трансген заменяет гены Ad E1a, E1b и/или E3; впоследствии вектор с дефектом репликации размножается в клетках 293 человека, которые обеспечивают функции удаленного гена в транс-положении. Аденовирусные векторы могут трансдуцировать различные типы тканей in vivo, включая неделящиеся, дифференцированные клетки, такие как клетки печени, почек и мышц. Обычные аденовирусные векторы могут нести большую полезную нагрузку.Adenovirus-based vectors are capable of very high transduction efficiency in many cell types and do not require cell division. With such vectors, a high titer and a high level of expression were obtained. The specified vector can be obtained in large quantities in a relatively simple system. Most adenoviral vectors are designed such that the transgene replaces the Ad E1a, E1b and/or E3 genes; subsequently, the replication-deficient vector propagates in human 293 cells that provide the functions of the deleted gene in trans. Adenovirus vectors can transduce various tissue types in vivo, including non-dividing, differentiated cells such as liver, kidney, and muscle cells. Conventional adenoviral vectors can carry a large payload.

При генерировании и размножении современных аденовирусных векторов, которые имеют дефект по репликации, можно использовать уникальную линию клеток-хелперов, обозначенную 293, которая была трансформирована из эмбриональных клеток почки человека фрагментами ДНК Ad5 и конститутивно экспрессирует белки E1 (Graham et al., 1977). Поскольку область E3 можно удалить из генома аденовируса (Jones & Shenk, 1978), существующие векторы аденовируса, с помощью клеток 293, несут чужеродную ДНК в области E1, D3 или в обеих областях (Graham & Prevec, 1991). Аденовирусные векторы уже использовались для экспрессии генов эукариот (Levrero et al., 1991; Gomez-Foix et al., 1992) и разработки вакцин (Grunhaus & Horwitz, 1992; Graham & Prevec, 1992). Исследования по введению рекомбинантного аденовируса в разные ткани включают инстилляцию в трахею (Rosenfeld et al., 1991; Rosenfeld et al., 1992), инъекции в мышцы (Ragot et al., 1993), периферические внутривенные инъекции (Herz & Gerard, 1993) и стереотаксические инокуляция в головной мозг (Le Gal La Salle et al., 1993). Пример использования Ad-вектора в клиническом испытании включал полинуклеотидную терапию для противоопухолевой иммунизации с внутримышечной инъекцией (Sterman et al., Hum. Gene Ther. 7:1083-9 (1998)).When generating and propagating modern adenoviral vectors that have a replication defect, it is possible to use a unique helper cell line, designated 293, which was transformed from human embryonic kidney cells with Ad5 DNA fragments and constitutively expresses E1 proteins (Graham et al., 1977). Because the E3 region can be removed from the adenovirus genome (Jones & Shenk, 1978), existing adenovirus vectors, using 293 cells, carry foreign DNA in the E1, D3 or both regions (Graham & Prevec, 1991). Adenovirus vectors have already been used for eukaryotic gene expression (Levrero et al., 1991; Gomez-Foix et al., 1992) and vaccine development (Grunhaus & Horwitz, 1992; Graham & Prevec, 1992). Studies on the introduction of recombinant adenovirus into various tissues include tracheal instillation (Rosenfeld et al., 1991; Rosenfeld et al., 1992), muscle injection (Ragot et al., 1993), peripheral intravenous injection (Herz & Gerard, 1993) and stereotaxic brain inoculation (Le Gal La Salle et al., 1993). An example of the use of an Ad vector in a clinical trial included polynucleotide therapy for antitumor immunization with intramuscular injection (Sterman et al., Hum. Gene Ther. 7:1083-9 (1998)).

В различных вариантах реализации один или более полинуклеотидов, кодирующих вариант нуклеазы и/или донорную матрицу репарации, вводят в гемопоэтическую клетку путем трансдукции клетки вирусом простого герпеса, например, HSV-1, HSV-2, содержащим один или более полинуклеотидов.In various embodiments, one or more polynucleotides encoding a nuclease variant and/or a repair donor template are introduced into a hematopoietic cell by transducing the cell with a herpes simplex virus, e.g., HSV-1, HSV-2, containing one or more polynucleotides.

Зрелый вирион HSV состоит из оболочечного икосаэдрического капсида с вирусным геномом, состоящим из линейной двухцепочечной молекулы ДНК размером 152 т.п.н. В одном варианте реализации вирусный вектор на основе HSV является дефицитным по одному или нескольким основным или второстепенным генам HSV. В одном варианте реализации вирусный вектор на основе HSV является дефектным по репликации. Большинство дефектных по репликации векторов HSV содержат делецию одного или нескольких промежуточно-ранних, ранних или поздних генов HSV для предотвращения репликации. Например, вектор HSV может быть дефектным по немедленно раннему гену, выбранному из группы, состоящей из: ICP4, ICP22, ICP27, ICP47 и их комбинации. Преимущества вектора HSV заключаются в его способности входить в латентную стадию, которая может привести к длительной экспрессии ДНК, и в его большом вирусном ДНК-геном, который может вмещать экзогенные вставки ДНК размером до 25 т.п.н. Векторы на основе HSV описаны, например, в патентах США. №№5837532, 5846782 и 5844513, а также в международных заявках на патент WO 91/02788, WO 96/04394, WO 98/15637 и WO 99/06583, каждая из которых полностью включена в настоящее описание посредством ссылки.The mature HSV virion consists of an enveloped icosahedral capsid with a viral genome consisting of a 152 kb linear double-stranded DNA molecule. In one embodiment, the HSV viral vector is deficient in one or more major or minor HSV genes. In one embodiment, the HSV-based viral vector is replication defective. Most replication-defective HSV vectors contain a deletion of one or more intermediate-early, early, or late HSV genes to prevent replication. For example, the HSV vector may be defective in an immediate early gene selected from the group consisting of: ICP4, ICP22, ICP27, ICP47, and combinations thereof. The advantages of the HSV vector are its ability to enter a latent stage, which can lead to long-term DNA expression, and its large viral DNA genome, which can accommodate exogenous DNA inserts up to 25 kb. HSV-based vectors are described, for example, in US patents. Nos. 5837532, 5846782 and 5844513, as well as in international patent applications WO 91/02788, WO 96/04394, WO 98/15637 and WO 99/06583, each of which is fully incorporated into this description by reference.

F. Клетки с отредактированным геномомF. Genome-edited cells

Клетки с отредактированным геномом, полученные способами, предусмотренными в частных вариантах реализации, содержат одну или более генных модификаций в гене PD-1 и позволяют создать улучшенные клеточные терапевтические средства для профилактики, лечения или ослабления по меньшей мере одного симптома рака, БТПХ, инфекционного заболевания, аутоиммунного заболевания, иммунодефицита или состояния ассоциированных с ними. Без привязки к какой-либо конкретной теории, мы полагаем, что композиции и способы, рассматриваемые в настоящей заявке, повышают эффективность адоптивной клеточной терапии, в частности, делая терапевтические клетки более устойчивыми к иммуносупрессивным сигналам и истощению.Genome-edited cells obtained by methods provided in private embodiments contain one or more gene modifications in the PD-1 gene and allow the creation of improved cellular therapeutics for the prevention, treatment, or amelioration of at least one symptom of cancer, GVHD, infectious disease, autoimmune disease, immunodeficiency or a condition associated with them. Without being bound by any particular theory, we believe that the compositions and methods discussed in this application increase the effectiveness of adoptive cell therapy, in particular, making therapeutic cells more resistant to immunosuppressive signals and depletion.

Клетки с отредактированным геномом, рассматриваемые в частных вариантах реализации могут быть аутологичными/аутогенными («собственными») или неаутологичными («не-собственными», например, аллогенными, сингенными или ксеногенными). Термин «аутологичный» в настоящей заявке относится к клеткам от одного и того же субъекта. Термин «аллогенный», в настоящей заявке, относится к клеткам одного и того же биологического вида, которые генетически отличаются от сравниваемой клетки. Термин «сингенный» в настоящей заявке относится к клеткам другого субъекта, которые генетически идентичны сравниваемой клетке. Термин «ксеногенный», в настоящей заявке, относится к клеткам другого вида по сравнению со сравниваемой клеткой. В предпочтительных вариантах реализации клетки получают от субъекта-млекопитающего. В более предпочтительном варианте реализации клетки получают от субъекта-примата, необязательно - примата, не являющегося человеком. В наиболее предпочтительном варианте реализации клетки получают от человека.Genome-edited cells considered in particular embodiments may be autologous/autologous ("self") or non-autologous ("non-self", eg, allogeneic, syngeneic, or xenogeneic). The term "autologous" in this application refers to cells from the same subject. The term "allogeneic", as used herein, refers to cells of the same species that are genetically different from the cell being compared. The term "syngeneic" in this application refers to cells of another subject that are genetically identical to the compared cell. The term "xenogenic", in this application, refers to cells of a different kind compared to the compared cell. In preferred embodiments, the cells are obtained from a mammalian subject. In a more preferred embodiment, the cells are obtained from a primate subject, optionally a non-human primate. In the most preferred embodiment, the cells are obtained from a human.

Термин «изолированная клетка» относится к не встречающейся в природе клетке, например клетке, которая не существует в природе, модифицированной клетке, сконструированной клетке, рекомбинантной клетке и т.д., которая была получена из ткани или органа in vivo и по существу не содержит внеклеточного матрикса.The term "isolated cell" refers to a non-naturally occurring cell, such as a cell that does not exist in nature, a modified cell, an engineered cell, a recombinant cell, etc., that has been obtained from a tissue or organ in vivo and is substantially free of extracellular matrix.

Используемый в настоящей заявке термин «популяция клеток» относится к множеству клеток, которые могут состоять из любого числа и/или комбинации гомогенных или гетерогенных типов клеток, как описано в другом месте в настоящей заявке. Например, для трансдукции Т-клеток популяция клеток может быть выделена или получена из периферической крови. Популяция клеток может содержать приблизительно 10%, приблизительно 20%, приблизительно 30%, приблизительно 40%, приблизительно 50%, приблизительно 60%, приблизительно 70%, приблизительно 80%, приблизительно 90% или приблизительно 100% типа клеток-мишеней для редактирования. В некоторых вариантах реализации Т-клетки могут быть выделены или очищены из популяции гетерогенных клеток с использованием способов, известных в данной области.Used in this application, the term "cell population" refers to a set of cells, which may consist of any number and/or combination of homogeneous or heterogeneous cell types, as described elsewhere in this application. For example, for transduction of T cells, a population of cells can be isolated or obtained from peripheral blood. The cell population may contain about 10%, about 20%, about 30%, about 40%, about 50%, about 60%, about 70%, about 80%, about 90%, or about 100% of the target cell type for editing. In some embodiments, T cells can be isolated or purified from a population of heterogeneous cells using methods known in the art.

Иллюстративные примеры типов клеток, геном которых можно редактировать с использованием композиций и способов, предусмотренных в настоящей заявке, включают, среди прочего, клеточные линии, первичные клетки, стволовые клетки, клетки-предшественники и дифференцированные клетки и их смеси.Illustrative examples of cell types whose genome can be edited using the compositions and methods provided in this application include, among others, cell lines, primary cells, stem cells, progenitor cells and differentiated cells, and mixtures thereof.

В предпочтительном варианте реализации композиции и способы редактирования генома используются для редактирования гемопоэтических клеток, более предпочтительно иммунных клеток и еще более предпочтительно Т-клеток.In a preferred embodiment, genome editing compositions and methods are used to edit hematopoietic cells, more preferably immune cells, and even more preferably T cells.

Термины «Т-клетка» или «Т-лимфоцит» признаны в данной области и включают тимоциты, иммунные эффекторные клетки, регуляторные Т-клетки, наивные Т-лимфоциты, незрелые Т-лимфоциты, зрелые Т-лимфоциты, покоящиеся Т-лимфоциты или активированные Т-лимфоциты. Т-клетка может быть T-хелпером (Th), например T-хелпером 1 (Th1) или T-хелпером 2 (Th2). Т-клетка может быть хелперной T-клеткой (HTL; CD4+T-клеткой) CD4+T-клеткой, цитотоксической T-клеткой (CTL; CD8+T-клеткой), инфильтрирующей опухоль цитотоксической T-клеткой (TIL; CD8+T-клеткой), CD4+CD8+T клеткой, CD4- CD8- Т- клеткой или любой другой подгруппой Т-клеток. В одном варианте реализации Т-клетка представляет собой иммунную эффекторную клетку. В одном варианте реализации Т-клетка представляет собой NKT-клетку. Другие иллюстративные популяции Т-клеток, подходящие для использования в частных вариантах реализации, включают наивные Т-клетки и Т-клетки памяти.The terms "T cell" or "T lymphocyte" are recognized in the art and include thymocytes, immune effector cells, regulatory T cells, naive T lymphocytes, immature T lymphocytes, mature T lymphocytes, resting T lymphocytes, or activated T-lymphocytes. The T cell may be a T helper (Th), such as T helper 1 (Th1) or T helper 2 (Th2). The T cell may be a helper T cell (HTL; CD4+T cell) CD4+T cell, cytotoxic T cell (CTL; CD8+T-cell) infiltrating the tumor with a cytotoxic T-cell (TIL; CD8+T cell), CD4+CD8+T cell, CD4-CD8- T cell or any other subgroup of T cells. In one embodiment, the T cell is an immune effector cell. In one embodiment, the T cell is a NKT cell. Other exemplary T cell populations suitable for use in particular embodiments include naive T cells and memory T cells.

В различных вариантах реализации клетки с отредактированным геномом содержат иммунные эффекторные клетки, содержащие ген PD-1, отредактированный композициями и способами, предусмотренными в настоящей заявке. «Иммунная эффекторная клетка» представляет собой любую клетку иммунной системы, которая выполняет одну или более эффекторных функций (например, цитотоксическая активность по уничтожению клеток, секреция цитокинов, индукция ADCC и/или CDC). Иллюстративные иммунные эффекторные клетки, рассматриваемые в частных вариантах реализации представляют собой T-лимфоциты, в частности цитотоксические T-клетки (CTL; CD8+T-клетки), TIL и хелперные T-клетки (HTL; CD4+T-клетки). В одном варианте реализации иммунные эффекторные клетки включают клетки природные киллеры (NK). В одном варианте реализации иммунные эффекторные клетки включают Т клетки-природные киллеры (NKT).In various embodiments, the genome-edited cells comprise immune effector cells containing the PD-1 gene edited by the compositions and methods provided herein. An "immune effector cell" is any cell of the immune system that performs one or more effector functions (eg, cytotoxic cell killing activity, secretion of cytokines, induction of ADCC and/or CDC). Exemplary immune effector cells contemplated in particular embodiments are T lymphocytes, specifically cytotoxic T cells (CTL; CD8 + T cells), TILs, and helper T cells (HTL; CD4 + T cells). In one embodiment, the immune effector cells include natural killer (NK) cells. In one embodiment, the immune effector cells include natural killer T cells (NKT).

«Активные Т-клетки» и «молодые Т-клетки» используются взаимозаменяемо в частных вариантах реализации и относятся к фенотипам Т-клеток, когда Т-клетка способна к пролиферации и сопутствующему снижению дифференцировки. В частных вариантах реализации молодая Т-клетка имеет фенотип «наивной Т-клетки». В частных вариантах реализации молодые Т-клетки содержат один или более из или все из следующих биологических маркеров: CD62L, CCR7, CD28, CD27, CD122, CD127, CD197 и CD38. В одном варианте реализации молодые Т-клетки содержат один или более или все из следующих биологических маркеров: CD62L, CD127, CD197 и CD38. В одном варианте реализации молодые Т-клетки лишены экспрессии CD57, CD244, CD160, PD-1, CTLA4, PD-1 и LAG3."Active T cells" and "young T cells" are used interchangeably in particular embodiments and refer to T cell phenotypes where the T cell is capable of proliferating and concomitantly decreasing differentiation. In particular embodiments, the young T cell has a "naive T cell" phenotype. In particular embodiments, young T cells contain one or more or all of the following biological markers: CD62L, CCR7, CD28, CD27, CD122, CD127, CD197, and CD38. In one embodiment, young T cells contain one or more or all of the following biological markers: CD62L, CD127, CD197, and CD38. In one embodiment, young T cells lack the expression of CD57, CD244, CD160, PD-1, CTLA4, PD-1, and LAG3.

Т-клетки могут быть получены из ряда источников, включая, среди прочего, мононуклеарные клетки периферической крови, костный мозг, ткань лимфатических узлов, пуповинную кровь, тимус, ткани из места инфекции, асцит, плевральный выпот, ткань селезенки и опухоли.T cells can be obtained from a number of sources including, but not limited to, peripheral blood mononuclear cells, bone marrow, lymph node tissue, cord blood, thymus, tissue from the site of infection, ascites, pleural effusion, spleen tissue, and tumors.

В частных вариантах реализации популяция клеток, включающая иммунные эффекторные клетки или Т-клетки, содержит отредактированный ген PD-1, где редактирование представляет собой DSB, репарированный с помощью NHEJ. В частных вариантах реализации иммунная эффекторная клетка или Т-клетка содержит отредактированный ген PD-1, где редактирование представляет собой DSB, репарированный NHEJ. В частных вариантах реализации редактирование представляет собой инсерцию или делецию (INDEL) приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 15, 16, 17, 18., 19, 20, 21, 22, 23, 24, 25 или более нуклеотидов в кодирующей последовательности гена PD-1, предпочтительно в экзоне 5, экзоне 1 или экзоне 2 гена PD-1, более предпочтительно в SEQ ID NO: 25 (или SEQ ID NO: 27) в экзоне 5 гена PD-1, в SEQ ID NO: 30 (или SEQ ID NO: 32) в экзоне 1 гена PD-1 или в SEQ ID NO: 35 (или SEQ ID NO: 37) в экзоне 2 гена PD-1.In particular embodiments, the cell population, including immune effector cells or T cells, contains an edited PD-1 gene, where the edit is DSB repaired with NHEJ. In particular embodiments, the immune effector cell or T cell contains an edited PD-1 gene, where the edit is DSB repaired by NHEJ. In particular implementations, the edit is an insertion or deletion (INDEL) of approximately 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 15, 16, 17, 18., 19, 20, 21, 22, 23, 24, 25 or more nucleotides in the PD-1 gene coding sequence, preferably in exon 5, exon 1 or exon 2 of the PD-1 gene, more preferably in SEQ ID NO: 25 (or SEQ ID NO: 27) in exon 5 of the PD-1 gene, in SEQ ID NO: 30 (or SEQ ID NO: 32) in exon 1 of the PD-1 gene, or in SEQ ID NO: 35 (or SEQ ID NO: 37) in exon 2 of the PD-1 gene.

В частном варианте реализации редактирование представляет собой делецию+1, -1, -2, -3 или -4 нуклеотидов в кодирующей последовательности гена PD-1, предпочтительно в экзоне 5, экзоне 1 или экзоне 2 ген PD-1, более предпочтительно в SEQ ID NO: 25 (или SEQ ID NO: 27) в экзоне 5 гена PD-1, в SEQ ID NO: 30 (или SEQ ID NO: 32) в экзоне 1 ген PD-1 или SEQ ID NO: 35 (или SEQ ID NO: 37) в экзоне 2 гена PD-1.In a particular embodiment, the edit is a deletion of +1, -1, -2, -3 or -4 nucleotides in the coding sequence of the PD-1 gene, preferably in exon 5, exon 1 or exon 2 of the PD-1 gene, more preferably in SEQ ID NO: 25 (or SEQ ID NO: 27) in exon 5 of the PD-1 gene, in SEQ ID NO: 30 (or SEQ ID NO: 32) in exon 1 of the PD-1 gene, or SEQ ID NO: 35 (or SEQ ID NO: 37) in exon 2 of the PD-1 gene.

В частных вариантах реализации популяция клеток, включающая иммунные эффекторные клетки или Т-клетки, содержит отредактированный ген PD-1, содержащий донорную матрицу репарации, встроенную в DSB, репарированный HDR.In particular embodiments, the cell population, including immune effector cells or T cells, contains an edited PD-1 gene containing a repair donor template inserted into a DSB, a repaired HDR.

В частных вариантах реализации популяция клеток, включающая иммунные эффекторные клетки или Т-клетки, содержит отредактированный ген PD-1, содержащий донорную матрицу репарации, содержащую ген PD-1 или его часть, и предназначена для введения одной или нескольких мутаций в геномную PD-1 последовательность с целью изменения экспрессии или передачи сигналов PD-1 и, предпочтительно, для уменьшения или устранения экспрессии и/или передачи сигналов PD-1.In particular embodiments, the cell population, including immune effector cells or T cells, contains an edited PD-1 gene containing a donor repair template containing the PD-1 gene or a portion thereof, and is designed to introduce one or more mutations into genomic PD-1 a sequence to alter PD-1 expression or signaling, and preferably to reduce or eliminate PD-1 expression and/or signaling.

В различных вариантах реализации клетка с отредактированным геномом содержит редактирование в гене PD-1 и дополнительно содержит полинуклеотид, кодирующий флип-рецептор PD-1, молекулу биспецифического Т-клеточного активатора (BiTE); цитокин (например, IL-2, инсулин, IFN-γ, IL-7, IL-21, IL-10, IL-12, IL-15 и TNF-α), хемокин (например, MIP-1α, MIP-1β, MCP-1, MCP-3 и RANTES), цитотоксин (например, перфорин, гранзим A и гранзим B), рецептор цитокинов (например, рецептор IL-2, рецептор IL-7, Рецептор IL-12, рецептор IL-15 и рецептор IL-21) или сконструированный антигенный рецептор (например, сконструированный T-клеточный рецептор (TCR), химерный антигенный рецептор (CAR), рецептор Daric или его компоненты, или химерный цитокиновый рецептор). В одном варианте реализации в клетку встраивают донорную матрицу репарации, содержащую полинуклеотид и вариант нуклеазы, и полинуклеотид встраивают в геном клетки в сайте DSB в гене PD-1 посредством HDR-репарации. Полинуклеотид также может быть введен в клетку в сайте, отличном от гена PD-1, например, путем трансдукции клетки вектором, содержащим полинуклеотид.In various embodiments, the genome-edited cell comprises an edit in the PD-1 gene and further comprises a polynucleotide encoding the PD-1 flip receptor, a bispecific T cell activator (BiTE) molecule; cytokine (eg IL-2, insulin, IFN-γ, IL-7, IL-21, IL-10, IL-12, IL-15 and TNF-α), chemokine (eg MIP-1α, MIP-1β , MCP-1, MCP-3, and RANTES), a cytotoxin (eg, perforin, granzyme A, and granzyme B), a cytokine receptor (eg, IL-2 receptor, IL-7 receptor, IL-12 receptor, IL-15 receptor, and IL-21 receptor) or an engineered antigen receptor (eg, engineered T cell receptor (TCR), chimeric antigen receptor (CAR), Daric receptor or components thereof, or chimeric cytokine receptor). In one embodiment, a repair donor template containing a polynucleotide and a nuclease variant is inserted into the cell, and the polynucleotide is inserted into the cell's genome at the DSB site in the PD-1 gene by HDR repair. The polynucleotide can also be introduced into the cell at a site other than the PD-1 gene, for example by transducing the cell with a vector containing the polynucleotide.

G. Композиции и составыG. Compositions and formulations

Композиции, рассматриваемые в частных вариантах реализации могут содержать один или более полипептидов, полинуклеотидов, векторов, содержащих их, а также композиции для редактирования генома и композиции с клеткой с отредактированным геномом, как предусмотрено в настоящей заявке. Композиции и способы редактирования генома, рассматриваемые в частных вариантах реализации полезны для редактирования сайта-мишени в гене человеческой запрограммированной клеточной гибели 1 (PD-1) в клетке или популяции клеток. В предпочтительных вариантах реализации композицию для редактирования генома используют для редактирования гена PD-1 в гемопоэтической клетке, например, Т-клетке или иммунной эффекторной клетке.Compositions contemplated in particular embodiments may comprise one or more polypeptides, polynucleotides, vectors containing them, as well as compositions for editing the genome and compositions with a genome-edited cell, as provided in this application. Genome editing compositions and methods contemplated in particular embodiments are useful for editing a target site in the human programmed cell death 1 (PD-1) gene in a cell or population of cells. In preferred embodiments, the genome editing composition is used to edit the PD-1 gene in a hematopoietic cell, such as a T cell or an immune effector cell.

В различных вариантах реализации рассматриваемые в настоящей заявке композиции содержат вариант нуклеазы и, необязательно, фермент, изменяющий структуру концов, например, 3'-5' экзонуклеазу (Trex2). Вариант нуклеазы может быть в форме мРНК, которая вводится в клетку с помощью способов доставки полинуклеотидов, описанных выше, например, электропорации, липидных наночастиц и т.д. В одном варианте реализации композицию, содержащую мРНК, кодирующую вариант хоминг-эндонуклеазы или megaTAL. и, необязательно, 3'-5' экзонуклеазу, вводят в клетку с помощью способов доставки полинуклеотидов, описанных выше. Такая композиция может быть использована для создания клетки с отредактированным геномом или популяции клеток с отредактированным геномом клетку с помощью допускающего ошибки NHEJ.In various embodiments, the compositions contemplated herein comprise a variant nuclease and optionally an end-reshaping enzyme, such as 3'-5' exonuclease (Trex2). The nuclease variant may be in the form of an mRNA that is introduced into the cell using the polynucleotide delivery methods described above, eg, electroporation, lipid nanoparticles, etc. In one embodiment, a composition comprising mRNA encoding a homing endonuclease or megaTAL variant. and optionally a 3'-5' exonuclease is introduced into the cell using the polynucleotide delivery methods described above. Such a composition can be used to create a genome-edited cell or population of genome-edited cells using error-prone NHEJ.

В различных вариантах реализации рассматриваемые в настоящей заявке композиции содержат донорную матрицу репарации. Композиция может быть доставлена в клетку, которая экспрессирует или будет экспрессировать вариант нуклеазы, и, необязательно, фермент, изменяющий структуру концов. В одном варианте реализации композиция может быть доставлена в клетку, которая экспрессирует или будет экспрессировать вариант хоминг-эндонуклеазы или megaTAL и, необязательно, экзонуклеазу 3'-5'. Для создания клетки с отредактированным геномом или популяции клеток с отредактированным геномом может быть использована экспрессия редактирующих ген ферментов в присутствии донорной матрицы репарации методом HDR.In various embodiments, the compositions contemplated herein comprise a repair donor matrix. The composition can be delivered to a cell that expresses or will express a variant nuclease, and optionally an end-reversing enzyme. In one embodiment, the composition can be delivered to a cell that expresses or will express a variant homing endonuclease or megaTAL and optionally a 3'-5' exonuclease. To create a genome-edited cell or population of genome-edited cells, the expression of gene-editing enzymes in the presence of a donor repair template by HDR can be used.

В частных вариантах реализации рассматриваемые в настоящей заявке композиции содержат популяцию клеток, вариант нуклеазы и, необязательно, донорную матрицу репарации. В частных вариантах реализации композиции, рассматриваемые в настоящей заявке, содержат популяцию клеток, вариант нуклеазы, фермент, изменяющий структуру концов и, необязательно, донорную матрицу репарации. Вариант нуклеазы и/или фермент, изменяющий структуру концов, может быть в форме мРНК, которая введена в клетку с помощью способов доставки полинуклеотидов, описанных выше.In particular embodiments, the compositions contemplated herein comprise a population of cells, a nuclease variant, and, optionally, a repair donor template. In private embodiments, the compositions contemplated in this application contain a population of cells, a variant nuclease, an enzyme that changes the structure of the ends and, optionally, a repair donor template. The nuclease variant and/or end-reversing enzyme may be in the form of mRNA that is introduced into the cell using the polynucleotide delivery methods described above.

В частных вариантах реализации рассматриваемые в настоящей заявке композиции содержат популяцию клеток, вариант хоминг-эндонуклеазы или megaTAL и, необязательно, донорную матрицу репарации. В частных вариантах реализации рассматриваемые в настоящей заявке композиции содержат популяцию клеток, вариант хоминг-эндонуклеазы или megaTAL, экзонуклеазу 3'-5' и, необязательно, донорную матрицу репарации. Вариант хоминг-эндонуклеазы, megaTAL и/или 3'-5' экзонуклеаза может быть в форме мРНК, которая введена в клетку с помощью способов доставки полинуклеотидов, описанных выше.In particular embodiments, the compositions contemplated herein comprise a population of cells, a homing endonuclease or megaTAL variant, and optionally a repair donor template. In particular embodiments, the compositions contemplated herein comprise a population of cells, a homing endonuclease or megaTAL variant, a 3'-5' exonuclease, and optionally a repair donor template. The homing endonuclease, megaTAL and/or 3'-5' exonuclease variant may be in the form of mRNA that is introduced into the cell using the polynucleotide delivery methods described above.

В частных вариантах реализации популяция клеток содержит генетически модифицированные иммунные эффекторные клетки.In private embodiments, the cell population contains genetically modified immune effector cells.

Композиции включают, среди прочего, фармацевтические композиции. «Фармацевтическая композиция» относится к композиции, составленной в виде фармацевтически приемлемых или физиологически приемлемых растворов для введения в клетку или животному, либо отдельно, либо в комбинации с одним или несколькими другими видами терапии. Также следует понимать, что при желании композиции можно вводить в комбинации с другими агентами, такими как, например, цитокины, факторы роста, гормоны, малые молекулы, химиотерапевтические средства, пролекарства, лекарства, антитела или другие. различные фармацевтически активные вещества. Для других компонентов, которые также могут быть включены в композиции, практически нет ограничений при условии, что дополнительные агенты не оказывают вредного влияния на композицию.Compositions include, inter alia, pharmaceutical compositions. "Pharmaceutical composition" refers to a composition formulated as pharmaceutically acceptable or physiologically acceptable solutions for administration to a cell or animal, either alone or in combination with one or more other therapies. It should also be understood that, if desired, the compositions may be administered in combination with other agents such as, for example, cytokines, growth factors, hormones, small molecules, chemotherapeutic agents, prodrugs, drugs, antibodies, or others. various pharmaceutically active substances. For other components that can also be included in the compositions, there are practically no restrictions, provided that additional agents do not adversely affect the composition.

Фраза «фармацевтически приемлемый» используется в настоящей заявке для обозначения тех соединений, материалов, композиций и/или дозированных форм, которые в рамках здравого медицинского суждения подходят для использования в контакте с тканями людей и животных без чрезмерной токсичности, раздражения, аллергического ответа или других проблем или осложнений, соизмеримых с разумным соотношением пользы/риска.The phrase "pharmaceutically acceptable" is used in this application to refer to those compounds, materials, compositions and/or dosage forms that, within the framework of sound medical judgment, are suitable for use in contact with human and animal tissues without undue toxicity, irritation, allergic response, or other problems. or complications commensurate with a reasonable benefit/risk ratio.

Термин «фармацевтически приемлемый носитель» относится к разбавителю, адъюванту, вспомогательному веществу или носителю, с которым вводят терапевтические клетки. Иллюстративными примерами фармацевтических носителей могут быть стерильные жидкости, такие как среды для культивирования клеток, вода и масла, включая масла нефтяного, животного, растительного или синтетического происхождения, такие как арахисовое масло, соевое масло, минеральное масло, кунжутное масло и тому подобное. Солевые растворы и водные растворы декстрозы и глицерина также могут быть использованы в качестве жидких носителей, особенно для инъекционных растворов. Подходящие фармацевтические вспомогательные вещества в частных вариантах реализации включают крахмал, глюкозу, лактозу, сахарозу, желатин, солод, рис, муку, мел, силикагель, стеарат натрия, моностеарат глицерина, тальк, хлорид натрия, сухое обезжиренное молоко, глицерин, пропилен, гликоль, воду, этанол и тому подобное. За исключением случаев, когда какой-либо обычный носитель или агент несовместим с активным ингредиентом, предполагается его использование в таких терапевтических композициях. В композиции также могут быть включены дополнительные активные ингредиенты.The term "pharmaceutically acceptable carrier" refers to a diluent, adjuvant, excipient or carrier with which therapeutic cells are administered. Illustrative examples of pharmaceutical carriers can be sterile liquids such as cell culture media, water, and oils, including oils of petroleum, animal, vegetable, or synthetic origin, such as peanut oil, soybean oil, mineral oil, sesame oil, and the like. Saline solutions and aqueous solutions of dextrose and glycerol can also be used as liquid carriers, especially for injectable solutions. Suitable pharmaceutical excipients in particular embodiments include starch, glucose, lactose, sucrose, gelatin, malt, rice, flour, chalk, silica gel, sodium stearate, glycerol monostearate, talc, sodium chloride, skimmed milk powder, glycerin, propylene, glycol, water, ethanol and the like. Unless any conventional carrier or agent is incompatible with the active ingredient, its use in such therapeutic compositions is contemplated. Additional active ingredients may also be included in the compositions.

В одном варианте реализации композиция, содержащая фармацевтически приемлемый носитель, является пригодной для введения субъекту. В частных вариантах реализации композиция, содержащая носитель, пригодна для парентерального введения, например, внутрисосудистого (внутривенного или внутриартериального), внутрибрюшинного или внутримышечного введения. В частных вариантах реализации композиция, содержащая фармацевтически приемлемый носитель, пригодна для внутрижелудочкового, интраспинального или интратекального введения. Фармацевтически приемлемые носители включают стерильные водные растворы, среды для культивирования клеток или дисперсии. Использование таких сред и агентов для фармацевтически активных веществ хорошо известно в данной области. За исключением случаев, когда какой-либо обычный носитель или агент несовместим с трансдуцированными клетками, предполагается его применение в таких фармацевтических композициях.In one embodiment, a composition containing a pharmaceutically acceptable carrier is suitable for administration to a subject. In private embodiments, the composition containing the carrier is suitable for parenteral administration, for example, intravascular (intravenous or intra-arterial), intraperitoneal or intramuscular administration. In private embodiments, the composition containing a pharmaceutically acceptable carrier is suitable for intraventricular, intraspinal, or intrathecal administration. Pharmaceutically acceptable carriers include sterile aqueous solutions, cell culture media or dispersions. The use of such media and agents for pharmaceutically active substances is well known in the art. Unless any conventional carrier or agent is incompatible with the transduced cells, its use in such pharmaceutical compositions is contemplated.

В частных вариантах реализации композиции, рассматриваемые в настоящей заявке, содержат генетически модифицированные Т-клетки и фармацевтически приемлемый носитель. Композицию, содержащую композицию на основе клеток, рассматриваемая в настоящей заявке, можно вводить отдельно посредством энтерального или парентерального способов введения или в комбинации с другими подходящими соединениями для достижения желаемых целей лечения.In private embodiments, the compositions discussed in this application contain genetically modified T cells and a pharmaceutically acceptable carrier. The composition containing the composition based on the cells considered in this application, you can enter alone by enteral or parenteral routes of administration or in combination with other suitable compounds to achieve the desired goals of treatment.

Фармацевтически приемлемый носитель должен иметь достаточно высокую чистоту и достаточно низкую токсичность, чтобы быть пригодным для введения человеку, подвергаемому лечению. Кроме того, он должен поддерживать или увеличивать стабильность композиции. Фармацевтически приемлемый носитель может быть жидким или твердым, и его выбирают с учетом планируемого способа введения для обеспечения желаемой массы, консистенции и т.д. при сочетании с другими компонентами композиции. Например, фармацевтически приемлемым носителем может быть без ограничения связующий агент (например, предварительно желатинизированный кукурузный крахмал, поливинилпирролидон или гидроксипропилметилцеллюлоза и др.), наполнитель (например, лактоза и другие сахара, микрокристаллическая целлюлоза, пектин, желатин, сульфат кальция, этилцеллюлоза, полиакрилаты, гидрофосфат кальция и др.), скользящее вещество (например, стеарат магния, тальк, диоксид кремния, коллоидный диоксид кремния, стеариновая кислота, стеараты металлов, гидрогенизированные растительные масла, кукурузный крахмал, полиэтиленгликоли, бензоат натрия, ацетат натрия и т.д.), дезинтегрант (например, крахмал крахмалгликолят натрия и т.д.) или смачивающий агент (например, лаурилсульфат натрия и т.д.). Другие подходящие фармацевтически приемлемые носители для рассматриваемых в настоящей заявке композиций включают, среди прочего, воду, солевые растворы, спирты, полиэтиленгликоли, желатины, амилозы, стеараты магния, тальки, кремниевые кислоты, вязкие парафины, гидроксиметилцеллюлозы, поливинилпирролидоны и тому подобное.The pharmaceutically acceptable carrier must be of sufficiently high purity and low enough toxicity to be suitable for administration to the person being treated. In addition, it must maintain or increase the stability of the composition. The pharmaceutically acceptable carrier may be liquid or solid and is selected with regard to the intended route of administration to provide the desired weight, consistency, etc. when combined with other components of the composition. For example, a pharmaceutically acceptable carrier may include, but is not limited to, a binding agent (for example, pregelatinized corn starch, polyvinylpyrrolidone or hydroxypropyl methylcellulose, etc.), a bulking agent (for example, lactose and other sugars, microcrystalline cellulose, pectin, gelatin, calcium sulfate, ethyl cellulose, polyacrylates, calcium hydrogen phosphate, etc.), lubricant (e.g. magnesium stearate, talc, silicon dioxide, colloidal silicon dioxide, stearic acid, metal stearates, hydrogenated vegetable oils, corn starch, polyethylene glycols, sodium benzoate, sodium acetate, etc.) , a disintegrant (eg, sodium starch glycolate, etc.) or a wetting agent (eg, sodium lauryl sulfate, etc.). Other suitable pharmaceutically acceptable carriers for the compositions herein include, inter alia, water, saline solutions, alcohols, polyethylene glycols, gelatins, amyloses, magnesium stearates, talcs, silicic acids, viscous paraffins, hydroxymethylcelluloses, polyvinyl pyrrolidones, and the like.

Такие растворы-носители также могут содержать буферы, разбавители и другие подходящие добавки. Используемый в настоящей заявке термин «буфер» относится к раствору или жидкости, химический состав которых нейтрализует кислоты или основания без значительного изменения pH. Примеры буферов, рассматриваемых в настоящей заявке, включают, среди прочего, забуференный фосфатом физиологический раствор (PBS) Дульбекко, раствор Рингера, 5% декстрозу в воде (D5W), нормальный/физиологический солевой раствор (0,9% NaCl).Such carrier solutions may also contain buffers, diluents and other suitable additives. Used in this application, the term "buffer" refers to a solution or liquid, the chemical composition of which neutralizes acids or bases without a significant change in pH. Examples of buffers contemplated herein include Dulbecco's phosphate buffered saline (PBS), Ringer's solution, 5% dextrose in water (D5W), normal/physiological saline (0.9% NaCl), among others.

Фармацевтически приемлемые носители могут присутствовать в количествах, достаточных для поддержания рН композиции приблизительно 7. В альтернативном варианте композиция имеет рН в диапазоне от приблизительно 6,8 до приблизительно 7,4, например, 6,8, 6,9, 7,0, 7,1, 7,2. 7.3 и 7.4. В еще одном варианте реализации композиция имеет рН приблизительно 7,4.Pharmaceutically acceptable carriers may be present in amounts sufficient to maintain the pH of the composition at about 7. Alternatively, the composition has a pH in the range of about 6.8 to about 7.4, such as 6.8, 6.9, 7.0, 7 ,1, 7,2. 7.3 and 7.4. In yet another embodiment, the composition has a pH of about 7.4.

Композиции, рассматриваемые в настоящей заявке, могут содержать нетоксичную фармацевтически приемлемую среду. Композиции могут быть суспензией. Используемый в настоящей заявке термин «суспензия» относится к условиям без слипания, в которых клетки не прикреплены к твердой подложке. Например, клетки, поддерживаемые в виде суспензии, можно взбалтывать или перемешивать без прилипания к подложке, такой как культуральная чашка.The compositions contemplated in this application may contain a non-toxic pharmaceutically acceptable environment. The compositions may be a suspension. Used in this application, the term "suspension" refers to conditions without sticking, in which the cells are not attached to a solid substrate. For example, cells maintained in suspension can be agitated or agitated without sticking to a support such as a culture dish.

В частных вариантах реализации композиции, рассматриваемые в настоящей заявке, составлены в виде суспензии, в которой Т-клетки с отредактированным геномом диспергированы в приемлемой жидкой среде или растворе, например, в солевой или бессывороточной среде, в пакете для внутривенного (IV) вливания или тому подобном. Приемлемые разбавители включают, среди прочего, воду, PlasmaLyte, раствор Рингера, изотонический раствор хлорида натрия (физиологический раствор), бессывороточную среду для культивирования клеток и среду, пригодную для криогенного хранения, например, среду Cryostor®.In particular embodiments, the compositions contemplated herein are formulated as a suspension in which genome-edited T cells are dispersed in an acceptable liquid medium or solution, such as saline or serum-free medium, in an intravenous (IV) infusion bag, or the like. similar. Suitable diluents include, among others, water, PlasmaLyte, Ringer's solution, isotonic sodium chloride solution (saline), serum-free cell culture medium, and cryogenic storage medium such as Cryostor® medium.

В некоторых вариантах реализации фармацевтически приемлемый носитель по существу не содержит природных белков человеческого или животного происхождения и пригоден для хранения композиции, содержащей популяцию Т-клеток с отредактированным геномом. Терапевтическая композиция предназначена для введения пациенту-человеку и, поэтому, по существу не содержит компонентов клеточной культуры, таких как бычий сывороточный альбумин, конская сыворотка и фетальная бычья сыворотка.In some embodiments, the pharmaceutically acceptable carrier is substantially free of naturally occurring proteins of human or animal origin and is suitable for holding a composition containing a population of genome-edited T cells. The therapeutic composition is intended to be administered to a human patient and is therefore substantially free of cell culture components such as bovine serum albumin, equine serum and fetal bovine serum.

В некоторых вариантах реализации композиции составлены в фармацевтически приемлемой среде для культивирования клеток. Такие композиции пригодны для введения субъектам-людям. В частных вариантах реализации фармацевтически приемлемая среда для культивирования клеток представляет собой бессывороточную среду.In some embodiments, the compositions are formulated in a pharmaceutically acceptable cell culture medium. Such compositions are suitable for administration to human subjects. In particular embodiments, the pharmaceutically acceptable cell culture medium is a serum-free medium.

Среда, не содержащая сыворотки, имеет несколько преимуществ перед средой, содержащей сыворотку, включая упрощенный и более четко определенный состав, меньшую степень загрязнения, устранение потенциального источника инфекционных агентов и более низкую стоимость. В различных вариантах реализации бессывороточная среда является не содержащей компонентов животного происхождения и необязательно безбелковой. Необязательно, среда может содержать биофармацевтически приемлемые рекомбинантные белки. Термин «не содержащая компонентов животного происхождения» среда относится к среде, в которой компоненты получены из не животных источников. В среде без компонентов животного происхождения рекомбинантные белки заменяют нативные животные белки, а питательные вещества получают из синтетических, растительных или микробных источников. «Безбелковая» среда, напротив, определяется как по существу не содержащая белка.Serum-free media has several advantages over serum-containing media, including simplified and more well-defined composition, less contamination, elimination of a potential source of infectious agents, and lower cost. In various embodiments, the serum-free medium is animal-free and optionally protein-free. Optionally, the medium may contain biopharmaceutically acceptable recombinant proteins. The term "animal-free" environment refers to an environment in which the components are derived from non-animal sources. In an animal-free environment, recombinant proteins replace native animal proteins and nutrients are obtained from synthetic, plant or microbial sources. "Protein-free" medium, in contrast, is defined as essentially free of protein.

Иллюстративные примеры бессывороточных сред, используемых в конкретных композициях, включают, среди прочего, QBSF-60 (Quality Biological, Inc.), StemPro-34 (Life Technologies) и X-VIVO 10.Illustrative examples of serum-free media used in specific formulations include, among others, QBSF-60 (Quality Biological, Inc.), StemPro-34 (Life Technologies), and X-VIVO 10.

В предпочтительном варианте реализации композиции, содержащие Т-клетки с отредактированным геномом, составлены в растворе PlasmaLyte.In a preferred embodiment, compositions containing genome-edited T cells are formulated in a PlasmaLyte solution.

В различных вариантах реализации композиции, содержащие Т-клетки с отредактированным геномом, готовят в криоконсервирующей среде. Например, криоконсервирующую среду с криоконсервационными агентами можно использовать для поддержания высокого выхода жизнеспособных клеток после оттаивания. Иллюстративные примеры криоконсервирующих сред, используемых в конкретных композициях, включают, среди прочего, CryoStor CS10, CryoStor CS5 и CryoStor CS2.In various embodiments, compositions containing genome-edited T cells are prepared in a cryopreservative medium. For example, cryopreservation medium with cryopreservation agents can be used to maintain a high yield of viable cells after thawing. Illustrative examples of cryopreservation media used in specific compositions include, among others, CryoStor CS10, CryoStor CS5 and CryoStor CS2.

В одном варианте реализации композиции составляют в растворе, содержащем смесь 50:50 PlasmaLyte A с CryoStor CS10.In one embodiment, the compositions are formulated in a solution containing a 50:50 mixture of PlasmaLyte A with CryoStor CS10.

В частных вариантах реализации композиция по существу не содержит микоплазмы, эндотоксина и микробных загрязнений. Под «по существу не содержат» в отношении эндотоксина подразумевается, что на дозу клеток приходится меньше эндотоксина, чем разрешено FDA для биопрепарата, то есть суммарное количество эндотоксина 5 EU/кг массы тела в день, что в среднем на человека весом 70 кг составляет 350 EU на суммарную дозу клеток. В частных вариантах реализации композиции, содержащие гемопоэтические стволовые или прогениторные клетки, трансдуцированные ретровирусным вектором, рассматриваемым в настоящей заявке, содержат от приблизительно 0,5 EU/мл до приблизительно 5,0 EU/мл или приблизительно 0,5 EU/мл, 1,0 EU/мл, 1,5 EU/мл, 2,0 EU/мл, 2,5 EU/мл, 3,0 EU/мл, 3,5 EU/мл, 4,0 EU/мл, 4,5 EU/мл или 5,0 EU/мл.In particular embodiments, the composition is substantially free of mycoplasma, endotoxin, and microbial contaminants. By "substantially free" in relation to endotoxin, it is meant that there is less endotoxin per dose of cells than is allowed by the FDA for the biologic, i.e. a total amount of endotoxin of 5 EU/kg of body weight per day, which is an average of 350 per person weighing 70 kg. EU per total cell dose. In private embodiments, compositions containing hematopoietic stem or progenitor cells transduced with a retroviral vector of this application contain from about 0.5 EU/ml to about 5.0 EU/ml or about 0.5 EU/ml, 1, 0 EU/ml, 1.5 EU/ml, 2.0 EU/ml, 2.5 EU/ml, 3.0 EU/ml, 3.5 EU/ml, 4.0 EU/ml, 4.5 EU/ml or 5.0 EU/ml.

В некоторых вариантах реализации предложены композиции и составы, подходящие для доставки полинуклеотидов, включая, среди прочего, одну или более мРНК, кодирующих одну или более перепрограммированных нуклеаз, и, необязательно, ферменты, изменяющие структуру концов.In some embodiments, compositions and formulations are provided suitable for the delivery of polynucleotides, including, inter alia, one or more mRNAs encoding one or more reprogrammed nucleases, and optionally, end-altering enzymes.

Иллюстративные составы для доставки ex vivo могут также включать применение различных трансфекционных агентов, известных в данной области, таких как фосфат кальция, электропорация, тепловой шок и различные липосомные составы (то есть для трансфекции, опосредованной липидами). Липосомы, как описано более подробно ниже, представляют собой липидные бислои, захватывающие фракцию водной жидкости. ДНК самопроизвольно связывается с внешней поверхностью катионных липосом (в силу своего заряда), и эти липосомы будут взаимодействовать с клеточной мембраной.Illustrative formulations for ex vivo delivery may also include the use of various transfection agents known in the art, such as calcium phosphate, electroporation, heat shock, and various liposome formulations (ie, for lipid-mediated transfection). Liposomes, as described in more detail below, are lipid bilayers that capture a fraction of an aqueous liquid. DNA spontaneously binds to the outer surface of cationic liposomes (due to its charge) and these liposomes will interact with the cell membrane.

В частных вариантах реализации составление фармацевтически приемлемых растворов носителей хорошо известно специалистам в данной области, как и разработка подходящих режимов дозирования и лечения для применения конкретных композиций, описанных в настоящей заявке, в различных схемах лечения, включая, например, энтеральное и парентеральное, например, внутрисосудистое, внутривенное, внутрисердечное, внутрикостное, внутрижелудочковое, внутримозговое, внутричерепное, интраспинальное, интратекальное и интрамедуллярное введение и состав. Специалисту в данной области будет понятно, что конкретные варианты реализации, рассматриваемые в настоящей заявке, могут содержать другие составы, такие как те, которые хорошо известны в области фармацевтики, и описаны, например, в справочнике Remington: The Science and Practice of Pharmacy, т.I и т.II. 22-е издание, под редакцией Loyd V. Allen Jr. Philadelphia, PA: Pharmaceutical Press; 2012, который включен в настоящую заявку посредством ссылки во всей своей полноте.In particular embodiments, the formulation of pharmaceutically acceptable carrier solutions is well known to those skilled in the art, as is the development of suitable dosing and treatment regimens for use of the specific compositions described herein in a variety of treatment regimens, including, for example, enteral and parenteral, for example, intravascular. , intravenous, intracardiac, intraosseous, intraventricular, intracerebral, intracranial, intraspinal, intrathecal and intramedullary administration and composition. The person skilled in the art will appreciate that the specific embodiments contemplated herein may contain other formulations, such as those well known in the pharmaceutical field and described, for example, in Remington: The Science and Practice of Pharmacy, t .I and vol.II. 22nd edition, edited by Loyd V. Allen Jr. Philadelphia, PA: Pharmaceutical Press; 2012, which is incorporated into this application by reference in its entirety.

H. Методы лечения клетками с отредактированным геномомH. Treatment methods with genome-edited cells

Клетки с отредактированным геномом, изготовленные с помощью композиций и способов, предусмотренных в настоящей заявке, дают улучшенные лекарственные продукты для применения при профилактике, лечении или ослаблении по меньшей мере одного симптома рака, БТПХ, инфекционного заболевания, аутоиммунного заболевания, воспалительного заболевания или иммунодефицита. Используемый в настоящей заявке термин «лекарственный продукт» относится к генетически модифицированным клеткам, полученным с применением композиций и способов, предусмотренных в настоящей заявке. В частных вариантах реализации лекарственный продукт содержит генетически отредактированные иммунные эффекторные клетки или Т-клетки. Кроме того, Т-клетки с отредактированным геномом, рассматриваемые в частных вариантах реализации обеспечивают более безопасную и более эффективную адоптивную клеточную терапию, поскольку они устойчивы к истощению Т-клеток и демонстрируют повышенную стойкость и жизнестойкость в микроокружении опухоли, что может позволить продолжительную терапию.Genome-edited cells made using the compositions and methods provided herein provide improved drug products for use in the prevention, treatment, or amelioration of at least one symptom of cancer, GVHD, infectious disease, autoimmune disease, inflammatory disease, or immunodeficiency. Used in this application, the term "drug product" refers to genetically modified cells obtained using the compositions and methods provided in this application. In private embodiments, the drug product contains genetically edited immune effector cells or T cells. In addition, genome-edited T cells contemplated in particular embodiments provide a safer and more effective adoptive cell therapy because they are resistant to T cell depletion and show increased persistence and viability in the tumor microenvironment, which may allow long-term therapy.

В частных вариантах реализации эффективное количество иммунных эффекторных клеток или Т-клеток с отредактированным геномом, содержащих отредактированный ген PD-1, вводят субъекту для предотвращения, лечения или ослабления по меньшей мере одного симптома рака, БТПХ, инфекционного заболевания, аутоиммунного заболевания, воспалительного заболевания или иммунодефицита.In particular embodiments, an effective amount of immune effector cells or genome-edited T cells comprising the edited PD-1 gene is administered to a subject to prevent, treat, or ameliorate at least one symptom of cancer, GVHD, an infectious disease, an autoimmune disease, an inflammatory disease, or immunodeficiency.

В частных вариантах реализации отредактированные PD-1 клетки по существу или полностью не экспрессируют PD-1 и, следовательно, не имеют или по существу не имеют функциональной экспрессии PD-1, например, не обладают способностью усиливать истощение Т-клеток и ингибировать экспрессию провоспалительных цитокинов. В частных вариантах реализации иммунные эффекторные клетки с отредактированным геномом, в которых отсутствует PD-1, являются более устойчивыми к иммуносупрессивным сигналам от микроокружения опухоли и проявляют повышенную жизнестойкость и устойчивость к истощению Т-клеток.In particular embodiments, edited PD-1 cells do not substantially or completely express PD-1 and therefore lack or substantially lack functional PD-1 expression, e.g., lack the ability to enhance T cell depletion and inhibit the expression of pro-inflammatory cytokines. . In particular embodiments, genome-edited immune effector cells lacking PD-1 are more resistant to immunosuppressive signals from the tumor microenvironment and exhibit increased viability and resistance to T cell depletion.

В частных вариантах реализации способ предотвращения, лечения или ослабления по меньшей мере одного симптома рака включает введение субъекту эффективного количества иммунных эффекторных клеток или Т-клеток с отредактированным геномом, содержащих отредактированный ген PD-1 и сконструированный TCR, CAR, или Daric, или другой терапевтический трансген для перенацеливания этих клеток на опухоль или рак. Генетически модифицированные клетки представляют собой более длительный и устойчивый лекарственный продукт, поскольку эти клетки более устойчивы к иммуносупрессивным сигналам из микроокружения опухоли благодаря редактированию гена PD-1 для уменьшения или устранения экспрессии PD-1.In particular embodiments, a method for preventing, treating, or alleviating at least one symptom of cancer comprises administering to a subject an effective amount of genome-edited immune effector cells or T cells containing an edited PD-1 gene and engineered TCR, CAR, or Daric, or other therapeutic a transgene to retarget those cells to a tumor or cancer. Genetically modified cells represent a longer lasting drug product because these cells are more resistant to immunosuppressive signals from the tumor microenvironment due to editing the PD-1 gene to reduce or eliminate PD-1 expression.

В частных вариантах реализации клетки с отредактированным геномом, рассматриваемые в настоящей заявке, используют при лечении солидных опухолей или раковых заболеваний.In particular embodiments, the genome-edited cells of this application are used in the treatment of solid tumors or cancers.

В частных вариантах реализации клетки с отредактированным геномом, рассматриваемые в настоящей заявке, используют при лечении солидных опухолей или раковых заболеваний, включая, среди прочего, следующие: рак надпочечника, адренокортикальная карцинома, рак анального канала, рак червеобразного отростка, астроцитома, атипичная тератоидная/рабдоидная опухоль, базальноклеточный рак, рак желчных протоков, рак мочевого пузыря, рак кости, рак головного мозга/ЦНС, рак молочной железы, опухоли бронхов, опухоли сердца, рак шейки матки, холангиокарцинома, хондросаркома, хордом, рак толстой кишки, колоректальный рак, краниофарингиома, протоковая карцинома (DCIS), рак эндометрия, эпендимома, рак пищевода, эстезионейробластома, саркома Юинга, экстракраниальна герминома, внегонадная герминома, рак глаза, рак фаллопиевых труб, фиброзная гистиосаркома, фибросаркома, рак желчного пузыря, рак желудка, желудочно-кишечные карциноидные опухоли, желудочно-кишечная стромальная опухоль (GIST), опухоли зародышевых клеток, глиома, глиобластома, рак головы и шеи, гемангиобластома, гепатоцеллюлярный рак, рак гипофарингеального отдела, интраокулярная меланома, саркома Капоши, рак почки, рак гортани, лейомиосаркома, рак губы, липосаркома, рак печени, рак легкого, немелкоклеточный рак легкого, рак легкого, злокачественная мезотелиома, медуллярная карцинома, медуллобластома, менангиома, меланома, карцинома Меркеля, срединная карцинома, рак ротовой полости, миксосаркома, миелодиспластический синдром, миелопролиферативные новообразования, рак полости носа и околоносовых пазух, рак носоглотки, нейробластома, олигодендроглиома, рак ротовой полости, рак полости рта, рак ротоглотки, остеосаркома, рак яичников, рак поджелудочной железы, опухоли островковых клеток поджелудочной железы, папиллярный рак, параганглиома, рак паращитовидной железы, рак полового члена, рак глотки, феохромоцитома, пинеалома, опухоль гипофиза, плевропульмональная бластома, первичный рак брюшины, рак простаты, рак прямой кишки, ретинобластома, почечно-клеточный рак, почечной лоханки и таза, рабдомиосаркома, рак слюнных желез, карцинома сальных желез, рак кожи, саркома мягких тканей, плоскоклеточный рак, мелкоклеточный рак легкого, рак тонкой кишки, рак желудка, карцинома потовых желез, синовиома, рак яичка, рак горла, рак тимуса, рак щитовидной железы, рак уретры, рак матки, саркома матки, рак влагалища, рак сосудов, рак вульвы и опухоль Вильмса.In particular embodiments, the genome-edited cells of this application are used in the treatment of solid tumors or cancers including, but not limited to, the following: adrenal cancer, adrenocortical carcinoma, anal cancer, appendix cancer, astrocytoma, atypical teratoid/rhabdoid tumor, basal cell carcinoma, bile duct cancer, bladder cancer, bone cancer, brain/CNS cancer, breast cancer, bronchial tumors, heart tumors, cervical cancer, cholangiocarcinoma, chondrosarcoma, chordomas, colon cancer, colorectal cancer, craniopharyngioma , ductal carcinoma (DCIS), endometrial cancer, ependymoma, esophageal cancer, esthesioneuroblastoma, Ewing's sarcoma, extracranial germinoma, extragonadal germinoma, eye cancer, fallopian tube cancer, fibrous histiosarcoma, fibrosarcoma, gallbladder cancer, gastric cancer, gastrointestinal carcinoid tumors , gastrointestinal stromal tumor (GIST), germinal tumors cell carcinoma, glioma, glioblastoma, head and neck cancer, hemangioblastoma, hepatocellular carcinoma, hypopharyngeal cancer, intraocular melanoma, Kaposi's sarcoma, kidney cancer, laryngeal cancer, leiomyosarcoma, lip cancer, liposarcoma, liver cancer, lung cancer, non-small cell lung cancer, lung cancer, malignant mesothelioma, medullary carcinoma, medulloblastoma, menangioma, melanoma, Merkel's carcinoma, median carcinoma, oral cancer, myxosarcoma, myelodysplastic syndrome, myeloproliferative neoplasms, cancer of the nasal cavity and paranasal sinuses, nasopharyngeal cancer, neuroblastoma, oligodendroglioma, oral cancer , oral cancer, oropharyngeal cancer, osteosarcoma, ovarian cancer, pancreatic cancer, pancreatic islet cell tumors, papillary cancer, paraganglioma, parathyroid cancer, penile cancer, pharyngeal cancer, pheochromocytoma, pinealoma, pituitary tumor, pleuropulmonary blastoma, primary peritoneal cancer, prostate cancer, rectal cancer, reti noblastoma, renal cell carcinoma, renal pelvis and pelvis, rhabdomyosarcoma, salivary gland cancer, sebaceous gland carcinoma, skin cancer, soft tissue sarcoma, squamous cell carcinoma, small cell lung cancer, small intestine cancer, gastric cancer, sweat gland carcinoma, synovioma, cancer testicular cancer, throat cancer, thymus cancer, thyroid cancer, urethral cancer, uterine cancer, uterine sarcoma, vaginal cancer, vascular cancer, vulvar cancer, and Wilms tumor.

В частных вариантах реализации клетки с отредактированным геномом, рассматриваемые в настоящей заявке, используются при лечении солидных опухолей или раковых заболеваний, включая, без ограничения, рак печени, рак поджелудочной железы, рак легких, рак молочной железы, рак мочевого пузыря, рак мозга, рак кости, рак щитовидной железы, рак почки или рак кожи.In particular embodiments, the genome-edited cells of this application are used in the treatment of solid tumors or cancers, including, but not limited to, liver cancer, pancreatic cancer, lung cancer, breast cancer, bladder cancer, brain cancer, cancer bone, thyroid cancer, kidney cancer, or skin cancer.

В частных вариантах реализации рассматриваемые в настоящей заявке клетки с отредактированным геномом используют для лечения различных видов рака, включая, среди прочего, рак поджелудочной железы, мочевого пузыря и легкого.In particular embodiments, the genome-edited cells of this application are used to treat a variety of cancers, including, but not limited to, pancreatic, bladder, and lung cancer.

В частных вариантах реализации клетки с отредактированным геномом, рассматриваемые в настоящей заявке, используют для лечения гемобластозов или гематологических раковых заболеваний.In private embodiments, the genome-edited cells of this application are used to treat hematological or hematological cancers.

В частных вариантах реализации клетки с отредактированным геномом, рассматриваемые в настоящей заявке, используют для лечения В-клеточных злокачественных новообразований, включая, среди прочего, лейкозы, лимфомы и множественную миелому.In particular embodiments, the genome-edited cells of this application are used to treat B-cell malignancies, including but not limited to leukemias, lymphomas, and multiple myeloma.

В частных вариантах реализации клетки с отредактированным геномом, рассматриваемые в настоящей заявке, используют для лечения гемобластозов, включая, среди прочего, лейкозы, лимфомы и множественные миеломы: острый лимфоцитарный лейкоз (ОЛЛ), острый миелоидный лейкоз (ОМЛ), миелобластный, промиелоцитарный, миеломоноцитарный, моноцитарный, эритролейкоз, лейкоз ворсистых клеток (ЛВК), хронический лимфоцитарный лейкоз (ХЛЛ) и хронический миелоидный лейкоз (ХМЛ), хронический миеломоноцитарный лейкоз (ХММЛ) и истинную полицитемию, лимфому Ходжкина, лимфому Ходжкина с преобладанием узловых лимфоцитов, лимфому Беркитта, лимфоцитарную лимфому (SLL), диффузную В-крупноклеточную лимфому, фолликулярную лимфому, крупноклеточную иммунобластную лимфому, B-лимфобластную лимфому из клеток-предшественников, лимфому из мантийных клеток, лимфому маргинальной зоны, фунгоидный микоз, анапластическую крупноклеточную лимфому, синдром Сезари, Т-лимфобластную лимфому из клеток-предшественников, множественную миелому, явную множественную миелому, вялотекущую множественную миелому, плазмоклеточный лейкоз, несекреторную миелому, миелому IgD, остеосклеротическую миелому, одиночную плазмоцитому кости и экстрамедуллярную плазмоцитому.In particular embodiments, the genome-edited cells of this application are used to treat hematological malignancies, including but not limited to leukemias, lymphomas, and multiple myelomas: acute lymphocytic leukemia (ALL), acute myeloid leukemia (AML), myeloblastic, promyelocytic, myelomonocytic , monocytic, erythroleukemia, hairy cell leukemia (PVC), chronic lymphocytic leukemia (CLL) and chronic myeloid leukemia (CML), chronic myelomonocytic leukemia (CMML) and polycythemia vera, Hodgkin's lymphoma, Hodgkin's lymphoma with a predominance of nodular lymphocytes, Burkitt's lymphoma, lymphocytic lymphoma (SLL), diffuse large B-cell lymphoma, follicular lymphoma, immunoblastic large cell lymphoma, progenitor B-lymphoblastic lymphoma, mantle cell lymphoma, marginal zone lymphoma, mycosis fungoides, anaplastic large cell lymphoma, Cesari syndrome, T-lymphoblastic lymphoma from progenitor cells, multiple mi aloma, overt multiple myeloma, indolent multiple myeloma, plasma cell leukemia, nonsecretory myeloma, IgD myeloma, osteosclerotic myeloma, solitary bone plasmacytoma, and extramedullary plasmacytoma.

Предпочтительные клетки для применения в способах редактирования генома, рассматриваемых в настоящей заявке, включают аутологичные/аутогенные («собственные») клетки, предпочтительно гемопоэтические клетки, более предпочтительно Т-клетки и более предпочтительно иммунные эффекторные клетки или клетки Treg.Preferred cells for use in the genome editing methods contemplated herein include autologous/autologous (“self”) cells, preferably hematopoietic cells, more preferably T cells, and more preferably immune effector or Treg cells.

В частных вариантах реализации предлагаются способы, включающие введение терапевтически эффективного количества клеток с отредактированным геномом, рассматриваемых в настоящей заявке, или композиции, содержащей их, нуждающемуся в этом пациенту, в качестве монотерапии или в сочетании с одним или несколькими терапевтическими агентами. По некоторым данным, такие клетки используют при лечении пациентов с риском развития рака, БТПХ, инфекционного заболевания, аутоиммунного заболевания, воспалительного заболевания или иммунодефицита. Таким образом, конкретные варианты реализации включают лечение, профилактику или ослабление по меньшей мере одного симптома рака, инфекционного заболевания, аутоиммунного заболевания, воспалительного заболевания или иммунодефицита, включающие введение субъекту, нуждающемуся в этом, терапевтически эффективного количества клеток с отредактированным геномом, рассматриваемых в настоящей заявке.In private embodiments, methods are provided that include administering a therapeutically effective amount of the genome-edited cells contemplated herein, or a composition containing them, to a patient in need thereof, as monotherapy or in combination with one or more therapeutic agents. According to some reports, such cells are used in the treatment of patients at risk of developing cancer, GVHD, infectious disease, autoimmune disease, inflammatory disease or immunodeficiency. Thus, specific embodiments include treating, preventing, or ameliorating at least one symptom of a cancer, infectious disease, autoimmune disease, inflammatory disease, or immunodeficiency, comprising administering to a subject in need thereof a therapeutically effective amount of the genome-edited cells contemplated herein. .

В одном варианте реализации способ лечения рака, БТПХ, инфекционного заболевания, аутоиммунного заболевания, воспалительного заболевания или иммунодефицита у нуждающегося в этом субъекта включает введение эффективного количества, например, терапевтически эффективного количества композиции, содержащей клетки с отредактированным геномом, рассматриваемые в настоящей заявке. Количество и частота введения будут определяться такими факторами, как состояние пациента, а также тип и тяжесть заболевания пациента, хотя надлежащие дозы могут быть определены клиническими испытаниями.In one embodiment, a method for treating cancer, GVHD, an infectious disease, an autoimmune disease, an inflammatory disease, or an immunodeficiency in a subject in need thereof comprises administering an effective amount, e.g., a therapeutically effective amount, of a composition comprising the genome-edited cells of the present application. The amount and frequency of administration will be determined by such factors as the condition of the patient and the type and severity of the patient's illness, although appropriate doses may be determined by clinical trials.

В одном иллюстративном варианте реализации эффективное количество клеток с отредактированным геномом, предоставленное субъекту, составляет по меньшей мере 2 х 106 клеток/кг, по меньшей мере 3 х 106 клеток/кг, по меньшей мере 4 х 106 клеток/кг, по меньшей мере 5 х 106 клеток/кг, по меньшей мере 6 х 106 клеток/кг, по меньшей мере 7 х 106 клеток/кг, по меньшей мере 8 х 106 клеток/кг, по меньшей мере 9 х 106 клеток/кг или, по меньшей мере 10 х 106 клеток/кг, или более клеток/кг, включая все промежуточные дозы клеток.In one exemplary embodiment, the effective number of genome-edited cells provided to a subject is at least 2 x 10 6 cells/kg, at least 3 x 10 6 cells/kg, at least 4 x 10 6 cells/kg, by at least 5 x 10 6 cells/kg, at least 6 x 10 6 cells/kg, at least 7 x 10 6 cells/kg, at least 8 x 10 6 cells/kg, at least 9 x 10 6 cells/kg, or at least 10 x 10 6 cells/kg, or more cells/kg, including all intermediate doses of cells.

В другом иллюстративном варианте реализации эффективное количество клеток с отредактированным геномом, предоставленное субъекту, составляет приблизительно 2 x 106 клеток/кг, приблизительно 3 x 106 клеток/кг, приблизительно 4 x 106 клеток/кг, приблизительно 5 x 106 клеток/кг, приблизительно 6 x 106 клеток/кг, приблизительно 7 x 106 клеток/кг, приблизительно 8 x 106 клеток/кг, приблизительно 9 x 106 клеток/кг, или приблизительно 10 x 106 клеток/кг, или более клеток/кг, включая все промежуточные дозы клеток.In another exemplary embodiment, the effective number of genome-edited cells provided to a subject is about 2 x 10 6 cells/kg, about 3 x 10 6 cells/kg, about 4 x 10 6 cells/kg, about 5 x 10 6 cells/kg. kg, approximately 6 x 10 6 cells/kg, approximately 7 x 10 6 cells/kg, approximately 8 x 10 6 cells/kg, approximately 9 x 10 6 cells/kg, or approximately 10 x 10 6 cells/kg, or more cells/kg including all intermediate cell doses.

В другом иллюстративном варианте реализации эффективное количество клеток с отредактированным геномом, предоставленное субъекту, составляет от приблизительно 2 х 106 клеток/кг до приблизительно 10 х 106 клеток/кг, от приблизительно 3 х 106 клеток/кг до приблизительно 10 х 106 клеток/кг, от приблизительно 4 х 106 клеток/кг до приблизительно 10 х 106 клеток/кг, от приблизительно 5 х 106 клеток/кг до приблизительно 10 х 106 клеток/кг, от 2 х 106 клеток/кг до приблизительно 6 х 106 клеток/кг, от 2 х 106 клеток/кг до приблизительно 7 × 106 клеток/кг, от 2 × 106 клеток/кг до приблизительно 8 × 106 клеток/кг, от 3 × 106 клеток/кг до приблизительно 6 × 106 клеток/кг, от 3 × 106 клеток/кг до от приблизительно 7 х 106 клеток/кг, от 3 х 106 клеток/кг до приблизительно 8 х 106 клеток/кг, от 4 х 106 клеток/кг до приблизительно 6 х 106 клеток/кг, от 4 х 106 клеток/кг до приблизительно 7 х 106 клеток/кг, от 4 х 106 клеток/кг до приблизительно 8 х 106 клеток/кг, от 5 х 106 клеток/кг до приблизительно 6 х 106 клеток/кг, от 5 х 106 клеток/кг до приблизительно 7 х 106 клеток/кг, от 5 х 106 клеток/кг до приблизительно 8 х 106 клеток/кг или от 6 х 106 клеток/кг до приблизительно 8 х 106 клеток/кг, включая все промежуточные дозы клеток.In another exemplary embodiment, the effective number of genome-edited cells provided to a subject is from about 2 x 10 6 cells/kg to about 10 x 10 6 cells/kg, from about 3 x 10 6 cells/kg to about 10 x 10 6 cells/kg, from about 4 x 10 6 cells/kg to about 10 x 10 6 cells/kg, from about 5 x 10 6 cells/kg to about 10 x 10 6 cells/kg, from 2 x 10 6 cells/kg up to about 6 x 10 6 cells/kg, from 2 x 10 6 cells/kg to about 7 x 10 6 cells/kg, from 2 x 10 6 cells/kg to about 8 x 10 6 cells/kg, from 3 x 10 6 cells/kg to approx. 6 x 10 6 cells/kg, 3 x 10 6 cells/kg to approx. 7 x 10 6 cells/kg, 3 x 10 6 cells/kg to approx. 8 x 10 6 cells/kg , 4 x 10 6 cells/kg to about 6 x 10 6 cells/kg, 4 x 10 6 cells/kg to about 7 x 10 6 cells/kg, 4 x 10 6 cells/kg to about 8 x 106 cells/kg, from 5 x 10 6 cells cells/kg to about 6 x 10 6 cells/kg, from 5 x 10 6 cells/kg to about 7 x 10 6 cells/kg, from 5 x 10 6 cells/kg to about 8 x 10 6 cells/kg, or from 6 x 10 6 cells/kg up to about 8 x 10 6 cells/kg including all intermediate cell doses.

Специалист в данной области техники поймет, что для осуществления желаемой терапии может потребоваться многократное введение композиций, рассматриваемых в частных вариантах реализации. Например, композицию можно вводить 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 или более раз в течение 1 недели, 2 недель, 3 недель, 1 месяца, 2 месяцев, 3 месяца, 4 месяца, 5 месяцев, 6 месяцев, 1 год, 2 года, 5 лет, 10 лет или более.One skilled in the art will appreciate that multiple administrations of the compositions contemplated in particular embodiments may be required to effect the desired therapy. For example, the composition can be administered 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 or more times within 1 week, 2 weeks, 3 weeks, 1 month, 2 months, 3 months, 4 months, 5 months, 6 months, 1 year, 2 years, 5 years, 10 years or more.

В некоторых вариантах реализации может быть желательным вводить активированные Т-клетки субъекту, а затем впоследствии повторно забирать у него кровь (или проводить аферез), активировать Т-клетки из нее и повторно вводить пациенту эти активированные и размноженные Т-клетки. Указанный процесс можно выполнять несколько раз каждые несколько недель. В некоторых случаях можно использовать Т-клетки из взятой крови объемом от 10 до 400 см3. В некоторых вариантах реализации активируют Т-клетки из взятой крови объемом 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350 или 400 см 3 или более. Без привязки к какой-либо конкретной теории, применение такого протокола множественного взятия крови/множественной реинфузии может служить для отбора определенных популяций Т-клеток.In some embodiments, it may be desirable to administer activated T cells to a subject and then subsequently bleed (or apheresis), activate the T cells from it, and reinject the activated and expanded T cells to the patient. This process can be performed several times every few weeks. In some cases, T cells from 10 to 400 cm3 of collected blood can be used. In some embodiments, T cells are activated from a drawn blood volume of 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, or 400 cm 3 or more. Without being bound by any particular theory, the use of such a multiple blood draw/multiple reinfusion protocol may serve to select specific T cell populations.

Введение композиций, рассматриваемых в частных вариантах реализации можно осуществлять любым удобным способом, включая ингаляцию аэрозоля, инъекцию, прием внутрь, трансфузию, имплантацию или трансплантацию. В предпочтительном варианте реализации композиции вводят парентерально. Фразы «парентеральное введение» и «введенный парентеральное», используемые в настоящей заявке, относятся к способам введения, отличным от энтерального и местного введения, обычно путем инъекции, и включают, без ограничения, внутрисосудистые, внутривенные, внутримышечные, внутриартериальные, интратекальные, внутрикапсулярные, интраорбитальные, внутриопухолевые, внутрисердечные, внутрикожные, внутрибрюшинные, транстрахеальные, подкожные, субкутикулярные, внутрисуставные, субкапсулярные, субарахноидальные, внутриспинальные и интрастернальные инъекции и инфузии. В одном варианте реализации композиции, рассматриваемые в настоящей заявке, вводят субъекту путем прямой инъекции в опухоль, лимфатический узел или участок инфекции.Administration of the compositions contemplated in particular embodiments may be by any convenient means, including aerosol inhalation, injection, ingestion, transfusion, implantation, or transplantation. In a preferred embodiment, the compositions are administered parenterally. The phrases "parenteral administration" and "introduced parenteral", as used in this application, refer to methods of administration other than enteral and topical administration, usually by injection, and include, without limitation, intravascular, intravenous, intramuscular, intraarterial, intrathecal, intracapsular, intraorbital, intratumoral, intracardiac, intradermal, intraperitoneal, transtracheal, subcutaneous, subcuticular, intraarticular, subcapsular, subarachnoid, intraspinal and intrasternal injections and infusions. In one embodiment, the compositions of this application are administered to a subject by direct injection into a tumor, lymph node, or site of infection.

В одном варианте реализации способ лечения субъекта, у которого диагностирован рак, включает удаление иммунных эффекторных клеток у субъекта, редактирование генома указанных иммунных эффекторных клеток и получение популяции геномом иммунных эффекторных клеток с отредактированным, и введение популяции иммунных эффекторных клеток с отредактированным геномом тому же субъекту. В предпочтительном варианте реализации иммунные эффекторные клетки включают Т-клетки.In one embodiment, the method of treating a subject diagnosed with cancer comprises removing the immune effector cells from the subject, editing the genome of said immune effector cells and obtaining a genome-edited immune effector cell population, and introducing the genome-edited immune effector cell population to the same subject. In a preferred embodiment, the immune effector cells include T cells.

Способы введения клеточных композиций, рассматриваемые в частных вариантах реализации включают любой способ, который эффективен для того, чтобы привести к реинтродукции ex vivo иммунных эффекторных клеток с отредактированным геномом или к реинтродукции предшественников иммунных эффекторных клеток с отредактированным геномом, которые при введении субъекту дифференцируются в зрелые иммунные эффекторные клетки. Один метод включает редактирование генома Т-клеток периферической крови ex vivo и возвращение этих трансдуцированных клеток субъекту.Methods of administering cell compositions contemplated in particular embodiments include any method that is effective to result in the ex vivo reintroduction of genome-edited immune effector cells or the reintroduction of genome-edited immune effector cell progenitors that, when administered to a subject, differentiate into mature immune effector cells. One method involves editing the genome of peripheral blood T cells ex vivo and returning these transduced cells to the subject.

Все публикации, патентные заявки и выданные патенты, процитированные в описании, включены в настоящую заявку посредством ссылки, как если бы каждая отдельная публикация, патентная заявка или выданный патент были прямо и индивидуально указаны как включенные в качестве ссылки.All publications, patent applications, and granted patents cited in the specification are incorporated herein by reference, as if each individual publication, patent application, or granted patent were expressly and individually indicated as being incorporated by reference.

Хотя для целей ясности понимания вышеизложенные варианты реализации были описаны в некоторых деталях в качестве иллюстрации и примера, для специалиста в данной области техники будет вполне очевидно в свете идей, рассматриваемых в настоящей заявке, что могут быть сделаны некоторые изменения и модификации без отступления от сущности или объема прилагаемой формулы изобретения. Следующие примеры приведены только для иллюстрации, а не для ограничения. Специалисты в данной области техники легко распознают множество некритических параметров, которые могут быть изменены или модифицированы для получения в основном аналогичных результатов.While for the purposes of clarity of understanding, the foregoing embodiments have been described in some detail by way of illustration and example, it will be readily apparent to one skilled in the art in light of the teachings contemplated in this application that certain changes and modifications can be made without departing from the spirit or the scope of the appended claims. The following examples are provided by way of illustration only and not by way of limitation. Those skilled in the art will readily recognize many non-critical parameters that can be changed or modified to produce substantially similar results.

ПРИМЕРЫEXAMPLES

Пример 1Example 1

Перепрограммирование I-OnuI для разрушения внутриклеточного сигнального мотива в гене рецептора запрограммированной смерти-1 (pd-1)Reprogramming of I-OnuI to Destroy an Intracellular Signaling Motif in the Programmed Death-1 (pd-1) Receptor Gene

PD-1 экспрессируется на плазматической мембране Т-клеток после стимуляции и активации антигенных рецепторов. PD-1 содержит сигнальный пептид, внеклеточный IgV-подобный домен, трансмембранный домен и внутриклеточный хвост, который содержит мотив иммунорецептора на основе тирозина (ITIM, консенсусная последовательность S/I/V/LxYxxI/V/L) и иммунорецепторный мотив переключения на основе тирозина (ITSM, консенсусная последовательность TxYxxV/I). Рисунок 1А. Тирозин в аминокислотном положении 248 в ITSM PD-1 становится фосфорилированным при связывании лиганда PD-L1/2 одновременно с активацией Т-клеток, создавая субстрат связывания для белка, содержащего домен SH2, тирозин-фосфатазы-2 (SHP2, см. Chemnitz JM). et. al. J. Immunol. 2004 Jul 15; 173 (2): 945-54.). Рекрутинг SHP2 в плазматическую мембрану противодействует управляемым фосфотирозином сигналам активации в Т-клетках (Yokosuka T et al., J Exp Med. 2012 Jun 4; 209 (6): 1201-17) и подавляет длительность активированного состояния Т-клеток. Кодон для фосфорилированного ITSM тирозина охвачен каноническим «центральным- 4» мотивом расщепления I-OnuI, ATAC. Фигура 1B. Был разработан вариант хоминг-эндонуклеазы, нацеленный на последовательность-мишень 22 п.н. (SEQ ID NO: 25), центрированную на указанном центральном -4 мотиве в экзоне 5 гена PD-1.PD-1 is expressed on the plasma membrane of T cells after stimulation and activation of antigen receptors. PD-1 contains a signal peptide, an extracellular IgV-like domain, a transmembrane domain, and an intracellular tail that contains an immunoreceptor tyrosine-based motif (ITIM, consensus sequence S/I/V/LxYxxI/V/L) and an immunoreceptor tyrosine-based switch motif (ITSM, consensus sequence TxYxxV/I). Figure 1A. Tyrosine at amino acid position 248 in ITSM PD-1 becomes phosphorylated upon binding of the PD-L1/2 ligand concurrently with T cell activation, creating a binding substrate for the SH2 domain containing protein tyrosine phosphatase-2 (SHP2, see Chemnitz JM) . et. al. J. Immunol. 2004 Jul 15; 173(2):945-54.). Recruitment of SHP2 to the plasma membrane counteracts phosphotyrosine-driven activation signals in T cells (Yokosuka T et al., J Exp Med. 2012 Jun 4; 209 (6): 1201-17) and suppresses the duration of the activated state of T cells. The codon for ITSM phosphorylated tyrosine is encompassed by the canonical "central-4" I-OnuI cleavage motif, ATAC. Figure 1B. A variant of the homing endonuclease was designed to target the 22 bp target sequence. (SEQ ID NO: 25) centered on the indicated central -4 motif in exon 5 of the PD-1 gene.

Без привязки к какой-либо конкретной теории, предполагается, что все возможные события инсерции/делации («инделы») в «центральной-4» последовательности АТАС и вблизи от нее полностью уничтожат один или более существенных признаков мотива ITSM, причем наиболее возможные инделы уничтожат сам кодон тирозина-248. Эти инделы, вероятно, будут генерировать доминантно-отрицательные белки PD-1, содержащие нормальный внеклеточный домен и нефункциональный внутриклеточный сигнальный домен. Доминирующие отрицательные белки PD-1 могут действовать как «поглотитель» для лигандов PD-1, тем самым уменьшая или устраняя иммуносупрессивную передачу сигналов. Кроме того, поскольку активированные Т-клетки усиливают экспрессию PD-L1; поскольку взаимодействия PD-1:PD-L1 происходят среди Т-клеток, как в цис-, так и в транс-положении; и поскольку эти взаимодействия важны для функции Т-клеток, редактирование генов для нарушения передачи сигналов PD-1 без влияния на экспрессию может сохранить возможные управляемые PD-L1 функции.Without being bound by any particular theory, it is assumed that all possible insertion/deletion events (“indels”) in and near the “central-4” ATAC sequence will completely eliminate one or more essential features of the ITSM motif, with the most possible indels eliminating the tyrosine codon itself is 248. These indels are likely to generate dominant-negative PD-1 proteins containing a normal extracellular domain and a non-functional intracellular signaling domain. Dominant negative PD-1 proteins can act as a "sink" for PD-1 ligands, thereby reducing or eliminating immunosuppressive signaling. In addition, since activated T cells upregulate PD-L1 expression; since PD-1:PD-L1 interactions occur among T cells, both in cis and trans; and because these interactions are important for T cell function, gene editing to disrupt PD-1 signaling without affecting expression may preserve possible PD-L1-driven functions.

Таким образом, I-OnuI был перепрограммирован для нацеливания на кодирующую область ITSM путем конструирования модульных библиотек, содержащих вариабельные аминокислотные остатки в интерфейсе распознавания ДНК. Для конструирования этих вариантов вырожденные кодоны встраивали в ДНК-связывающие домены I-OnuI с использованием олигонуклеотидов. Олигонуклеотиды, кодирующие эти вырожденные кодоны, использовали в качестве ПЦР-матриц для создания библиотек вариантов путем рекомбинации разрыва в штамме дрожжей S. cerevisiae. Каждая библиотека вариантов охватывала N- либо С-концевой домен распознавания ДНК I-OnuI и содержала ~ 107-108 уникальных трансформантов. Полученные библиотеки поверхностных дисплеев подвергали скринингу с помощью проточной цитометрии на активность расщепления в отношении сайта-мишени, содержащего «полусайты» соответствующих доменов (SEQ ID NO: 28-29), как показано на фиг.2.Thus, I-OnuI was reprogrammed to target the ITSM coding region by constructing modular libraries containing variable amino acid residues in the DNA recognition interface. To construct these variants, degenerate codons were inserted into the DNA-binding domains of I-OnuI using oligonucleotides. Oligonucleotides encoding these degenerate codons were used as PCR templates to generate variant libraries by recombination of the break in the yeast strain S. cerevisiae. Each variant library spanned either the N- or C-terminal I-OnuI DNA recognition domain and contained ~10 7 -10 8 unique transformants. The resulting surface display libraries were screened by flow cytometry for cleavage activity against a target site containing "half sites" of the respective domains (SEQ ID NOs: 28-29) as shown in FIG. 2.

Дрожжи, имеющие HE I-OnuI с перепрограммированными N- и C-концевым доменом, очищали и экстрагировали плазмидную ДНК. Проводили ПЦР-реакции для амплификации перепрограммированных доменов, которые впоследствии трансформировали в S. cerevisiae для создания библиотеки комбинаций перепрограммированных доменов. Из этой библиотеки идентифицировали полностью перепрограммированные варианты I-OnuI, которые распознают полный сайт-мишень (SEQ ID NO: 25), присутствующий в кодирующей области ITSM в экзоне 5 гена PD-1, и очищали их.Yeasts having HE I-OnuI with reprogrammed N- and C-terminal domains were purified and plasmid DNA was extracted. PCR reactions were performed to amplify the reprogrammed domains, which were subsequently transformed into S. cerevisiae to create a library of reprogrammed domain combinations. From this library, fully reprogrammed I-OnuI variants that recognize the complete target site (SEQ ID NO: 25) present in the ITSM coding region in exon 5 of the PD-1 gene were identified and purified.

Активность перепрограммированных I-OnuI HE, которые нацелены на область кодирования ITSM PD-1 в экзоне 5, измеряли с использованием хромосомно интегрированной флуоресцентной репортерной системы (Certo et. Al., 2011). Полностью перепрограммированные I-OnuI HE, которые связывают и расщепляют последовательность-мишень PD-1 ITSM, клонировали в плазмиды экспрессии млекопитающих и затем индивидуально трансфицировали в клеточную линию фибробластов HEK 293T, содержащую последовательность-мишень экзона5 PD-1, расположенную в направлении против хода транскрипции от гена вне рамки трансляции, кодирующего флуоресцентный белок mCherry. Расщепление встроенного сайта-мишень указанной HE и накопление инделов после репарации ДНК посредством негомологичного соединения концов (NHEJ) приводит к тому, что приблизительно один из трех репарированных локусов помещает флуоресцентный репортерный ген обратно «в рамку». Поэтому процентное содержание клеток HEK 293T с флуоресцирующим mCherry используют в качестве показателя активности эндонуклеазы в хромосомно встроенной последовательности-мишени. Полностью перепрограммированный I-OnuI HE (PD-1.ITSM.ex5_RD1_CV3-08, SEQ ID NO: 6), нацеленный на сайт экзона 5 PD-1, показал очень умеренную эффективность экспрессии mCherry в клеточном хромосомном контексте. Фигура 3А. Вариант HE имел умеренные свойства аффинности к ДНК при измерении с помощью равновесного титрования субстрата (фиг.3 В).The activity of reprogrammed I-OnuI HEs that target the ITSM coding region of PD-1 in exon 5 was measured using a chromosome-integrated fluorescent reporter system (Certo et. Al., 2011). Fully reprogrammed I-OnuI HEs that bind and cleave the ITSM PD-1 target sequence were cloned into mammalian expression plasmids and then individually transfected into the HEK 293T fibroblast cell line containing the upstream PD-1 exon 5 target sequence. from a gene outside the translation frame encoding the mCherry fluorescent protein. Cleavage of the inserted target site of this HE and accumulation of indels after DNA repair by non-homologous end joining (NHEJ) results in approximately one in three repaired loci placing the fluorescent reporter gene back in-frame. Therefore, the percentage of HEK 293T cells with fluorescent mCherry is used as an indicator of endonuclease activity in the chromosomally inserted target sequence. Fully reprogrammed I-OnuI HE (PD-1.ITSM.ex5_RD1_CV3-08, SEQ ID NO: 6) targeted at the exon 5 site of PD-1 showed a very modest efficiency of mCherry expression in a cellular chromosomal context. Figure 3A. The HE variant had moderate DNA affinity properties as measured by substrate equilibrium titration (FIG. 3B).

Затем была сгенерирована библиотека вторичных вариантов I-OnuI путем выполнения случайного мутагенеза в варианте PD-1.ITSM.ex5_RD1_CV3-08 HE. Чтобы выделить варианты с улучшенной каталитической эффективностью, выполняли сортировку потока на основе дисплея в более жестких условиях расщепления. Указанный процесс позволил выявить вариант I-OnuI (PD-1.ITSM.ex5_RD2_73, SEQ ID NO: 7), который содержал четыре аминокислотные мутации относительно варианта RD1 и имел в несколько раз более высокий процент клеток, экспрессирующих mCherry, по сравнению с вариантом RD1. Фигура 4. Для повышения эффективности редактирования генов на сайте-мишени экзона 5 были выполнены три дополнительных круга скрининга для обогащения активности (PD-1.ITSM.ex5_RD3_03, SEQ ID NO: 8; PD-1.ITSM.ex5_RD4_CV23, SEQ ID NO: 9; и PD-1.ITSM.ex5_RD5_CV23MK, SEQ ID NO: 10).A library of I-OnuI secondary variants was then generated by performing random mutagenesis on the PD-1.ITSM.ex5_RD1_CV3-08 HE variant. In order to isolate variants with improved catalytic efficiency, display-based stream sorting was performed under more stringent splitting conditions. This process made it possible to identify the I-OnuI variant (PD-1.ITSM.ex5_RD2_73, SEQ ID NO: 7), which contained four amino acid mutations relative to the RD1 variant and had a several times higher percentage of cells expressing mCherry compared to the RD1 variant. . Figure 4. To increase the efficiency of gene editing at the target site of exon 5, three additional rounds of screening for activity enrichment were performed (PD-1.ITSM.ex5_RD3_03, SEQ ID NO: 8; PD-1.ITSM.ex5_RD4_CV23, SEQ ID NO: 9 and PD-1.ITSM.ex5_RD5_CV23MK, SEQ ID NO: 10).

Пример 2Example 2

Характеризация варианта I-OnuI и megaTAL, нацеленных на экзон 5 PD-1Characterization of I-OnuI and megaTAL variant targeting exon 5 of PD-1

Сайт-мишень экзона 5 PD-1 содержит CpG-динуклеотидные мотивы как в сайте связывания мегануклеазы, так и в соседнем сайте связывания массива TAL (фигура 1 В). Статус метилирования этих динуклеотидов оценивали путем бисульфитного секвенирования в первичных Т-клетках человека, активированных CD3 и CD28 и культивируемых в полной среде с добавкой IL-2. Через 3 дня геномную ДНК выделяли и обрабатывали бисульфитом для превращения любых неметилированных цитозиновых оснований в урацил. Сайт-мишень экзона 5 затем секвенировали для выявления неметилированного (превращенного в тимин) в сравнении с метилированным (оставшимся цитозином) статусом каждого цитозина. Результаты показывают, что оба цитозина с CpG мотивом в сайте-мишени были преимущественно метилированы (Фигура 5), что согласуется с типичными паттернами метилирования «генного тела».The PD-1 exon 5 target site contains CpG dinucleotide motifs both at the meganuclease binding site and at the adjacent TAL array binding site (FIG. 1B). The methylation status of these dinucleotides was assessed by bisulfite sequencing in primary human T cells activated with CD3 and CD28 and cultured in complete medium supplemented with IL-2. After 3 days, genomic DNA was isolated and treated with bisulfite to convert any unmethylated cytosine bases to uracil. The exon 5 target site was then sequenced to identify the unmethylated (converted to thymine) versus methylated (remaining cytosine) status of each cytosine. The results show that both cytosines with a CpG motif at the target site were predominantly methylated (Figure 5), consistent with typical "gene body" methylation patterns.

Чтобы подтвердить, что вариант PD-1.ITSM.ex5_RD5_CV23MK хоминг-эндонуклеазы (HE) распознает и расщепляет метилированный сайт-мишень экзона 5, проводили анализ аффинности связывания и расщепления ДНК с использованием субстратов, содержащих 5-метилцитозин в положении p5 сайта-мишени, или обратного комплемента гуанинового основания в p6 или на обеих цепях последовательности-мишени, что является показателем статуса метилирования сайта-мишени в активированных Т-клетках. Фигура 6. Вариант HE связывал и расщеплял метилированные ДНК-субстраты и немодифицированный субстрат аналогичным образом.To confirm that the homing endonuclease (HE) variant PD-1.ITSM.ex5_RD5_CV23MK recognizes and cleaves the methylated target site of exon 5, DNA binding and cleavage affinity assays were performed using substrates containing 5-methylcytosine at position p5 of the target site, or reverse complement of a guanine base at p6 or both strands of the target sequence, which is indicative of the methylation status of the target site in activated T cells. Figure 6. The HE variant bound and cleaved methylated DNA substrates and unmodified substrate in a similar manner.

Вариант PD-1.ITSM.ex5_RD5_CV23MK HE был отформатирован как megaTAL (SEQ ID NO: 19) путем добавления толерантного к 5-метилцитозину массива TAL величиной 10,5 единиц, который соответствует сайту-мишени массива TAL из 11 пар оснований (SEQ ID NO: 26), к N-концу домена мегануклеазы (как описано Boissel et al., 2013). Последовательность сайта-мишени megaTAL описана в SEQ ID NO: 27. MegaTAL был протестирован на соответствие метилированному динуклеотиду CpG, присутствующему в сайте-мишени массива TAL. Массив TAL был сконструирован так, чтобы быть толерантным к метилированному основанию путем включения «N*» RVD в соответствующую позицию массива.The PD-1.ITSM.ex5_RD5_CV23MK HE variant was formatted as megaTAL (SEQ ID NO: 19) by adding a 5-methylcytosine-tolerant TAL array of 10.5 units, which corresponds to the target site of the 11 bp TAL array (SEQ ID NO: : 26), to the N-terminus of the meganuclease domain (as described by Boissel et al., 2013). The sequence of the megaTAL target site is described in SEQ ID NO: 27. MegaTAL was tested to match the methylated CpG dinucleotide present in the target site of the TAL array. The TAL array was designed to be methylated base tolerant by including "N*" RVD at the appropriate array position.

Эффективность редактирования megaTAL оценивали путем предварительной стимуляции первичных Т-клеток человека анти-CD3 и анти-CD28 антителами в среде с добавлением цитокинов в течение 48-72 часов, а затем подвергали клетки электропорации с транскрибированной in vitro (IVT), кэппированной и полиаденилированной мРНК (SEQ ID NO: 40), кодирующей megaTAL PD-1.ITSM.ex5_RD5_CV23MK. Кроме того, была добавлена IVT-мРНК, кодирующая 3'-5'-экзонуклеазу Trex2, чтобы усилить процессинг разрыва путем негомологичного присоединения конца (NHEJ) (см. Certo et al., 2012). После электропорации клетки культивировали в течение 7-10 дней в среде с цитокинами, в течение которых извлекали аликвоты для выделения геномной ДНК с последующей ПЦР-амплификацией по сайту-мишени экзона 5 PD-1.The efficiency of megaTAL editing was assessed by prestimulating primary human T cells with anti-CD3 and anti-CD28 antibodies in cytokine-supplemented medium for 48-72 hours, and then subjecting the cells to electroporation with in vitro transcribed (IVT), capped, and polyadenylated mRNA ( SEQ ID NO: 40) encoding megaTAL PD-1.ITSM.ex5_RD5_CV23MK. In addition, an IVT mRNA encoding Trex2 3'-5' exonuclease was added to enhance break processing by non-homologous end attachment (NHEJ) (see Certo et al., 2012). After electroporation, the cells were cultured for 7-10 days in a medium with cytokines, during which aliquots were removed for isolation of genomic DNA, followed by PCR amplification at the target site of exon 5 of PD-1.

Частоту инсерций/делеций измеряли методом отслеживания инсерций/делеций Tracking of Indels DEcomposition (TIDE, см. Brinkman et al., 2014) или высокопроизводительного секвенирования. Эффективность редактирования megaTAL PD-1.ITSM.ex5_RD5_CV23MK в присутствии Trex2 составила приблизительно 60%. Фигура 7А. Преобладающими типами инсерций/делеций, наблюдаемыми на сайте- мишени, были+1, -1, -2, -3 или -4 нуклеотида. Фигура 7B. Указанный анализ подтвердил, что вариант PD-1.ITSM.ex5_RD5_CV23MK разрушил консенсусный мотив ITSM PD-1 в значительной части человеческих T-клеток, обработанных megaTAL.Insertion/deletion rates were measured by Tracking of Indels DEcomposition (TIDE, see Brinkman et al., 2014) or high throughput sequencing. The editing efficiency of megaTAL PD-1.ITSM.ex5_RD5_CV23MK in the presence of Trex2 was approximately 60%. Figure 7A. The predominant types of insertions/deletions observed at the target site were +1, -1, -2, -3 or -4 nucleotides. Figure 7B. This analysis confirmed that the PD-1.ITSM.ex5_RD5_CV23MK variant disrupted the ITSM PD-1 consensus motif in a significant proportion of megaTAL-treated human T cells.

Пример 3Example 3

Перепрограммирование доменов мегануклеазы I-OnuI для разрушения внеклеточных доменов в гене рецептора запрограммированной смерти-1 (pd-1)Reprogramming of I-OnuI meganuclease domains to disrupt extracellular domains in the programmed death receptor-1 (pd-1) gene

Центральная-4-специфичность варианта I-OnuI HE, который нацелен на сайт-мишень экзона 5 PD-1 (SEQ ID NO: 25), была охарактеризована с использованием высокопроизводительных анализов эндонуклеаз in vitro с поверхностным дисплеем дрожжей (Jarjour, West-Foyle et al., 2009). Плазмида, кодирующая вариант HE, который нацелен на экзон 5 PD-1, была трансформирована в S. cerevisiae для поверхностного дисплея, а затем протестирована на активность расщепления в отношении сгенерированных ПЦР двухцепочечных ДНК-субстратов, содержащих последовательность ДНК сайта-мишени экзона 5 PD-1, которая содержит каждую из 256 возможных центральных-4 последовательностей. Полученный профиль специфичности показал, что указанный перепрограммированный I-OnuI является высокоселективным в отношении центральных-4 сайтов-мишеней (Фигура 8), но может также расщеплять дополнительные неканонические центральные-4 сайты-мишени. Поскольку очень мало канонических центральных-4 сайтов-мишеней I-OnuI расположено в других местах гена PD-1, неканонические центральные-4 сайты-мишени в экзоне 1 и экзоне 2 PD-1 были использованы для перепрограммирования дополнительных хоминг-эндонуклеаз.The central-4-specificity of the I-OnuI HE variant that targets the target site of exon 5 of PD-1 (SEQ ID NO: 25) was characterized using high-throughput yeast surface display in vitro endonuclease assays (Jarjour, West-Foyle et al. al., 2009). A plasmid encoding an HE variant that targets exon 5 of PD-1 was transformed into S. cerevisiae for surface display and then tested for cleavage activity against PCR-generated double-stranded DNA substrates containing the DNA sequence of the target site of exon 5 of PD- 1, which contains each of the 256 possible central-4 sequences. The resulting specificity profile showed that this reprogrammed I-OnuI is highly selective for central-4 target sites (Figure 8), but can also cleave additional non-canonical central-4 target sites. Since very few canonical central-4 target sites of I-OnuI are located elsewhere in the PD-1 gene, non-canonical central-4 target sites in exon 1 and exon 2 of PD-1 were used to reprogram additional homing endonucleases.

Эти неканонические центральные-4 сайты-мишени в экзоне 1 и экзоне 2 PD-1 находятся в областях, которые кодируют сигнальный пептид и домен IgV соответственно. Без привязки к какой-либо конкретной теории, предполагается, что нацеливание на эти области путем инделами, редактирующими ген, устраняет или дестабилизирует экспрессию белка PD-1 создавая чистый инактивированный фенотип.Кроме того, имея доступ к этим сайтам для более сложных операций по редактированию гена, включая, помимо прочего, целевую инсерцию трансгенных кассет, можно создавать фенотипы, которые находятся под уникальным регуляторным контролем.These non-canonical central-4 target sites in exon 1 and exon 2 of PD-1 are in regions that encode the signal peptide and the IgV domain, respectively. Without being bound by any particular theory, it is hypothesized that targeting these regions by gene editing indels abolishes or destabilizes PD-1 protein expression creating a clear inactivated phenotype. In addition, having access to these sites for more complex gene editing operations , including but not limited to the targeted insertion of transgenic cassettes, phenotypes can be created that are under unique regulatory control.

I-OnuI был перепрограммирован так, чтобы быть нацеленным на два неканонических центральных-4 сайта-мишени (SEQ ID NO: 30 и 35), по одному в каждом из этих двух экзонов/мотивов, и распространяющийся на сайты-мишени соответствующего массива TAL (SEQ ID NO: 26 и 31) и сайты-мишени полного megaTAL (SEQ ID NO: 31 и 37). Рис 9А и 9 В. I-OnuI был перепрограммирован так, чтобы быть нацеленным на экзон 1 или экзон 2 гена PD-1 путем конструирования модульных библиотек, содержащих вариабельные аминокислотные остатки в интерфейсе распознавания ДНК. Для конструирования вариантов вырожденные кодоны были встроеены в ДНК-связывающие домены I-OnuI с использованием олигонуклеотидов. Олигонуклеотиды, кодирующие вырожденные кодоны, использовали в качестве ПЦР-матриц для создания библиотек вариантов путем рекомбинации разрывов в штамме дрожжей S. cerevisiae. Каждая библиотека вариантов охватывала N- или С-концевой домен узнавания ДНК I-OnuI и содержала ~ 107-108 уникальных трансформантов. Полученные библиотеки поверхностных дисплеев подвергали скринингу с помощью проточной цитометрии на активность расщепления в отношении сайтов-мишеней, содержащих «полусайты» соответствующих доменов (экзон 1: SEQ ID NO: 34 и 35; экзон 2: SEQ ID NO: 38 и 39).I-OnuI was reprogrammed to target two non-canonical central-4 target sites (SEQ ID NOs: 30 and 35), one in each of these two exons/motifs, and extending to target sites of the corresponding TAL array ( SEQ ID NOs: 26 and 31) and complete megaTAL target sites (SEQ ID NOs: 31 and 37). Figures 9A and 9B. I-OnuI was reprogrammed to target either exon 1 or exon 2 of the PD-1 gene by constructing modular libraries containing variable amino acid residues in the DNA recognition interface. To construct variants, degenerate codons were inserted into the DNA-binding domains of I-OnuI using oligonucleotides. Oligonucleotides encoding degenerate codons were used as PCR templates to generate variant libraries by recombining breaks in the yeast strain S. cerevisiae. Each variant library spanned the N- or C-terminal I-OnuI DNA recognition domain and contained ~10 7 -10 8 unique transformants. The resulting surface display libraries were screened by flow cytometry for cleavage activity against target sites containing "half sites" of the respective domains (exon 1: SEQ ID NOS: 34 and 35; exon 2: SEQ ID NOS: 38 and 39).

Дрожжи, имеющие I-OnuI HE с перепрограммированными N- и C-концевыии доменами, очищали и экстрагировали плазмидную ДНК. Проводили реакции ПЦР для амплификации перепрограммированных доменов, которые впоследствии трансформировали в S. cerevisiae для создания библиотек комбинаций перепрограммированных доменов. Выявляли полностью перепрограммированные варианты I-OnuI, активные против полного сайта-мишени в области, кодирующей сигнальный пептид в экзоне 1 PD-1, и в области, кодирующей домен IgV в экзоне 2 PD-1, и выделяли из этих библиотек.Yeasts having I-OnuI HE with reprogrammed N- and C-terminal domains were purified and plasmid DNA was extracted. PCR reactions were performed to amplify the reprogrammed domains, which were subsequently transformed into S. cerevisiae to create libraries of reprogrammed domain combinations. Fully reprogrammed I-OnuI variants active against the entire target site in the region encoding the signal peptide in exon 1 of PD-1 and in the region encoding the IgV domain in exon 2 of PD-1 were identified and isolated from these libraries.

Перепрограммированные I-OnuI HE, нацеленные на сайты-мишени экзона 1 и экзона 2 PD-1, клонировали в плазмиды экспрессии млекопитающих и затем индивидуально трансфицировали в клеточную линию фибробластов HEK 293T, содержащую соответствующие последовательности-мишени в направлении против хода транскрипции от гена вне рамки, кодирующего флуоресцентный белок iRFP.Reprogrammed I-OnuI HEs targeting PD-1 exon 1 and exon 2 target sites were cloned into mammalian expression plasmids and then individually transfected into the HEK 293T fibroblast cell line containing the appropriate target sequences upstream of the out-of-frame gene. coding for the fluorescent protein iRFP.

Перепрограммированный HE I-OnuI, нацеленный на сайт экзона 1 PD-1 (PD-1.ile3.exon1_RD1_B1, SEQ ID NO: 11), показал умеренную эффективность экспрессии iRFP в контексте клеточной хромосомы, либо в виде автономного варианта HE, либо после форматирования в качестве megaTAL (SEQ ID NO: 20). Вторичную библиотеку вариантов I-OnuI генерировали путем проведения случайного мутагенеза по варианту RD1 экзона 1 PD-1, выявленному в процессе скрининга первоначальной библиотеки. Сортировку потока на основе дисплея выполняли в более жестких условиях расщепления, чтобы выделить варианты с улучшенной каталитической эффективностью. Указанный процесс выявил два варианта I-OnuI (PD-1.ile3.exon1_RD2_B1H8, PD-1.ile3.exon1_RD2_B1G2, SEQ ID NO: 12 и 60 соответственно). Эти варианты содержали четыре (PD-1.ile3.exon1_RD2_B1H8) или пять (PD-1.ile3.exon1_RD2_B1G2) аминокислотных мутации относительно варианта RD1 и имели значительно более высокий уровень экспрессирующих iRFP клеток по сравнению с вариантом RD1 экзона 1PD-1, как в качестве автономного варианта HE, так и после форматирования в виде megaTAL (SEQ ID NO: 21 и SEQ ID NO: 64). Фигура 10.Reprogrammed HE I-OnuI targeting the PD-1 exon 1 site (PD-1.ile3.exon1_RD1_B1, SEQ ID NO: 11) showed moderate efficiency in iRFP expression in the context of the cellular chromosome, either as a standalone HE variant or after formatting as megaTAL (SEQ ID NO: 20). A secondary library of I-OnuI variants was generated by random mutagenesis on the RD1 variant of exon 1 of PD-1 identified during the screening of the original library. Display-based stream sorting was performed under more stringent splitting conditions to highlight variants with improved catalytic efficiency. This process revealed two variants of I-OnuI (PD-1.ile3.exon1_RD2_B1H8, PD-1.ile3.exon1_RD2_B1G2, SEQ ID NOS: 12 and 60, respectively). These variants contained four (PD-1.ile3.exon1_RD2_B1H8) or five (PD-1.ile3.exon1_RD2_B1G2) amino acid mutations relative to the RD1 variant and had a significantly higher level of iRFP-expressing cells compared to the RD1 variant of exon 1PD-1, as in as a standalone HE variant, and after formatting as megaTAL (SEQ ID NO: 21 and SEQ ID NO: 64). Figure 10.

Перепрограммированный HE I-OnuI, нацеленный на сайт экзона 2 PD-1 (PD-1.IgV.exon2_RD1_G5; SEQ ID NO: 13), показал высокую эффективность экспрессии iRFP при доставке либо в виде автономного варианта HE, либо после форматирования в виде megaTAL (SEQ ID NO: 22).Reprogrammed HE I-OnuI targeting the PD-1 exon 2 site (PD-1.IgV.exon2_RD1_G5; SEQ ID NO: 13) showed high efficiency of iRFP expression when delivered either as a standalone HE variant or formatted as megaTAL (SEQ ID NO: 22).

Варианты HE, нацеленные на экзон 1 и экзон 2, проявляли сильные свойства аффинности к ДНК при измерении путем равновесного титрования субстрата с использованием их соответствующих последовательностей-мишеней. Фигура 11A.HE variants targeting exon 1 and exon 2 exhibited strong DNA affinity properties as measured by equilibrium substrate titration using their respective target sequences. Figure 11A.

Нуклеазу экзона 1 дополнительно очищали для улучшения ее специфичности в области, контактирующей с парой оснований -8, -7 и -6. Микробиблиотеки были построены путем рандомизации аминокислотных остатков 68, 70, 78, 80 и 82, и после 6 раундов сортировки с помощью проточного цитометра три клона (PD-1.ile3.exon1_RD2_B1G2C4, PD-1.ile3.exon1_RD2_B1G2C11 и PD-1.ile3.exon1_RD2_B1G2C5; SEQ ID NO: 61, 62 и 63 соответственно) показали более высокую специфичность, чем родительская нуклеаза (PD-1.ile3.exon1_RD2_B1G2; SEQ ID No: 60). Фигура 11B.Exon 1 nuclease was further purified to improve its specificity in the region in contact with base pair -8, -7 and -6. Microlibraries were constructed by randomizing amino acid residues 68, 70, 78, 80 and 82, and after 6 rounds of flow cytometer sorting three clones (PD-1.ile3.exon1_RD2_B1G2C4, PD-1.ile3.exon1_RD2_B1G2C11 and PD-1.ile3 .exon1_RD2_B1G2C5; SEQ ID NO: 61, 62 and 63, respectively) showed higher specificity than the parent nuclease (PD-1.ile3.exon1_RD2_B1G2; SEQ ID No: 60). Figure 11B.

Для оценки статуса метилирования CpG-мотивов, присутствующих в сайтах-мишенях экзона 1 и экзона 2 PD-1, использовали бисульфитное секвенирование. Фигура 12. Было показано, что мотив CpG в сайте-мишени PD-1 экзона 1 в активированных Т-клетках неметилирован, тогда как оба мотива CpG в сайте-мишени экзона 2 PD-1 метилированы. Был выполнен анализ активности на основе дисплея, чтобы подтвердить, что последовательность-мишень с полностью метилированным CpG экзона 2 PD-1 была эффективно расщеплена соответствующим вариантом HE.Bisulfite sequencing was used to assess the methylation status of CpG motifs present in exon 1 and exon 2 target sites of PD-1. Figure 12. The CpG motif at the PD-1 target site of exon 1 in activated T cells was shown to be unmethylated, while both CpG motifs at the target site of exon 2 of PD-1 were methylated. Display-based activity analysis was performed to confirm that the fully methylated CpG target sequence of exon 2 of PD-1 was efficiently cleaved by the corresponding HE variant.

Кроме того, сайт-мишень с полностью метилированным CpG экзона 2 был использован для выявления варианта I-OnuI (PD-1.IgV.exon2_RD1_PS3, SEQ ID NO: 14) с улучшенной связывающей и расщепляющей активностью в отношении CpG- метилированного сайта-мишени.In addition, a fully methylated exon 2 CpG target site was used to identify an I-OnuI variant (PD-1.IgV.exon2_RD1_PS3, SEQ ID NO: 14) with improved binding and cleaving activity for the CpG-methylated target site.

Пример 4Example 4

Направленное разрушение гена pd-1 в первичных человеческих т-клетках спасает pd-l1-опосредованное подавление функции т-клетокTargeted disruption of the pd-1 gene in primary human t cells rescues pd-l1-mediated suppression of t cell function

Функциональное воздействие megaTAL, перепрограммированных для расщепления различных последовательностей-мишеней в гене PD-1, оценивали в первичных Т-клетках человека, активированных с помощью CD3 и CD28 и культивируемых в полной среде с добавлением IL-2. Активированные PBMC трансдуцировали лентивирусным вектором, кодирующим анти-BCMA CAR. Т-клетки с анти-ВСМА CAR подвергали электропорации транскрибированной in vitro мРНК, кодирующей megaTAL, нацеленные либо на экзон 5 PD-1, либо на экзон 1 PD-1 (SEQ ID NO: 40 и 41, соответственно), и мРНК, кодирующей Trex2 (SEQ ID NO: 43). Контрольные клетки включали необработанные Т-клетки или Т-клетки, обработанные мРНК, кодирующей голубой флуоресцентный белок (CFP) или megaTAL, нацеленный на CCR5 (см. Sather et. al., Sci Transl Med. 2015 Sep 30;7(307):307ra156). После 10-дневной экспансии Т-клетки стимулировали поликлональным активирующим реагентом форбол-12-миристат-13-ацетат (PMA)/иономицин (P/I). PD-1 естественным образом активируется на клеточной поверхности после активации Т-клеток. Активация PD-1 была подавлена после трансфекции мРНК megaTAL экзона 1 PD-1, что указывает на то, что инделы в данной области нарушает нормальную выработку белка PD-1. Напротив, обработка мРНК, кодирующей контрольный CCR5-megaTAL или нацеленным на экзон 5 PD-1, megaTAL, не оказала влияния на поверхностную экспрессию PD-1, несмотря на высокий уровень инделов, индуцированных в ITSM этим megaTAL. Фигура 13А. Дальнейшие эксперименты, повторенные в сходных условиях с обогащенными по специфичности версиями мРНК экзона 1 PD-1 (SEQ ID NO: 65, 66, 67 и 68), также показали сходное нарушение экспрессии PD-1 в Т-клетках. Фигура 13BThe functional impact of megaTAL reprogrammed to cleave various target sequences in the PD-1 gene was evaluated in primary human T cells activated with CD3 and CD28 and cultured in complete medium supplemented with IL-2. Activated PBMCs were transduced with a lentiviral vector encoding anti-BCMA CAR. Anti-BCMA CAR T cells were electroporated with in vitro transcribed mRNA encoding megaTAL targeting either exon 5 of PD-1 or exon 1 of PD-1 (SEQ ID NOs: 40 and 41, respectively) and mRNA encoding Trex2 (SEQ ID NO: 43). Control cells included untreated T cells or T cells treated with mRNA encoding blue fluorescent protein (CFP) or megaTAL targeting CCR5 (see Sather et. al., Sci Transl Med. 2015 Sep 30;7(307): 307ra156). After 10 days of expansion, T cells were stimulated with the polyclonal activating reagent phorbol-12-myristate-13-acetate (PMA)/ionomycin (P/I). PD-1 is naturally activated on the cell surface after T cell activation. PD-1 activation was downregulated following transfection of PD-1 exon 1 megaTAL mRNA, indicating that indels in this region interfere with normal PD-1 protein production. In contrast, treatment with mRNA encoding the control CCR5-megaTAL or targeting PD-1 exon 5, megaTAL, had no effect on surface expression of PD-1, despite the high level of indels induced in ITSM by this megaTAL. Figure 13A. Further experiments repeated under similar conditions with specificity enriched versions of PD-1 exon 1 mRNA (SEQ ID NOs: 65, 66, 67 and 68) also showed a similar disruption of PD-1 expression in T cells. Figure 13B

Одновременная доставка megaTAL экзона 1 и экзона 5 PD-1 значительно улучшала нарушение экспрессии PD-1 на клеточной поверхности, независимо от доставки экзонуклеазы Trex2. Фигура 14. Это указывает на то, что одновременное образование проксимального разрыва ДНК является механизмом, способствующим событиям делеции большого гена с высокой эффективностью, не зависящей от экзонуклеазного усиления индела.Simultaneous delivery of megaTAL exon 1 and exon 5 of PD-1 significantly improved the disruption of PD-1 expression on the cell surface, independent of the delivery of Trex2 exonuclease. Figure 14. This indicates that the simultaneous formation of a proximal DNA break is a mechanism that promotes large gene deletion events with high efficiency, independent of indel exonuclease amplification.

Влияние нарушения передачи сигналов PD-1 в Т-клетках путем нацеливания либо на его экспрессию, либо на его сигнальные функции анализировали на основании выработки цитокинов в клетке CAR-T в ответ на опухолевые клетки, модифицированные для экспрессии лиганда PD-1, PD-L1. Совместное культивирование анти-BCMA CAR T-клеток с BCMA-экспрессирующими опухолевыми клеточными линиями приводило к активации T-клеток и последующей секреции воспалительных цитокинов, примером чего являются высокие уровни TNFα и IL-17A, измеренные в супернатанте. Коэкспрессия PD-L1 на BCMA-экспрессирующих опухолевых клетках подавляла выработку воспалительных цитокинов. Однако трансфекция анти-BCMA CAR T-клеток мРНК, кодирующей megaTALs либо экзона 1 либо экзона 5 PD-1, снижает опосредованную PD-L1 супрессию цитокинов, так как выработка воспалительных цитокинов в этих образцах восстанавливается до базовых уровней Фигура 15A.The effect of disrupting PD-1 signaling in T cells by targeting either its expression or its signaling functions was analyzed based on cytokine production in the CAR-T cell in response to tumor cells modified to express the PD-1 ligand, PD-L1 . Co-culture of anti-BCMA CAR T cells with BCMA-expressing tumor cell lines resulted in T cell activation and subsequent secretion of inflammatory cytokines, exemplified by high levels of TNFα and IL-17A measured in the supernatant. Co-expression of PD-L1 on BCMA-expressing tumor cells suppressed the production of inflammatory cytokines. However, transfection of anti-BCMA CAR T cells with mRNA encoding either exon 1 or exon 5 PD-1 megaTALs reduces PD-L1 mediated cytokine suppression as inflammatory cytokine production in these samples is restored to baseline levels. Figure 15A.

Пример 5Example 5

Гомологичная рекомбинация трансгена в экзон 1 гена PD-1Homologous recombination of the transgene into exon 1 of the PD-1 gene

Была разработана и сконструирована плазмида рекомбинантного адено-ассоциированного вируса (rAAV), содержащая промотор-трансгенную кассету, содержащую гетерологичный промотор, трансген, кодирующий флуоресцентный белок, и сигнал полиаденилирования, расположенный между областями гомологии, нацеленными на гены. Целостность элементов AAV ITR была проверена с помощью лизата XmaI. Трансгенную кассету помещали между двумя гомологичными областями, длиной приблизительно 600-700 п.н., фланкирующими сайт расщепления megaTAL экзона 1 PD-1 (SEQ ID NO: 27). 5'-гомологичное плечо (SEQ ID NO: 54) содержало часть первого экзона PD-1 и другие последовательности в направлении против транскрипции от сайта расщепления megaTAL. 3'-гомологичное плечо (SEQ ID NO: 55) содержало часть экзона PD-1 и другие последовательности, расположенные по ходу транскрипции от сайта расщепления megaTAL. Ни одна гомологичная область не содержала полного сайта-мишени megaTAL. Указанная иллюстративная кассета экспрессии содержала промотор энхансера вируса миелопролиферативной саркомы с делецией опосредующего отрицательную регуляцию участка, с заменой на праймер-связывающий сайт из dl587rev (MND), функционально связанный с полинуклеотидом, кодирующим флуоресцентный полипептид, например синий флуоресцентный белок (BFP), красный флуоресцентный белок (RFP), голубой флуоресцентный белок (CFP), зеленый флуоресцентный белок (GFP) и т.д. Кроме того, кассета экспрессии содержала сигнал позднего полиаденилирования SV40, расположенный по ходу транскрипции от кодона терминации трансгена. Фигура 16А. Рекомбинантный AAV (rAAV) получали путем транзиторной котрансфекции клеток HEK 293T плазмидами, обеспечивающими репликационные, капсидные и аденовирусные хелперные элементы, необходимые для выработки вируса. Рекомбинантный rAAV был выделен из совместно трансфицированной культуры клеток HEK 293T с использованием ультрацентрифугирования в градиенте йодиксанола.A recombinant adeno-associated virus (rAAV) plasmid was designed and constructed containing a promoter-transgene cassette containing a heterologous promoter, a transgene encoding a fluorescent protein, and a polyadenylation signal located between regions of homology targeting genes. The integrity of the AAV ITR elements was verified using the XmaI lysate. The transgene cassette was placed between two homologous regions, approximately 600-700 bp long, flanking the megaTAL cleavage site of exon 1 of PD-1 (SEQ ID NO: 27). The 5' homologous arm (SEQ ID NO: 54) contained part of the first exon of PD-1 and other sequences upstream from the megaTAL cleavage site. The 3' homologous arm (SEQ ID NO: 55) contained a portion of the PD-1 exon and other sequences downstream of the megaTAL cleavage site. None of the homologous regions contained the complete megaTAL target site. Said exemplary expression cassette contained a myeloproliferative sarcoma virus enhancer promoter with a deletion of the downregulation-mediating region, replaced by a primer-binding site from dl587rev (MND) operably linked to a polynucleotide encoding a fluorescent polypeptide, e.g. blue fluorescent protein (BFP), red fluorescent protein (RFP), blue fluorescent protein (CFP), green fluorescent protein (GFP), etc. In addition, the expression cassette contained the SV40 late polyadenylation signal located downstream of the transgene termination codon. Figure 16A. Recombinant AAV (rAAV) was generated by transient co-transfection of HEK 293T cells with plasmids providing the replication, capsid, and adenoviral helper elements required for virus production. Recombinant rAAV was isolated from a co-transfected HEK 293T cell culture using iodixanol gradient ultracentrifugation.

MegaTAL-индуцированную гомологичную рекомбинацию оценивали в первичных Т-клетках человека, активированных CD3 и CD28 и культивируемых в полной среде с добавлением IL-2. После 3 дней культивирования Т-клетки промывали и подвергали электропорации транскрибированной in vitro мРНК megaTAL экзона 1 PD-1 (SEQ ID NO: 41), а затем трансдуцировали очищенной трансгенной кассетой, кодирующей рекомбинантный AAV, MND-GFP (SEQ ID NO: 53). Контрольная группа включала Т-клетки, обработанные мРНК megaTAL или вектором, нацеленным на rAAV. Использовали проточную цитометрию для измерения в нескольких временных точках доли Т-клеток, экспрессирующих флуоресцентный белок, и для дифференциации транзитороной экспрессии флуоресцентного белка из эписомального rAAV-нацеленного вектора от долговременной экспрессии хромосомно интегрированной кассеты. Фигура 16B. Опосредованное MegaTAL разрушение гена PD-1 обнаруживали секвенированием и по потере экспрессии PD-1 после активации поликлональных Т-клеток.MegaTAL-induced homologous recombination was evaluated in primary human T cells activated by CD3 and CD28 and cultured in complete medium supplemented with IL-2. After 3 days of culture, T cells were washed and electroporated with in vitro transcribed PD-1 exon 1 megaTAL mRNA (SEQ ID NO: 41) and then transduced with a purified transgenic cassette encoding recombinant AAV, MND-GFP (SEQ ID NO: 53) . The control group included T cells treated with megaTAL mRNA or a vector targeted to rAAV. Flow cytometry was used to measure, at multiple time points, the proportion of T cells expressing the fluorescent protein and to differentiate transient expression of fluorescent protein from an episomal rAAV-targeted vector from long-term expression of a chromosomally integrated cassette. Figure 16B. MegaTAL-mediated disruption of the PD-1 gene was detected by sequencing and loss of PD-1 expression after polyclonal T cell activation.

Долговременную экспрессию трансгена наблюдали в 20-60% Т-клеток, которые были обработаны вектором, нацеленным как на megaTAL, так и на rAAV. В контрольных образцах обработка только rAAV приводила к вариабельным уровням транзитороной экспрессии флуоресцентного белка и очень низким уровням (<1%) длительной экспрессии флуоресцентного белка в обработанных Т-клетках, что согласуется с отсутствием интеграции в геном. Результаты были подтверждены в экспериментах, проведенных на Т-клетках, выделенных от нескольких независимых доноров.Long-term expression of the transgene was observed in 20-60% of T cells that were treated with a vector that targeted both megaTAL and rAAV. In controls, rAAV-only treatment resulted in variable levels of transient fluorescent protein expression and very low levels (<1%) of long-term fluorescent protein expression in treated T cells, consistent with a lack of genome integration. The results were confirmed in experiments carried out on T cells isolated from several independent donors.

Пример 6Example 6

Гомологичная рекомбинация трансгена, кодирующего химерный антигенный рецептор (CAR) в ген PD-1Homologous recombination of a transgene encoding a chimeric antigen receptor (CAR) into the PD-1 gene

Плазмиды рекомбинантного адено-ассоциированного вируса (rAAV) разрабатывали, конструировали и верифицировали, как описано выше, за исключением того, что трансгенная кассета, кодирующая анти-CD19 CAR (SEQ ID NO: 56) или анти-BCMA CAR (SEQ ID NO: 57) была помещена между гомологичными областями направленным на экзон 1 PD-1. Кассеты экспрессии CAR содержали промотор MND, функционально связанный с полинуклеотидом, кодирующим CAR, содержащим полученный из CD8α сигнальный пептид, одноцепочечный вариабельный фрагмент (scFv), нацеленный либо на антиген CD19, либо на антиген созревания В-клеток (BCMA), полученная из CD8α. шарнирная область и трансмембранный домен, внутриклеточный костимулирующий домен 4-1BB, CD3 дзета-сигнальный домен и гомологичные плечи, предназначенные для нацеливания на сайт-мишень экзона 1 PDCD1 (SEQ ID NO: 54 и 55).Recombinant adeno-associated virus (rAAV) plasmids were designed, constructed and verified as described above, except that the transgenic cassette encoding the anti-CD19 CAR (SEQ ID NO: 56) or anti-BCMA CAR (SEQ ID NO: 57 ) was placed between homologous regions directed to exon 1 of PD-1. The CAR expression cassettes contained an MND promoter operably linked to a polynucleotide encoding a CAR containing a signal peptide derived from CD8α, a single chain variable fragment (scFv) targeted either at the CD19 antigen or at the B cell maturation antigen (BCMA) derived from CD8α. a hinge region and a transmembrane domain, an intracellular co-stimulatory domain 4-1BB, a CD3 zeta signaling domain, and homologous arms designed to target the target site of exon 1 of PDCD1 (SEQ ID NOS: 54 and 55).

Первичные человеческие Т-клетки активировали CD3 и CD28 и выращивали в среде с добавками цитокинов, как описано выше. Гомологичную рекомбинацию трансгенов CAR в экзон 1 PD-1 сайт-мишень оценивали с использованием активированных первичных человеческих Т-клеток, электропорированных in vitro транскрибированной мРНК экзона 1 PD-1 (SEQ ID NO: 41), а затем трансдуцированных кодирующим rAAV анти-CD19 или анти-ВСМА CAR. Проточную цитометрию для определения экспрессии CAR проводили через 10 дней, то есть через 7 дней после электропорации и трансдукции. Контрольные образцы включали Т-клетки, обработанные либо мРНК megaTAL, либо вектором, нацеленным на rAAV. Экспрессию CD19-CAR и BCMA-CAR анализировали с использованием рекомбинантных PE-конъюгированных CD19-Fc или PE-конъюгированных BCMA-Fc окрашивающих реагентов. Т-клетки, обработанные мРНК megaTAL и rAAV-CAR, показали экспрессию CD19-CAR в 30-60% Т-клеток и экспрессию BCMA-CAR в 10-20% Т-клеток. Фигура 16B. Наблюдались сходные скорости размножения Т-клеток и неразличимые фенотипы Т-клеток между необработанными, rAAV-обработанными и megaTAL/rAAV CAR-обработанными Т-клетками.Primary human T cells were activated with CD3 and CD28 and grown in cytokine supplemented media as described above. Homologous recombination of CAR transgenes into PD-1 exon 1 target site was assessed using activated primary human T cells electroporated in vitro with transcribed PD-1 exon 1 mRNA (SEQ ID NO: 41) and then transduced with anti-CD19 coding rAAV or anti-BCMA CAR. Flow cytometry to determine CAR expression was performed 10 days later, i.e. 7 days after electroporation and transduction. Control samples included T cells treated with either megaTAL mRNA or a vector targeted to rAAV. Expression of CD19-CAR and BCMA-CAR was analyzed using recombinant PE-conjugated CD19-Fc or PE-conjugated BCMA-Fc staining reagents. T cells treated with megaTAL mRNA and rAAV-CAR showed CD19-CAR expression in 30-60% of T cells and BCMA-CAR expression in 10-20% of T cells. Figure 16B. Similar T cell proliferation rates and indistinguishable T cell phenotypes were observed between untreated, rAAV-treated and megaTAL/rAAV CAR-treated T cells.

Пример 7Example 7

Гомологичная рекомбинация лишенного промотора трансгена в ген pd-1Homologous recombination of a promoter-deprived transgene into the pd-1 gene

Была разработана, сконструирована и верифицирована плазмида рекомбинантного адено-ассоциированного вируса (rAAV), содержащая флуоресцентный репортерый трансген (mCherry) и сигнал полиаденилирования, но без экзогенного промотора (SEQ ID NO: 58). Фигура 17. Стартовый кодон mCherry сливается и перекрывается с эндогенным стартовым кодоном PD-1, заменяя остальную часть экзона 1 PD-1 на кДНК, кодирующую белок mCherry. Эта стратегия стимулирует экспрессию флуоресцентного белка от эндогенного промотора PD-1, а также нарушает нормальную экспрессию белка PD-1.A recombinant adeno-associated virus (rAAV) plasmid was designed, constructed, and verified containing a fluorescent reporter transgene (mCherry) and a polyadenylation signal, but without an exogenous promoter (SEQ ID NO: 58). Figure 17. The mCherry start codon is fused and overlapped with the endogenous PD-1 start codon, replacing the rest of exon 1 of PD-1 with the cDNA encoding the mCherry protein. This strategy stimulates the expression of a fluorescent protein from the endogenous PD-1 promoter and also disrupts the normal expression of the PD-1 protein.

Первичные человеческие Т-клетки активировали, электропорировали транскрибированной мРНК megaTAL in vitro и трансдуцировали rAAV, как описано выше. Контрольные клетки включали Т-клетки, обработанные мРНК megaTAL или вектором, нацеленным на rAAV. Экспрессию флуоресцентного репортера анализировали с помощью проточной цитометрии в различные моменты времени после трансфекции, в присутствии или в отсутствие активации поликлональных Т-клеток, используя форбол-12-миристат-13-ацетат (PMA)/иономицин (P/I). В Т-клетках, обработанных только мРНК megaTAL или вектором, нацеленным на rAAV, экспрессия репортера не наблюдалась. Подобные показатели активности megaTAL наблюдались с или без трансдукции rAAV. Низкоуровневая экспрессия флуоресцентного репортера наблюдалась в Т-клетках, которые получали как megaTAL, так и нацеливающий на rAAV вектор, и были активированы P/I в течение 48 часов. Экспрессия флуоресцентного репортера, обусловленная эндогенным промотором PD-1, была ниже по сравнению с экспрессией рецептора, управляемого гетерологичным промотором (снижение интенсивности флуоресценции в ~5 раз).Primary human T cells were activated, electroporated with transcribed megaTAL mRNA in vitro, and transduced with rAAV as described above. Control cells included T cells treated with megaTAL mRNA or a vector targeted to rAAV. Fluorescent reporter expression was analyzed by flow cytometry at various time points after transfection, in the presence or absence of polyclonal T cell activation, using phorbol-12-myristate-13-acetate (PMA)/ionomycin (P/I). In T cells treated with megaTAL mRNA alone or with a vector targeted to rAAV, reporter expression was not observed. Similar measures of megaTAL activity were observed with or without rAAV transduction. Low-level expression of the fluorescent reporter was observed in T cells that received both megaTAL and the rAAV-targeting vector and were activated by P/I for 48 hours. Expression of the fluorescent reporter driven by the endogenous PD-1 promoter was lower than that of the receptor driven by the heterologous promoter (~5-fold decrease in fluorescence intensity).

Пример 8Example 8

Конститутивная экспрессия PD-1 после гомологичной рекомбинации трансгена, кодирующего флуоресцентный белок, в экзон 5 гена PD-1Constitutive expression of PD-1 after homologous recombination of a transgene encoding a fluorescent protein into exon 5 of the PD-1 gene

Была разработана, сконструирована и верифицирована рекомбинантная плазмида адено-ассоциированного вируса (rAAV), содержащая гетерологичный промотор, трансген синего флуоресцентного белка (BFP) и сигнал полиаденилирования (SEQ ID NO: 44) для введения в экзон 5 PD-1. Трансгенная кассета была помещена между 1,3 т.п.н. и 1,0 т.п.н.гомологичными плечами, фланкирующими сайт расщепления megaTAL экзона 5 PD-1. 5'-гомологичное плечо (SEQ ID NO: 45) включало в себя часть экзона 5 PD-1 в направлении против хода транскрипции от сайта megaTAL, и другие последовательности в направлении против хода транскрипции. 3'-гомологичное плечо (SEQ ID NO: 46) содержало концевую кодирующую последовательность экзона 5 PD-1 и другие последовательности по ходу транскрипции. Ни одна гомологичная область не содержала полного сайта-мишени megaTAL. Фигура 18.A recombinant adeno-associated virus (rAAV) plasmid containing a heterologous promoter, a blue fluorescent protein (BFP) transgene, and a polyadenylation signal (SEQ ID NO: 44) was designed, constructed, and verified for introduction into exon 5 of PD-1. The transgenic cassette was placed between 1.3 kb. and 1.0 kb homologous arms flanking the megaTAL cleavage site of exon 5 of PD-1. The 5' homologous arm (SEQ ID NO: 45) included a portion of exon 5 of PD-1 upstream from the megaTAL site, and other sequences upstream. The 3' homologous arm (SEQ ID NO: 46) contained the terminal coding sequence for exon 5 of PD-1 and other sequences downstream of transcription. None of the homologous regions contained the complete megaTAL target site. Figure 18.

Первичные человеческие Т-клетки активировали CD3 и CD28, электропорировали in vitro транскрибированной мРНК megaTAL экзона 5 PD-1 (SEQ ID NO: 40), затем трансдуцировали rAAV, кодирующим трансген флуоресцентного репортера. Контрольные клетки включали необработанные Т-клетки и Т-клетки, обработанные только вектором, нацеленным на rAAV. Экспрессию флуоресцентного репортера анализировали проточной цитометрией в различные моменты времени после трансфекции. Клетки, обработанные одним rAAV, демонстрировали транзиторную экспрессию BFP, которая снижалась до фоновых уровней во время размножения клеток. Т-клетки, которые получали как мРНК megaTAL экзона 5 PD-1, так и вектор rAAV, демонстрировали стабильную популяцию Т-клеток, экспрессирующих BFP, которые сохранялись в течение всего периода культивирования ex vivo.Primary human T cells were activated with CD3 and CD28, electroporated in vitro with transcribed PD-1 exon 5 megaTAL mRNA (SEQ ID NO: 40), then transduced with rAAV encoding the fluorescent reporter transgene. Control cells included untreated T cells and T cells treated with rAAV targeting vector only. Fluorescent reporter expression was analyzed by flow cytometry at various time points after transfection. Cells treated with rAAV alone showed transient expression of BFP, which decreased to background levels during cell expansion. T cells that received both PD-1 exon 5 megaTAL mRNA and the rAAV vector showed a stable population of BFP-expressing T cells that persisted throughout the ex vivo culture period.

Т-клетки, обработанные мРНК megaTAL экзона 5 PD-1 и вектором rAAV, имели отчетливый паттерн экспрессии PD-1, в результате чего в отсутствие активации почти все BFP-экспрессирующие клетки также экспрессировали белок PD-1. Это указывает на то, что стратегия нацеливания изменила нормальную регуляцию гена PD-1 на конститутивный, а не индуцибельный паттерн экспрессии. Более того, благодаря нацеливанию на экзон 5 PD-1 конститутивно экспрессируемый белок в этой стратегии нацеливания представляет собой вариант PD-1, который обладает нарушенной ингибирующей передачей сигналов и который может действовать как доминантный отрицательный рецептор. Экспрессия PD-1 не была повышена в Т-клетках, обработанных мРНК 5 megaTAL экзона PD-1 или в Т-клетках, обработанных мРНК megaTAL и rAAV, содержащих гомологичные плечи к экзону 1. Фигура 19.T cells treated with PD-1 exon 5 megaTAL mRNA and rAAV vector had a distinct PD-1 expression pattern, resulting in almost all BFP-expressing cells also expressing PD-1 protein in the absence of activation. This indicates that the targeting strategy changed the normal regulation of the PD-1 gene to a constitutive rather than an inducible expression pattern. Moreover, by targeting exon 5 of PD-1, the constitutively expressed protein in this targeting strategy is a PD-1 variant that has impaired inhibitory signaling and that can act as a dominant negative receptor. PD-1 expression was not upregulated in PD-1 exon 5 megaTAL mRNA-treated T cells or in megaTAL and rAAV mRNA-treated T cells containing homologous arms to exon 1. Figure 19.

Пример 9Example 9

Гомологичная рекомбинация трансгена в ген PD-1 не зависит от одиночного нуклеотидного полиморфизма (SNP)Homologous recombination of transgene into PD-1 gene is independent of single nucleotide polymorphism (SNP)

Локус PD-1 является генетически гетерогенным, с высокой распространенностью SNP, присутствующих как в интронных, так и в экзонных областях. Присутствие дивергентных SNP вблизи сайта расщепления megaTAL может потенциально влиять на эффективность гомологичной рекомбинации в локусе PD-1. Плазмиды рекомбинантного адено-ассоциированного вируса (rAAV), включающие гетерологичный промотор, трансген флуоресцентного белка и поздний сигнал полиаденилирования SV40, были разработаны для оценки воздействия SNP, затем сконструированы и верифицированы, как описано выше (SEQ ID NO: 47 и 48). Гомологичные плечи были либо идентичны консенсусной последовательности PD-1, либо они были разработаны для включения точечных мутаций из обычных SNP, проксимальных к сайту нацеливания на megaTAL экзона 5 PD-1. В этих конструкциях 5'-гомологичное плечо (L-SNP, SEQ ID NO: 49) содержит интронный G/A SNP (rs6705653), расположенный в 220 п.н. в направлении против хода транскрипции от сайта расщепления megaTAL, в то время как 3'-гомологичное плечо (R-SNP, SEQ ID NO: 50) содержит молчащий C/T SNP (rs2227981), расположенный в 68 п.н. по ходу транскрипции от сайта расщепления megaTAL PD-1. Фигура 20.The PD-1 locus is genetically heterogeneous, with a high abundance of SNPs present in both intron and exon regions. The presence of divergent SNPs near the megaTAL cleavage site could potentially influence the efficiency of homologous recombination at the PD-1 locus. Recombinant adeno-associated virus (rAAV) plasmids comprising a heterologous promoter, a fluorescent protein transgene and an SV40 late polyadenylation signal were designed to assess SNP exposure, then constructed and verified as described above (SEQ ID NOS: 47 and 48). The homologous arms were either identical to the PD-1 consensus sequence, or they were designed to include point mutations from normal SNPs proximal to the megaTAL targeting site of exon 5 of PD-1. In these constructs, the 5' homologous arm (L-SNP, SEQ ID NO: 49) contains an intron G/A SNP (rs6705653) located at 220 bp. upstream of the megaTAL cleavage site, while the 3' homologous arm (R-SNP, SEQ ID NO: 50) contains a silent C/T SNP (rs2227981) located at 68 bp. downstream from the megaTAL PD-1 cleavage site. Figure 20.

Первичные человеческие Т-клетки активировали CD3 и CD28, электропорировали транскрибированной in vitro мРНК megaTAL и трансдуцировали rAAV, кодирующим консенсусные гомологичные плечи, или rAAV, несущим либо L-SNP, либо R-SNP гомологичные плечи. Контрольные клетки включали Т-клетки, трансдуцированные только направленным вектором rAAV. Экспрессию флуоресцентного белка анализировали проточной цитометрией в разные моменты времени после трансдукции. Экспрессия флуоресцентного белка снизилась до фоновых уровней в образцах, которые получали только rAAV, в то время как Т-клетки, обработанные megaTAL в сочетании с rAAV, продемонстрировали стабильные уровни экспрессии флуоресцентного белка. Все образцы демонстрировали схожие уровни флуоресценции, несмотря на то, что их обрабатывали либо не-SNP-содержащими rAAV векторами, либо векторами, содержащими L -или R-варианты SNP, что указывает на то, что SNP, проксимальные к сайту-мишени megaTAL, не влияют или не оказывают существенного влияния на HR на сайте-мишени.Primary human T cells were activated with CD3 and CD28, electroporated with in vitro transcribed megaTAL mRNA, and transduced with rAAV encoding consensus homologous arms or rAAV carrying either L-SNP or R-SNP homologous arms. Control cells included T cells transduced with the targeted rAAV vector only. Fluorescent protein expression was analyzed by flow cytometry at different time points after transduction. Fluorescent protein expression decreased to background levels in samples that received rAAV alone, while T cells treated with megaTAL in combination with rAAV showed stable levels of fluorescent protein expression. All samples showed similar levels of fluorescence despite being treated with either non-SNP-containing rAAV vectors or vectors containing L- or R-variant SNPs, indicating that SNPs proximal to the megaTAL target site do not affect or have no significant effect on HR at the target site.

Пример 10Example 10

Гомологичная рекомбинация трансгена, кодирующего рецептор-переключатель, в локус PDCD1Homologous recombination of a transgene encoding the switch receptor into the PDCD1 locus

Рецепторы-переключатели представляют собой сконструированные химерные молекулы, способные преобразовывать внеклеточные ингибирующие сигналы в сигналы внутриклеточной активации, однако их эффективность часто коррелирует с их способностью подавлять нативную экспрессию природных рецепторов. Один из способов обойти это ограничение - встроить рецептор-переключатель в нативный локус и нарушить естественный рецептор. Плазмида рекомбинантного адено-ассоциированного вируса (rAAV), содержащая гетерологичный промотор, трансген, кодирующий внеклеточный лиганд-связывающий домен PD-1 и внутриклеточный сигнальный домен CD28 (рецептор-переключатель PD-1, SEQ ID NO: 59), и поздний сигнал полиаденилирования SV40, была разработана для нацеливания на экзон 5 PD-1, сконструирована и верифицирована. 5'-гомологичное плечо включало в себя часть экзона 5 PD-1 в направлении против хода транскрипции от сайта расщепления megaTAL, содержащего ITIM и другие последовательности в направлении против хода транскрипции. 3'-гомологичное плечо содержало концевую кодирующую последовательность экзона 5 PD-1 и часть UTR-области и было укорочено до ~ 650 п.н. для размещения кДНК рецептора-переключателя. Ни одна гомологичная область не содержала полного сайта-мишени megaTAL. Фигура 21.Switch receptors are engineered chimeric molecules capable of converting extracellular inhibitory signals into intracellular activation signals, but their effectiveness often correlates with their ability to downregulate native expression of natural receptors. One way to get around this limitation is to insert a switch receptor into the native locus and disrupt the natural receptor. Recombinant adeno-associated virus (rAAV) plasmid containing a heterologous promoter, a transgene encoding the PD-1 extracellular ligand-binding domain and the CD28 intracellular signaling domain (PD-1 switch receptor, SEQ ID NO: 59), and the SV40 polyadenylation late signal , was designed to target exon 5 of PD-1, constructed and verified. The 5' homologous arm included a portion of exon 5 of PD-1 upstream from the megaTAL cleavage site containing ITIM and other sequences upstream. The 3' homologous arm contained the terminal coding sequence for exon 5 of PD-1 and part of the UTR region and was shortened to ~650 bp. to host the switch receptor cDNA. None of the homologous regions contained the complete megaTAL target site. Figure 21.

Первичные Т-клетки человека активировали CD3 и CD28, электропорировали in vitro транскрибированной мРНК экзона 5 megaTAL экзона PD-1 и трансдуцировали направленным на rAAV вектором, кодирующим рецептор-переключатель PD-1. Контрольные клетки включали образцы, которые получали только megaTAL или rAAV. Экспрессию рецептора-переключателя PD-1 анализировали путем окрашивания анти-PD-1 антителом в отсутствие стимуляции Т-клеток. Наблюдались высокие уровни экспрессии в Т-клетках, обработанных мРНК megaTAL экзона 5 PD-1 и трансдуцированных rAAV.Primary human T cells were activated with CD3 and CD28, electroporated in vitro with transcribed mRNA of PD-1 exon 5 megaTAL exon 5, and transduced with an rAAV-targeted vector encoding the PD-1 switch receptor. Control cells included samples that received only megaTAL or rAAV. Expression of the PD-1 switch receptor was analyzed by anti-PD-1 antibody staining in the absence of T cell stimulation. High levels of expression were observed in T cells treated with PD-1 exon 5 megaTAL mRNA and transduced with rAAV.

Пример 11Example 11

Дальнодействующее вырезание внутриклеточной сигнальной области PD-1 с применением HDRLong-range excision of the PD-1 intracellular signaling region using HDR

Известно, что механизм гомологичной рекомбинации включает механизмы «поиска» гомологии, которые могут охватывать отдаленные геномные последовательности. Без привязки к какой-либо конкретной теории, предполагается, что более существенные участки генов-мишеней или хромосомных областей могут быть подвержены эффективному манипулированию с применением комбинации доставки megaTAL и rAAV. Была разработана, сконструирована и верифицирована плазмида рекомбинантного адено-ассоциированного вируса (rAAV), включающая гетерологичный промотор, трансген BFP и поздний сигнал полиаденилирования SV40, фланкированный гомологичными плечами для оценки дистальных событий HR (SEQ ID NO: 52). Трансген был фланкирован 5'-гомологичным плечом 1,3 т.п.н., начинающимся направлении против хода транскрипции от экзона 3 PD-1 и заканчивающимся непосредственно перед началом экзона 4. 3'- гомологичное плечо содержало концевую кодирующую последовательность экзона 5 PD-1 и часть UTR области. Ни одна гомологичная область не содержала полного сайта-мишени megaTAL. Успешная гомологичная рекомбинация предназначена для устранения всей внутриклеточной сигнальной области PD-1, чтобы при этом на обработанной клетке оставалась только внеклеточная и трансмембранная часть PD-1. Фигура 22.It is known that the mechanism of homologous recombination includes the mechanisms of "search" for homology, which can cover distant genomic sequences. Without wishing to be bound by any particular theory, it is believed that more significant portions of target genes or chromosomal regions can be effectively manipulated using a combination of megaTAL and rAAV delivery. A recombinant adeno-associated virus (rAAV) plasmid was designed, constructed, and verified, comprising a heterologous promoter, a BFP transgene, and an SV40 late polyadenylation signal flanked by homologous arms to assess distal HR events (SEQ ID NO: 52). The transgene was flanked by a 1.3 kb 5' homologous arm that started upstream from exon 3 of PD-1 and ended just before the start of exon 4. The 3' homologous arm contained the terminal coding sequence for exon 5 of PD-1. 1 and part of the UTR area. None of the homologous regions contained the complete megaTAL target site. Successful homologous recombination is designed to eliminate the entire intracellular signaling region of PD-1, leaving only the extracellular and transmembrane portion of PD-1 on the treated cell. Figure 22.

Первичные человеческие Т-клетки активируют CD3 и CD28, электропорируют транскрибируемой in vitro мРНК megaTAL и трансдуцируют BFP, кодирующим нацеленный на rAAV вектор, содержащий дистальне 5'-гомологичное плечо. Контрольные клетки включают Т-клетки, обработанные вектором, нацеленным на megaTAL или rAAV. Стабильная экспрессия BFP наблюдается только в образцах, которые получили мРНК megaTAL, нацеленного на экзон 5 и rAAV, и PDCD1.Primary human T cells activate CD3 and CD28, are electroporated with in vitro transcribed megaTAL mRNA, and transduced with BFP encoding an rAAV-targeted vector containing a distal 5' homologous arm. Control cells include T cells treated with a vector targeted to megaTAL or rAAV. Stable expression of BFP was observed only in samples that received mRNA of megaTAL targeting exon 5 and rAAV and PDCD1.

Пример 12Example 12

Разрушение гена PD-1 и антитело-опосредованная блокада PD1Destruction of the PD-1 gene and antibody-mediated blockade of PD1

в первичных Т-клетках человека in vitroin primary human T cells in vitro

Функциональное воздействие megaTAL, перепрограммированных для расщепления различных последовательностей-мишеней в гене PD-1, оценивали в первичных Т-клетках человека, активированных CD3 и CD28 и культивируемых в полной среде с добавлением IL-2. Активированные PBMC трансдуцировали лентивирусным вектором, кодирующим анти-BCMA CAR. Анти-BCMA CAR-Т-клетки подвергали электропорации транскрибированной in vitro мРНК, кодирующей megaTAL, нацеленные либо на экзон 5 PD-1, либо на экзон 1 PD-1 (SEQ ID NO: 40 и 41, соответственно), и мРНК, кодирующей Trex2 (SEQ ID NO: 43). Контрольные клетки включали Т-клетки, электропорированные без мРНК (имитационные Mock EP), или Т-клетки, электропорированные мРНК, кодирующей megaTAL, специфичный для TCRα, который не обладает каталитической активностью.The functional impact of megaTAL reprogrammed to cleave various target sequences in the PD-1 gene was evaluated in primary human T cells activated by CD3 and CD28 and cultured in complete medium supplemented with IL-2. Activated PBMCs were transduced with a lentiviral vector encoding an anti-BCMA CAR. Anti-BCMA CAR T cells were electroporated with in vitro transcribed mRNA encoding megaTAL targeting either exon 5 of PD-1 or exon 1 of PD-1 (SEQ ID NOS: 40 and 41, respectively) and mRNA encoding Trex2 (SEQ ID NO: 43). Control cells included T cells electroporated without mRNA (mock EP mocks) or T cells electroporated with mRNA encoding TCRα-specific megaTAL, which has no catalytic activity.

После 10-дневного размножения Т-клетки совместно культивировали с клетками А549, трансдуцированными лентивирусным вектором, кодирующим BCMA-GFP. CAR Т-клетки совместно культивировали с клетками-мишенями A549 отдельно или в присутствии 20 мкг/мл анти-PD-1-антитела. Клетки совместно культивировали в течение 72 часов, и анализировали уровни цитокинов в супернатантах с применением анализа с использованием микросфер (Intellicyt QBeads). В отсутствие анти-PD-1-антитела клетки, которые были обработаны megaTAL либо PD1-Ex1, либо PD1-Ex5, показали повышенную выработку IFNγ и TNFα по сравнению с контрольными клетками - имитационными Mock EP и TCRα. Добавление антитела αPD-1 устраняет эту разницу, что приводит к эквивалентному уровню секреции IFNγ и TNFα в супернатантах, полученных из контрольных и обработанных PD1 megaTAL клеток (Фигура 15B).After 10 days of expansion, T cells were co-cultured with A549 cells transduced with a lentiviral vector encoding BCMA-GFP. CAR T cells were co-cultured with A549 target cells alone or in the presence of 20 μg/ml anti-PD-1 antibody. Cells were co-cultured for 72 hours and cytokine levels in the supernatants were analyzed using a microbead assay (Intellicyt QBeads). In the absence of anti-PD-1 antibody, cells that were treated with megaTAL with either PD1-Ex1 or PD1-Ex5 showed increased production of IFNγ and TNFα compared to control Mock EP and TCRα mock cells. The addition of the αPD-1 antibody eliminates this difference, resulting in an equivalent level of IFNγ and TNFα secretion in supernatants derived from control and PD1 megaTAL-treated cells (Figure 15B).

Пример 13Example 13

Гомологичная рекомбинация трансгена, лишенного промотора, в ген PD-1Homologous recombination of a transgene lacking a promoter into the PD-1 gene

Была разработана, сконструирована и верифицирована плазмида рекомбинантного адено-ассоциированного вируса (rAAV), содержащая трансген флуоресцентного репортера (mCherry) и сигнал полиаденилирования, но без экзогенного промотора (SEQ ID NO: 58). Фигура 17. Стартовый кодон mCherry сливается и перекрывается с эндогенным стартовым кодоном PD-1, при этом заменяя остальную часть экзона 1 PD-1 на кДНК, кодирующую белок mCherry. Эта стратегия стимулирует экспрессию флуоресцентного белка из эндогенного промотора PD-1, а также нарушает нормальную экспрессию белка PD-1.A recombinant adeno-associated virus (rAAV) plasmid containing a fluorescent reporter transgene (mCherry) and a polyadenylation signal but without an exogenous promoter was designed, constructed and verified (SEQ ID NO: 58). Figure 17. The mCherry start codon fuses and overlaps with the endogenous PD-1 start codon, while replacing the rest of exon 1 of PD-1 with the cDNA encoding the mCherry protein. This strategy stimulates the expression of a fluorescent protein from the endogenous PD-1 promoter and also disrupts the normal expression of the PD-1 protein.

Первичные человеческие Т-клетки активировали, электропорировали транскрибированной in vitro мРНК megaTAL и трансдуцировали rAAV, как описано выше. Контрольные образцы включали Т-клетки, обработанные мРНК megaTAL или вектором, нацеленным на rAAV. Экспрессию флуоресцентного репортера анализировали с помощью проточной цитометрии через 24 часа после стимуляции в присутствии или в отсутствие активации поликлональных Т-клеток с использованием форбол-12-миристат-13-ацетата (PMA)/иономицина (P/I). В необработанных Т-клетках экспрессия megaTAL не наблюдалась. Перед стимуляцией P/I низкие базальные уровни экспрессии флуоресцентного репортера наблюдались в Т-клетках, которые получали и megaTAL и нацеленный на rAAV вектор для HDR. Двадцать четыре часа стимуляции P/I увеличивали экспрессию флуоресцентного репортера, вызванную эндогенным PD-1, с 3% до 27,3% (сравните верхнюю и нижнюю правые панели на рисунке 17).Primary human T cells were activated, electroporated with in vitro transcribed megaTAL mRNA, and transduced with rAAV as described above. Control samples included T cells treated with megaTAL mRNA or a vector targeted to rAAV. Fluorescent reporter expression was analyzed by flow cytometry 24 hours after stimulation in the presence or absence of polyclonal T cell activation using phorbol-12-myristate-13-acetate (PMA)/ionomycin (P/I). In untreated T cells, megaTAL expression was not observed. Prior to P/I stimulation, low basal levels of fluorescent reporter expression were observed in T cells that received both megaTAL and the rAAV-targeted vector for HDR. Twenty-four hours of P/I stimulation increased endogenous PD-1-induced fluorescent reporter expression from 3% to 27.3% (compare upper and lower right panels in Figure 17).

Пример 14Example 14

Гомологичная рекомбинация цитокинового трансгена, лишенного промотора, в локус PD-1Homologous recombination of a promoter-deficient cytokine transgene into the PD-1 locus

Была разработана, сконструирована и верифицирована плазмида рекомбинантного адено-ассоциированного вируса (rAAV), содержащая трансгены IL-12 или IL-15 и сигнал полиаденилирования, но без экзогенного промотора (SEQ ID NO: 58). Стартовый кодон трансгена сливается и перекрывается с эндогенным стартовым кодоном PD-1, заменяя остальную часть экзона 1 PD-1 на кДНК, кодирующую цитокин IL-12 или IL-15 (Фигура 23, верхняя панель). Эта стратегия стимулирует экспрессию трансгена из эндогенного промотора PD-1, а также нарушает нормальную экспрессию PD-1.A recombinant adeno-associated virus (rAAV) plasmid containing IL-12 or IL-15 transgenes and a polyadenylation signal but without an exogenous promoter was designed, constructed and verified (SEQ ID NO: 58). The start codon of the transgene fuses and overlaps with the endogenous start codon of PD-1, replacing the rest of exon 1 of PD-1 with cDNA encoding the cytokine IL-12 or IL-15 (Figure 23, upper panel). This strategy stimulates transgene expression from the endogenous PD-1 promoter and also disrupts normal PD-1 expression.

Первичные человеческие Т-клетки активировали и трансдуцировали лентивирусным вектором, кодирующим анти-BCMA CAR, через 24 часа после активации. Клетки размножали в течение 2 дней, электропорировали транскрибированной in vitro megaTAL мРНК и трансдуцировали rAAV, как описано выше. Контрольные образцы включали нетрансдуцированные T-клетки, T-клетки, обработанные только анти-BCMA CAR, или T-клетки, обработанные анти-BCMA CAR и культивированные в присутствии рекомбинантного IL-12. Активность megaTAL PD-1 определяли с помощью анализа проточной цитометрии экспрессии PD-1 на T-клетках, стимулированных в течение 24 часов PMA/иономицином. Сочетание megaTAL PD-1 с IL-12 AAV показало снижение экспрессии PD-1 приблизительно на 40% по сравнению с контрольными образцами (Фигура 23, нижняя панель).Primary human T cells were activated and transduced with a lentiviral vector encoding anti-BCMA CAR 24 hours after activation. Cells were expanded for 2 days, electroporated with in vitro transcribed megaTAL mRNA, and transduced with rAAV as described above. Control samples included non-transduced T cells, T cells treated with anti-BCMA CAR alone, or T cells treated with anti-BCMA CAR and cultured in the presence of recombinant IL-12. megaTAL PD-1 activity was determined by flow cytometry analysis of PD-1 expression on T cells stimulated for 24 hours with PMA/ionomycin. The combination of megaTAL PD-1 with IL-12 AAV showed a decrease in the expression of PD-1 by approximately 40% compared with controls (Figure 23, bottom panel).

Уровни экспрессии IL-12 измеряли с помощью ELISA после активации PMA/иономицином или после совместного культивирования Т-клеток с экспрессирующей антиген клеточной линией K562-BCMA. Нестимулированные T-клетки показали минимальную выработку IL-12, а стимуляция PMA/иономицином при совместном культивировании с антиген-позитивными клетками K562 приводила к секреции IL-12 (фигура 24A). Анализы повторной стимуляции использовали для измерения функционального истощения BCMA-CAR Т-клеток. Опухолевые клетки и анти-BCMA CAR Т-клетки смешивали, культивировали в течение 7 дней и добавляли дополнительные клетки-мишени K562-BCMA для имитации повторной стимуляции. После 1-й стимуляции уровни выработки IFNγ и цитотоксичности были одинаковыми во всех образцах Т-клеток. После 2-й стимуляции выработка IFNγ и цитотоксичность увеличились в анти-BCMA-CAR T-клетках, обработанных рекомбинантным IL-12 или обработанных и megaTAL PD-1, и HDR матрицей IL-12, по сравнению с контрольными обработанными клетками (фигура 24B).IL-12 expression levels were measured by ELISA after activation with PMA/ionomycin or after co-culture of T cells with the antigen-expressing K562-BCMA cell line. Unstimulated T cells showed minimal IL-12 production, and PMA/ionomycin stimulation when co-cultured with antigen positive K562 cells resulted in IL-12 secretion (Figure 24A). Restimulation assays were used to measure functional depletion of BCMA-CAR T cells. Tumor cells and anti-BCMA CAR T cells were mixed, cultured for 7 days, and additional K562-BCMA target cells were added to mimic restimulation. After the 1st stimulation, the levels of IFNγ production and cytotoxicity were the same in all T cell samples. After 2nd stimulation, IFNγ production and cytotoxicity increased in anti-BCMA-CAR T cells treated with recombinant IL-12 or treated with both megaTAL PD-1 and HDR matrix IL-12 compared to control treated cells (Figure 24B) .

В общем, в следующей формуле изобретения используемые термины не должны толковаться как ограничивающие формулу изобретения конкретными вариантами реализации, раскрытыми в описании и формуле изобретения, но должны толковаться как включающие в себя все возможные варианты реализации вместе с полным объемом эквивалентов, подразумеваемых такими пунктами формулы. Соответственно, формула изобретения не ограничивается приведенным описанием.In general, in the following claims, the terms used are not to be construed as limiting the claims to the specific embodiments disclosed in the specification and claims, but are to be construed as including all possible embodiments together with the full scope of equivalents implied by such claims. Accordingly, the claims are not limited to the above description.

--->--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ SEQUENCE LIST

<110>БЛУБЕРД БИО, ИНК.<110>BLUEBIRD BIO, INC.

МАНН, Джасдип MANN, Jasdeep

ГАЙ, Джоэл GUY, Joel

ДЖАРДЖУР, Джордан JARJUR, Jordan

ЧЖАН, Джой CHANG, Joy

<120>ВАРИАНТЫ, КОМПОЗИЦИИ И МЕТОДЫ ИСПОЛЬЗОВАНИЯ ХОМИНГ-ЭНДОНУКЛЕАЗЫ PD-1<120>VARIANTS, COMPOSITIONS AND METHODS FOR USING PD-1 HOMING-ENDONUCLEASE

<130>BLBD-076/02WO<130>BLBD-076/02WO

<150>США 62/414 279<150>USA 62/414 279

<151>2016-10-28<151>2016-10-28

<150>США 62/385 079<150>USA 62/385 079

<151>2016-09-08<151>2016-09-08

<160>123 <160>123

<170>PatentIn версия 3.5<170>PatentIn version 3.5

<210>1<210>1

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Ophiostoma novo-ulmi subsp.americana (митохондрия)<213>Ophiostoma novo-ulmi subsp.americana (mitochondrion)

<400>1<400>1

Met Ala Tyr Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrMet Ala Tyr Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn AsnGly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn

20 25 30 20 25 30

Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile ThrAsn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu LysLys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys

65 70 75 8065 70 75 80

Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Met Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Met Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Cys Val Met Glu Asn Lys Glu His Leu Lys Ile Asn Gly IleAla Phe Cys Val Met Glu Asn Lys Glu His Leu Lys Ile Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr AspLys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Ile Ile Ser Lys Glu Arg Ser LeuGlu Leu Lys Lys Ala Phe Pro Glu Ile Ile Ser Lys Glu Arg Ser Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys LeuGly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu

180 185 190 180 185 190

Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys AspGly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile

210 215 220 210 215 220

Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val ThrLys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val PheGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe

290 295 300 290 295 300

<210>2<210>2

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Ophiostoma novo-ulmi subsp.americana (митохондрия)<213>Ophiostoma novo-ulmi subsp.americana (mitochondrion)

<400>2<400>2

Met Ala Tyr Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrMet Ala Tyr Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn AsnGly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn

20 25 30 20 25 30

Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile ThrAsn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu LysLys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys

65 70 75 8065 70 75 80

Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr AspLys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys LeuGly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu

180 185 190 180 185 190

Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys AspGly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile

210 215 220 210 215 220

Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val ThrLys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val PheGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe

290 295 300 290 295 300

<210>3<210>3

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Ophiostoma novo-ulmi subsp.americana (митохондрия)<213>Ophiostoma novo-ulmi subsp.americana (mitochondrion)

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(3)<222>(1)..(3)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>3<400>3

Xaa Xaa Xaa Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Met Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn AsnGly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn

20 25 30 20 25 30

Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile ThrAsn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu LysLys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys

65 70 75 8065 70 75 80

Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr AspLys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys LeuGly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu

180 185 190 180 185 190

Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys AspGly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile

210 215 220 210 215 220

Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val ThrLys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val PheGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Val Phe

290 295 300 290 295 300

<210>4<210>4

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Ophiostoma novo-ulmi subsp.americana (митохондрия)<213>Ophiostoma novo-ulmi subsp.americana (mitochondrion)

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(4)<222>(1)..(4)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(302)..(303)<222>(302)..(303)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>4<400>4

Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn AsnGly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn

20 25 30 20 25 30

Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile ThrAsn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu LysLys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys

65 70 75 8065 70 75 80

Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr AspLys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys LeuGly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu

180 185 190 180 185 190

Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys AspGly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile

210 215 220 210 215 220

Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val ThrLys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa XaaGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa

290 295 300 290 295 300

<210>5<210>5

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Ophiostoma novo-ulmi subsp.americana (митохондрия)<213>Ophiostoma novo-ulmi subsp.americana (mitochondrion)

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(8)<222>(1)..(8)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(302)..(303)<222>(302)..(303)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>5<400>5

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn AsnGly Phe Ala Asp Ala Glu Gly Ser Phe Leu Leu Arg Ile Arg Asn Asn

20 25 30 20 25 30

Asn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile ThrAsn Lys Ser Ser Val Gly Tyr Ser Thr Glu Leu Gly Phe Gln Ile Thr

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu LysLys Val Gly Val Ile Ala Asn Ser Gly Asp Asn Ala Val Ser Leu Lys

65 70 75 8065 70 75 80

Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr AspLys Glu Leu Val Arg Ile Lys Ala Lys Leu Asn Trp Gly Leu Thr Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Ser Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys LeuGly Glu Gly Cys Phe Phe Val Asn Leu Ile Lys Ser Lys Ser Lys Leu

180 185 190 180 185 190

Gly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys AspGly Val Gln Val Gln Leu Val Phe Ser Ile Thr Gln His Ile Lys Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile

210 215 220 210 215 220

Lys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val ThrLys Glu Lys Asn Lys Ser Glu Phe Ser Trp Leu Asp Phe Val Val Thr

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa XaaGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa

290 295 300 290 295 300

<210>6<210>6

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный вариант I-OnuI PD-1.ITSM.ex5_RD1_CV3-08<223>Synthesized version of I-OnuI PD-1.ITSM.ex5_RD1_CV3-08

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(4)<222>(1)..(4)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(302)..(303)<222>(302)..(303)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>6<400>6

Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Glu Ile Arg Asn ValGly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Glu Ile Arg Asn Val

20 25 30 20 25 30

Asn Pro Asn Ile Pro Arg Tyr Lys Thr Arg Leu Arg Phe Glu Ile AspAsn Pro Asn Ile Pro Arg Tyr Lys Thr Arg Leu Arg Phe Glu Ile Asp

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Lys Ile Tyr Asn Gln Gly Asp Ser Tyr Val Lys Leu ArgLys Val Gly Lys Ile Tyr Asn Gln Gly Asp Ser Tyr Val Lys Leu Arg

65 70 75 8065 70 75 80

Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn AspLys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Glu Gly His Phe Gly Val Ile Leu Ala Lys Arg Arg Pro Ala SerGly Glu Gly His Phe Gly Val Ile Leu Ala Lys Arg Arg Pro Ala Ser

180 185 190 180 185 190

Pro Val Gln Val Arg Leu Arg Phe Ala Ile Gly Gln His Ile Arg AspPro Val Gln Val Arg Leu Arg Phe Ala Ile Gly Gln His Ile Arg Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg Ile

210 215 220 210 215 220

Arg Glu Lys Asn Ile Ser Glu Lys Ser Trp Leu Glu Phe Glu Val ThrArg Glu Lys Asn Ile Ser Glu Lys Ser Trp Leu Glu Phe Glu Val Thr

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa XaaGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa

290 295 300 290 295 300

<210>7<210>7

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный вариант I-OnuI, PD-1.ITSM.ex5_RD2_73<223>Synthesized version of I-OnuI, PD-1.ITSM.ex5_RD2_73

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(4)<222>(1)..(4)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(302)..(303)<222>(302)..(303)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>7<400>7

Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Glu Ile Arg Asn ValGly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Glu Ile Arg Asn Val

20 25 30 20 25 30

Asn Pro Asn Ile Pro Arg Tyr Arg Thr Arg Leu Arg Phe Glu Ile AspAsn Pro Asn Ile Pro Arg Tyr Arg Thr Arg Leu Arg Phe Glu Ile Asp

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asp Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asp Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Lys Ile Tyr Asn Arg Gly Asp Ser Tyr Val Lys Leu ArgLys Val Gly Lys Ile Tyr Asn Arg Gly Asp Ser Tyr Val Lys Leu Arg

65 70 75 8065 70 75 80

Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn AspLys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Glu Gly His Phe Gly Val Ile Leu Ala Lys Arg Arg Pro Ala SerGly Glu Gly His Phe Gly Val Ile Leu Ala Lys Arg Arg Pro Ala Ser

180 185 190 180 185 190

Pro Val Gln Val Arg Leu Arg Phe Ala Ile Gly Gln His Ile Arg AspPro Val Gln Val Arg Leu Arg Phe Ala Ile Gly Gln His Ile Arg Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg ThrLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg Thr

210 215 220 210 215 220

Arg Glu Lys Asn Ile Ser Glu Lys Ser Trp Leu Glu Phe Glu Val ThrArg Glu Lys Asn Ile Ser Glu Lys Ser Trp Leu Glu Phe Glu Val Thr

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa XaaGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa

290 295 300 290 295 300

<210>8<210>8

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный вариант I-OnuI, PD-1.ITSM.ex5_RD3_03<223>Synthesized version of I-OnuI, PD-1.ITSM.ex5_RD3_03

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(4)<222>(1)..(4)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(302)..(303)<222>(302)..(303)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>8<400>8

Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Glu Ile Arg Asn ValGly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Glu Ile Arg Asn Val

20 25 30 20 25 30

Asn Pro Asn Ile Pro Arg Tyr Arg Thr Arg Leu Arg Phe Glu Ile AspAsn Pro Asn Ile Pro Arg Tyr Arg Thr Arg Leu Arg Phe Glu Ile Asp

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asp Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asp Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Lys Ile Tyr Asn Gln Gly Asp Ser Tyr Val Lys Leu ArgLys Val Gly Lys Ile Tyr Asn Gln Gly Asp Ser Tyr Val Lys Leu Arg

65 70 75 8065 70 75 80

Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn AspLys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Asp Gly His Phe Gly Val Ile Leu Ala Lys Arg Arg Pro Ala SerGly Asp Gly His Phe Gly Val Ile Leu Ala Lys Arg Arg Pro Ala Ser

180 185 190 180 185 190

Pro Val Gln Val Arg Leu Arg Phe Ala Ile Gly Gln His Ile Arg AspPro Val Gln Val Arg Leu Arg Phe Ala Ile Gly Gln His Ile Arg Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg ThrLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg Thr

210 215 220 210 215 220

Arg Glu Lys Asn Ile Ser Glu Lys Ser Trp Leu Glu Phe Glu Val ThrArg Glu Lys Asn Ile Ser Glu Lys Ser Trp Leu Glu Phe Glu Val Thr

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa XaaGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa

290 295 300 290 295 300

<210>9<210>9

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный вариант I-OnuI, PD-1.ITSM.ex5_RD4_CV23<223>Synthesized version of I-OnuI, PD-1.ITSM.ex5_RD4_CV23

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(4)<222>(1)..(4)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(302)..(303)<222>(302)..(303)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>9<400>9

Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Glu Ile Arg Asn ValGly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Glu Ile Arg Asn Val

20 25 30 20 25 30

Asn Pro Asn Ile Pro Arg Tyr Arg Thr Arg Leu Arg Phe Glu Ile AspAsn Pro Asn Ile Pro Arg Tyr Arg Thr Arg Leu Arg Phe Glu Ile Asp

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asp Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asp Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Lys Ile Tyr Asn Gln Gly Asp Ser Tyr Val Lys Leu ArgLys Val Gly Lys Ile Tyr Asn Gln Gly Asp Ser Tyr Val Lys Leu Arg

65 70 75 8065 70 75 80

Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn AspLys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Asp Gly His Phe Gly Val Ile Leu Ala Lys Arg Arg Pro Ala SerGly Asp Gly His Phe Gly Val Ile Leu Ala Lys Arg Arg Pro Ala Ser

180 185 190 180 185 190

Pro Val Gln Val Arg Leu Arg Phe Ala Ile Gly Gln His Ile Arg AspPro Val Gln Val Arg Leu Arg Phe Ala Ile Gly Gln His Ile Arg Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg Ile

210 215 220 210 215 220

Arg Glu Lys Asn Lys Ser Glu Lys Ser Trp Leu Glu Phe Glu Val ThrArg Glu Lys Asn Lys Ser Glu Lys Ser Trp Leu Glu Phe Glu Val Thr

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa XaaGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa

290 295 300 290 295 300

<210>10<210>10

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный вариант I-OnuI, PD-1.ITSM.ex5_RD5_CV23MK<223>Synthesized version of I-OnuI, PD-1.ITSM.ex5_RD5_CV23MK

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(4)<222>(1)..(4)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(302)..(303)<222>(302)..(303)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>10<400>10

Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Glu Ile Arg Asn ValGly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Glu Ile Arg Asn Val

20 25 30 20 25 30

Asn Pro Asn Ile Pro Arg Tyr Arg Thr Arg Leu Arg Phe Glu Ile AspAsn Pro Asn Ile Pro Arg Tyr Arg Thr Arg Leu Arg Phe Glu Ile Asp

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asp Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asp Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Lys Ile Tyr Asn Gln Gly Asp Ser Tyr Val Lys Leu ArgLys Val Gly Lys Ile Tyr Asn Gln Gly Asp Ser Tyr Val Lys Leu Arg

65 70 75 8065 70 75 80

Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn AspLys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Asp Gly His Phe Gly Val Ile Leu Ala Lys Arg Arg Pro Ala SerGly Asp Gly His Phe Gly Val Ile Leu Ala Lys Arg Arg Pro Ala Ser

180 185 190 180 185 190

Pro Val Gln Val Arg Leu Arg Phe Met Ile Gly Gln His Ile Lys AspPro Val Gln Val Arg Leu Arg Phe Met Ile Gly Gln His Ile Lys Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg Ile

210 215 220 210 215 220

Arg Glu Lys Asn Lys Ser Glu Lys Ser Trp Leu Glu Phe Glu Val ThrArg Glu Lys Asn Lys Ser Glu Lys Ser Trp Leu Glu Phe Glu Val Thr

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa XaaGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa

290 295 300 290 295 300

<210>11<210>11

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный вариант I-OnuI, PD-1.ile3.exon1_RD1_B1<223>Synthesized version of I-OnuI, PD-1.ile3.exon1_RD1_B1

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(4)<222>(1)..(4)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(302)..(303)<222>(302)..(303)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>11<400>11

Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn ArgGly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn Arg

20 25 30 20 25 30

Asn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe Ala Ile ValAsn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe Ala Ile Val

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Ile Ile Thr Asn Asp Gly Asp Arg Tyr Val Arg Leu ArgLys Val Gly Ile Ile Thr Asn Asp Gly Asp Arg Tyr Val Arg Leu Arg

65 70 75 8065 70 75 80

Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Val Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Val Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn AspLys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn AlaGly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala

180 185 190 180 185 190

Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg AspArg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile

210 215 220 210 215 220

Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val GluTyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa XaaGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa

290 295 300 290 295 300

<210>12<210>12

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный вариант I-OnuI, PD-1.ile3.exon1_RD2_B1H8<223>Synthesized version of I-OnuI, PD-1.ile3.exon1_RD2_B1H8

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(4)<222>(1)..(4)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(302)..(303)<222>(302)..(303)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>12<400>12

Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn ArgGly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn Arg

20 25 30 20 25 30

Asn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe Thr Ile ValAsn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe Thr Ile Val

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Ile Ile Thr Asn Asp Gly Asp Arg Tyr Val Arg Leu CysLys Val Gly Ile Ile Thr Asn Asp Gly Asp Arg Tyr Val Arg Leu Cys

65 70 75 8065 70 75 80

Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Val Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Val Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Ala Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn AspLys Glu Leu Ala Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Gly Lys Glu Arg Pro LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Gly Lys Glu Arg Pro Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn AlaGly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala

180 185 190 180 185 190

Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg AspArg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile

210 215 220 210 215 220

Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val GluTyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa XaaGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa

290 295 300 290 295 300

<210>13<210>13

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный вариант I-OnuI, PD-1.IgV.exon2_RD1_G5<223>Synthesized version of I-OnuI, PD-1.IgV.exon2_RD1_G5

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(4)<222>(1)..(4)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(302)..(303)<222>(302)..(303)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>13<400>13

Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Tyr Ile Ser Asn ValGly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Tyr Ile Ser Asn Val

20 25 30 20 25 30

Asn Asn Asn Arg Ser Arg Tyr Arg Ala Arg Leu Arg Phe Ala Ile GluAsn Asn Asn Arg Ser Arg Tyr Arg Ala Arg Leu Arg Phe Ala Ile Glu

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Val Ile Asn Asn Ile Gly Asp Thr Ser Val Arg Leu SerLys Val Gly Val Ile Asn Asn Ile Gly Asp Thr Ser Val Arg Leu Ser

65 70 75 8065 70 75 80

Val Gly Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Gly Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn AspLys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Asp Gly Asn Phe Tyr Val His Leu Lys Lys Ser Gly Arg Thr ThrGly Asp Gly Asn Phe Tyr Val His Leu Lys Lys Ser Gly Arg Thr Thr

180 185 190 180 185 190

Arg Val Tyr Val Gln Leu Arg Phe Ser Ile Ala Gln His Ile Arg AspArg Val Tyr Val Gln Leu Arg Phe Ser Ile Ala Gln His Ile Arg Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile

210 215 220 210 215 220

Asn Glu Trp Asn Ala Ser Glu Arg Ser Ala Leu Glu Phe Arg Val ThrAsn Glu Trp Asn Ala Ser Glu Arg Ser Ala Leu Glu Phe Arg Val Thr

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa XaaGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa

290 295 300 290 295 300

<210>14<210>14

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный вариант I-OnuI, PD-1.IgV.exon2_RD1_PS3<223>Synthesized version of I-OnuI, PD-1.IgV.exon2_RD1_PS3

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(4)<222>(1)..(4)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(302)..(303)<222>(302)..(303)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>14<400>14

Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Cys Phe Leu Leu His Ile Arg Asn LeuGly Phe Ala Asp Ala Glu Gly Cys Phe Leu Leu His Ile Arg Asn Leu

20 25 30 20 25 30

Asn Arg Thr Ser Thr Lys Tyr Arg Thr Arg Leu Ser Phe Glu Ile GluAsn Arg Thr Ser Thr Lys Tyr Arg Thr Arg Leu Ser Phe Glu Ile Glu

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Ile Ile Asn Asn Ile Gly Asn Arg Arg Val Arg Leu SerLys Val Gly Ile Ile Asn Asn Ile Gly Asn Arg Arg Val Arg Leu Ser

65 70 75 8065 70 75 80

Val Arg Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Arg Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Leu Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Leu Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn AspLys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Asp Gly Asn Phe Tyr Val His Leu Lys Lys Ser Gly Arg Thr ThrGly Asp Gly Asn Phe Tyr Val His Leu Lys Lys Ser Gly Arg Thr Thr

180 185 190 180 185 190

Arg Val Tyr Val Gln Leu Arg Phe Ser Ile Ser Gln His Ile Arg AspArg Val Tyr Val Gln Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile

210 215 220 210 215 220

Thr Glu Ser Asn Pro Ser Glu Arg Ser Asp Leu Glu Phe Arg Val ThrThr Glu Ser Asn Pro Ser Glu Arg Ser Asp Leu Glu Phe Arg Val Thr

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa XaaGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa

290 295 300 290 295 300

<210>15<210>15

<211>870<211>870

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный megaTAL PD-1.ITSM.ex5_RD1_CV3-08<223>Synthesized megaTAL PD-1.ITSM.ex5_RD1_CV3-08

<400>15<400>15

Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu ArgMet Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg

1 5 10 15 1 5 10 15

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys ValThr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

20 25 30 20 25 30

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly PheArg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

35 40 45 35 40 45

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu GlyThr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

50 55 60 50 55 60

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu AlaThr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

65 70 75 8065 70 75 80

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala ArgThr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

85 90 95 85 90 95

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro ProAla Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

100 105 110 100 105 110

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly GlyLeu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

115 120 125 115 120 125

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr GlyVal Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

130 135 140 130 135 140

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser AsnAla Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

145 150 155 160145 150 155 160

Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro ValGly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

165 170 175 165 170 175

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile AlaLeu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

180 185 190 180 185 190

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu LeuSer His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

195 200 205 195 200 205

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val AlaPro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala

210 215 220 210 215 220

Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg LeuIle Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

225 230 235 240225 230 235 240

Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val ValLeu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val

245 250 255 245 250 255

Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val GlnAla Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

260 265 270 260 265 270

Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp GlnArg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln

275 280 285 275 280 285

Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu ThrVal Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr

290 295 300 290 295 300

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr ProVal Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro

305 310 315 320305 310 315 320

Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala LeuAsp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu

325 330 335 325 330 335

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly LeuGlu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu

340 345 350 340 345 350

Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys GlnThr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln

355 360 365 355 360 365

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp HisAla Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His

370 375 380 370 375 380

Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly GlyGly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly

385 390 395 400385 390 395 400

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys GlnLys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

405 410 415 405 410 415

Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn AsnAsp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn

420 425 430 420 425 430

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val LeuGly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

435 440 445 435 440 445

Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala SerCys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser

450 455 460 450 455 460

Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu ProAsn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

465 470 475 480465 470 475 480

Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala IleVal Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile

485 490 495 485 490 495

Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala GlnAla Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln

500 505 510 500 505 510

Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His LeuLeu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu

515 520 525 515 520 525

Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val LysVal Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys

530 535 540 530 535 540

Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg ArgLys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg

545 550 555 560545 550 555 560

Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Ser Arg ArgIle Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Ser Arg Arg

565 570 575 565 570 575

Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala Asp Ala Glu GlyGlu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala Asp Ala Glu Gly

580 585 590 580 585 590

Ser Phe Gln Leu Glu Ile Arg Asn Val Asn Pro Asn Ile Pro Arg TyrSer Phe Gln Leu Glu Ile Arg Asn Val Asn Pro Asn Ile Pro Arg Tyr

595 600 605 595 600 605

Lys Thr Arg Leu Arg Phe Glu Ile Asp Leu His Asn Lys Asp Lys SerLys Thr Arg Leu Arg Phe Glu Ile Asp Leu His Asn Lys Asp Lys Ser

610 615 620 610 615 620

Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys Val Gly Lys Ile Tyr AsnIle Leu Glu Asn Ile Gln Ser Thr Trp Lys Val Gly Lys Ile Tyr Asn

625 630 635 640625 630 635 640

Gln Gly Asp Ser Tyr Val Lys Leu Arg Val Thr Arg Phe Glu Asp LeuGln Gly Asp Ser Tyr Val Lys Leu Arg Val Thr Arg Phe Glu Asp Leu

645 650 655 645 650 655

Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu Ile Thr Gln LysLys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu Ile Thr Gln Lys

660 665 670 660 665 670

Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser Val Met Glu AsnLeu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser Val Met Glu Asn

675 680 685 675 680 685

Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu Val Arg Ile LysLys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu Val Arg Ile Lys

690 695 700 690 695 700

Ala Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys Lys Ala Phe ProAla Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys Lys Ala Phe Pro

705 710 715 720705 710 715 720

Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys Asn Ile Pro AsnGlu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys Asn Ile Pro Asn

725 730 735 725 730 735

Leu Lys Trp Leu Ala Gly Phe Thr Ser Gly Glu Gly His Phe Gly ValLeu Lys Trp Leu Ala Gly Phe Thr Ser Gly Glu Gly His Phe Gly Val

740 745 750 740 745 750

Ile Leu Ala Lys Arg Arg Pro Ala Ser Pro Val Gln Val Arg Leu ArgIle Leu Ala Lys Arg Arg Pro Ala Ser Pro Val Gln Val Arg Leu Arg

755 760 765 755 760 765

Phe Ala Ile Gly Gln His Ile Arg Asp Lys Asn Leu Met Asn Ser LeuPhe Ala Ile Gly Gln His Ile Arg Asp Lys Asn Leu Met Asn Ser Leu

770 775 780 770 775 780

Ile Thr Tyr Leu Gly Cys Gly Arg Ile Arg Glu Lys Asn Ile Ser GluIle Thr Tyr Leu Gly Cys Gly Arg Ile Arg Glu Lys Asn Ile Ser Glu

785 790 795 800785 790 795 800

Lys Ser Trp Leu Glu Phe Glu Val Thr Lys Phe Ser Asp Ile Asn AspLys Ser Trp Leu Glu Phe Glu Val Thr Lys Phe Ser Asp Ile Asn Asp

805 810 815 805 810 815

Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile Gly Val Lys LeuLys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile Gly Val Lys Leu

820 825 830 820 825 830

Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu Ile Glu Glu LysGlu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu Ile Glu Glu Lys

835 840 845 835 840 845

Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys Lys Ile Lys LeuLys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys Lys Ile Lys Leu

850 855 860 850 855 860

Asn Met Asn Lys Gly ArgAsn Met Asn Lys Gly Arg

865 870865 870

<210>16<210>16

<211>870<211>870

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный megaTAL PD-1.ITSM.ex5_RD2_73<223>Synthesized megaTAL PD-1.ITSM.ex5_RD2_73

<400>16<400>16

Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu ArgMet Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg

1 5 10 15 1 5 10 15

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys ValThr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

20 25 30 20 25 30

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly PheArg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

35 40 45 35 40 45

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu GlyThr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

50 55 60 50 55 60

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu AlaThr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

65 70 75 8065 70 75 80

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala ArgThr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

85 90 95 85 90 95

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro ProAla Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

100 105 110 100 105 110

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly GlyLeu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

115 120 125 115 120 125

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr GlyVal Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

130 135 140 130 135 140

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser AsnAla Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

145 150 155 160145 150 155 160

Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro ValGly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

165 170 175 165 170 175

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile AlaLeu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

180 185 190 180 185 190

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu LeuSer His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

195 200 205 195 200 205

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val AlaPro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala

210 215 220 210 215 220

Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg LeuIle Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

225 230 235 240225 230 235 240

Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val ValLeu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val

245 250 255 245 250 255

Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val GlnAla Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

260 265 270 260 265 270

Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp GlnArg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln

275 280 285 275 280 285

Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu ThrVal Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr

290 295 300 290 295 300

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr ProVal Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro

305 310 315 320305 310 315 320

Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala LeuAsp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu

325 330 335 325 330 335

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly LeuGlu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu

340 345 350 340 345 350

Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys GlnThr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln

355 360 365 355 360 365

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp HisAla Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His

370 375 380 370 375 380

Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly GlyGly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly

385 390 395 400385 390 395 400

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys GlnLys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

405 410 415 405 410 415

Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn AsnAsp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn

420 425 430 420 425 430

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val LeuGly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

435 440 445 435 440 445

Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala SerCys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser

450 455 460 450 455 460

Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu ProAsn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

465 470 475 480465 470 475 480

Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala IleVal Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile

485 490 495 485 490 495

Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala GlnAla Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln

500 505 510 500 505 510

Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His LeuLeu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu

515 520 525 515 520 525

Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val LysVal Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys

530 535 540 530 535 540

Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg ArgLys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg

545 550 555 560545 550 555 560

Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Ser Arg ArgIle Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Ser Arg Arg

565 570 575 565 570 575

Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala Asp Ala Glu GlyGlu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala Asp Ala Glu Gly

580 585 590 580 585 590

Ser Phe Gln Leu Glu Ile Arg Asn Val Asn Pro Asn Ile Pro Arg TyrSer Phe Gln Leu Glu Ile Arg Asn Val Asn Pro Asn Ile Pro Arg Tyr

595 600 605 595 600 605

Arg Thr Arg Leu Arg Phe Glu Ile Asp Leu His Asn Lys Asp Lys SerArg Thr Arg Leu Arg Phe Glu Ile Asp Leu His Asn Lys Asp Lys Ser

610 615 620 610 615 620

Ile Leu Glu Asp Ile Gln Ser Thr Trp Lys Val Gly Lys Ile Tyr AsnIle Leu Glu Asp Ile Gln Ser Thr Trp Lys Val Gly Lys Ile Tyr Asn

625 630 635 640625 630 635 640

Arg Gly Asp Ser Tyr Val Lys Leu Arg Val Thr Arg Phe Glu Asp LeuArg Gly Asp Ser Tyr Val Lys Leu Arg Val Thr Arg Phe Glu Asp Leu

645 650 655 645 650 655

Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu Ile Thr Gln LysLys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu Ile Thr Gln Lys

660 665 670 660 665 670

Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser Val Met Glu AsnLeu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser Val Met Glu Asn

675 680 685 675 680 685

Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu Val Arg Ile LysLys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu Val Arg Ile Lys

690 695 700 690 695 700

Ala Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys Lys Ala Phe ProAla Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys Lys Ala Phe Pro

705 710 715 720705 710 715 720

Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys Asn Ile Pro AsnGlu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys Asn Ile Pro Asn

725 730 735 725 730 735

Leu Lys Trp Leu Ala Gly Phe Thr Ser Gly Glu Gly His Phe Gly ValLeu Lys Trp Leu Ala Gly Phe Thr Ser Gly Glu Gly His Phe Gly Val

740 745 750 740 745 750

Ile Leu Ala Lys Arg Arg Pro Ala Ser Pro Val Gln Val Arg Leu ArgIle Leu Ala Lys Arg Arg Pro Ala Ser Pro Val Gln Val Arg Leu Arg

755 760 765 755 760 765

Phe Ala Ile Gly Gln His Ile Arg Asp Lys Asn Leu Met Asn Ser LeuPhe Ala Ile Gly Gln His Ile Arg Asp Lys Asn Leu Met Asn Ser Leu

770 775 780 770 775 780

Ile Thr Tyr Leu Gly Cys Gly Arg Thr Arg Glu Lys Asn Ile Ser GluIle Thr Tyr Leu Gly Cys Gly Arg Thr Arg Glu Lys Asn Ile Ser Glu

785 790 795 800785 790 795 800

Lys Ser Trp Leu Glu Phe Glu Val Thr Lys Phe Ser Asp Ile Asn AspLys Ser Trp Leu Glu Phe Glu Val Thr Lys Phe Ser Asp Ile Asn Asp

805 810 815 805 810 815

Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile Gly Val Lys LeuLys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile Gly Val Lys Leu

820 825 830 820 825 830

Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu Ile Glu Glu LysGlu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu Ile Glu Glu Lys

835 840 845 835 840 845

Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys Lys Ile Lys LeuLys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys Lys Ile Lys Leu

850 855 860 850 855 860

Asn Met Asn Lys Gly ArgAsn Met Asn Lys Gly Arg

865 870865 870

<210>17<210>17

<211>870<211>870

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный megaTAL PD-1.ITSM.ex5_RD3_03<223>Synthesized megaTAL PD-1.ITSM.ex5_RD3_03

<400>17<400>17

Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu ArgMet Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg

1 5 10 15 1 5 10 15

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys ValThr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

20 25 30 20 25 30

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly PheArg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

35 40 45 35 40 45

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu GlyThr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

50 55 60 50 55 60

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu AlaThr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

65 70 75 8065 70 75 80

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala ArgThr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

85 90 95 85 90 95

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro ProAla Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

100 105 110 100 105 110

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly GlyLeu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

115 120 125 115 120 125

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr GlyVal Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

130 135 140 130 135 140

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser AsnAla Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

145 150 155 160145 150 155 160

Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro ValGly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

165 170 175 165 170 175

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile AlaLeu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

180 185 190 180 185 190

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu LeuSer His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

195 200 205 195 200 205

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val AlaPro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala

210 215 220 210 215 220

Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg LeuIle Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

225 230 235 240225 230 235 240

Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val ValLeu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val

245 250 255 245 250 255

Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val GlnAla Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

260 265 270 260 265 270

Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp GlnArg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln

275 280 285 275 280 285

Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu ThrVal Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr

290 295 300 290 295 300

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr ProVal Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro

305 310 315 320305 310 315 320

Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala LeuAsp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu

325 330 335 325 330 335

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly LeuGlu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu

340 345 350 340 345 350

Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys GlnThr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln

355 360 365 355 360 365

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp HisAla Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His

370 375 380 370 375 380

Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly GlyGly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly

385 390 395 400385 390 395 400

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys GlnLys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

405 410 415 405 410 415

Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn AsnAsp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn

420 425 430 420 425 430

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val LeuGly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

435 440 445 435 440 445

Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala SerCys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser

450 455 460 450 455 460

Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu ProAsn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

465 470 475 480465 470 475 480

Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala IleVal Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile

485 490 495 485 490 495

Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala GlnAla Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln

500 505 510 500 505 510

Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His LeuLeu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu

515 520 525 515 520 525

Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val LysVal Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys

530 535 540 530 535 540

Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg ArgLys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg

545 550 555 560545 550 555 560

Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Ser Arg ArgIle Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Ser Arg Arg

565 570 575 565 570 575

Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala Asp Ala Glu GlyGlu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala Asp Ala Glu Gly

580 585 590 580 585 590

Ser Phe Gln Leu Glu Ile Arg Asn Val Asn Pro Asn Ile Pro Arg TyrSer Phe Gln Leu Glu Ile Arg Asn Val Asn Pro Asn Ile Pro Arg Tyr

595 600 605 595 600 605

Arg Thr Arg Leu Arg Phe Glu Ile Asp Leu His Asn Lys Asp Lys SerArg Thr Arg Leu Arg Phe Glu Ile Asp Leu His Asn Lys Asp Lys Ser

610 615 620 610 615 620

Ile Leu Glu Asp Ile Gln Ser Thr Trp Lys Val Gly Lys Ile Tyr AsnIle Leu Glu Asp Ile Gln Ser Thr Trp Lys Val Gly Lys Ile Tyr Asn

625 630 635 640625 630 635 640

Gln Gly Asp Ser Tyr Val Lys Leu Arg Val Thr Arg Phe Glu Asp LeuGln Gly Asp Ser Tyr Val Lys Leu Arg Val Thr Arg Phe Glu Asp Leu

645 650 655 645 650 655

Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu Ile Thr Gln LysLys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu Ile Thr Gln Lys

660 665 670 660 665 670

Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser Val Met Glu AsnLeu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser Val Met Glu Asn

675 680 685 675 680 685

Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu Val Arg Ile LysLys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu Val Arg Ile Lys

690 695 700 690 695 700

Ala Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys Lys Ala Phe ProAla Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys Lys Ala Phe Pro

705 710 715 720705 710 715 720

Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys Asn Ile Pro AsnGlu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys Asn Ile Pro Asn

725 730 735 725 730 735

Leu Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp Gly His Phe Gly ValLeu Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp Gly His Phe Gly Val

740 745 750 740 745 750

Ile Leu Ala Lys Arg Arg Pro Ala Ser Pro Val Gln Val Arg Leu ArgIle Leu Ala Lys Arg Arg Pro Ala Ser Pro Val Gln Val Arg Leu Arg

755 760 765 755 760 765

Phe Ala Ile Gly Gln His Ile Arg Asp Lys Asn Leu Met Asn Ser LeuPhe Ala Ile Gly Gln His Ile Arg Asp Lys Asn Leu Met Asn Ser Leu

770 775 780 770 775 780

Ile Thr Tyr Leu Gly Cys Gly Arg Thr Arg Glu Lys Asn Ile Ser GluIle Thr Tyr Leu Gly Cys Gly Arg Thr Arg Glu Lys Asn Ile Ser Glu

785 790 795 800785 790 795 800

Lys Ser Trp Leu Glu Phe Glu Val Thr Lys Phe Ser Asp Ile Asn AspLys Ser Trp Leu Glu Phe Glu Val Thr Lys Phe Ser Asp Ile Asn Asp

805 810 815 805 810 815

Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile Gly Val Lys LeuLys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile Gly Val Lys Leu

820 825 830 820 825 830

Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu Ile Glu Glu LysGlu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu Ile Glu Glu Lys

835 840 845 835 840 845

Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys Lys Ile Lys LeuLys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys Lys Ile Lys Leu

850 855 860 850 855 860

Asn Met Asn Lys Gly ArgAsn Met Asn Lys Gly Arg

865 870865 870

<210>18<210>18

<211>870<211>870

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный megaTAL PD-1.ITSM.ex5_RD4_CV23<223>Synthesized megaTAL PD-1.ITSM.ex5_RD4_CV23

<400>18<400>18

Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu ArgMet Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg

1 5 10 15 1 5 10 15

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys ValThr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

20 25 30 20 25 30

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly PheArg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

35 40 45 35 40 45

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu GlyThr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

50 55 60 50 55 60

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu AlaThr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

65 70 75 8065 70 75 80

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala ArgThr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

85 90 95 85 90 95

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro ProAla Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

100 105 110 100 105 110

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly GlyLeu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

115 120 125 115 120 125

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr GlyVal Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

130 135 140 130 135 140

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser AsnAla Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

145 150 155 160145 150 155 160

Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro ValGly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

165 170 175 165 170 175

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile AlaLeu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

180 185 190 180 185 190

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu LeuSer His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

195 200 205 195 200 205

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val AlaPro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala

210 215 220 210 215 220

Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg LeuIle Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

225 230 235 240225 230 235 240

Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val ValLeu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val

245 250 255 245 250 255

Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val GlnAla Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

260 265 270 260 265 270

Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp GlnArg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln

275 280 285 275 280 285

Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu ThrVal Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr

290 295 300 290 295 300

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr ProVal Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro

305 310 315 320305 310 315 320

Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala LeuAsp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu

325 330 335 325 330 335

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly LeuGlu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu

340 345 350 340 345 350

Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys GlnThr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln

355 360 365 355 360 365

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp HisAla Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His

370 375 380 370 375 380

Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly GlyGly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly

385 390 395 400385 390 395 400

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys GlnLys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

405 410 415 405 410 415

Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn AsnAsp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn

420 425 430 420 425 430

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val LeuGly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

435 440 445 435 440 445

Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala SerCys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser

450 455 460 450 455 460

Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu ProAsn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

465 470 475 480465 470 475 480

Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala IleVal Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile

485 490 495 485 490 495

Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala GlnAla Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln

500 505 510 500 505 510

Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His LeuLeu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu

515 520 525 515 520 525

Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val LysVal Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys

530 535 540 530 535 540

Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg ArgLys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg

545 550 555 560545 550 555 560

Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Ser Arg ArgIle Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Ser Arg Arg

565 570 575 565 570 575

Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala Asp Ala Glu GlyGlu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala Asp Ala Glu Gly

580 585 590 580 585 590

Ser Phe Gln Leu Glu Ile Arg Asn Val Asn Pro Asn Ile Pro Arg TyrSer Phe Gln Leu Glu Ile Arg Asn Val Asn Pro Asn Ile Pro Arg Tyr

595 600 605 595 600 605

Arg Thr Arg Leu Arg Phe Glu Ile Asp Leu His Asn Lys Asp Lys SerArg Thr Arg Leu Arg Phe Glu Ile Asp Leu His Asn Lys Asp Lys Ser

610 615 620 610 615 620

Ile Leu Glu Asp Ile Gln Ser Thr Trp Lys Val Gly Lys Ile Tyr AsnIle Leu Glu Asp Ile Gln Ser Thr Trp Lys Val Gly Lys Ile Tyr Asn

625 630 635 640625 630 635 640

Gln Gly Asp Ser Tyr Val Lys Leu Arg Val Thr Arg Phe Glu Asp LeuGln Gly Asp Ser Tyr Val Lys Leu Arg Val Thr Arg Phe Glu Asp Leu

645 650 655 645 650 655

Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu Ile Thr Gln LysLys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu Ile Thr Gln Lys

660 665 670 660 665 670

Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser Val Met Glu AsnLeu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser Val Met Glu Asn

675 680 685 675 680 685

Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu Val Arg Ile LysLys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu Val Arg Ile Lys

690 695 700 690 695 700

Ala Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys Lys Ala Phe ProAla Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys Lys Ala Phe Pro

705 710 715 720705 710 715 720

Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys Asn Ile Pro AsnGlu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys Asn Ile Pro Asn

725 730 735 725 730 735

Leu Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp Gly His Phe Gly ValLeu Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp Gly His Phe Gly Val

740 745 750 740 745 750

Ile Leu Ala Lys Arg Arg Pro Ala Ser Pro Val Gln Val Arg Leu ArgIle Leu Ala Lys Arg Arg Pro Ala Ser Pro Val Gln Val Arg Leu Arg

755 760 765 755 760 765

Phe Ala Ile Gly Gln His Ile Arg Asp Lys Asn Leu Met Asn Ser LeuPhe Ala Ile Gly Gln His Ile Arg Asp Lys Asn Leu Met Asn Ser Leu

770 775 780 770 775 780

Ile Thr Tyr Leu Gly Cys Gly Arg Ile Arg Glu Lys Asn Lys Ser GluIle Thr Tyr Leu Gly Cys Gly Arg Ile Arg Glu Lys Asn Lys Ser Glu

785 790 795 800785 790 795 800

Lys Ser Trp Leu Glu Phe Glu Val Thr Lys Phe Ser Asp Ile Asn AspLys Ser Trp Leu Glu Phe Glu Val Thr Lys Phe Ser Asp Ile Asn Asp

805 810 815 805 810 815

Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile Gly Val Lys LeuLys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile Gly Val Lys Leu

820 825 830 820 825 830

Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu Ile Glu Glu LysGlu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu Ile Glu Glu Lys

835 840 845 835 840 845

Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys Lys Ile Lys LeuLys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys Lys Ile Lys Leu

850 855 860 850 855 860

Asn Met Asn Lys Gly ArgAsn Met Asn Lys Gly Arg

865 870865 870

<210>19<210>19

<211>870<211>870

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный megaTAL PD-1.ITSM.ex5_RD5_CV23MK<223>Synthesized megaTAL PD-1.ITSM.ex5_RD5_CV23MK

<400>19<400>19

Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu ArgMet Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg

1 5 10 15 1 5 10 15

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys ValThr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

20 25 30 20 25 30

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly PheArg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

35 40 45 35 40 45

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu GlyThr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

50 55 60 50 55 60

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu AlaThr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

65 70 75 8065 70 75 80

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala ArgThr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

85 90 95 85 90 95

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro ProAla Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

100 105 110 100 105 110

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly GlyLeu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

115 120 125 115 120 125

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr GlyVal Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

130 135 140 130 135 140

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser AsnAla Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

145 150 155 160145 150 155 160

Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro ValGly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

165 170 175 165 170 175

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile AlaLeu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

180 185 190 180 185 190

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu LeuSer His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

195 200 205 195 200 205

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val AlaPro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala

210 215 220 210 215 220

Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg LeuIle Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu

225 230 235 240225 230 235 240

Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val ValLeu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val

245 250 255 245 250 255

Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val GlnAla Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln

260 265 270 260 265 270

Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp GlnArg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln

275 280 285 275 280 285

Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu ThrVal Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr

290 295 300 290 295 300

Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr ProVal Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro

305 310 315 320305 310 315 320

Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala LeuAsp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu

325 330 335 325 330 335

Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly LeuGlu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu

340 345 350 340 345 350

Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys GlnThr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln

355 360 365 355 360 365

Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp HisAla Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His

370 375 380 370 375 380

Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly GlyGly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly

385 390 395 400385 390 395 400

Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys GlnLys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln

405 410 415 405 410 415

Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn AsnAsp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn

420 425 430 420 425 430

Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val LeuGly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu

435 440 445 435 440 445

Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala SerCys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser

450 455 460 450 455 460

Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu ProAsn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro

465 470 475 480465 470 475 480

Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala IleVal Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile

485 490 495 485 490 495

Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala GlnAla Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln

500 505 510 500 505 510

Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His LeuLeu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu

515 520 525 515 520 525

Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val LysVal Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys

530 535 540 530 535 540

Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg ArgLys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg

545 550 555 560545 550 555 560

Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Ser Arg ArgIle Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Ser Arg Arg

565 570 575 565 570 575

Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala Asp Ala Glu GlyGlu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala Asp Ala Glu Gly

580 585 590 580 585 590

Ser Phe Gln Leu Glu Ile Arg Asn Val Asn Pro Asn Ile Pro Arg TyrSer Phe Gln Leu Glu Ile Arg Asn Val Asn Pro Asn Ile Pro Arg Tyr

595 600 605 595 600 605

Arg Thr Arg Leu Arg Phe Glu Ile Asp Leu His Asn Lys Asp Lys SerArg Thr Arg Leu Arg Phe Glu Ile Asp Leu His Asn Lys Asp Lys Ser

610 615 620 610 615 620

Ile Leu Glu Asp Ile Gln Ser Thr Trp Lys Val Gly Lys Ile Tyr AsnIle Leu Glu Asp Ile Gln Ser Thr Trp Lys Val Gly Lys Ile Tyr Asn

625 630 635 640625 630 635 640

Gln Gly Asp Ser Tyr Val Lys Leu Arg Val Thr Arg Phe Glu Asp LeuGln Gly Asp Ser Tyr Val Lys Leu Arg Val Thr Arg Phe Glu Asp Leu

645 650 655 645 650 655

Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu Ile Thr Gln LysLys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu Ile Thr Gln Lys

660 665 670 660 665 670

Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser Val Met Glu AsnLeu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser Val Met Glu Asn

675 680 685 675 680 685

Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu Val Arg Ile LysLys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu Val Arg Ile Lys

690 695 700 690 695 700

Ala Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys Lys Ala Phe ProAla Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys Lys Ala Phe Pro

705 710 715 720705 710 715 720

Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys Asn Ile Pro AsnGlu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys Asn Ile Pro Asn

725 730 735 725 730 735

Leu Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp Gly His Phe Gly ValLeu Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp Gly His Phe Gly Val

740 745 750 740 745 750

Ile Leu Ala Lys Arg Arg Pro Ala Ser Pro Val Gln Val Arg Leu ArgIle Leu Ala Lys Arg Arg Pro Ala Ser Pro Val Gln Val Arg Leu Arg

755 760 765 755 760 765

Phe Met Ile Gly Gln His Ile Lys Asp Lys Asn Leu Met Asn Ser LeuPhe Met Ile Gly Gln His Ile Lys Asp Lys Asn Leu Met Asn Ser Leu

770 775 780 770 775 780

Ile Thr Tyr Leu Gly Cys Gly Arg Ile Arg Glu Lys Asn Lys Ser GluIle Thr Tyr Leu Gly Cys Gly Arg Ile Arg Glu Lys Asn Lys Ser Glu

785 790 795 800785 790 795 800

Lys Ser Trp Leu Glu Phe Glu Val Thr Lys Phe Ser Asp Ile Asn AspLys Ser Trp Leu Glu Phe Glu Val Thr Lys Phe Ser Asp Ile Asn Asp

805 810 815 805 810 815

Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile Gly Val Lys LeuLys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile Gly Val Lys Leu

820 825 830 820 825 830

Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu Ile Glu Glu LysGlu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu Ile Glu Glu Lys

835 840 845 835 840 845

Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys Lys Ile Lys LeuLys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys Lys Ile Lys Leu

850 855 860 850 855 860

Asn Met Asn Lys Gly ArgAsn Met Asn Lys Gly Arg

865 870865 870

<210>20<210>20

<211>841<211>841

<212>PRT<212>PRT

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный megaTAL PD-1.ile3.exon1_RD1 B1<223>Synthesized megaTAL PD-1.ile3.exon1_RD1 B1

<400>20<400>20

Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu ArgMet Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg

1 5 10 15 1 5 10 15

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys ValThr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

20 25 30 20 25 30

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly PheArg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

35 40 45 35 40 45

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu GlyThr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

50 55 60 50 55 60

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu AlaThr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

65 70 75 8065 70 75 80

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala ArgThr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

85 90 95 85 90 95

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro ProAla Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

100 105 110 100 105 110

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly GlyLeu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

115 120 125 115 120 125

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr GlyVal Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

130 135 140 130 135 140

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser AsnAla Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

145 150 155 160145 150 155 160

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro ValAsn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

165 170 175 165 170 175

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile AlaLeu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

180 185 190 180 185 190

Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu LeuSer Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

195 200 205 195 200 205

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val AlaPro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala

210 215 220 210 215 220

Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln ArgIle Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

225 230 235 240225 230 235 240

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln ValLeu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

245 250 255 245 250 255

Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr ValVal Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val

260 265 270 260 265 270

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro AspGln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp

275 280 285 275 280 285

Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu GluGln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu

290 295 300 290 295 300

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu ThrThr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

305 310 315 320305 310 315 320

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln AlaPro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala

325 330 335 325 330 335

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His GlyLeu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly

340 345 350 340 345 350

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly LysLeu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

355 360 365 355 360 365

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln AspGln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp

370 375 380 370 375 380

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp GlyHis Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly

385 390 395 400385 390 395 400

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu CysGly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

405 410 415 405 410 415

Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser AsnGln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

420 425 430 420 425 430

Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro ValGly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

435 440 445 435 440 445

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile AlaLeu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

450 455 460 450 455 460

Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln LeuSer Asn Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu

465 470 475 480465 470 475 480

Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu ValSer Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val

485 490 495 485 490 495

Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys LysAla Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys

500 505 510 500 505 510

Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg IleGly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile

515 520 525 515 520 525

Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val Gly Gly SerGly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val Gly Gly Ser

530 535 540 530 535 540

Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala AspSer Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala Asp

545 550 555 560545 550 555 560

Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn Arg Asn Arg Gly ThrAla Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn Arg Asn Arg Gly Thr

565 570 575 565 570 575

Ala Arg Tyr His Thr Arg Leu Ser Phe Ala Ile Val Leu His Asn LysAla Arg Tyr His Thr Arg Leu Ser Phe Ala Ile Val Leu His Asn Lys

580 585 590 580 585 590

Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys Val Gly IleAsp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys Val Gly Ile

595 600 605 595 600 605

Ile Thr Asn Asp Gly Asp Arg Tyr Val Arg Leu Arg Val Thr Arg PheIle Thr Asn Asp Gly Asp Arg Tyr Val Arg Leu Arg Val Thr Arg Phe

610 615 620 610 615 620

Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu ValGlu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu Val

625 630 635 640625 630 635 640

Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser ValThr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser Val

645 650 655 645 650 655

Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu ValMet Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu Val

660 665 670 660 665 670

Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys LysArg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys Lys

675 680 685 675 680 685

Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys AsnAla Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu Ile Asn Lys Asn

690 695 700 690 695 700

Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp Gly SerIle Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp Gly Ser

705 710 715 720705 710 715 720

Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala Arg Val Arg ValPhe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala Arg Val Arg Val

725 730 735 725 730 735

Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp Lys Asn Leu MetGln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp Lys Asn Leu Met

740 745 750 740 745 750

Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile Tyr Glu Gly AsnAsn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile Tyr Glu Gly Asn

755 760 765 755 760 765

Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu Lys Phe Ser AspLys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu Lys Phe Ser Asp

770 775 780 770 775 780

Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile GlyIle Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile Gly

785 790 795 800785 790 795 800

Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu IleVal Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu Ile

805 810 815 805 810 815

Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys LysGlu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys Lys

820 825 830 820 825 830

Ile Lys Leu Asn Met Asn Lys Gly ArgIle Lys Leu Asn Met Asn Lys Gly Arg

835 840 835 840

<210>21<210>21

<211>841<211>841

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный megaTAL PD-1.ile3.exon1_RD2_B1H8<223>Synthesized megaTAL PD-1.ile3.exon1_RD2_B1H8

<400>21<400>21

Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu ArgMet Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg

1 5 10 15 1 5 10 15

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys ValThr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

20 25 30 20 25 30

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly PheArg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

35 40 45 35 40 45

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu GlyThr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

50 55 60 50 55 60

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu AlaThr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

65 70 75 8065 70 75 80

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala ArgThr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

85 90 95 85 90 95

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro ProAla Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

100 105 110 100 105 110

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly GlyLeu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

115 120 125 115 120 125

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr GlyVal Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

130 135 140 130 135 140

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser AsnAla Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

145 150 155 160145 150 155 160

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro ValAsn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

165 170 175 165 170 175

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile AlaLeu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

180 185 190 180 185 190

Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu LeuSer Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

195 200 205 195 200 205

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val AlaPro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala

210 215 220 210 215 220

Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln ArgIle Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

225 230 235 240225 230 235 240

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln ValLeu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

245 250 255 245 250 255

Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr ValVal Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val

260 265 270 260 265 270

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro AspGln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp

275 280 285 275 280 285

Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu GluGln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu

290 295 300 290 295 300

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu ThrThr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

305 310 315 320305 310 315 320

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln AlaPro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala

325 330 335 325 330 335

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His GlyLeu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly

340 345 350 340 345 350

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly LysLeu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

355 360 365 355 360 365

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln AspGln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp

370 375 380 370 375 380

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp GlyHis Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly

385 390 395 400385 390 395 400

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu CysGly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

405 410 415 405 410 415

Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser AsnGln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

420 425 430 420 425 430

Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro ValGly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

435 440 445 435 440 445

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile AlaLeu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

450 455 460 450 455 460

Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln LeuSer Asn Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile Val Ala Gln Leu

465 470 475 480465 470 475 480

Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu ValSer Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val

485 490 495 485 490 495

Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys LysAla Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp Ala Val Lys Lys

500 505 510 500 505 510

Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg IleGly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val Asn Arg Arg Ile

515 520 525 515 520 525

Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val Gly Gly SerGly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg Val Gly Gly Ser

530 535 540 530 535 540

Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala AspSer Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr Gly Phe Ala Asp

545 550 555 560545 550 555 560

Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn Arg Asn Arg Gly ThrAla Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn Arg Asn Arg Gly Thr

565 570 575 565 570 575

Ala Arg Tyr His Thr Arg Leu Ser Phe Thr Ile Val Leu His Asn LysAla Arg Tyr His Thr Arg Leu Ser Phe Thr Ile Val Leu His Asn Lys

580 585 590 580 585 590

Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys Val Gly IleAsp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp Lys Val Gly Ile

595 600 605 595 600 605

Ile Thr Asn Asp Gly Asp Arg Tyr Val Arg Leu Cys Val Thr Arg PheIle Thr Asn Asp Gly Asp Arg Tyr Val Arg Leu Cys Val Thr Arg Phe

610 615 620 610 615 620

Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu ValGlu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys Tyr Pro Leu Val

625 630 635 640625 630 635 640

Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser ValThr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln Ala Phe Ser Val

645 650 655 645 650 655

Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu AlaMet Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile Lys Glu Leu Ala

660 665 670 660 665 670

Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys LysArg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp Glu Leu Lys Lys

675 680 685 675 680 685

Ala Phe Pro Glu Asn Ile Gly Lys Glu Arg Pro Leu Ile Asn Lys AsnAla Phe Pro Glu Asn Ile Gly Lys Glu Arg Pro Leu Ile Asn Lys Asn

690 695 700 690 695 700

Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp Gly SerIle Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser Gly Asp Gly Ser

705 710 715 720705 710 715 720

Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala Arg Val Arg ValPhe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala Arg Val Arg Val

725 730 735 725 730 735

Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp Lys Asn Leu MetGln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp Lys Asn Leu Met

740 745 750 740 745 750

Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile Tyr Glu Gly AsnAsn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile Tyr Glu Gly Asn

755 760 765 755 760 765

Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu Lys Phe Ser AspLys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu Lys Phe Ser Asp

770 775 780 770 775 780

Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile GlyIle Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn Thr Leu Ile Gly

785 790 795 800785 790 795 800

Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu IleVal Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val Ala Lys Leu Ile

805 810 815 805 810 815

Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys LysGlu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp Glu Ile Lys Lys

820 825 830 820 825 830

Ile Lys Leu Asn Met Asn Lys Gly ArgIle Lys Leu Asn Met Asn Lys Gly Arg

835 840 835 840

<210>22<210>22

<211>909<211>909

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный megaTAL PD-1.IgV.exon2_RD1_G5<223>Synthesized megaTAL PD-1.IgV.exon2_RD1_G5

<400>22<400>22

Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu ArgMet Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg

1 5 10 15 1 5 10 15

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys ValThr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

20 25 30 20 25 30

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly PheArg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

35 40 45 35 40 45

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu GlyThr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

50 55 60 50 55 60

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu AlaThr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

65 70 75 8065 70 75 80

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala ArgThr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

85 90 95 85 90 95

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro ProAla Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

100 105 110 100 105 110

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly GlyLeu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

115 120 125 115 120 125

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr GlyVal Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

130 135 140 130 135 140

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser AsnAla Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

145 150 155 160145 150 155 160

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro ValAsn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

165 170 175 165 170 175

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile AlaLeu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

180 185 190 180 185 190

Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu LeuSer Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

195 200 205 195 200 205

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val AlaPro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala

210 215 220 210 215 220

Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln ArgIle Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

225 230 235 240225 230 235 240

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln ValLeu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

245 250 255 245 250 255

Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr ValVal Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val

260 265 270 260 265 270

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro AspGln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp

275 280 285 275 280 285

Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu GluGln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu

290 295 300 290 295 300

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu ThrThr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

305 310 315 320305 310 315 320

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln AlaPro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala

325 330 335 325 330 335

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His GlyLeu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly

340 345 350 340 345 350

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly LysLeu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

355 360 365 355 360 365

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln AspGln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp

370 375 380 370 375 380

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile GlyHis Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly

385 390 395 400385 390 395 400

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu CysGly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

405 410 415 405 410 415

Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser AsnGln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

420 425 430 420 425 430

Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro ValIle Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

435 440 445 435 440 445

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile AlaLeu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

450 455 460 450 455 460

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu LeuSer His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

465 470 475 480465 470 475 480

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val AlaPro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala

485 490 495 485 490 495

Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln ArgIle Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

500 505 510 500 505 510

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln ValLeu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

515 520 525 515 520 525

Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Ser IleVal Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile

530 535 540 530 535 540

Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr AsnVal Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn

545 550 555 560545 550 555 560

Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met AspAsp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp

565 570 575 565 570 575

Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg ValAla Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val

580 585 590 580 585 590

Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser ArgAsn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg

595 600 605 595 600 605

Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrVal Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

610 615 620 610 615 620

Gly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Tyr Ile Ser Asn ValGly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Tyr Ile Ser Asn Val

625 630 635 640625 630 635 640

Asn Asn Asn Arg Ser Arg Tyr Arg Ala Arg Leu Arg Phe Ala Ile GluAsn Asn Asn Arg Ser Arg Tyr Arg Ala Arg Leu Arg Phe Ala Ile Glu

645 650 655 645 650 655

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

660 665 670 660 665 670

Lys Val Gly Val Ile Asn Asn Ile Gly Asp Thr Ser Val Arg Leu SerLys Val Gly Val Ile Asn Asn Ile Gly Asp Thr Ser Val Arg Leu Ser

675 680 685 675 680 685

Val Gly Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Gly Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

690 695 700 690 695 700

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

705 710 715 720705 710 715 720

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

725 730 735 725 730 735

Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn AspLys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp

740 745 750 740 745 750

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu

755 760 765 755 760 765

Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser

770 775 780 770 775 780

Gly Asp Gly Asn Phe Tyr Val His Leu Lys Lys Ser Gly Arg Thr ThrGly Asp Gly Asn Phe Tyr Val His Leu Lys Lys Ser Gly Arg Thr Thr

785 790 795 800785 790 795 800

Arg Val Tyr Val Gln Leu Arg Phe Ser Ile Ala Gln His Ile Arg AspArg Val Tyr Val Gln Leu Arg Phe Ser Ile Ala Gln His Ile Arg Asp

805 810 815 805 810 815

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile

820 825 830 820 825 830

Asn Glu Trp Asn Ala Ser Glu Arg Ser Ala Leu Glu Phe Arg Val ThrAsn Glu Trp Asn Ala Ser Glu Arg Ser Ala Leu Glu Phe Arg Val Thr

835 840 845 835 840 845

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

850 855 860 850 855 860

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

865 870 875 880865 870 875 880

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

885 890 895 885 890 895

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly ArgGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg

900 905 900 905

<210>23<210>23

<211>909<211>909

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный megaTAL PD-1.IgV.exon2_RD1_PS3<223>Synthesized megaTAL PD-1.IgV.exon2_RD1_PS3

<400>23<400>23

Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu ArgMet Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg

1 5 10 15 1 5 10 15

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys ValThr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

20 25 30 20 25 30

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly PheArg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

35 40 45 35 40 45

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu GlyThr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

50 55 60 50 55 60

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu AlaThr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

65 70 75 8065 70 75 80

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala ArgThr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

85 90 95 85 90 95

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro ProAla Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

100 105 110 100 105 110

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly GlyLeu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

115 120 125 115 120 125

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr GlyVal Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

130 135 140 130 135 140

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser AsnAla Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

145 150 155 160145 150 155 160

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro ValAsn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

165 170 175 165 170 175

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile AlaLeu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

180 185 190 180 185 190

Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu LeuSer Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

195 200 205 195 200 205

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val AlaPro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala

210 215 220 210 215 220

Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln ArgIle Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

225 230 235 240225 230 235 240

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln ValLeu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

245 250 255 245 250 255

Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr ValVal Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val

260 265 270 260 265 270

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro AspGln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp

275 280 285 275 280 285

Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu GluGln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu

290 295 300 290 295 300

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu ThrThr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

305 310 315 320305 310 315 320

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln AlaPro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala

325 330 335 325 330 335

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His GlyLeu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly

340 345 350 340 345 350

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly LysLeu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys

355 360 365 355 360 365

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln AspGln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp

370 375 380 370 375 380

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile GlyHis Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly

385 390 395 400385 390 395 400

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu CysGly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

405 410 415 405 410 415

Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser AsnGln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

420 425 430 420 425 430

Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro ValIle Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

435 440 445 435 440 445

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile AlaLeu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

450 455 460 450 455 460

Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu LeuSer His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

465 470 475 480465 470 475 480

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val AlaPro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala

485 490 495 485 490 495

Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln ArgIle Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

500 505 510 500 505 510

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln ValLeu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

515 520 525 515 520 525

Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Ser IleVal Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Ser Ile

530 535 540 530 535 540

Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr AsnVal Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn

545 550 555 560545 550 555 560

Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met AspAsp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Met Asp

565 570 575 565 570 575

Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg ValAla Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg Arg Val

580 585 590 580 585 590

Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser ArgAsn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile Ser Arg

595 600 605 595 600 605

Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrVal Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

610 615 620 610 615 620

Gly Phe Ala Asp Ala Glu Gly Cys Phe Leu Leu His Ile Arg Asn LeuGly Phe Ala Asp Ala Glu Gly Cys Phe Leu Leu His Ile Arg Asn Leu

625 630 635 640625 630 635 640

Asn Arg Thr Ser Thr Lys Tyr Arg Thr Arg Leu Ser Phe Glu Ile GluAsn Arg Thr Ser Thr Lys Tyr Arg Thr Arg Leu Ser Phe Glu Ile Glu

645 650 655 645 650 655

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

660 665 670 660 665 670

Lys Val Gly Ile Ile Asn Asn Ile Gly Asn Arg Arg Val Arg Leu SerLys Val Gly Ile Ile Asn Asn Ile Gly Asn Arg Arg Val Arg Leu Ser

675 680 685 675 680 685

Val Arg Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Arg Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

690 695 700 690 695 700

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

705 710 715 720705 710 715 720

Ala Phe Ser Leu Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Leu Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

725 730 735 725 730 735

Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn AspLys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp

740 745 750 740 745 750

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu

755 760 765 755 760 765

Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser

770 775 780 770 775 780

Gly Asp Gly Asn Phe Tyr Val His Leu Lys Lys Ser Gly Arg Thr ThrGly Asp Gly Asn Phe Tyr Val His Leu Lys Lys Ser Gly Arg Thr Thr

785 790 795 800785 790 795 800

Arg Val Tyr Val Gln Leu Arg Phe Ser Ile Ser Gln His Ile Arg AspArg Val Tyr Val Gln Leu Arg Phe Ser Ile Ser Gln His Ile Arg Asp

805 810 815 805 810 815

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Tyr Ile

820 825 830 820 825 830

Thr Glu Ser Asn Pro Ser Glu Arg Ser Asp Leu Glu Phe Arg Val ThrThr Glu Ser Asn Pro Ser Glu Arg Ser Asp Leu Glu Phe Arg Val Thr

835 840 845 835 840 845

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

850 855 860 850 855 860

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

865 870 875 880865 870 875 880

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

885 890 895 885 890 895

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly ArgGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg

900 905 900 905

<210>24<210>24

<211>236<211>236

<212>БЕЛОК<212>PROTEIN

<213>Mus musculus<213>Mus musculus

<400>24<400>24

Met Ser Glu Pro Pro Arg Ala Glu Thr Phe Val Phe Leu Asp Leu GluMet Ser Glu Pro Pro Arg Ala Glu Thr Phe Val Phe Leu Asp Leu Glu

1 5 10 15 1 5 10 15

Ala Thr Gly Leu Pro Asn Met Asp Pro Glu Ile Ala Glu Ile Ser LeuAla Thr Gly Leu Pro Asn Met Asp Pro Glu Ile Ala Glu Ile Ser Leu

20 25 30 20 25 30

Phe Ala Val His Arg Ser Ser Leu Glu Asn Pro Glu Arg Asp Asp SerPhe Ala Val His Arg Ser Ser Leu Glu Asn Pro Glu Arg Asp Asp Ser

35 40 45 35 40 45

Gly Ser Leu Val Leu Pro Arg Val Leu Asp Lys Leu Thr Leu Cys MetGly Ser Leu Val Leu Pro Arg Val Leu Asp Lys Leu Thr Leu Cys Met

50 55 60 50 55 60

Cys Pro Glu Arg Pro Phe Thr Ala Lys Ala Ser Glu Ile Thr Gly LeuCys Pro Glu Arg Pro Phe Thr Ala Lys Ala Ser Glu Ile Thr Gly Leu

65 70 75 8065 70 75 80

Ser Ser Glu Ser Leu Met His Cys Gly Lys Ala Gly Phe Asn Gly AlaSer Ser Glu Ser Leu Met His Cys Gly Lys Ala Gly Phe Asn Gly Ala

85 90 95 85 90 95

Val Val Arg Thr Leu Gln Gly Phe Leu Ser Arg Gln Glu Gly Pro IleVal Val Arg Thr Leu Gln Gly Phe Leu Ser Arg Gln Glu Gly Pro Ile

100 105 110 100 105 110

Cys Leu Val Ala His Asn Gly Phe Asp Tyr Asp Phe Pro Leu Leu CysCys Leu Val Ala His Asn Gly Phe Asp Tyr Asp Phe Pro Leu Leu Cys

115 120 125 115 120 125

Thr Gly Leu Gln Arg Leu Gly Ala His Leu Pro Gln Asp Thr Val CysThr Gly Leu Gln Arg Leu Gly Ala His Leu Pro Gln Asp Thr Val Cys

130 135 140 130 135 140

Leu Asp Thr Leu Pro Ala Leu Arg Gly Leu Asp Arg Ala His Ser HisLeu Asp Thr Leu Pro Ala Leu Arg Gly Leu Asp Arg Ala His Ser His

145 150 155 160145 150 155 160

Gly Thr Arg Ala Gln Gly Arg Lys Ser Tyr Ser Leu Ala Ser Leu PheGly Thr Arg Ala Gln Gly Arg Lys Ser Tyr Ser Leu Ala Ser Leu Phe

165 170 175 165 170 175

His Arg Tyr Phe Gln Ala Glu Pro Ser Ala Ala His Ser Ala Glu GlyHis Arg Tyr Phe Gln Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly

180 185 190 180 185 190

Asp Val His Thr Leu Leu Leu Ile Phe Leu His Arg Ala Pro Glu LeuAsp Val His Thr Leu Leu Leu Ile Phe Leu His Arg Ala Pro Glu Leu

195 200 205 195 200 205

Leu Ala Trp Ala Asp Glu Gln Ala Arg Ser Trp Ala His Ile Glu ProLeu Ala Trp Ala Asp Glu Gln Ala Arg Ser Trp Ala His Ile Glu Pro

210 215 220 210 215 220

Met Tyr Val Pro Pro Asp Gly Pro Ser Leu Glu AlaMet Tyr Val Pro Pro Asp Gly Pro Ser Leu Glu Ala

225 230 235 225 230 235

<210>25<210>25

<211>22<211>22

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>25<400>25

aatggtggca tactccgtct gc 22aatggtggca tactccgtct gc 22

<210>26<210>26

<211>11<211>11

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>26<400>26

tccgctagga a 11tccgctagga a 11

<210>27<210>27

<211>37<211>37

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>27<400>27

tccgctagga aagacaatgg tggcatactc cgtctgc 37tccgctagga aagacaatgg tggcatactc cgtctgc 37

<210>28<210>28

<211>22<211>22

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>28<400>28

aatggtggca tacaaccttt ta 22aatggtggca tacaaccttt ta 22

<210>29<210>29

<211>22<211>22

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>29<400>29

tttccactta tactccgtct gc 22tttccactta tactccgtct gc 22

<210>30<210>30

<211>22<211>22

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>30<400>30

ggcatgcaga tcccacaggc gc 22ggcatgcaga tcccacaggc gc 22

<210>31<210>31

<211>14<211>14

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>31<400>31

ggtggggctg ctcc 14ggtggggctg ctcc 14

<210>32<210>32

<211>37<211>37

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>32<400>32

ggtggggctg ctccaggcat gcagatccca caggcgc 37ggtggggctg ctccaggcat gcagatccca caggcgc 37

<210>33<210>33

<211>22<211>22

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>33<400>33

ggcatgcaga tccaaccttt ta 22ggcatgcaga tccaaccttt ta 22

<210>34<210>34

<211>22<211>22

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>34<400>34

tttccactta tcccacaggc gc 22tttccactta tcccacaggc gc 22

<210>35<210>35

<211>22<211>22

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>35<400>35

acgggcgtga cttccacatg ag 22acgggcgtga cttccacatg ag 22

<210>36<210>36

<211>12<211>12

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>36<400>36

gtcacacaac tg 12gtcacacaac tg 12

<210>37<210>37

<211>38<211>38

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>37<400>37

gtcacacaac tgcccaacgg gcgtgacttc cacatgag 38gtcacacaac tgcccaacgg gcgtgacttc cacatgag 38

<210>38<210>38

<211>22<211>22

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>38<400>38

acgggcgtga cttaaccttt ta 22acggggcgtga cttaaccttt ta 22

<210>39<210>39

<211>22<211>22

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>39<400>39

tttccactta cttccacatg ag 22tttccactta cttccacatg ag 22

<210>40<210>40

<211>2650<211>2650

<212>РНК<212>RNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная мРНК megaTAL RD5_CV23MK экзона 5 PD-1<223>Synthesized mRNA megaTAL RD5_CV23MK exon 5 PD-1

<400>40<400>40

augggauccg ccccccccaa gaagaagcgc aagguggugg accugagaac ccugggguac 60augggauccg ccccccccaa gaagaagcgc aagguggugg accugagaac ccugggguac 60

agccagcagc aacaggagaa gaucaaaccg aaggugcgca gcacgguggc ccagcaccau 120agccagcagc aacaggagaa gaucaaaccg aaggugcgca gcacgguggc ccagcaccau 120

gaagcccucg ugggucaugg auucacgcac gcccacaucg uggcccuguc gcagcauccg 180180

gccgcccugg gcaccguggc ggugaccuac cagcacauca ucaccgcccu gcccgaagcc 240gccgcccugg gcaccguggc ggugaccuac cagcacauca ucaccgcccu gcccgaagcc 240

acccacgagg acaucguggg agugggcaag cagugguccg gagcacgcgc ccuggaggcc 300acccacgagg acaucguggg agugggcaag cagugguccg gagcacgcgc ccuggaggcc 300

cugcugaccg acgccgggga acugcgcggc ccgccucugc agcuggauac cggccaacug 360cugcugaccg acgccgggga acugcgcggc ccgccucugc agcuggauac cggccaacug 360

gucaagaucg ccaagagagg cggagugacc gcgauggagg ccguccacgc cucccggaac 420gucaagaucg ccaagagg cggagugacc gcgauggagg ccguccacgc cucccggaac 420

gcucugaccg gugccccgcu caaucugacu ccggaccagg ugguggcuau cgccagcaac 480gcucugaccg gugccccgcu caaucugacu ccggaccagg ugguggcuau cgccagcaac 480

ggaggaggaa aacaggcccu cgaaacagug cagaggcugc ugccuguccu uugucaagau 540ggaggaggaa aacaggcccu cgaaacagug cagaggcugc ugccuguccu uugucaagau 540

cacgggcuga cucccgacca ggucguggcc auugccagcc acgacggcgg caagcaggcu 600cacggggcuga cucccgacca ggucguggcc auugccagcc acgacggcgg caagcaggcu 600

uuggagacug ugcagcggcu ccugccagug cugugccaag aucacggucu gaccccagau 660uuggagacug ugcagcggcu ccugccagug cugugccaag aucacggucu gaccccagau 660

caggucgucg ccauugcuuc caacggaggc aaacaagcgc uggaaacggu ccaacgccug 720caggucgucg ccauugcuuc caacgggaggc aaacaagcgc uggaaacggu ccaacgccug 720

cugccggugc uuugucagga ucacggccug accccugauc aggugguggc caucgcgucc 780cugccggugc uuugucagga ucacggccug accccugauc aggugguggc caucgcgucc 780

aauaacgggg ggaagcaggc acucgagacu guccagaggc uccugccugu gcucugccag 840aauaacgggg ggaagcaggc acucgagacu guccagaggc uccugccugu gcucugccag 840

gaccacgggc ucacacccga ucaggucguc gcuaucgcgu cgcacgacgg uggaaagcag 900gaccacgggc ucacacccga ucaggucguc gcuaucgcgu cgcacgacgg uggaaagcag 900

gcccuggaaa ccgugcagcg ccuguugccg gugcuguguc aggaccaugg ccuuacuccg 960gcccuggaaa ccgugcagcg ccuguugccg gugcuguguc aggaccaugg ccuuucuccg 960

gaucaggucg ucgcgaucgc aucuaauggu ggaggaaagc aggcccugga gacaguccag 1020gaucaggucg ucgcgaucgc aucuaauggu ggaggaaagc aggcccugga gacaguccag 1020

cgccugcucc cgguguugug ccaagaccau ggucuuaccc cugaccaggu ggucgcuauu 1080cgccugcucc cgguguugug ccaagaccau ggucuuaccc cugaccaggu ggucgcuauu 1080

gccucgaaca ucggcggaaa gcaagcccug gaaaccgugc agcgacuucu gccgguccug 11401140

ugccaggauc auggauugac cccagaccag gugguggcga uugccagcaa caacggcggg 1200ugcggauc auggauugac cccagaccag gugguggcga uugccagcaa caacggcggg 1200

aagcaagcgu uggaaaccgu ccagagacug cuuccugugc ugugccaaga ccacgguuug 12601260

accccggacc aagucgucgc caucgcuucc aacaacggag ggaagcaggc acucgaaacu 1320accccggacc aagucgucgc caucgcuucc aacaacggag ggaagcaggc acucgaaacu 1320

gugcaacggu ugcugcccgu gcucugucag gaucacggac ucaccccuga ucagguggug 13801380

gccaucgcaa gcaacaucgg uggcaaacag gcucuggaaa cuguccaaag acugcugccc 1440gccaucgcaa gcaacaucgg uggcaaacag gcucuggaaa cuguccaaag acugcugccc 1440

gugcuuugcc aggaccacgg acugacuccu gaccaagugg uggcaauugc cuccaacauc 1500gugcuuugcc aggaccacgg acugacuccu gaccaagugg uggcaauugc cuccaacauc 1500

ggaggcaagc aagcgcucga auccaucgug gcgcagcuca gccggccaga ccccgcccug 1560ggaggcaagc aagcgcucga auccaucgug gcgcagcuca gccggccaga ccccgcccug 1560

gccgcccuga cuaacgauca ccugguggcc cuggcgugcc ucggcggucg ccccgcuaug 1620gccgcccuga cuaacgauca ccugguggcc cuggcgugcc ucggcggucg ccccgcuaug 1620

gacgcgguga agaaggggcu gccccacgcc cccgagcuca uucggcgggu gaaccgccgg 1680gacgcgguga agaaggggcu gccccgcc cccgagcuca uucggcgggu gaaccgccgg 1680

aucggagaaa gaaccuccca ucggguggcc aucucgagau cacggcggga auccauuaac 17401740

cccuggaucc ugacuggcuu ugccgacgcc gagggauccu uccagcucga aauccggaac 1800cccuggaucc ugacuggcuu ugccgacgcc gagggauccu uccagcucga aauccggaac 1800

gugaacccaa acaucccccg guaucgcacc agacugcggu ucgagaucga ccuucacaac 1860gugaacccaa acaucccccg guaucgcacc agacugcggu ucgagaucga ccuucacaac 1860

aaggacaagu ccauucugga ggacauccag ucaaccugga aagugggaaa gaucuacaac 1920aaggacaagu ccauucugga ggacauccag ucaaccugga aagugggaaa gaucuacaac 1920

cagggggacu cauacgugaa gcugcgggug acccgcuucg aagaucucaa agugaucauc 1980cagggggacu cauacgugaa gcugcgggug acccgcuucg aagaucucaa agugaucauc 1980

gaccauuucg agaaguaccc ccugaucacu cagaagcuug gagacuacaa acuguucaag 20402040

caggcauucu ccgugaugga gaacaaggag caccugaagg agaacgggau uaaggagcug 21002100

gugcgaauua aggcgaaaau gaacugggga uugaacgaug agcugaagaa ggcguucccg 2160gugcgaauua aggcgaaaau gaacugggga uugaacgaug agcugaagaa ggcguucccg 2160

gaaaacauuu ccaaggagcg cccgcucauc aacaagaaca ucccuaaucu gaaguggcuc 2220gaaaacauuu ccaaggagcg cccgcucauc aacaagaaca ucccuaaucu gaaguggcuc 2220

gcgggguuua ccucuggcga cggccauuuc ggagugauuc ucgcaaagcg caggcccgcc 2280gcgggguuua ccucuggcga cggccauuuc ggagugauuc ucgcaaagcg caggcccgcc 2280

agcccugugc aagugcggcu gcgguucaug aucggccagc acauuaagga caagaaccug 2340agcccuguc aagugcggcu gcgguucaug aucggccagc acauuaagga caagaaccug 2340

augaacucgc ucaucaccua ccuuggaugc ggccggauuc gcgaaaagaa caagagcgag 2400augaacucgc ucaucaccua ccuuggaugc ggccggauuc gcgaaaagaa caagagcgag 2400

aaguccuggc uggaauuuga agugaccaag uucagcgaca ucaacgacaa gaucauuccg 2460uucagcgaca ucaacgacaa gaucauuccg 2460

guguuccagg aaaacacccu gauuggcgug aagcuggagg acuucgagga uuggugcaag 2520guguuccagg aaaacacccu gauuggcgug aagcuggagg acuucgagga uuggugcaag 2520

guggccaagc ucaucgaaga aaagaagcac cugacugaau ccggcuugga cgagaucaag 2580guggccaagc ucaucgaaga aaagaagcac cugacugaau ccggcuugga cgagaucaag 2580

aagauuaagc ugaauaugaa caagggaagg ugauagcgcg cuagccguac ggaaaaaaaa 2640aagauuaagc ugaauuugaa caagggaagg ugauagcgcg cuagccguac ggaaaaaaaa 2640

aaaaaaaaaa 2650aaaaaaaaaa 2650

<210>41<210>41

<211>2526<211>2526

<212>РНК<212>RNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная мРНК megaTAL RD2_B1H8 экзона 1 PD-1<223>Synthesized mRNA megaTAL RD2_B1H8 exon 1 PD-1

<400>41<400>41

augggaagcg ccccgccgaa gaagaagcgc aagguggugg aucugagaac ccugggauac 60augggaagcg ccccgccgaa gaagaagcgc aagguggugg aucugagaac ccugggauac 60

agccagcagc agcaggagaa gaucaagccg aagguccggu cuaccguggc ccagcaccau 120agccagcagc agcaggagaa gaucaagccg aagguccggu cuaccguggc ccagcaccau 120

gaggcccuug ugggccacgg cuucacacau gcacacaucg ucgcccuguc gcagcauccc 180gaggcccuug ugggccacgg cuucacacau gcacacaucg ucgcccuguc gcagcauccc 180

gccgcccugg ggaccguggc cgugaccuau caacacauca uuaccgcccu gccggaggcc 240gccgcccugg ggaccguggc cgugaccuau caacacauca uuaccgcccu gccgggaggcc 240

acccacgagg acaucguggg uguggggaag caguggagcg gagccagggc acucgaagcc 300acccacgagg acaucguggg uguggggaag caguggagcg gagccagggc acucgaagcc 300

cuccucacug acgcuggaga acugcgcgga ccgccucucc agcuggacac cggacagcug 360cuccucacug acgcuggaga acugcgcgga ccgccucucc agcuggacac cggacagcug 360

gugaaaaucg ccaagcgggg aggagugacc gccauggaag ccgugcacgc cucgaggaac 420gugaaaaucg ccaagcgggg aggagugacc gccauggaag ccgugcacgc cucgaggaac 420

gcgcugacug gcgccccucu gaaccugacc ccugaucagg ucguggcuau cgccucaaac 480gcgcugacug gcgccccucu gaaccugacc ccugaucagg ucguggcuau cgccucaaac 480

aacgggggua agcaggcgcu ggagacagug caacgacuuc ugccagugcu uugucaggac 540aacgggggua agcaggcgcu ggagacagug caacgacuuc ugccagugcu uugucaggac 540

cauggucuga cccccgacca ggucgucgcc auugcaucca acaauggugg caagcaggca 600cauggucuga cccccgacca ggucgucgcc auugcaucca acaauggugg caagcaggca 600

cuggagacug uccagaggcu gcucccggug cugugccagg accacgggcu caccccggac 660660

caaguggucg ccaucgccuc caacggagga ggaaaacaag cucuggagac ugugcaacgc 720caaguggucg ccaucgccuc caacggagga ggaaaacaag cucuggagac ugugcaacgc 720

cugcugccug uguugugcca agaccacgga cugacgcccg aucagguggu ggcgaucgca 780780

ucgaacaacg gaggaaagca agcgcuggaa accgugcagc gccuccugcc cguccucugc 840ucgaacaacg gaggaaagca agcgcuggaa accgugcagc gccuccugcc cguccucugc 840

caggaucacg gccugacucc ggaccaggug gucgcgaucg ccagcaauaa cggggggaag 900caggaucacg gccugacucc ggaccaggug gucgcgaucg ccagcaauaa cggggggaag 900

caagcccucg agacugugca gcgguugcug cccgugcucu gccaagauca uggccuuacc 960caagcccucg agacugugca gcgguugcug cccgugcucu gccaagauca uggccuuacc 960

ccagaccaag ucguggccau ugcuuccaac aacgguggca aacaggcgcu cgaaaccguc 1020ccagaccaag ucguggccau ugcuuccaac aacgguggca aacaggcgcu cgaaaccguc 1020

cagcggcugu ugcccgugcu uugccaggau cacggacuca ccccugauca ggugguggca 10801080

auugcgucca acaacggugg aaagcaggcc cuggaaacgg ugcagcggcu gcuuccgguc 1140auugcgucca acaacggugg aaagcaggcc cuggaaacgg ugcagcggcu gcuuccgguc 1140

cugugucagg aucaugggcu gacucccgac caggucgucg ccauugcauc ccacgauggg 1200cugugucagg aucaugggcu gacuccgac caggucgucg ccauugcauc ccacgauggg 1200

gguaaacagg cccucgaaac agugcagaga cuccugccag uccugugcca agaccacgga 12601260

cuuaccccgg aucagguggu ggccauagcc ucgaacggcg gcgggaaaca ggcucuggaa 1320cuuaccccgg aucagguggu ggccauagcc ucgaacggcg gcgggaaaca ggcucuggaa 1320

acugugcaaa gacuccuccc gguguugugu caagaccaug gacugacccc agaucaggug 13801380

guggcuauug ccucuaacaa cggcggcaag caagcacucg aaagcaucgu ggcccaguug 1440guggcuauug cccucuaacaa cggcggcaag caagcacucg aaagcaucgu ggcccaguug 1440

ucacgccccg accccgcacu ggcugcccug acgaaugacc aucugguggc gcuggccugc 1500ucacgccccg accccgcacu ggcugcccug acgaaugacc aucugguggc gcuggccugc 1500

cugggaggga ggccagcgau ggaugcggug aagaagggac ugccccaugc uccggagcug 1560cugggaggga ggccagcgau ggaugcggug aagaagggac ugccccaugc uccggagcug 1560

auucggagag ugaauaggcg caucggagag agaacuucac aucggguggc cauuucuaga 16201620

gugggcggca gcucccggcg cgaguccauu aaccccugga uccugaccgg cuuugccgac 1680gugggcggca gcucccggcg cgaguccauu aaccccugga uccugaccgg cuuugccgac 1680

gccgaagggu ccuucggccu cucgauccug aaccggaacc gggguaccgc ucgguaccac 1740gccgaagggu ccuucggccu cucgauccug aaccggaacc gggguaccgc ucgguaccac 1740

accagacugu ccuucaccau cgugcugcac aacaaggaca agagcauccu cgaaaacauu 1800accagacugu ccuucaccau cgugcugcac aacaaggaca agagcauccu cgaaaacauu 1800

cagucaacgu ggaagguggg aauuauuacu aacgacggcg acagauacgu gcgccugugc 1860cagucaacgu ggaagguggg aauuauuacu aacgacggcg acagauacgu gcgccugugc 1860

gugacccggu uugaggaccu gaaggucauu aucgaccacu ucgagaagua cccccucgug 1920gugacccggu uugaggaccu gaaggucauu aucgaccacu ucgagaagua cccccucgug 1920

acucagaagc ugggagacua caagcuguuc aagcaggcgu ucucggugau ggaaaacaag 1980acucagaagc ugggagacua caagcuguuc aagcaggcgu ucucggugau ggaaaacaag 1980

gagcaccuga aggagaacgg caucaaggag cucgcccgga ucaaggccaa gaugaacugg 2040gagcaccuga aggagaacgg caucaaggag cucgccggga ucaaggccaa gaugaacugg 2040

ggccugaaug augaacucaa gaaggcguuc ccugaaaaca ucgguaaaga acggccccug 2100ggccugaaug augaacucaa gaaggcguuc ccugaaaaca ucgguaaaga acggccccug 2100

aucaacaaga acaucccgaa cuucaagugg cuugccggau ucaccuccgg cgacggaucc 2160aucaacaaga acaucccgaa cuucaagugg cuugccggau ucaccuccgg cgacggaucc 2160

uucuucgucc ggcugcgcaa guccaacgug aacgcgagag ugcgggugca auuggucuuu 22202220

gaaaucucac agcacaucag ggacaagaau uugaugaacu cccucaucac cuaccugggu 2280gaaaucucac agcacaucag ggacaagaau uugaugaacu cccucaucac cuaccugggu 2280

ugcggacaca ucuacgaagg caauaagucg gagcggagcu ggcugcaguu ucgcguggaa 2340ugcggacaca ucuacgaagg caauaagucg gagcggagcu ggcugcaguu ucgcguggaa 2340

aaguucuccg acauuaacga caagaucauc ccaguguucc aggaaaacac ucugauuggc 2400aaguucuccg acauuaacga caagaucauc ccaguguucc aggaaaacac ucugauuggc 2400

gugaagcuug aggauuucga ggacuggugc aagguggcca agcugauuga agagaagaag 24602460

caccugaccg aguccggccu ggacgaaauc aagaaaauca agcugaacau gaacaaggga 2520caccugaccg aguccggccu ggacgaaauc aagaaaauca agcugaacau gaacaaggga 2520

cgguga 2526cgguga 2526

<210>42<210>42

<211>2730<211>2730

<212>РНК<212>RNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная мРНК megaTAL RD1_G5 экзона 2 PD-1<223>Synthesized mRNA megaTAL RD1_G5 exon 2 PD-1

<400>42<400>42

augggaagcg ccccuccgaa gaagaagcgc aaggucgugg accucagaac ccuggguuac 60augggaagcg ccccuccgaa gaagaagcgc aaggucgugg accucagaac ccuggguuac 60

ucccagcagc agcaggagaa aauuaagccg aaggugcgcu ccaccguggc ucaacaccac 120ucccagcagc agcaggagaa aauuaagccg aaggugcgcu ccaccguggc ucaacaccac 120

gaggcccucg ugggccaugg auucacucac gcccauaucg uggcccuguc ccagcacccg 180180

gccgcccugg gcaccguggc ggugaccuac cagcacauca ucaccgcgcu gccugaagcc 240gccgcccugg gcaccguggc ggugaccuac cagcacauca ucaccgcgcu gccugaagcc 240

acccacgagg acaucgucgg uguggguaag cagugguccg gagccagagc ccuggaggcu 300acccacgagg acaucgucgg uguggguaag cagugguccg gagccagagc ccuggaggcu 300

cugcugaccg acgccggaga acucagaggc ccgccucugc agcuggacac cggacagcug 360cugcugaccg acgccggaga acucagaggc ccgccucugc agcuggacac cggacagcug 360

gugaagauag ccaagagagg cggcgugacc gccauggaag ccgugcaugc gucccgcaac 420gugaagauag ccaagagagg cggcgugacc gccauggaag ccgugcaugc gucccgcaac 420

gcacugaccg gggccccccu gaaccugacu ccagaccaag ugguggcuau cgccagcaac 480gcacugaccg gggccccccu gaaccugacu ccagaccaag ugguggcuau cgccagcaac 480

aauggaggaa agcaagccuu ggaaaccgug cagcggcugc ucccgguccu uugccaagac 540aauggaggaa agcaagccuu ggaaaccgug cagcggcugc ucccgguccu uugccaagac 540

cacggccuga cacccgauca ggugguggca aucgcaucga auggcggcgg gaagcaggcc 600cacggccuga cacccgauca ggugguggca aucgcaucga auggcggcgg gaagcaggcc 600

cucgagacug ugcagaggcu ccugccugug cugugccagg accaugggcu gaccccagac 660cucgagacug ugcagaggcu ccugccugug cugugccagg accaugggcu gaccccagac 660

cagguggucg caaucgccuc gcacgacgga ggcaagcaag cccuggaaac uguccagcgc 720cagguggucg caaucgccuc gcacgacgga ggcaagcaag cccuggaaac uguccagcgc 720

cugcucccug uccuguguca agaucauggg cucacuccug aucaggucgu cgccaucgcc 780cugcucccug uccuguguca agaucauggg cucacuccug aucaggucgu cgccaucgcc 780

ucgaacauug guggcaagca ggcgcucgaa accguccagc gguugcugcc agugcuuugc 840ucgaacauug guggcaagca ggcgcucgaa accguccagc gguugcugcc agugcuuugc 840

caggaccaug gucugacccc cgaucaagug gucgcgauug ccucacacga uggcgguaag 900caggaccaug gucugacccc cgaucaagug gucgcgauug ccucacacga uggcgguaag 900

caggcuuugg aaaccgugca acggcuguug ccuguccucu gccaggacca cggcuugacu 960caggcuuugg aaaccgugca acggcuguug ccuguccucu gccaggacca cggcuugacu 960

cccgaccagg ugguggccau agccucaaac aucggaggga aacaagcccu cgaaaccguc 1020cccgaccagg ugguggccau agccucaaac aucggaggga aacaagcccu cgaaaccguc 1020

cagaggcugc ugccgguguu gugccaggau cacggauuga ccccagacca gguggucgcc 1080cagaggcugc ugccgguguu gugccaggau cacggauuga ccccagacca gguggucgcc 1080

auugcuuccc acgauggggg aaagcaggcc cuggagacug ugcagcgccu ccuucccguc 11401140

cugugucagg aucauggacu uacccccgac caagucgugg cgauugcuuc caauaucgga 1200cugugucagg aucauggacu uacccccgac caagucgugg cgauugcuuc cauauucggga 1200

ggcaaacagg cccuugaaac agugcagcgc cuguugccgg ugcucugcca agaucacgga 12601260

cugaccccug accagguggu ggcgaucgcg ucaaauaucg gcggcaagca ggcacuggag 13201320

acaguccaga gacuccugcc gguccucugc caggaccacg gucuuacucc ugaccaagug 13801380

guggcuaucg caucccauga uggugggaaa caggcucuug aaacugugca acgccugcug 1440guggcuaucg caucccauga uggugggaaa caggcucuug aaacugugca acgccugcug 1440

cccgugcugu gccaagacca cggacugacu ccggaccagg ucguggccau cgcuucaaac 1500ccggugcugu gccaagacca cggacugacu ccggaccagg ucguggccau cgcuucaaac 1500

ggagggggaa aacaggcacu ugaaacggug cagagacugc ugccuguccu uugucaggac 15601560

cacggguuga ccccggacca ggucguggcu auugccucga acaacggggg gaagcaagcg 1620cacggguuga ccccggacca ggucguggcu auugccucga acaacggggg gaagcaagcg 1620

cucgagucca uuguggccca gcugagccgg ccugaucccg cacuggccgc gcugaccaac 1680cucgagucca uuguggccca gcugagccgg ccugaucccg cacuggccgc gcugaccaac 1680

gaucaccugg uggcccucgc cugucugggc ggacggccgg ccauggacgc cgugaagaag 17401740

ggacugccgc acgcgcccga gcugauccgc cgcgugaaca ggcggauugg agaacgcacc 1800ggacugccgc acgcgcccga gcugauccgc cgcgugaaca ggcggauugg agaacgcacc 1800

ucccaccggg uggccaucuc gagaguggga ggauccucua gacgggaguc cauuaacccg 1860ucccaccggg uggccaucuc gagaguggga ggauccucua gacgggaguc cauuaacccg 1860

uggauccuga cuggauucgc cgacgccgag ggguccuucc agcuguacau cuccaacgug 1920uggauccuga cuggauucgc cgacgccgag ggguccuucc agcuguacau cuccaacgug 1920

aacaacaacc gcagcagaua cagggcccgg cugcgguucg cgaucgaacu gcacaauaag 1980aacaacaacc gcagcagaua cagggcccgg cugcgguucg cgaucgaacu gcacaauaag 1980

gacaagagca uccucgagaa cauucagucc acuuggaagg ugggcgugau uaacaacauc 20402040

ggcgauacca gcgugcggcu cuccgugggg cgguucgaag aucucaaggu gaucaucgac 2100ggcgauacca gcgugcggcu cuccgugggg cgguucgaag aucucaaggu gaucaucgac 2100

cacuucgaga aguacccgcu gaucacccag aagcugggag acuacaagcu guucaagcaa 2160cacuucgaga aguacccgcu gaucacccag aagcugggag acuacaagcu guucaagcaa 2160

gcuuucagcg ugauggaaaa caaggaacau cugaaagaga acgguaucaa ggaacuggug 2220gcuuucagcg ugauggaaaa caaggaacau cugaaagaga acgguaucaa ggaacuggug 2220

cggauuaagg ccaagaugaa cuggggucug aacgaugaac ugaagaaggc guucccggag 2280cggauuaagg ccaagaugaa cuggggucug aacgaugaac ugaagaaggc guucccggag 2280

aauaucagca aggagcgccc ccugauuaac aaaaacaucc caaaccucaa guggcucgcc 23402340

ggcuuuacuu ccggagaugg uaacuucuac gugcaccuga agaaguccgg aagaaccacc 2400ggcuuuacuu ccggagaugg uaacuucuac gugcaccuga agaaguccgg aagaaccacc 2400

cgggucuacg ugcagcugag guucuccauc gcccagcaca uccgggacaa gaacuugaug 24602460

aacucccuga ucaccuaccu cgguugcgga uacaucaacg aauggaacgc cagcgagaga 2520aacucccuga ucaccuaccu cgguugcgga uacaucaacg aauggaacgc cagcgagaga 2520

ucggcccugg aguucagggu gacuaaguuc uccgacauca acgacaagau uauccccgug 2580ucggcccugg aguucagggu gacuaaguuc uccgacauca acgacaagau uauccccgug 2580

uuucaggaaa auacccucau cggcgugaag cuggaggacu uugaggacug gugcaaggug 2640uuucaggaaa auacccucau cggcgugaag cuggaggacu uugaggacug gugcaaggug 2640

gccaagcuga ucgaggaaaa gaaacaucug accgagagcg gccuggacga aaucaagaag 2700gccaagcuga ucgaggaaaa gaaacaucug accgagagcg gccuggacga aaucaagaag 2700

auuaagcuga acaugaacaa gggacgauga 2730auuaagcuga acaugaacaa gggacgauga 2730

<210>43<210>43

<211>711<211>711

<212>РНК<212>RNA

<213>Mus musculus<213>Mus musculus

<400>43<400>43

augucugagc caccucgggc ugagaccuuu guauuccugg accuagaagc cacugggcuc 60augucugagc caccucgggc ugagaccuuu guauuccugg accuagaagc cacugggcuc

ccaaacaugg acccugagau ugcagagaua ucccuuuuug cuguucaccg cucuucccug 120ccaaacaugg acccugagau ugcagagaua ucccuuuuug cuguucaccg cucuucccug 120

gagaacccag aacgggauga uucugguucc uuggugcugc cccguguucu ggacaagcuc 180gagaacccag aacgggauga uucugguucc uuggugcugc cccguguucu ggacaagcuc 180

acacugugca ugugcccgga gcgccccuuu acugccaagg ccagugagau uacugguuug 240acacugugca ugugcccgga gcgccccuuu acugccaagg ccagugagau uacugguuug 240

agcagcgaaa gccugaugca cugcgggaag gcugguuuca auggcgcugu gguaaggaca 300agcagcgaaa gccugaugca cugcgggaag gcugguuuca auggcgcugu gguaaggaca 300

cugcagggcu uccuaagccg ccaggagggc cccaucugcc uuguggccca caauggcuuc 360cugcagggcu uccuaagccg ccaggagggc cccaucugcc uuguggccca caauggcuuc 360

gauuaugacu ucccacugcu gugcacgggg cuacaacguc ugggugccca ucugccccaa 420gauuaugacu uccacugcu gugcacgggg cuacaacguc ugggugccca ucugccccaa 420

gacacugucu gccuggacac acugccugca uugcggggcc uggaccgugc ucacagccac 480gacacugucu gccuggacac acugccugca uugcggggcc uggaccgugc ucacagccac 480

ggcaccaggg cucaaggccg caaaagcuac agccuggcca gucucuucca ccgcuacuuc 540ggcaccagggg cucaaggccg caaaagcuac agccuggcca gucucuucca ccgcuacuuc 540

caggcugaac ccagugcugc ccauucagca gaaggugaug ugcacacccu gcuucugauc 600caggcugaac ccagugcugc ccauucagca gaaggugaug ugcacacccu gcuucugauc 600

uuccugcauc gugcuccuga gcugcucgcc ugggcagaug agcaggcccg cagcugggcu 660uuccugcauc gugcuccuga gcugcucgcc ugggcagaug agcaggcccg cagcugggcu 660

cauauugagc ccauguacgu gccaccugau gguccaagcc ucgaagccug a 711cauauugagc ccauguacgu gccaccugau gguccaagcc ucgaagccug a 711

<210>44<210>44

<211>7601<211>7601

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная конструкция Exon5_MND-BFP rAAV PD-1<223>Exon5_MND-BFP rAAV PD-1 synthesized construct

<400>44<400>44

cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60cagctgcgcg ctcgctcgct cactgaggcc gcccggggcaa agcccggggcg tcgggcgacc 60

tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120

actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtagaattca 180actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtagaattca 180

gtccagggct ctgtcctgca cctggggaat ggtgaccggc atctctgtcc tctagctctg 240gtccagggct ctgtcctgca cctggggaat ggtgaccggc atctctgtcc tctagctctg 240

gaagcacccc agcccctcta gtctgccctc acccctgacc ctgaccctcc accctgaccc 300gaagcacccc agcccctcta gtctgccctc acccctgacc ctgaccctcc accctgaccc 300

cgtcctaacc cctgaccttt gtgcccttcc agagagaagg gcagaagtgc ccacagccca 360cgtcctaacc cctgaccttt gtgcccttcc agagagaagg gcagaagtgc cccagccca 360

ccccagcccc tcacccaggc cagccggcca gttccaaacc ctggtggttg gtgtcgtggg 420ccccagcccc tcacccaggc cagccggcca gttccaaacc ctggtggttg gtgtcgtggg 420

cggcctgctg ggcagcctgg tgctgctagt ctgggtcctg gccgtcatct gctcccgggc 480cggcctgctg ggcagcctgg tgctgctagt ctgggtcctg gccgtcatct gctcccggggc 480

cgcacgaggt aacgtcatcc cagcccctcg gcctgccctg ccctaaccct gctggcggcc 540cgcacgaggt aacgtcatcc cagcccctcg gcctgccctg ccctaaccct gctggcggcc 540

ctcactcccg cctccccttc ctccaccctt ccctcacccc accccacctc cccccatctc 600ctcactcccg ccctccccttc ctccaccctt ccctcacccc accccacctc cccccatctc 600

cccgccaggc taagtccctg atgaaggccc ctggactaag accccccacc taggagcacg 660cccgccaggc taagtccctg atgaaggccc ctggactaag accccccacc taggagcacg 660

gctcagggtc ggcctggtga ccccaagtgt gtttctctgc agggacaata ggagccaggc 720gctcagggtc ggcctggtga ccccaagtgt gtttctctgc agggacaata ggagccaggc 720

gcaccggcca gcccctggtg agtctcactc ttttcctgca tgatccactg tgccttcctt 780gcaccggcca gcccctggtg agtctcactc ttttcctgca tgatccactg tgccttcctt 780

cctgggtggg cagaggtgga aggacaggct gggaccacac ggcctgcagg actcacattc 840cctgggtggg cagaggtgga aggacaggct gggaccacac ggcctgcagg actcacattc 840

tattatagcc aggaccccac ctccccagcc cccaggcagc aacctcaatc cctaaagcca 900tattatagcc aggaccccac ctccccagcc cccaggcagc aacctcaatc cctaaagcca 900

tgatctgggg ccccagccca cctgcggtct ccgggggtgc ccggcccatg tgtgtgcctg 960tgatctgggg ccccagccca cctgcggtct ccggggggtgc ccggcccatg tgtgtgcctg 960

cctgcggtct ccaggggtgc ctggcccacg cgtgtgcccg cctgcggtct ctgggggtgc 10201020

ccggcccaca tatgtgcctg cctgcggtct ccaggtgtgc ccggcccatg cgtgtgccca 1080ccggcccaca tatgtgcctg cctgcggtct ccaggtgtgc ccggcccatg cgtgtgccca 1080

cctgcgaggg cgtggggtgg gcttggtcat ttcttatctt acattggaga caggagagct 1140cctgcgaggg cgtggggtgg gcttggtcat ttcttatctt acattggaga caggaagct 1140

tgaaaagtca cattttggaa tcctaaatct gcaagaatgc cagggacatt tcagaggggg 1200tgaaaagtca cattttggaa tcctaaatct gcaagaatgc cagggacatt tcagagggggg 1200

acattgagcc agagaggagg ggtggtgtcc ccagatcaca cagagggcag tggtgggaca 12601260

gctcagggta agcagctcat agtggggggc ccaggttcgg tgccggtact gcagccaggc 1320gctcagggta agcagctcat agtggggggc ccaggttcgg tgccggtact gcagccaggc 1320

tgtggagccg cgggcctcct tcctgcggtg ggccgtgggg ctgactccct ctccctttct 1380tgtggagccg cgggcctcct tcctgcggtg ggccgtgggg ctgactccct ctccctttct 1380

cctcaaagaa ggaggacccc tcagccgtgc ctgtgttctc tgtggactat ggggagctgg 1440cctcaaagaa ggaggacccc tcagccgtgc ctgtgttctc tgtggactat ggggagctgg 1440

atttccagtg gcgagagaag accccggagc cccccgtgcc ctgtgtccct gagcagacgg 1500atttccagtg gcgagagaag accccggagc cccccgtgcc ctgtgtccct gagcagacgg 1500

agtaatgcat gaacagagaa acaggagaat atgggccaaa caggatatct gtggtaagca 1560agtaatgcat gaacagagaa acaggagaat atgggccaaa caggatatct gtggtaagca 1560

gttcctgccc cggctcaggg ccaagaacag ttggaacagc agaatatggg ccaaacagga 1620gttcctgccc cggctcaggg ccaagaacag ttggaacagc agaatatgggg ccaaacagga 1620

tatctgtggt aagcagttcc tgccccggct cagggccaag aacagatggt ccccagatgc 1680tatctgtggt aagcagttcc tgccccggct cagggccaag aacagatggt ccccagatgc 1680

ggtcccgccc tcagcagttt ctagagaacc atcagatgtt tccagggtgc cccaaggacc 1740ggtcccgccc tcagcagttt ctagagaacc atcagatgtt tccagggtgc cccaaggacc 1740

tgaaatgacc ctgtgcctta tttgaactaa ccaatcagtt cgcttctcgc ttctgttcgc 1800tgaaatgacc ctgtgcctta tttgaactaa ccaatcagtt cgcttctcgc ttctgttcgc 1800

gcgcttctgc tccccgagct ctatataagc agagctcgtt tagtgaaccg tcagatcgcc 1860gcgcttctgc tccccgagct ctatataagc agagctcgtt tagtgaaccg tcagatcgcc 1860

tggagacgcc atccacgctg ttttgacttc catagaagga tctcgaggcc accatggcta 1920tggagacgcc atccacgctg ttttgacttc catagaagga tctcgaggcc accatggcta 1920

gcgagctgat taaggagaac atgcacatga agctgtacat ggagggcacc gtggacaacc 1980gcgagctgat taaggagaac atgcacatga agctgtacat ggagggcacc gtggacaacc 1980

atcacttcaa gtgcacatcc gagggcgaag gcaagcccta cgagggcacc cagaccatga 2040atcacttcaa gtgcacatcc gagggcgaag gcaagcccta cgagggcacc cagaccatga 2040

gaatcaaggt ggtcgagggc ggccctctcc ccttcgcctt cgacatcctg gctactagct 2100gaatcaaggt ggtcgagggc ggccctctcc ccttcgcctt cgacatcctg gctactagct 2100

tcctctacgg cagcaagacc ttcatcaacc acacccaggg catccccgac ttcttcaagc 2160tcctctacgg cagcaagacc ttcatcaacc acacccaggg catccccgac ttcttcaagc 2160

agtccttccc tgagggcttc acatgggaga gagtcaccac atacgaggac gggggcgtgc 2220agtccttccc tgagggcttc acatgggaga gagtcaccac atacgaggac gggggcgtgc 2220

tgaccgctac ccaggacacc agcctccagg acggctgcct catctacaac gtcaagatca 2280tgaccgctac ccaggacacc agcctccagg acggctgcct catctacaac gtcaagatca 2280

gaggggtgaa cttcacatcc aacggccctg tgatgcagaa gaaaacactc ggctgggagg 2340gaggggtgaa cttcacatcc aacggccctg tgatgcagaa gaaaacactc ggctgggagg 2340

ccttcaccga gacgctgtac cccgctgacg gcggcctgga aggcagaaac gacatggccc 2400ccttcaccga gacgctgtac cccgctgacg gcggcctgga aggcagaaac gacatggccc 2400

tgaagctcgt gggcgggagc catctgatcg caaacatcaa gaccacatat agatccaaga 2460tgaagctcgt gggcgggagc catctgatcg caaacatcaa gaccacatat agatccaaga 2460

aacccgctaa gaacctcaag atgcctggcg tctactatgt ggactacaga ctggaaagaa 2520aacccgctaa gaacctcaag atgcctggcg tctactatgt ggactacaga ctggaaagaa 2520

tcaaggaggc caacaacgag acctacgtcg agcagcacga ggtggcagtg gccagatact 2580tcaaggaggc caacaacgag acctacgtcg agcagcacga ggtggcagtg gccagatact 2580

gcgacctccc tagcaaactg gggcacaagc taaattgaaa gctttgcttt atttgtgaaa 2640gcgacctccc tagcaaactg gggcacaagc taaattgaaa gctttgcttt atttgtgaaa 2640

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gtttaacaac 2700tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gtttaacaac 2700

aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagt 27602760

cgacccacca ttgtctttcc tagcggaatg ggcacctcat cccccgcccg caggggctca 2820cgacccacca ttgtctttcc tagcggaatg ggcacctcat cccccgcccg caggggctca 2820

gctgacggcc ctcggagtgc ccagccactg aggcctgagg atggacactg ctcttggccc 2880gctgacggcc ctcggagtgc ccagccactg aggcctgagg atggacactg ctcttggccc 2880

ctctgaccgg cttccttggc caccagtgtt ctgcagaccc tccaccatga gcccgggtca 2940ctctgaccgg cttccttggc caccagtgtt ctgcagaccc tccaccatga gcccgggtca 2940

gcgcatttcc tcaggagaag caggcagggt gcaggccatt gcaggccgtc caggggctga 3000gcgcatttcc tcaggagaag caggcagggt gcaggccatt gcaggccgtc caggggctga 3000

gctgcctggg ggcgaccggg gctccagcct gcacctgcac caggcacagc cccaccacag 3060gctgcctggg ggcgaccggg gctccagcct gcacctgcac caggcacagc cccaccacag 3060

gactcatgtc tcaatgccca cagtgagccc aggcagcagg tgtcaccgtc ccctacaggg 3120gactcatgtc tcaatgccca cagtgagccc aggcagcagg tgtcaccgtc ccctacaggg 3120

agggccagat gcagtcactg cttcaggtcc tgccagcaca gagctgcctg cgtccagctc 3180agggccagat gcagtcactg cttcaggtcc tgccagcaca gagctgcctg cgtccagctc 3180

cctgaatctc tgctgctgct gctgctgctg ctgctgctgc ctgcggcccg gggctgaagg 3240cctgaatctc tgctgctgct gctgctgctg ctgctgctgc ctgcggcccg gggctgaagg 3240

cgccgtggcc ctgcctgacg ccccggagcc tcctgcctga acttgggggc tggttggaga 3300cgccgtggcc ctgcctgacg ccccggagcc tcctgcctga acttgggggc tggttggaga 3300

tggccttgga gcagccaagg tgcccctggc agtggcatcc cgaaacgccc tggacgcagg 3360tggccttgga gcagccaagg tgcccctggc agtggcatcc cgaaacgccc tggacgcagg 3360

gcccaagact gggcacagga gtgggaggta catggggctg gggactcccc aggagttatc 3420gcccaagact gggcacagga gtgggaggta catggggctg gggactcccc aggagttatc 3420

tgctccctgc aggcctagag aagtttcagg gaaggtcaga agagctcctg gctgtggtgg 3480tgctccctgc aggcctagag aagtttcagg gaaggtcaga agagctcctg gctgtggtgg 3480

gcagggcagg aaacccctcc acctttacac atgcccaggc agcacctcag gccctttgtg 3540gcagggcagg aaacccctcc acctttacac atgcccaggc agcacctcag gccctttgtg 3540

gggcagggaa gctgaggcag taagcgggca ggcagagctg gaggcctttc aggcccagcc 3600gggcagggaa gctgaggcag taagcgggca ggcagagctg gaggcctttc aggcccagcc 3600

agcactctgg cctcctgccg ccgcattcca ccccagcccc tcacaccact cgggagaggg 3660agcactctgg ccctcctgccg ccgcattcca ccccagcccc tcacaccact cgggagaggg 3660

acatcctacg gtcccaaggt caggagggca gggctggggt tgactcaggc ccctcccagc 3720acatcctacg gtcccaaggt caggagggca gggctggggt tgactcaggc ccctcccagc 3720

tgtggccacc tgggtgttgg gagggcagaa gtgcaggcac ctagggcccc ccatgtgccc 3780tgtggccacc tgggtgttgg gagggcagaa gtgcaggcac ctagggcccc ccatgtgccc 3780

accctgggag ctctccttgg aacccattcc tgaaattatt taaaggggtt ggccggacta 3840accctgggag ctctccttgg aacccattcc tgaaattatt taaaaggggtt ggccggacta 3840

gttacgtaga taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg 3900gttacgtaga taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg 3900

agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg 3960agttggccac tccctctctg cgcgctcgct cgctcactga ggccggggcga ccaaaggtcg 3960

cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc cagctggcgt 4020cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc cagctggcgt 4020

aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa 4080aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa 4080

tggcgattcc gttgcaatgg ctggcggtaa tattgttctg gatattacca gcaaggccga 4140tggcgattcc gttgcaatgg ctggcggtaa tattgttctg gatattacca gcaaggccga 4140

tagtttgagt tcttctactc aggcaagtga tgttattact aatcaaagaa gtattgcgac 4200tagtttgagt tcttctactc aggcaagtga tgttattact aatcaaagaa gtattgcgac 4200

aacggttaat ttgcgtgatg gacagactct tttactcggt ggcctcactg attataaaaa 4260aacggttaat ttgcgtgatg gacagactct tttactcggt ggcctcactg attataaaaa 4260

cacttctcag gattctggcg taccgttcct gtctaaaatc cctttaatcg gcctcctgtt 4320cacttctcag gattctggcg taccgttcct gtctaaaatc cctttaatcg gcctcctgtt 4320

tagctcccgc tctgattcta acgaggaaag cacgttatac gtgctcgtca aagcaaccat 4380tagctcccgc tctgattcta acgaggaaag cacgttatac gtgctcgtca aagcaaccat 4380

agtacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga 4440agtacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga 4440

ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg 45004500

ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat 4560ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat 4560

ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg 4620ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg 4620

ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata 4680ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata 4680

gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt 4740gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt 4740

tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat 4800tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat 4800

ttaacgcgaa ttttaacaaa atattaacgt ttacaattta aatatttgct tatacaatct 4860ttaacgcgaa ttttaacaaa atattaacgt ttacaattta aatatttgct tatacaatct 4860

tcctgttttt ggggcttttc tgattatcaa ccggggtaca tatgattgac atgctagttt 49204920

tacgattacc gttcatcgat tctcttgttt gctccagact ctcaggcaat gacctgatag 4980tacgattacc gttcatcgat tctcttgttt gctccagact ctcaggcaat gacctgatag 4980

cctttgtaga gacctctcaa aaatagctac cctctccggc atgaatttat cagctagaac 5040cctttgtaga gacctctcaa aaatagctac cctctccggc atgaatttat cagctagaac 5040

ggttgaatat catattgatg gtgatttgac tgtctccggc ctttctcacc cgtttgaatc 5100ggttgaatat catattgatg gtgatttgac tgtctccggc ctttctcacc cgtttgaatc 5100

tttacctaca cattactcag gcattgcatt taaaatatat gagggttcta aaaattttta 5160tttacctaca cattactcag gcattgcatt taaaatatat gagggttcta aaaattttta 5160

tccttgcgtt gaaataaagg cttctcccgc aaaagtatta cagggtcata atgtttttgg 5220tccttgcgtt gaaataaagg cttctcccgc aaaagtatta cagggtcata atgtttttgg 5220

tacaaccgat ttagctttat gctctgaggc tttattgctt aattttgcta attctttgcc 5280tacaaccgat ttagctttat gctctgaggc tttattgctt aattttgcta attctttgcc 5280

ttgcctgtat gatttattgg atgttggaat cgcctgatgc ggtattttct ccttacgcat 5340ttgcctgtat gatttattgg atgttggaat cgcctgatgc ggtattttct ccttacgcat 5340

ctgtgcggta tttcacaccg catatggtgc actctcagta caatctgctc tgatgccgca 5400ctgtgcggta tttcacaccg catatggtgc actctcagta caatctgctc tgatgccgca 5400

tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 5460tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 5460

ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 5520ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 5520

ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta 5580ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta 5580

taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt tcggggaaat 5640taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt tcggggaaat 5640

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 5700gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 5700

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 5760agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 5760

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 5820catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 5820

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 5880ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 5880

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 5940atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 5940

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 6000ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 6000

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 60606060

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 6120ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 6120

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 6180ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 6180

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 6240gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 6240

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 63006300

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 6360gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 6360

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 6420ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 6420

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 6480gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 6480

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 6540gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 6540

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 6600caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 6600

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 66606660

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 6720ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 6720

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 6780taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 6780

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 6840tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 6840

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 6900gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 6900

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 6960agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 6960

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 7020aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 7020

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 7080gccagtggcg ataagtcgtg tcttaccgggg ttggactcaa gacgatagtt accggataag 7080

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 7140gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 7140

tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 7200tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 7200

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 7260agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 7260

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 7320cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 7320

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 7380gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 7380

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 7440gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 7440

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 7500ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 7500

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata 7560cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata 7560

cgcaaaccgc ctctccccgc gcgttggccg attcattaat g 7601cgcaaaccgc ctctccccgc gcgttggccg attcattaat g 7601

<210>45<210>45

<211>1325<211>1325

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>45<400>45

agtccagggc tctgtcctgc acctggggaa tggtgaccgg catctctgtc ctctagctct 60agtccagggc tctgtcctgc acctggggaa tggtgaccgg catctctgtc ctctagctct 60

ggaagcaccc cagcccctct agtctgccct cacccctgac cctgaccctc caccctgacc 120ggaagcaccc cagcccctct agtctgccct cacccctgac cctgaccctc caccctgacc 120

ccgtcctaac ccctgacctt tgtgcccttc cagagagaag ggcagaagtg cccacagccc 180ccgtcctaac ccctgacctt tgtgcccttc cagagagaag ggcagaagtg cccacagccc 180

accccagccc ctcacccagg ccagccggcc agttccaaac cctggtggtt ggtgtcgtgg 240accccagccc ctcacccagg ccagccggcc agttccaaac cctggtggtt ggtgtcgtgg 240

gcggcctgct gggcagcctg gtgctgctag tctgggtcct ggccgtcatc tgctcccggg 300gcggcctgct gggcagcctg gtgctgctag tctgggtcct ggccgtcatc tgctcccggg 300

ccgcacgagg taacgtcatc ccagcccctc ggcctgccct gccctaaccc tgctggcggc 360ccgcacgagg taacgtcatc ccagcccctc ggcctgccct gccctaaccc tgctggcggc 360

cctcactccc gcctcccctt cctccaccct tccctcaccc caccccacct ccccccatct 420cctcactccc gcctcccctt cctccaccct tccctcaccc caccccacct ccccccatct 420

ccccgccagg ctaagtccct gatgaaggcc cctggactaa gaccccccac ctaggagcac 480ccccgccagg ctaagtccct gatgaaggcc cctggactaa gaccccccac ctaggagcac 480

ggctcagggt cggcctggtg accccaagtg tgtttctctg cagggacaat aggagccagg 540ggctcagggt cggcctggtg accccaagtg tgtttctctg cagggacaat aggagccagg 540

cgcaccggcc agcccctggt gagtctcact cttttcctgc atgatccact gtgccttcct 600cgcaccggcc agcccctggt gagtctcact cttttcctgc atgatccact gtgccttcct 600

tcctgggtgg gcagaggtgg aaggacaggc tgggaccaca cggcctgcag gactcacatt 660tcctgggtgg gcagaggtgg aaggacaggc tgggaccaca cggcctgcag gactcacatt 660

ctattatagc caggacccca cctccccagc ccccaggcag caacctcaat ccctaaagcc 720ctattatagc caggacccca cctccccagc ccccaggcag caacctcaat ccctaaagcc 720

atgatctggg gccccagccc acctgcggtc tccgggggtg cccggcccat gtgtgtgcct 780atgatctggg gccccagccc acctgcggtc tccgggggtg cccggcccat gtgtgtgcct 780

gcctgcggtc tccaggggtg cctggcccac gcgtgtgccc gcctgcggtc tctgggggtg 840gcctgcggtc tccaggggtg cctggcccac gcgtgtgccc gcctgcggtc tctgggggtg 840

cccggcccac atatgtgcct gcctgcggtc tccaggtgtg cccggcccat gcgtgtgccc 900cccggcccac atatgtgcct gcctgcggtc tccaggtgtg cccggcccat gcgtgtgccc 900

acctgcgagg gcgtggggtg ggcttggtca tttcttatct tacattggag acaggagagc 960acctgcgagg gcgtggggtg ggcttggtca tttcttatct tacattggag acaggagagc 960

ttgaaaagtc acattttgga atcctaaatc tgcaagaatg ccagggacat ttcagagggg 1020ttgaaaagtc acattttgga atcctaaatc tgcaagaatg ccagggacat ttcagagggg 1020

gacattgagc cagagaggag gggtggtgtc cccagatcac acagagggca gtggtgggac 1080gacattgagc cagagaggag gggtggtgtc cccagatcac acagagggca gtggtgggac 1080

agctcagggt aagcagctca tagtgggggg cccaggttcg gtgccggtac tgcagccagg 1140agctcagggt aagcagctca tagtgggggg cccaggttcg gtgccggtac tgcagccagg 1140

ctgtggagcc gcgggcctcc ttcctgcggt gggccgtggg gctgactccc tctccctttc 1200ctgtggagcc gcgggcctcc ttcctgcggt gggccgtggg gctgactccc tctccctttc 1200

tcctcaaaga aggaggaccc ctcagccgtg cctgtgttct ctgtggacta tggggagctg 12601260

gatttccagt ggcgagagaa gaccccggag ccccccgtgc cctgtgtccc tgagcagacg 1320gatttccagt ggcgagagaa gaccccggag ccccccgtgc cctgtgtccc tgagcagacg 1320

gagta 1325gagta 1325

<210>46<210>46

<211>1072<211>1072

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>46<400>46

ccaccattgt ctttcctagc ggaatgggca cctcatcccc cgcccgcagg ggctcagctg 60ccaccattgt ctttcctagc ggaatgggca cctcatcccc cgcccgcagg ggctcagctg 60

acggccctcg gagtgcccag ccactgaggc ctgaggatgg acactgctct tggcccctct 120acggccctcg gagtgcccag ccactgaggc ctgaggatgg acactgctct tggcccctct 120

gaccggcttc cttggccacc agtgttctgc agaccctcca ccatgagccc gggtcagcgc 180gaccggcttc cttggccacc agtgttctgc agaccctcca ccatgagccc gggtcagcgc 180

atttcctcag gagaagcagg cagggtgcag gccattgcag gccgtccagg ggctgagctg 240atttcctcag gagaagcagg cagggtgcag gccattgcag gccgtccagg ggctgagctg 240

cctgggggcg accggggctc cagcctgcac ctgcaccagg cacagcccca ccacaggact 300cctgggggcg accggggctc cagcctgcac ctgcaccagg cacagcccca ccacaggact 300

catgtctcaa tgcccacagt gagcccaggc agcaggtgtc accgtcccct acagggaggg 360catgtctcaa tgcccacagt gagcccaggc agcaggtgtc accgtcccct acagggaggg 360

ccagatgcag tcactgcttc aggtcctgcc agcacagagc tgcctgcgtc cagctccctg 420ccagatgcag tcactgcttc aggtcctgcc agcacagagc tgcctgcgtc cagctccctg 420

aatctctgct gctgctgctg ctgctgctgc tgctgcctgc ggcccggggc tgaaggcgcc 480aatctctgct gctgctgctg ctgctgctgc tgctgcctgc ggcccggggc tgaaggcgcc 480

gtggccctgc ctgacgcccc ggagcctcct gcctgaactt gggggctggt tggagatggc 540gtggccctgc ctgacgcccc ggagcctcct gcctgaactt gggggctggt tggagatggc 540

cttggagcag ccaaggtgcc cctggcagtg gcatcccgaa acgccctgga cgcagggccc 600cttggagcag ccaaggtgcc cctggcagtg gcatcccgaa acgccctgga cgcagggccc 600

aagactgggc acaggagtgg gaggtacatg gggctgggga ctccccagga gttatctgct 660aagactgggc acaggagtgg gaggtacatg gggctgggga ctccccagga gttatctgct 660

ccctgcaggc ctagagaagt ttcagggaag gtcagaagag ctcctggctg tggtgggcag 720ccctgcaggc ctagagaagt ttcagggaag gtcagaagag ctcctggctg tggtgggcag 720

ggcaggaaac ccctccacct ttacacatgc ccaggcagca cctcaggccc tttgtggggc 780ggcaggaaac ccctccacct ttacacatgc ccaggcagca cctcaggccc tttgtggggc 780

agggaagctg aggcagtaag cgggcaggca gagctggagg cctttcaggc ccagccagca 840agggaagctg aggcagtaag cgggcaggca gagctggagg cctttcaggc cggccagca 840

ctctggcctc ctgccgccgc attccacccc agcccctcac accactcggg agagggacat 900ctctggcctc ctgccgccgc attccacccc agcccctcac accactcggg agagggacat 900

cctacggtcc caaggtcagg agggcagggc tggggttgac tcaggcccct cccagctgtg 960cctacggtcc caaggtcagg agggcagggc tggggttgac tcaggcccct cccagctgtg 960

gccacctggg tgttgggagg gcagaagtgc aggcacctag ggccccccat gtgcccaccc 1020gccacctggg tgttgggagg gcagaagtgc aggcacctag ggccccccat gtgcccaccc 1020

tgggagctct ccttggaacc cattcctgaa attatttaaa ggggttggcc gg 1072tgggagctct ccttgggaacc cattcctgaa attatttaaa ggggttggcc gg 1072

<210>47<210>47

<211>7601<211>7601

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная конструкция SNP 3'-гомологичного плеча rAAV PD-1<223>Synthesized SNP construct of the 3' homologous arm of rAAV PD-1

Exon5_MND-BFP Exon5_MND-BFP

<400>47<400>47

cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60cagctgcgcg ctcgctcgct cactgaggcc gcccggggcaa agcccggggcg tcgggcgacc 60

tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120

actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtagaattca 180actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtagaattca 180

gtccagggct ctgtcctgca cctggggaat ggtgaccggc atctctgtcc tctagctctg 240gtccagggct ctgtcctgca cctggggaat ggtgaccggc atctctgtcc tctagctctg 240

gaagcacccc agcccctcta gtctgccctc acccctgacc ctgaccctcc accctgaccc 300gaagcacccc agcccctcta gtctgccctc acccctgacc ctgaccctcc accctgaccc 300

cgtcctaacc cctgaccttt gtgcccttcc agagagaagg gcagaagtgc ccacagccca 360cgtcctaacc cctgaccttt gtgcccttcc agagagaagg gcagaagtgc cccagccca 360

ccccagcccc tcacccaggc cagccggcca gttccaaacc ctggtggttg gtgtcgtggg 420ccccagcccc tcacccaggc cagccggcca gttccaaacc ctggtggttg gtgtcgtggg 420

cggcctgctg ggcagcctgg tgctgctagt ctgggtcctg gccgtcatct gctcccgggc 480cggcctgctg ggcagcctgg tgctgctagt ctgggtcctg gccgtcatct gctcccggggc 480

cgcacgaggt aacgtcatcc cagcccctcg gcctgccctg ccctaaccct gctggcggcc 540cgcacgaggt aacgtcatcc cagcccctcg gcctgccctg ccctaaccct gctggcggcc 540

ctcactcccg cctccccttc ctccaccctt ccctcacccc accccacctc cccccatctc 600ctcactcccg ccctccccttc ctccaccctt ccctcacccc accccacctc cccccatctc 600

cccgccaggc taagtccctg atgaaggccc ctggactaag accccccacc taggagcacg 660cccgccaggc taagtccctg atgaaggccc ctggactaag accccccacc taggagcacg 660

gctcagggtc ggcctggtga ccccaagtgt gtttctctgc agggacaata ggagccaggc 720gctcagggtc ggcctggtga ccccaagtgt gtttctctgc agggacaata ggagccaggc 720

gcaccggcca gcccctggtg agtctcactc ttttcctgca tgatccactg tgccttcctt 780gcaccggcca gcccctggtg agtctcactc ttttcctgca tgatccactg tgccttcctt 780

cctgggtggg cagaggtgga aggacaggct gggaccacac ggcctgcagg actcacattc 840cctgggtggg cagaggtgga aggacaggct gggaccacac ggcctgcagg actcacattc 840

tattatagcc aggaccccac ctccccagcc cccaggcagc aacctcaatc cctaaagcca 900tattatagcc aggaccccac ctccccagcc cccaggcagc aacctcaatc cctaaagcca 900

tgatctgggg ccccagccca cctgcggtct ccgggggtgc ccggcccatg tgtgtgcctg 960tgatctgggg ccccagccca cctgcggtct ccggggggtgc ccggcccatg tgtgtgcctg 960

cctgcggtct ccaggggtgc ctggcccacg cgtgtgcccg cctgcggtct ctgggggtgc 10201020

ccggcccaca tatgtgcctg cctgcggtct ccaggtgtgc ccggcccatg cgtgtgccca 1080ccggcccaca tatgtgcctg cctgcggtct ccaggtgtgc ccggcccatg cgtgtgccca 1080

cctgcgaggg cgtggggtgg gcttggtcat ttcttatctt acattggaga caggagagct 1140cctgcgaggg cgtggggtgg gcttggtcat ttcttatctt acattggaga caggaagct 1140

tgaaaagtca cattttggaa tcctaaatct gcaagaatgc cagggacatt tcagaggggg 1200tgaaaagtca cattttggaa tcctaaatct gcaagaatgc cagggacatt tcagagggggg 1200

acattgagcc agagaggagg ggtggtgtcc ccagatcaca cagagggcag tggtgggaca 12601260

gctcagggta agcagctcat agtggggggc ccaggttcgg tgccggtact gcagccaggc 1320gctcagggta agcagctcat agtggggggc ccaggttcgg tgccggtact gcagccaggc 1320

tgtggagccg cgggcctcct tcctgcggtg ggccgtgggg ctgactccct ctccctttct 1380tgtggagccg cgggcctcct tcctgcggtg ggccgtgggg ctgactccct ctccctttct 1380

cctcaaagaa ggaggacccc tcagccgtgc ctgtgttctc tgtggactat ggggagctgg 1440cctcaaagaa ggaggacccc tcagccgtgc ctgtgttctc tgtggactat ggggagctgg 1440

atttccagtg gcgagagaag accccggagc cccccgtgcc ctgtgtccct gagcagacgg 1500atttccagtg gcgagagaag accccggagc cccccgtgcc ctgtgtccct gagcagacgg 1500

agtaatgcat gaacagagaa acaggagaat atgggccaaa caggatatct gtggtaagca 1560agtaatgcat gaacagagaa acaggagaat atgggccaaa caggatatct gtggtaagca 1560

gttcctgccc cggctcaggg ccaagaacag ttggaacagc agaatatggg ccaaacagga 1620gttcctgccc cggctcaggg ccaagaacag ttggaacagc agaatatgggg ccaaacagga 1620

tatctgtggt aagcagttcc tgccccggct cagggccaag aacagatggt ccccagatgc 1680tatctgtggt aagcagttcc tgccccggct cagggccaag aacagatggt ccccagatgc 1680

ggtcccgccc tcagcagttt ctagagaacc atcagatgtt tccagggtgc cccaaggacc 1740ggtcccgccc tcagcagttt ctagagaacc atcagatgtt tccagggtgc cccaaggacc 1740

tgaaatgacc ctgtgcctta tttgaactaa ccaatcagtt cgcttctcgc ttctgttcgc 1800tgaaatgacc ctgtgcctta tttgaactaa ccaatcagtt cgcttctcgc ttctgttcgc 1800

gcgcttctgc tccccgagct ctatataagc agagctcgtt tagtgaaccg tcagatcgcc 1860gcgcttctgc tccccgagct ctatataagc agagctcgtt tagtgaaccg tcagatcgcc 1860

tggagacgcc atccacgctg ttttgacttc catagaagga tctcgaggcc accatggcta 1920tggagacgcc atccacgctg ttttgacttc catagaagga tctcgaggcc accatggcta 1920

gcgagctgat taaggagaac atgcacatga agctgtacat ggagggcacc gtggacaacc 1980gcgagctgat taaggagaac atgcacatga agctgtacat ggagggcacc gtggacaacc 1980

atcacttcaa gtgcacatcc gagggcgaag gcaagcccta cgagggcacc cagaccatga 2040atcacttcaa gtgcacatcc gagggcgaag gcaagcccta cgagggcacc cagaccatga 2040

gaatcaaggt ggtcgagggc ggccctctcc ccttcgcctt cgacatcctg gctactagct 2100gaatcaaggt ggtcgagggc ggccctctcc ccttcgcctt cgacatcctg gctactagct 2100

tcctctacgg cagcaagacc ttcatcaacc acacccaggg catccccgac ttcttcaagc 2160tcctctacgg cagcaagacc ttcatcaacc acacccaggg catccccgac ttcttcaagc 2160

agtccttccc tgagggcttc acatgggaga gagtcaccac atacgaggac gggggcgtgc 2220agtccttccc tgagggcttc acatgggaga gagtcaccac atacgaggac gggggcgtgc 2220

tgaccgctac ccaggacacc agcctccagg acggctgcct catctacaac gtcaagatca 2280tgaccgctac ccaggacacc agcctccagg acggctgcct catctacaac gtcaagatca 2280

gaggggtgaa cttcacatcc aacggccctg tgatgcagaa gaaaacactc ggctgggagg 2340gaggggtgaa cttcacatcc aacggccctg tgatgcagaa gaaaacactc ggctgggagg 2340

ccttcaccga gacgctgtac cccgctgacg gcggcctgga aggcagaaac gacatggccc 2400ccttcaccga gacgctgtac cccgctgacg gcggcctgga aggcagaaac gacatggccc 2400

tgaagctcgt gggcgggagc catctgatcg caaacatcaa gaccacatat agatccaaga 2460tgaagctcgt gggcgggagc catctgatcg caaacatcaa gaccacatat agatccaaga 2460

aacccgctaa gaacctcaag atgcctggcg tctactatgt ggactacaga ctggaaagaa 2520aacccgctaa gaacctcaag atgcctggcg tctactatgt ggactacaga ctggaaagaa 2520

tcaaggaggc caacaacgag acctacgtcg agcagcacga ggtggcagtg gccagatact 2580tcaaggaggc caacaacgag acctacgtcg agcagcacga ggtggcagtg gccagatact 2580

gcgacctccc tagcaaactg gggcacaagc taaattgaaa gctttgcttt atttgtgaaa 2640gcgacctccc tagcaaactg gggcacaagc taaattgaaa gctttgcttt atttgtgaaa 2640

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gtttaacaac 2700tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gtttaacaac 2700

aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagt 27602760

cgacccacca ttgtctttcc tagcggaatg ggcacctcat cccccgcccg caggggctca 2820cgacccacca ttgtctttcc tagcggaatg ggcacctcat cccccgcccg caggggctca 2820

gccgacggcc ctcggagtgc ccagccactg aggcctgagg atggacactg ctcttggccc 2880gccgacggcc ctcggagtgc ccagccactg aggcctgagg atggacactg ctcttggccc 2880

ctctgaccgg cttccttggc caccagtgtt ctgcagaccc tccaccatga gcccgggtca 2940ctctgaccgg cttccttggc caccagtgtt ctgcagaccc tccaccatga gcccgggtca 2940

gcgcatttcc tcaggagaag caggcagggt gcaggccatt gcaggccgtc caggggctga 3000gcgcatttcc tcaggagaag caggcagggt gcaggccatt gcaggccgtc caggggctga 3000

gctgcctggg ggcgaccggg gctccagcct gcacctgcac caggcacagc cccaccacag 3060gctgcctggg ggcgaccggg gctccagcct gcacctgcac caggcacagc cccaccacag 3060

gactcatgtc tcaatgccca cagtgagccc aggcagcagg tgtcaccgtc ccctacaggg 3120gactcatgtc tcaatgccca cagtgagccc aggcagcagg tgtcaccgtc ccctacaggg 3120

agggccagat gcagtcactg cttcaggtcc tgccagcaca gagctgcctg cgtccagctc 3180agggccagat gcagtcactg cttcaggtcc tgccagcaca gagctgcctg cgtccagctc 3180

cctgaatctc tgctgctgct gctgctgctg ctgctgctgc ctgcggcccg gggctgaagg 3240cctgaatctc tgctgctgct gctgctgctg ctgctgctgc ctgcggcccg gggctgaagg 3240

cgccgtggcc ctgcctgacg ccccggagcc tcctgcctga acttgggggc tggttggaga 3300cgccgtggcc ctgcctgacg ccccggagcc tcctgcctga acttgggggc tggttggaga 3300

tggccttgga gcagccaagg tgcccctggc agtggcatcc cgaaacgccc tggacgcagg 3360tggccttgga gcagccaagg tgcccctggc agtggcatcc cgaaacgccc tggacgcagg 3360

gcccaagact gggcacagga gtgggaggta catggggctg gggactcccc aggagttatc 3420gcccaagact gggcacagga gtgggaggta catggggctg gggactcccc aggagttatc 3420

tgctccctgc aggcctagag aagtttcagg gaaggtcaga agagctcctg gctgtggtgg 3480tgctccctgc aggcctagag aagtttcagg gaaggtcaga agagctcctg gctgtggtgg 3480

gcagggcagg aaacccctcc acctttacac atgcccaggc agcacctcag gccctttgtg 3540gcagggcagg aaacccctcc acctttacac atgcccaggc agcacctcag gccctttgtg 3540

gggcagggaa gctgaggcag taagcgggca ggcagagctg gaggcctttc aggcccagcc 3600gggcagggaa gctgaggcag taagcgggca ggcagagctg gaggcctttc aggcccagcc 3600

agcactctgg cctcctgccg ccgcattcca ccccagcccc tcacaccact cgggagaggg 3660agcactctgg ccctcctgccg ccgcattcca ccccagcccc tcacaccact cgggagaggg 3660

acatcctacg gtcccaaggt caggagggca gggctggggt tgactcaggc ccctcccagc 3720acatcctacg gtcccaaggt caggagggca gggctggggt tgactcaggc ccctcccagc 3720

tgtggccacc tgggtgttgg gagggcagaa gtgcaggcac ctagggcccc ccatgtgccc 3780tgtggccacc tgggtgttgg gagggcagaa gtgcaggcac ctagggcccc ccatgtgccc 3780

accctgggag ctctccttgg aacccattcc tgaaattatt taaaggggtt ggccggacta 3840accctgggag ctctccttgg aacccattcc tgaaattatt taaaaggggtt ggccggacta 3840

gttacgtaga taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg 3900gttacgtaga taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg 3900

agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg 3960agttggccac tccctctctg cgcgctcgct cgctcactga ggccggggcga ccaaaggtcg 3960

cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc cagctggcgt 4020cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc cagctggcgt 4020

aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa 4080aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa 4080

tggcgattcc gttgcaatgg ctggcggtaa tattgttctg gatattacca gcaaggccga 4140tggcgattcc gttgcaatgg ctggcggtaa tattgttctg gatattacca gcaaggccga 4140

tagtttgagt tcttctactc aggcaagtga tgttattact aatcaaagaa gtattgcgac 4200tagtttgagt tcttctactc aggcaagtga tgttattact aatcaaagaa gtattgcgac 4200

aacggttaat ttgcgtgatg gacagactct tttactcggt ggcctcactg attataaaaa 4260aacggttaat ttgcgtgatg gacagactct tttactcggt ggcctcactg attataaaaa 4260

cacttctcag gattctggcg taccgttcct gtctaaaatc cctttaatcg gcctcctgtt 4320cacttctcag gattctggcg taccgttcct gtctaaaatc cctttaatcg gcctcctgtt 4320

tagctcccgc tctgattcta acgaggaaag cacgttatac gtgctcgtca aagcaaccat 4380tagctcccgc tctgattcta acgaggaaag cacgttatac gtgctcgtca aagcaaccat 4380

agtacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga 4440agtacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga 4440

ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg 45004500

ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat 4560ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat 4560

ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg 4620ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg 4620

ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata 4680ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata 4680

gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt 4740gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt 4740

tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat 4800tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat 4800

ttaacgcgaa ttttaacaaa atattaacgt ttacaattta aatatttgct tatacaatct 4860ttaacgcgaa ttttaacaaa atattaacgt ttacaattta aatatttgct tatacaatct 4860

tcctgttttt ggggcttttc tgattatcaa ccggggtaca tatgattgac atgctagttt 49204920

tacgattacc gttcatcgat tctcttgttt gctccagact ctcaggcaat gacctgatag 4980tacgattacc gttcatcgat tctcttgttt gctccagact ctcaggcaat gacctgatag 4980

cctttgtaga gacctctcaa aaatagctac cctctccggc atgaatttat cagctagaac 5040cctttgtaga gacctctcaa aaatagctac cctctccggc atgaatttat cagctagaac 5040

ggttgaatat catattgatg gtgatttgac tgtctccggc ctttctcacc cgtttgaatc 5100ggttgaatat catattgatg gtgatttgac tgtctccggc ctttctcacc cgtttgaatc 5100

tttacctaca cattactcag gcattgcatt taaaatatat gagggttcta aaaattttta 5160tttacctaca cattactcag gcattgcatt taaaatatat gagggttcta aaaattttta 5160

tccttgcgtt gaaataaagg cttctcccgc aaaagtatta cagggtcata atgtttttgg 5220tccttgcgtt gaaataaagg cttctcccgc aaaagtatta cagggtcata atgtttttgg 5220

tacaaccgat ttagctttat gctctgaggc tttattgctt aattttgcta attctttgcc 5280tacaaccgat ttagctttat gctctgaggc tttattgctt aattttgcta attctttgcc 5280

ttgcctgtat gatttattgg atgttggaat cgcctgatgc ggtattttct ccttacgcat 5340ttgcctgtat gatttattgg atgttggaat cgcctgatgc ggtattttct ccttacgcat 5340

ctgtgcggta tttcacaccg catatggtgc actctcagta caatctgctc tgatgccgca 5400ctgtgcggta tttcacaccg catatggtgc actctcagta caatctgctc tgatgccgca 5400

tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 5460tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 5460

ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 5520ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 5520

ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta 5580ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta 5580

taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt tcggggaaat 5640taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt tcggggaaat 5640

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 5700gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 5700

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 5760agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 5760

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 5820catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 5820

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 5880ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 5880

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 5940atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 5940

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 6000ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 6000

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 60606060

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 6120ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 6120

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 6180ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 6180

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 6240gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 6240

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 63006300

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 6360gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 6360

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 6420ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 6420

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 6480gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 6480

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 6540gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 6540

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 6600caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 6600

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 66606660

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 6720ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 6720

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 6780taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 6780

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 6840tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 6840

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 6900gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 6900

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 6960agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 6960

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 7020aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 7020

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 7080gccagtggcg ataagtcgtg tcttaccgggg ttggactcaa gacgatagtt accggataag 7080

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 7140gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 7140

tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 7200tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 7200

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 7260agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 7260

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 7320cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 7320

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 7380gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 7380

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 7440gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 7440

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 7500ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 7500

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata 7560cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata 7560

cgcaaaccgc ctctccccgc gcgttggccg attcattaat g 7601cgcaaaccgc ctctccccgc gcgttggccg attcattaat g 7601

<210>48<210>48

<211>7601<211>7601

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная конструкция SNP rAAV PD-1 Exon5_MND-BFP 5'-<223>Synthesized SNP construct rAAV PD-1 Exon5_MND-BFP 5'-

гомологичное плечоhomologous shoulder

<400>48<400>48

cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60cagctgcgcg ctcgctcgct cactgaggcc gcccggggcaa agcccggggcg tcgggcgacc 60

tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120

actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtagaattca 180actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtagaattca 180

gtccagggct ctgtcctgca cctggggaat ggtgaccggc atctctgtcc tctagctctg 240gtccagggct ctgtcctgca cctggggaat ggtgaccggc atctctgtcc tctagctctg 240

gaagcacccc agcccctcta gtctgccctc acccctgacc ctgaccctcc accctgaccc 300gaagcacccc agcccctcta gtctgccctc acccctgacc ctgaccctcc accctgaccc 300

cgtcctaacc cctgaccttt gtgcccttcc agagagaagg gcagaagtgc ccacagccca 360cgtcctaacc cctgaccttt gtgcccttcc agagagaagg gcagaagtgc cccagccca 360

ccccagcccc tcacccaggc cagccggcca gttccaaacc ctggtggttg gtgtcgtggg 420ccccagcccc tcacccaggc cagccggcca gttccaaacc ctggtggttg gtgtcgtggg 420

cggcctgctg ggcagcctgg tgctgctagt ctgggtcctg gccgtcatct gctcccgggc 480cggcctgctg ggcagcctgg tgctgctagt ctgggtcctg gccgtcatct gctcccggggc 480

cgcacgaggt aacgtcatcc cagcccctcg gcctgccctg ccctaaccct gctggcggcc 540cgcacgaggt aacgtcatcc cagcccctcg gcctgccctg ccctaaccct gctggcggcc 540

ctcactcccg cctccccttc ctccaccctt ccctcacccc accccacctc cccccatctc 600ctcactcccg ccctccccttc ctccaccctt ccctcacccc accccacctc cccccatctc 600

cccgccaggc taagtccctg atgaaggccc ctggactaag accccccacc taggagcacg 660cccgccaggc taagtccctg atgaaggccc ctggactaag accccccacc taggagcacg 660

gctcagggtc ggcctggtga ccccaagtgt gtttctctgc agggacaata ggagccaggc 720gctcagggtc ggcctggtga ccccaagtgt gtttctctgc agggacaata ggagccaggc 720

gcaccggcca gcccctggtg agtctcactc ttttcctgca tgatccactg tgccttcctt 780gcaccggcca gcccctggtg agtctcactc ttttcctgca tgatccactg tgccttcctt 780

cctgggtggg cagaggtgga aggacaggct gggaccacac ggcctgcagg actcacattc 840cctgggtggg cagaggtgga aggacaggct gggaccacac ggcctgcagg actcacattc 840

tattatagcc aggaccccac ctccccagcc cccaggcagc aacctcaatc cctaaagcca 900tattatagcc aggaccccac ctccccagcc cccaggcagc aacctcaatc cctaaagcca 900

tgatctgggg ccccagccca cctgcggtct ccgggggtgc ccggcccatg tgtgtgcctg 960tgatctgggg ccccagccca cctgcggtct ccggggggtgc ccggcccatg tgtgtgcctg 960

cctgcggtct ccaggggtgc ctggcccacg cgtgtgcccg cctgcggtct ctgggggtgc 10201020

ccggcccaca tatgtgcctg cctgcggtct ccaggtgtgc ccggcccatg cgtgtgccca 1080ccggcccaca tatgtgcctg cctgcggtct ccaggtgtgc ccggcccatg cgtgtgccca 1080

cctgcgaggg cgtggggtgg gcttggtcat ttcttatctt acattggaga caggagagct 1140cctgcgaggg cgtggggtgg gcttggtcat ttcttatctt acattggaga caggaagct 1140

tgaaaagtca cattttggaa tcctaaatct gcaagaatgc cagggacatt tcagaggggg 1200tgaaaagtca cattttggaa tcctaaatct gcaagaatgc cagggacatt tcagagggggg 1200

acattgagcc agagaggagg ggtggtgtcc ccagatcaca cagagggcag tggtgggaca 12601260

gctcagggta agcagctcgt agtggggggc ccaggttcgg tgccggtact gcagccaggc 1320gctcagggta agcagctcgt agtggggggc ccaggttcgg tgccggtact gcagccaggc 1320

tgtggagccg cgggcctcct tcctgcggtg ggccgtgggg ctgactccct ctccctttct 1380tgtggagccg cgggcctcct tcctgcggtg ggccgtgggg ctgactccct ctccctttct 1380

cctcaaagaa ggaggacccc tcagccgtgc ctgtgttctc tgtggactat ggggagctgg 1440cctcaaagaa ggaggacccc tcagccgtgc ctgtgttctc tgtggactat ggggagctgg 1440

atttccagtg gcgagagaag accccggagc cccccgtgcc ctgtgtccct gagcagacgg 1500atttccagtg gcgagagaag accccggagc cccccgtgcc ctgtgtccct gagcagacgg 1500

agtaatgcat gaacagagaa acaggagaat atgggccaaa caggatatct gtggtaagca 1560agtaatgcat gaacagagaa acaggagaat atgggccaaa caggatatct gtggtaagca 1560

gttcctgccc cggctcaggg ccaagaacag ttggaacagc agaatatggg ccaaacagga 1620gttcctgccc cggctcaggg ccaagaacag ttggaacagc agaatatgggg ccaaacagga 1620

tatctgtggt aagcagttcc tgccccggct cagggccaag aacagatggt ccccagatgc 1680tatctgtggt aagcagttcc tgccccggct cagggccaag aacagatggt ccccagatgc 1680

ggtcccgccc tcagcagttt ctagagaacc atcagatgtt tccagggtgc cccaaggacc 1740ggtcccgccc tcagcagttt ctagagaacc atcagatgtt tccagggtgc cccaaggacc 1740

tgaaatgacc ctgtgcctta tttgaactaa ccaatcagtt cgcttctcgc ttctgttcgc 1800tgaaatgacc ctgtgcctta tttgaactaa ccaatcagtt cgcttctcgc ttctgttcgc 1800

gcgcttctgc tccccgagct ctatataagc agagctcgtt tagtgaaccg tcagatcgcc 1860gcgcttctgc tccccgagct ctatataagc agagctcgtt tagtgaaccg tcagatcgcc 1860

tggagacgcc atccacgctg ttttgacttc catagaagga tctcgaggcc accatggcta 1920tggagacgcc atccacgctg ttttgacttc catagaagga tctcgaggcc accatggcta 1920

gcgagctgat taaggagaac atgcacatga agctgtacat ggagggcacc gtggacaacc 1980gcgagctgat taaggagaac atgcacatga agctgtacat ggagggcacc gtggacaacc 1980

atcacttcaa gtgcacatcc gagggcgaag gcaagcccta cgagggcacc cagaccatga 2040atcacttcaa gtgcacatcc gagggcgaag gcaagcccta cgagggcacc cagaccatga 2040

gaatcaaggt ggtcgagggc ggccctctcc ccttcgcctt cgacatcctg gctactagct 2100gaatcaaggt ggtcgagggc ggccctctcc ccttcgcctt cgacatcctg gctactagct 2100

tcctctacgg cagcaagacc ttcatcaacc acacccaggg catccccgac ttcttcaagc 2160tcctctacgg cagcaagacc ttcatcaacc acacccaggg catccccgac ttcttcaagc 2160

agtccttccc tgagggcttc acatgggaga gagtcaccac atacgaggac gggggcgtgc 2220agtccttccc tgagggcttc acatgggaga gagtcaccac atacgaggac gggggcgtgc 2220

tgaccgctac ccaggacacc agcctccagg acggctgcct catctacaac gtcaagatca 2280tgaccgctac ccaggacacc agcctccagg acggctgcct catctacaac gtcaagatca 2280

gaggggtgaa cttcacatcc aacggccctg tgatgcagaa gaaaacactc ggctgggagg 2340gaggggtgaa cttcacatcc aacggccctg tgatgcagaa gaaaacactc ggctgggagg 2340

ccttcaccga gacgctgtac cccgctgacg gcggcctgga aggcagaaac gacatggccc 2400ccttcaccga gacgctgtac cccgctgacg gcggcctgga aggcagaaac gacatggccc 2400

tgaagctcgt gggcgggagc catctgatcg caaacatcaa gaccacatat agatccaaga 2460tgaagctcgt gggcgggagc catctgatcg caaacatcaa gaccacatat agatccaaga 2460

aacccgctaa gaacctcaag atgcctggcg tctactatgt ggactacaga ctggaaagaa 2520aacccgctaa gaacctcaag atgcctggcg tctactatgt ggactacaga ctggaaagaa 2520

tcaaggaggc caacaacgag acctacgtcg agcagcacga ggtggcagtg gccagatact 2580tcaaggaggc caacaacgag acctacgtcg agcagcacga ggtggcagtg gccagatact 2580

gcgacctccc tagcaaactg gggcacaagc taaattgaaa gctttgcttt atttgtgaaa 2640gcgacctccc tagcaaactg gggcacaagc taaattgaaa gctttgcttt atttgtgaaa 2640

tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gtttaacaac 2700tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa gtttaacaac 2700

aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagt 27602760

cgacccacca ttgtctttcc tagcggaatg ggcacctcat cccccgcccg caggggctca 2820cgacccacca ttgtctttcc tagcggaatg ggcacctcat cccccgcccg caggggctca 2820

gctgacggcc ctcggagtgc ccagccactg aggcctgagg atggacactg ctcttggccc 2880gctgacggcc ctcggagtgc ccagccactg aggcctgagg atggacactg ctcttggccc 2880

ctctgaccgg cttccttggc caccagtgtt ctgcagaccc tccaccatga gcccgggtca 2940ctctgaccgg cttccttggc caccagtgtt ctgcagaccc tccaccatga gcccgggtca 2940

gcgcatttcc tcaggagaag caggcagggt gcaggccatt gcaggccgtc caggggctga 3000gcgcatttcc tcaggagaag caggcagggt gcaggccatt gcaggccgtc caggggctga 3000

gctgcctggg ggcgaccggg gctccagcct gcacctgcac caggcacagc cccaccacag 3060gctgcctggg ggcgaccggg gctccagcct gcacctgcac caggcacagc cccaccacag 3060

gactcatgtc tcaatgccca cagtgagccc aggcagcagg tgtcaccgtc ccctacaggg 3120gactcatgtc tcaatgccca cagtgagccc aggcagcagg tgtcaccgtc ccctacaggg 3120

agggccagat gcagtcactg cttcaggtcc tgccagcaca gagctgcctg cgtccagctc 3180agggccagat gcagtcactg cttcaggtcc tgccagcaca gagctgcctg cgtccagctc 3180

cctgaatctc tgctgctgct gctgctgctg ctgctgctgc ctgcggcccg gggctgaagg 3240cctgaatctc tgctgctgct gctgctgctg ctgctgctgc ctgcggcccg gggctgaagg 3240

cgccgtggcc ctgcctgacg ccccggagcc tcctgcctga acttgggggc tggttggaga 3300cgccgtggcc ctgcctgacg ccccggagcc tcctgcctga acttgggggc tggttggaga 3300

tggccttgga gcagccaagg tgcccctggc agtggcatcc cgaaacgccc tggacgcagg 3360tggccttgga gcagccaagg tgcccctggc agtggcatcc cgaaacgccc tggacgcagg 3360

gcccaagact gggcacagga gtgggaggta catggggctg gggactcccc aggagttatc 3420gcccaagact gggcacagga gtgggaggta catggggctg gggactcccc aggagttatc 3420

tgctccctgc aggcctagag aagtttcagg gaaggtcaga agagctcctg gctgtggtgg 3480tgctccctgc aggcctagag aagtttcagg gaaggtcaga agagctcctg gctgtggtgg 3480

gcagggcagg aaacccctcc acctttacac atgcccaggc agcacctcag gccctttgtg 3540gcagggcagg aaacccctcc acctttacac atgcccaggc agcacctcag gccctttgtg 3540

gggcagggaa gctgaggcag taagcgggca ggcagagctg gaggcctttc aggcccagcc 3600gggcagggaa gctgaggcag taagcgggca ggcagagctg gaggcctttc aggcccagcc 3600

agcactctgg cctcctgccg ccgcattcca ccccagcccc tcacaccact cgggagaggg 3660agcactctgg ccctcctgccg ccgcattcca ccccagcccc tcacaccact cgggagaggg 3660

acatcctacg gtcccaaggt caggagggca gggctggggt tgactcaggc ccctcccagc 3720acatcctacg gtcccaaggt caggagggca gggctggggt tgactcaggc ccctcccagc 3720

tgtggccacc tgggtgttgg gagggcagaa gtgcaggcac ctagggcccc ccatgtgccc 3780tgtggccacc tgggtgttgg gagggcagaa gtgcaggcac ctagggcccc ccatgtgccc 3780

accctgggag ctctccttgg aacccattcc tgaaattatt taaaggggtt ggccggacta 3840accctgggag ctctccttgg aacccattcc tgaaattatt taaaaggggtt ggccggacta 3840

gttacgtaga taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg 3900gttacgtaga taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg 3900

agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg 3960agttggccac tccctctctg cgcgctcgct cgctcactga ggccggggcga ccaaaggtcg 3960

cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc cagctggcgt 4020cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc cagctggcgt 4020

aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa 4080aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa 4080

tggcgattcc gttgcaatgg ctggcggtaa tattgttctg gatattacca gcaaggccga 4140tggcgattcc gttgcaatgg ctggcggtaa tattgttctg gatattacca gcaaggccga 4140

tagtttgagt tcttctactc aggcaagtga tgttattact aatcaaagaa gtattgcgac 4200tagtttgagt tcttctactc aggcaagtga tgttattact aatcaaagaa gtattgcgac 4200

aacggttaat ttgcgtgatg gacagactct tttactcggt ggcctcactg attataaaaa 4260aacggttaat ttgcgtgatg gacagactct tttactcggt ggcctcactg attataaaaa 4260

cacttctcag gattctggcg taccgttcct gtctaaaatc cctttaatcg gcctcctgtt 4320cacttctcag gattctggcg taccgttcct gtctaaaatc cctttaatcg gcctcctgtt 4320

tagctcccgc tctgattcta acgaggaaag cacgttatac gtgctcgtca aagcaaccat 4380tagctcccgc tctgattcta acgaggaaag cacgttatac gtgctcgtca aagcaaccat 4380

agtacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga 4440agtacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga 4440

ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg 45004500

ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat 4560ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat 4560

ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg 4620ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg 4620

ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata 4680ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata 4680

gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt 4740gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt 4740

tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat 4800tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat 4800

ttaacgcgaa ttttaacaaa atattaacgt ttacaattta aatatttgct tatacaatct 4860ttaacgcgaa ttttaacaaa atattaacgt ttacaattta aatatttgct tatacaatct 4860

tcctgttttt ggggcttttc tgattatcaa ccggggtaca tatgattgac atgctagttt 49204920

tacgattacc gttcatcgat tctcttgttt gctccagact ctcaggcaat gacctgatag 4980tacgattacc gttcatcgat tctcttgttt gctccagact ctcaggcaat gacctgatag 4980

cctttgtaga gacctctcaa aaatagctac cctctccggc atgaatttat cagctagaac 5040cctttgtaga gacctctcaa aaatagctac cctctccggc atgaatttat cagctagaac 5040

ggttgaatat catattgatg gtgatttgac tgtctccggc ctttctcacc cgtttgaatc 5100ggttgaatat catattgatg gtgatttgac tgtctccggc ctttctcacc cgtttgaatc 5100

tttacctaca cattactcag gcattgcatt taaaatatat gagggttcta aaaattttta 5160tttacctaca cattactcag gcattgcatt taaaatatat gagggttcta aaaattttta 5160

tccttgcgtt gaaataaagg cttctcccgc aaaagtatta cagggtcata atgtttttgg 5220tccttgcgtt gaaataaagg cttctcccgc aaaagtatta cagggtcata atgtttttgg 5220

tacaaccgat ttagctttat gctctgaggc tttattgctt aattttgcta attctttgcc 5280tacaaccgat ttagctttat gctctgaggc tttattgctt aattttgcta attctttgcc 5280

ttgcctgtat gatttattgg atgttggaat cgcctgatgc ggtattttct ccttacgcat 5340ttgcctgtat gatttattgg atgttggaat cgcctgatgc ggtattttct ccttacgcat 5340

ctgtgcggta tttcacaccg catatggtgc actctcagta caatctgctc tgatgccgca 5400ctgtgcggta tttcacaccg catatggtgc actctcagta caatctgctc tgatgccgca 5400

tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 5460tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 5460

ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 5520ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 5520

ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta 5580ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta 5580

taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt tcggggaaat 5640taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt tcggggaaat 5640

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 5700gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 5700

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 5760agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 5760

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 5820catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 5820

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 5880ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 5880

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 5940atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 5940

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 6000ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 6000

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 60606060

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 6120ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 6120

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 6180ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 6180

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 6240gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 6240

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 63006300

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 6360gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 6360

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 6420ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 6420

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 6480gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 6480

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 6540gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 6540

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 6600caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 6600

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 66606660

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 6720ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 6720

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 6780taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 6780

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 6840tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 6840

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 6900gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 6900

agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 6960agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 6960

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 7020aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 7020

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 7080gccagtggcg ataagtcgtg tcttaccgggg ttggactcaa gacgatagtt accggataag 7080

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 7140gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 7140

tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 7200tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 7200

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 7260agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 7260

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 7320cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 7320

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 7380gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 7380

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 7440gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 7440

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 7500ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 7500

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata 7560cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata 7560

cgcaaaccgc ctctccccgc gcgttggccg attcattaat g 7601cgcaaaccgc ctctccccgc gcgttggccg attcattaat g 7601

<210>49<210>49

<211>1325<211>1325

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>49<400>49

agtccagggc tctgtcctgc acctggggaa tggtgaccgg catctctgtc ctctagctct 60agtccagggc tctgtcctgc acctggggaa tggtgaccgg catctctgtc ctctagctct 60

ggaagcaccc cagcccctct agtctgccct cacccctgac cctgaccctc caccctgacc 120ggaagcaccc cagcccctct agtctgccct cacccctgac cctgaccctc caccctgacc 120

ccgtcctaac ccctgacctt tgtgcccttc cagagagaag ggcagaagtg cccacagccc 180ccgtcctaac ccctgacctt tgtgcccttc cagagagaag ggcagaagtg cccacagccc 180

accccagccc ctcacccagg ccagccggcc agttccaaac cctggtggtt ggtgtcgtgg 240accccagccc ctcacccagg ccagccggcc agttccaaac cctggtggtt ggtgtcgtgg 240

gcggcctgct gggcagcctg gtgctgctag tctgggtcct ggccgtcatc tgctcccggg 300gcggcctgct gggcagcctg gtgctgctag tctgggtcct ggccgtcatc tgctcccggg 300

ccgcacgagg taacgtcatc ccagcccctc ggcctgccct gccctaaccc tgctggcggc 360ccgcacgagg taacgtcatc ccagcccctc ggcctgccct gccctaaccc tgctggcggc 360

cctcactccc gcctcccctt cctccaccct tccctcaccc caccccacct ccccccatct 420cctcactccc gcctcccctt cctccaccct tccctcaccc caccccacct ccccccatct 420

ccccgccagg ctaagtccct gatgaaggcc cctggactaa gaccccccac ctaggagcac 480ccccgccagg ctaagtccct gatgaaggcc cctggactaa gaccccccac ctaggagcac 480

ggctcagggt cggcctggtg accccaagtg tgtttctctg cagggacaat aggagccagg 540ggctcagggt cggcctggtg accccaagtg tgtttctctg cagggacaat aggagccagg 540

cgcaccggcc agcccctggt gagtctcact cttttcctgc atgatccact gtgccttcct 600cgcaccggcc agcccctggt gagtctcact cttttcctgc atgatccact gtgccttcct 600

tcctgggtgg gcagaggtgg aaggacaggc tgggaccaca cggcctgcag gactcacatt 660tcctgggtgg gcagaggtgg aaggacaggc tgggaccaca cggcctgcag gactcacatt 660

ctattatagc caggacccca cctccccagc ccccaggcag caacctcaat ccctaaagcc 720ctattatagc caggacccca cctccccagc ccccaggcag caacctcaat ccctaaagcc 720

atgatctggg gccccagccc acctgcggtc tccgggggtg cccggcccat gtgtgtgcct 780atgatctggg gccccagccc acctgcggtc tccgggggtg cccggcccat gtgtgtgcct 780

gcctgcggtc tccaggggtg cctggcccac gcgtgtgccc gcctgcggtc tctgggggtg 840gcctgcggtc tccaggggtg cctggcccac gcgtgtgccc gcctgcggtc tctgggggtg 840

cccggcccac atatgtgcct gcctgcggtc tccaggtgtg cccggcccat gcgtgtgccc 900cccggcccac atatgtgcct gcctgcggtc tccaggtgtg cccggcccat gcgtgtgccc 900

acctgcgagg gcgtggggtg ggcttggtca tttcttatct tacattggag acaggagagc 960acctgcgagg gcgtggggtg ggcttggtca tttcttatct tacattggag acaggagagc 960

ttgaaaagtc acattttgga atcctaaatc tgcaagaatg ccagggacat ttcagagggg 1020ttgaaaagtc acattttgga atcctaaatc tgcaagaatg ccagggacat ttcagagggg 1020

gacattgagc cagagaggag gggtggtgtc cccagatcac acagagggca gtggtgggac 1080gacattgagc cagagaggag gggtggtgtc cccagatcac acagagggca gtggtgggac 1080

agctcagggt aagcagctcg tagtgggggg cccaggttcg gtgccggtac tgcagccagg 1140agctcagggt aagcagctcg tagtgggggg cccaggttcg gtgccggtac tgcagccagg 1140

ctgtggagcc gcgggcctcc ttcctgcggt gggccgtggg gctgactccc tctccctttc 1200ctgtggagcc gcgggcctcc ttcctgcggt gggccgtggg gctgactccc tctccctttc 1200

tcctcaaaga aggaggaccc ctcagccgtg cctgtgttct ctgtggacta tggggagctg 12601260

gatttccagt ggcgagagaa gaccccggag ccccccgtgc cctgtgtccc tgagcagacg 1320gatttccagt ggcgagagaa gaccccggag ccccccgtgc cctgtgtccc tgagcagacg 1320

gagta 1325gagta 1325

<210>50<210>50

<211>1072<211>1072

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>50<400>50

ccaccattgt ctttcctagc ggaatgggca cctcatcccc cgcccgcagg ggctcagccg 60ccaccattgt ctttcctagc ggaatgggca cctcatcccc cgcccgcagg ggctcagccg 60

acggccctcg gagtgcccag ccactgaggc ctgaggatgg acactgctct tggcccctct 120acggccctcg gagtgcccag ccactgaggc ctgaggatgg acactgctct tggcccctct 120

gaccggcttc cttggccacc agtgttctgc agaccctcca ccatgagccc gggtcagcgc 180gaccggcttc cttggccacc agtgttctgc agaccctcca ccatgagccc gggtcagcgc 180

atttcctcag gagaagcagg cagggtgcag gccattgcag gccgtccagg ggctgagctg 240atttcctcag gagaagcagg cagggtgcag gccattgcag gccgtccagg ggctgagctg 240

cctgggggcg accggggctc cagcctgcac ctgcaccagg cacagcccca ccacaggact 300cctgggggcg accggggctc cagcctgcac ctgcaccagg cacagcccca ccacaggact 300

catgtctcaa tgcccacagt gagcccaggc agcaggtgtc accgtcccct acagggaggg 360catgtctcaa tgcccacagt gagcccaggc agcaggtgtc accgtcccct acagggaggg 360

ccagatgcag tcactgcttc aggtcctgcc agcacagagc tgcctgcgtc cagctccctg 420ccagatgcag tcactgcttc aggtcctgcc agcacagagc tgcctgcgtc cagctccctg 420

aatctctgct gctgctgctg ctgctgctgc tgctgcctgc ggcccggggc tgaaggcgcc 480aatctctgct gctgctgctg ctgctgctgc tgctgcctgc ggcccggggc tgaaggcgcc 480

gtggccctgc ctgacgcccc ggagcctcct gcctgaactt gggggctggt tggagatggc 540gtggccctgc ctgacgcccc ggagcctcct gcctgaactt gggggctggt tggagatggc 540

cttggagcag ccaaggtgcc cctggcagtg gcatcccgaa acgccctgga cgcagggccc 600cttggagcag ccaaggtgcc cctggcagtg gcatcccgaa acgccctgga cgcagggccc 600

aagactgggc acaggagtgg gaggtacatg gggctgggga ctccccagga gttatctgct 660aagactgggc acaggagtgg gaggtacatg gggctgggga ctccccagga gttatctgct 660

ccctgcaggc ctagagaagt ttcagggaag gtcagaagag ctcctggctg tggtgggcag 720ccctgcaggc ctagagaagt ttcagggaag gtcagaagag ctcctggctg tggtgggcag 720

ggcaggaaac ccctccacct ttacacatgc ccaggcagca cctcaggccc tttgtggggc 780ggcaggaaac ccctccacct ttacacatgc ccaggcagca cctcaggccc tttgtggggc 780

agggaagctg aggcagtaag cgggcaggca gagctggagg cctttcaggc ccagccagca 840agggaagctg aggcagtaag cgggcaggca gagctggagg cctttcaggc cggccagca 840

ctctggcctc ctgccgccgc attccacccc agcccctcac accactcggg agagggacat 900ctctggcctc ctgccgccgc attccacccc agcccctcac accactcggg agagggacat 900

cctacggtcc caaggtcagg agggcagggc tggggttgac tcaggcccct cccagctgtg 960cctacggtcc caaggtcagg agggcagggc tggggttgac tcaggcccct cccagctgtg 960

gccacctggg tgttgggagg gcagaagtgc aggcacctag ggccccccat gtgcccaccc 1020gccacctggg tgttgggagg gcagaagtgc aggcacctag ggccccccat gtgcccaccc 1020

tgggagctct ccttggaacc cattcctgaa attatttaaa ggggttggcc gg 1072tgggagctct ccttgggaacc cattcctgaa attatttaaa ggggttggcc gg 1072

<210>51<210>51

<211>7880<211>7880

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная конструкция рецептора-переключателя rAAV PD-1 <223>Synthesized construction of the rAAV PD-1 switch receptor

Exon5_MND-PD-1-CD28Exon5_MND-PD-1-CD28

<400>51<400>51

cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60cagctgcgcg ctcgctcgct cactgaggcc gcccggggcaa agcccggggcg tcgggcgacc 60

tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120

actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtagaattca 180actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtagaattca 180

gtccagggct ctgtcctgca cctggggaat ggtgaccggc atctctgtcc tctagctctg 240gtccagggct ctgtcctgca cctggggaat ggtgaccggc atctctgtcc tctagctctg 240

gaagcacccc agcccctcta gtctgccctc acccctgacc ctgaccctcc accctgaccc 300gaagcacccc agcccctcta gtctgccctc acccctgacc ctgaccctcc accctgaccc 300

cgtcctaacc cctgaccttt gtgcccttcc agagagaagg gcagaagtgc ccacagccca 360cgtcctaacc cctgaccttt gtgcccttcc agagagaagg gcagaagtgc cccagccca 360

ccccagcccc tcacccaggc cagccggcca gttccaaacc ctggtggttg gtgtcgtggg 420ccccagcccc tcacccaggc cagccggcca gttccaaacc ctggtggttg gtgtcgtggg 420

cggcctgctg ggcagcctgg tgctgctagt ctgggtcctg gccgtcatct gctcccgggc 480cggcctgctg ggcagcctgg tgctgctagt ctgggtcctg gccgtcatct gctcccggggc 480

cgcacgaggt aacgtcatcc cagcccctcg gcctgccctg ccctaaccct gctggcggcc 540cgcacgaggt aacgtcatcc cagcccctcg gcctgccctg ccctaaccct gctggcggcc 540

ctcactcccg cctccccttc ctccaccctt ccctcacccc accccacctc cccccatctc 600ctcactcccg ccctccccttc ctccaccctt ccctcacccc accccacctc cccccatctc 600

cccgccaggc taagtccctg atgaaggccc ctggactaag accccccacc taggagcacg 660cccgccaggc taagtccctg atgaaggccc ctggactaag accccccacc taggagcacg 660

gctcagggtc ggcctggtga ccccaagtgt gtttctctgc agggacaata ggagccaggc 720gctcagggtc ggcctggtga ccccaagtgt gtttctctgc agggacaata ggagccaggc 720

gcaccggcca gcccctggtg agtctcactc ttttcctgca tgatccactg tgccttcctt 780gcaccggcca gcccctggtg agtctcactc ttttcctgca tgatccactg tgccttcctt 780

cctgggtggg cagaggtgga aggacaggct gggaccacac ggcctgcagg actcacattc 840cctgggtggg cagaggtgga aggacaggct gggaccacac ggcctgcagg actcacattc 840

tattatagcc aggaccccac ctccccagcc cccaggcagc aacctcaatc cctaaagcca 900tattatagcc aggaccccac ctccccagcc cccaggcagc aacctcaatc cctaaagcca 900

tgatctgggg ccccagccca cctgcggtct ccgggggtgc ccggcccatg tgtgtgcctg 960tgatctgggg ccccagccca cctgcggtct ccggggggtgc ccggcccatg tgtgtgcctg 960

cctgcggtct ccaggggtgc ctggcccacg cgtgtgcccg cctgcggtct ctgggggtgc 10201020

ccggcccaca tatgtgcctg cctgcggtct ccaggtgtgc ccggcccatg cgtgtgccca 1080ccggcccaca tatgtgcctg cctgcggtct ccaggtgtgc ccggcccatg cgtgtgccca 1080

cctgcgaggg cgtggggtgg gcttggtcat ttcttatctt acattggaga caggagagct 1140cctgcgaggg cgtggggtgg gcttggtcat ttcttatctt acattggaga caggaagct 1140

tgaaaagtca cattttggaa tcctaaatct gcaagaatgc cagggacatt tcagaggggg 1200tgaaaagtca cattttggaa tcctaaatct gcaagaatgc cagggacatt tcagagggggg 1200

acattgagcc agagaggagg ggtggtgtcc ccagatcaca cagagggcag tggtgggaca 12601260

gctcagggta agcagctcat agtggggggc ccaggttcgg tgccggtact gcagccaggc 1320gctcagggta agcagctcat agtggggggc ccaggttcgg tgccggtact gcagccaggc 1320

tgtggagccg cgggcctcct tcctgcggtg ggccgtgggg ctgactccct ctccctttct 1380tgtggagccg cgggcctcct tcctgcggtg ggccgtgggg ctgactccct ctccctttct 1380

cctcaaagaa ggaggacccc tcagccgtgc ctgtgttctc tgtggactat ggggagctgg 1440cctcaaagaa ggaggacccc tcagccgtgc ctgtgttctc tgtggactat ggggagctgg 1440

atttccagtg gcgagagaag accccggagc cccccgtgcc ctgtgtccct gagcagacgg 1500atttccagtg gcgagagaag accccggagc cccccgtgcc ctgtgtccct gagcagacgg 1500

agtaatgcat gaacagagaa acaggagaat atgggccaaa caggatatct gtggtaagca 1560agtaatgcat gaacagagaa acaggagaat atgggccaaa caggatatct gtggtaagca 1560

gttcctgccc cggctcaggg ccaagaacag ttggaacagc agaatatggg ccaaacagga 1620gttcctgccc cggctcaggg ccaagaacag ttggaacagc agaatatgggg ccaaacagga 1620

tatctgtggt aagcagttcc tgccccggct cagggccaag aacagatggt ccccagatgc 1680tatctgtggt aagcagttcc tgccccggct cagggccaag aacagatggt ccccagatgc 1680

ggtcccgccc tcagcagttt ctagagaacc atcagatgtt tccagggtgc cccaaggacc 1740ggtcccgccc tcagcagttt ctagagaacc atcagatgtt tccagggtgc cccaaggacc 1740

tgaaatgacc ctgtgcctta tttgaactaa ccaatcagtt cgcttctcgc ttctgttcgc 1800tgaaatgacc ctgtgcctta tttgaactaa ccaatcagtt cgcttctcgc ttctgttcgc 1800

gcgcttctgc tccccgagct ctatataagc agagctcgtt tagtgaaccg tcagatcgcc 1860gcgcttctgc tccccgagct ctatataagc agagctcgtt tagtgaaccg tcagatcgcc 1860

tggagacgcc atccacgctg ttttgacttc catagaagga tctcgaggcc accatgcaga 1920tggagacgcc atccacgctg ttttgacttc catagaagga tctcgaggcc accatgcaga 1920

tcccgcaagc gccctggcca gtcgtctggg cggtgctaca actgggctgg cggccaggat 1980tcccgcaagc gccctggcca gtcgtctggg cggtgctaca actgggctgg cggccaggat 1980

ggttcttaga ctccccagac aggccctgga acccccccac cttctcccca gccctgctcg 2040ggttcttaga ctccccagac aggccctgga acccccccac cttctcccca gccctgctcg 2040

tggtgaccga aggggacaac gccaccttca cctgcagctt ctccaacaca tcggagagct 2100tggtgaccga aggggacaac gccaccttca cctgcagctt ctccaacaca tcggagagct 2100

tcgtgctaaa ctggtaccgc atgagcccca gcaaccagac ggacaagctg gccgccttcc 2160tcgtgctaaa ctggtaccgc atgagcccca gcaaccagac ggacaagctg gccgccttcc 2160

ccgaggaccg cagccagccc ggccaggact gccgcttccg tgtcacacaa ctgcccaacg 2220ccgaggaccg cagccagccc ggccaggact gccgcttccg tgtcacacaa ctgcccaacg 2220

ggcgtgactt ccacatgagc gtggtcaggg cccggcgcaa tgacagcggc acctacctct 2280ggcgtgactt ccacatgagc gtggtcaggg cccggcgcaa tgacagcggc acctacctct 2280

gtggggccat ctccctggcc cccaaggcgc agatcaaaga gagcctgcgg gcagagctca 2340gtggggccat ctccctggcc cccaaggcgc agatcaaaga gagcctgcgg gcagagctca 2340

gggtgacaga gagaagggca gaagtgccca cagcccaccc cagcccctca cccaggccag 2400gggtgacaga gagaagggca gaagtgccca cagcccaccc cagcccctca cccaggccag 2400

ccggccagtt ccaaaccctg gtggttggtg tcgtgggcgg cctgctgggc agcctggtgc 2460ccggccagtt ccaaaccctg gtggttggtg tcgtgggcgg cctgctgggc agcctggtgc 2460

tgctagtctg ggtcctggcc gtcatcagga gtaagaggag caggctcctg cacagtgact 2520tgctagtctg ggtcctggcc gtcatcagga gtaagaggag caggctcctg cacagtgact 2520

acatgaacat gactccccgc cgccccgggc ccacccgcaa gcattaccag ccctatgccc 2580acatgaacat gactccccgc cgccccgggc cccaccgcaa gcattaccag ccctatgccc 2580

caccacgcga cttcgcagcc tatcgctccg gtgagggcag aggaagtctt ctaacatgcg 2640caccacgcga cttcgcagcc tatcgctccg gtgaggggcag aggaagtctt ctaacatgcg 2640

gtgacgtgga ggagaatccg ggccctgtga gcaagggcga ggaggataac tccgccatca 2700gtgacgtgga ggagaatccg ggccctgtga gcaagggcga ggaggataac tccgccatca 2700

tcaaggagtt cctgcgcttc aaggtgcaca tggagggctc cgtgaacggc cacgagttcg 2760tcaaggagtt cctgcgcttc aaggtgcaca tggagggctc cgtgaacggc cacgagttcg 2760

agatcgaggg cgagggcgag ggccgcccct acgagggcac ccagaccgcc aagctgaagg 2820agatcgaggg cgagggcgag ggccgcccct acgagggcac ccagaccgcc aagctgaagg 2820

tgaccaaggg tggccccctg cccttcgcct gggacatcct gtcccctcag ttcatgtacg 2880tgaccaaggg tggccccctg cccttcgcct gggacatcct gtcccctcag ttcatgtacg 2880

gctccaaggc ctacgtgaag caccccgccg acatccccga ctacttgaag ctgtccttcc 2940gctccaaggc ctacgtgaag caccccgccg acatccccga ctacttgaag ctgtccttcc 2940

ccgagggctt caagtgggag cgcgtgatga acttcgagga cggcggcgtg gtgaccgtga 3000ccgaggggctt caagtgggag cgcgtgatga acttcgagga cggcggcgtg gtgaccgtga 3000

cccaggactc ctctctgcag gacggcgagt tcatctacaa ggtgaagctg cgcggcacca 3060cccaggactc ctctctgcag gacggcgagt tcatctacaa ggtgaagctg cgcggcacca 3060

acttcccctc cgacggcccc gtaatgcaga agaagaccat gggctgggag gcctcctccg 3120acttcccctc cgacggcccc gtaatgcaga agaagaccat gggctgggag gcctcctccg 3120

agcggatgta ccccgaggac ggcgccctga agggcgagat caagcagagg ctgaagctga 3180agcggatgta ccccgaggac ggcgccctga agggcgagat caagcagagg ctgaagctga 3180

aggacggcgg ccactacgac gctgaggtca agaccaccta caaggccaag aagcccgtgc 3240aggacggcgg ccactacgac gctgaggtca agaccaccta caaggccaag aagcccgtgc 3240

agctgcccgg cgcctacaac gtcaacatca agttggacat cacctcccac aacgaggact 3300agctgcccgg cgcctacaac gtcaacatca agttggacat cacctcccac aacgaggact 3300

acaccatcgt ggaacagtac gaacgcgccg agggccgcca ctccaccggc ggcatggacg 3360acaccatcgt ggaacagtac gaacgcgccg agggccgcca ctccaccggc ggcatggacg 3360

agctgtacaa gtgatgaaag ctttgcttta tttgtgaaat ttgtgatgct attgctttat 3420agctgtacaa gtgatgaaag ctttgcttta tttgtgaaat ttgtgatgct attgctttat 3420

ttgtaaccat tataagctgc aataaacaag tttaacaaca acaattgcat tcattttatg 3480ttgtaaccat tataagctgc aataaacaag

tttcaggttc agggggaggt gtgggaggtt ttttaaagtc gacgtggccc tgcctgacgc 3540tttcaggttc agggggaggt gtgggaggtt ttttaaagtc gacgtggccc tgcctgacgc 3540

cccggagcct cctgcctgaa cttgggggct ggttggagat ggccttggag cagccaaggt 3600cccggagcct cctgcctgaa cttgggggct ggttggagat ggccttggag cagccaaggt 3600

gcccctggca gtggcatccc gaaacgccct ggacgcaggg cccaagactg ggcacaggag 3660gcccctggca gtggcatccc gaaacgccct ggacgcaggg cccaagactg ggcacaggag 3660

tgggaggtac atggggctgg ggactcccca ggagttatct gctccctgca ggcctagaga 3720tgggaggtac atggggctgg ggactcccca ggagttatct gctccctgca ggcctagaga 3720

agtttcaggg aaggtcagaa gagctcctgg ctgtggtggg cagggcagga aacccctcca 3780agtttcaggg aaggtcagaa gagctcctgg ctgtggtggg cagggcagga aacccctcca 3780

cctttacaca tgcccaggca gcacctcagg ccctttgtgg ggcagggaag ctgaggcagt 3840cctttacaca tgcccaggca gcacctcagg ccctttgtgg ggcagggaag ctgaggcagt 3840

aagcgggcag gcagagctgg aggcctttca ggcccagcca gcactctggc ctcctgccgc 3900aagcgggcag gcagagctgg aggcctttca ggcccagcca gcactctggc ctcctgccgc 3900

cgcattccac cccagcccct cacaccactc gggagaggga catcctacgg tcccaaggtc 3960cgcattccac cccagcccct cacaccactc gggagaggga catcctacgg tcccaaggtc 3960

aggagggcag ggctggggtt gactcaggcc cctcccagct gtggccacct gggtgttggg 4020aggagggcag ggctggggtt gactcaggcc cctcccagct gtggccacct gggtgttggg 4020

agggcagaag tgcaggcacc tagggccccc catgtgccca ccctgggagc tctccttgga 4080agggcagaag tgcaggcacc tagggccccc catgtgccca ccctggggagc tctccttgga 4080

acccattcct gaaattattt aaaggggttg gccggactag ttacgtagat aagtagcatg 4140acccattcct gaaattattt aaaggggttg gccggactag ttacgtagat aagtagcatg 4140

gcgggttaat cattaactac aaggaacccc tagtgatgga gttggccact ccctctctgc 4200gcgggttaat cattaactac aaggaacccc tagtgatgga gttggccact ccctctctgc 4200

gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc 4260gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc 4260

gggcggcctc agtgagcgag cgagcgcgcc agctggcgta atagcgaaga ggcccgcacc 4320gggcggcctc agtgagcgag cgagcgcgcc agctggcgta atagcgaaga ggcccgcacc 4320

gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcgattccg ttgcaatggc 4380gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcgattccg ttgcaatggc 4380

tggcggtaat attgttctgg atattaccag caaggccgat agtttgagtt cttctactca 4440tggcggtaat attgttctgg atattaccag caaggccgat agtttgagtt cttctactca 4440

ggcaagtgat gttattacta atcaaagaag tattgcgaca acggttaatt tgcgtgatgg 4500ggcaagtgat gttatacta atcaaagaag tattgcgaca acggttaatt tgcgtgatgg 4500

acagactctt ttactcggtg gcctcactga ttataaaaac acttctcagg attctggcgt 4560acagactctt ttactcggtg gcctcactga ttataaaaac acttctcagg attctggcgt 4560

accgttcctg tctaaaatcc ctttaatcgg cctcctgttt agctcccgct ctgattctaa 4620accgttcctg tctaaaatcc ctttaatcgg ccctcctgttt agctcccgct ctgattctaa 4620

cgaggaaagc acgttatacg tgctcgtcaa agcaaccata gtacgcgccc tgtagcggcg 46804680

cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc 4740cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc 4740

tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc 4800tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc 4800

gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg 4860gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg 4860

accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg 4920accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg 4920

tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg 4980tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg 4980

gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt 5040gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt 5040

cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa 5100cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa 5100

tattaacgtt tacaatttaa atatttgctt atacaatctt cctgtttttg gggcttttct 5160tattaacgtt tacaatttaa atatttgctt atacaatctt cctgtttttg gggctttttct 5160

gattatcaac cggggtacat atgattgaca tgctagtttt acgattaccg ttcatcgatt 5220gattatcaac cggggtacat atgattgaca tgctagtttt acgattaccg ttcatcgatt 5220

ctcttgtttg ctccagactc tcaggcaatg acctgatagc ctttgtagag acctctcaaa 5280ctcttgtttg ctccagactc tcaggcaatg acctgatagc ctttgtagag acctctcaaa 5280

aatagctacc ctctccggca tgaatttatc agctagaacg gttgaatatc atattgatgg 5340aatagctacc ctctccggca tgaatttatc agctagaacg gttgaatatc atattgatgg 5340

tgatttgact gtctccggcc tttctcaccc gtttgaatct ttacctacac attactcagg 5400tgatttgact gtctccggcc tttctcaccc gtttgaatct ttacctacac attactcagg 5400

cattgcattt aaaatatatg agggttctaa aaatttttat ccttgcgttg aaataaaggc 5460cattgcattt aaaatattg agggttctaa aaatttttat ccttgcgttg aaataaaggc 5460

ttctcccgca aaagtattac agggtcataa tgtttttggt acaaccgatt tagctttatg 5520ttctcccgca aaagtattac agggtcataa tgtttttggt acaaccgatt tagctttatg 5520

ctctgaggct ttattgctta attttgctaa ttctttgcct tgcctgtatg atttattgga 5580ctctgaggct ttattgctta attttgctaa ttctttgcct tgcctgtatg atttattgga 5580

tgttggaatc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc 5640tgttggaatc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc 5640

atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca gccccgacac 5700atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca gccccgacac 5700

ccgccaacac ccgctgacgc gccctgacgg gcttgtctgc tcccggcatc cgcttacaga 5760ccgccaacac ccgctgacgc gccctgacgg gcttgtctgc tcccggcatc cgcttacaga 5760

caagctgtga ccgtctccgg gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa 5820caagctgtga ccgtctccgg gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa 5820

cgcgcgagac gaaagggcct cgtgatacgc ctatttttat aggttaatgt catgataata 5880cgcgcgagac gaaagggcct cgtgatacgc ctatttttat aggttaatgt catgataata 5880

atggtttctt agacgtcagg tggcactttt cggggaaatg tgcgcggaac ccctatttgt 5940atggtttctt agacgtcagg tggcactttt cggggaaatg tgcgcggaac ccctatttgt 5940

ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc ctgataaatg 6000ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc ctgataaatg 6000

cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt cgcccttatt 60606060

cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta 6120cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta 6120

aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga tctcaacagc 6180aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga tctcaacagc 6180

ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc caatgatgag cacttttaaa 6240ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc caatgatgag cacttttaaa 6240

gttctgctat gtggcgcggt attatcccgt attgacgccg ggcaagagca actcggtcgc 6300gttctgctat gtggcgcggt attatcccgt attgacgccg ggcaagagca actcggtcgc 6300

cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga aaagcatctt 6360cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga aaagcatctt 6360

acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag tgataacact 64206420

gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc ttttttgcac 6480gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc ttttttgcac 6480

aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa tgaagccata 6540aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa tgaagccata 6540

ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt gcgcaaacta 6600ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt gcgcaaacta 6600

ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg gatggaggcg 6660ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg gatggaggcg 6660

gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt tattgctgat 6720gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt tattgctgat 6720

aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg gccagatggt 6780aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg gccagatggt 6780

aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat ggatgaacga 6840aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat ggatgaacga 6840

aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact gtcagaccaa 6900aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact gtcagaccaa 6900

gtttactcat atatacttta gattgattta aaacttcatt tttaatttaa aaggatctag 6960gtttactcat atatacttta gattgattta aaacttcatt tttaatttaa aggatctag 6960

gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt ttcgttccac 7020gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt ttcgttccac 7020

tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc 7080tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc 7080

gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat 7140gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat 7140

caagagctac caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat 7200caagagctac caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat 7200

actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct 7260actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct 7260

acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt 7320acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt 7320

cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg 7380cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg 7380

gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta 7440gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta 7440

cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg 7500cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcggga caggtatccg 7500

gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg 75607560

tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc 7620tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc 7620

tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg 7680tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg 7680

gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga ttctgtggat 7740gccttttgct ggccttttgc tcacatgttc ttttcctgcgt tatcccctga ttctgtggat 7740

aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac gaccgagcgc 7800aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac gaccgagcgc 7800

agcgagtcag tgagcgagga agcggaagag cgcccaatac gcaaaccgcc tctccccgcg 7860agcgagtcag tgagcgagga agcggaagag cgcccaatac gcaaaccgcc tctccccgcg 7860

cgttggccga ttcattaatg 7880cgttggccga ttcattaatg 7880

<210>52<210>52

<211>7593<211>7593

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная конструкция rAAV PD-1 Exon5_MND-BFP_дистальное 5'-<223>Synthesized construct rAAV PD-1 Exon5_MND-BFP_distal 5'-

гомологичное плечоhomologous shoulder

<400>52<400>52

cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60cagctgcgcg ctcgctcgct cactgaggcc gcccggggcaa agcccggggcg tcgggcgacc 60

tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120

actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtagaattcg 180actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtagaattcg 180

gccccactgc ccactgccca gggcagcaat gcccatacca cgtggtccca gctccgagct 240gccccactgc ccactgccca gggcagcaat gcccatacca cgtggtccca gctccgagct 240

tgtcctgaaa agggggcaaa gactggaccc tgagcctgcc aaggggccac actcctccca 300tgtcctgaaa agggggcaaa gactggaccc tgagcctgcc aaggggccac actcctccca 300

gggctggggt ctccatgggc agccccccac ccacccagac cagttacact cccctgtgcc 360gggctggggt ctccatgggc agccccccac ccacccagac cagttacact cccctgtgcc 360

agagcagtgc agacaggacc aggccaggat gcccaagggt caggggctgg ggatgggtag 420agagcagtgc agacaggacc aggccaggat gcccaagggt caggggctgg ggatgggtag 420

cccccaaaca gccctttctg ggggactggc ctcaacgggg aagggggtga aggctcttag 480cccccaaaca gccctttctg ggggactggc ctcaacgggg aagggggtga aggctcttag 480

taggaaatca gggagaccca agtcagagcc aggcgctgtg cagaagctgc agcctcacgt 540taggaaatca gggagaccca agtcagagcc aggcgctgtg cagaagctgc agcctcacgt 540

agaaggaaga gcctctgcag tggaggccag tgcccatccc cgggtggcag aggccccagc 600agaaggaaga gcctctgcag tggaggccag tgcccatccc cgggtggcag aggccccagc 600

agagacttct caatgacatt ccagctgggg tggcccttcc agagcccttg ctgcccgagg 660agagacttct caatgacatt ccagctgggg tggcccttcc agagcccttg ctgcccgagg 660

gatgtgagca ggtggccggg gaggctttgt ggggccaccc agccccttcc tcacctctct 720gatgtgagca ggtggccggg gaggctttgt ggggccaccc agccccttcc tcacctctct 720

ccatctctca gactccccag acaggccctg gaaccccccc accttctccc cagccctgct 780ccatctctca gactccccag acaggccctg gaaccccccc accttctccc cagccctgct 780

cgtggtgacc gaaggggaca acgccacctt cacctgcagc ttctccaaca catcggagag 840cgtggtgacc gaaggggaca acgccacctt cacctgcagc ttctccaaca catcggagag 840

cttcgtgcta aactggtacc gcatgagccc cagcaaccag acggacaagc tggccgcctt 900cttcgtgcta aactggtacc gcatgagccc cagcaaccag acggacaagc tggccgcctt 900

ccccgaggac cgcagccagc ccggccagga ctgccgcttc cgtgtcacac aactgcccaa 960ccccgaggac cgcagccagc ccggccagga ctgccgcttc cgtgtcacac aactgcccaa 960

cgggcgtgac ttccacatga gcgtggtcag ggcccggcgc aatgacagcg gcacctacct 1020cgggcgtgac ttccacatga gcgtggtcag ggcccggcgc aatgacagcg gcacctacct 1020

ctgtggggcc atctccctgg cccccaaggc gcagatcaaa gagagcctgc gggcagagct 1080ctgtggggcc atctccctgg cccccaaggc gcagatcaaa gagagcctgc gggcagagct 1080

cagggtgaca ggtgcggcct cggaggcccc ggggcagggg tgagctgagc cggtcctggg 1140cagggtgaca ggtgcggcct cggaggcccc ggggcagggg tgagctgagc cggtcctggg 1140

gtgggtgtcc cctcctgcac aggatcagga gctccagggt cgtagggcag ggacccccca 1200gtgggtgtcc cctcctgcac aggatcagga gctccagggt cgtagggcag ggacccccca 1200

gctccagtcc agggctctgt cctgcacctg gggaatggtg accggcatct ctgtcctcta 1260gctccagtcc agggctctgt cctgcacctg gggaatggtg accggcatct ctgtcctcta 1260

gctctggaag caccccagcc cctctagtct gccctcaccc ctgaccctga ccctccaccc 1320gctctggaag caccccagcc cctctagtct gccctcaccc ctgaccctga ccctccaccc 1320

tgaccccgtc ctaacccctg acctttgtgc ccttccagag agaagggcag aagtgcccac 1380tgaccccgtc ctaacccctg acctttgtgc ccttccagag agaagggcag aagtgcccac 1380

agcccacccc agcccctcac ccaggccagc cggccagttc caaaccctgg tggttggtgt 1440agcccacccc agcccctcac ccaggccagc cggccagttc caaaccctgg tggttggtgt 1440

cgtgggcggc ctgctgggca gcctggtgct gctagtctgg gtcctggccg tcatctatgc 1500cgtgggcggc ctgctgggca gcctggtgct gctagtctgg gtcctggccg tcatctatgc 1500

atgaacagag aaacaggaga atatgggcca aacaggatat ctgtggtaag cagttcctgc 15601560

cccggctcag ggccaagaac agttggaaca gcagaatatg ggccaaacag gatatctgtg 1620cccggctcag ggccaagaac agttggaaca gcagaatatg ggccaaacag gatatctgtg 1620

gtaagcagtt cctgccccgg ctcagggcca agaacagatg gtccccagat gcggtcccgc 1680gtaagcagtt cctgccccgg ctcaggggcca agaacagatg gtccccagat gcggtcccgc 1680

cctcagcagt ttctagagaa ccatcagatg tttccagggt gccccaagga cctgaaatga 1740cctcagcagt ttctagagaa ccatcagatg tttccagggt gccccaagga cctgaaatga 1740

ccctgtgcct tatttgaact aaccaatcag ttcgcttctc gcttctgttc gcgcgcttct 1800ccctgtgcct tatttgaact aaccaatcag ttcgcttctc gcttctgttc gcgcgcttct 1800

gctccccgag ctctatataa gcagagctcg tttagtgaac cgtcagatcg cctggagacg 18601860

ccatccacgc tgttttgact tccatagaag gatctcgagg ccaccatggc tagcgagctg 1920ccatccacgc tgttttgact tccatagaag gatctcgagg ccaccatggc tagcgagctg 1920

attaaggaga acatgcacat gaagctgtac atggagggca ccgtggacaa ccatcacttc 1980attaaggaga acatgcacat gaagctgtac atggagggca ccgtggacaa ccatcacttc 1980

aagtgcacat ccgagggcga aggcaagccc tacgagggca cccagaccat gagaatcaag 2040aagtgcacat ccgagggcga aggcaagccc tacgaggca cccagaccat gagaatcaag 2040

gtggtcgagg gcggccctct ccccttcgcc ttcgacatcc tggctactag cttcctctac 2100gtggtcgagg gcggccctct ccccttcgcc ttcgacatcc tggctactag cttcctctac 2100

ggcagcaaga ccttcatcaa ccacacccag ggcatccccg acttcttcaa gcagtccttc 2160ggcagcaaga ccttcatcaa ccacacccag ggcatccccg acttcttcaa gcagtccttc 2160

cctgagggct tcacatggga gagagtcacc acatacgagg acgggggcgt gctgaccgct 2220cctgagggct tcacatggga gagagtcacc acatacgagg acggggggcgt gctgaccgct 2220

acccaggaca ccagcctcca ggacggctgc ctcatctaca acgtcaagat cagaggggtg 2280acccaggaca ccagcctcca ggacggctgc ctcatctaca acgtcaagat cagaggggtg 2280

aacttcacat ccaacggccc tgtgatgcag aagaaaacac tcggctggga ggccttcacc 2340aacttcacat ccaacggccc tgtgatgcag aagaaaacac tcggctggga ggccttcacc 2340

gagacgctgt accccgctga cggcggcctg gaaggcagaa acgacatggc cctgaagctc 2400gagacgctgt accccgctga cggcggcctg gaaggcagaa acgacatggc cctgaagctc 2400

gtgggcggga gccatctgat cgcaaacatc aagaccacat atagatccaa gaaacccgct 2460gtgggcggga gccatctgat cgcaaacatc aagaccacat atagatccaa gaaacccgct 2460

aagaacctca agatgcctgg cgtctactat gtggactaca gactggaaag aatcaaggag 2520aagaacctca agatgcctgg cgtctactat gtggactaca gactggaaag aatcaaggag 2520

gccaacaacg agacctacgt cgagcagcac gaggtggcag tggccagata ctgcgacctc 2580gccaacaacg agacctacgt cgagcagcac gaggtggcag tggccagata ctgcgacctc 2580

cctagcaaac tggggcacaa gctaaattga aagctttgct ttatttgtga aatttgtgat 2640cctagcaaac tggggcacaa gctaaattga aagctttgct ttatttgtga aatttgtgat 2640

gctattgctt tatttgtaac cattataagc tgcaataaac aagtttaaca acaacaattg 2700gctattgctt tatttgtaac cattataagc tgcaataaac aagtttaaca acaacaattg 2700

cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gtcgacccac 2760cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gtcgacccac 2760

cattgtcttt cctagcggaa tgggcacctc atcccccgcc cgcaggggct cagctgacgg 2820cattgtcttt cctagcggaa tgggcacctc atcccccgcc cgcaggggct cagctgacgg 2820

ccctcggagt gcccagccac tgaggcctga ggatggacac tgctcttggc ccctctgacc 2880ccctcggagt gcccagccac tgaggcctga ggatggacac tgctcttggc ccctctgacc 2880

ggcttccttg gccaccagtg ttctgcagac cctccaccat gagcccgggt cagcgcattt 2940ggcttccttg gccaccagtg ttctgcagac cctccaccat gagcccgggt cagcgcattt 2940

cctcaggaga agcaggcagg gtgcaggcca ttgcaggccg tccaggggct gagctgcctg 3000cctcaggaga agcaggcagg gtgcaggcca ttgcaggccg tccaggggct gagctgcctg 3000

ggggcgaccg gggctccagc ctgcacctgc accaggcaca gccccaccac aggactcatg 3060ggggcgaccg gggctccagc ctgcacctgc accaggcaca gccccaccac aggactcatg 3060

tctcaatgcc cacagtgagc ccaggcagca ggtgtcaccg tcccctacag ggagggccag 3120tctcaatgcc cacagtgagc ccaggcagca ggtgtcaccg tcccctacag ggagggccag 3120

atgcagtcac tgcttcaggt cctgccagca cagagctgcc tgcgtccagc tccctgaatc 3180atgcagtcac tgcttcaggt cctgccagca cagagctgcc tgcgtccagc tccctgaatc 3180

tctgctgctg ctgctgctgc tgctgctgct gcctgcggcc cggggctgaa ggcgccgtgg 3240tctgctgctg ctgctgctgc tgctgctgct gcctgcggcc cggggctgaa ggcgccgtgg 3240

ccctgcctga cgccccggag cctcctgcct gaacttgggg gctggttgga gatggccttg 3300ccctgcctga cgccccggag ccctcctgcct gaacttgggg gctggttgga gatggccttg 3300

gagcagccaa ggtgcccctg gcagtggcat cccgaaacgc cctggacgca gggcccaaga 3360gagcagccaa ggtgcccctg gcagtggcat cccgaaacgc cctggacgca gggcccaaga 3360

ctgggcacag gagtgggagg tacatggggc tggggactcc ccaggagtta tctgctccct 3420ctgggcacag gagtgggagg tacatggggc tggggactcc ccaggagtta tctgctccct 3420

gcaggcctag agaagtttca gggaaggtca gaagagctcc tggctgtggt gggcagggca 3480gcaggcctag agaagtttca gggaaggtca gaagagctcc tggctgtggt gggcagggca 3480

ggaaacccct ccacctttac acatgcccag gcagcacctc aggccctttg tggggcaggg 3540ggaaacccct ccaccttttac acatgcccag gcagcacctc aggccctttg tggggcaggg 3540

aagctgaggc agtaagcggg caggcagagc tggaggcctt tcaggcccag ccagcactct 3600aagctgaggc agtaagcggg caggcagagc tggaggcctt tcaggcccag ccagcactct 3600

ggcctcctgc cgccgcattc caccccagcc cctcacacca ctcgggagag ggacatccta 3660ggcctcctgc cgccgcattc caccccagcc cctcacacca ctcggggagag ggacatccta 3660

cggtcccaag gtcaggaggg cagggctggg gttgactcag gcccctccca gctgtggcca 3720cggtcccaag gtcaggaggg cagggctggg gttgactcag gcccctccca gctgtggcca 3720

cctgggtgtt gggagggcag aagtgcaggc acctagggcc ccccatgtgc ccaccctggg 3780cctgggtgtt gggagggcag aagtgcaggc acctagggcc ccccatgtgc ccaccctggg 3780

agctctcctt ggaacccatt cctgaaatta tttaaagggg ttggccggac tagttacgta 3840agctctcctt ggaacccatt cctgaaatta tttaaagggg ttggccggac tagttacgta 3840

gataagtagc atggcgggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc 3900gataagtagc atggcggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc 3900

actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc 3960actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgccgacgc 3960

ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gccagctggc gtaatagcga 4020ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gccagctggc gtaatagcga 4020

agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgatt 4080agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgatt 4080

ccgttgcaat ggctggcggt aatattgttc tggatattac cagcaaggcc gatagtttga 4140ccgttgcaat ggctggcggt aatattgttc tggatattac cagcaaggcc gatagtttga 4140

gttcttctac tcaggcaagt gatgttatta ctaatcaaag aagtattgcg acaacggtta 4200gttcttctac tcaggcaagt gatgttatta ctaatcaaag aagtattgcg acaacggtta 4200

atttgcgtga tggacagact cttttactcg gtggcctcac tgattataaa aacacttctc 4260atttgcgtga tggacagact cttttactcg gtggcctcac tgattataaa aacacttctc 4260

aggattctgg cgtaccgttc ctgtctaaaa tccctttaat cggcctcctg tttagctccc 4320aggattctgg cgtaccgttc ctgtctaaaa tccctttaat cggcctcctg tttagctccc 4320

gctctgattc taacgaggaa agcacgttat acgtgctcgt caaagcaacc atagtacgcg 4380gctctgattc taacgaggaa agcacgttat acgtgctcgt caaagcaacc atagtacgcg 4380

ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca 4440ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca 4440

cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc 4500cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc 4500

gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct 4560gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct 4560

ttacggcacc tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg 4620ttacggcacc tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg 4620

ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc 4680ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc 4680

ttgttccaaa ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg 4740ttgttccaaa ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg 4740

attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg 4800attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg 4800

aattttaaca aaatattaac gtttacaatt taaatatttg cttatacaat cttcctgttt 4860aattttaaca aaatattaac gtttacaatt taaatatttg cttatacaat cttcctgttt 4860

ttggggcttt tctgattatc aaccggggta catatgattg acatgctagt tttacgatta 4920ttggggcttt tctgattatc aaccggggta catatgattg acatgctagt tttacgatta 4920

ccgttcatcg attctcttgt ttgctccaga ctctcaggca atgacctgat agcctttgta 4980ccgttcatcg attctcttgt ttgctccaga ctctcaggca atgacctgat agcctttgta 4980

gagacctctc aaaaatagct accctctccg gcatgaattt atcagctaga acggttgaat 5040gagacctctc aaaaatagct accctctccg gcatgaattt atcagctaga acggttgaat 5040

atcatattga tggtgatttg actgtctccg gcctttctca cccgtttgaa tctttaccta 5100atcatattga tggtgatttg actgtctccg gcctttctca cccgtttgaa tctttaccta 5100

cacattactc aggcattgca tttaaaatat atgagggttc taaaaatttt tatccttgcg 5160cacattactc aggcattgca tttaaaatat atgagggttc taaaaattttt tatccttgcg 5160

ttgaaataaa ggcttctccc gcaaaagtat tacagggtca taatgttttt ggtacaaccg 5220ttgaaataaa ggcttctccc gcaaaagtat tacagggtca taatgttttt ggtacaaccg 5220

atttagcttt atgctctgag gctttattgc ttaattttgc taattctttg ccttgcctgt 52805280

atgatttatt ggatgttgga atcgcctgat gcggtatttt ctccttacgc atctgtgcgg 5340atgatttatt ggatgttgga atcgcctgat gcggtatttt ctccttacgc atctgtgcgg 5340

tatttcacac cgcatatggt gcactctcag tacaatctgc tctgatgccg catagttaag 5400tatttcacac cgcatatggt gcactctcag tacaatctgc tctgatgccg catagttaag 5400

ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc tgctcccggc 5460ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc tgctcccggc 5460

atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc 5520atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc 5520

gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt tataggttaa 5580gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt tataggttaa 5580

tgtcatgata ataatggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgg 5640tgtcatgata ataatggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgg 5640

aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata 5700aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata 5700

accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg 5760accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg 5760

tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac 5820tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac 5820

gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact 5880gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact 5880

ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat 5940ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat 5940

gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga 6000gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg cggggcaaga 6000

gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac 6060gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac 6060

agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat 6120agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat 6120

gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac 6180gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac 6180

cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct 6240cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttgggg aaccggagct 6240

gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac 6300gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac 6300

gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac aattaataga 6360gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac aattaataga 6360

ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg 6420ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg 6420

gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact 64806480

ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac 6540ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac 6540

tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta 6600tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta 6600

actgtcagac caagtttact catatatact ttagattgat ttaaaacttc atttttaatt 6660actgtcagac caagtttact catatatact ttagattgat ttaaaacttc atttttaatt 6660

taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga 67206720

gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc 6780gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc 6780

tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt 6840tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt 6840

ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc 6900ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc 6900

gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc 6960gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc 6960

tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 7020tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 7020

cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 7080cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 7080

gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 7140gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 7140

actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc 7200actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc 7200

ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg 7260ggacaggtat ccggtaagcg gcagggtcgg aacaggag cgcacgaggg agcttccagg 7260

gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg 7320gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg 7320

atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt 7380atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt 7380

tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc 7440tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc 7440

tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc gccgcagccg 7500tgattctgtg gtaaccgta ttaccgcctt tgagtgagct gataccgctc gccgcagccg 7500

aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc 7560aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc 7560

gcctctcccc gcgcgttggc cgattcatta atg 7593gcctctcccc gcgcgttggc cgattcatta atg 7593

<210>53<210>53

<211>6718<211>6718

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная конструкция rAAV PD-1 Exon1_MND-GFP<223>Synthesized construct rAAV PD-1 Exon1_MND-GFP

<400>53<400>53

cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60cagctgcgcg ctcgctcgct cactgaggcc gcccggggcaa agcccggggcg tcgggcgacc 60

tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120

actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtaaggctgt 180actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtaaggctgt 180

tgcaggcatc acacggtgga aagatctgga actgtggcca tggtgtgagg ccatccacaa 240tgcaggcatc acacggtgga aagatctgga actgtggcca tggtgtgagg ccatccacaa 240

ggtggaagct ttgaggggga gccgattagc catggacagt tgtcattcag tagggtcacc 300ggtggaagct ttgaggggga gccgattagc catggacagt tgtcattcag tagggtcacc 300

tgtgccccag cgaaggggga tgggccggga aggcagaggc caggcacctg cccccagcag 360tgtgccccag cgaaggggga tgggccggga aggcagaggc caggcacctg cccccagcag 360

gggcagaggc tgtgggcagc cgggaggctc ccagaggctc cgacagaatg ggagtggggt 420gggcagaggc tgtgggcagc cgggaggctc ccagaggctc cgacagaatg ggagtggggt 420

tgagcccacc cctcactgca gcccaggaac ctgagcccag agggggccac ccaccttccc 480tgagcccacc ccctcactgca gccaggaac ctgagcccag agggggccac ccaccttccc 480

caggcaggga ggcccggccc ccagggagat gggggggatg ggggaggaga agggcctgcc 540caggcaggga ggcccggccc ccagggagat gggggggatg ggggaggaga agggcctgcc 540

cccacccggc agcctcagga ggggcagctc gggcgggata tggaaagagg ccacagcagt 600cccacccggc agcctcagga ggggcagctc gggcgggata tggaaagagg ccacagcagt 600

gagcagagac acagaggagg aaggggccct gagctgggga gacccccacg gggtagggcg 660gagcagagac acagaggagg aaggggccct gagctgggga gacccccacg gggtagggcg 660

tgggggccac gggcccacct cctccccatc tcctctgtct ccctgtctct gtctctctct 720tgggggccac gggccccacct cctccccatc tcctctgtct ccctgtctct gtctctctct 720

ccctccccca ccctctcccc agtcctaccc cctcctcacc cctcctcccc cagcactgcc 780ccctccccca ccctctcccc agtcctaccc cctcctcacc cctcctcccc cagcactgcc 780

tctgtcactc tcgcccacgt ggatgtggag gaagaggggg cgggagcaag gggcgggcac 840tctgtcactc tcgcccacgt ggatgtggag gaagaggggg cgggagcaag gggcgggcac 840

cctcccttca acctgacctg ggacagtttc ccttccgctc acctccgcct gagcagtgga 900cctcccttca acctgacctg ggacagtttc ccttccgctc acctccgcct gagcagtgga 900

gaaggcggca ctctggtggg gctgctccaa cgcgtgaaca gagaaacagg agaatatggg 960gaaggcggca ctctggtggg gctgctccaa cgcgtgaaca gagaaacagg agaatatggg 960

ccaaacagga tatctgtggt aagcagttcc tgccccggct cagggccaag aacagttgga 1020ccaaacagga tatctgtggt aagcagttcc tgccccggct cagggccaag aacagttgga 1020

acagcagaat atgggccaaa caggatatct gtggtaagca gttcctgccc cggctcaggg 1080acagcagaat atgggccaaa caggatatct gtggtaagca gttcctgccc cggctcaggg 1080

ccaagaacag atggtcccca gatgcggtcc cgccctcagc agtttctaga gaaccatcag 1140ccaagaacag atggtcccca gatgcggtcc cgccctcagc agtttctaga gaaccatcag 1140

atgtttccag ggtgccccaa ggacctgaaa tgaccctgtg ccttatttga actaaccaat 1200atgtttccag ggtgccccaa ggacctgaaa tgaccctgtg ccttatttga actaaccaat 1200

cagttcgctt ctcgcttctg ttcgcgcgct tctgctcccc gagctctata taagcagagc 1260cagttcgctt ctcgcttctg ttcgcgcgct tctgctcccc gagctctata taagcagagc 1260

tcgtttagtg aaccgtcaga tcgcctggag acgccatcca cgctgttttg acttccatag 1320tcgtttagtg aaccgtcaga tcgcctggag acgccatcca cgctgttttg acttccatag 1320

aaggatctcg aggccaccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc 1380aaggatctcg aggccaccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc 1380

atcctggtcg agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc 1440atcctggtcg agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc 1440

gagggcgatg ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg 1500gagggcgatg ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg 1500

cccgtgccct ggcccaccct cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc 1560cccgtgccct ggcccaccct cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc 1560

taccccgacc acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc 1620taccccgacc acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc 1620

caggagcgca ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag 1680caggagcgca ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag 1680

ttcgagggcg acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac 1740ttcgagggcg acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac 1740

ggcaacatcc tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcatg 1800ggcaacatcc tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcatg 1800

gccgacaagc agaagaacgg catcaaggtg aacttcaaga tccgccacaa catcgaggac 1860gccgacaagc agaagaacgg catcaaggtg aacttcaaga tccgccacaa catcgaggac 1860

ggcagcgtgc agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg 1920ggcagcgtgc agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg 1920

ctgctgcccg acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag 1980ctgctgcccg acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag 1980

aagcgcgatc acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg 2040aagcgcgatc acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg 2040

gacgagctgt acaagtaagc ggccgcgctt tatttgtgaa atttgtgatg ctattgcttt 2100gacgagctgt acaagtaagc ggccgcgctt tatttgtgaa atttgtgatg ctattgcttt 2100

atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca ttcattttat 21602160

gtttcaggtt cagggggaga tgtgggaggt tttttaaagc ctcaccggtt ctgggcggtg 2220gtttcaggtt cagggggaga tgtgggaggt tttttaaagc ctcaccggtt ctgggcggtg 2220

ctacaactgg gctggcggcc aggatggttc ttaggtaggt ggggtcggcg gtcaggtgtc 2280ctacaactgg gctggcggcc aggatggttc ttaggtaggt ggggtcggcg gtcaggtgtc 2280

ccagagccag gggtctggag ggaccttcca ccctcagtcc ctggcaggtc ggggggtgct 2340ccagagccag gggtctggag ggaccttcca ccctcagtcc ctggcaggtc ggggggtgct 2340

gaggcgggcc tggccctggc agcccagggg tcccggagcg aggggtctgg agggaccttt 2400gaggcggggcc tggccctggc agcccagggg tcccggagcg aggggtctgg agggaccttt 2400

cactctcagt ccctggcagg tcggggggtg ctgtggcagg cccagccttg gcccccagct 2460cactctcagt ccctggcagg tcggggggtg ctgtggcagg cccagccttg gcccccagct 2460

ctgcccctta ccctgagctg tgtggctttg ggcagctcga actcctgggt tcctctctgg 2520ctgcccctta ccctgagctg tgtggctttg ggcagctcga actcctgggt tcctctctgg 2520

gccccaactc ctcccctggc ccaagtcccc tctttgctcc tgggcaggca ggacctctgt 2580gccccaactc ctcccctggc ccaagtcccc tctttgctcc tgggcaggca ggacctctgt 2580

cccctctcag ccggtccttg gggctgcgtg tttctgtaga atgacgggtc aggctggcca 2640cccctctcag ccggtccttg gggctgcgtg tttctgtaga atgacgggtc aggctggcca 2640

gaaccccaaa ccttggccgt ggggagtctg cgtggcggct ctgccttgcc caggcatcct 2700gaaccccaaa ccttggccgt ggggagtctg cgtggcggct ctgccttgcc caggcatcct 2700

tggtcctcac tcgagttttc ctaaggatgg gatgagcccc atgtgggact aaccttggct 2760tggtcctcac tcgagttttc ctaaggatgg gatgagcccc atgtgggact aaccttggct 2760

ttacgacgtc aaagtttaga tgagctggtg atatttttct cattatatcc aaagtgtacc 2820ttacgacgtc aaagtttaga tgagctggtg atatttttct cattatatcc aaagtgtacc 2820

tgttcgagtg aggacagttc ttctgtctcc aggatccctc ctgggtgggg attgtgcccg 2880tgttcgagtg aggacagttc ttctgtctcc aggatccctc ctgggtgggg attgtgcccg 2880

cctgggtctc tgcccagatt ccagggctct ccccgagccc tgttcagacc atccgtgggg 2940cctgggtctc tgcccagatt ccagggctct ccccgagccc tgttcagacc atccgtgggg 2940

gaggccttgg cctcactctt acgtagataa gtagcatggc gggttaatca ttaactacaa 3000gaggccttgg cctcactctt acgtagataa gtagcatggc gggttaatca ttaactacaa 3000

ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 3060ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 3060

cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg 3120cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg 3120

agcgcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc 3180agcgcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc 3180

gcagcctgaa tggcgaatgg cgattccgtt gcaatggctg gcggtaatat tgttctggat 3240gcagcctgaa tggcgaatgg cgattccgtt gcaatggctg gcggtaatat tgttctggat 3240

attaccagca aggccgatag tttgagttct tctactcagg caagtgatgt tattactaat 3300attaccagca aggccgatag tttgagttct tctactcagg caagtgatgt tattactaat 3300

caaagaagta ttgcgacaac ggttaatttg cgtgatggac agactctttt actcggtggc 3360caaagaagta ttgcgacaac ggttaatttg cgtgatggac agactctttt actcggtggc 3360

ctcactgatt ataaaaacac ttctcaggat tctggcgtac cgttcctgtc taaaatccct 3420ctcactgatt ataaaaacac ttctcaggat tctggcgtac cgttcctgtc taaaatccct 3420

ttaatcggcc tcctgtttag ctcccgctct gattctaacg aggaaagcac gttatacgtg 3480ttaatcggcc tcctgtttag ctcccgctct gattctaacg aggaaagcac gttatacgtg 3480

ctcgtcaaag caaccatagt acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt 35403540

ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt 3600ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt 3600

cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct 3660cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct 3660

ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg 3720ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg 3720

tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga 3780tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga 3780

gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc 3840gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc 3840

ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga 3900ggtctattct ttttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga 3900

gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgttta caatttaaat 39603960

atttgcttat acaatcttcc tgtttttggg gcttttctga ttatcaaccg gggtacatat 4020atttgcttat acaatcttcc tgtttttggg gcttttctga ttatcaaccg gggtacatat 4020

gattgacatg ctagttttac gattaccgtt catcgattct cttgtttgct ccagactctc 4080gattgacatg ctagttttac gattaccgtt catcgattct cttgtttgct ccagactctc 4080

aggcaatgac ctgatagcct ttgtagagac ctctcaaaaa tagctaccct ctccggcatg 4140aggcaatgac ctgatagcct ttgtagagaac ctctcaaaaa tagctaccct ctccggcatg 4140

aatttatcag ctagaacggt tgaatatcat attgatggtg atttgactgt ctccggcctt 4200aatttatcag ctagaacggt tgaatatcat attgatggtg atttgactgt ctccggcctt 4200

tctcacccgt ttgaatcttt acctacacat tactcaggca ttgcatttaa aatatatgag 4260tctcacccgt ttgaatcttt acctacacat tactcaggca ttgcatttaa aatatatgag 4260

ggttctaaaa atttttatcc ttgcgttgaa ataaaggctt ctcccgcaaa agtattacag 4320ggttctaaaa atttttatcc ttgcgttgaa ataaaggctt ctcccgcaaa agtattacag 4320

ggtcataatg tttttggtac aaccgattta gctttatgct ctgaggcttt attgcttaat 4380ggtcataatg tttttggtac aaccgattta gctttatgct ctgaggcttt attgcttaat 4380

tttgctaatt ctttgccttg cctgtatgat ttattggatg ttggaatcgc ctgatgcggt 4440tttgctaatt ctttgccttg cctgtatgat ttattggatg ttggaatcgc ctgatgcggt 4440

attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 4500attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 4500

tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc 4560tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc 4560

cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga 4620cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga 4620

gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg 4680gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg 4680

tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg 4740tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg 4740

gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 4800gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 4800

atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 4860atatgtatcc gctcatgaga caataaccct gtaaatgct tcaataatat tgaaaaagga 4860

agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 4920agagtatgag tattcaacat ttccgtgtcg cccttattcc ctttttttgcg gcattttgcc 4920

ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 4980ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 4980

gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc 5040gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc 5040

gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 5100gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 5100

tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 5160tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 5160

acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 5220acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 5220

aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 5280aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 5280

cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 5340cgatcgggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 5340

gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 5400gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 5400

cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc 5460cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc 5460

tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 5520tagcttcccg gcaacaatta atagactgga tggaggcggga taaagttgca ggaccacttc 5520

tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 5580tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 5580

ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 5640ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 5640

tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 5700tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 5700

gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 5760gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 5760

ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 5820ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 5820

tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 5880tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 5880

agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 5940agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 5940

aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 6000aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 6000

cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 60606060

agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 6120agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 6120

tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 6180tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccggggttg gactcaagac 6180

gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 6240gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 6240

gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 6300gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 6300

ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 6360ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 6360

gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 6420gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 6420

ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 6480ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 6480

ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 65406540

acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 6600acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 6600

gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 66606660 gagctgatac cgctcgccgc agccgaacga ccgagcgcag

cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatg 6718cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatg 6718

<210>54<210>54

<211>756<211>756

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>54<400>54

aggctgttgc aggcatcaca cggtggaaag atctggaact gtggccatgg tgtgaggcca 60aggctgttgc aggcatcaca cggtggaaag atctggaact gtggccatgg tgtgaggcca 60

tccacaaggt ggaagctttg agggggagcc gattagccat ggacagttgt cattcagtag 120tccacaaggt ggaagctttg agggggagcc gattagccat ggacagttgt cattcagtag 120

ggtcacctgt gccccagcga agggggatgg gccgggaagg cagaggccag gcacctgccc 180ggtcacctgt gccccagcga agggggatgg gccgggaagg cagaggccag gcacctgccc 180

ccagcagggg cagaggctgt gggcagccgg gaggctccca gaggctccga cagaatggga 240ccagcagggg cagaggctgt gggcagccgg gaggctccca gaggctccga cagaatggga 240

gtggggttga gcccacccct cactgcagcc caggaacctg agcccagagg gggccaccca 300gtggggttga gcccacccct cactgcagcc caggaacctg agcccagagg gggccaccca 300

ccttccccag gcagggaggc ccggccccca gggagatggg ggggatgggg gaggagaagg 360ccttccccag gcagggaggc ccggccccca gggagatggg ggggatgggg gaggagaagg 360

gcctgccccc acccggcagc ctcaggaggg gcagctcggg cgggatatgg aaagaggcca 420gcctgccccc acccggcagc ctcaggaggg gcagctcggg cgggatatgg aaagaggcca 420

cagcagtgag cagagacaca gaggaggaag gggccctgag ctggggagac ccccacgggg 480cagcagtgag cagagacaca gaggaggaag gggccctgag ctggggagac ccccacgggg 480

tagggcgtgg gggccacggg cccacctcct ccccatctcc tctgtctccc tgtctctgtc 540tagggcgtgg gggccacggg cccacctcct ccccatctcc tctgtctccc tgtctctgtc 540

tctctctccc tcccccaccc tctccccagt cctaccccct cctcacccct cctcccccag 600tctctctccc tccccccaccc tctccccagt cctaccccct cctcacccct cctcccccag 600

cactgcctct gtcactctcg cccacgtgga tgtggaggaa gagggggcgg gagcaagggg 660cactgcctct gtcactctcg cccacgtgga tgtggaggaa gagggggcgg gagcaagggg 660

cgggcaccct cccttcaacc tgacctggga cagtttccct tccgctcacc tccgcctgag 720cgggcaccct cccttcaacc tgacctggga cagttttccct tccgctcacc tccgcctgag 720

cagtggagaa ggcggcactc tggtggggct gctcca 756cagtggagaa ggcggcactc tggtggggct gctcca 756

<210>55<210>55

<211>750<211>750

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>55<400>55

tctgggcggt gctacaactg ggctggcggc caggatggtt cttaggtagg tggggtcggc 60tctgggcggt gctacaactg ggctggcggc caggatggtt cttaggtagg tggggtcggc 60

ggtcaggtgt cccagagcca ggggtctgga gggaccttcc accctcagtc cctggcaggt 120ggtcaggtgt cccagagcca ggggtctgga gggaccttcc accctcagtc cctggcaggt 120

cggggggtgc tgaggcgggc ctggccctgg cagcccaggg gtcccggagc gaggggtctg 180cggggggtgc tgaggcgggc ctggccctgg cagcccaggg gtcccggagc gaggggtctg 180

gagggacctt tcactctcag tccctggcag gtcggggggt gctgtggcag gcccagcctt 240gagggacctt tcactctcag tccctggcag gtcggggggt gctgtggcag gcccagcctt 240

ggcccccagc tctgcccctt accctgagct gtgtggcttt gggcagctcg aactcctggg 300ggcccccagc tctgcccctt accctgagct gtgtggcttt gggcagctcg aactcctggg 300

ttcctctctg ggccccaact cctcccctgg cccaagtccc ctctttgctc ctgggcaggc 360ttcctctctg ggccccaact ccctcccctgg cccaagtccc ctctttgctc ctgggcaggc 360

aggacctctg tcccctctca gccggtcctt ggggctgcgt gtttctgtag aatgacgggt 420aggacctctg tcccctctca gccggtcctt ggggctgcgt gtttctgtag aatgacgggt 420

caggctggcc agaaccccaa accttggccg tggggagtct gcgtggcggc tctgccttgc 480caggctggcc agaaccccaa accttggccg tggggagtct gcgtggcggc tctgccttgc 480

ccaggcatcc ttggtcctca ctcgagtttt cctaaggatg ggatgagccc catgtgggac 540ccaggcatcc ttggtcctca ctcgagtttt cctaaggatg ggatgagccc catgtgggac 540

taaccttggc tttacgacgt caaagtttag atgagctggt gatatttttc tcattatatc 600taaccttggc tttacgacgt caaagtttag atgagctggt gatatttttc tcattatatc 600

caaagtgtac ctgttcgagt gaggacagtt cttctgtctc caggatccct cctgggtggg 660caaagtgtac ctgttcgagt gaggacagtt cttctgtctc caggatccct cctgggtggg 660

gattgtgccc gcctgggtct ctgcccagat tccagggctc tccccgagcc ctgttcagac 720gattgtgccc gcctgggtct ctgcccagat tccagggctc tccccgagcc ctgttcagac 720

catccgtggg ggaggccttg gcctcactct 750catccgtggg ggaggccttg gcctcactct 750

<210>56<210>56

<211>7609<211>7609

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная конструкция rAAV PD-1 Exon1_MND-CD19CAR<223>Synthesized construct rAAV PD-1 Exon1_MND-CD19CAR

<400>56<400>56

cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60cagctgcgcg ctcgctcgct cactgaggcc gcccggggcaa agcccggggcg tcgggcgacc 60

tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120

actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtaaggctgt 180actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtaaggctgt 180

tgcaggcatc acacggtgga aagatctgga actgtggcca tggtgtgagg ccatccacaa 240tgcaggcatc acacggtgga aagatctgga actgtggcca tggtgtgagg ccatccacaa 240

ggtggaagct ttgaggggga gccgattagc catggacagt tgtcattcag tagggtcacc 300ggtggaagct ttgaggggga gccgattagc catggacagt tgtcattcag tagggtcacc 300

tgtgccccag cgaaggggga tgggccggga aggcagaggc caggcacctg cccccagcag 360tgtgccccag cgaaggggga tgggccggga aggcagaggc caggcacctg cccccagcag 360

gggcagaggc tgtgggcagc cgggaggctc ccagaggctc cgacagaatg ggagtggggt 420gggcagaggc tgtgggcagc cgggaggctc ccagaggctc cgacagaatg ggagtggggt 420

tgagcccacc cctcactgca gcccaggaac ctgagcccag agggggccac ccaccttccc 480tgagcccacc ccctcactgca gccaggaac ctgagcccag agggggccac ccaccttccc 480

caggcaggga ggcccggccc ccagggagat gggggggatg ggggaggaga agggcctgcc 540caggcaggga ggcccggccc ccagggagat gggggggatg ggggaggaga agggcctgcc 540

cccacccggc agcctcagga ggggcagctc gggcgggata tggaaagagg ccacagcagt 600cccacccggc agcctcagga ggggcagctc gggcgggata tggaaagagg ccacagcagt 600

gagcagagac acagaggagg aaggggccct gagctgggga gacccccacg gggtagggcg 660gagcagagac acagaggagg aaggggccct gagctgggga gacccccacg gggtagggcg 660

tgggggccac gggcccacct cctccccatc tcctctgtct ccctgtctct gtctctctct 720tgggggccac gggccccacct cctccccatc tcctctgtct ccctgtctct gtctctctct 720

ccctccccca ccctctcccc agtcctaccc cctcctcacc cctcctcccc cagcactgcc 780ccctccccca ccctctcccc agtcctaccc cctcctcacc cctcctcccc cagcactgcc 780

tctgtcactc tcgcccacgt ggatgtggag gaagaggggg cgggagcaag gggcgggcac 840tctgtcactc tcgcccacgt ggatgtggag gaagaggggg cgggagcaag gggcgggcac 840

cctcccttca acctgacctg ggacagtttc ccttccgctc acctccgcct gagcagtgga 900acctcccttca acctgacctg ggacagtttc ccttccgctc acctccgcct gagcagtgga 900

gaaggcggca ctctggtggg gctgctccaa cgcgtgatcc atcgattagt ccaatttgtt 960gaaggcggca ctctggtggg gctgctccaa cgcgtgatcc atcgattagt ccaatttgtt 960

aaagacagga tatcagtggt ccaggctcta gttttgactc aacaatatca ccagctgaag 1020aaagacagga tatcagtggt ccaggctcta gttttgactc aacaatatca ccagctgaag 1020

cctatagagt acgagccata gatagaataa aagattttat ttagtctcca gaaaaagggg 1080cctatagagt acgagccata gatagaataa aagattttat ttagtctcca gaaaaagggg 1080

ggaatgaaag accccacctg taggtttggc aagctaggat caaggttagg aacagagaga 1140ggaatgaaag accccacctg taggtttggc aagctaggat caaggttagg aacagagaga 1140

cagcagaata tgggccaaac aggatatctg tggtaagcag ttcctgcccc ggctcagggc 1200cagcagaata tggggccaaac aggatatctg tggtaagcag ttcctgcccc ggctcaggggc 1200

caagaacagt tggaacagca gaatatgggc caaacaggat atctgtggta agcagttcct 12601260

gccccggctc agggccaaga acagatggtc cccagatgcg gtcccgccct cagcagtttc 1320gccccggctc agggccaaga acagatggtc cccagatgcg gtcccgccct cagcagtttc 1320

tagagaacca tcagatgttt ccagggtgcc ccaaggacct gaaatgaccc tgtgccttat 13801380

ttgaactaac caatcagttc gcttctcgct tctgttcgcg cgcttctgct ccccgagctc 1440ttgaactaac caatcagttc gcttctcgct tctgttcgcg cgcttctgct ccccgagctc 1440

aataaaagag cccacaaccc ctcactcggc gcgacgcgtc atagccacca tggccttacc 1500aataaaagag cccacaaccc ctcactcggc gcgacgcgtc atagccacca tggccttacc 1500

agtgaccgcc ttgctcctgc cgctggcctt gctgctccac gccgccaggc cggacatcca 1560agtgaccgcc ttgctcctgc cgctggcctt gctgctccac gccgccaggc cggacatcca 1560

gatgacacag actacatcct ccctgtctgc ctctctggga gacagagtca ccatcagttg 1620gatgacacag actacatcct ccctgtctgc ctctctggga gacagagtca ccatcagttg 1620

cagggcaagt caggacatta gtaaatattt aaattggtat cagcagaaac cagatggaac 1680cagggcaagt caggacatta gtaaatattt aaattggtat cagcagaaac cagatggaac 1680

tgttaaactc ctgatctacc atacatcaag attacactca ggagtcccat caaggttcag 1740tgttaaactc ctgatctacc atacatcaag attacactca ggagtcccat caaggttcag 1740

tggcagtggg tctggaacag attattctct caccattagc aacctggagc aagaagatat 1800tggcagtggg tctggaacag attattctct caccattagc aacctggagc aagaagatat 1800

tgccacttac ttttgccaac agggtaatac gcttccgtac acgttcggag gggggaccaa 1860tgccacttac ttttgccaac agggtaatac gcttccgtac acgttcggag gggggaccaa 1860

gctggagatc acaggtggcg gtggctccgg cggtggtggg tctggtggcg gcggaagcga 1920gctggagatc acaggtggcg gtggctccgg cggtggtggg tctggtggcg gcggaagcga 1920

ggtgaaactg caggagtcag gacctggcct ggtggcgccc tcacagagcc tgtccgtcac 1980ggtgaaactg caggagtcag gacctggcct ggtggcgccc tcacagagcc tgtccgtcac 1980

atgcactgtc tcaggggtct cattacccga ctatggtgta agctggattc gccagcctcc 2040atgcactgtc tcaggggtct cattacccga ctatggtgta agctggattc gccagcctcc 2040

acgaaagggt ctggagtggc tgggagtaat atggggtagt gaaaccacat actataattc 2100acgaaagggt ctggagtggc tgggagtaat atggggtagt gaaaccacat actataattc 2100

agctctcaaa tccagactga ccatcatcaa ggacaactcc aagagccaag ttttcttaaa 2160agctctcaaa tccagactga ccatcatcaa ggacaactcc aagagccaag ttttcttaaa 2160

aatgaacagt ctgcaaactg atgacacagc catttactac tgtgccaaac attattacta 2220aatgaacagt ctgcaaactg atgacacagc catttactac tgtgccaaac attattacta 2220

cggtggtagc tatgctatgg actactgggg tcaaggaacc tcggtcaccg tctcctcaac 2280cggtggtagc tatgctatgg actactgggg tcaaggaacc tcggtcaccg tctcctcaac 2280

cacgacgcca gcgccgcgac caccaacacc ggcgcccacc atcgcgtcgc agcccctgtc 2340cacgacgcca gcgccgcgac caccaacacc ggcgcccacc atcgcgtcgc agcccctgtc 2340

cctgcgccca gaggcgtgcc ggccagcggc ggggggcgca gtgcacacga gggggctgga 2400cctgcgccca gaggcgtgcc ggccagcggc ggggggcgca gtgcacacga gggggctgga 2400

cttcgcctgt gatatctaca tctgggcgcc cttggccggg acttgtgggg tccttctcct 2460cttcgcctgt gatatctaca tctgggcgcc cttggccggg acttgtgggg tccttctcct 2460

gtcactggtg atcacccttt actgcaaacg gggcagaaag aaactcctgt atatattcaa 2520gtcactggtg atcacccttt actgcaaacg gggcagaaag aaactcctgt atatattcaa 2520

acaaccattt atgagaccag tacaaactac tcaagaggaa gatggctgta gctgccgatt 2580acaaccattt atgagaccag tacaaactac tcaagaggaa gatggctgta gctgccgatt 2580

tccagaagaa gaagaaggag gatgtgaact gagagtgaag ttcagcagga gcgcagacgc 2640tccagaagaa gaagaaggag gatgtgaact gagagtgaag ttcagcagga gcgcagacgc 2640

ccccgcgtac cagcagggcc agaaccagct ctataacgag ctcaatctag gacgaagaga 2700ccccgcgtac cagcagggcc agaaccagct ctataacgag ctcaatctag gacgaagaga 2700

ggagtacgat gttttggaca agagacgtgg ccgggaccct gagatggggg gaaagccgag 2760ggagtacgat gttttggaca agagacgtgg ccgggaccct gagatggggg gaaagccgag 2760

aaggaagaac cctcaggaag gcctgtacaa tgaactgcag aaagataaga tggcggaggc 2820aaggaagaac cctcaggaag gcctgtacaa tgaactgcag aaagataaga tggcgggaggc 2820

ctacagtgag attgggatga aaggcgagcg ccggaggggc aaggggcacg atggccttta 2880ctacagtgag attgggatga aaggcgagcg ccggaggggc aaggggcacg atggccttta 2880

ccagggtctc agtacagcca ccaaggacac ctacgacgcc cttcacatgc aggccctgcc 2940ccagggtctc agtacagcca ccaaggacac ctacgacgcc cttcacatgc aggccctgcc 2940

ccctcgctaa gcggccgcgc tttatttgtg aaatttgtga tgctattgct ttatttgtaa 3000ccctcgctaa gcggccgcgc tttatttgtg aaatttgtga tgctattgct ttatttgtaa 3000

ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt atgtttcagg 30603060

ttcaggggga gatgtgggag gttttttaaa gctcaccggt tctgggcggt gctacaactg 3120ttcaggggga gatgtgggag gttttttaaa gctcaccggt tctgggcggt gctacaactg 3120

ggctggcggc caggatggtt cttaggtagg tggggtcggc ggtcaggtgt cccagagcca 3180ggctggcggc caggatggtt cttaggtagg tggggtcggc ggtcaggtgt cccagagcca 3180

ggggtctgga gggaccttcc accctcagtc cctggcaggt cggggggtgc tgaggcgggc 3240ggggtctgga gggaccttcc accctcagtc cctggcaggt cggggggtgc tgaggcggggc 3240

ctggccctgg cagcccaggg gtcccggagc gaggggtctg gagggacctt tcactctcag 3300ctggccctgg cagcccaggg gtcccggagc gaggggtctg gagggacctt tcactctcag 3300

tccctggcag gtcggggggt gctgtggcag gcccagcctt ggcccccagc tctgcccctt 3360tccctggcag gtcggggggt gctgtggcag gcccagcctt ggcccccagc tctgcccctt 3360

accctgagct gtgtggcttt gggcagctcg aactcctggg ttcctctctg ggccccaact 3420accctgagct gtgtggcttt gggcagctcg aactcctggg ttcctctctg ggccccaact 3420

cctcccctgg cccaagtccc ctctttgctc ctgggcaggc aggacctctg tcccctctca 3480cctcccctgg cccaagtccc ctctttgctc ctgggcaggc aggacctctg tcccctctca 3480

gccggtcctt ggggctgcgt gtttctgtag aatgacgggt caggctggcc agaaccccaa 3540gccggtcctt ggggctgcgt gtttctgtag aatgacgggt caggctggcc agaaccccaa 3540

accttggccg tggggagtct gcgtggcggc tctgccttgc ccaggcatcc ttggtcctca 3600accttggccg tggggagtct gcgtggcggc tctgccttgc ccaggcatcc ttggtcctca 3600

ctcgagtttt cctaaggatg ggatgagccc catgtgggac taaccttggc tttacgacgt 36603660

caaagtttag atgagctggt gatatttttc tcattatatc caaagtgtac ctgttcgagt 37203720

gaggacagtt cttctgtctc caggatccct cctgggtggg gattgtgccc gcctgggtct 3780gaggacagtt cttctgtctc caggatccct cctgggtggg gattgtgccc gcctgggtct 3780

ctgcccagat tccagggctc tccccgagcc ctgttcagac catccgtggg ggaggccttg 3840ctgccgat tccagggctc tccccgagcc ctgttcagac catccgtggg ggaggccttg 3840

gcctcactct tacgtagata agtagcatgg cgggttaatc attaactaca aggaacccct 3900gcctcactct tacgtagata agtagcatgg cgggttaatc attaactaca aggaacccct 3900

agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc 3960agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg cggggcgacc 3960

aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcca 4020aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcca 4020

gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga 4080gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga 4080

atggcgaatg gcgattccgt tgcaatggct ggcggtaata ttgttctgga tattaccagc 4140atggcgaatg gcgattccgt tgcaatggct ggcggtaata ttgttctgga tattaccagc 4140

aaggccgata gtttgagttc ttctactcag gcaagtgatg ttattactaa tcaaagaagt 4200aaggccgata gtttgagttc ttctactcag gcaagtgatg ttattactaa tcaaagaagt 4200

attgcgacaa cggttaattt gcgtgatgga cagactcttt tactcggtgg cctcactgat 4260attgcgacaa cggttaattt gcgtgatgga cagactcttt tactcggtgg cctcactgat 4260

tataaaaaca cttctcagga ttctggcgta ccgttcctgt ctaaaatccc tttaatcggc 4320tataaaaaca cttctcagga ttctggcgta ccgttcctgt ctaaaatccc tttaatcggc 4320

ctcctgttta gctcccgctc tgattctaac gaggaaagca cgttatacgt gctcgtcaaa 4380ctcctgttta gctcccgctc tgattctaac gaggaaagca cgttatacgt gctcgtcaaa 4380

gcaaccatag tacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 4440gcaaccatag tacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 4440

cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 4500cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 4500

ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 4560ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 4560

gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 4620gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 4620

acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 4680acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 4680

ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 4740ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 4740

ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 4800ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 4800

acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttaaa tatttgctta 48604860

tacaatcttc ctgtttttgg ggcttttctg attatcaacc ggggtacata tgattgacat 4920tacaatcttc ctgtttttgg ggcttttctg attatcaacc ggggtacata tgattgacat 4920

gctagtttta cgattaccgt tcatcgattc tcttgtttgc tccagactct caggcaatga 4980gctagtttta cgattaccgt tcatcgattc tcttgtttgc tccagactct caggcaatga 4980

cctgatagcc tttgtagaga cctctcaaaa atagctaccc tctccggcat gaatttatca 5040cctgatagcc tttgtagaga cctctcaaaa atagctaccc tctccggcat gaatttatca 5040

gctagaacgg ttgaatatca tattgatggt gatttgactg tctccggcct ttctcacccg 5100gctagaacgg ttgaatatca tattgatggt gatttgactg tctccggcct ttctcacccg 5100

tttgaatctt tacctacaca ttactcaggc attgcattta aaatatatga gggttctaaa 5160tttgaatctt tacctacaca ttactcaggc attgcattta aaatatatga gggttctaaa 5160

aatttttatc cttgcgttga aataaaggct tctcccgcaa aagtattaca gggtcataat 5220aatttttatc cttgcgttga aataaaggct tctcccgcaa aagtattaca gggtcataat 5220

gtttttggta caaccgattt agctttatgc tctgaggctt tattgcttaa ttttgctaat 5280gtttttggta caaccgattt agctttatgc tctgaggctt tattgcttaa ttttgctaat 5280

tctttgcctt gcctgtatga tttattggat gttggaatcg cctgatgcgg tattttctcc 5340tctttgcctt gcctgtatga tttattggat gttggaatcg cctgatgcgg tattttctcc 5340

ttacgcatct gtgcggtatt tcacaccgca tatggtgcac tctcagtaca atctgctctg 5400ttacgcatct gtgcggtatt tcacaccgca tatggtgcac tctcagtaca atctgctctg 5400

atgccgcata gttaagccag ccccgacacc cgccaacacc cgctgacgcg ccctgacggg 5460atgccgcata gttaagccag ccccgacacc cgccaacacc cgctgacgcg ccctgacggg 5460

cttgtctgct cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt 5520cttgtctgct cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt 5520

gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg aaagggcctc gtgatacgcc 5580gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg aaagggcctc gtgatacgcc 5580

tatttttata ggttaatgtc atgataataa tggtttctta gacgtcaggt ggcacttttc 5640tatttttata ggttaatgtc atgataataa tggtttctta gacgtcaggt ggcacttttc 5640

ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc 5700ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc 5700

cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga 5760cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga 5760

gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt 5820gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt 5820

ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag 5880ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag 5880

tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag 5940tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag 5940

aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta 6000aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta 6000

ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg 6060ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg 6060

agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca 6120agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca 6120

gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag 6180gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag 6180

gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc 6240gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc 6240

gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg 6300gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg 6300

tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc 6360tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc 6360

ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg 6420ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg 6420

cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg 6480cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg 6480

gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga 6540gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga 6540

cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac 66006600

tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa 66606660

aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca 6720aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca 6720

aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 6780aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 6780

gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 6840gatcttcttg agatcctttt ttttgcgcg taatctgctg cttgcaaaca aaaaaaccac 6840

cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 6900cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 6900

ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc 6960ctggcttcag tagttaggcc 6960

accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 7020accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 7020

tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac 7080tggctgctgc cagtggcgat aagtcgtgtc ttaccggggtt ggactcaaga cgatagttac 7080

cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 7140cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 7140

gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 7200gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 7200

ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 7260aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 7260

cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 7320cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 7320

tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg 7380tctgacttga gcgtcgattt ttgtgatgct cgtcagggggg gcggagccta tggaaaaacg 7380

ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 7440ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 7440

ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 7500ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 7500

ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc 7560ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc 7560

gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatg 7609gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatg 7609

<210>57<210>57

<211>7492<211>7492

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная конструкция rAAV PD-1 Exon1_MND-BCMACAR<223>Synthesized construct rAAV PD-1 Exon1_MND-BCMACAR

<400>57<400>57

cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60cagctgcgcg ctcgctcgct cactgaggcc gcccggggcaa agcccggggcg tcgggcgacc 60

tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120

actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtaaggctgt 180actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtaaggctgt 180

tgcaggcatc acacggtgga aagatctgga actgtggcca tggtgtgagg ccatccacaa 240tgcaggcatc acacggtgga aagatctgga actgtggcca tggtgtgagg ccatccacaa 240

ggtggaagct ttgaggggga gccgattagc catggacagt tgtcattcag tagggtcacc 300ggtggaagct ttgaggggga gccgattagc catggacagt tgtcattcag tagggtcacc 300

tgtgccccag cgaaggggga tgggccggga aggcagaggc caggcacctg cccccagcag 360tgtgccccag cgaaggggga tgggccggga aggcagaggc caggcacctg cccccagcag 360

gggcagaggc tgtgggcagc cgggaggctc ccagaggctc cgacagaatg ggagtggggt 420gggcagaggc tgtgggcagc cgggaggctc ccagaggctc cgacagaatg ggagtggggt 420

tgagcccacc cctcactgca gcccaggaac ctgagcccag agggggccac ccaccttccc 480tgagcccacc ccctcactgca gccaggaac ctgagcccag agggggccac ccaccttccc 480

caggcaggga ggcccggccc ccagggagat gggggggatg ggggaggaga agggcctgcc 540caggcaggga ggcccggccc ccagggagat gggggggatg ggggaggaga agggcctgcc 540

cccacccggc agcctcagga ggggcagctc gggcgggata tggaaagagg ccacagcagt 600cccacccggc agcctcagga ggggcagctc gggcgggata tggaaagagg ccacagcagt 600

gagcagagac acagaggagg aaggggccct gagctgggga gacccccacg gggtagggcg 660gagcagagac acagaggagg aaggggccct gagctgggga gacccccacg gggtagggcg 660

tgggggccac gggcccacct cctccccatc tcctctgtct ccctgtctct gtctctctct 720tgggggccac gggccccacct cctccccatc tcctctgtct ccctgtctct gtctctctct 720

ccctccccca ccctctcccc agtcctaccc cctcctcacc cctcctcccc cagcactgcc 780ccctccccca ccctctcccc agtcctaccc cctcctcacc cctcctcccc cagcactgcc 780

tctgtcactc tcgcccacgt ggatgtggag gaagaggggg cgggagcaag gggcgggcac 840tctgtcactc tcgcccacgt ggatgtggag gaagaggggg cgggagcaag gggcgggcac 840

cctcccttca acctgacctg ggacagtttc ccttccgctc acctccgcct gagcagtgga 900cctcccttca acctgacctg ggacagtttc ccttccgctc acctccgcct gagcagtgga 900

gaaggcggca ctctggtggg gctgctccaa cgcgtaatga aagaccccac ctgtaggttt 960gaaggcggca ctctggtggg gctgctccaa cgcgtaatga aagaccccac ctgtaggttt 960

ggcaagctag gatcaaggtt aggaacagag agacagcaga atatgggcca aacaggatat 1020ggcaagctag gatcaaggtt aggaacagag agacagcaga atatggggcca aacaggatat 1020

ctgtggtaag cagttcctgc cccggctcag ggccaagaac agttggaaca gcagaatatg 1080ctgtggtaag cagttcctgc cccggctcag ggccaagaac agttggaaca gcagaatatg 1080

ggccaaacag gatatctgtg gtaagcagtt cctgccccgg ctcagggcca agaacagatg 1140ggccaaacag gatatctgtg gtaagcagtt cctgccccgg ctcaggggcca agaacagatg 1140

gtccccagat gcggtcccgc cctcagcagt ttctagagaa ccatcagatg tttccagggt 12001200

gccccaagga cctgaaatga ccctgtgcct tatttgaact aaccaatcag ttcgcttctc 1260gccccaagga cctgaaatga ccctgtgcct tatttgaact aaccaatcag ttcgcttctc 1260

gcttctgttc gcgcgcttct gctccccgag ctcaataaaa gagcccacaa cccctcactc 1320gcttctgttc gcgcgcttct gctccccgag ctcaataaaa gagcccacaa cccctcactc 1320

ggcgcgattc acctgacgcg tctacgccac catggcactc cccgtcaccg cccttctctt 1380ggcgcgattc acctgacgcg tctacgccac catggcactc cccgtcaccg cccttctctt 1380

gcccctcgcc ctgctgctgc atgctgccag gcccgacatt gtgctcactc agtcacctcc 1440gcccctcgcc ctgctgctgc atgctgccag gcccgacatt gtgctcactc agtcacctcc 1440

cagcctggcc atgagcctgg gaaaaagggc caccatctcc tgtagagcca gtgagtccgt 1500cagcctggcc atgagcctgg gaaaaagggc caccatctcc tgtagagcca gtgagtccgt 1500

cacaatcttg gggagccatc ttattcactg gtatcagcag aagcccgggc agcctccaac 1560cacaatcttg gggagccatc ttattcactg gtatcagcag aagcccgggc agcctccaac 1560

ccttcttatt cagctcgcgt caaacgtcca gacgggtgta cctgccagat tttctggtag 1620ccttcttatt cagctcgcgt caaacgtcca gacgggtgta cctgccagat tttctggtag 1620

cgggtcccgc actgatttta cactgaccat agatccagtg gaagaagacg atgtggccgt 1680cgggtcccgc actgatttta cactgaccat agatccagtg gaagaagacg atgtggccgt 1680

gtattattgt ctgcagagca gaacgattcc tcgcacattt ggtgggggta ctaagctgga 1740gtattattgt ctgcagagca gaacgattcc tcgcacattt ggtgggggta ctaagctgga 1740

gattaaggga agcacgtccg gctcagggaa gccgggctcc ggcgagggaa gcacgaaggg 1800gattaaggga agcacgtccg gctcagggaa gccgggctcc ggcgagggaa gcacgaaggg 1800

gcaaattcag ctggtccaga gcggacctga gctgaaaaaa cccggcgaga ctgttaagat 1860gcaaattcag ctggtccaga gcggacctga gctgaaaaaa cccggcgaga ctgttaagat 1860

cagttgtaaa gcatctggct ataccttcac cgactacagc ataaattggg tgaaacgggc 1920cagttgtaaa gcatctggct ataccttcac cgactacagc ataaattggg tgaaacgggc 1920

ccctggaaag ggcctcaaat ggatgggttg gatcaatacc gaaactaggg agcctgctta 1980ccctggaaag ggcctcaaat ggatgggttg gatcaatacc gaaactaggg agcctgctta 1980

tgcatatgac ttccgcggga gattcgcctt ttcactcgag acatctgcct ctactgctta 2040tgcatatgac ttccgcggga gattcgcctt ttcactcgag acatctgcct ctactgctta 2040

cctccaaata aacaacctca agtatgaaga tacagccact tacttttgcg ccctcgacta 2100cctccaaata aacaacctca agtatgaaga tacagccact tacttttgcg ccctcgacta 2100

tagttacgcc atggactact ggggacaggg aacctccgtt accgtcagtt ccgcggccgc 2160tagttacgcc atggactact ggggacaggg aacctccgtt accgtcagtt ccgcggccgc 2160

aaccacaaca cctgctccaa ggccccccac acccgctcca actatagcca gccaaccatt 2220aaccacaaca cctgctccaa ggccccccac acccgctcca actatagcca gccaaccatt 2220

gagcctcaga cctgaagctt gcaggcccgc agcaggaggc gccgtccata cgcgaggcct 2280gagcctcaga cctgaagctt gcaggcccgc agcaggaggc gccgtccata cgcgaggcct 2280

ggacttcgcg tgtgatattt atatttgggc ccctttggcc ggaacatgtg gggtgttgct 2340ggacttcgcg tgtgatattt atatttgggc ccctttggcc ggaacatgtg gggtgttgct 2340

tctctccctt gtgatcactc tgtattgtaa gcgcgggaga aagaagctcc tgtacatctt 2400tctctccctt gtgatcactc tgtattgtaa gcgcgggaga aagaagctcc tgtacatctt 2400

caagcagcct tttatgcgac ctgtgcaaac cactcaggaa gaagatgggt gttcatgccg 2460caagcagcct tttatgcgac ctgtgcaaac cactcaggaa gaagatgggt gttcatgccg 2460

cttccccgag gaggaagaag gagggtgtga actgagggtg aaattttcta gaagcgccga 2520cttccccgag gaggaagaag gagggtgtga actgagggtg aaattttcta gaagcgccga 2520

tgctcccgca tatcagcagg gtcagaatca gctctacaat gaattgaatc tcggcaggcg 2580tgctcccgca tatcagcagg gtcagaatca gctctacaat gaattgaatc tcggcaggcg 2580

agaagagtac gatgttctgg acaagagacg gggcagggat cccgagatgg ggggaaagcc 2640agaagagtac gatgttctgg acaagagacg gggcagggat cccgagatgg ggggaaagcc 2640

ccggagaaaa aatcctcagg aggggttgta caatgagctg cagaaggaca agatggctga 2700ccggagaaaa aatcctcagg aggggttgta caatgagctg cagaaggaca agatggctga 2700

agcctatagc gagatcggaa tgaaaggcga aagacgcaga ggcaaggggc atgacggtct 2760agcctatagc gagatcggaa tgaaaggcga aagacgcaga ggcaaggggc atgacggtct 2760

gtaccagggt ctctctacag ccaccaagga cacttatgat gcgttgcata tgcaagcctt 2820gtaccagggt ctctctacag ccaccaagga cacttatgat gcgttgcata tgcaagcctt 2820

gccaccccgc taagcggccg cgctttattt gtgaaatttg tgatgctatt gctttatttg 2880gccaccccgc taagcggccg cgctttattt gtgaaatttg tgatgctatt gctttatttg 2880

taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc 2940taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc 2940

aggttcaggg ggagatgtgg gaggtttttt aaagctcacc ggttctgggc ggtgctacaa 3000aggttcaggg ggagatgtgg gaggtttttt aaagctcacc ggttctggggc ggtgctacaa 3000

ctgggctggc ggccaggatg gttcttaggt aggtggggtc ggcggtcagg tgtcccagag 3060ctgggctggc ggccaggatg gttcttaggt aggtggggtc ggcggtcagg tgtcccagag 3060

ccaggggtct ggagggacct tccaccctca gtccctggca ggtcgggggg tgctgaggcg 3120ccaggggtct ggagggacct tccaccctca gtccctggca ggtcgggggg tgctgaggcg 3120

ggcctggccc tggcagccca ggggtcccgg agcgaggggt ctggagggac ctttcactct 3180ggcctggccc tggcagccca ggggtcccgg agcgaggggt ctggagggac ctttcactct 3180

cagtccctgg caggtcgggg ggtgctgtgg caggcccagc cttggccccc agctctgccc 3240cagtccctgg caggtcgggg ggtgctgtgg caggcccagc cttggccccc agctctgccc 3240

cttaccctga gctgtgtggc tttgggcagc tcgaactcct gggttcctct ctgggcccca 3300cttaccctga gctgtgtggc tttggggcagc tcgaactcct gggttcctct ctgggcccca 3300

actcctcccc tggcccaagt cccctctttg ctcctgggca ggcaggacct ctgtcccctc 3360actcctcccc tggcccaagt cccctctttg ctcctgggca ggcaggacct ctgtcccctc 3360

tcagccggtc cttggggctg cgtgtttctg tagaatgacg ggtcaggctg gccagaaccc 3420tcagccggtc cttggggctg cgtgtttctg tagaatgacg ggtcaggctg gccagaaccc 3420

caaaccttgg ccgtggggag tctgcgtggc ggctctgcct tgcccaggca tccttggtcc 3480caaaccttgg ccgtggggag tctgcgtggc ggctctgcct tgcccaggca tccttggtcc 3480

tcactcgagt tttcctaagg atgggatgag ccccatgtgg gactaacctt ggctttacga 3540tcactcgagt ttttcctaagg atgggatgag ccccatgtgg gactaacctt ggctttacga 3540

cgtcaaagtt tagatgagct ggtgatattt ttctcattat atccaaagtg tacctgttcg 36003600

agtgaggaca gttcttctgt ctccaggatc cctcctgggt ggggattgtg cccgcctggg 36603660

tctctgccca gattccaggg ctctccccga gccctgttca gaccatccgt gggggaggcc 3720tctctgccca gattccaggg ctctccccga gccctgttca gaccatccgt gggggaggcc 3720

ttggcctcac tcttacgtag ataagtagca tggcgggtta atcattaact acaaggaacc 3780ttggcctcac tcttacgtag ataagtagca tggcgggtta atcattaact acaaggaacc 3780

cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 3840cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 3840

accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 3900accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 3900

ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc 3960ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc 3960

tgaatggcga atggcgattc cgttgcaatg gctggcggta atattgttct ggatattacc 4020tgaatggcga atggcgattc cgttgcaatg gctggcggta atattgttct ggatattacc 4020

agcaaggccg atagtttgag ttcttctact caggcaagtg atgttattac taatcaaaga 4080agcaaggccg atagtttgag ttcttctact caggcaagtg atgttattac taatcaaaga 4080

agtattgcga caacggttaa tttgcgtgat ggacagactc ttttactcgg tggcctcact 4140agtattgcga caacggttaa tttgcgtgat ggacagactc ttttactcgg tggcctcact 4140

gattataaaa acacttctca ggattctggc gtaccgttcc tgtctaaaat ccctttaatc 4200gattataaaa acacttctca ggattctggc gtaccgttcc tgtctaaaat ccctttaatc 4200

ggcctcctgt ttagctcccg ctctgattct aacgaggaaa gcacgttata cgtgctcgtc 4260ggcctcctgt ttagctcccg ctctgattct aacgaggaaa gcacgttata cgtgctcgtc 4260

aaagcaacca tagtacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac 4320aaagcaacca tagtacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac 4320

gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc 4380gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc 4380

ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt 4440ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt 4440

agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg 4500agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg 4500

ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac 4560ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac 4560

gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta 46204620

ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 4680ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 4680

ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttacaattt aaatatttgc 4740ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttacaattt aaatatttgc 4740

ttatacaatc ttcctgtttt tggggctttt ctgattatca accggggtac atatgattga 4800ttatacaatc ttcctgtttt tggggctttt ctgattatca accggggtac atatgattga 4800

catgctagtt ttacgattac cgttcatcga ttctcttgtt tgctccagac tctcaggcaa 4860catgctagtt ttacgattac cgttcatcga ttctcttgtt tgctccagac tctcaggcaa 4860

tgacctgata gcctttgtag agacctctca aaaatagcta ccctctccgg catgaattta 4920tgacctgata gcctttgtag agacctctca aaaatagcta ccctctccgg catgaattta 4920

tcagctagaa cggttgaata tcatattgat ggtgatttga ctgtctccgg cctttctcac 4980tcagctagaa cggttgaata tcatattgat ggtgatttga ctgtctccgg cctttctcac 4980

ccgtttgaat ctttacctac acattactca ggcattgcat ttaaaatata tgagggttct 5040ccgtttgaat ctttacctac acattactca ggcattgcat ttaaaatata tgagggttct 5040

aaaaattttt atccttgcgt tgaaataaag gcttctcccg caaaagtatt acagggtcat 5100aaaaattttt atccttgcgt tgaaataaag gcttctcccg caaaagtatt acagggtcat 5100

aatgtttttg gtacaaccga tttagcttta tgctctgagg ctttattgct taattttgct 51605160

aattctttgc cttgcctgta tgatttattg gatgttggaa tcgcctgatg cggtattttc 5220aattctttgc cttgcctgta tgatttattg gatgttggaa tcgcctgatg cggtattttc 5220

tccttacgca tctgtgcggt atttcacacc gcatatggtg cactctcagt acaatctgct 5280tccttacgca tctgtgcggt atttcacacc gcatatggtg cactctcagt acaatctgct 5280

ctgatgccgc atagttaagc cagccccgac acccgccaac acccgctgac gcgccctgac 5340ctgatgccgc atagttaagc cagccccgac acccgccaac acccgctgac gcgccctgac 5340

gggcttgtct gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca 5400gggcttgtct gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca 5400

tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac 5460tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac 5460

gcctattttt ataggttaat gtcatgataa taatggtttc ttagacgtca ggtggcactt 5520gcctattttt ataggttaat gtcatgataa taatggtttc ttagacgtca ggtggcactt 5520

ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt 5580ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt 5580

atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta 5640atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta 5640

tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg 5700tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg 5700

tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac 5760tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac 5760

gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg 5820gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg 5820

aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc 5880aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc 5880

gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg 5940gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg 5940

ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat 6000ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat 6000

gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg 6060gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg 6060

gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg 6120gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg 6120

atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc 6180atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc 6180

ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt 6240ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt 6240

cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct 63006300

cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc 63606360

gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca 6420gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca 6420

cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct 6480cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct 6480

cactgattaa gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt 6540cactgattaa gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt 6540

taaaacttca tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga 6600taaaacttca tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga 6600

ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca 6660ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca 6660

aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac 6720aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac 6720

caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg 67806780

taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag 6840taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag 6840

gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac 6900gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac 6900

cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt 69606960

taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg 7020taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg 7020

agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc 7080agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc 7080

ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc 7140ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc 7140

gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc 7200gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc 7200

acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa 7260acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa 7260

acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt 7320acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt 7320

tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg 7380tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg 7380

ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag 7440ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag 7440

agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tg 7492agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tg 7492

<210>58<210>58

<211>6147<211>6147

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная конструкция rAAV PD-1 Exon1_ATG-mCherry<223>Synthesized construct rAAV PD-1 Exon1_ATG-mCherry

<400>58<400>58

cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa agcccgggcg tcgggcgacc 60cagctgcgcg ctcgctcgct cactgaggcc gcccggggcaa agcccggggcg tcgggcgacc 60

tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120

actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtaaggctgt 180actaggggtt ccttgtagtt aatgattaac ccgccatgct acttatctac gtaaggctgt 180

tgcaggcatc acacggtgga aagatctgga actgtggcca tggtgtgagg ccatccacaa 240tgcaggcatc acacggtgga aagatctgga actgtggcca tggtgtgagg ccatccacaa 240

ggtggaagct ttgaggggga gccgattagc catggacagt tgtcattcag tagggtcacc 300ggtggaagct ttgaggggga gccgattagc catggacagt tgtcattcag tagggtcacc 300

tgtgccccag cgaaggggga tgggccggga aggcagaggc caggcacctg cccccagcag 360tgtgccccag cgaaggggga tgggccggga aggcagaggc caggcacctg cccccagcag 360

gggcagaggc tgtgggcagc cgggaggctc ccagaggctc cgacagaatg ggagtggggt 420gggcagaggc tgtgggcagc cgggaggctc ccagaggctc cgacagaatg ggagtggggt 420

tgagcccacc cctcactgca gcccaggaac ctgagcccag agggggccac ccaccttccc 480tgagcccacc ccctcactgca gccaggaac ctgagcccag agggggccac ccaccttccc 480

caggcaggga ggcccggccc ccagggagat gggggggatg ggggaggaga agggcctgcc 540caggcaggga ggcccggccc ccagggagat gggggggatg ggggaggaga agggcctgcc 540

cccacccggc agcctcagga ggggcagctc gggcgggata tggaaagagg ccacagcagt 600cccacccggc agcctcagga ggggcagctc gggcgggata tggaaagagg ccacagcagt 600

gagcagagac acagaggagg aaggggccct gagctgggga gacccccacg gggtagggcg 660gagcagagac acagaggagg aaggggccct gagctgggga gacccccacg gggtagggcg 660

tgggggccac gggcccacct cctccccatc tcctctgtct ccctgtctct gtctctctct 720tgggggccac gggccccacct cctccccatc tcctctgtct ccctgtctct gtctctctct 720

ccctccccca ccctctcccc agtcctaccc cctcctcacc cctcctcccc cagcactgcc 780ccctccccca ccctctcccc agtcctaccc cctcctcacc cctcctcccc cagcactgcc 780

tctgtcactc tcgcccacgt ggatgtggag gaagaggggg cgggagcaag gggcgggcac 840tctgtcactc tcgcccacgt ggatgtggag gaagaggggg cgggagcaag gggcgggcac 840

cctcccttca acctgacctg ggacagtttc ccttccgctc acctccgcct gagcagtgga 900cctcccttca acctgacctg ggacagtttc ccttccgctc acctccgcct gagcagtgga 900

gaaggcggca ctctggtggg gctgctccag gcatgcaggt gagcaagggc gaggaggata 960gaaggcggca ctctggtggg gctgctccag gcatgcaggt gagcaagggc gaggaggata 960

actccgccat catcaaggag ttcctgcgct tcaaggtgca catggagggc tccgtgaacg 1020actccgccat catcaaggag ttcctgcgct tcaaggtgca catggagggc tccgtgaacg 1020

gccacgagtt cgagatcgag ggcgagggcg agggccgccc ctacgagggc acccagaccg 1080gccacgagtt cgagatcgag ggcgagggcg agggccgccc ctacgagggc acccagaccg 1080

ccaagctgaa ggtgaccaag ggtggccccc tgcccttcgc ctgggacatc ctgtcccctc 1140ccaagctgaa ggtgaccaag ggtggccccc tgcccttcgc ctgggacatc ctgtcccctc 1140

agttcatgta cggctccaag gcctacgtga agcaccccgc cgacatcccc gactacttga 1200agttcatgta cggctccaag gcctacgtga agcaccccgc cgacatcccc gactacttga 1200

agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag gacggcggcg 1260agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag gacggcggcg 1260

tggtgaccgt gacccaggac tcctctctgc aggacggcga gttcatctac aaggtgaagc 1320tggtgaccgt gacccaggac tcctctctgc aggacggcga gttcatctac aaggtgaagc 1320

tgcgcggcac caacttcccc tccgacggcc ccgtaatgca gaagaagacc atgggctggg 1380tgcgcggcac caacttcccc tccgacggcc ccgtaatgca gaagaagacc atgggctggg 1380

aggcctcctc cgagcggatg taccccgagg acggcgccct gaagggcgag atcaagcaga 1440aggcctcctc cgagcggatg taccccgagg acggcgccct gaagggcgag atcaagcaga 1440

ggctgaagct gaaggacggc ggccactacg acgctgaggt caagaccacc tacaaggcca 1500ggctgaagct gaaggacggc ggccactacg acgctgaggt caagaccacc tacaaggcca 1500

agaagcccgt gcagctgccc ggcgcctaca acgtcaacat caagttggac atcacctccc 1560agaagcccgt gcagctgccc ggcgcctaca acgtcaacat caagttggac atcacctccc 1560

acaacgagga ctacaccatc gtggaacagt acgaacgcgc cgagggccgc cactccaccg 1620acaacgagga ctacaccatc gtggaacagt acgaacgcgc cgagggccgc cactccaccg 1620

gcggcatgga cgagctgtac aagtgatgaa agctttgctt tatttgtgaa atttgtgatg 1680gcggcatgga cgagctgtac aagtgatgaa agctttgctt tatttgtgaa atttgtgatg 1680

ctatgcttta tttgtaacca ttataagctg caataaacaa gtttaacaac aacaattgca 1740ctatgcttta tttgtaacca ttataagctg caataaacaa gtttaacaac aacaattgca 1740

ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagt aggtggggtc 1800ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagt aggtggggtc 1800

ggcggtcagg tgtcccagag ccaggggtct ggagggacct tccaccctca gtccctggca 1860ggcggtcagg tgtccgag ccaggggtct ggagggacct tccaccctca gtccctggca 1860

ggtcgggggg tgctgaggcg ggcctggccc tggcagccca ggggtcccgg agcgaggggt 1920ggtcgggggg tgctgaggcg ggcctggccc tggcagccca ggggtcccgg agcgaggggt 1920

ctggagggac ctttcactct cagtccctgg caggtcgggg ggtgctgtgg caggcccagc 1980ctggagggac ctttcactct cagtccctgg caggtcgggg ggtgctgtgg caggcccagc 1980

cttggccccc agctctgccc cttaccctga gctgtgtggc tttgggcagc tcgaactcct 2040cttggccccc agctctgccc cttaccctga gctgtgtggc tttgggcagc tcgaactcct 2040

gggttcctct ctgggcccca actcctcccc tggcccaagt cccctctttg ctcctgggca 2100gggttcctct ctgggcccca actcctcccc tggcccaagt cccctctttg ctcctgggca 2100

ggcaggacct ctgtcccctc tcagccggtc cttggggctg cgtgtttctg tagaatgacg 2160ggcaggacct ctgtcccctc tcagccggtc cttggggctg cgtgtttctg tagaatgacg 2160

ggtcaggctg gccagaaccc caaaccttgg ccgtggggag tctgcgtggc ggctctgcct 2220ggtcaggctg gccagaaccc caaaccttgg ccgtggggag tctgcgtggc ggctctgcct 2220

tgcccaggca tccttggtcc tcactcgagt tttcctaagg atgggatgag ccccatgtgg 22802280

gactaacctt ggctttacga cgtcaaagtt tagatgagct ggtgatattt ttctcattat 23402340

atccaaagtg tacctgttcg agtgaggaca gttcttctgt ctccaggata cgtagataag 2400atccaaagtg tacctgttcg agtgaggaca gttcttctgt ctccaggata cgtagataag 2400

tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc 2460tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt ggccactccc 2460

tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc 2520tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccggggc 2520

tttgcccggg cggcctcagt gagcgagcga gcgcgccagc tggcgtaata gcgaagaggc 2580tttgcccggg cggcctcagt gagcgagcga gcgcgccagc tggcgtaata gcgaagaggc 2580

ccgcaccgat cgcccttccc aacagttgcg cagcctgaat ggcgaatggc gattccgttg 2640ccgcaccgat cgcccttccc aacagttgcg cagcctgaat ggcgaatggc gattccgttg 2640

caatggctgg cggtaatatt gttctggata ttaccagcaa ggccgatagt ttgagttctt 2700caatggctgg cggtaatatt gttctggata ttaccagcaa ggccgatagt ttgagttctt 2700

ctactcaggc aagtgatgtt attactaatc aaagaagtat tgcgacaacg gttaatttgc 2760ctactcaggc aagtgatgtt attactaatc aaagaagtat tgcgacaacg gttaatttgc 2760

gtgatggaca gactctttta ctcggtggcc tcactgatta taaaaacact tctcaggatt 2820gtgatggaca gactctttta ctcggtggcc tcactgatta taaaaacact tctcaggatt 2820

ctggcgtacc gttcctgtct aaaatccctt taatcggcct cctgtttagc tcccgctctg 2880ctggcgtacc gttcctgtct aaaatccctt taatcggcct cctgtttagc tcccgctctg 2880

attctaacga ggaaagcacg ttatacgtgc tcgtcaaagc aaccatagta cgcgccctgt 29402940

agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 3000agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 3000

agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 3060agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 3060

tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 3120tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 3120

cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 3180cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga 3180

tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 3240tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 3240

caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg 33003300

ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt 3360ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt 3360

aacaaaatat taacgtttac aatttaaata tttgcttata caatcttcct gtttttgggg 34203420

cttttctgat tatcaaccgg ggtacatatg attgacatgc tagttttacg attaccgttc 3480cttttctgat tatcaaccgg ggtacatatg attgacatgc tagttttacg attaccgttc 3480

atcgattctc ttgtttgctc cagactctca ggcaatgacc tgatagcctt tgtagagacc 3540atcgattctc ttgtttgctc cagactctca ggcaatgacc tgatagcctt tgtagagacc 3540

tctcaaaaat agctaccctc tccggcatga atttatcagc tagaacggtt gaatatcata 3600tctcaaaaat agctaccctc tccggcatga atttatcagc tagaacggtt gaatatcata 3600

ttgatggtga tttgactgtc tccggccttt ctcacccgtt tgaatcttta cctacacatt 36603660

actcaggcat tgcatttaaa atatatgagg gttctaaaaa tttttatcct tgcgttgaaa 3720actcaggcat tgcatttaaa atatatgagg gttctaaaaa tttttatcct tgcgttgaaa 3720

taaaggcttc tcccgcaaaa gtattacagg gtcataatgt ttttggtaca accgatttag 3780taaaggcttc tcccgcaaaa gtattacagg gtcataatgt ttttggtaca accgatttag 3780

ctttatgctc tgaggcttta ttgcttaatt ttgctaattc tttgccttgc ctgtatgatt 3840ctttatgctc tgaggcttta ttgcttaatt ttgctaattc tttgccttgc ctgtatgatt 3840

tattggatgt tggaatcgcc tgatgcggta ttttctcctt acgcatctgt gcggtatttc 3900tattggatgt tggaatcgcc tgatgcggta ttttctcctt acgcatctgt gcggtatttc 3900

acaccgcata tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc 3960acaccgcata tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc 3960

ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc 4020ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc 4020

ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc 4080ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc 4080

accgaaacgc gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat 4140accgaaacgc gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat 4140

gataataatg gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc 4200gtaataatg gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc 4200

tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg 4260tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg 4260

ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc 4320ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc 4320

ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt 4380ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt 4380

gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct 4440gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct 4440

caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac 4500caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac 4500

ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact 4560ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt gacgccggggc aagagcaact 4560

cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa 4620cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa 4620

gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga 4680gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga 4680

taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt 4740taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt 4740

tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga 4800tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga 4800

agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg 4860agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg 4860

caaactatta actggcgaac tacttactct agcttcccgg caacaattaa tagactggat 4920caaactatta actggcgaac tacttactct agcttcccgg caacaattaa tagactggat 4920

ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat 4980ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat 4980

tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc 5040tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc 5040

agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga 5100agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga 5100

tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc 5160tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc 5160

agaccaagtt tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag 5220agaccaagtt tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag 5220

gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc 5280gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc 5280

gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt 5340gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt 5340

tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt 5400tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt 5400

gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat 5460gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat 5460

accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc 5520accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc 5520

accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa 5580accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa 5580

gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg 5640gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg 5640

ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag 5700ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag 5700

atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag 5760atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag 5760

gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa 58205820

cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt 58805880

gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg 5940gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg 5940

gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc 6000gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc 6000

tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac 6060tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac 6060

cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct 6120cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct 6120

ccccgcgcgt tggccgattc attaatg 6147ccccgcgcgt tggccgattc attaatg 6147

<210>59<210>59

<211>232<211>232

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Сделано в лаборатории<223>Lab made

<400>59<400>59

Met Gln Ile Pro Gln Ala Pro Trp Pro Val Val Trp Ala Val Leu GlnMet Gln Ile Pro Gln Ala Pro Trp Pro Val Val Trp Ala Val Leu Gln

1 5 10 15 1 5 10 15

Leu Gly Trp Arg Pro Gly Trp Phe Leu Asp Ser Pro Asp Arg Pro TrpLeu Gly Trp Arg Pro Gly Trp Phe Leu Asp Ser Pro Asp Arg Pro Trp

20 25 30 20 25 30

Asn Pro Pro Thr Phe Ser Pro Ala Leu Leu Val Val Thr Glu Gly AspAsn Pro Pro Thr Phe Ser Pro Ala Leu Leu Val Val Thr Glu Gly Asp

35 40 45 35 40 45

Asn Ala Thr Phe Thr Cys Ser Phe Ser Asn Thr Ser Glu Ser Phe ValAsn Ala Thr Phe Thr Cys Ser Phe Ser Asn Thr Ser Glu Ser Phe Val

50 55 60 50 55 60

Leu Asn Trp Tyr Arg Met Ser Pro Ser Asn Gln Thr Asp Lys Leu AlaLeu Asn Trp Tyr Arg Met Ser Pro Ser Asn Gln Thr Asp Lys Leu Ala

65 70 75 8065 70 75 80

Ala Phe Pro Glu Asp Arg Ser Gln Pro Gly Gln Asp Cys Arg Phe ArgAla Phe Pro Glu Asp Arg Ser Gln Pro Gly Gln Asp Cys Arg Phe Arg

85 90 95 85 90 95

Val Thr Gln Leu Pro Asn Gly Arg Asp Phe His Met Ser Val Val ArgVal Thr Gln Leu Pro Asn Gly Arg Asp Phe His Met Ser Val Val Arg

100 105 110 100 105 110

Ala Arg Arg Asn Asp Ser Gly Thr Tyr Leu Cys Gly Ala Ile Ser LeuAla Arg Arg Asn Asp Ser Gly Thr Tyr Leu Cys Gly Ala Ile Ser Leu

115 120 125 115 120 125

Ala Pro Lys Ala Gln Ile Lys Glu Ser Leu Arg Ala Glu Leu Arg ValAla Pro Lys Ala Gln Ile Lys Glu Ser Leu Arg Ala Glu Leu Arg Val

130 135 140 130 135 140

Thr Glu Arg Arg Ala Glu Val Pro Thr Ala His Pro Ser Pro Ser ProThr Glu Arg Arg Ala Glu Val Pro Thr Ala His Pro Ser Pro Ser Pro

145 150 155 160145 150 155 160

Arg Pro Ala Gly Gln Phe Gln Thr Leu Val Val Gly Val Val Gly GlyArg Pro Ala Gly Gln Phe Gln Thr Leu Val Val Gly Val Val Gly Gly

165 170 175 165 170 175

Leu Leu Gly Ser Leu Val Leu Leu Val Trp Val Leu Ala Val Ile ArgLeu Leu Gly Ser Leu Val Leu Leu Val Trp Val Leu Ala Val Ile Arg

180 185 190 180 185 190

Ser Lys Arg Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr ProSer Lys Arg Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr Pro

195 200 205 195 200 205

Arg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro ProArg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro Pro

210 215 220 210 215 220

Arg Asp Phe Ala Ala Tyr Arg SerArg Asp Phe Ala Ala Tyr Arg Ser

225 230 225 230

<210>60<210>60

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный вариант I-OnuI, PD-1.ile3.exon1_RD2_B1G2<223>Synthesized version of I-OnuI, PD-1.ile3.exon1_RD2_B1G2

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(4)<222>(1)..(4)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(302)..(303)<222>(302)..(303)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>60<400>60

Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Glu Ile Arg Asn ValGly Phe Ala Asp Ala Glu Gly Ser Phe Gln Leu Glu Ile Arg Asn Val

20 25 30 20 25 30

Asn Pro Asn Ile Pro Arg Tyr Lys Thr Arg Leu Arg Phe Glu Ile AspAsn Pro Asn Ile Pro Arg Tyr Lys Thr Arg Leu Arg Phe Glu Ile Asp

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Lys Ile Tyr Asn Gln Gly Asp Ser Tyr Val Lys Leu ArgLys Val Gly Lys Ile Tyr Asn Gln Gly Asp Ser Tyr Val Lys Leu Arg

65 70 75 8065 70 75 80

Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn AspLys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Leu Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Glu Gly His Phe Gly Val Ile Leu Ala Lys Arg Arg Pro Ala SerGly Glu Gly His Phe Gly Val Ile Leu Ala Lys Arg Arg Pro Ala Ser

180 185 190 180 185 190

Pro Val Gln Val Arg Leu Arg Phe Ala Ile Gly Gln His Ile Arg AspPro Val Gln Val Arg Leu Arg Phe Ala Ile Gly Gln His Ile Arg Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly Arg Ile

210 215 220 210 215 220

Arg Glu Lys Asn Ile Ser Glu Lys Ser Trp Leu Glu Phe Glu Val ThrArg Glu Lys Asn Ile Ser Glu Lys Ser Trp Leu Glu Phe Glu Val Thr

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa XaaGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa

290 295 300 290 295 300

<210>61<210>61

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный вариант I-OnuI, PD-1.ile3.exon1_RD3_B1G2C4<223>Synthesized version of I-OnuI, PD-1.ile3.exon1_RD3_B1G2C4

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(4)<222>(1)..(4)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(302)..(303)<222>(302)..(303)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>61<400>61

Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn ArgGly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn Arg

20 25 30 20 25 30

Asn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe Thr Ile MetAsn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe Thr Ile Met

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Ser Ile Leu Asn Asn Gly Asp His Tyr Val Ser Leu ValLys Val Gly Ser Ile Leu Asn Asn Gly Asp His Tyr Val Ser Leu Val

65 70 75 8065 70 75 80

Val Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn AspLys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn AlaGly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala

180 185 190 180 185 190

Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg AspArg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile

210 215 220 210 215 220

Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val GluTyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa XaaGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa

290 295 300 290 295 300

<210>62<210>62

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный вариант I-OnuI, PD-1.ile3.exon1_RD3_B1 G2C11<223>Synthesized version of I-OnuI, PD-1.ile3.exon1_RD3_B1 G2C11

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(4)<222>(1)..(4)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(302)..(303)<222>(302)..(303)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>62<400>62

Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn ArgGly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn Arg

20 25 30 20 25 30

Asn Arg Gly Thr Gly Arg Tyr His Thr Arg Leu Ser Phe Thr Ile MetAsn Arg Gly Thr Gly Arg Tyr His Thr Arg Leu Ser Phe Thr Ile Met

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Ser Ile Thr Asn Asn Gly Asp His Tyr Val Ser Leu ValLys Val Gly Ser Ile Thr Asn Asn Gly Asp His Tyr Val Ser Leu Val

65 70 75 8065 70 75 80

Val Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Tyr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn AspLys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn AlaGly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala

180 185 190 180 185 190

Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg AspArg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile

210 215 220 210 215 220

Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val GluTyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa XaaGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa

290 295 300 290 295 300

<210>63<210>63

<211>303<211>303

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированный вариант I-OnuI, PD-1.ile3.exon1_RD3_B1 G2C5<223>Synthesized version of I-OnuI, PD-1.ile3.exon1_RD3_B1 G2C5

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(1)..(4)<222>(1)..(4)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<220><220>

<221>MOD_RES<221>MOD_RES

<222>(302)..(303)<222>(302)..(303)

<223>Любая аминокислота или отсутствует<223>Any or missing amino acid

<400>63<400>63

Xaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu ThrXaa Xaa Xaa Xaa Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile Leu Thr

1 5 10 15 1 5 10 15

Gly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn ArgGly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu Asn Arg

20 25 30 20 25 30

Asn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe Thr Ile MetAsn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe Thr Ile Met

35 40 45 35 40 45

Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr TrpLeu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser Thr Trp

50 55 60 50 55 60

Lys Val Gly Ser Ile Tyr Asn Asn Gly Asp His Tyr Val Ser Leu GluLys Val Gly Ser Ile Tyr Asn Asn Gly Asp His Tyr Val Ser Leu Glu

65 70 75 8065 70 75 80

Val Phe Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu LysVal Phe Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe Glu Lys

85 90 95 85 90 95

Tyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys GlnTyr Pro Leu Ile Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe Lys Gln

100 105 110 100 105 110

Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly IleAla Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn Gly Ile

115 120 125 115 120 125

Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn AspLys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu Asn Asp

130 135 140 130 135 140

Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro LeuGlu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg Pro Leu

145 150 155 160145 150 155 160

Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr SerIle Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe Thr Ser

165 170 175 165 170 175

Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn AlaGly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val Asn Ala

180 185 190 180 185 190

Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg AspArg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile Arg Asp

195 200 205 195 200 205

Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His IleLys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly His Ile

210 215 220 210 215 220

Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val GluTyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg Val Glu

225 230 235 240225 230 235 240

Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu AsnLys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln Glu Asn

245 250 255 245 250 255

Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys ValThr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys Lys Val

260 265 270 260 265 270

Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu AspAla Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly Leu Asp

275 280 285 275 280 285

Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa XaaGlu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg Xaa Xaa

290 295 300 290 295 300

<210>64<210>64

<211>943<211>943

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная конструкция megaTAL PD-1.ile3.exon1_RD1_B1G2<223>Synthesized construct megaTAL PD-1.ile3.exon1_RD1_B1G2

<400>64<400>64

Met Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu ArgMet Gly Ser Ala Pro Pro Lys Lys Lys Arg Lys Val Val Asp Leu Arg

1 5 10 15 1 5 10 15

Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys ValThr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val

20 25 30 20 25 30

Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly PheArg Ser Thr Val Ala Gln His His Glu Ala Leu Val Gly His Gly Phe

35 40 45 35 40 45

Thr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu GlyThr His Ala His Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly

50 55 60 50 55 60

Thr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu AlaThr Val Ala Val Thr Tyr Gln His Ile Ile Thr Ala Leu Pro Glu Ala

65 70 75 8065 70 75 80

Thr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala ArgThr His Glu Asp Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg

85 90 95 85 90 95

Ala Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro ProAla Leu Glu Ala Leu Leu Thr Asp Ala Gly Glu Leu Arg Gly Pro Pro

100 105 110 100 105 110

Leu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly GlyLeu Gln Leu Asp Thr Gly Gln Leu Val Lys Ile Ala Lys Arg Gly Gly

115 120 125 115 120 125

Val Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr GlyVal Thr Ala Met Glu Ala Val His Ala Ser Arg Asn Ala Leu Thr Gly

130 135 140 130 135 140

Ala Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser AsnAla Pro Leu Asn Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

145 150 155 160145 150 155 160

Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro ValAsn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

165 170 175 165 170 175

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile AlaLeu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

180 185 190 180 185 190

Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu LeuSer Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

195 200 205 195 200 205

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val AlaPro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala

210 215 220 210 215 220

Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln ArgIle Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

225 230 235 240225 230 235 240

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln ValLeu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

245 250 255 245 250 255

Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr ValVal Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val

260 265 270 260 265 270

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro AspGln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp

275 280 285 275 280 285

Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu GluGln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu

290 295 300 290 295 300

Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu ThrThr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr

305 310 315 320305 310 315 320

Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln AlaPro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala

325 330 335 325 330 335

Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His GlyLeu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly

340 345 350 340 345 350

Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly LysLeu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys

355 360 365 355 360 365

Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln AspGln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp

370 375 380 370 375 380

His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp GlyHis Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly

385 390 395 400385 390 395 400

Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu CysGly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys

405 410 415 405 410 415

Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser AsnGln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn

420 425 430 420 425 430

Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro ValGly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val

435 440 445 435 440 445

Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile AlaLeu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala

450 455 460 450 455 460

Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu LeuSer Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu

465 470 475 480465 470 475 480

Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val AlaPro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala

485 490 495 485 490 495

Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln ArgIle Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg

500 505 510 500 505 510

Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln ValLeu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val

515 520 525 515 520 525

Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr ValVal Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val

530 535 540 530 535 540

Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro AspGln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp

545 550 555 560545 550 555 560

Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu GluGln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu

565 570 575 565 570 575

Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala LeuSer Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu

580 585 590 580 585 590

Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro AlaThr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala

595 600 605 595 600 605

Met Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile ArgMet Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg

610 615 620 610 615 620

Arg Val Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala IleArg Val Asn Arg Arg Ile Gly Glu Arg Thr Ser His Arg Val Ala Ile

625 630 635 640625 630 635 640

Ser Arg Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp IleSer Arg Val Gly Gly Ser Ser Arg Arg Glu Ser Ile Asn Pro Trp Ile

645 650 655 645 650 655

Leu Thr Gly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile LeuLeu Thr Gly Phe Ala Asp Ala Glu Gly Ser Phe Gly Leu Ser Ile Leu

660 665 670 660 665 670

Asn Arg Asn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe ThrAsn Arg Asn Arg Gly Thr Ala Arg Tyr His Thr Arg Leu Ser Phe Thr

675 680 685 675 680 685

Ile Met Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln SerIle Met Leu His Asn Lys Asp Lys Ser Ile Leu Glu Asn Ile Gln Ser

690 695 700 690 695 700

Thr Trp Lys Val Gly Ile Ile Thr Asn Asn Gly Asp His Tyr Val ThrThr Trp Lys Val Gly Ile Ile Thr Asn Asn Gly Asp His Tyr Val Thr

705 710 715 720705 710 715 720

Leu Arg Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His PheLeu Arg Val Thr Arg Phe Glu Asp Leu Lys Val Ile Ile Asp His Phe

725 730 735 725 730 735

Glu Lys Tyr Pro Leu Val Thr Gln Lys Leu Gly Asp Tyr Lys Leu PheGlu Lys Tyr Pro Leu Val Thr Gln Lys Leu Gly Asp Tyr Lys Leu Phe

740 745 750 740 745 750

Lys Gln Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu AsnLys Gln Ala Phe Ser Val Met Glu Asn Lys Glu His Leu Lys Glu Asn

755 760 765 755 760 765

Gly Ile Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly LeuGly Ile Lys Glu Leu Val Arg Ile Lys Ala Lys Met Asn Trp Gly Leu

770 775 780 770 775 780

Asn Asp Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu ArgAsn Asp Glu Leu Lys Lys Ala Phe Pro Glu Asn Ile Ser Lys Glu Arg

785 790 795 800785 790 795 800

Pro Leu Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly PhePro Leu Ile Asn Lys Asn Ile Pro Asn Phe Lys Trp Leu Ala Gly Phe

805 810 815 805 810 815

Thr Ser Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn ValThr Ser Gly Asp Gly Ser Phe Phe Val Arg Leu Arg Lys Ser Asn Val

820 825 830 820 825 830

Asn Ala Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His IleAsn Ala Arg Val Arg Val Gln Leu Val Phe Glu Ile Ser Gln His Ile

835 840 845 835 840 845

Arg Asp Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys GlyArg Asp Lys Asn Leu Met Asn Ser Leu Ile Thr Tyr Leu Gly Cys Gly

850 855 860 850 855 860

His Ile Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe ArgHis Ile Tyr Glu Gly Asn Lys Ser Glu Arg Ser Trp Leu Gln Phe Arg

865 870 875 880865 870 875 880

Val Glu Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe GlnVal Glu Lys Phe Ser Asp Ile Asn Asp Lys Ile Ile Pro Val Phe Gln

885 890 895 885 890 895

Glu Asn Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp CysGlu Asn Thr Leu Ile Gly Val Lys Leu Glu Asp Phe Glu Asp Trp Cys

900 905 910 900 905 910

Lys Val Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser GlyLys Val Ala Lys Leu Ile Glu Glu Lys Lys His Leu Thr Glu Ser Gly

915 920 925 915 920 925

Leu Asp Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly ArgLeu Asp Glu Ile Lys Lys Ile Lys Leu Asn Met Asn Lys Gly Arg

930 935 940 930 935 940

<210>65<210>65

<211>2832<211>2832

<212>РНК<212>RNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная конструкция мРНК megaTAL PD-1 Exon1 RD2_B1G2<223>Synthesized mRNA construct megaTAL PD-1 Exon1 RD2_B1G2

<400>65<400>65

augggaagcg cgccaccuaa gaagaaacgc aaagucgugg aucuacgcac gcucggcuac 60augggaagcg cgccaccuaa gaagaaacgc aaagucgugg aucuacgcac gcucggcuac 60

agucagcagc agcaagagaa gaucaaaccg aaggugcguu cgacaguggc gcagcaccac 120agucagcagc agcaagagaa gaucaaaccg aaggugcguu cgacaguggc gcagcaccac 120

gaggcacugg ugggccaugg guuuacacac gcgcacaucg uugcgcucag ccaacacccg 180gaggcacugg ugggccaugg guuuacacac gcgcacaucg uugcgcucag ccaacacccg 180

gcagcguuag ggaccgucgc ugucacguau cagcacauaa ucacggcguu gccagaggcg 240gcagcguuag ggaccgucgc ugucacguau cagcacauaa ucacggcguu gccagaggcg 240

acacacgaag acaucguugg cgucggcaaa cagugguccg gcgcacgcgc ccuggaggcc 300acacacgaag acaucguugg cgucggcaaa cagugguccg gcgcacgcgc ccuggaggcc 300

uugcucacgg augcggggga guugagaggu ccgccguuac aguuggacac aggccaacuu 360uugcucacgg augcggggga guugagaggu ccgccguuac aguuggacac aggccaacuu 360

gugaagauug caaaacgugg cggcgugacc gcaauggagg cagugcaugc aucgcgcaau 420gugaagauug caaaacgugg cggcgugacc gcaauggagg cagugcaugc aucgcgcaau 420

gcacugacgg gugccccccu gaaccuaacc ccugaucagg uagucgcuau agcuucaaac 480gcacugacgg gugccccccu gaaccuaacc ccugaucagg uagucgcuau agcuucaaac 480

aacgggggca agcaagcacu ggagaccguu caacgacucc ugccagugcu cugccaagac 540aacgggggca agcaagcacu ggagaccguu caacgacucc ugccagugcu cugccaagac 540

cacggacuua cgccagauca ggugguugcu auugccucca acaauggcgg gaaacaagcg 600cacggacuua cgccagauca ggugguugcu auugccucca acaauggcgg gaaacaagcg 600

uuggaaacug ugcagagacu guuaccuguc uugugucaag accacggccu cacgccagau 660660

caggugguag ccauagcguc gaauggaggu gguaagcaag cccuugaaac gguccagcgu 720caggugguag ccauagcguc gaauggaggu gguaagcaag cccuugaaac gguccagcgu 720

cuucugccgg uguugugcca ggaccacgga cuaacgccgg aucaggucgu agccauugcu 780cuucugccgg uguugugcca ggaccacggga cuaacgccgg aucaggucgu agccauugcu 780

ucaaauaacg gcggcaaaca ggcgcuagag acaguccagc gccucuugcc uguguuaugc 840ucaaauaacg gcggcaaaca ggcgcuagag acaguccagc gccucuugcc uguguuaugc 840

caggaucacg gcuuaacccc agaccaaguu guggcuauug caucuaacaa ugguggcaaa 900caggaucacg gcuuaacccc agaccaaguu guggcuauug cauuaacaa ugguggcaaa 900

caagccuugg agacagugca acgauuacug ccugucuuau gucaggauca uggccugacg 960caagccuugg agacagugca acgauuacug ccugucuuau gucaggauca uggccugacg 960

cccgaucagg uaguggcaau cgcaucuaau aauggaggua agcaagcacu ggagacuguc 1020cccgaucagg uaguggcaau cgcaucuaau aauggaggua agcaagcacu ggagacuguc 1020

cagagauugu uacccguacu augucaagau caugguuuga cgccugauca gguuguugcg 1080cagagauugu uacccguacu augucaagau caugguuuga cgccugauca gguuguugcg 1080

auagccagca acaacggagg gaaacaggcu cuugaaaccg uacagcgacu ucucccaguc 11401140

uugugccaag aucacgggcu uacuccugau caagucguag cuaucgccag ccacgacggu 1200uugugccaag aucacgggcu uacuccugau caagucguag cuaucgccag ccacgacggu 1200

gggaaacagg cccuggaaac cguacaacgu cuccucccag uacuuuguca agaccacggg 1260gggaaacagg cccuggaaac cguacaacgu cuccucccag uacuuuguca agaccacggg 1260

uugacuccgg aucaagucgu cgcgaucgcg agcaauggag gggggaagca ggcgcuggaa 1320uugacuccgg aucaagucgu cgcgaucgcg agcaauggag gggggaagca ggcgcuggaa 1320

acuguucaga gacugcugcc uguacuuugu caggaccaug gucugacacc ugaccaaguu 1380acuguucaga gacugcugcc uguacuuugu caggaccaug gucugacacc ugaccaaguu 1380

guggcgauag ccaguaacaa ugggggaaaa caggcacuag agacgguuca aagguuguug 1440guggcgauag ccaguaacaa ugggggaaaa caggcacuag agacgguuca aagguuguug 1440

cccguucugu gccaggacca cggcuugaca ccggaucagg ugguagcuau cgcuucacac 1500cccguucugu gccaggacca cggcuugaca ccggaucagg ugguagcuau cgcuucacac 1500

gauggcggaa aacaggcuuu agaaacaguc caaagacuuc ucccaguccu uugucaggac 15601560

cacggauuga cuccagauca agucguugcu auugcaagua augguggugg uaagcaagcu 1620cacggauuga cuccagauca agucguugcu auugcaagua augguggugg uaagcaagcu 1620

uuagaaaccg uacagaggcu uuugccagug cugugccagg accauggacu gaccccugau 16801680

caagugguag caauugcauc ucaugaugga ggaaaacaag cucuggaaag cauuguggcc 1740caagugguag caauugcauc ucaugaugga ggaaaacaag cucuggaaag cauuguggcc 1740

cagcugagcc ggccugaucc ggcguuggcc gcguugacca acgaccaccu cgucgccuug 1800cagcugagcc ggccugaucc ggcguuggcc gcguugacca acgaccaccu cgucgccuug 1800

gccugccucg gcggacgucc ugccauggau gcagugaaaa agggauugcc gcacgcgccg 1860gccugccucg gcggacgucc ugccauggau gcagugaaaa agggauugcc gcacgcgccg 1860

gaauugauca gaagagucaa ucgccguauu ggcgaacgca cgucccaucg cguugcgaua 1920gaauugauca gaagagucaa ucgccguauu ggcgaacgca cgucccaucg cguugcgaua 1920

ucuagagugg gaggaagcuc ucgcagagag uccaucaacc cauggauucu gacugguuuc 1980ucuagagugg gaggaagcuc ucgcagagag uccaucaacc cauggauucu gacugguuuc 1980

gcugaugccg aaggaucauu cgggcuaagc auccucaaca gaaacagagg uacugcuaga 2040gcugaugccg aaggaucauu cgggcuaagc auccucaaca gaaacagagg uacugcuaga 2040

uaccacacuc gacugucauu cacaaucaug cugcacaaca aggacaaauc gauucuggag 2100uaccacacuc gacugucauu cacaaucaug cugcacaaca aggacaaauc gauucuggag 2100

aauauccagu cgacuuggaa ggucggcaua aucaccaaca acggcgacca cuacgucacc 2160aauauccagu cgacuuggaa ggucggcaua aucaccaaca acggcgacca cuacgucacc 2160

cugcgcguca cccguuucga agauuugaaa gugauuaucg accacuucga gaaauauccg 2220cugcgcguca cccguuucga agauuugaaa gugauuaucg accacuucga gaaauauccg 2220

cugguaacac agaaauuggg cgauuacaag uuguuuaaac aggcauucag cgucauggag 2280cugguaacac agaaauuggg cgauuacaag uuguuuaaac aggcauucag cgucauggag 2280

aacaaagaac aucuuaagga gaaugggauu aaggagcucg uacgaaucaa agcuaagaug 2340aacaaagaac aucuuaagga gaaugggauu aaggagcucg

aauugggguc ucaaugacga auugaaaaaa gcauuuccag agaacauuag caaagagcgc 2400aauugggguc ucaugacga auugaaaaaa gcauuuccag agaacauuag caaagagcgc 2400

ccccuuauca auaagaacau uccgaauuuc aaauggcugg cuggauucac aucuggugau 2460ccccuuauca auaagaacau uccgaauuuc aaauggcugg cuggauucac aucggugau 2460

ggcuccuucu ucgugcgccu aagaaagucu aauguuaaug cuagaguacg ugugcaacug 2520ggcuccuucu ucgugcgccu aagaaagucu aauguuaaug cuagaguacg ugugcaacug 2520

guauucgaga ucucacagca caucagagac aagaaccuga ugaauucauu gauaacauac 2580guauucgaga ucucacagca caucagagac aagaaccuga ugaauucauu gauaacauac 2580

cuaggcugug gucacaucua cgagggaaac aaaucugagc gcaguuggcu ccaauucaga 2640cuaggcugug gucacaucua cgagggaaac aaauucugagc gcaguuggcu ccaauucaga 2640

guagaaaaau ucagcgauau caacgacaag aucauuccgg uauuccagga aaauacucug 2700guagaaaaau ucagcgauau caacgacaag aucauuccgg uauuccagga aaauacucug 2700

auuggcguca aacucgagga cuuugaagau uggugcaagg uugccaaauu gaucgaagag 27602760

aagaaacacc ugaccgaauc cgguuuggau gagauuaaga aaaucaagcu gaacaugaac 2820aagaaacacc ugaccgaauc cgguuuggau gagauuaaga aaaucaagcu gaacaugaac 2820

aaaggucguu ga 2832aaaggucguu ga 2832

<210>66<210>66

<211>2832<211>2832

<212>РНК<212>RNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная конструкция мРНК PD-1 Exon1 RD2_B1G2C4 megaTAL<223>Synthesized mRNA construct PD-1 Exon1 RD2_B1G2C4 megaTAL

<400>66<400>66

augggaagcg cgccaccuaa gaagaaacgc aaagucgugg aucuacgcac gcucggcuac 60augggaagcg cgccaccuaa gaagaaacgc aaagucgugg aucuacgcac gcucggcuac 60

agucagcagc agcaagagaa gaucaaaccg aaggugcguu cgacaguggc gcagcaccac 120agucagcagc agcaagagaa gaucaaaccg aaggugcguu cgacaguggc gcagcaccac 120

gaggcacugg ugggccaugg guuuacacac gcgcacaucg uugcgcucag ccaacacccg 180gaggcacugg ugggccaugg guuuacacac gcgcacaucg uugcgcucag ccaacacccg 180

gcagcguuag ggaccgucgc ugucacguau cagcacauaa ucacggcguu gccagaggcg 240gcagcguuag ggaccgucgc ugucacguau cagcacauaa ucacggcguu gccagaggcg 240

acacacgaag acaucguugg cgucggcaaa cagugguccg gcgcacgcgc ccuggaggcc 300acacacgaag acaucguugg cgucggcaaa cagugguccg gcgcacgcgc ccuggaggcc 300

uugcucacgg augcggggga guugagaggu ccgccguuac aguuggacac aggccaacuu 360uugcucacgg augcggggga guugagaggu ccgccguuac aguuggacac aggccaacuu 360

gugaagauug caaaacgugg cggcgugacc gcaauggagg cagugcaugc aucgcgcaau 420gugaagauug caaaacgugg cggcgugacc gcaauggagg cagugcaugc aucgcgcaau 420

gcacugacgg gugccccccu gaaccuaacc ccugaucagg uagucgcuau agcuucaaac 480gcacugacgg gugccccccu gaaccuaacc ccugaucagg uagucgcuau agcuucaaac 480

aacgggggca agcaagcacu ggagaccguu caacgacucc ugccagugcu cugccaagac 540aacgggggca agcaagcacu ggagaccguu caacgacucc ugccagugcu cugccaagac 540

cacggacuua cgccagauca ggugguugcu auugccucca acaauggcgg gaaacaagcg 600cacggacuua cgccagauca ggugguugcu auugccucca acaauggcgg gaaacaagcg 600

uuggaaacug ugcagagacu guuaccuguc uugugucaag accacggccu cacgccagau 660660

caggugguag ccauagcguc gaauggaggu gguaagcaag cccuugaaac gguccagcgu 720caggugguag ccauagcguc gaauggaggu gguaagcaag cccuugaaac gguccagcgu 720

cuucugccgg uguugugcca ggaccacgga cuaacgccgg aucaggucgu agccauugcu 780cuucugccgg uguugugcca ggaccacggga cuaacgccgg aucaggucgu agccauugcu 780

ucaaauaacg gcggcaaaca ggcgcuagag acaguccagc gccucuugcc uguguuaugc 840ucaaauaacg gcggcaaaca ggcgcuagag acaguccagc gccucuugcc uguguuaugc 840

caggaucacg gcuuaacccc agaccaaguu guggcuauug caucuaacaa ugguggcaaa 900caggaucacg gcuuaacccc agaccaaguu guggcuauug cauuaacaa ugguggcaaa 900

caagccuugg agacagugca acgauuacug ccugucuuau gucaggauca uggccugacg 960caagccuugg agacagugca acgauuacug ccugucuuau gucaggauca uggccugacg 960

cccgaucagg uaguggcaau cgcaucuaau aauggaggua agcaagcacu ggagacuguc 1020cccgaucagg uaguggcaau cgcaucuaau aauggaggua agcaagcacu ggagacuguc 1020

cagagauugu uacccguacu augucaagau caugguuuga cgccugauca gguuguugcg 1080cagagauugu uacccguacu augucaagau caugguuuga cgccugauca gguuguugcg 1080

auagccagca acaacggagg gaaacaggcu cuugaaaccg uacagcgacu ucucccaguc 11401140

uugugccaag aucacgggcu uacuccugau caagucguag cuaucgccag ccacgacggu 1200uugugccaag aucacgggcu uacuccugau caagucguag cuaucgccag ccacgacggu 1200

gggaaacagg cccuggaaac cguacaacgu cuccucccag uacuuuguca agaccacggg 1260gggaaacagg cccuggaaac cguacaacgu cuccucccag uacuuuguca agaccacggg 1260

uugacuccgg aucaagucgu cgcgaucgcg agcaauggag gggggaagca ggcgcuggaa 1320uugacuccgg aucaagucgu cgcgaucgcg agcaauggag gggggaagca ggcgcuggaa 1320

acuguucaga gacugcugcc uguacuuugu caggaccaug gucugacacc ugaccaaguu 1380acuguucaga gacugcugcc uguacuuugu caggaccaug gucugacacc ugaccaaguu 1380

guggcgauag ccaguaacaa ugggggaaaa caggcacuag agacgguuca aagguuguug 1440guggcgauag ccaguaacaa ugggggaaaa caggcacuag agacgguuca aagguuguug 1440

cccguucugu gccaggacca cggcuugaca ccggaucagg ugguagcuau cgcuucacac 1500cccguucugu gccaggacca cggcuugaca ccggaucagg ugguagcuau cgcuucacac 1500

gauggcggaa aacaggcuuu agaaacaguc caaagacuuc ucccaguccu uugucaggac 15601560

cacggauuga cuccagauca agucguugcu auugcaagua augguggugg uaagcaagcu 1620cacggauuga cuccagauca agucguugcu auugcaagua augguggugg uaagcaagcu 1620

uuagaaaccg uacagaggcu uuugccagug cugugccagg accauggacu gaccccugau 16801680

caagugguag caauugcauc ucaugaugga ggaaaacaag cucuggaaag cauuguggcc 1740caagugguag caauugcauc ucaugaugga ggaaaacaag cucuggaaag cauuguggcc 1740

cagcugagcc ggccugaucc ggcguuggcc gcguugacca acgaccaccu cgucgccuug 1800cagcugagcc ggccugaucc ggcguuggcc gcguugacca acgaccaccu cgucgccuug 1800

gccugccucg gcggacgucc ugccauggau gcagugaaaa agggauugcc gcacgcgccg 1860gccugccucg gcggacgucc ugccauggau gcagugaaaa agggauugcc gcacgcgccg 1860

gaauugauca gaagagucaa ucgccguauu ggcgaacgca cgucccaucg cguugcgaua 1920gaauugauca gaagagucaa ucgccguauu ggcgaacgca cgucccaucg cguugcgaua 1920

ucuagagugg gaggaagcuc ucgcagagag uccaucaacc cauggauucu gacugguuuc 1980ucuagagugg gaggaagcuc ucgcagagag uccaucaacc cauggauucu gacugguuuc 1980

gcugaugccg aaggaucauu cgggcuaagc auccucaaca gaaacagagg uacugcuaga 2040gcugaugccg aaggaucauu cgggcuaagc auccucaaca gaaacagagg uacugcuaga 2040

uaccacacuc gacugucauu cacaaucaug cugcacaaca aggacaaauc gauucuggag 2100uaccacacuc gacugucauu cacaaucaug cugcacaaca aggacaaauc gauucuggag 2100

aauauccagu cgacuuggaa ggucggcagc auccucaaca auggcgacca cuacgucucg 2160aauauccagu cgacuuggaa ggucggcagc auccucaaca auggcgacca cuacgucucg 2160

cugguggucu accguuucga agauuugaaa gugauuaucg accacuucga gaaauauccg 2220cuggggucu accguuucga agauuugaaa gugauuuaucg accacuucga gaaauauccg 2220

cugauaacac agaaauuggg cgauuacaag uuguuuaaac aggcauucag cgucauggag 2280cugauaacac agaaauuggg cgauuacaag uuguuuaaac aggcauucag cgucauggag 2280

aacaaagaac aucuuaagga gaaugggauu aaggagcucg uacgaaucaa agcuaagaug 2340aacaaagaac aucuuaagga gaaugggauu aaggagcucg

aauugggguc ucaaugacga auugaaaaaa gcauuuccag agaacauuag caaagagcgc 2400aauugggguc ucaugacga auugaaaaaa gcauuuccag agaacauuag caaagagcgc 2400

ccccuuauca auaagaacau uccgaauuuc aaauggcugg cuggauucac aucuggugau 2460ccccuuauca auaagaacau uccgaauuuc aaauggcugg cuggauucac aucggugau 2460

ggcuccuucu ucgugcgccu aagaaagucu aauguuaaug cuagaguacg ugugcaacug 2520ggcuccuucu ucgugcgccu aagaaagucu aauguuaaug cuagaguacg ugugcaacug 2520

guauucgaga ucucacagca caucagagac aagaaccuga ugaauucauu gauaacauac 2580guauucgaga ucucacagca caucagagac aagaaccuga ugaauucauu gauaacauac 2580

cuaggcugug gucacaucua cgagggaaac aaaucugagc gcaguuggcu ccaauucaga 2640cuaggcugug gucacaucua cgagggaaac aaauucugagc gcaguuggcu ccaauucaga 2640

guagaaaaau ucagcgauau caacgacaag aucauuccgg uauuccagga aaauacucug 2700guagaaaaau ucagcgauau caacgacaag aucauuccgg uauuccagga aaauacucug 2700

auuggcguca aacucgagga cuuugaagau uggugcaagg uugccaaauu gaucgaagag 27602760

aagaaacacc ugaccgaauc cgguuuggau gagauuaaga aaaucaagcu gaacaugaac 2820aagaaacacc ugaccgaauc cgguuuggau gagauuaaga aaaucaagcu gaacaugaac 2820

aaaggucguu ga 2832aaaggucguu ga 2832

<210>67<210>67

<211>2832<211>2832

<212>РНК<212>RNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная конструкция мРНК megaTAL PD-1 Exon1 RD2_B1G2C11<223>Synthesized mRNA construct megaTAL PD-1 Exon1 RD2_B1G2C11

<400>67<400>67

augggaagcg cgccaccuaa gaagaaacgc aaagucgugg aucuacgcac gcucggcuac 60augggaagcg cgccaccuaa gaagaaacgc aaagucgugg aucuacgcac gcucggcuac 60

agucagcagc agcaagagaa gaucaaaccg aaggugcguu cgacaguggc gcagcaccac 120agucagcagc agcaagagaa gaucaaaccg aaggugcguu cgacaguggc gcagcaccac 120

gaggcacugg ugggccaugg guuuacacac gcgcacaucg uugcgcucag ccaacacccg 180gaggcacugg ugggccaugg guuuacacac gcgcacaucg uugcgcucag ccaacacccg 180

gcagcguuag ggaccgucgc ugucacguau cagcacauaa ucacggcguu gccagaggcg 240gcagcguuag ggaccgucgc ugucacguau cagcacauaa ucacggcguu gccagaggcg 240

acacacgaag acaucguugg cgucggcaaa cagugguccg gcgcacgcgc ccuggaggcc 300acacacgaag acaucguugg cgucggcaaa cagugguccg gcgcacgcgc ccuggaggcc 300

uugcucacgg augcggggga guugagaggu ccgccguuac aguuggacac aggccaacuu 360uugcucacgg augcggggga guugagaggu ccgccguuac aguuggacac aggccaacuu 360

gugaagauug caaaacgugg cggcgugacc gcaauggagg cagugcaugc aucgcgcaau 420gugaagauug caaaacgugg cggcgugacc gcaauggagg cagugcaugc aucgcgcaau 420

gcacugacgg gugccccccu gaaccuaacc ccugaucagg uagucgcuau agcuucaaac 480gcacugacgg gugccccccu gaaccuaacc ccugaucagg uagucgcuau agcuucaaac 480

aacgggggca agcaagcacu ggagaccguu caacgacucc ugccagugcu cugccaagac 540aacgggggca agcaagcacu ggagaccguu caacgacucc ugccagugcu cugccaagac 540

cacggacuua cgccagauca ggugguugcu auugccucca acaauggcgg gaaacaagcg 600cacggacuua cgccagauca ggugguugcu auugccucca acaauggcgg gaaacaagcg 600

uuggaaacug ugcagagacu guuaccuguc uugugucaag accacggccu cacgccagau 660660

caggugguag ccauagcguc gaauggaggu gguaagcaag cccuugaaac gguccagcgu 720caggugguag ccauagcguc gaauggaggu gguaagcaag cccuugaaac gguccagcgu 720

cuucugccgg uguugugcca ggaccacgga cuaacgccgg aucaggucgu agccauugcu 780cuucugccgg uguugugcca ggaccacggga cuaacgccgg aucaggucgu agccauugcu 780

ucaaauaacg gcggcaaaca ggcgcuagag acaguccagc gccucuugcc uguguuaugc 840ucaaauaacg gcggcaaaca ggcgcuagag acaguccagc gccucuugcc uguguuaugc 840

caggaucacg gcuuaacccc agaccaaguu guggcuauug caucuaacaa ugguggcaaa 900caggaucacg gcuuaacccc agaccaaguu guggcuauug cauuaacaa ugguggcaaa 900

caagccuugg agacagugca acgauuacug ccugucuuau gucaggauca uggccugacg 960caagccuugg agacagugca acgauuacug ccugucuuau gucaggauca uggccugacg 960

cccgaucagg uaguggcaau cgcaucuaau aauggaggua agcaagcacu ggagacuguc 1020cccgaucagg uaguggcaau cgcaucuaau aauggaggua agcaagcacu ggagacuguc 1020

cagagauugu uacccguacu augucaagau caugguuuga cgccugauca gguuguugcg 1080cagagauugu uacccguacu augucaagau caugguuuga cgccugauca gguuguugcg 1080

auagccagca acaacggagg gaaacaggcu cuugaaaccg uacagcgacu ucucccaguc 11401140

uugugccaag aucacgggcu uacuccugau caagucguag cuaucgccag ccacgacggu 1200uugugccaag aucacgggcu uacuccugau caagucguag cuaucgccag ccacgacggu 1200

gggaaacagg cccuggaaac cguacaacgu cuccucccag uacuuuguca agaccacggg 1260gggaaacagg cccuggaaac cguacaacgu cuccucccag uacuuuguca agaccacggg 1260

uugacuccgg aucaagucgu cgcgaucgcg agcaauggag gggggaagca ggcgcuggaa 1320uugacuccgg aucaagucgu cgcgaucgcg agcaauggag gggggaagca ggcgcuggaa 1320

acuguucaga gacugcugcc uguacuuugu caggaccaug gucugacacc ugaccaaguu 1380acuguucaga gacugcugcc uguacuuugu caggaccaug gucugacacc ugaccaaguu 1380

guggcgauag ccaguaacaa ugggggaaaa caggcacuag agacgguuca aagguuguug 1440guggcgauag ccaguaacaa ugggggaaaa caggcacuag agacgguuca aagguuguug 1440

cccguucugu gccaggacca cggcuugaca ccggaucagg ugguagcuau cgcuucacac 1500cccguucugu gccaggacca cggcuugaca ccggaucagg ugguagcuau cgcuucacac 1500

gauggcggaa aacaggcuuu agaaacaguc caaagacuuc ucccaguccu uugucaggac 15601560

cacggauuga cuccagauca agucguugcu auugcaagua augguggugg uaagcaagcu 1620cacggauuga cuccagauca agucguugcu auugcaagua augguggugg uaagcaagcu 1620

uuagaaaccg uacagaggcu uuugccagug cugugccagg accauggacu gaccccugau 16801680

caagugguag caauugcauc ucaugaugga ggaaaacaag cucuggaaag cauuguggcc 1740caagugguag caauugcauc ucaugaugga ggaaaacaag cucuggaaag cauuguggcc 1740

cagcugagcc ggccugaucc ggcguuggcc gcguugacca acgaccaccu cgucgccuug 1800cagcugagcc ggccugaucc ggcguuggcc gcguugacca acgaccaccu cgucgccuug 1800

gccugccucg gcggacgucc ugccauggau gcagugaaaa agggauugcc gcacgcgccg 1860gccugccucg gcggacgucc ugccauggau gcagugaaaa agggauugcc gcacgcgccg 1860

gaauugauca gaagagucaa ucgccguauu ggcgaacgca cgucccaucg cguugcgaua 1920gaauugauca gaagagucaa ucgccguauu ggcgaacgca cgucccaucg cguugcgaua 1920

ucuagagugg gaggaagcuc ucgcagagag uccaucaacc cauggauucu gacugguuuc 1980ucuagagugg gaggaagcuc ucgcagagag uccaucaacc cauggauucu gacugguuuc 1980

gcugaugccg aaggaucauu cgggcuaagc auccucaaca gaaacagagg uacugguaga 2040gcugaugccg aaggaucauu cgggcuaagc auccucaaca gaaacagagg uacugguaga 2040

uaccacacuc gacugucauu cacaaucaug cugcacaaca aggacaaauc gauucuggag 2100uaccacacuc gacugucauu cacaaucaug cugcacaaca aggacaaauc gauucuggag 2100

aauauccagu cgacuuggaa ggucggcucg aucacgaaca acggcgacca cuacgucagc 2160aauauccagu cgacuuggaa ggucggcucg aucacgaaca acggcgacca cuacgucagc 2160

cuggucgucu accguuucga agauuugaaa gugauuaucg accacuucga gaaauauccg 2220cuggucgucu accguuucga agauuugaaa gugauuaucg accacuucga gaaauauccg 2220

cugauaacac agaaauuggg cgauuacaag uuguuuaaac aggcauucag cgucauggag 2280cugauaacac agaaauuggg cgauuacaag uuguuuaaac aggcauucag cgucauggag 2280

aacaaagaac aucuuaagga gaaugggauu aaggagcucg uacgaaucaa agcuaagaug 2340aacaaagaac aucuuaagga gaaugggauu aaggagcucg

aauugggguc ucaaugacga auugaaaaaa gcauuuccag agaacauuag caaagagcgc 2400aauugggguc ucaugacga auugaaaaaa gcauuuccag agaacauuag caaagagcgc 2400

ccccuuauca auaagaacau uccgaauuuc aaauggcugg cuggauucac aucuggugau 2460ccccuuauca auaagaacau uccgaauuuc aaauggcugg cuggauucac aucggugau 2460

ggcuccuucu ucgugcgccu aagaaagucu aauguuaaug cuagaguacg ugugcaacug 2520ggcuccuucu ucgugcgccu aagaaagucu aauguuaaug cuagaguacg ugugcaacug 2520

guauucgaga ucucacagca caucagagac aagaaccuga ugaauucauu gauaacauac 2580guauucgaga ucucacagca caucagagac aagaaccuga ugaauucauu gauaacauac 2580

cuaggcugug gucacaucua cgagggaaac aaaucugagc gcaguuggcu ccaauucaga 2640cuaggcugug gucacaucua cgagggaaac aaauucugagc gcaguuggcu ccaauucaga 2640

guagaaaaau ucagcgauau caacgacaag aucauuccgg uauuccagga aaauacucug 2700guagaaaaau ucagcgauau caacgacaag aucauuccgg uauuccagga aaauacucug 2700

auuggcguca aacucgagga cuuugaagau uggugcaagg uugccaaauu gaucgaagag 27602760

aagaaacacc ugaccgaauc cgguuuggau gagauuaaga aaaucaagcu gaacaugaac 2820aagaaacacc ugaccgaauc cgguuuggau gagauuaaga aaaucaagcu gaacaugaac 2820

aaaggucguu ga 2832aaaggucguu ga 2832

<210>68<210>68

<211>2832<211>2832

<212>РНК<212>RNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Синтезированная конструкция мРНК megaTAL PD-1 Exon1 RD2_B1G2C5<223>Synthesized mRNA construct megaTAL PD-1 Exon1 RD2_B1G2C5

<400>68<400>68

augggaagcg cgccaccuaa gaagaaacgc aaagucgugg aucuacgcac gcucggcuac 60augggaagcg cgccaccuaa gaagaaacgc aaagucgugg aucuacgcac gcucggcuac 60

agucagcagc agcaagagaa gaucaaaccg aaggugcguu cgacaguggc gcagcaccac 120agucagcagc agcaagagaa gaucaaaccg aaggugcguu cgacaguggc gcagcaccac 120

gaggcacugg ugggccaugg guuuacacac gcgcacaucg uugcgcucag ccaacacccg 180gaggcacugg ugggccaugg guuuacacac gcgcacaucg uugcgcucag ccaacacccg 180

gcagcguuag ggaccgucgc ugucacguau cagcacauaa ucacggcguu gccagaggcg 240gcagcguuag ggaccgucgc ugucacguau cagcacauaa ucacggcguu gccagaggcg 240

acacacgaag acaucguugg cgucggcaaa cagugguccg gcgcacgcgc ccuggaggcc 300acacacgaag acaucguugg cgucggcaaa cagugguccg gcgcacgcgc ccuggaggcc 300

uugcucacgg augcggggga guugagaggu ccgccguuac aguuggacac aggccaacuu 360uugcucacgg augcggggga guugagaggu ccgccguuac aguuggacac aggccaacuu 360

gugaagauug caaaacgugg cggcgugacc gcaauggagg cagugcaugc aucgcgcaau 420gugaagauug caaaacgugg cggcgugacc gcaauggagg cagugcaugc aucgcgcaau 420

gcacugacgg gugccccccu gaaccuaacc ccugaucagg uagucgcuau agcuucaaac 480gcacugacgg gugccccccu gaaccuaacc ccugaucagg uagucgcuau agcuucaaac 480

aacgggggca agcaagcacu ggagaccguu caacgacucc ugccagugcu cugccaagac 540aacgggggca agcaagcacu ggagaccguu caacgacucc ugccagugcu cugccaagac 540

cacggacuua cgccagauca ggugguugcu auugccucca acaauggcgg gaaacaagcg 600cacggacuua cgccagauca ggugguugcu auugccucca acaauggcgg gaaacaagcg 600

uuggaaacug ugcagagacu guuaccuguc uugugucaag accacggccu cacgccagau 660660

caggugguag ccauagcguc gaauggaggu gguaagcaag cccuugaaac gguccagcgu 720caggugguag ccauagcguc gaauggaggu gguaagcaag cccuugaaac gguccagcgu 720

cuucugccgg uguugugcca ggaccacgga cuaacgccgg aucaggucgu agccauugcu 780cuucugccgg uguugugcca ggaccacggga cuaacgccgg aucaggucgu agccauugcu 780

ucaaauaacg gcggcaaaca ggcgcuagag acaguccagc gccucuugcc uguguuaugc 840ucaaauaacg gcggcaaaca ggcgcuagag acaguccagc gccucuugcc uguguuaugc 840

caggaucacg gcuuaacccc agaccaaguu guggcuauug caucuaacaa ugguggcaaa 900caggaucacg gcuuaacccc agaccaaguu guggcuauug cauuaacaa ugguggcaaa 900

caagccuugg agacagugca acgauuacug ccugucuuau gucaggauca uggccugacg 960caagccuugg agacagugca acgauuacug ccugucuuau gucaggauca uggccugacg 960

cccgaucagg uaguggcaau cgcaucuaau aauggaggua agcaagcacu ggagacuguc 1020cccgaucagg uaguggcaau cgcaucuaau aauggaggua agcaagcacu ggagacuguc 1020

cagagauugu uacccguacu augucaagau caugguuuga cgccugauca gguuguugcg 1080cagagauugu uacccguacu augucaagau caugguuuga cgccugauca gguuguugcg 1080

auagccagca acaacggagg gaaacaggcu cuugaaaccg uacagcgacu ucucccaguc 11401140

uugugccaag aucacgggcu uacuccugau caagucguag cuaucgccag ccacgacggu 1200uugugccaag aucacgggcu uacuccugau caagucguag cuaucgccag ccacgacggu 1200

gggaaacagg cccuggaaac cguacaacgu cuccucccag uacuuuguca agaccacggg 1260gggaaacagg cccuggaaac cguacaacgu cuccucccag uacuuuguca agaccacggg 1260

uugacuccgg aucaagucgu cgcgaucgcg agcaauggag gggggaagca ggcgcuggaa 1320uugacuccgg aucaagucgu cgcgaucgcg agcaauggag gggggaagca ggcgcuggaa 1320

acuguucaga gacugcugcc uguacuuugu caggaccaug gucugacacc ugaccaaguu 1380acuguucaga gacugcugcc uguacuuugu caggaccaug gucugacacc ugaccaaguu 1380

guggcgauag ccaguaacaa ugggggaaaa caggcacuag agacgguuca aagguuguug 1440guggcgauag ccaguaacaa ugggggaaaa caggcacuag agacgguuca aagguuguug 1440

cccguucugu gccaggacca cggcuugaca ccggaucagg ugguagcuau cgcuucacac 1500cccguucugu gccaggacca cggcuugaca ccggaucagg ugguagcuau cgcuucacac 1500

gauggcggaa aacaggcuuu agaaacaguc caaagacuuc ucccaguccu uugucaggac 15601560

cacggauuga cuccagauca agucguugcu auugcaagua augguggugg uaagcaagcu 1620cacggauuga cuccagauca agucguugcu auugcaagua augguggugg uaagcaagcu 1620

uuagaaaccg uacagaggcu uuugccagug cugugccagg accauggacu gaccccugau 16801680

caagugguag caauugcauc ucaugaugga ggaaaacaag cucuggaaag cauuguggcc 1740caagugguag caauugcauc ucaugaugga ggaaaacaag cucuggaaag cauuguggcc 1740

cagcugagcc ggccugaucc ggcguuggcc gcguugacca acgaccaccu cgucgccuug 1800cagcugagcc ggccugaucc ggcguuggcc gcguugacca acgaccaccu cgucgccuug 1800

gccugccucg gcggacgucc ugccauggau gcagugaaaa agggauugcc gcacgcgccg 1860gccugccucg gcggacgucc ugccauggau gcagugaaaa agggauugcc gcacgcgccg 1860

gaauugauca gaagagucaa ucgccguauu ggcgaacgca cgucccaucg cguugcgaua 1920gaauugauca gaagagucaa ucgccguauu ggcgaacgca cgucccaucg cguugcgaua 1920

ucuagagugg gaggaagcuc ucgcagagag uccaucaacc cauggauucu gacugguuuc 1980ucuagagugg gaggaagcuc ucgcagagag uccaucaacc cauggauucu gacugguuuc 1980

gcugaugccg aaggaucauu cgggcuaagc auccucaaca gaaacagagg uacugcuaga 2040gcugaugccg aaggaucauu cgggcuaagc auccucaaca gaaacagagg uacugcuaga 2040

uaccacacuc gacugucauu cacaaucaug cugcacaaca aggacaaauc gauucuggag 2100uaccacacuc gacugucauu cacaaucaug cugcacaaca aggacaaauc gauucuggag 2100

aauauccagu cgacuuggaa ggucggcucg aucuacaaca acggcgacca cuacgucucg 2160aauauccagu cgacuuggaa ggucggcucg aucuacaaca acggcgacca cuacgucucg 2160

cuggaggucu uccguuucga agauuugaaa gugauuaucg accacuucga gaaauauccg 2220cuggaggucu uccguuucga agauuugaaa gugauuaucg accacuucga gaaauauccg 2220

cugauaacac agaaauuggg cgauuacaag uuguuuaaac aggcauucag cgucauggag 2280cugauaacac agaaauuggg cgauuacaag uuguuuaaac aggcauucag cgucauggag 2280

aacaaagaac aucuuaagga gaaugggauu aaggagcucg uacgaaucaa agcuaagaug 2340aacaaagaac aucuuaagga gaaugggauu aaggagcucg

aauugggguc ucaaugacga auugaaaaaa gcauuuccag agaacauuag caaagagcgc 2400aauugggguc ucaugacga auugaaaaaa gcauuuccag agaacauuag caaagagcgc 2400

ccccuuauca auaagaacau uccgaauuuc aaauggcugg cuggauucac aucuggugau 2460ccccuuauca auaagaacau uccgaauuuc aaauggcugg cuggauucac aucggugau 2460

ggcuccuucu ucgugcgccu aagaaagucu aauguuaaug cuagaguacg ugugcaacug 2520ggcuccuucu ucgugcgccu aagaaagucu aauguuaaug cuagaguacg ugugcaacug 2520

guauucgaga ucucacagca caucagagac aagaaccuga ugaauucauu gauaacauac 2580guauucgaga ucucacagca caucagagac aagaaccuga ugaauucauu gauaacauac 2580

cuaggcugug gucacaucua cgagggaaac aaaucugagc gcaguuggcu ccaauucaga 2640cuaggcugug gucacaucua cgagggaaac aaauucugagc gcaguuggcu ccaauucaga 2640

guagaaaaau ucagcgauau caacgacaag aucauuccgg uauuccagga aaauacucug 2700guagaaaaau ucagcgauau caacgacaag aucauuccgg uauuccagga aaauacucug 2700

auuggcguca aacucgagga cuuugaagau uggugcaagg uugccaaauu gaucgaagag 27602760

aagaaacacc ugaccgaauc cgguuuggau gagauuaaga aaaucaagcu gaacaugaac 2820aagaaacacc ugaccgaauc cgguuuggau gagauuaaga aaaucaagcu gaacaugaac 2820

aaaggucguu ga 2832aaaggucguu ga 2832

<210>69<210>69

<211>3<211>3

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Иллюстративная линкерная последовательность<223>Exemplary linker sequence

<400>69<400>69

Gly Gly GlyGly Gly Gly

1 one

<210>70<210>70

<211>5<211>5

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Иллюстративная линкерная последовательность<223>Exemplary linker sequence

<400>70<400>70

Asp Gly Gly Gly SerAsp Gly Gly Gly Ser

1 5 fifteen

<210>71<210>71

<211>5<211>5

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Иллюстративная линкерная последовательность<223>Exemplary linker sequence

<400>71<400>71

Thr Gly Glu Lys ProThr Gly Glu Lys Pro

1 5 fifteen

<210>72<210>72

<211>4<211>4

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Иллюстративная линкерная последовательность<223>Exemplary linker sequence

<400>72<400>72

Gly Gly Arg ArgGly Gly Arg Arg

1 one

<210>73<210>73

<211>5<211>5

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Иллюстративная линкерная последовательность<223>Exemplary linker sequence

<400>73<400>73

Gly Gly Gly Gly SerGly Gly Gly Gly Ser

1 5 fifteen

<210>74<210>74

<211>14<211>14

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Иллюстративная линкерная последовательность<223>Exemplary linker sequence

<400>74<400>74

Glu Gly Lys Ser Ser Gly Ser Gly Ser Glu Ser Lys Val AspGlu Gly Lys Ser Ser Gly Ser Gly Ser Glu Ser Lys Val Asp

1 5 10 1 5 10

<210>75<210>75

<211>18<211>18

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Иллюстративная линкерная последовательность<223>Exemplary linker sequence

<400>75<400>75

Lys Glu Ser Gly Ser Val Ser Ser Glu Gln Leu Ala Gln Phe Arg SerLys Glu Ser Gly Ser Val Ser Ser Glu Gln Leu Ala Gln Phe Arg Ser

1 5 10 15 1 5 10 15

Leu AspLeu Asp

<210>76<210>76

<211>8<211>8

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Иллюстративная линкерная последовательность<223>Exemplary linker sequence

<400>76<400>76

Gly Gly Arg Arg Gly Gly Gly SerGly Gly Arg Arg Gly Gly Gly Ser

1 5 fifteen

<210>77<210>77

<211>9<211>9

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Иллюстративная линкерная последовательность<223>Exemplary linker sequence

<400>77<400>77

Leu Arg Gln Arg Asp Gly Glu Arg ProLeu Arg Gln Arg Asp Gly Glu Arg Pro

1 5 fifteen

<210>78<210>78

<211>12<211>12

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Иллюстративная линкерная последовательность<223>Exemplary linker sequence

<400>78<400>78

Leu Arg Gln Lys Asp Gly Gly Gly Ser Glu Arg ProLeu Arg Gln Lys Asp Gly Gly Gly Ser Glu Arg Pro

1 5 10 1 5 10

<210>79<210>79

<211>16<211>16

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Иллюстративная линкерная последовательность<223>Exemplary linker sequence

<400>79<400>79

Leu Arg Gln Lys Asp Gly Gly Gly Ser Gly Gly Gly Ser Glu Arg ProLeu Arg Gln Lys Asp Gly Gly Gly Ser Gly Gly Gly Ser Glu Arg Pro

1 5 10 15 1 5 10 15

<210>80<210>80

<211>7<211>7

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Cleavage sequence by TEV protease<223>Cleavage sequence by TEV protease

<220><220>

<221>прочий_признак<221>other_characteristic

<222>(2)..(3)<222>(2)..(3)

<223>Xaa - любая аминокислота<223>Xaa - any amino acid

<220><220>

<221>прочий_признак<221>other_characteristic

<222>(5)..(5)<222>(5)..(5)

<223>Xaa - любая аминокислота<223>Xaa - any amino acid

<220><220>

<221>ПРОЧИЙ_ПРИЗНАК<221>OTHER_SIGNIFICANT

<222>(7)..(7)<222>(7)..(7)

<223>Xaa=Gly или Ser<223>Xaa=Gly or Ser

<400>80<400>80

Glu Xaa Xaa Tyr Xaa Gln XaaGlu Xaa Xaa Tyr Xaa Gln Xaa

1 5 fifteen

<210>81<210>81

<211>7<211>7

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Последовательность сайта расщепления протеазой TEV<223>TEV protease cleavage site sequence

<400>81<400>81

Glu Asn Leu Tyr Phe Gln GlyGlu Asn Leu Tyr Phe Gln Gly

1 5 fifteen

<210>82<210>82

<211>7<211>7

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Последовательность сайта расщепления протеазой TEV<223>TEV protease cleavage site sequence

<400>82<400>82

Glu Asn Leu Tyr Phe Gln SerGlu Asn Leu Tyr Phe Gln Ser

1 5 fifteen

<210>83<210>83

<211>22<211>22

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>83<400>83

Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp ValGly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val

1 5 10 15 1 5 10 15

Glu Glu Asn Pro Gly ProGlu Glu Asn Pro Gly Pro

20 twenty

<210>84<210>84

<211>19<211>19

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>84<400>84

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu AsnAla Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn

1 5 10 15 1 5 10 15

Pro Gly ProPro Gly Pro

<210>85<210>85

<211>14<211>14

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>85<400>85

Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly ProLeu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro

1 5 10 1 5 10

<210>86<210>86

<211>21<211>21

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>86<400>86

Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val GluGly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu

1 5 10 15 1 5 10 15

Glu Asn Pro Gly ProGlu Asn Pro Gly Pro

20 twenty

<210>87<210>87

<211>18<211>18

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>87<400>87

Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn ProGlu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro

1 5 10 15 1 5 10 15

Gly ProGlyPro

<210>88<210>88

<211>13<211>13

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>88<400>88

Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly ProLeu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro

1 5 10 1 5 10

<210>89<210>89

<211>23<211>23

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>89<400>89

Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly AspGly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp

1 5 10 15 1 5 10 15

Val Glu Ser Asn Pro Gly ProVal Glu Ser Asn Pro Gly Pro

20 twenty

<210>90<210>90

<211>20<211>20

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>90<400>90

Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu SerGln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser

1 5 10 15 1 5 10 15

Asn Pro Gly ProAsn Pro Gly Pro

20 twenty

<210>91<210>91

<211>14<211>14

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>91<400>91

Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly ProLeu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro

1 5 10 1 5 10

<210>92<210>92

<211>25<211>25

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>92<400>92

Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu AlaGly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala

1 5 10 15 1 5 10 15

Gly Asp Val Glu Ser Asn Pro Gly ProGly Asp Val Glu Ser Asn Pro Gly Pro

20 25 20 25

<210>93<210>93

<211>22<211>22

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>93<400>93

Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp ValVal Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val

1 5 10 15 1 5 10 15

Glu Ser Asn Pro Gly ProGlu Ser Asn Pro Gly Pro

20 twenty

<210>94<210>94

<211>14<211>14

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>94<400>94

Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly ProLeu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro

1 5 10 1 5 10

<210>95<210>95

<211>19<211>19

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>95<400>95

Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser AsnLeu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn

1 5 10 15 1 5 10 15

Pro Gly ProPro Gly Pro

<210>96<210>96

<211>19<211>19

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>96<400>96

Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser AsnThr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn

1 5 10 15 1 5 10 15

Pro Gly ProPro Gly Pro

<210>97<210>97

<211>14<211>14

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>97<400>97

Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly ProLeu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro

1 5 10 1 5 10

<210>98<210>98

<211>17<211>17

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>98<400>98

Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro GlyAsn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly

1 5 10 15 1 5 10 15

ProPro

<210>99<210>99

<211>20<211>20

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>99<400>99

Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu SerGln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser

1 5 10 15 1 5 10 15

Asn Pro Gly ProAsn Pro Gly Pro

20 twenty

<210>100<210>100

<211>24<211>24

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>100<400>100

Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala GlyAla Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly

1 5 10 15 1 5 10 15

Asp Val Glu Ser Asn Pro Gly ProAsp Val Glu Ser Asn Pro Gly Pro

20 twenty

<210>101<210>101

<211>40<211>40

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>101<400>101

Val Thr Glu Leu Leu Tyr Arg Met Lys Arg Ala Glu Thr Tyr Cys ProVal Thr Glu Leu Leu Tyr Arg Met Lys Arg Ala Glu Thr Tyr Cys Pro

1 5 10 15 1 5 10 15

Arg Pro Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln LysArg Pro Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys

20 25 30 20 25 30

Ile Val Ala Pro Val Lys Gln ThrIle Val Ala Pro Val Lys Gln Thr

35 40 35 40

<210>102<210>102

<211>18<211>18

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>102<400>102

Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn ProLeu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro

1 5 10 15 1 5 10 15

Gly ProGlyPro

<210>103<210>103

<211>40<211>40

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>103<400>103

Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys Ile ValLeu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys Ile Val

1 5 10 15 1 5 10 15

Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala GlyAla Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly

20 25 30 20 25 30

Asp Val Glu Ser Asn Pro Gly ProAsp Val Glu Ser Asn Pro Gly Pro

35 40 35 40

<210>104<210>104

<211>33<211>33

<212>БЕЛОК<212>PROTEIN

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Саморасщепляемый полипептид, содержащий сайт 2А<223>Self-cleaving polypeptide containing the 2A site

<400>104<400>104

Glu Ala Arg His Lys Gln Lys Ile Val Ala Pro Val Lys Gln Thr LeuGlu Ala Arg His Lys Gln Lys Ile Val Ala Pro Val Lys Gln Thr Leu

1 5 10 15 1 5 10 15

Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro GlyAsn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly

20 25 30 20 25 30

ProPro

<210>105<210>105

<211>10<211>10

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Консенсусная последовательность Козака<223>Kozak consensus sequence

<400>105<400>105

gccrccatgg 10gccrccatgg 10

<210>106<210>106

<211>8<211>8

<212>БЕЛОК<212>PROTEIN

<213>Homo sapiens<213>Homo sapiens

<400>106<400>106

Glu Gln Thr Glu Tyr Ala Thr IleGlu Gln Thr Glu Tyr Ala Thr Ile

1 5 fifteen

<210>107<210>107

<211>43<211>43

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>107<400>107

tgagcagacg gagtatgcca ccattgtctt tcctagcgga atg 43tgagcagacg gagtatgcca ccattgtctt tcctagcgga atg 43

<210>108<210>108

<211>43<211>43

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Сделано в лаборатории<223>Lab made

<400>108<400>108

cattccgcta ggaaagacaa tggtggcata ctccgtctgc tca 43cattccgcta ggaaagacaa tggtggcata ctccgtctgc tca 43

<210>109<210>109

<211>22<211>22

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Сделано в лаборатории<223>Lab made

<220><220>

<221>прочий_признак<221>other_characteristic

<222>(14)..(22)<222>(14)..(22)

<223>n is A, C, G или T<223>n is A, C, G, or T

<400>109<400>109

aatggtggca tacnnnnnnn nn 22aatggtggca tacnnnnnnn nn 22

<210>110<210>110

<211>22<211>22

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Сделано в лаборатории<223>Lab made

<220><220>

<221>прочий_признак<221>other_characteristic

<222>(1)..(9)<222>(1)..(9)

<223>n is a, c, g, or t<223>n is a, c, g, or t

<400>110<400>110

nnnnnnnnna tactccgtct gc 22nnnnnnnnna tactccgtct gc 22

<210>111<210>111

<211>22<211>22

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Сделано в лаборатории<223>Lab made

<400>111<400>111

aatggtggca tactccgtct gc 22aatggtggca tactccgtct gc 22

<210>112<210>112

<211>43<211>43

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>112<400>112

attccgctag gaaagacaat ggtggcatac tccgtctgct cag 43attccgctag gaaagacaat ggtggcatac tccgtctgct cag 43

<210>113<210>113

<211>43<211>43

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Сделано в лаборатории<223>Lab made

<400>113<400>113

atttcgttag gaaagataat ggtggtatat ttcgtttgtt tag 43atttcgttag gaaagataat ggtggtatat ttcgtttgtt tag 43

<210>114<210>114

<211>7<211>7

<212>БЕЛОК<212>PROTEIN

<213>Homo sapiens<213>Homo sapiens

<400>114<400>114

Met Gln Ile Pro Gln Ala ProMet Gln Ile Pro Gln Ala Pro

1 5 fifteen

<210>115<210>115

<211>44<211>44

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>115<400>115

ctctggtggg gctgctccag gcatgcagat cccacaggcg ccct 44ctctggtggg gctgctccag gcatgcagat cccacaggcg ccct 44

<210>116<210>116

<211>44<211>44

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Сделано в лаборатории<223>Lab made

<400>116<400>116

agggcgcctg tgggatctgc atccctggag cagccccacc agag 44agggcgcctg tgggatctgc atccctggag cagccccacc agag 44

<210>117<210>117

<211>8<211>8

<212>БЕЛОК<212>PROTEIN

<213>Homo sapiens<213>Homo sapiens

<400>117<400>117

Asn Gly Arg Asp Phe His Met SerAsn Gly Arg Asp Phe His Met Ser

1 5 fifteen

<210>118<210>118

<211>43<211>43

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>118<400>118

gtgtcacaca actgcccaac gggcgtgact tccacatgag cgt 43gtgtcacaca actgcccaac gggcgtgact tccacatgag cgt 43

<210>119<210>119

<211>43<211>43

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Сделано в лаборатории<223>Lab made

<400>119<400>119

acgctcatgt ggaagtcacg cccgttgggc agttgtgtga cac 43acgctcatgt ggaagtcacg cccgttggggc agttgtgtga cac 43

<210>120<210>120

<211>32<211>32

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>120<400>120

gctccaggca tgcagatccc acaggcgccc tg 32gctccaggca tgcagatccc acaggcgccc tg 32

<210>121<210>121

<211>32<211>32

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Сделано в лаборатории<223>Lab Made

<400>121<400>121

actccaaaca tacaaatccc acaaacaccc ta 32actccaaaca tacaaatccc acaaacaccc ta 32

<210>122<210>122

<211>31<211>31

<212>ДНК<212>DNA

<213>Homo sapiens<213>Homo sapiens

<400>122<400>122

gcccaacggg cgtgacttcc acatgagcgt g 31gcccaacggg cgtgacttcc acatgagcgt g 31

<210>123<210>123

<211>31<211>31

<212>ДНК<212>DNA

<213>Искусственная последовательность<213>Artificial sequence

<220><220>

<223>Сделано в лаборатории<223>Lab Made

<400>123<400>123

acccaacgaa cgtaacttcc acataaacgt a 31acccaacgaa cgtaacttcc acataaacgt a 31

<---<---

Claims (22)

1. Полипептид, содержащий вариант I-OnuI хоминг-эндонуклеазы (НЕ), который связывает и расщепляет сайт-мишень в человеческом гене запрограммированной клеточной гибели 1 (PD-1), отличающийся тем, что вариант I-OnuI НЕ содержит аминокислотную последовательность, по меньшей мере на 95% идентичную аминокислотной последовательности, представленной в любой из SEQ ID NO: 60-63.1. A polypeptide containing an I-OnuI homing endonuclease (HE) variant that binds and cleaves a target site in the human programmed cell death 1 (PD-1) gene, characterized in that the I-OnuI variant does NOT contain the amino acid sequence at least 95% identical to the amino acid sequence shown in any of SEQ ID NOs: 60-63. 2. Полипептид по п. 1, где вариант I-OnuI НЕ расщепляет сайт-мишень экзона 1 гена PD-1 и содержит следующие аминокислотные замены по отношению к аминокислотной последовательности, представленной в SEQ ID NO: 4:2. The polypeptide of claim 1, wherein the I-OnuI variant does NOT cleave the target site of exon 1 of the PD-1 gene and contains the following amino acid substitutions relative to the amino acid sequence shown in SEQ ID NO: 4: (a) L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46A, T48V, V68I, А70Т, S72D, N75R, A76Y, S78R, K80R, I100V, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и Т240Е;(a) L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46A, T48V, V68I, A70T, S72D, N75R, A76Y, S78R, K80R, I100V, L138M, T143N . (b) L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, V37G, G38R, S40H, E42R, G44S, Q46T, T48V, V68I, А70Т, S72D, N75R, A76Y, S78R, К80С, I100V, V132A, L138M, T143N, S155G, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и Т240Е;(b) L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, V37G, G38R, S40H, E42R, G44S, Q46T, T48V, V68I, A70T, S72D, N75R, A76Y, S78R, K80C, I100V, V132A . (c) L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, Т48М, V68I, А70Т, S72N, N75H, A76Y, S78T, K80R, I100V, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и Т240Е;(c) L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48M, V68I, A70T, S72N, N75H, A76Y, S78T, K80R, I100V, L138M, T143N . (d) L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, Т48М, V68S, A70Y, S72N, N75H, A76Y, K80E, T82F, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и Т240Е;(d) L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48M, V68S, A70Y, S72N, N75H, A76Y, K80E, T82F, L138M, T143N, S159P , E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R and T240E; (e) L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, Т48М, V68S, A70L, S72N, N75H, A76Y, K80V, T82Y, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и Т240Е; или(e) L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37A, G38R, S40H, E42R, G44S, Q46T, T48M, V68S, A70L, S72N, N75H, A76Y, K80V, T82Y, L138M, T143N, S159P , E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R and T240E; or (f) L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37G, G38R, S40H, E42R, G44S, Q46T, Т48М, V68S, А70Т, S72N, N75H, A76Y, K80V, T82Y, L138M, T143N, S159P, E178D, C180S, N184R, I186R, K189N, S190V, K191N, L192A, G193R, Q195R, S201E, T203S, K207R, Y223H, K225Y, K227G, F232R, D236Q, V238R и Т240Е.(f) L26G, R28S, R30L, N32R, K34R, S35G, S36T, V37G, G38R, S40H, E42R, G44S, Q46T, T48M, V68S, A70T, S72N, N75H, A76Y, K80V, T82Y, L138M, T143N, S159P . 3. Полипептид по п. 1 или 2, где указанный полипептид связывает полинуклеотидную последовательность, представленную в SEQ ID NO: 30.3. A polypeptide according to claim 1 or 2, wherein said polypeptide binds the polynucleotide sequence shown in SEQ ID NO: 30. 4. Полипептид, содержащий вариант I-OnuI хоминг-эндонуклеазы (НЕ), который связывает и расщепляет сайт-мишень в человеческом гене запрограммированной клеточной гибели 1 (PD-1), отличающийся тем, что вариант I-OnuI НЕ содержит аминокислотную последовательность, по меньшей мере на 95% идентичную аминокислотной последовательности, представленной в любой из SEQ ID NO: 60-63, дополнительно содержащий ДНК-связывающий домен TALE, который содержит от приблизительно 9,5 единиц повтора TALE до приблизительно 15,5 единиц повтора TALE.4. A polypeptide containing an I-OnuI homing endonuclease (HE) variant that binds and cleaves a target site in the human programmed cell death 1 (PD-1) gene, characterized in that the I-OnuI variant does NOT contain the amino acid sequence at least 95% identical to the amino acid sequence shown in any of SEQ ID NOs: 60-63, further containing a TALE DNA binding domain that contains from about 9.5 TALE repeat units to about 15.5 TALE repeat units. 5. Полипептид по п. 4, где ДНК-связывающий домен TALE связывает полинуклеотидную последовательность, представленную в SEQ ID NO: 31.5. The polypeptide of claim 4, wherein the TALE DNA binding domain binds the polynucleotide sequence shown in SEQ ID NO: 31. 6. Полипептид по п. 5, где указанный полипептид связывает и расщепляет полинуклеотидную последовательность, представленную в SEQ ID NO: 32.6. The polypeptide of claim 5, wherein said polypeptide binds and cleaves the polynucleotide sequence shown in SEQ ID NO: 32. 7. Полипептид, содержащий вариант I-OnuI хоминг-эндонуклеазы (НЕ), который связывает и расщепляет сайт-мишень в человеческом гене запрограммированной клеточной гибели 1 (PD-1), отличающийся тем, что вариант I-OnuI НЕ содержит аминокислотную последовательность, по меньшей мере на 95% идентичную аминокислотной последовательности, представленной в любой из SEQ ID NO: 60-63, дополнительно содержащий пептидный линкер или вирусный саморасщепляемый пептид 2А и 3'-5' экзонуклеазу Trex2, или соответствующий биологически активный фрагмент.7. A polypeptide containing an I-OnuI homing endonuclease (HE) variant that binds and cleaves a target site in the human programmed cell death 1 (PD-1) gene, characterized in that the I-OnuI variant does NOT contain the amino acid sequence at least 95% identical to the amino acid sequence shown in any of SEQ ID NOs: 60-63, additionally containing a peptide linker or viral self-cleaving peptide 2A and 3'-5' Trex2 exonuclease, or an appropriate biologically active fragment. 8. Полинуклеотид, кодирующий полипептид по любому из пп. 1-7.8. Polynucleotide encoding a polypeptide according to any one of paragraphs. 1-7. 9. Полинуклеотид по п. 8, где полинуклеотид представляет собой мРНК.9. The polynucleotide of claim 8, wherein the polynucleotide is mRNA. 10. Полинуклеотид по п. 8, где полинуклеотид представляет собой кДНК.10. The polynucleotide of claim 8, wherein the polynucleotide is cDNA. 11. Вектор экспрессии, содержащий полинуклеотид, кодирующий полипептид по любому из пп. 1-10.11. An expression vector containing a polynucleotide encoding a polypeptide according to any one of paragraphs. 1-10. 12. Клетка для адоптивной клеточной терапии, содержащая полипептид по любому из пп. 1-7, полинуклеотид по пп. 8-10 или вектор экспрессии по п. 11, при этом клетка представляет собой гемопоэтическую клетку, Т-клетку, клетку CD3+, клетку CD4+, клетку CD8+, иммунную эффекторную клетку, цитотоксический Т-лимфоцит (ЦТЛ), инфильтрирующий опухоль лимфоцит (TIL), хелперную Т-клетку, природный киллер (NK) или Т-клетку-природный киллер (NKT).12. Cell for adoptive cell therapy containing a polypeptide according to any one of paragraphs. 1-7, the polynucleotide according to claims. 8-10 or an expression vector according to claim 11, wherein the cell is a hematopoietic cell, a T cell, a CD3+ cell, a CD4+ cell, a CD8+ cell, an immune effector cell, a cytotoxic T lymphocyte (CTL), a tumor infiltrating lymphocyte (TIL) , a helper T cell, a natural killer (NK), or a natural killer T cell (NKT). 13. Клетка для адоптивной клеточной терапии, содержащая полипептид по любому из пп. 1-7, полинуклеотид по любому из пп. 8-10 или вектор экспрессии по п. 11, где указанная клетка содержит полинуклеотид, кодирующий сконструированный TCR, CAR, рецептор Daric или дзетакин.13. Cell for adoptive cell therapy containing a polypeptide according to any one of paragraphs. 1-7, a polynucleotide according to any one of paragraphs. 8-10 or an expression vector according to claim 11, wherein said cell contains a polynucleotide encoding an engineered TCR, CAR, Daric receptor, or zetakin. 14. Клетка для адоптивной клеточной терапии по п. 13, где указанная клетка представляет собой гемопоэтическую клетку, Т-клетку, CD3+ клетку, CD4+ клетку, CD8+ клетку, иммунную эффекторную клетку, цитотоксический Т-лимфоцит (CTL), инфильтрирующий опухоль лимфоцит (TIL), хелперную Т-клетку, клетку-природный киллер (NK) или Т-клетку-природный киллер (NKT).14. An adoptive cell therapy cell according to claim 13, wherein said cell is a hematopoietic cell, a T cell, a CD3+ cell, a CD4+ cell, a CD8+ cell, an immune effector cell, a cytotoxic T lymphocyte (CTL), a tumor infiltrating lymphocyte (TIL). ), a helper T cell, a natural killer (NK) cell, or a natural killer T cell (NKT). 15. Композиция для адоптивной клеточной терапии, содержащая эффективное количество клеток по любому из пп. 12-14.15. Composition for adoptive cell therapy, containing an effective number of cells according to any one of paragraphs. 12-14. 16. Композиция для адоптивной клеточной терапии, содержащая эффективное количество клеток по любому из пп. 12-14 и физиологически приемлемый носитель.16. Composition for adoptive cell therapy, containing an effective number of cells according to any one of paragraphs. 12-14 and a physiologically acceptable carrier.
RU2019110065A 2016-09-08 2017-09-08 Options, compositions, and methods for use of homing-endonuclease pd-1 RU2781083C2 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662385079P 2016-09-08 2016-09-08
US62/385,079 2016-09-08
US201662414279P 2016-10-28 2016-10-28
US62/414,279 2016-10-28
PCT/US2017/050774 WO2018049226A1 (en) 2016-09-08 2017-09-08 Pd-1 homing endonuclease variants, compositions, and methods of use

Publications (3)

Publication Number Publication Date
RU2019110065A RU2019110065A (en) 2020-10-08
RU2019110065A3 RU2019110065A3 (en) 2021-01-20
RU2781083C2 true RU2781083C2 (en) 2022-10-05

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007049095A1 (en) * 2005-10-25 2007-05-03 Cellectis Laglidadg homing endonuclease variants having mutations in two functional subdomains and use thereof
EP2215223A2 (en) * 2007-10-31 2010-08-11 Precision Biosciences, Inc. Rationally-designed single-chain meganucleases with non-palindromic recognition sequences
WO2012068380A2 (en) * 2010-11-17 2012-05-24 Sangamo Biosciences, Inc. Methods and compositions for modulating pd1
WO2013126794A1 (en) * 2012-02-24 2013-08-29 Fred Hutchinson Cancer Research Center Compositions and methods for the treatment of hemoglobinopathies
EA201492222A1 (en) * 2012-05-25 2015-05-29 Селлектис METHODS OF CONSTRUCTING NONALLOACTIVE AND SUSTAINABLE T-CELL IMMUNOSUPRESSION FOR IMMUNOTHERAPY

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007049095A1 (en) * 2005-10-25 2007-05-03 Cellectis Laglidadg homing endonuclease variants having mutations in two functional subdomains and use thereof
EP2215223A2 (en) * 2007-10-31 2010-08-11 Precision Biosciences, Inc. Rationally-designed single-chain meganucleases with non-palindromic recognition sequences
WO2012068380A2 (en) * 2010-11-17 2012-05-24 Sangamo Biosciences, Inc. Methods and compositions for modulating pd1
WO2013126794A1 (en) * 2012-02-24 2013-08-29 Fred Hutchinson Cancer Research Center Compositions and methods for the treatment of hemoglobinopathies
EA201492222A1 (en) * 2012-05-25 2015-05-29 Селлектис METHODS OF CONSTRUCTING NONALLOACTIVE AND SUSTAINABLE T-CELL IMMUNOSUPRESSION FOR IMMUNOTHERAPY

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ЖДАНОВ Д.Д. и др. Эндонуклеаза EndoG индуцирует альтернативный сплайсинг каталитической субъединицы теломеразы hTERT и гибель опухолевых клеток, Биомедицинская химия, 2016, том 62, вып. 3, с. 239-250. *

Similar Documents

Publication Publication Date Title
KR102451510B1 (en) PD-1 Homing Endonuclease Variants, Compositions and Methods of Use
AU2019204429B2 (en) Modified hematopoietic stem/progenitor and non-T effector cells, and uses thereof
KR102386029B1 (en) genome editing immune effector cells
AU774643B2 (en) Compositions and methods for use in recombinational cloning of nucleic acids
KR20210149060A (en) RNA-induced DNA integration using TN7-like transposons
AU2021200863A1 (en) Genetically-modified cells comprising a modified human t cell receptor alpha constant region gene
KR20200032174A (en) Enhanced chimeric antigen receptors and uses thereof
KR20200064129A (en) Transgenic selection methods and compositions
KR20170108946A (en) Chimeric antigen receptors targeting fc receptor-like 5 and uses thereof
AU2016333886A1 (en) Engineered meganucleases with recognition sequences found in the human T cell receptor alpha constant region gene
KR20190101410A (en) Gene therapy to treat Wilson&#39;s disease
KR102628872B1 (en) Tools and methods for using cell division loci to control proliferation of cells
DK2768848T3 (en) METHODS AND PROCEDURES FOR EXPRESSION AND SECRETARY OF PEPTIDES AND PROTEINS
CN112041334A (en) Expression of human FOXP3 in gene-edited T cells
CN112218882A (en) FOXP3 in edited CD34+Expression in cells
US11033638B2 (en) Single-vector gene construct comprising insulin and glucokinase genes
CN116083398B (en) Isolated Cas13 proteins and uses thereof
KR102409420B1 (en) Marker composition for transformed organism, transformed organism and method for transformation
KR20220142502A (en) Muscle-specific nucleic acid regulatory elements and methods and uses thereof
RU2781083C2 (en) Options, compositions, and methods for use of homing-endonuclease pd-1
CN110016481A (en) A kind of pX335-xCas9n carrier and its construction method and application
WO2023122725A2 (en) Controllable stimulation of genetically engineered lymphocytes for the treatment of cancer
RU2779747C2 (en) Chimeric antigen receptors targeted to fc receptor-like protein 5, and their use