EA041085B1 - LIBRARIES OF MODULAR POLYPEPTIDES AND METHODS FOR THEIR PRODUCTION AND APPLICATION - Google Patents
LIBRARIES OF MODULAR POLYPEPTIDES AND METHODS FOR THEIR PRODUCTION AND APPLICATION Download PDFInfo
- Publication number
- EA041085B1 EA041085B1 EA201890611 EA041085B1 EA 041085 B1 EA041085 B1 EA 041085B1 EA 201890611 EA201890611 EA 201890611 EA 041085 B1 EA041085 B1 EA 041085B1
- Authority
- EA
- Eurasian Patent Office
- Prior art keywords
- domain
- library
- protein
- modular
- polypeptide
- Prior art date
Links
Description
Перекрестная ссылкаcross reference
Настоящая заявка испрашивает приоритет согласно предварительной заявке на патент США № 62/212999, поданной 1 сентября 2015 года, содержание которой полностью включено в настоящую заявку посредством ссылки.This application claims priority under U.S. Provisional Application No. 62/212,999, filed September 1, 2015, the contents of which are hereby incorporated by reference in their entirety.
Заявление об исследованиях, финансируемых из федерального бюджета.Federally funded research statement.
Настоящее изобретение было выполнено при государственной поддержке в рамках грантов EY016546, Р50 GM081879, R01 СА196277, F32 GM006499 и R01 GM055040, присужденных Национальными институтами здравоохранения (США). Правительство США обладает определенными правами на настоящее изобретение.The present invention was made with government support under grants EY016546, P50 GM081879, R01 CA196277, F32 GM006499 and R01 GM055040 awarded by the National Institutes of Health (USA). The US Government has certain rights to the present invention.
Включение перечня последовательностей, предоставленного в виде текстового файла, посредством ссылки.Inclusion of a sequence listing provided as a text file via a link.
Перечень последовательностей предоставлен в настоящей заявке в виде текстового файла UCSF518WO SeqList_ST25.txt, созданного 29 августа 2016 года и имеющего размер 145 килобайт. Содержимое текстового файла полностью включено в настоящую заявку посредством ссылки.The sequence listing is provided in this application as a text file UCSF518WO SeqList_ST25.txt created on August 29, 2016 and having a size of 145 kilobytes. The contents of the text file are incorporated herein by reference in their entirety.
ВведениеIntroduction
Многие эукариотические белки осуществляют свои функции с помощью модульных доменов или мотивов, которые контролируют или облегчают входные и выходные функции белка в целом. В настоящее время существуют способы перегруппировки и рекомбинации модульных доменов эукариотических белков, позволяющие создавать новые белки с измененными соотношениями входных/выходных функций и совершенно новыми общими функциями. Успешное конструирование отдельных модульных белков путем простой рекомбинации доменов, опосредующих входные и выходные функции, послужило доказательством принципа упомянутого модульного подхода к разработке новых белков.Many eukaryotic proteins carry out their functions through modular domains or motifs that control or facilitate the input and output functions of the protein as a whole. Currently, there are ways to rearrange and recombine the modular domains of eukaryotic proteins, allowing you to create new proteins with modified ratios of input/output functions and completely new overall functions. The successful construction of individual modular proteins by simple recombination of domains that mediate input and output functions served as proof of the principle of the mentioned modular approach to the development of new proteins.
Конструирование новых синтетических белков, например, для применения в терапевтических клетках, до настоящего времени осуществляли на основании подхода последовательного создания конструкций. Аналогичным образом, трансфекцию и скрининг таких синтетических белков также выполняли с использованием низкопроизводительного подхода, используя отдельные конструкции, которые подвергали скринингу на индивидуальной основе, или, в некоторых случаях, небольшое количество отдельных конструкций подвергали одновременному скринингу. Одновременный скрининг, несмотря на то, что он является более эффективным, чем скрининг отдельных конструкций на индивидуальной основе, имеет ограниченную масштабируемость вследствие требования, заключающегося в том, что отдельные конструкции должны оставаться физически раздельными, чтобы облегчить окончательную идентификацию эффективных конструкций. Индивидуальный скрининг большого количества новых белков является обременительным при проведении количественного исследования в условиях in vitro, но становится еще более неприемлемо затруднительным и дорогостоящим при переходе испытаний к стадии количественных исследований, проводимых в моделях в условиях in vivo. Упомянутое индивидуальное получение и индивидуальный скрининг значительно ограничивают скорость разработки новых синтетических белков.The construction of new synthetic proteins, for example for use in therapeutic cells, has hitherto been based on a sequential construction approach. Similarly, transfection and screening of such synthetic proteins was also performed using a low throughput approach, using single constructs that were screened on an individual basis, or, in some cases, a small number of single constructs were screened simultaneously. Simultaneous screening, while more efficient than screening individual constructs on an individual basis, has limited scalability due to the requirement that individual constructs must remain physically separate to facilitate eventual identification of effective constructs. Individual screening of a large number of new proteins is cumbersome in in vitro quantitation, but becomes even more unacceptably difficult and costly when testing moves to the quantification stage in in vivo models. This individual production and individual screening significantly limits the rate of development of new synthetic proteins.
Краткое описание изобретенияBrief description of the invention
В настоящем изобретении предложены библиотеки синтетических модульных полипептидов и нуклеиновые кислоты, кодирующие указанные библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы получения библиотек синтетических модульных полипептидов и нуклеиновых кислот, кодирующих библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы скрининга библиотеки синтетических модульных полипептидов для идентификации выбранного фенотипа, связанного с элементом библиотеки синтетических модульных полипептидов, причем указанные способы можно применять в количественных исследования в условиях in vitro и в условиях in vivo.The present invention provides synthetic modular polypeptide libraries and nucleic acids encoding said synthetic modular polypeptide libraries. The present invention also provides methods for obtaining libraries of synthetic modular polypeptides and nucleic acids encoding libraries of synthetic modular polypeptides. The present invention also provides methods for screening a library of synthetic modular polypeptides to identify a selected phenotype associated with an element of the library of synthetic modular polypeptides, which methods can be used in quantitative studies in vitro and in vivo conditions.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный способ включает: а) введение в клетки-хозяева библиотеки, содержащей нуклеиновые кислоты-штрихкоды, с получением гетерогенной популяции генетически модифицированных клеток-хозяев, причем указанная библиотека нуклеиновых кислот-штрихкодов содержит множество элементов, при этом каждый из множества элементов содержит нуклеотидную последовательность, кодирующую отличающийся синтетический модульный полипептид; и b) идентификацию генетически модифицированной клетки-хозяина в гетерогенной популяции, которая проявляет выбранный фенотип в ответ на стимул.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, said method comprising: the barcode nucleic acid library contains a plurality of elements, each of the plurality of elements containing a nucleotide sequence encoding a different synthetic modular polypeptide; and b) identifying the genetically modified host cell in the heterogeneous population that exhibits the selected phenotype in response to the stimulus.
В настоящем изобретении также предложен способ, в котором синтетический модульный полипептид представляет собой полипептид химерного антигенного рецептора (CAR) и в котором стимул представляет собой антигенпрезентирующую клетку, которая экспрессирует на своей поверхности антиген, который связан с CAR.The present invention also provides a method wherein the synthetic modular polypeptide is a chimeric antigen receptor (CAR) polypeptide and wherein the stimulus is an antigen presenting cell that expresses on its surface an antigen that is associated with the CAR.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный стимул вступает в контакт с костимулирующей молекулой.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, said stimulus being contacted with a co-stimulatory molecule.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа,The present invention also provides a method for identifying a selected phenotype in a cell,
- 1 041085 связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный рецепторный полипептид.- 1 041085 associated with a synthetic modular polypeptide, and the specified synthetic modular polypeptide is a modular receptor polypeptide.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный модульный рецепторный полипептид представляет собой химерный полипептид рецептора Notch.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, said modular receptor polypeptide being a chimeric Notch receptor polypeptide.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный стимул представляет собой лиганд химерного полипептида рецептора Notch.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, said stimulus being a chimeric Notch receptor polypeptide ligand.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный каркасный белок.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, said synthetic modular polypeptide being a modular scaffold protein.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный белок протеинкиназы или протеинфосфатазы.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, said synthetic modular polypeptide being a protein kinase or protein phosphatase modular protein.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный транскрипционный регуляторный белок.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, said synthetic modular polypeptide being a modular transcriptional regulatory protein.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный эпигенетический регуляторный белок.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, said synthetic modular polypeptide being a modular epigenetic regulatory protein.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный белок рекомбиназы или нуклеазы.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, said synthetic modular polypeptide being a recombinase or nuclease modular protein.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный выбранный фенотип имеет отличительную черту фенотипа, включающую два или более фенотипов.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, said selected phenotype having a phenotypic feature comprising two or more phenotypes.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, включающий секвенирование нуклеиновой последовательности-штрихкода из идентифицированной генетически модифицированной клетки-хозяина для идентификации синтетического модульного полипептида, связанного с фенотипом.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, comprising sequencing a nucleic barcode sequence from an identified genetically modified host cell to identify a synthetic modular polypeptide associated with the phenotype.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, включающий количественное определение синтетического модульного полипептида, связанного с фенотипом.The present invention also provides a method for identifying a selected phenotype associated with a synthetic modular polypeptide in a cell, comprising quantifying the synthetic modular polypeptide associated with the phenotype.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, включающий количественное определение отдельного модуля синтетических модульных полипептидов из библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая связана с фенотипом.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, comprising quantifying a single module of synthetic modular polypeptides from a nucleic acid library containing barcode nucleic acid sequences that is associated with the phenotype.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем каждая нуклеотидная последовательность, кодирующая отличающийся синтетический модульный полипептид, содержит последовательность, кодирующую детектируемый репортер, который функционально соединен с нуклеотидной последовательностью, кодирующей синтетический модульный полипептид, причем указанный способ дополнительно включает разделение гетерогенной популяции генетически модифицированных клеток-хозяев на основании экспрессируемого детектируемого репортера.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, wherein each nucleotide sequence encoding a different synthetic modular polypeptide contains a sequence encoding a detectable reporter that is operably linked to a nucleotide sequence encoding a synthetic modular polypeptide, wherein said the method further comprises separating a heterogeneous population of genetically modified host cells based on an expressed detectable reporter.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем идентификацию выполняют в условиях in vitro или в условиях ex vivo.The present invention also provides a method for identifying a selected phenotype associated with a synthetic modular polypeptide in a cell, the identification being performed in vitro or ex vivo.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный фенотип представляет собой один или более из: а) пролиферации; b) выработки цитокинов; с) экспрессии маркера клеточной поверхности; d) экспрессии репортерного белка.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, said phenotype being one or more of: a) proliferation; b) production of cytokines; c) expression of a cell surface marker; d) reporter protein expression.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный способ включает библиотеку нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит 100 или более уникальных элементов, и идентификация включает скрининг 100 или более уникальных элементов библиотеки для выбранного фенотипа.The present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, said method comprising a nucleic acid library containing nucleic barcode sequences that contains 100 or more unique elements, and the identification includes screening 100 or more unique elements of the library for the chosen phenotype.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный способ включает библиотеку нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, содержащую множество элементов, при этом каждый из множества элементов содержит нуклеотидную последовательность, кодирующую синтетический модульный полипептид, содержащий модульный домен, выбранный из группы, состоящей из: антигенсвязывающего домена, специфичного связывающего домена или белкаThe present invention also provides a method for identifying in a cell a selected phenotype associated with a synthetic modular polypeptide, said method comprising a nucleic acid library containing nucleic barcode sequences containing a plurality of elements, each of the plurality of elements containing a nucleotide sequence encoding a synthetic modular polypeptide containing a modular domain selected from the group consisting of: an antigen-binding domain, a specific binding domain, or a protein
- 2 041085 специфичного партнера по связыванию, костимулирующего домена, коингибирующего домена, внутриклеточного сигнального домена, трансмембранного домена, домена каркасного белка, домена белка протеинкиназы, домена белка протеинфосфатазы, домена белка рецепторной тирозинкиназы, домена белка липидкиназы, домена белка липидфосфатазы, домена белка убиквитинилазы, домена белка деубиквитинилазы, домена белка SUМОилазы, домена белка ацетилазы, домена белка деацетилазы, домена белка метилазы, домена белка деметилазы, домена белка нуклеазы, домена белка рекомбиназы, домена белка транскрипционного фактора и их комбинаций.- 2 041085 specific binding partner, co-stimulatory domain, co-inhibitory domain, intracellular signaling domain, transmembrane domain, scaffold protein domain, protein kinase protein domain, protein phosphatase protein domain, receptor tyrosine kinase protein domain, lipid kinase protein domain, lipid phosphatase protein domain, ubiquitinylase protein domain, a deubiquitinylase protein domain, a SUMOylase protein domain, an acetylase protein domain, a deacetylase protein domain, a methylase protein domain, a demethylase protein domain, a nuclease protein domain, a recombinase protein domain, a transcription factor protein domain, and combinations thereof.
В настоящем изобретении предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, причем указанная библиотека содержит: множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, при этом каждый уникальный полинуклеотид содержит: i) кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, ii) область нуклеиновой последовательности-штрихкода, содержащую первую нуклеиновую последовательность-штрихкод, специфичную для первой кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, специфичной для второй кодирующей последовательности, причем указанная первая и вторая нуклеиновые последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой и второй кодирующим последовательностям; и при этом секвенирование каждой области нуклеиновой последовательности-штрихкода позволяет идентифицировать каждый уникальный синтетический модульный полипептид.The present invention provides a library of nucleic acids containing nucleic barcode sequences, said library containing: a plurality of unique polynucleotides, each containing a nucleotide sequence encoding a unique synthetic modular polypeptide, each unique polynucleotide containing: i) a coding region encoding a unique a synthetic modular polypeptide comprising a first coding sequence encoding a first module connected in open reading frame to a second coding sequence encoding a second module, ii) a barcode nucleic sequence region containing a first barcode nucleic sequence specific for the first coding sequence, connected with a second nucleic sequence-barcode specific for the second coding sequence, wherein said first and second nucleic sequences-barcodes arranged in reverse order from the 5' end to the 3' end with respect to the first and second coding sequences; and while sequencing each region of the nucleic sequence-barcode allows you to identify each unique synthetic modular polypeptide.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой указанная первая и вторая кодирующие последовательности непосредственно соединены без каких-либо промежуточных некодирующих нуклеотидов.The present invention also provides a library of nucleic acids containing nucleic barcode sequences in which said first and second coding sequences are directly linked without any intermediate non-coding nucleotides.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой множество уникальных полинуклеотидов содержит по меньшей мере 1000 уникальных полинуклеотидов.The present invention also provides a library of nucleic acids containing nucleic barcode sequences, in which a plurality of unique polynucleotides contains at least 1000 unique polynucleotides.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой область нуклеиновой последовательностиштрихкода расположена в направлении 5'-конца относительно кодирующей области.The present invention also provides a library of nucleic acids containing barcode nucleic acid sequences, in which the barcode nucleic acid sequence region is located in the 5' direction relative to the coding region.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой кодирующая область расположена в направлении 5'-конца относительно области нуклеиновой последовательности-штрихкода.The present invention also provides a library of nucleic acids containing nucleic barcode sequences, in which the coding region is located in the direction of the 5'end relative to the region of the nucleic barcode sequence.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанный уникальный синтетический модульный полипептид содержит костимулирующий домен.The present invention also provides a library of nucleic acids containing nucleic barcode sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, and said unique synthetic modular polypeptide contains a costimulatory domain.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, который содержит первый и второй модули, причем указанный первый и второй модули содержат различные костимулирующие домены.The present invention also provides a library of nucleic acids containing nucleic barcode sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, which contains the first and second modules, and the specified first and second modules contain different costimulatory domains.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая включает множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем каждый уникальный полинуклеотид дополнительно содержит промоторную последовательность, функционально соединенную с кодирующей областью и репортерной последовательностью, кодирующей детектируемый полипептид, причем указанный детектируемый полипептид представляет собой детектируемый оптическими способами полипептид, содержащий, например, детектируемый оптическими способами флуоресцентный полипептид.The present invention also provides a library of nucleic acids containing nucleic barcode sequences that includes a plurality of unique polynucleotides, each containing a nucleotide sequence encoding a unique synthetic modular polypeptide, each unique polynucleotide further comprising a promoter sequence operably linked to a coding region and a reporter a sequence encoding a detectable polypeptide, wherein said detectable polypeptide is an optically detectable polypeptide containing, for example, an optically detectable fluorescent polypeptide.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, которая содержит кодирующую область, причем указанная кодирующая область дополнительно содержит третью кодирующую последовательность, кодирующую третий модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, и область нуклеиновой последовательности-штрихкода содержит третью нуклеиновую последовательность-штрихкод, специфичную для третьей кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, причем указанная первая, вторая и третья нуклеиновые последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой, второй и третьей кодирующим последовательностям.The present invention also provides a library of nucleic acids containing nucleic barcode sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, which contains a coding region, and the specified coding region additionally contains a third coding sequence encoding the third module connected with the preservation of the open reading frame with the second coding sequence, and the region of the nucleic sequence-barcode contains the third nucleic sequence-barcode, specific for the third coding sequence, connected to the second nucleic sequence-barcode, and the specified first, second and third nucleic sequences -barcodes are arranged in reverse order from the 5' end to the 3' end with respect to the first, second and third coding sequences.
- 3 041085- 3 041085
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой полипептиды химерного антигенного рецептора (CAR).The present invention also provides a library of nucleic acids containing nucleic barcode sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, and these unique synthetic modular polypeptides encoded by each unique polynucleotide of the set are chimeric antigen receptor (CAR) polypeptides.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные рецепторные полипептиды.The present invention also provides a library of nucleic acids containing nucleic barcode sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, and these unique synthetic modular polypeptides encoded by each unique polynucleotide of the set are modular receptor polypeptides.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, кодирующих модульные рецепторные полипептиды, причем указанные модульные рецепторные полипептиды представляют собой химерные полипептиды рецептора Notch.The present invention also provides a library of nucleic acids containing nucleic barcode sequences encoding modular receptor polypeptides, said modular receptor polypeptides being chimeric Notch receptor polypeptides.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные каркасные белки.The present invention also provides a library of nucleic acids containing nucleic barcode sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, and these unique synthetic modular polypeptides encoded by each unique polynucleotide of the set are modular scaffold proteins.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные белки протеинкиназ или протеинфосфатаз.The present invention also provides a library of nucleic acids containing nucleic barcode sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, and these unique synthetic modular polypeptides encoded by each unique polynucleotide of the set are modular proteins of protein kinases or protein phosphatases.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные транскрипционные регуляторные белки.The present invention also provides a library of nucleic acids containing nucleic barcode sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, and these unique synthetic modular polypeptides encoded by each unique polynucleotide of the set are modular transcriptional regulatory proteins.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные эпигенетические регуляторные белки.The present invention also provides a library of nucleic acids containing nucleic barcode sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, and these unique synthetic modular polypeptides encoded by each unique polynucleotide of the set are modular epigenetic regulatory proteins.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные белки рекомбиназ или нуклеаз.The present invention also provides a library of nucleic acids containing nucleic barcode sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, and these unique synthetic modular polypeptides encoded by each unique polynucleotide of the set are modular proteins of recombinases or nucleases.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, содержат модульный домен, выбранный из группы состоящий из: антигенсвязывающего домена, специфичного связывающего домена или белка специфичного партнера по связыванию, костимулирующего домена, коингибирующего домена, внутриклеточного сигнального домена, трансмембранного домена, домена каркасного белка, домена белка протеинкиназы, домена белка протеинфосфатазы, домена белка рецепторной тирозинкиназы, домена белка липидкиназы, домена белка липидфосфатазы, домена белка убиквитинилазы, домена белка деубиквитинилазы, домена белка SUМОилазы, домена белка ацетилазы, домена белка деацетилазы, домена белка метилазы, домена белка деметилазы, домена белка нуклеазы, домена белка рекомбиназы, домена белка транскрипционного фактора и их комбинаций.The present invention also provides a library of nucleic acids containing nucleic barcode sequences, which contains a plurality of unique polynucleotides, each of which contains a nucleotide sequence encoding a unique synthetic modular polypeptide, and these unique synthetic modular polypeptides, encoded by each unique polynucleotide of the set, contain a modular a domain selected from the group consisting of: antigen-binding domain, specific binding domain or specific binding partner protein, co-stimulatory domain, co-inhibitory domain, intracellular signaling domain, transmembrane domain, scaffold protein domain, protein kinase protein domain, protein phosphatase protein domain, receptor tyrosine kinase protein domain , lipid kinase protein domain, lipid phosphatase protein domain, ubiquitinylase protein domain, deubiquitinylase protein domain, SUMOylase protein domain, acetylase protein domain, protein domain deacetylase, methylase protein domain, demethylase protein domain, nuclease protein domain, recombinase protein domain, transcription factor protein domain, and combinations thereof.
В настоящем изобретении предложна клеточная библиотека, содержащая: множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем каждый уникальный полинукThe present invention provides a cell library comprising: a plurality of cells each containing a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, each unique polynucleotide
- 4 041085 леотид содержит: i) кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, ii) область нуклеиновой последовательности-штрихкода, содержащую первую нуклеиновую последовательность-штрихкод, специфичную для первой кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, специфичной для второй кодирующей последовательности, причем указанная первая и вторая последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой и второй кодирующим последовательностям; и при этом секвенирование каждой области нуклеиновой последовательностиштрихкода позволяет идентифицировать каждый уникальный синтетический модульный полипептид каждой клетки библиотеки.- 4 041085 leotide contains: i) a coding region encoding a unique synthetic modular polypeptide containing the first coding sequence encoding the first module, connected with maintaining an open reading frame with the second coding sequence encoding the second module, ii) the region of the nucleic sequence-barcode containing a first nucleic barcode sequence specific to a first coding sequence, connected to a second nucleic barcode sequence specific to a second coding sequence, wherein said first and second barcode sequences are arranged in reverse order from the 5' end to the 3' end with respect to to the first and second coding sequences; and while sequencing each region of the nucleic sequence of the barcode allows you to identify each unique synthetic modular polypeptide of each cell of the library.
В настоящем изобретении также предложена клеточная библиотека, в которой клетки представляют собой прокариотические клетки или эукариотические клетки. В настоящем изобретении также предложена клеточная библиотека, в которой эукариотические клетки представляют собой клетки человека. В настоящем изобретении также предложена клеточная библиотека, в которой клетки человека представляют собой Т-клетки человека.The present invention also provides a cell library in which the cells are prokaryotic cells or eukaryotic cells. The present invention also provides a cell library in which the eukaryotic cells are human cells. The present invention also provides a cell library in which the human cells are human T cells.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, которая содержит кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, причем указанная первая и вторая кодирующие последовательности непосредственно соединены без каких-либо промежуточных некодирующих нуклеотидов.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, which contains a coding region encoding a unique synthetic modular polypeptide, containing a first coding sequence encoding a first module, linked in open reading frame to a second coding sequence encoding a second module, said first and second coding sequences being directly linked without any intermediate non-coding nucleotides.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, которая содержит кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, причем указанная кодирующая область дополнительно содержит последовательность, кодирующую репортер, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, which contains a coding region encoding a unique synthetic modular polypeptide, containing a first coding sequence encoding a first module, coupled in open reading frame to a second coding sequence encoding a second module, said coding region further comprising a sequence encoding a reporter coupled in open reading frame to the second coding sequence.
В настоящем изобретении также предложена клеточная библиотека, которая содержит последовательность, кодирующую репортер, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, причем указанный репортер представляет собой эпитопную метку.The present invention also provides a cellular library that contains a reporter-coding sequence fused in an open reading frame to a second coding sequence, said reporter being an epitope tag.
В настоящем изобретении также предложена клеточная библиотека, которая содержит последовательность, кодирующую репортер, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, причем указанный репортер представляет собой флуоресцентный белок.The present invention also provides a cellular library that contains a reporter-coding sequence fused in open reading frame to a second coding sequence, said reporter being a fluorescent protein.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанное множество клеток содержит по меньшей мере 1000 уникальных полинуклеотидов.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, and said plurality of cells contains at least 1000 unique polynucleotides.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, которая содержит кодирующую область, кодирующую уникальный синтетический модульный полипептид, причем указанная кодирующая область дополнительно содержит третью кодирующую последовательность, кодирующую третий модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, и область нуклеиновой последовательностиштрихкода содержит третью последовательность-штрихкод, специфичную для третьей кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, причем указанная первая, вторая и третья нуклеиновые последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой, второй и третьей кодирующим последовательностям.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence that contains a coding region encoding a unique synthetic modular polypeptide, and said coding region further comprises a third coding sequence encoding a third module, connected while maintaining an open reading frame with the second coding sequence, and the region of the barcode nucleic sequence contains a third barcode sequence specific for the third coding sequence, connected to the second barcode nucleic sequence, and the specified first, second and third barcode nucleic sequences are located in the reverse order from 5'-end to 3'-end relative to the first, second and third coding sequences.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой полипептиды химерного антигенного рецептора (CAR).The present invention also provides a cell library that contains a plurality of cells, each containing a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein the unique synthetic modular polypeptides encoded by each unique polynucleotide from the plurality of cells are chimeric antigen receptor polypeptides. (CAR).
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последова- 5 041085 тельность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные рецепторные полипептиды.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide from the plurality of cells are are modular receptor polypeptides.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные модульные рецепторные полипептиды представляют собой химерные полипептиды рецептора Notch.The present invention also provides a cell library that contains a plurality of cells each containing a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, said modular receptor polypeptides being chimeric Notch receptor polypeptides.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные каркасные белки.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide from the plurality of cells are modular scaffold proteins. .
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные белки протеинкиназ или протеинфосфатаз.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide from the plurality of cells are protein kinase modular proteins. or protein phosphatase.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные транскрипционные регуляторные белки.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, and said unique synthetic modular polypeptides encoded by each unique polynucleotide from a plurality of cells are modular transcriptional regulatory proteins.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные эпигенетические регуляторные белки.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, and said unique synthetic modular polypeptides encoded by each unique polynucleotide from a plurality of cells are modular epigenetic regulatory proteins.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные белки рекомбиназ или нуклеаз.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, wherein said unique synthetic modular polypeptides encoded by each unique polynucleotide from the plurality of cells are recombinase modular proteins. or nuclease.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, содержат модульный домен, выбранный из группы, состоящей из: антигенсвязывающего домена, специфичного связывающего домена или белка специфичного партнера по связыванию, костимулирующего домена, коингибирующего домена, внутриклеточного сигнального домена, трансмембранного домена, домена каркасного белка, домена белка протеинкиназы, домена белка протеинфосфатазы, домена белка рецепторной тирозинкиназы, домена белка липидкиназы, домена белка липидфосфатазы, домена белка убиквитинилазы, домена белка деубиквитинилазы, домена белка SUМОилазы, домена белка ацетилазы, домена белка деацетилазы, домена белка метилазы, домена белка деметилазы, домена белка нуклеазы, домена белка рекомбиназы, домена белка транскрипционного фактора и их комбинаций.The present invention also provides a cell library that contains a plurality of cells, each of which contains a unique polynucleotide containing a nucleotide sequence encoding a unique synthetic modular polypeptide, and said unique synthetic modular polypeptides encoded by each unique polynucleotide from a plurality of cells contain a modular domain selected from the group consisting of: antigen-binding domain, specific binding domain or specific binding partner protein, co-stimulatory domain, co-inhibitory domain, intracellular signaling domain, transmembrane domain, scaffold protein domain, protein kinase protein domain, protein phosphatase protein domain, receptor tyrosine kinase protein domain, lipid kinase protein domain, lipid phosphatase protein domain, ubiquitinylase protein domain, deubiquitinylase protein domain, SUMOylase protein domain, acetylase protein domain, deacetylase protein domain, methylase protein domain, a demethylase protein domain, a nuclease protein domain, a recombinase protein domain, a transcription factor protein domain, and combinations thereof.
В настоящем изобретении предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный способ включает: приведение первого полинуклеотида, содержащего последовательность, кодирующую первый модуль, соединенную с первой нуклеиновой последовательностью-штрихкодом, в контакт со вторым полинуклеотидом, содержащим последовательность, кодирующую второй модуль, соединенную со второй нуклеиновой последовательностьюштрихкодом, в условиях, достаточных для введения первого полинуклеотида во второй полинуклеотид в месте соединения второй кодирующей последовательности со второй нуклеиновой последовательностью-штрихкодом с получением бимодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды, причем указанный бимодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, содержит вторую модульную кодирующую последовательность, соединенную с сохранением открытой рамки считывания с первой модульной кодирующей последовательностью, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностью-штрихкодом.The present invention provides a method for obtaining a nucleic acid library containing barcode nucleic acid sequences, each of which encodes a unique synthetic modular polypeptide, and this method includes: bringing the first polynucleotide containing the sequence encoding the first module, connected to the first nucleic barcode sequence, into contact with a second polynucleotide containing a sequence encoding a second module connected to a second nucleic sequence by a barcode, under conditions sufficient to introduce the first polynucleotide into the second polynucleotide at the junction of the second coding sequence with the second nucleic sequence-barcode to obtain a bimodular polynucleotide containing nucleic sequences - barcodes, wherein said bimodular polynucleotide containing nucleic barcode sequences contains a second modular coding sequence b, coupled in an open reading frame to a first modular coding sequence coupled to a first barcode nucleoside sequence coupled to a second barcode nucleoside sequence.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный способ дополнительно включает приведение первогоThe present invention also provides a method for obtaining a library of nucleic acids containing nucleic barcode sequences, each of which encodes a unique synthetic modular polypeptide, and this method further includes bringing the first
- 6 041085 и второго полинуклеотидов в контакт с третьим полинуклеотидом, содержащим третью модульную кодирующую последовательность, соединенную с третьей нуклеиновой последовательностью-штрихкодом, причем указанный третий полинуклеотид встраивается в первый полинуклеотид в месте соединения первой кодирующей последовательности и первой нуклеиновой последовательности-штрихкода с получением трехмодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды, при этом трехмодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, содержит вторую модульную кодирующую последовательность, соединенную с сохранением открытой рамки считывания с первой модульной кодирующей последовательностью, соединенной с сохранением открытой рамки считывания с третьей модульной кодирующей последовательностью, соединенной с третьей нуклеиновой последовательностью-штрихкодом, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностью-штрихкодом.- 6 041085 and a second polynucleotide in contact with a third polynucleotide containing a third modular coding sequence connected to a third nucleic barcode sequence, wherein said third polynucleotide is inserted into the first polynucleotide at the junction of the first coding sequence and the first nucleic barcode sequence to obtain a three-module polynucleotide containing nucleic barcode sequences, while the three-modular polynucleotide containing nucleic barcode sequences contains a second modular coding sequence connected in an open reading frame to the first modular coding sequence connected in an open reading frame to a third modular coding sequence connected to a third barcode nucleic acid sequence linked to a first barcode nucleic acid sequence linked to a second barcode nucleic acid sequence barcode research.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанная первая и вторая модульные кодирующие последовательности соединены с сохранением открытой рамки считывания без каких-либо промежуточных некодирующих нуклеотидов.The present invention also provides a method for preparing a nucleic acid library containing barcode nucleic acid sequences, each of which encodes a unique synthetic modular polypeptide, wherein said first and second modular coding sequences are linked in an open reading frame without any intervening non-coding nucleotides.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанная библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, содержит 1000 или более уникальных нуклеиновых кислот, каждая из которых кодирует уникальный синтетический модульный полипептид.The present invention also provides a method for obtaining a nucleic acid library containing barcode nucleic acid sequences, each of which encodes a unique synthetic modular polypeptide, and said nucleic acid library containing barcode nucleic sequences contains 1000 or more unique nucleic acids, each of which encodes unique synthetic modular polypeptide.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанные нуклеиновые последовательности-штрихкоды расположены в направлении 5'-конца относительно последовательностей, кодирующих модули, или в направлении 3'-конца относительно последовательностей, кодирующих модули.The present invention also provides a method for obtaining a nucleic acid library containing barcode nucleic acid sequences, each of which encodes a unique synthetic modular polypeptide, and said nucleic barcode sequences are located in the 5'-terminus relative to the sequences encoding the modules, or in the 3' direction -end relative to sequences encoding modules.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем введение первого полинуклеотида во второй полинуклеотид в месте соединения второй кодирующей последовательности и второй нуклеиновой последовательностиштрихкода опосредовано активностью фермента рестрикции, который распознает сайт распознавания фермента рестрикции на втором полинуклеотиде и расщепляет второй полинуклеотид между второй кодирующей последовательностью и второй нуклеиновой последовательностью-штрихкодом, включая случаи, когда используемый фермент рестрикции представляет собой фермент рестрикции типа II, включая случаи, когда используемый фермент рестрикции представляет собой фермент рестрикции типа IIS.The present invention also provides a method for obtaining a nucleic acid library containing barcode nucleic acid sequences, each of which encodes a unique synthetic modular polypeptide, wherein the introduction of the first polynucleotide into the second polynucleotide at the junction of the second coding sequence and the second nucleic barcode sequence is mediated by the activity of a restriction enzyme that recognizes a restriction enzyme recognition site on the second polynucleotide and cleaves the second polynucleotide between the second coding sequence and the second barcode nucleic sequence, including cases where the restriction enzyme used is a type II restriction enzyme, including cases where the restriction enzyme used is a type IIS restriction enzyme.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный первый полинуклеотид также содержит сайт распознавания фермента рестрикции, который присутствует на втором полинуклеотиде.The present invention also provides a method for obtaining a library of nucleic acids containing nucleic barcode sequences, each of which encodes a unique synthetic modular polypeptide, and the first polynucleotide also contains a restriction enzyme recognition site that is present on the second polynucleotide.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный способ дополнительно включает приведение бимодульных полинуклеотидов, содержащих нуклеиновые последовательности-штрихкоды, в контакт с полинуклеотидом, кодирующим репортер, в условиях, достаточных для введения полинуклеотида, кодирующего репортер, в бимодульный полинуклеотид, содержащий нуклеиновые последовательностиштрихкоды, в месте соединения первой модульной кодирующей последовательности и первой нуклеиновой последовательности-штрихкода с получением связанного с репортером бимодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды, причем указанный связанный с репортером бимодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, содержит вторую модульную кодирующую последовательность, соединенную с сохранением открытой рамки считывания с первой модульной кодирующей последовательностью, соединенной с сохранением открытой рамки считывания с последовательностью, кодирующей репортер, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностьюштрихкодом. В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой последовательность, кодирующая репортер, кодирует эпитопную метку или флуоресцентный репортер.The present invention also provides a method for preparing a library of nucleic acids containing barcode nucleic acid sequences each encoding a unique synthetic modular polypeptide, said method further comprising contacting the bimodular polynucleotides containing the barcode nucleic acid sequences with a reporter-encoding polynucleotide in conditions sufficient to introduce a reporter-encoding polynucleotide into a bimodular polynucleotide containing barcode nucleic sequences at the junction of the first modular coding sequence and the first barcode nucleic sequence to obtain a reporter-bound bimodular polynucleotide containing barcode nucleic acid sequences, said reporter-bound bimodular polynucleotide containing nucleic barcode sequences, contains a second modular coding sequence connected with preservation an open reading frame with a first modular coding sequence connected in an open reading frame with a sequence encoding a reporter connected to a first nucleic barcode sequence connected to a second nucleic sequence with a barcode. The present invention also provides a method for obtaining a nucleic acid library containing nucleic barcode sequences, in which the sequence encoding the reporter encodes an epitope tag or a fluorescent reporter.
В настоящем изобретении предложен химерный антигенный рецептор (CAR), идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR содержит по меньшей мере один комодулирующий домен, перечисленный в табл. 3 или 4.The present invention provides a chimeric antigen receptor (CAR) identified by screening a library of nucleic acids encoding synthetic modular CAR polypeptides, said CAR containing at least one comodulatory domain listed in Table 1. 3 or 4.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанныйThe present invention also provides a CAR identified by screening a library of nucleic acids encoding synthetic modular CAR polypeptides, said
- 7 041085- 7 041085
CAR содержит CD19-специфичный антигенсвязывающий домен.CAR contains a CD19 specific antigen binding domain.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанныйThe present invention also provides a CAR identified by screening a library of nucleic acids encoding synthetic modular CAR polypeptides, said
CAR содержит первичный сигнальный домен CD3-дзета.CAR contains the primary signaling domain of CD3-zeta.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR стимулирует активность Т-клеток и содержит по меньшей мере один костимулирующий домен, перечисленный в табл. 3.The present invention also provides a CAR identified by screening a library of nucleic acids encoding synthetic modular CAR polypeptides, said CAR stimulating T cell activity and containing at least one co-stimulatory domain listed in Table 1. 3.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR ингибирует активность Т-клеток и содержит по меньшей мере один коингибирующий домен, перечисленный в табл. 4.The present invention also provides a CAR identified by screening a library of nucleic acids encoding synthetic modular CAR polypeptides, said CAR inhibiting T cell activity and containing at least one co-inhibitory domain listed in Table 1. 4.
В настоящем изобретении также предложена нуклеиновая кислота, кодирующая CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, включая, например, любой из CAR, описанных в настоящем документе.The present invention also provides a nucleic acid encoding a CAR identified by screening a library of nucleic acids encoding synthetic modular CAR polypeptides, including, for example, any of the CARs described herein.
Краткое описание чертежейBrief description of the drawings
На фиг. 1 представлена модульная последовательность, содержащая нуклеиновую последовательность-штрихкод, субклонированная для сборки библиотеки согласно одному варианту реализации настоящего изобретения.In FIG. 1 shows a modular sequence containing a barcode nucleic sequence subcloned to assemble a library according to one embodiment of the present invention.
На фиг. 2 представлена модульная последовательность, содержащая нуклеиновую последовательность-штрихкод, показанная на фиг. 1, после расщепления ферментом рестрикции типа IIS при подготовке к сборке библиотеки.In FIG. 2 is a modular sequence containing the nucleic barcode sequence shown in FIG. 1 after IIS digestion in preparation for library assembly.
На фиг. 3 представлен примерный фрагмент последовательности в соответствии с фиг. 1 (перед расщеплением ферментом рестрикции типа IIS (RE), SEQ ID NO: 16) и фиг. 2 (после расщепления ферментом рестрикции IIS, SEQ ID NO: 17), содержащий последовательность, кодирующую костимулирующий домен CD28 (трансляция фрагмента после расщепления ферментом рестрикции IIS, SEQ ID NO: 18).In FIG. 3 shows an exemplary fragment of the sequence according to FIG. 1 (before digestion with restriction enzyme type IIS (RE), SEQ ID NO: 16) and FIG. 2 (after cleavage with restriction enzyme IIS, SEQ ID NO: 17) containing a sequence encoding the costimulatory domain of CD28 (translation of the fragment after cleavage with restriction enzyme IIS, SEQ ID NO: 18).
На фиг. 4 представлена табл. 1. Идентификационные номера последовательностей для последовательностей, представленных в табл. 1, были следующими: индекс 1 - SEQ ID NO: 19; индекс 2 - SEQ ID NO: 20; индекс 3 - SEQ ID NO: 21; индекс 4 - SEQ ID NO: 22; индекс 5 - SEQ ID NO: 23; индекс 6 - SEQ ID NO: 24; индекс 7 - SEQ ID NO: 25; индекс 8 - SEQ ID NO: 26; индекс 9 - SEQ ID NO: 27; индекс 10 - SEQ ID NO: 28; индекс 11 - SEQ ID NO: 29; индекс 12 - SEQ ID NO: 30; индекс 13 -SEQ ID NO: 31; индекс 14 - SEQ ID NO: 32; индекс 15 - SEQ ID NO: 33; индекс 16 - SEQ ID NO: 34; индекс 17 - SEQ ID NO: 35; индекс 18 - SEQ ID NO: 36; индекс 19 - SEQ ID NO: 37; индекс 20 - SEQ ID NO: 38; индекс 21 - SEQ ID NO: 39; индекс 22 - SEQ ID NO: 40; индекс 23 - SEQ ID NO: 41; индекс 24 - SEQ ID NO: 42; индекс 25 - SEQ ID NO: 43; индекс 26 - SEQ ID NO: 44; индекс 27 - SEQ ID NO: 45; индекс 28 - SEQ ID NO: 46; индекс 29 - SEQ ID NO: 47; индекс 30 - SEQ ID NO: 48; индекс 31 - SEQ ID NO: 49; индекс 32 - SEQ ID NO: 50; индекс 33 - SEQ ID NO: 51; индекс 34 - SEQ ID NO: 52; индекс 35 - SEQ ID NO: 53; индекс 36 - SEQ ID NO: 54; индекс 37 - SEQ ID NO: 55; индекс 38 - SEQ ID NO: 56; индекс 39 - SEQ ID NO: 57; индекс 40 - SEQ ID NO: 58; индекс 41 - SEQ ID NO: 59; индекс 42 - SEQ ID NO: 60; индекс 43 - SEQ ID NO: 61; индекс 44 - SEQ ID NO: 62; индекс 45 - SEQ ID NO: 63; индекс 46 - SEQ ID NO: 64; индекс 47 - SEQ ID NO: 65; индекс 48 - SEQ ID NO: 66; индекс 49 - SEQ ID NO: 67; индекс 50 - SEQ ID NO: 68; индекс 51 - SEQ ID NO: 69; индекс 52 - SEQ ID NO: 70; индекс 53 - SEQ ID NO: 71; индекс 54 - SEQ ID NO: 72; индекс 55 - SEQ ID NO: 73; индекс 56 - SEQ ID NO: 74; индекс 57 - SEQ ID NO: 75; индекс 58 - SEQ ID NO: 76; индекс 59 - SEQ ID NO: 77; индекс 60 - SEQ ID NO: 26; индекс 61 - SEQ ID NO: 26; индекс 62 - SEQ ID NO: 26.In FIG. 4 is presented in Table. 1. Identification numbers of sequences for the sequences presented in table. 1 were as follows: index 1 - SEQ ID NO: 19; index 2 - SEQ ID NO: 20; index 3 - SEQ ID NO: 21; index 4 - SEQ ID NO: 22; index 5 - SEQ ID NO: 23; index 6 - SEQ ID NO: 24; index 7 - SEQ ID NO: 25; index 8 - SEQ ID NO: 26; index 9 - SEQ ID NO: 27; index 10 - SEQ ID NO: 28; index 11 - SEQ ID NO: 29; index 12 - SEQ ID NO: 30; index 13 -SEQ ID NO: 31; index 14 - SEQ ID NO: 32; index 15 - SEQ ID NO: 33; index 16 - SEQ ID NO: 34; index 17 - SEQ ID NO: 35; index 18 - SEQ ID NO: 36; index 19 - SEQ ID NO: 37; index 20 - SEQ ID NO: 38; index 21 - SEQ ID NO: 39; index 22 - SEQ ID NO: 40; index 23 - SEQ ID NO: 41; index 24 - SEQ ID NO: 42; index 25 - SEQ ID NO: 43; index 26 - SEQ ID NO: 44; index 27 - SEQ ID NO: 45; index 28 - SEQ ID NO: 46; index 29 - SEQ ID NO: 47; index 30 - SEQ ID NO: 48; index 31 - SEQ ID NO: 49; index 32 - SEQ ID NO: 50; index 33 - SEQ ID NO: 51; index 34 - SEQ ID NO: 52; index 35 - SEQ ID NO: 53; index 36 - SEQ ID NO: 54; index 37 - SEQ ID NO: 55; index 38 - SEQ ID NO: 56; index 39 - SEQ ID NO: 57; index 40 - SEQ ID NO: 58; index 41 - SEQ ID NO: 59; index 42 - SEQ ID NO: 60; index 43 - SEQ ID NO: 61; index 44 - SEQ ID NO: 62; index 45 - SEQ ID NO: 63; index 46 - SEQ ID NO: 64; index 47 - SEQ ID NO: 65; index 48 - SEQ ID NO: 66; index 49 - SEQ ID NO: 67; index 50 - SEQ ID NO: 68; index 51 - SEQ ID NO: 69; index 52 - SEQ ID NO: 70; index 53 - SEQ ID NO: 71; index 54 - SEQ ID NO: 72; index 55 - SEQ ID NO: 73; index 56 - SEQ ID NO: 74; index 57 - SEQ ID NO: 75; index 58 - SEQ ID NO: 76; index 59 - SEQ ID NO: 77; index 60 - SEQ ID NO: 26; index 61 - SEQ ID NO: 26; index 62 - SEQ ID NO: 26.
На фиг. 5 представлена общая схема ступенчатой сборки двумерной библиотеки комодулирующих модулей, содержащей нуклеиновые последовательности-штрихкоды, в соответствии с одним вариантом реализации настоящего изобретения.In FIG. 5 is a general diagram of a staggered assembly of a two-dimensional library of comodulating modules containing nucleic barcode sequences, in accordance with one embodiment of the present invention.
На фиг. 6 представлена общая схема получения двумерной библиотеки из 62x62 комодулирующих модулей согласно одному варианту реализации настоящего изобретения.In FIG. 6 shows a general scheme for obtaining a two-dimensional library of 62x62 comodulating modules according to one embodiment of the present invention.
На фиг. 7 представлена общая конфигурация элементов одномерной библиотеки химерных антигенных рецепторов (CAR) в соответствии с одним вариантом реализации настоящего изобретения.In FIG. 7 shows the general configuration of the elements of a one-dimensional chimeric antigen receptor (CAR) library in accordance with one embodiment of the present invention.
На фиг. 8 представлены результаты функциональной сортировки (т.е. бининга) стимулированных CAR-экспрессирующих Т-клеток на основании конечного уровня активации.In FIG. 8 shows the results of functional sorting (ie, binning) of stimulated CAR-expressing T cells based on the end level of activation.
На фиг. 9 представлены результаты количественной оценки относительного влияния каждого комодулирующего домена библиотеки на активность Т-клеток, которую осуществляли с помощью количественного секвенирования специфичных для модуля последовательностей-штрихкодов.In FIG. 9 shows the results of a quantitative assessment of the relative effect of each comodulatory domain of the library on T cell activity, which was performed using quantitative sequencing of module-specific barcode sequences.
На фиг. 10 представлены характеристики зависимости ответа от дозы для шести комодулирующих доменов при трех повышающихся уровнях вносимого антигена, полученные с использованием 62элементной одномерной библиотеки.In FIG. 10 shows the dose-response profiles for six comodulatory domains at three increasing antigen loading levels obtained using a 62-element one-dimensional library.
На фиг. 11 представлен неограничивающий пример библиотеки CAR, который свидетельствует о том, что различные домены CAR могут варьироваться в библиотеке в соответствии с одним вариантомIn FIG. 11 is a non-limiting example of a CAR library showing that different CAR domains can vary within a library according to one variant.
- 8 041085 реализации настоящего изобретения.- 8 041085 implementation of the present invention.
На фиг. 12 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In FIG. 12 is a diagram of an assembly strategy for the coding modules of the sequences containing the barcode nucleic acid sequences described herein.
На фиг. 13 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In FIG. 13 is a diagram of an assembly strategy for the coding modules of the sequences containing the barcode nucleic acid sequences described herein.
На фиг. 14 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In FIG. 14 is a diagram of an assembly strategy for the coding modules of the sequences containing the barcode nucleic acid sequences described herein.
На фиг. 15 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In FIG. 15 is a diagram of an assembly strategy for the coding modules of the sequences containing the barcode nucleic acid sequences described herein.
На фиг. 16 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In FIG. 16 is a diagram of an assembly strategy for the coding modules of the sequences containing the barcode nucleic acid sequences described herein.
На фиг. 17 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In FIG. 17 is a diagram of an assembly strategy for the coding modules of the sequences containing the barcode nucleic acid sequences described herein.
На фиг. 18 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In FIG. 18 is a diagram of an assembly strategy for the coding modules of the sequences containing the barcode nucleic acid sequences described herein.
На фиг. 19 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In FIG. 19 is a diagram of an assembly strategy for the coding modules of the sequences containing the barcode nucleic acid sequences described herein.
На фиг. 20 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In FIG. 20 is a diagram of an assembly strategy for the coding modules of the sequences containing the nucleic barcode sequences described herein.
На фиг. 21 представлена схема стратегии сборки кодирующих модули последовательностей, содержащих нуклеиновые последовательности-штрихкоды, описанных в настоящем документе.In FIG. 21 is a diagram of an assembly strategy for the coding modules of the sequences containing the nucleic barcode sequences described herein.
На фиг. 22 представлена схема стратегии комбинаторной вложенной сборки библиотеки модульных химерных антигенных рецепторов (CAR) в соответствии с вариантом реализации настоящего изобретения.In FIG. 22 is a schematic diagram of a combinatorial nested assembly strategy for a modular chimeric antigen receptor (CAR) library in accordance with an embodiment of the present invention.
На фиг. 23 представлена схема получения объединенной клеточной модульной библиотеки CAR в соответствии с вариантом реализации настоящего изобретения.In FIG. 23 is a diagram for the production of a combined CAR cellular module library in accordance with an embodiment of the present invention.
На фиг. 24 представлен схематичный пример интегрированного способа детектирования фенотипа и идентификации модульного полипептида для применения в условиях in vitro и/или в условиях in vivo в соответствии с вариантом реализации настоящего изобретения.In FIG. 24 is a schematic example of an integrated method for phenotype detection and modular polypeptide identification for in vitro and/or in vivo use in accordance with an embodiment of the present invention.
На фиг. 25 представлена табл. 2.In FIG. 25 is presented in Table. 2.
На фиг. 26 исчерпывающе представлен каждый элемент двумерной библиотеки из 61x61 элемента, согласно результатам определения путем глубокого секвенирования собранной библиотеки.In FIG. 26 is an exhaustive representation of each element of a two-dimensional library of 61x61 elements, as determined by deep sequencing of the assembled library.
На фиг. 27 представлены результаты количественной оценки элементов предварительно нормированной комбинаторной библиотеки нуклеиновых кислот, описанной в настоящем документе.In FIG. 27 shows the results of element quantification of the pre-normalized combinatorial nucleic acid library described herein.
На фиг. 28 представлено линейное уравнение, использованное при расчете корректировок для нормирования, относящихся к элементам библиотеки, количественно определенным, как показано на фиг. 27.In FIG. 28 is a linear equation used in calculating normalization adjustments related to library items quantified as shown in FIG. 27.
На фиг. 29 представлены результаты, подтверждающие предсказуемость корректировок для нормирования, выполненных в соответствии с описанным в настоящем документе способом.In FIG. 29 presents results confirming the predictability of normalization adjustments made in accordance with the method described herein.
ОпределенияDefinitions
В настоящей заявке термины полинуклеотид и нуклеиновая кислота используются взаимозаменяемо и относятся к полимерной форме нуклеотидов любой длины, как рибонуклеотидов, так и дезоксирибонуклеотидов. Следовательно, данный термин включает, но не ограничивается ими, одно-, двух- или многоцепочечную ДНК или РНК, геномную ДНК, кДНК, гибриды ДНК-РНК или полимер, содержащий пуриновые и пиримидиновые основания или другие природные, химически или биохимически модифицированные, неприродные или дериватизированные нуклеотидные основания.In this application, the terms polynucleotide and nucleic acid are used interchangeably and refer to the polymeric form of nucleotides of any length, both ribonucleotides and deoxyribonucleotides. Therefore, this term includes, but is not limited to, single-, double- or multi-stranded DNA or RNA, genomic DNA, cDNA, DNA-RNA hybrids, or a polymer containing purine and pyrimidine bases or other natural, chemically or biochemically modified, non-natural or derivatized nucleotide bases.
В настоящей заявке термины полипептид, пептид и белок используются взаимозаменяемо и относятся к полимерной форме аминокислот любой длины, которая может включать генетически кодируемые и не кодируемые генетически аминокислоты, химически или биохимически модифицированные или дериватизированные аминокислоты и полипептиды, имеющие модифицированные пептидные остовы. Термин включает гибридные белки, включая, но не ограничиваясь ими, гибридные белки с гетерологичной аминокислотной последовательностью, гибриды с гетерологичными и гомологичными лидерными последовательностями, с N-концевыми остатками метионина или без указанных остатков; иммунологически меченые белки; и т.п.In this application, the terms polypeptide, peptide and protein are used interchangeably and refer to the polymeric form of amino acids of any length, which may include genetically encoded and non-genetically encoded amino acids, chemically or biochemically modified or derivatized amino acids, and polypeptides having modified peptide backbones. The term includes fusion proteins, including, but not limited to, fusion proteins with a heterologous amino acid sequence, fusions with heterologous and homologous leader sequences, with or without N-terminal methionine residues; immunologically labeled proteins; and so on.
В настоящей заявке термины домен и мотив используются взаимозаменяемо и относятся к структурированным доменам, имеющим одну или более конкретных функций, и неструктурированным сегментам полипептида, которые, несмотря на отсутствие структурированности, сохраняют одну или более конкретных функций. Например, структурированный домен может включать, но не ограничивается ими, непрерывное или дискретное множество аминокислот, или их частей, в свернутом полипептиде, который имеет трехмерную структуру, которая вносит вклад в определенную функцию полипептида. В других случаях домен может включать неструктурированный сегмент полипептида, содержащий множество из двух или более аминокислот, или их частей, который поддерживает определенную функцию по- 9 041085 липептида, развернутого или неупорядоченного. Данное определение также включает домены, которые могут быть неупорядоченными или неструктурированными, но становятся структурированными или упорядоченными при связывании с мишенью или партнером по связыванию. Неограничивающие примеры исходно неструктурированных доменов и доменов исходно неструктурированных белков описаны, например, в Dyson & Wright. Nature Reviews Molecular Cell Biology 6:197-208.In this application, the terms domain and motif are used interchangeably and refer to structured domains having one or more specific functions and unstructured segments of a polypeptide that, despite not being structured, retain one or more specific functions. For example, a structured domain may include, but is not limited to, a continuous or discrete set of amino acids, or parts thereof, in a folded polypeptide that has a three-dimensional structure that contributes to a particular function of the polypeptide. In other cases, the domain may include an unstructured polypeptide segment containing a plurality of two or more amino acids, or portions thereof, that supports a particular function of the polypeptide, whether unfolded or disordered. This definition also includes domains that may be random or unstructured, but become structured or ordered when bound to a target or binding partner. Non-limiting examples of natively unstructured domains and domains of natively unstructured proteins are described, for example, in Dyson & Wright. Nature Reviews Molecular Cell Biology 6:197-208.
В настоящей заявке термин модуль относится к непрерывной полипептидной последовательности или ее фрагменту, который связан с той или иной функцией, в частности с биологической функцией.In the present application, the term module refers to a continuous polypeptide sequence or fragment thereof, which is associated with a particular function, in particular with a biological function.
В настоящей заявке термины химерный антигенный рецептор и CAR используются взаимозаменяемо и относятся к искусственным многомодульным молекулам, способным инициировать или ингибировать активацию иммунной клетки, которые обычно, но не исключительно, содержат внеклеточный домен (например, домен, связывающий лиганд/антиген), трансмембранный домен и один или более внутриклеточных сигнальных доменов. Термин CAR не ограничивается конкретными молекулами CAR, а также включает варианты CAR. Варианты CAR включают разделенные CAR, в которых внеклеточная часть (например, участок связывания лиганда) и внутриклеточная часть (например, внутриклеточная сигнальная часть) CAR присутствуют на двух отдельных молекулах. Варианты CAR также включают CAR-включатели и CAR-выключатели, которые представляют собой активируемые/подавляемые при определенных условиях CAR, например, указанные варианты включают расщепленный CAR, в котором условная гетеродимеризация двух частей расщепленного CAR контролируется фармакологически. Варианты CAR также включают биспецифичные CAR, которые содержат домен связывания дополнительного CAR, который может усиливать или ингибировать активность основного CAR. Варианты CAR также включают ингибиторные химерные антигенные рецепторы (iCAR), которые можно применять, например, в качестве компонента биспецифичной системы CAR, когда связывание домена связывания с дополнительным CAR приводит к ингибированию активации основного CAR. Молекулы CAR и их производные (т.е. варианты CAR) описаны, например, в заявке РСТ US2014/016527; Fedorov et al. Sci Transl Med (2013) ;5(215):215ra172; Glienke et al. Front Pharmacol (2015) 6:21; Kakarla & Gottschalk 52 Cancer J (2014) 20(2): 151-5; Riddell et al. Cancer J (2014) 20(2): 141-4; Pegram et al. Cancer J (2014) 20(2): 127-33; Cheadle et al. Immunol Rev (2014) 257(1):91-106; Barrett et al. Annu Rev Med (2014) 65:333-47; Sadelain et al. Cancer Discov (2013) 3(4):388-98; Cartellieri et al., J Biomed Biotechnol (2010) 956304, содержание которых полностью включено в настоящую заявку посредством ссылки.In this application, the terms chimeric antigen receptor and CAR are used interchangeably and refer to artificial multi-module molecules capable of initiating or inhibiting immune cell activation, which usually, but not exclusively, contain an extracellular domain (for example, a ligand/antigen binding domain), a transmembrane domain, and one or more intracellular signaling domains. The term CAR is not limited to specific CAR molecules, but also includes CAR variants. CAR variants include separated CARs in which an extracellular portion (eg, ligand binding site) and an intracellular portion (eg, intracellular signaling portion) of the CAR are present on two separate molecules. CAR variants also include CAR switches and CAR switches, which are conditionally activated/suppressed CARs, for example, these variants include a cleaved CAR in which the conditional heterodimerization of the two parts of the cleaved CAR is controlled pharmacologically. CAR variants also include bispecific CARs that contain an additional CAR binding domain that can enhance or inhibit the activity of the main CAR. CAR variants also include inhibitory chimeric antigen receptors (iCARs), which can be used, for example, as a component of a bispecific CAR system where binding of a binding domain to an additional CAR results in inhibition of activation of the primary CAR. CAR molecules and their derivatives (ie, CAR variants) are described, for example, in PCT application US2014/016527; Fedorov et al. Sci Transl Med (2013) ;5(215):215ra172; Glienke et al. Front Pharmacol (2015) 6:21; Kakarla & Gottschalk 52 Cancer J (2014) 20(2): 151-5; Riddell et al. Cancer J (2014) 20(2): 141-4; Pegram et al. Cancer J (2014) 20(2): 127-33; Headle et al. Immunol Rev (2014) 257(1):91-106; Barrett et al. Annu Rev Med (2014) 65:333-47; Sadelain et al. Cancer Discov (2013) 3(4):388-98; Cartellieri et al., J Biomed Biotechnol (2010) 956304, the contents of which are hereby incorporated by reference in their entirety.
Термин ген относится к определенной единице наследственности, присутствующей в определенном локусе в генетическом компоненте организма. Ген может представлять собой последовательность нуклеиновой кислоты, например, последовательность ДНК или РНК, присутствующую в геноме нуклеиновых кислот, геноме ДНК или РНК, организма, и, в некоторых случаях, может присутствовать на хромосоме. Ген может представлять собой последовательность ДНК, кодирующую мРНК, которая кодирует белок. Ген может состоять из одного экзона и может не иметь интронов или может содержать несколько экзонов и один или более интронов. Одна из двух или более идентичных или альтернативных форм гена, присутствующих в определенном локусе, называется аллель, и, например, диплоидный организм обычно будет иметь два аллеля определенного гена. Новые аллели определенного гена могут возникнуть природным или искусственным путем посредством природной или индуцированной мутации и могут распространяться путем размножения или клонирования. Ген или аллель может быть выделен из генома организма и реплицирован и/или подвергнут манипуляциям, или ген или аллель может быть модифицирован в условиях in situ методами генной терапии. Локус гена или аллель может иметь связанные регуляторные элементы, и генная терапия, в некоторых случаях, может включать модификацию регуляторных элементов гена или аллеля, оставляя кодирующие последовательности гена или аллеля немодифицированными.The term gene refers to a specific unit of heredity present at a specific locus in the genetic component of an organism. A gene may be a nucleic acid sequence, such as a DNA or RNA sequence, present in the nucleic acid genome, DNA or RNA genome, of an organism, and, in some cases, may be present on a chromosome. A gene may be a DNA sequence encoding an mRNA that codes for a protein. A gene may consist of a single exon and may have no introns, or may contain multiple exons and one or more introns. One of two or more identical or alternative forms of a gene present at a particular locus is called an allele and, for example, a diploid organism will typically have two alleles for a particular gene. New alleles for a particular gene may arise naturally or artificially through natural or induced mutation, and may be propagated by reproduction or cloning. The gene or allele may be isolated from the genome of the organism and replicated and/or manipulated, or the gene or allele may be modified in situ by gene therapy techniques. A gene locus or allele may have associated regulatory elements, and gene therapy, in some cases, may involve modification of the regulatory elements of a gene or allele, leaving the coding sequences of the gene or allele unmodified.
Термин функционально соединенный относится к сопоставлению, при котором описанные компоненты взаимосвязаны, что позволяет им функционировать предполагаемым способом. Например, промотор функционально соединен с кодирующей последовательностью, если промотор влияет на ее транскрипцию или экспрессию.The term operably linked refers to an alignment in which the described components are interconnected, allowing them to function in the intended manner. For example, a promoter is operably linked to a coding sequence if the promoter affects its transcription or expression.
Вектор или вектор экспрессии представляет собой репликон, такой как плазмида, фаг, вирус или космида, к которому может быть присоединен другой сегмент ДНК, т.е. вставка, чтобы вызвать репликацию присоединенного сегмента в клетке.An expression vector or vector is a replicon, such as a plasmid, phage, virus, or cosmid, to which another DNA segment can be attached, i.e. insertion to cause replication of the attached segment in the cell.
В настоящей заявке термин гетерологичный означает нуклеотидную или полипептидную последовательность, которая не встречается в нативной (например, природной) нуклеиновой кислоте или белке, соответственно.In this application, the term heterologous means a nucleotide or polypeptide sequence that does not occur in native (eg, natural) nucleic acid or protein, respectively.
Термины антитела и иммуноглобулин включают антитела или иммуноглобулины любого изотипа, фрагменты антител, которые сохраняют специфичное связывание с антигеном, включая, но не ограничиваясь ими, фрагменты Fab, Fv, scFv и Fd, химерные антитела, гуманизированные антитела, одноцепочечные антитела и гибридные белки, содержащие антигенсвязывающую часть антитела и белка, не относящегося к антителам.The terms antibodies and immunoglobulin include antibodies or immunoglobulins of any isotype, antibody fragments that retain specific binding to an antigen, including, but not limited to, Fab, Fv, scFv, and Fd fragments, chimeric antibodies, humanized antibodies, single-chain antibodies, and fusion proteins containing the antigen-binding portion of an antibody and a non-antibody protein.
Фрагменты антитела содержат часть интактного антитела, например антигенсвязывающую или вариабельную область интактного антитела. Примеры фрагментов антител включают фрагменты Fab,Antibody fragments contain a portion of an intact antibody, such as the antigen-binding or variable region of an intact antibody. Examples of antibody fragments include Fab fragments,
- 10 041085- 10 041085
Fab', F(ab')2 и Fv; диатела; линейные антитела (Zapata et al., Protein Eng. 8(10): 1057-1062 (1995)); молекулы одноцепочечных антител; и полиспецифичные антитела, образованные из фрагментов антител. Расщепление антител папаином позволяет получить два идентичных антигенсвязывающих фрагмента, называемых фрагментами Fab, каждый из которых содержит один антигенсвязывающий сайт, и остаточный фрагмент Fc, обозначение, которое отражает способность фрагмента легко кристаллизоваться. Обработка пепсином позволяет получить фрагмент F(ab')2, который содержит два антигенсвязывающих сайта и по-прежнему способен к сшиванию антигена.Fab', F(ab')2 and Fv; diabody; linear antibodies (Zapata et al., Protein Eng. 8(10): 1057-1062 (1995)); single chain antibody molecules; and polyspecific antibodies formed from antibody fragments. Cleavage of antibodies with papain produces two identical antigen-binding fragments, called Fab fragments, each containing one antigen-binding site, and a residual Fc fragment, a designation that reflects the ability of the fragment to easily crystallize. Pepsin treatment produces an F(ab') 2 fragment that contains two antigen binding sites and is still capable of antigen crosslinking.
Одноцепочечные Fv или sFv фрагменты антитела содержат домены VH и VL антитела, причем указанные домены присутствуют в одной полипептидной цепи. Согласно некоторым вариантам реализации настоящего изобретения полипептид Fv дополнительно содержит полипептидный линкер между доменами VH и VL, который позволяет sFv формировать желаемую структуру для связывания антигена. Для обзора sFv см. Pluckthun in The Pharmacology of Monoclonal Antibodies, vol. 113, Rosenburg and Moore eds., Springer-Verlag, New York, pp. 269-315 (1994).Single chain Fv or sFv fragments of an antibody contain the VH and V L domains of the antibody, these domains being present in the same polypeptide chain. In some embodiments, the Fv polypeptide further comprises a polypeptide linker between the VH and VL domains that allows the sFv to form the desired structure for antigen binding. For a review of sFv, see Pluckthun in The Pharmacology of Monoclonal Antibodies, vol. 113, Rosenburg and Moore eds., Springer-Verlag, New York, pp. 269-315 (1994).
В настоящей заявке термин аффинность относится к константе равновесия для обратимого связывания двух агентов и выражается как константа диссоциации (Kd).In this application, the term affinity refers to the equilibrium constant for the reversible binding of two agents and is expressed as a dissociation constant (Kd).
Аффинность может быть по меньшей мере в 1 раз больше, по меньшей мере в 2 раза больше, по меньшей мере в 3 раза больше, по меньшей мере в 4 раза больше, по меньшей мере в 5 раз больше, по меньшей мере в 6 раз больше, по меньшей мере в 7 раз больше, по меньшей мере в 8 раз больше, по меньшей мере в 9 раз больше, по меньшей мере в 10 раз больше, по меньшей мере в 20 раз больше, по меньшей мере в 30 раз больше, по меньшей мере в 40 раз больше, по меньшей мере в 50 раз больше, по меньшей мере в 60 раз больше, по меньшей мере в 70 раз больше, по меньшей мере в 80 раз больше, по меньшей мере в 90 раз больше, по меньшей мере в 100 раз больше или по меньшей мере в 1000 раз больше или более, чем аффинность антитела в отношении нецелевых аминокислотных последовательностей. Аффинность антитела в отношении целевого белка может быть, например, от приблизительно 100 до приблизительно 0,1 наномоль нМ, от приблизительно 100 нМ до приблизительно 1 пикомоль (пМ) или от приблизительно 100 нМ до приблизительно 1 фемтомоль (фМ) или более.Affinity can be at least 1 fold, at least 2 fold, at least 3 fold, at least 4 fold, at least 5 fold, at least 6 fold , at least 7 times more, at least 8 times more, at least 9 times more, at least 10 times more, at least 20 times more, at least 30 times more, according to at least 40 times more, at least 50 times more, at least 60 times more, at least 70 times more, at least 80 times more, at least 90 times more, at least 100 times greater, or at least 1000 times greater, or greater than the affinity of the antibody for non-target amino acid sequences. The affinity of an antibody for a target protein can be, for example, from about 100 to about 0.1 nanomoles nM, from about 100 nM to about 1 picomole (pM), or from about 100 nM to about 1 femtomol (fM) or more.
Термин связывание относится к непосредственной связи двух молекул посредством, например, ковалентных, электростатических, гидрофобных и ионных и/или водородных связей, включая такие взаимодействия как солевые мостики и водные мостики. Неспецифичное связывание относится к связыванию с величиной аффинности менее приблизительно 10-7 М, например к связыванию с аффинностью 10-6 М, 10-5 М, 10-4М и т.д.The term bonding refers to the direct bonding of two molecules through, for example, covalent, electrostatic, hydrophobic and ionic and/or hydrogen bonds, including such interactions as salt bridges and water bridges. Non-specific binding refers to binding with an affinity value of less than about 10 -7 M, such as binding with an affinity of 10 -6 M, 10 -5 M, 10 -4 M, and so on.
В настоящей заявке термин иммунные клетки обычно включает белые клетки крови (лейкоциты), которые получены из гемопоэтических стволовых клеток (HSC), вырабатываемых в костном мозге. Иммунные клетки включают, например, лимфоциты (Т-клетки, В-клетки, природные клетки-киллеры (NK)) и клетки миелоидного происхождения (нейтрофилы, эозинофилы, базофилы, моноциты, макрофаги и дендритные клетки).In this application, the term immune cells generally includes white blood cells (leukocytes) that are derived from hematopoietic stem cells (HSC) produced in the bone marrow. Immune cells include, for example, lymphocytes (T cells, B cells, natural killer (NK) cells) and cells of myeloid origin (neutrophils, eosinophils, basophils, monocytes, macrophages and dendritic cells).
Термин Т-клетка включает все типы иммунных клеток, экспрессирующих CD3, включая хелперные Т-клетки (CD4+ клетки), цитотоксические Т-клетки (CD8+ клетки), регуляторные Т-клетки (Treg) и гамма-дельта Т-клетки.The term T cell includes all types of CD3-expressing immune cells, including helper T cells (CD4+ cells), cytotoxic T cells (CD8+ cells), regulatory T cells (Treg), and gamma delta T cells.
Термин цитотоксическая клетка включает CD8+ Т-клетки, природные клетки-киллеры (NK) и нейтрофилы, которые способны опосредовать цитотоксические ответы.The term cytotoxic cell includes CD8+ T cells, natural killer (NK) cells, and neutrophils that are capable of mediating cytotoxic responses.
В настоящей заявке термин стволовая клетка обычно включает плюрипотентные или мультипотентные стволовые клетки. Стволовые клетки включают, например, эмбриональные стволовые клетки (ES); мезенхимальные стволовые клетки (MSC); индуцированные плюрипотентные стволовые клетки (iPS); и коммитированные клетки-предшественники (гемопоэтические стволовые клетки (HSC), клетки, полученные из костного мозга, и т.д.).In this application, the term stem cell usually includes pluripotent or multipotent stem cells. Stem cells include, for example, embryonic stem cells (ES); mesenchymal stem cells (MSC); induced pluripotent stem cells (iPS); and committed progenitor cells (hematopoietic stem cells (HSC), cells derived from bone marrow, etc.).
В настоящей заявке термин лечение, лечащий и т.п. относятся к получению желательного фармакологического и/или физиологического действия. Действие может быть профилактическим с точки зрения полного или частичного предотвращения заболевания или его симптома и/или может быть терапевтическим с точки зрения частичного или полного излечения заболевания и/или нежелательного явления, связанного с заболеванием. В настоящей заявке термин лечение охватывает любой способ лечения заболевания у млекопитающего, например у человека, и включает: (а) предотвращение возникновения заболевания у субъекта, который может быть предрасположен к заболеванию, но у которого данное заболевание еще не было диагностировано; (b) ингибирование заболевания, т.е. прекращение его развития; и (с) облегчение заболевания, т.е. индукцию регресса заболевания.In the present application, the term treatment, treating, etc. relate to obtaining the desired pharmacological and/or physiological action. The action may be prophylactic in terms of completely or partially preventing a disease or symptom thereof and/or may be therapeutic in terms of partially or completely curing a disease and/or an adverse event associated with the disease. As used herein, the term treatment encompasses any method of treating a disease in a mammal, such as a human, and includes: (a) preventing the onset of a disease in a subject who may be predisposed to the disease but in which the disease has not yet been diagnosed; (b) inhibition of the disease, ie. cessation of its development; and (c) alleviating the disease, ie. induction of disease regression.
В настоящей заявке термины индивидуум, субъект, хозяин и пациент используются взаимозаменяемо и относятся к млекопитающему, включая, но не ограничиваясь ими, мышевидных грызунов (например, крыс, мышей), зайцеобразных (например, кроликов), приматов, отличных от человека, человека, собачьих, кошачьих, копытных (например, лошадей, крупный рогатый скот, овец, свиней, коз) и т.д.In this application, the terms individual, subject, host, and patient are used interchangeably and refer to a mammal, including, but not limited to, murine rodents (e.g., rats, mice), lagomorphs (e.g., rabbits), non-human primates, humans, canine, feline, ungulate (e.g. horse, cattle, sheep, pig, goat), etc.
Терапевтически эффективное количество или эффективное количество относится к количеству агента, или комбинированным количествам двух агентов, которое, при введении млекопитающему илиA therapeutically effective amount or effective amount refers to the amount of an agent, or combined amounts of the two agents, which, when administered to a mammal or
- 11 041085 другому субъекту для лечения заболевания, является достаточным для осуществления указанного лечения заболевания. Терапевтически эффективное количество будет варьироваться в зависимости от агента(ов), заболевания и степени его тяжести, а также от возраста, массы и т.д., субъекта, подлежащего лечению.- 11 041085 to another subject for the treatment of the disease is sufficient to carry out the specified treatment of the disease. A therapeutically effective amount will vary depending on the agent(s), the disease and its severity, as well as the age, weight, etc., of the subject being treated.
Термины контроль, контрольная реакция, контрольное количественное исследование и т.п. относятся к реакции, тесту или другой части экспериментальной или диагностической процедуры или дизайна эксперимента, для которых ожидаемый результат известен с высокой степенью достоверности, например, для того чтобы указать, являются ли результаты, полученные из соответствующих экспериментальных образцов надежными, указать с какой степенью достоверности соответствующие экспериментальные результаты указывают на истинный результат и/или чтобы обеспечить калибровку экспериментальных результатов. Например, в некоторых случаях, контроль может представлять собой отрицательный контроль так, что существенный компонент количественного исследования исключается из реакции отрицательного контроля так, что экспериментатор может иметь высокую степень уверенности в том, что реакция отрицательного контроля не приведет к положительному результату. В некоторых случаях контроль может представлять собой положительный контроль так, что все компоненты конкретного количественного исследования охарактеризованы и известны, при их объединении, для получения конкретного результата в количественном исследовании, выполняемом экспериментатором, который может иметь высокую степень уверенности в том, что реакция положительного контроля не приведет к отсутствию положительного результата.Terms control, control reaction, control quantitative study, etc. refer to a reaction, test or other part of an experimental or diagnostic procedure or experimental design for which the expected outcome is known with a high degree of certainty, e.g. experimental results indicate the true result and/or to provide calibration of the experimental results. For example, in some cases, the control may be a negative control such that an essential component of the assay is excluded from the negative control reaction so that the experimenter can have a high degree of confidence that the negative control reaction will not lead to a positive result. In some cases, the control may be a positive control such that all components of a particular assay are characterized and known, when combined, to produce a specific result in a assay performed by an experimenter who can have a high degree of confidence that the positive control's response is not lead to no positive outcome.
В настоящей заявке термин праймер или олигонуклеотидный праймер относится к олигонуклеотиду, который инициирует синтез комплементарной цепи нуклеиновой кислоты в условиях, когда индуцируется синтез продукта удлинения праймера, например, в присутствии нуклеотидов и агента, индуцирующего полимеризацию, такого как ДНК- или РНК-полимераза, и при подходящей температуре, рН, концентрации металлов и концентрации соли. Праймеры обычно имеют длину, совместимую с их использованием при синтезе продуктов удлинения праймера, и могут иметь длину, которая находиться в диапазоне от 8 до 100 нуклеотидов, например от 10 до 75, от 15 до 60, от 15 до 40, от 18 до 30, от 20 до 40, от 21 до 50, от 22 до 45, от 25 до 40 и т.д., включая диапазон 18-40, 20-35, 21-30 нуклеотидов и любую длину в пределах указанных диапазонов. В некоторых случаях длина праймеров может находиться в пределах диапазона от 10 до 50 нуклеотидов, например 15-45, 18-40, 20-30, 21-25 и т.д., и праймер может иметь любую длину в пределах указанных диапазонов. Согласно некоторым вариантам реализации настоящего изобретения праймеры обычно содержат не более 10, 12, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65 или 70 нуклеотидов.As used herein, the term primer or oligonucleotide primer refers to an oligonucleotide that initiates the synthesis of a complementary nucleic acid strand under conditions where synthesis of a primer extension product is induced, for example, in the presence of nucleotides and a polymerization-inducing agent such as DNA or RNA polymerase, and at suitable temperature, pH, metal concentration and salt concentration. Primers are generally of a length compatible with their use in the synthesis of primer extension products and may be in the range of 8 to 100 nucleotides, e.g. 10 to 75, 15 to 60, 15 to 40, 18 to 30 , 20 to 40, 21 to 50, 22 to 45, 25 to 40, etc., including the range of 18-40, 20-35, 21-30 nucleotides, and any length within these ranges. In some cases, the length of the primers may be within the range of 10 to 50 nucleotides, such as 15-45, 18-40, 20-30, 21-25, etc., and the primer may be any length within these ranges. In some embodiments of the present invention, primers typically contain no more than 10, 12, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60 , 65 or 70 nucleotides.
Термины гибридизоваться и гибридизация относятся к образованию комплексов между нуклеотидными последовательностями, которые достаточно комплементарны, чтобы образовывать комплексы посредством спаривания оснований по Уотсону-Крику. Например, при гибридизации праймера с мишенью (матрицей) такие комплексы (или гибриды) достаточно стабильны, чтобы обеспечивать прайминг, необходимый, например, для инициирования синтеза ДНК ДНК-полимеразой.The terms hybridize and hybridize refer to the formation of complexes between nucleotide sequences that are complementary enough to form complexes via Watson-Crick base pairing. For example, when hybridizing a primer with a target (template), such complexes (or hybrids) are stable enough to provide the priming necessary, for example, to initiate DNA synthesis by DNA polymerase.
Термин биологический образец включает множество типов образцов, полученных от индивидуума или популяции индивидуумов, и может быть использован в диагностическом, контрольном или скрининговом количественном исследовании. Определение включает кровь и другие жидкие образцы биологического происхождения, образцы плотных тканей, такие как образец биопсии или культур тканей или полученные из них клетки и их потомство. Определение также включает образцы, которые были обработаны каким-либо образом после их получения, например, путем смешивания или объединения отдельных образцов, обработки реагентами, солюбилизации или обогащения определенными компонентами, такие как клетки, полинуклеотиды, полипептиды и т.д. Термин биологический образец включает клинический образец, а также включает клетки в культуре, клеточные супернатанты, клеточные лизаты, сыворотку, плазму, биологическую жидкость и образцы тканей. Термин биологический образец включает мочу, слюну, спинномозговую жидкость, интерстициальную жидкость, глазную жидкость, синовиальную жидкость, фракции крови, такие как плазма крови и сыворотка крови, и т.п. Термин биологический образец также включает образцы плотных тканей, образцы культур тканей и клеточные образцы.The term biological sample includes many types of samples obtained from an individual or a population of individuals and can be used in a diagnostic, control, or screening quantitative study. The definition includes blood and other liquid samples of biological origin, solid tissue samples such as biopsy samples or tissue cultures or cells derived from them, and their progeny. The definition also includes samples that have been processed in some way after they were received, for example, by mixing or combining individual samples, treatment with reagents, solubilization or enrichment with certain components, such as cells, polynucleotides, polypeptides, etc. The term biological sample includes a clinical sample and also includes cells in culture, cell supernatants, cell lysates, serum, plasma, biological fluid, and tissue samples. The term biological sample includes urine, saliva, cerebrospinal fluid, interstitial fluid, ocular fluid, synovial fluid, blood fractions such as blood plasma and blood serum, and the like. The term biological sample also includes solid tissue samples, tissue culture samples, and cell samples.
Термин оценка включает любую форму измерения и включает определение присутствия или отсутствия элемента. Термины определение, измерение, исследование, оценка и количественное исследование используются взаимозаменяемо и включают количественные и качественные определения. Оценка может быть относительной или абсолютной. Оценка присутствия включает определение количества присутствующего объекта и/или определение его присутствия или отсутствия. В настоящей заявке термины определение, измерение и оценка и количественное исследование используются взаимозаменяемо и включают количественные и качественные определения.The term evaluation includes any form of measurement and includes determining the presence or absence of an element. The terms definition, measurement, research, evaluation and quantitative research are used interchangeably and include quantitative and qualitative definitions. The assessment can be relative or absolute. Presence estimation includes determining the amount of an object present and/or determining its presence or absence. In this application, the terms definition, measurement and evaluation and quantitative research are used interchangeably and include quantitative and qualitative definitions.
Настоящее изобретение будет дополнительно описано ниже, однако следует понимать, что настоящее изобретение не ограничено конкретными описанными вариантами реализации, поскольку очевидно, что они могу варьироваться. Также следует понимать, что терминология, используемая в настоящем документе, предназначена исключительно для описания конкретных вариантов реализации и не предназначена для ограничения, поскольку объем настоящего изобретения будет ограничен только прилагаемойThe present invention will be further described below, however, it should be understood that the present invention is not limited to the specific embodiments described, as it is obvious that they may vary. It should also be understood that the terminology used herein is for the sole purpose of describing particular embodiments and is not intended to be limiting, as the scope of the present invention will only be limited by the appended
- 12 041085 формулой изобретения.- 12 041085 claims.
В тех случаях, когда представлен диапазон значений, следует понимать, что каждое промежуточное значение, до десятой части единицы нижнего предела, если из контекста явно не следует иное, между верхним и нижним пределом указанного диапазона и любым другим заявленным или промежуточным значением в указанном диапазоне, включено в область настоящего изобретения. Верхний и нижний пределы указанных меньших диапазонов могут быть независимо включены в меньшие диапазоны и также включены в область настоящего изобретения, с учетом любого конкретно исключенного предела в указанном диапазоне. В тех случаях, когда указанный диапазон включает один или оба предела, в область настоящего изобретения также включены диапазоны, исключающие один или оба из указанных включенных пределов.Where a range of values is provided, it should be understood that each intermediate value, up to a tenth of a unit of the lower limit, unless the context clearly requires otherwise, between the upper and lower limits of the specified range and any other declared or intermediate value in the specified range, included in the scope of the present invention. The upper and lower limits of these smaller ranges may be independently included in the smaller ranges and are also included within the scope of the present invention, subject to any specifically excluded limit within the specified range. In cases where the specified range includes one or both of the limits, ranges excluding one or both of the specified included limits are also included in the scope of the present invention.
Если не указано иное, в настоящей заявке все технические и научные термины имеют то же значение, которое обычно понятно специалисту в данной области техники, к которой относится настоящее изобретение. Несмотря на то, что любые способы и материалы, аналогичные или эквивалентные тем, которые описаны в настоящем документе, также могут быть использованы при реализации настоящего изобретения или при испытаниях настоящего изобретения, в настоящем документе описаны предпочтительные способы и материалы. Все публикации, упомянутые в настоящем документе, включены в настоящую заявку посредством ссылки для раскрытия и описания способов и/или материалов, в связи с которыми цитируются публикации.Unless otherwise indicated, in this application, all technical and scientific terms have the same meaning as is usually understood by a person skilled in the art to which the present invention pertains. Although any methods and materials similar or equivalent to those described herein can also be used in the implementation of the present invention or when testing the present invention, preferred methods and materials are described herein. All publications mentioned in this document are incorporated into this application by reference for the disclosure and description of the methods and/or materials in connection with which the publications are cited.
Следует отметить, что в настоящей заявке и в прилагаемой формуле изобретения формы единственного числа включают множественные формы референтов, если из контекста явно не следует иное. Например, ссылка на полипептид включает множество таких полипептидов, и ссылка на антиген включает ссылку на один или более антигенов и их эквивалентов, известных специалистам в данной области техники, и т.д. Также следует отметить, что формула настоящего изобретения может быть составлена для исключения любого необязательного элемента. Следовательно, данное заявление предназначено для применения в качестве предшествующей основы для использования такой исключающей терминологии как исключительно, только и т.п. в отношении описания элементов формулы настоящего изобретения или использования отрицательного ограничения.It should be noted that in this application and in the appended claims, singular forms include plural forms of referents, unless the context clearly indicates otherwise. For example, a reference to a polypeptide includes a plurality of such polypeptides, and a reference to an antigen includes a reference to one or more antigens and their equivalents known to those skilled in the art, and so on. It should also be noted that the claims of the present invention may be drafted to exclude any optional element. Therefore, this statement is intended to be used as a foregoing basis for the use of such exclusionary terminology as exclusively, only, and the like. regarding the description of the elements of the claims of the present invention or the use of a negative limitation.
Следует понимать, что некоторые признаки настоящего изобретения, которые для ясности описаны применительно к отдельным вариантам реализации, также могут быть представлены в комбинации в одном варианте реализации. И наоборот, различные признаки изобретения, которые для краткости описаны применительно к одному варианту реализации, также могут быть представлены по отдельности или в любой подходящей дополнительной комбинации. Все комбинации вариантов реализации, относящихся к настоящему изобретению, конкретно охватываются настоящим изобретением и раскрыты в настоящем документе точно так же, как если бы каждая комбинация была индивидуально и явно раскрыта. Помимо этого все дополнительные комбинации различных вариантов реализации и их элементов также конкретно включены в область настоящего изобретения и раскрыты в настоящем документе точно так же, как если бы каждая такая дополнительная комбинация была индивидуально и явно раскрыта в настоящем документе.It should be understood that some of the features of the present invention, which for clarity are described in relation to individual implementation options, can also be presented in combination in one embodiment. Conversely, various features of the invention, which are described for brevity in relation to one implementation variant, can also be presented individually or in any suitable additional combination. All combinations of embodiments relating to the present invention are specifically covered by the present invention and are disclosed herein in the same way as if each combination were individually and expressly disclosed. In addition, all additional combinations of various embodiments and their elements are also specifically included in the scope of the present invention and are disclosed herein in the same way as if each such additional combination were individually and expressly disclosed herein.
Публикации, обсуждаемые в настоящем документе, представлены исключительно для их раскрытия до даты подачи настоящей заявки. Ничто из содержащегося в настоящем документе не должно быть истолковано как допущение того, что изобретение не имеет права предшествовать такому раскрытию на основании предшествующего изобретения. Помимо этого даты представленных публикаций могут отличаться от фактических дат публикаций, которые, возможно, необходимо будет подтвердить самостоятельно.The publications discussed herein are provided solely for their disclosure prior to the filing date of this application. Nothing contained herein should be construed as an admission that the invention has no right to precede such disclosure by virtue of prior invention. In addition, the dates of the submitted publications may differ from the actual dates of publications, which may need to be confirmed independently.
Подробное описание изобретенияDetailed description of the invention
В настоящем изобретении предложены библиотеки синтетических модульных полипептидов и нуклеиновые кислоты, кодирующие указанные библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы получения библиотек синтетических модульных полипептидов и нуклеиновых кислот, кодирующих библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы скрининга библиотеки синтетических модульных полипептидов для идентификации выбранного фенотипа, связанного с элементом библиотеки синтетических модульных полипептидов, причем указанные способы можно применять в количественных исследованиях в условиях in vitro и в условиях in vivo.The present invention provides synthetic modular polypeptide libraries and nucleic acids encoding said synthetic modular polypeptide libraries. The present invention also provides methods for obtaining libraries of synthetic modular polypeptides and nucleic acids encoding libraries of synthetic modular polypeptides. The present invention also provides methods for screening a library of synthetic modular polypeptides to identify a selected phenotype associated with an element of the library of synthetic modular polypeptides, which methods can be used in quantitative studies in vitro and in vivo conditions.
Библиотеки.Libraries.
Аспекты настоящего изобретения относятся к библиотекам нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которые кодируют множество синтетических модульных полипептидов. Аспекты настоящего изобретения также включают клеточные библиотеки, в которых каждая клетка экспрессирует отдельную нуклеиновую кислоту, содержащую нуклеиновую последовательность-штрихкод, кодирующую уникальный синтетический модульный полипептид, или множество указанных индивидуальных нуклеиновых кислот, содержащих нуклеиновые последовательностиштрихкоды. Как описано более подробно ниже, аспекты настоящего изобретения также включают способы получения указанных библиотек и способы скрининга указанных библиотек для детектированияAspects of the present invention relate to libraries of nucleic acids containing nucleic barcode sequences that encode a plurality of synthetic modular polypeptides. Aspects of the present invention also include cell libraries in which each cell expresses a single nucleic acid containing a barcode nucleic acid sequence encoding a unique synthetic modular polypeptide, or a plurality of said individual nucleic acids containing barcode nucleic acid sequences. As described in more detail below, aspects of the present invention also include methods for obtaining said libraries and methods for screening said libraries for detection.
- 13 041085 конкретных фенотипов.- 13 041085 specific phenotypes.
Библиотеки нуклеиновых кислот согласно настоящему изобретению обычно комбинаторно собраны из модульных компонентов и включают многозвенную последовательность-штрихкод, которую можно секвенировать, чтобы определить идентичность и конфигурацию модульных компонентов каждого элемента библиотеки. Следовательно, каждый отдельный элемент библиотеки нуклеиновых кислот будет содержать, по меньшей мере, кодирующую область и область нуклеиновой последовательностиштрихкода. В настоящей заявке термин кодирующая область, поскольку он относится к отдельным элементам библиотеки нуклеиновых кислот, относится к области каждой нуклеиновой кислоты, которая кодирует синтетический полипептид, представляющий интерес, например синтетический полипептид, содержащий один или более полипептидных модулей, которые могут быть подвергнуты скринингу для определения их влияния на конкретный желательный или нежелательный фенотип. В некоторых случаях кодирующая область может дополнительно содержать последовательности, кодирующие репортерную молекулу, например молекулу, которая используется для детектирования и/или измерения экспрессии представляющего интерес синтетического полипептида.Nucleic acid libraries of the present invention are typically assembled combinatorially from modular components and include a ladder barcode sequence that can be sequenced to determine the identity and configuration of the modular components of each element of the library. Therefore, each individual element of the nucleic acid library will contain at least a coding region and a barcode nucleic sequence region. In this application, the term coding region, as it refers to individual elements of a nucleic acid library, refers to the region of each nucleic acid that encodes a synthetic polypeptide of interest, for example, a synthetic polypeptide containing one or more polypeptide modules that can be screened to determine their influence on a particular desirable or undesirable phenotype. In some cases, the coding region may further comprise sequences encoding a reporter molecule, such as a molecule that is used to detect and/or measure the expression of a synthetic polypeptide of interest.
Кодирующая область обычно кодирует один модульный полипептид, более подробно описанный ниже; однако настоящее описание не исключает библиотеки, в которых кодирующая область каждого элемента библиотеки кодирует два или более отдельных модульных полипептидов. Такие элементы библиотеки могут включать одну кодирующую область, которая является полицистронной (например, бицистронной, полицистронной и т.д.), например, путем включения разделимого линкера (например, участка внутренней посадки рибосомы (IRES), рибосомальной шунтирующей последовательности, нуклеиновой кислоты, кодирующей саморасщепляющийся пептид, и т.д.) между последовательностями, кодирующими разделяемые модульные полипептиды. Кодирующая область, содержащая последовательность, кодирующую два или более отдельных модульных полипептидов, будет непрерывной и будет собрана и подвергнута скринингу в соответствии со способами, описанными в настоящем документе для одномодульных полипептидных конструкций.The coding region typically encodes a single modular polypeptide, described in more detail below; however, the present description does not exclude libraries in which the coding region of each element of the library encodes two or more separate modular polypeptides. Such library elements may include a single coding region that is polycistronic (e.g., bicistronic, polycistronic, etc.), e.g., by including a separable linker (e.g., internal ribosome entry site (IRES), ribosomal shunt sequence, nucleic acid encoding self-cleaving peptide, etc.) between sequences encoding shared modular polypeptides. A coding region containing a sequence encoding two or more separate modular polypeptides will be contiguous and will be assembled and screened according to the methods described herein for single-module polypeptide constructs.
Кодирующая область будет содержать вариабельные модули и невариабельные модули, причем предполагаемый способ применения библиотеки будет определять, является ли конкретная часть синтетического модульного полипептида вариабельной или невариабельной. Вариабельные модули кодирующей области обычно представляют собой те модули, которые подвергают скринингу, индивидуально или комбинаторно, для определения функционального свойства и/или влияния на представляющий интерес фенотип. В целом, вариабельные модули будут связаны с последовательностью-штрихкодом, идентифицирующей модуль, тогда как невариабельные модули не будут связаны с последовательностьюштрихкодом. Любой модуль может служить вариабельным или невариабельным модулем в зависимости от конструкции конкретной библиотеки и/или способа скрининга, с которым связана библиотека.The coding region will contain variable modules and non-variable modules, and the intended use of the library will determine whether a particular portion of the synthetic modular polypeptide is variable or non-variable. Coding region variable modules are typically those modules that are screened, individually or combinatorially, to determine a functional property and/or effect on a phenotype of interest. In general, variable modules will be associated with a barcode sequence identifying the module, while non-variable modules will not be associated with a barcode sequence. Any module may serve as a variable or non-variable module depending on the design of the particular library and/or the screening method with which the library is associated.
В качестве неограничивающего примера в некоторых вариантах реализации, в которых кодирующая область кодирует химерный антигенный рецептор (CAR), любой модуль CAR может служить в качестве вариабельного модуля в зависимости от активности CAR, которую подвергают скринингу, включая, помимо прочего, внеклеточный домен, корегуляторный домен или первичный сигнальный домен. Например, на фиг. 11 представлен один элемент библиотеки CAR, в которой каждый член библиотеки содержит внеклеточный домен, корегуляторный домен и первичный сигнальный домен и предоставляет неограничивающие примеры случаев, когда каждый домен может служить в качестве вариабельного модуля.As a non-limiting example, in some embodiments in which the coding region encodes a chimeric antigen receptor (CAR), any CAR module may serve as a variable module depending on the activity of the CAR being screened, including but not limited to extracellular domain, coregulatory domain or primary signaling domain. For example, in FIG. 11 shows one element of the CAR library, in which each member of the library contains an extracellular domain, a coregulatory domain, and a primary signaling domain, and provides non-limiting examples of cases where each domain can serve as a variable module.
В некоторых случаях внеклеточный домен может быть вариабельным модулем, например в тех случаях, когда интерес представляет нацеленное воздействие на антиген, в тех случаях, когда интерес представляет сила взаимодействия между антигеном и внеклеточным доменом и т.д. В некоторых случаях корегуляторный домен может быть вариабельным модулем, например в тех случаях, когда индивидуальный корегуляторный домен или комбинации корегуляторных доменов должны быть подвергнуты скринингу для оценки совместной модуляции функциональной активности. В некоторых случаях первичный сигнальный домен может быть вариабельным модулем, например в тех случаях, когда различные внутриклеточные пути передачи сигналов должны быть подвергнуты скринингу.In some cases, the extracellular domain may be a variable module, for example, in cases where the targeting of the antigen is of interest, in cases where the strength of the interaction between the antigen and the extracellular domain is of interest, etc. In some cases, the coregulatory domain may be a variable module, such as when an individual coregulatory domain or combinations of coregulatory domains are to be screened for co-modulation of functional activity. In some cases, the primary signaling domain may be a variable module, such as when different intracellular signaling pathways are to be screened.
В качестве неограничивающего примера, в некоторых случаях, кодируемый синтетический модульный полипептид может представлять собой химерный полипептид рецептора Notch, содержащий внеклеточный связывающий домен, расщепляемый домен полипептида рецептора Notch (включая индуцируемый связыванием сайт расщепления) и внутриклеточный домен. Подходящие химерные полипептиды рецептора Notch и их домены включают, но не ограничиваются ими, например, те, которые описаны в заявке на патент США РСТ US0201/019188; содержание которой полностью включено в настоящую заявку посредством ссылки. В некоторых случаях один или более доменов химерного полипептида рецептора Notch служат в качестве вариабельного домена, включая, но не ограничиваясь ими, например, внеклеточный связывающий домен, домен полипептида рецептора Notch, внутриклеточный домен, внеклеточный связывающий домен и домен полипептида рецептора Notch, внеклеточный связывающий домен и внутриклеточный домен или домен полипептида рецептора Notch и внутриклеточный домен.As a non-limiting example, in some cases, the encoded synthetic modular polypeptide may be a chimeric Notch receptor polypeptide comprising an extracellular binding domain, a cleavage domain of the Notch receptor polypeptide (including a binding-inducible cleavage site), and an intracellular domain. Suitable chimeric Notch receptor polypeptides and their domains include, but are not limited to, for example, those described in US patent application PCT US0201/019188; the contents of which are incorporated herein by reference in their entirety. In some cases, one or more domains of a chimeric Notch receptor polypeptide serve as a variable domain, including, but not limited to, for example, an extracellular binding domain, a Notch receptor polypeptide domain, an intracellular domain, an extracellular binding domain, and a Notch receptor polypeptide domain, an extracellular binding domain. and an intracellular domain or a Notch receptor polypeptide domain and an intracellular domain.
Невариабельные модули, включенные в кодирующую область, будут выбраны, если это необходиNon-variable modules included in the coding region will be selected if needed.
- 14 041085 мо, так, чтобы все элементы библиотеки имели функцию невариабельного модуля, т.е. когда функция, которая обеспечивается невариабельным модулем, поддерживается постоянной во всех элементах библиотеки. В качестве неограничивающих примеров, в некоторых случаях, внеклеточный домен, корегуляторный домен или первичный сигнальный домен, описанные выше, могут служить в качестве невариабельных модулей, если это необходимо, или если для проведения количественного исследования необходимо, чтобы все элементы библиотеки имели функцию внеклеточного домена, корегуляторного домена или первичного сигнального домена. В качестве неограничивающих примеров, в некоторых случаях, внеклеточный связывающий домен, расщепляемый домен полипептида рецептора Notch или внутриклеточный домен, описанные выше, могут представлять собой невариабельные модули, если это необходимо, или если для проведения количественного исследования необходимо, чтобы все элементы библиотеки имели функцию внеклеточного связывающего домена, расщепляемого домена полипептида рецептора Notch или внутриклеточного домена.- 14 041085 mo, so that all elements of the library have the function of a non-variable module, i.e. when a function that is provided by a non-variable module is kept constant across all members of the library. As non-limiting examples, in some cases, the extracellular domain, coregulatory domain, or primary signaling domain described above can serve as non-variable modules, if necessary, or if it is necessary for quantitative research that all elements of the library have the function of an extracellular domain, coregulatory domain or primary signaling domain. As non-limiting examples, in some cases, the extracellular binding domain, Notch receptor polypeptide cleavage domain, or intracellular domain described above may be non-variable modules, if necessary, or if it is necessary for quantitative analysis that all elements of the library have the function of extracellular a binding domain, a cleavable domain of a Notch receptor polypeptide, or an intracellular domain.
В зависимости от конкретных применяемых модулей и скринингового количественного исследования, для которых используется библиотека согласно настоящему изобретению, кодирующая область каждого элемента библиотеки может кодировать любую комбинацию вариабельных и невариабельных модулей, при этом простейшая кодирующая область кодирует только вариабельный модуль. В некоторых случаях каждый отдельный элемент библиотеки, например каждый вектор, в который вставлен вариабельный модуль, может содержать, перед вставкой вариабельного модуля, одну или более кодирующих последовательностей так, что при вставке вариабельного модуля кодирующая область будет содержать вариабельный модуль и ранее существовавшие кодирующие последовательности, которые могут содержать невариабельный модуль и/или немодульную кодирующую последовательность или не содержать их. В некоторых случаях такая ранее существовавшая кодирующая последовательность, которая присутствует во всех элементах библиотеки, может упоминаться как константный домен.Depending on the specific modules used and the screening assay for which the library of the present invention is used, the coding region of each library element can encode any combination of variable and non-variable modules, with the simplest coding region encoding only the variable module. In some cases, each individual element of the library, for example, each vector into which a variable module is inserted, may contain, prior to insertion of the variable module, one or more coding sequences such that when the variable module is inserted, the coding region will contain the variable module and pre-existing coding sequences, which may or may not contain a non-variable module and/or a non-modular coding sequence. In some cases, such a pre-existing coding sequence that is present in all elements of the library may be referred to as a constant domain.
В некоторых случаях кодирующая область может кодировать два или более вариабельных модулей, включая, но не ограничиваясь ими, например, три или более вариабельных модулей, четыре или более вариабельных модулей, пять или более вариабельных модулей, шесть или более вариабельных модулей, семь или более вариабельных модулей, восемь или более вариабельных модулей и т.д. В некоторых случаях кодирующая область может кодировать два или более невариабельных модулей, включая, но не ограничиваясь ими, например, три или более невариабельных модулей, четыре или более невариабельных модулей, пять или более невариабельных модулей, шесть или более невариабельных модулей, семь или более невариабельных модулей, восемь или более невариабельных модулей и т.д. Количество вариабельных и невариабельных модулей в кодирующей области может быть лимитировано практическими ограничениями способа клонирования кодирующей последовательности и конструирования библиотеки.In some cases, a coding region may encode two or more variable modules, including but not limited to, for example, three or more variable modules, four or more variable modules, five or more variable modules, six or more variable modules, seven or more variable modules. modules, eight or more variable modules, etc. In some cases, a coding region may encode two or more non-variable modules, including but not limited to, for example, three or more non-variable modules, four or more non-variable modules, five or more non-variable modules, six or more non-variable modules, seven or more non-variable modules. modules, eight or more non-variable modules, etc. The number of variable and non-variable modules in a coding region may be limited by the practical limitations of the method for cloning a coding sequence and constructing a library.
Количество уникальных элементов библиотеки, кодирующей уникальные синтетические модульные полипептиды, будет зависеть от количества вариабельных модулей, используемых при конструировании библиотеки и общей предполагаемой сложности библиотеки. Согласно некоторым вариантам реализации настоящего изобретения сложность библиотеки может быть описана применительно к размерности библиотеки, причем размерность библиотеки коррелирует с количеством последовательностей, кодирующих вариабельные модули, которые присутствуют в кодирующей области элементов библиотеки. Следовательно, одномерная библиотека содержит одну последовательность, кодирующую вариабельный модуль, в каждой кодирующей области каждого элемента библиотеки, двумерная библиотека содержит две последовательности, кодирующие вариабельные модули, в каждой кодирующей области каждого элемента библиотеки, трехмерная библиотека содержит три последовательности, кодирующие вариабельные модули, в каждой кодирующей области каждого элемента библиотеки, четырехмерная библиотека содержит четыре последовательности, кодирующие вариабельные модули, в каждой кодирующей области каждого элемента библиотеки и так далее.The number of unique elements in a library encoding unique synthetic modular polypeptides will depend on the number of variable modules used in constructing the library and the overall perceived complexity of the library. In some embodiments of the present invention, the complexity of a library can be described in terms of library dimension, with library dimension being correlated with the number of variable module encoding sequences that are present in the coding region of library elements. Therefore, the one-dimensional library contains one variable module encoding sequence in each coding region of each library element, the two-dimensional library contains two variable module encoding sequences in each coding region of each library element, the three-dimensional library contains three variable module encoding sequences in each coding region of each element of the library, the four-dimensional library contains four sequences encoding variable modules in each coding region of each element of the library, and so on.
Размерность библиотеки не обязательно должна быть однородной во всей библиотеке, и, следовательно, в некоторых случаях, библиотека может иметь смешанную размерность. Под смешанной размерностью подразумевается, что библиотека содержит элементы библиотеки, отличные от одномерных, описанных выше. Например, библиотека может быть частично одномерной, частично двумерной, частично трехмерной и т.д. Указанные библиотеки со смешанной размерностью могут представлять собой смешанные одно- и двумерные библиотеки, двух- и трехмерные библиотеки, одно, двух- и трехмерные библиотеки и т.д. Представленные описания библиотек со смешанной размерностью не являются ограничивающими, и специалист в данной области техники легко поймет, что разнообразие библиотек со смешанной размерностью, включенных в область настоящего изобретения, выходит далеко за рамки явно описанных.The dimensions of a library need not be uniform throughout the library, and therefore, in some cases, a library may have mixed dimensions. By mixed dimension is meant that the library contains elements of the library that are different from the one-dimensional ones described above. For example, the library may be partially one-dimensional, partially two-dimensional, partially three-dimensional, and so on. These mixed dimensional libraries may be mixed 1D and 2D libraries, 2D and 3D libraries, 1D, 2D and 3D libraries, and so on. The descriptions of mixed dimensional libraries provided are not limiting, and one of ordinary skill in the art will readily appreciate that the variety of mixed dimensional libraries included within the scope of the present invention goes well beyond what is explicitly described.
Следовательно, количество уникальных элементов библиотеки, кодирующих уникальные синтетические модульные полипептиды, будет различаться и будет являться результатом размерности библиотеки и количества модулей, использованных при конструировании библиотеки. Например, одномерная библиотека, сконструированная из 20 уникальных вариабельных модулей, будет содержать 20 уникальных элементов библиотеки. Двумерная библиотека, сконструированная из 20 уникальных вариабельных модулей, будет содержать 20x20 (т.е. 400) уникальных элементов библиотеки. Трехмерная библиотека,Therefore, the number of unique library elements encoding unique synthetic modular polypeptides will vary and will be a result of the size of the library and the number of modules used in the construction of the library. For example, a one-dimensional library constructed from 20 unique variable modules would contain 20 unique library elements. A two-dimensional library constructed from 20 unique variable modules will contain 20x20 (ie 400) unique library elements. 3D Library,
- 15 041085 сконструированная из 20 уникальных вариабельных модулей, будет содержать 20x20x20 (т.е. 8000) уникальных элементов библиотеки. В некоторых случаях уникальный элемент библиотеки из многомерной библиотеки может содержать две или более последовательностей, кодирующих один и тот же вариабельный модуль.- 15 041085 constructed from 20 unique variable modules will contain 20x20x20 (ie 8000) unique library elements. In some cases, a unique library element from a multidimensional library may contain two or more sequences encoding the same variable module.
В некоторых случаях, когда каждый элемент библиотеки содержит два или более вариабельных модулей, указанные модули могут иметь конкретное положение, это означает, что подмножество вариабельных модулей может быть помещено только в определенном месте в пределах синтетического модульного полипептида по отношению к другим вариабельным модулям. Например, синтетический модульный полипептид, содержащий два вариабельных модуля, может содержать первый набор и второй набор вариабельных модулей, причем модули первого набора всегда находятся в определенном положении относительно модулей второго набора. Следовательно, двумерная библиотека, сконструированная с учетом специфичного положения модулей, состоящая из 30 уникальных вариабельных модулей, включая первый набор из 10 уникальных вариабельных модулей и второй набор из 20 уникальных вариабельных модулей, может содержать 10x20 (т.е. 200) уникальных элементов библиотеки.In some cases, where each element of the library contains two or more variable modules, these modules may have a specific position, which means that a subset of the variable modules can only be placed in a specific location within the synthetic modular polypeptide in relation to other variable modules. For example, a synthetic modular polypeptide containing two variable modules may contain a first set and a second set of variable modules, with the modules of the first set always in a certain position relative to the modules of the second set. Therefore, a two-dimensional library designed with a specific module position, consisting of 30 unique variable modules, including a first set of 10 unique variable modules and a second set of 20 unique variable modules, may contain 10x20 (i.e., 200) unique library elements.
Специалист в данной области техники легко поймет значительную изменчивость конфигураций библиотек, учитывая описанную выше вариабельную размерность и вариабельные количества модулей, которые могут быть объединены, с использованием специфичных положений или без них, при конструировании библиотек согласно настоящему изобретению. Следовательно, общее количество уникальных элементов библиотеки будет сильно варьироваться и может находиться в пределах диапазона от менее чем 20 до 50000 и более, включая, но не ограничиваясь ими, например, 20 или более, 30 или более, 40 или более, 50 или более, 60 или более 70 или более, 80 или более, 90 или более, 100 или более, 150 или более, 200 или более, 250 или более, 300 или более, 350 или более, 400 или более, 450 или более, 500 или более, 550 или более, 600 или более, 650 или более, 700 или более, 750 или более, 800 или более, 850 или более, 900 или более, 950 или более, 1000 или более, 1500 или более, 2000 или более, 2500 или более, 3000 или более, 3500 или более, 4000 или более, 4500 или более, 5000 или более, 5500 или более, 6000 или более, 6500 или более, 7000 или более, 7500 или более, 8000 или более, 8500 или более, 9000 или более, 9500 или более, 10000 или более, 20000 или более, 30000 и более, 40000 или более, 50000 и более и т.д.One of skill in the art will readily appreciate the significant variability in library configurations given the variable dimension described above and the variable numbers of modules that can be combined, with or without specific positions, when constructing libraries according to the present invention. Therefore, the total number of unique library items will vary greatly and may range from less than 20 to 50,000 or more, including but not limited to, for example, 20 or more, 30 or more, 40 or more, 50 or more, 60 or more 70 or more, 80 or more, 90 or more, 100 or more, 150 or more, 200 or more, 250 or more, 300 or more, 350 or more, 400 or more, 450 or more, 500 or more , 550 or more, 600 or more, 650 or more, 700 or more, 750 or more, 800 or more, 850 or more, 900 or more, 950 or more, 1000 or more, 1500 or more, 2000 or more, 2500 3000 or more 3500 or more 4000 or more 4500 or more 5000 or more 5500 or more 6000 or more 6500 or more 7000 or more 7500 or more 8000 or more 8500 or more , 9000 or more, 9500 or more, 10000 or more, 20000 or more, 30000 or more, 40000 or more, 50000 or more, etc.
В тех случаях, когда многомерные библиотеки сконструированы путем объединения, общее количество уникальных элементов библиотеки в пуле может значительно варьироваться и может находиться в пределах диапазона от менее чем 20 до 50000 или более, как описано выше, и может иметь более высокую степень разнообразия, включая, но не ограничиваясь указанными, например, 105 или более, 106 или более, 107 или более, 108 или более, или 109 или более.Where multidimensional libraries are constructed by pooling, the total number of unique library items in the pool may vary considerably and may range from less than 20 to 50,000 or more as described above, and may have a higher degree of diversity, including, but not limited to, for example, 105 or more, 106 or more, 10 7 or more, 108 or more, or 109 or more.
Уникальные элементы библиотек, описанные в настоящем документе, не обязательно должны быть физически упорядочены для целей конструирования библиотеки или скрининга. Как описано более подробно ниже, комбинаторная сборка компонентов нуклеиновых кислот, кодирующих каждый синтетический модульный полипептид, и совместная сборка многозвенных последовательностей-штрихкодов с помощью способа, который характеризует идентичность и ориентацию собранных модулей, обеспечивает однореакторный синтез и общий скрининг библиотек, описанных в настоящем документе. Следовательно, библиотека, и множество уникальных элементов библиотеки, может присутствовать в одном подходящем растворе и/или присутствовать в одном подходящем контейнере.The unique elements of the libraries described herein need not be physically ordered for library construction or screening purposes. As described in more detail below, the combinatorial assembly of the nucleic acid components encoding each synthetic modular polypeptide and the co-assembly of the multi-unit barcode sequences in a manner that characterizes the identity and orientation of the assembled modules allows for a one-pot synthesis and overall screening of the libraries described herein. Therefore, a library, and a plurality of unique library elements, may be present in one suitable solution and/or present in one suitable container.
Синтетические модульные полипептиды.Synthetic modular polypeptides.
В настоящем изобретении предложены библиотеки синтетических модульных полипептидов и нуклеиновые кислоты, кодирующие синтетические модульные полипептиды. Под модульным полипептидом подразумевают функциональный белок, содержащий два или более функционально связанных модульных компонентов, так, что модули физически соединены и совместно функционируют в одной молекуле полипептида. Модули модульного полипептида могут иметь связанные или несвязанные функции или виды активности. Во многих вариантах реализации по меньшей мере два из модульных компонентов синтетических модульных полипептидов получены из отдельных белков. Модули, полученные из отдельных белков, могут быть получены из различных белков, которые функционально не связаны или функционально связаны, и могут быть получены из разных молекул организма, из одной и той же молекулы организма, разных ортологичных белков, различных паралогичных белков и т.д.The present invention provides synthetic modular polypeptide libraries and nucleic acids encoding synthetic modular polypeptides. By modular polypeptide is meant a functional protein containing two or more operably linked modular components such that the modules are physically connected and co-function in a single polypeptide molecule. Modular polypeptide modules may have related or unrelated functions or activities. In many embodiments, at least two of the modular components of synthetic modular polypeptides are derived from separate proteins. Modules derived from individual proteins can be derived from different proteins that are operably unrelated or operably linked, and can be derived from different body molecules, from the same body molecule, different orthologous proteins, different paralogous proteins, etc. .
Согласно некоторым вариантам реализации настоящего изобретения отдельные элементы библиотеки синтетических модульных полипептидов, описанной в настоящем документе, будут включать, как минимум, модуль, который является членом специфичной связывающейся пары (например, связывающейся пары антиген-антитело, связывающейся пары лиганд-рецептор и т.д.), и функциональный или сигнальный модуль, который участвует в индукции клеточного ответа. В некоторых случаях элемент конкретной связывающейся пары может быть упомянут в настоящем документе как внеклеточный домен или внеклеточный распознаваемый домен. В некоторых случаях элемент конкретной связывающейся пары может относиться к белку, участвующему в сигнальном взаимодействии белок-белок, или к белку, участвующему во взаимодействии белок-липид.In some embodiments of the present invention, individual elements of the synthetic modular polypeptide library described herein will include, at a minimum, a module that is a member of a specific binding pair (e.g., antigen-antibody binding pair, ligand-receptor binding pair, etc.). .), and a functional or signaling module that is involved in the induction of a cellular response. In some cases, an element of a particular binding pair may be referred to herein as an extracellular domain or extracellular recognition domain. In some cases, the element of a particular binding pair may refer to a protein involved in protein-protein signaling interaction, or to a protein involved in protein-lipid interaction.
- 16 041085- 16 041085
Во многих вариантах реализации элемент конкретной связывающейся пары, который можно применять в отдельных элементах библиотеки, может включать антигенсвязывающий домен. Антигенсвязывающий домен, подходящий для применения в элементах библиотеки согласно настоящему изобретению, может представлять собой любой антигенсвязывающий полипептид, широкий спектр которых известен в данной области техники. В некоторых случаях антигенсвязывающий домен представляет собой одноцепочечный фрагмент Fv (scFv). Для применения подходят другие домены распознавания на основе антител (cAb VHH (вариабельные домены антител верблюдовых) и гуманизированные варианты, IgNAR VH (вариабельные домены антител акул) и гуманизированные варианты, sdAb VH (вариабельные домены однодоменных антител) и вариабельные домены антител, содержащих фрагменты антител верблюдовых. В некоторых случаях для применения также подходят домены распознавания на основе Тклеточных рецепторов (TCR), таких как одноцепочечный TCR (scTv, одноцепочечный двухдоменный TCR, содержащий VaVe).In many embodiments, the element of a specific binding pair that can be used in individual library elements may include an antigen binding domain. An antigen-binding domain suitable for use in the library elements of the present invention may be any antigen-binding polypeptide, a wide range of which is known in the art. In some cases, the antigen binding domain is a single chain Fv fragment (scFv). Other antibody-based recognition domains are suitable for use (cAb VHH (variable domains of camelid antibodies) and humanized variants, IgNAR VH (variable domains of shark antibodies) and humanized variants, sdAb VH (variable domains of single-domain antibodies) and variable domains of antibodies containing antibody fragments T cell receptor (TCR) based recognition domains such as single chain TCR (scTv, single chain dual domain TCR containing VaVe) are also suitable for use in some cases.
Антигенсвязывающий домен, подходящий для применения в элементах библиотек согласно настоящему изобретению, может иметь множество видов антигенсвязывающей специфичности. В некоторых случаях антигенсвязывающий домен специфичен в отношении эпитопа, присутствующего в антигене, который экспрессируется (синтезируется) раковой клеткой, т.е. в антигене, связанном с раковой клеткой. Антиген, связанный с раковой клеткой, может представлять собой антиген, связанный, например, с клеткой рака молочной железы, В-клеточной лимфомой, клеткой лимфомы Ходжкина, клеткой рака яичников, клеткой рака предстательной железы, мезотелиомой, клеткой рака легких (например, клеткой мелкоклеточного рака легких), клеткой неходжкинской В-клеточной лимфомы (B-NHL), клеткой рака яичников, клеткой рака предстательной железы, клеткой мезотелиомы, клеткой рака легких (например, клеткой мелкоклеточного рака легких), клеткой меланомы, клеткой хронического лимфоцитарного лейкоза, клеткой острого лимфоцитарного лейкоза, клеткой нейробластомы, глиомой, глиобластомой, медуллобластомой, клеткой колоректального рака и т.д. Антиген, связанный с раковой клеткой, также может быть экспрессирован нераковой клеткой.An antigen binding domain suitable for use in the library elements of the present invention may have many types of antigen binding specificity. In some instances, the antigen-binding domain is specific for an epitope present on an antigen that is expressed (synthesized) by the cancer cell, ie. in the antigen associated with the cancer cell. The cancer cell-associated antigen may be an antigen associated with, for example, breast cancer cell, B-cell lymphoma, Hodgkin's lymphoma cell, ovarian cancer cell, prostate cancer cell, mesothelioma, lung cancer cell (e.g. small cell lung cancer cell), non-Hodgkin B-cell lymphoma (B-NHL) cell, ovarian cancer cell, prostate cancer cell, mesothelioma cell, lung cancer cell (eg, small cell lung cancer cell), melanoma cell, chronic lymphocytic leukemia cell, acute lymphocytic leukemia, neuroblastoma cell, glioma, glioblastoma, medulloblastoma, colorectal cancer cell, etc. An antigen associated with a cancer cell can also be expressed by a non-cancerous cell.
Неограничивающие примеры антигенов, с которыми может связываться антигенсвязывающий домен библиотеки согласно настоящему изобретению, включают, например, CD19, CD20, CD38, CD30, Her2/neu, ERBB2, СА125, MUC-1, специфичный для предстательной железы мембранный антиген (PSMA), молекулу адгезии CD44, мезотелин, онкоэмбриональный антиген (СЕА), рецептор эпидермального фактора роста (EGFR), EGFRvIII, рецептор фактора роста эндотелия сосудов 2 (VEGFR2), высокомолекулярный антиген, связанный с меланомой (HMW-MAA), MAGE-A1, IL-13R-a2, GD2 и т.п.Non-limiting examples of antigens to which the antigen-binding domain of the library of the present invention can bind include, for example, CD19, CD20, CD38, CD30, Her2/neu, ERBB2, CA125, MUC-1, prostate specific membrane antigen (PSMA), molecule CD44, mesothelin, oncoembryonic antigen (CEA), epidermal growth factor receptor (EGFR), EGFRvIII, vascular endothelial growth factor receptor 2 (VEGFR2), high molecular weight melanoma-associated antigen (HMW-MAA), MAGE-A1, IL-13R -a2, GD2, etc.
В некоторых случаях элемент конкретной связывающейся пары, подходящий для применения в элементах библиотек согласно настоящему изобретению, представляет собой лиганд для рецептора. Лиганды включают, но не ограничиваются ими, цитокины (например, ИЛ-13 и т.д.); факторы роста (например, херегулин, фактор роста эндотелия сосудов (VEGF) и т.п.); пептид, связывающий интегрин (например, пептид, содержащий последовательность Arg-Gly-Asp); лиганды Notch (например, Delta, Serrate, Delta-like, X-Delta, Jagged и т.д., а также их гомологи и ортологи) и т.п.In some cases, the element of a particular binding pair suitable for use in the elements of the libraries according to the present invention is a ligand for the receptor. Ligands include, but are not limited to, cytokines (eg, IL-13, etc.); growth factors (eg, heregulin, vascular endothelial growth factor (VEGF), etc.); an integrin-binding peptide (eg, a peptide containing the sequence Arg-Gly-Asp); Notch ligands (eg, Delta, Serrate, Delta-like, X-Delta, Jagged, etc. and their homologues and orthologues), and the like.
В случае если элемент конкретной связывающейся пары в элементах библиотек согласно настоящему изобретению является лигандом, то конкретный элемент библиотеки может быть активирован в присутствии второго члена конкретной связывающейся пары, причем второй элемент конкретной связывающейся пары представляет собой рецептор для лиганда. Например, если лиганд представляет собой VEGF, второй элемент специфичной связывающейся пары может представлять собой рецептор VEGF, включая растворимый рецептор VEGF. В другом примере, если лиганд является лигандом Notch, то второй член специфичной связывающейся пары может представлять собой рецептор Notch или его лигандсвязывающий участок. В качестве другого примера, если лиганд представляет собой херегулин, то второй член специфичной связывающейся пары может представлять собой Her2.In the event that an element of a particular binding pair in the elements of the libraries of the present invention is a ligand, then the particular element of the library can be activated in the presence of a second member of the particular binding pair, the second element of the particular binding pair being the receptor for the ligand. For example, if the ligand is VEGF, the second member of the specific binding pair may be a VEGF receptor, including a soluble VEGF receptor. In another example, if the ligand is a Notch ligand, then the second member of the specific binding pair may be a Notch receptor or a ligand-binding site thereof. As another example, if the ligand is heregulin, then the second member of the specific binding pair may be Her2.
В некоторых случаях член специфичной связывающейся пары, который включен в элементы библиотеки согласно настоящему изобретению, представляет собой рецептор, например рецептор для лиганда, корецептор и т.д. Рецептор может представлять собой лигандсвязывающий фрагмент рецептора. Подходящие рецепторы включают, но не ограничиваются ими, рецептор фактора роста (например, рецептор VEGF); полипептид члена 1 подсемейства лектиноподобных рецепторов клеток-киллеров K (NKG2D) (рецептор для MICA, MICB и ULB6); рецептор цитокинов (например, рецептор ИЛ-13, рецептор ИЛ-2 и т.д.); Her2; CD27; полипептид рецептора естественной цитотоксичности (NCR) (например, NKP30 (NCR3/CD337) (рецептор для HLA-B-ассоциированного транскрипта 3 (ВАТ3) и В7-Н6) и т.д.); рецептор Notch (например, NOTCH1 человека, NOTCH2 человека, NOTCH3 человека, NOTCH4 человека и т.д.) и т.п.In some cases, the member of a specific binding pair that is included in the library elements of the present invention is a receptor, such as a receptor for a ligand, a co-receptor, etc. The receptor may be a ligand-binding fragment of the receptor. Suitable receptors include, but are not limited to, growth factor receptor (eg, VEGF receptor); lectin-like killer cell receptor subfamily member 1 (NKG2D) member polypeptide (receptor for MICA, MICB and ULB6); a cytokine receptor (eg, IL-13 receptor, IL-2 receptor, etc.); Her2; CD27; a natural cytotoxicity receptor (NCR) polypeptide (eg, NKP30 (NCR3/CD337) (receptor for HLA-B-associated transcript 3 (BAT3) and B7-H6), etc.); a Notch receptor (eg, human NOTCH1, human NOTCH2, human NOTCH3, human NOTCH4, etc.); and the like.
Специфичные партнеры по связыванию также включают димерные пары. Отдельные члены димерных пар подходят для применения в качестве элемента библиотек согласно настоящему изобретению и включают, но не ограничиваются ими, связывающиеся с димеризатором пары. Связывающиеся с димеризатором пары связываются с различными участками одной и той же молекулы (называемой в настоящем документе димеризатор). В присутствии димеризатора оба члена связывающейся с димеризатором пары связываются с различными участками димеризатора и, следовательно, сближаются друг с другом.Specific binding partners also include dimer pairs. Individual members of dimer pairs are suitable for use as members of the libraries of the present invention and include, but are not limited to, dimerizer-binding pairs. Dimerizer-binding pairs bind to different regions of the same molecule (referred to herein as a dimerizer). In the presence of a dimerizer, both members of the dimerizer-binding pair bind to different regions of the dimerizer and hence approach each other.
- 17 041085- 17 041085
Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является обратимым. Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является необратимым. Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является нековалентным. Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является ковалентным.According to some embodiments of the present invention, the binding to the dimerizer is reversible. According to some embodiments of the present invention, binding to the dimerizer is irreversible. In some embodiments of the present invention, the binding to the dimerizer is non-covalent. In some embodiments of the present invention, the binding to the dimerizer is covalent.
Другие димерные пары, подходящие для применения, включают связывающиеся с димеризатором пары, которые димеризуются при связывании первого члена димерной пары с димеризирующим агентом, причем димеризующий агент индуцирует конформационное изменение в первом члене димерной пары, и при этом конформационное изменение позволяет первому члену димерной пары связываться (ковалентно или нековалентно) со вторым членом димерной пары. Другие димерные пары, подходящие для применения, включают димерные пары, в которых воздействие света (например, синего света) индуцирует димеризацию димерной пары.Other suitable dimer pairs include dimer-binding pairs that dimerize when the first member of the dimer pair is bound to the dimerizing agent, wherein the dimerizing agent induces a conformational change in the first member of the dimer pair, wherein the conformational change allows the first member of the dimer pair to bind ( covalently or non-covalently) with the second member of the dimeric pair. Other dimer pairs suitable for use include dimer pairs in which exposure to light (eg, blue light) induces dimerization of the dimer pair.
В некоторых случаях член специфичной связывающейся пары может включать белок, участвующий в сигнальном взаимодействии белок-белок или сигнальном взаимодействии белок-липид, и в этой связи синтетические модульные полипептиды, описанные в настоящем документе, могут включать один или более доменов взаимодействия белок-белок или доменов взаимодействия белок-липид. Подходящие домены взаимодействия белок-белок или домены взаимодействия белок-липид включают, но не ограничиваются ими, например, домен 14-3-3 (например, тот, который присутствует в структуре 2В05 PDB (база данных белковых структур RCSB, доступная на веб-сайте www.rcsb.org)), домен фактора деполимеризации актина (ADF) (например, присутствующий в структуре 1CFY PDB), домен ANK (например, присутствующий в структуре 1SW6 PDB), домен ANTH (N-концевой гомологии АР180) (например, присутствующий в структуре 5AHV PDB), домен Armadillo (ARM) (например, присутствующий в структуре 1BK6 PDB), домен BAR (Bin/Amphiphysin/Rvs) (например, присутствующая в структуре 1I4D PDB), домен BEACH (beige and CHS) (например, присутствующий в структуре 1MI1 PDB), домены ВН (гомологии Bcl-2) (BH1, ВН2, BH3 и ВН4) (например, присутствующие в структуре 1BXL PDB), домен повтора бакуловируса IAP (BIR) (например, присутствующий в структуре 1G73 PDB), домен BRCT (BRCA1 Сконец) (например, присутствующий в структуре 1Т29 PDB), бромдомен (например, присутствующий в структуре 1E6I PDB), домен ВТВ (BR-C, ttk и bab) (например, присутствующий в структуре 1R2B PDB), домен С1 (например, присутствующий в структуре 1PTQ PDB), домен С2 (например, присутствующий в структуре 1А25 PDB), домены привлечения каспазы (CARD) (например, присутствующие в структуре 1CWW PDB), суперспиральный домен (СС) (например, присутствующий в структуре 1QEY PDB), домен CALM (Clathrin Assembly Lymphoid Myeloid) (например, присутствующий в структуре 1HFA PDB), домен гомологичности калопонина (СН) (например, присутствующий в структуре 1BKR PDB), домен, модифицирующий организацию хроматина (Chromo) (например, присутствующий в структуре 1KNA PDB), домен CUE (например, присутствующий в структуре 1OTR PDB), домены гибели (DD) (например, присутствующие в структуре 1FAD PDB), домен гибели-эффектора (DED) (например, присутствующий в структуре 1A1W PDB), домен Discheveled, EGL-10 и плекстрин (DEP) (например, присутствующий в структуре 1FSH PDB), домен гомологии Dbl (DH) (например, присутствующий в структуре 1FOE PDB), домен EF-руки (EFh) (например, присутствующий в структуре 2PMY PDB), домен Eps15-гомологии (ЕН) (например, присутствующий в структуре 1ЕН2 PDB), домен NH2-концевой гомологии эпсина (ENTH) (например, присутствующий в структуре 1EDU PDB), домен гомологии Ena/Vasp 1 (EVH1) (например, присутствующий в структуре 1QC6 PDB), домен F-box (например, присутствующий в структуре 1FS1 PDB), домен FERM (полоса 4.1, эзрин, радиксин, моэзин) (например, присутствующий в структуре 1GC6 PDB), домен FF (например, присутствующий в структуре 1UZC PDB), домен гомологии формина-2 (FH2) (например, присутствующий в структуре 1UX4 PDB), домен, ассоциированный с Forkhead (FHA) (например, присутствующий в структуре 1G6G PDB), домен FYVE (Fab-1, YGL023, Vps27 и ЕЕА1) (например, присутствующий в структуре 1VFY PDB), домен GAT (GGA и Tom1) (например, присутствующий в структуре 1O3X PDB), домен гомологии гелсолина (GEL) (например, присутствующий в структуре 1H1V PDB), домен GLUE (GRAM-подобный убиквитин-связывающий домен в ЕАР45) (например, присутствующий в структуре 2CAY PDB), домен GRAM (из глюкозилтрансфераз, Rab-подобные активаторы ГТФаз и миотубуларины) (например, присутствующий в структуре 1LW3 PDB), домен GRIP (например, присутствующий в структуре 1UPT PDB), домен глицин-тирозин-фенилаланин (GYF) (например, присутствующий в структуре 1GYF PDB), домен HEAT (хантингтон, фактор удлинения 3, PR65/A, TOR) (например, присутствующий в структуре 1IBR PDB), домен, гомологичный С-концевому домену Е6-АР (НЕСТ) (например, присутствующий в структуре 1C4Z PDB), домен IQ (например, присутствующий в структуре 1N2D PDB), домен LIM (Lin-1, Isl-1 и Мес-3) (например, присутствующий в структуре 1QLI PDB), домен обогащенных лейцином повторов (LRR) (например, присутствующий в структуре 1YRG PDB), домен злокачественной опухоли головного мозга (МВТ) (например, присутствующий в структуре 1OYX PDB), домен МН1 (гомологии Mad 1) (например, присутствующий в структуре 1OZJ PDB), домен МН2 (гомологии Mad 2) (например, присутствующий в структуре 1DEV PDB), домен MIU (взаимодействующий с убиквитином мотив) (например, присутствующий в структуре 2С7М PDB), домен NZF (цинковый палец Npl4) (например, присутствующий в структуре 1Q5W PDB), домен PAS (Per-ARNT-Sim)In some cases, a member of a specific binding pair may include a protein involved in protein-protein signaling interaction or protein-lipid signaling interaction, and in this regard, the synthetic modular polypeptides described herein may include one or more protein-protein interaction domains or domains protein-lipid interactions. Suitable protein-protein interaction domains or protein-lipid interaction domains include, but are not limited to, for example, the 14-3-3 domain (for example, the one present in the 2B05 PDB structure (RCSB Protein Structure Database available on the website www.rcsb.org)), actin depolymerization factor (ADF) domain (e.g. present in the 1CFY PDB structure), ANK domain (e.g. present in the 1SW6 PDB structure), ANTH domain (N-terminal homology of AP180) (e.g. present in structure 5AHV PDB), Armadillo domain (ARM) (e.g. present in structure 1BK6 PDB), BAR domain (Bin/Ampphiphysin/Rvs) (e.g. present in structure 1I4D PDB), BEACH domain (beige and CHS) (e.g., present in the 1MI1 PDB structure), BH domains (Bcl-2 homologies) (BH1, BH2, BH3 and BH4) (e.g. present in the 1BXL PDB structure), baculovirus IAP repeat (BIR) domain (e.g. present in the 1G73 PDB structure) , a BRCT domain (BRCA1 C-terminal) (e.g., present in the 1T29 P DB), bromo domain (e.g. present in the 1E6I PDB structure), BTB domain (BR-C, ttk and bab) (e.g. present in the 1R2B PDB structure), C1 domain (e.g. present in the 1PTQ PDB structure), C2 domain ( e.g., present in the 1A25 PDB structure), caspase attraction domains (CARD) (e.g., present in the 1CWW PDB structure), supercoiled domain (CC) (e.g., present in the 1QEY PDB structure), CALM domain (Clathrin Assembly Lymphoid Myeloid) (e.g. , present in the 1HFA PDB structure), caloponin (CH) homology domain (e.g., present in the 1BKR PDB structure), chromatin organization modifying (Chromo) domain (e.g., present in the 1KNA PDB structure), CUE domain (e.g., present in the 1KNA PDB structure), 1OTR PDB), death domains (DD) (e.g., present in the 1FAD PDB structure), death effector domain (DED) (e.g., present in the 1A1W PDB structure), Discheveled domain, EGL-10, and plextrin (DEP) (e.g., present in the 1FSH PDB structure), d Dbl homology domain (DH) (e.g., present in the 1FOE PDB structure), EF-arm (EFh) domain (e.g., present in the 2PMY PDB structure), Eps15 homology (EH) domain (e.g., present in the 1EH2 PDB structure), epsin NH2-terminal homology (ENTH) domain (eg, present in the 1EDU PDB structure), Ena/Vasp 1 (EVH1) homology domain (eg, present in the 1QC6 PDB structure), F-box domain (eg, present in the 1FS1 PDB structure ), FERM domain (lane 4.1, ezrin, radixin, moesin) (e.g., present in the 1GC6 PDB structure), FF domain (e.g., present in the 1UZC PDB structure), formin-2 (FH2) homology domain (e.g., present in the 1UX4 PDB), Forkhead Associated (FHA) domain (e.g., present in the 1G6G PDB structure), FYVE domain (Fab-1, YGL023, Vps27, and EEA1) (e.g., present in the 1VFY PDB structure), GAT domain (GGA and Tom1) (e.g. present in the 1O3X PDB structure), gelsolin homology domain (GEL) (e.g. present in structure 1H1V PDB), GLUE domain (GRAM-like ubiquitin-binding domain in EAP45) (e.g. present in structure 2CAY PDB), GRAM domain (from glucosyltransferases, Rab-like GTPases activators and myotubularins) (e.g. present in structure 1LW3 PDB), GRIP domain (e.g. present in the 1UPT PDB structure), glycine tyrosine phenylalanine (GYF) domain (e.g. present in the 1GYF PDB structure), HEAT domain (Huntington, extension factor 3, PR65/A, TOR) ( e.g., present in the 1IBR PDB structure), a domain homologous to the C-terminal E6-AP domain (HEST) (e.g., present in the 1C4Z PDB structure), IQ domain (e.g., present in the 1N2D PDB structure), LIM domain (Lin-1 , Isl-1 and Mec-3) (e.g., present in the 1QLI PDB structure), leucine rich repeat (LRR) domain (e.g., present in the 1YRG PDB structure), brain tumor (MBT) domain (e.g., present in the 1OYX PDB), MH1 domain (Mad 1 homologies) (for example, the presence present in the 1OZJ PDB structure), MH2 domain (Mad 2 homology) (e.g., present in the 1DEV PDB structure), MIU domain (ubiquitin-interacting motif) (e.g., present in the 2C7M PDB structure), NZF domain (Npl4 zinc finger) ( e.g. present in the 1Q5W PDB structure), PAS domain (Per-ARNT-Sim)
- 18 041085 (например, присутствующий в структуре 1Р97 PDB), домен Phox и Bem1 (РВ1) (например, присутствующий в структуре 1IPG PDB), домен PDZ (постсинаптическая плотность 95, PSD-85, discs large, Dlg, zonula occludens-1, ZO-1) (например, присутствующей в структуре 1ВЕ9 PDB), домен гомологичности плекстрина (РН) (например, присутствующий в структуре 1MAI PDB), домен Polo-Box (например, присутствующий в структуре 1Q4K PDB), домен связывания фосфотирозина (РТВ) (например, присутствующего в структуре 1SHC PDB), домен Pumilio/Puf (PUF) (например, присутствующий в структуре 1M8W PDB), домен PWWP (например, присутствующий в структуре 1KHC PDB), домен гомологии Phox (PX) (например, присутствующий в структуре 1Н6Н PDB), домен RGS (регулятор опосредованной Gбелком передачи сигналов) (например, присутствующий в структуре 1AGR PDB), домен RING (например, присутствующий в структуре 1FBV PDB), домен SAM (стерильный альфа-мотив) (например, присутствующий в структуре 1В0Х PDB), домен Shadow Chromo (SC) (например, присутствующий в структуре 1E0B PDB), домен Src-гомологии 2 (SH2) (например, присутствующий в структуре 1SHB PDB), домен Src-гомологии 3 (SH3) (например, присутствующий в структуре 3SEM PDB), домен SOCS (супрессоры передачи сигналов с участием цитокинов) (например, присутствующий в структуре 1VCB PDB), домен SPRY (например, присутствующий в структуре 2AFJ PDB), родственный стероидогенному острому регуляторному белку (StAR) домен переноса липидов (START) (например, присутствующий в структуре 1ЕМ2 PDB), домен SWIRM (например, присутствующий в структуре 2AQF PDB), домен рецептора Toll/Il-1 (TIR) (например, присутствующий в структуре 1FYV PDB), домен тетратрикопептидного повтора (TPR) (например, присутствующий в структуре 1ELW PDB), домен TRAF (факторы, связанные с рецептором фактора некроза опухолей (ФНО)) (например, присутствующий в структуре 1F3V PDB), домен tSNARE (домен SNARE (растворимый чувствительный к N-этилмалеимиду рецептор, обеспечивающий прикрепление белков (SNAP)) (например, присутствующий в структуре 1SFC PDB), домен Tubby (например, присутствующий в структуре 1I7E PDB), домен TUDOR (например, присутствующий в структуре 2GFA PDB), связанный с убиквитином (UBA) домен (например, присутствующий в структуре 1IFY PDB), домен UEV (вариант убиквитина Е2) (например, присутствующий в структуре 1S1Q PDB), домен мотива, взаимодействующего с убиквитином (UIM) (например, присутствующий в структуре 1Q0W PDB), домен VHL (например, присутствующий в структуре 1LM8 PDB), домен VHS (Vps27p, Hrs и STAM) (например, присутствующий в структуре 1ELK PDB), домен WD40 (например, присутствующий в структуре 1NEX PDB), домен WW (например, присутствующий в структуре 1I6C PDB) и т.п.- 18 041085 (eg, present in the 1P97 PDB structure), Phox and Bem1 (PB1) domain (eg, present in the 1IPG PDB structure), PDZ domain (post-synaptic density 95, PSD-85, discs large, Dlg, zonula occludens-1 , ZO-1) (e.g., present in the 1BE9 PDB structure), plextrin homology domain (PH) (e.g., present in the 1MAI PDB structure), Polo-Box domain (e.g., present in the 1Q4K PDB structure), phosphotyrosine binding domain (PTB ) (e.g. present in the 1SHC PDB structure), Pumilio/Puf (PUF) domain (e.g. present in the 1M8W PDB structure), PWWP domain (e.g. present in the 1KHC PDB structure), Phox (PX) homology domain (e.g. present in the 1H6H PDB structure), RGS domain (regulator of G protein-mediated signaling) (e.g., present in the 1AGR PDB structure), RING domain (e.g., present in the 1FBV PDB structure), SAM domain (sterile alpha motif) (e.g., present in 1B0X PDB structure), Shadow Chromo domain ( SC) (e.g. present in structure 1E0B PDB), Src homology domain 2 (SH2) (e.g. present in structure 1SHB PDB), Src homology domain 3 (SH3) (e.g. present in structure 3SEM PDB), SOCS domain (suppressors of signaling involving cytokines) (for example, present in the 1VCB PDB structure), SPRY domain (for example, present in the 2AFJ PDB structure), steroidogenic acute regulatory protein (StAR) related lipid transfer domain (START) (for example, present in the structure 1EM2 PDB), SWIRM domain (e.g. present in structure 2AQF PDB), Toll/Il-1 receptor (TIR) domain (e.g. present in structure 1FYV PDB), tetratricopeptide repeat (TPR) domain (e.g. present in structure 1ELW PDB ), a TRAF domain (tumor necrosis factor (TNF) receptor-associated factors) (e.g. present in the 1F3V PDB structure), a tSNARE domain (SNARE domain (soluble N-ethylmaleimide sensitive protein attachment receptor (SNA P)) (e.g. present in structure 1SFC PDB), Tubby domain (e.g. present in structure 1I7E PDB), TUDOR domain (e.g. present in structure 2GFA PDB), ubiquitin-associated (UBA) domain (e.g. present in structure 1IFY PDB), UEV domain (E2 ubiquitin variant) (e.g., present in the 1S1Q PDB structure), Ubiquitin Interacting Motif (UIM) domain (e.g., present in the 1Q0W PDB structure), VHL domain (e.g., present in the 1LM8 PDB structure ), VHS domain (Vps27p, Hrs, and STAM) (eg, present in the 1ELK PDB structure), WD40 domain (eg, present in the 1NEX PDB structure), WW domain (eg, present in the 1I6C PDB structure), and the like.
Отдельные элементы библиотеки согласно настоящему изобретению, описанной в настоящем документе, могут содержать модулирующий домен. Модулирующие домены включают домены со стимулирующими и ингибирующими функциями и домены, которые модулируют активирующие и/или ингибирующие функции других сигнальных доменов, реакции с участием которых протекают раньше, чем реакции с участием модулирующих доменов. В некоторых случаях модулирующие домены включают костимулирующие домены. В некоторых случаях модулирующие домены включают коингибирующие домены.Individual elements of the library according to the present invention described herein may contain a modulating domain. Modulating domains include domains with stimulatory and inhibitory functions and domains that modulate the activating and/or inhibitory functions of other signaling domains, the reactions involving which proceed before the reactions involving the modulating domains. In some cases, modulating domains include costimulatory domains. In some cases, modulating domains include co-inhibitory domains.
Модулирующий домен, пригодный для включения в элементы библиотеки согласно настоящему изобретению, может представлять собой любую функциональную единицу полипептида, длина которой равна длине аминокислотного мотива из 3 аминокислот, и длина которой равна длине полноразмерного белка, причем размер модулирующего домена ограничен только тем, что домен должен быть достаточно большим, чтобы сохранить свою функцию, и достаточно маленьким, чтобы быть совместимым с желательным способом сборки. Соответственно, модулирующий домен может иметь размер в диапазоне от 3 до 1000 аминокислот или более, и, в некоторых случаях, может иметь в длину от приблизительно 30 до приблизительно 70 аминокислот (а.к.), например модулирующий домен может иметь в длину от приблизительно 30 до приблизительно 35 а.к., от приблизительно 35 до приблизительно 40 а.к., от приблизительно 40 до приблизительно 45 а.к., от приблизительно 45 до приблизительно 50 а.к., от приблизительно 50 до приблизительно 55 а.к., от приблизительно 55 до приблизительно 60 а.к., от приблизительно 60 до приблизительно 65 а.к. или от приблизительно 65 до приблизительно 70 а.к. В других случаях модулирующий домен может иметь в длину от приблизительно 70 до приблизительно 100 а.к., от приблизительно 100 до приблизительно 200 а.к. или более 200 а.к.A modulating domain suitable for inclusion in the library elements of the present invention may be any polypeptide functional unit that is equal in length to the 3 amino acid motif and is equal in length to the full-length protein, with the modulating domain being limited in size only by the fact that the domain must be large enough to retain its function and small enough to be compatible with the desired assembly method. Accordingly, the modulating domain may range in size from 3 to 1000 amino acids or more, and, in some cases, may be from about 30 to about 70 amino acids (a.a.) in length, for example, the modulating domain may be from about 30 to about 35 a.a., from about 35 to about 40 a.a., from about 40 to about 45 a.a., from about 45 to about 50 a.a., from about 50 to about 55 a.a. k., from about 55 to about 60 a.k., from about 60 to about 65 a.k. or from about 65 to about 70 a.k. In other cases, the modulating domain may be from about 70 to about 100 aa, from about 100 to about 200 aa in length. or more than 200 a.c.
В некоторых случаях ''костимулирующие домены можно применять в отдельных элементах библиотек согласно настоящему изобретению. Совместная стимуляция обычно относится к вторичному неспецифичному механизму активации, посредством которого распространяется первичная специфичная стимуляция. Примеры совместной стимуляции включают неспецифичную для антигена Т-клеточную стимуляцию после антигенспецифичной передачи сигналов через рецептор Т-клеток и неспецифичную для антигена В-клеточную совместную стимуляцию после передачи сигналов через рецептор В-клеток. Совместная стимуляция, например совместная Т-клеточная стимуляция, и связанные с ней факторы были описаны в работе Chen & Flies. Nat Rev Immunol (2013) 13(4):227-42, содержание которой полностью включено в настоящую заявку посредством ссылки. Костимулирующие домены обычно представляют собой полипептиды, полученные из рецепторов. Согласно некоторым вариантам реализации настоящего изобретения костимулирующие домены гомодимеризуются. Костимулирующий домен согласно настоящему изобретению может представлять собой внутриклеточную часть трансмембранного белка (т.е. косIn some cases, co-stimulatory domains can be used in individual elements of the libraries of the present invention. Co-stimulation generally refers to a secondary non-specific activation mechanism through which the primary specific stimulation is propagated. Examples of co-stimulation include non-antigen specific T cell stimulation following antigen specific T cell receptor signaling and non antigen specific B cell co stimulation following B cell receptor signaling. Co-stimulation, such as co-stimulation of T-cells, and related factors have been described by Chen & Flies. Nat Rev Immunol (2013) 13(4):227-42, the contents of which are hereby incorporated by reference in their entirety. Co-stimulatory domains are usually polypeptides derived from receptors. In some embodiments of the present invention, the co-stimulatory domains are homodimerized. The co-stimulatory domain of the present invention may be an intracellular portion of a transmembrane protein (i.e., braid
- 19 041085 тимулирующий домен может быть получен из трансмембранного белка). Неограничивающие примеры подходящих костимулирующих полипептидов включают, но не ограничиваются ими, 4-1ВВ (CD137), CD28, ICOS, ОХ-40, BTLA, CD27, CD30, GITR и HVEM. В некоторых случаях костимулирующий домен, например, используемый в элементе библиотеки согласно настоящему изобретению, может включать костимулирующий домен, перечисленный в табл. 1. В некоторых случаях костимулирующий домен отдельного элемента библиотеки содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична аминокислотной последовательности костимулирующего домена, описанного в настоящем документе.- 19 041085 the stimulating domain can be derived from a transmembrane protein). Non-limiting examples of suitable costimulatory polypeptides include, but are not limited to, 4-1BB (CD137), CD28, ICOS, OX-40, BTLA, CD27, CD30, GITR, and HVEM. In some cases, the co-stimulatory domain, such as that used in the library element of the present invention, may include the co-stimulatory domain listed in Table. 1. In some cases, the co-stimulatory domain of an individual library element contains an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the amino acid sequence of the costimulatory domain described herein.
В некоторых случаях коингибирующие домены можно применять в отдельных элементах библиотек согласно настоящему изобретению. Подходящие коингибирующие домены обычно представляют собой полипептиды, полученные из рецепторов. Совместное ингибирование обычно относится к вторичному ингибированию первичных антигенспецифичных механизмов активации, которое предотвращает совместную стимуляцию. Совместное ингибирование, например совместное ингибирование Т-клеток, и связанные с ним факторы были описаны в работах Chen & Flies. Nat Rev Immunol (2013) 13(4):227-42 и Thaventhiran et al. J Clin Cell Immunol (2012) S12, содержание которых полностью включено в настоящую заявку посредством ссылки. Согласно некоторым вариантам реализации настоящего изобретения коингибирующие домены гомодимеризуются. Коингибирующий домен согласно настоящему изобретению может быть внутриклеточной частью трансмембранного белка (т.е. коингибирующий домен может быть получен из трансмембранного белка). Неограничивающие примеры подходящих коингибирующих полипептидов включают, но не ограничиваются ими, CTLA-4 и PD-1. В некоторых случаях коингибирующий домен, например, используемый в элементе библиотеки согласно настоящему изобретению, может включать коингибирующий домен, перечисленный в табл. 1. В некоторых случаях костимулирующий домен отдельного элемента библиотеки содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична аминокислотной последовательности костимулирующего домена, описанного в настоящем документе.In some cases, co-inhibitory domains can be used in individual elements of the libraries according to the present invention. Suitable co-inhibitory domains are typically receptor-derived polypeptides. Co-inhibition generally refers to secondary inhibition of primary antigen-specific activation mechanisms that prevents co-stimulation. Co-inhibition, eg, co-inhibition of T cells, and related factors have been described by Chen & Flies. Nat Rev Immunol (2013) 13(4):227-42 and Thaventhiran et al. J Clin Cell Immunol (2012) S12, the contents of which are incorporated herein by reference in their entirety. In some embodiments of the present invention, the co-inhibitory domains are homodimerized. The co-inhibitory domain of the present invention may be an intracellular portion of a transmembrane protein (ie, the co-inhibitory domain may be derived from a transmembrane protein). Non-limiting examples of suitable co-inhibitory polypeptides include, but are not limited to, CTLA-4 and PD-1. In some instances, a co-inhibitory domain, such as that used in a library element of the present invention, may include the co-inhibitory domain listed in Table 1. 1. In some cases, the co-stimulatory domain of an individual library element contains an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the amino acid sequence of the costimulatory domain described herein.
В некоторых случаях отдельные элементы библиотеки из библиотеки синтетических модульных полипептидов могут включать модуль внутриклеточного сигнального домена. Внутриклеточные сигнальные домены, подходящие для применения в качестве модулей библиотеки согласно настоящему изобретению, включают любой желательный сигнальный домен, который обеспечивает различимый и детектируемый сигнал (например, увеличение выработки одного или более цитокинов клеткой; изменение транскрипции гена-мишени; изменение активности белка; изменение поведения клеток, например гибель клеток, пролиферацию клеток, дифференцировку клеток, выживаемость клеток; модуляцию клеточных сигнальных реакций и т.д.) в ответ на активацию отдельного элемента библиотеки. Домен внутриклеточной сигнализации может быть ковалентно присоединен к отдельным элементам библиотеки или может не иметь такой связи, например, в тех случаях, когда все элементы библиотеки используют общий внутриклеточный сигнальный домен, внутриклеточный сигнальный домен может быть не связан с элементами библиотеки, например, может диффундировать в цитоплазме.In some instances, individual library elements from a library of synthetic modular polypeptides may include an intracellular signaling domain module. Suitable intracellular signaling domains for use as modules of the library of the present invention include any desired signaling domain that provides a distinct and detectable signal (e.g., increased production of one or more cytokines by a cell; alteration in target gene transcription; alteration in protein activity; alteration in behavior cells, such as cell death, cell proliferation, cell differentiation, cell survival, modulation of cell signaling responses, etc.) in response to activation of a single element of the library. The intracellular signaling domain may or may not be covalently attached to individual elements of the library, for example, in cases where all elements of the library use a common intracellular signaling domain, the intracellular signaling domain may not be associated with elements of the library, for example, it may diffuse into cytoplasm.
В некоторых случаях отдельные элементы библиотеки согласно настоящему изобретению будут включать трансмембранный домен для введения в мембрану эукариотических клеток. Трансмембранный домен может присутствовать в любом удобном месте в пределах элементов библиотек, например на Nконце для модульных компонентов библиотеки, на С-конце для модульных компонентов библиотеки, может быть расположен между по меньшей мере двумя модульными компонентами библиотеки (например, между антигенсвязывающим доменом и костимулирующим доменом элементов модульной библиотеки CAR) и т.д.In some cases, individual elements of the library according to the present invention will include a transmembrane domain for insertion into the membrane of eukaryotic cells. The transmembrane domain may be present at any convenient location within the library elements, e.g., at the N-terminus for modular library components, at the C-terminus for modular library components, may be located between at least two modular library components (e.g., between the antigen-binding domain and the costimulatory domain). elements of the CAR modular library), etc.
Любой трансмембранный (ТМ) домен, который обеспечивает введение полипептида в мембрану эукариотических клеток (например, млекопитающего), подходит для применения. В качестве одного неограничивающего примера, подходящей для использования является ТМ-последовательность IYIWAPLAGTCGVLLLSLVITLYC (SEQ ID NO: 1). Дополнительные неограничивающие примеры подходящих ТМ-последовательностей включают:Any transmembrane (TM) domain that allows the introduction of the polypeptide into the membrane of eukaryotic cells (eg, mammalian) is suitable for use. As one non-limiting example, the TM sequence IYIWAPLAGTCGVLLLSLVITLYC (SEQ ID NO: 1) is suitable for use. Additional non-limiting examples of suitable TM sequences include:
a) последовательности, полученные из CD8-бета: LGLLVAGVLVLLVSLGVAIHLCC (SEQ ID NO: 2);a) sequences derived from CD8-beta: LGLLVAGVLVLLVSLGVAIHLCC (SEQ ID NO: 2);
b) последовательности, полученные из CD4: ALIVLGGVAGLLLFIGLGIFFCVRC (SEQ ID NO: 3);b) sequences derived from CD4: ALIVLGGVAGLLLFIGLGIFFCVRC (SEQ ID NO: 3);
c) последовательности, полученные из CD3-дзета: LCYLLDGILFIYGVILTALFLRV (SEQ ID NO: 4);c) sequences derived from CD3-zeta: LCYLLDGILFIYGVILTALFLRV (SEQ ID NO: 4);
d) последовательности, полученные из CD28: WVLVVVGGVLACYSLLVTVAFIIFWV (SEQ ID NO: 5);d) sequences derived from CD28: WVLVVVGGVLACYSLLVTVAFIIFWV (SEQ ID NO: 5);
e) последовательности, полученные из CD134 (ОХ40): VAAILGLGLVLGLLGPLAILLALYLL (SEQ ID NO: 6); иe) sequences derived from CD134 (OX40): VAAILGLGLVLGLLGPLAILLALYLL (SEQ ID NO: 6); And
f) последовательности, полученные из CD7: ALPAALAVISFLLGLGLGVACVLA (SEQ ID NO: 7).f) sequences derived from CD7: ALPAALAVISFLLGLGLGVACVLA (SEQ ID NO: 7).
- 20 041085- 20 041085
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более дополнительных модульных элементов. Например, в тех случаях, когда библиотека представляет собой библиотеку химерных антигенных рецепторов (CAR), отдельные элементы библиотеки могут быть сконфигурированы так, чтобы содержать один или более дополнительных компонентов, как описано, например, в РСТ публикации заявки на патент WO 2014/127261, содержание которой полностью включено в настоящую заявку посредством ссылки.In some cases, individual elements of libraries of synthetic modular polypeptides can be configured to contain one or more additional modular elements. For example, where the library is a chimeric antigen receptor (CAR) library, individual elements of the library can be configured to contain one or more additional components as described, for example, in PCT patent application publication WO 2014/127261, the contents of which are incorporated herein by reference in their entirety.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей многодоменного каркасного белка. В настоящей заявке термин каркасные белки включает якорные белки и адаптерные белки. Указанные белки содержат несколько связывающих доменов, каждый из которых привлекает или закрепляет определенные элементы сигнального пути, например закрепляет их в комплексах, локализует их в клетке или модулирует процесс передачи сигналов (например, контролирует положительную и/или отрицательную обратную связь, стабилизирует активированные сигнальные компоненты от инактивации и т.д.). Следовательно, домены многодоменных каркасных белков, многодоменных якорных белков и многодоменных адаптерных белков обычно включают связывающие домены членов пути передачи сигналов.In some instances, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more multidomain backbone protein modules. In this application, the term scaffold proteins includes anchor proteins and adapter proteins. These proteins contain several binding domains, each of which attracts or anchors certain elements of the signaling pathway, for example, anchors them in complexes, localizes them in the cell, or modulates the signaling process (for example, controls positive and/or negative feedback, stabilizes activated signaling components from inactivation, etc.). Therefore, the domains of multidomain scaffold proteins, multidomain anchor proteins, and multidomain adapter proteins typically comprise the binding domains of signaling pathway members.
Неограничивающие примеры каркасных белков и путей передачи сигналов, в которых они функционируют, включают, например, каркасный белок Ste5 пути с участием митоген-активируемой протеинкиназы (MAPK); якорные белки А-киназы (AKAP) пути передачи сигналов с участием протеинкиназы А (PKA); супрессор киназы Ras 1 (KSR) пути передачи сигналов с участием MAPK; белок В-клеточной лимфомы 10 (BCL-10) пути передачи сигналов с участием N-концевой киназы JUN (JNK) и пути передачи сигналов с участием MAPK; киназу киназы митоген-активируемой протеинкиназы 1 (MEKK1) пути передачи сигналов с участием JNK и пути передачи сигналов с участием MAPK; AHNAK-1 кальцийзависимого пути передачи сигналов; HOMER кальций-зависимого пути передачи сигналов; белки Pellino пути передачи сигналов врожденной иммунной системы; семейство NLR, содержащие пириновые домены (NLRP) белки пути передачи сигналов врожденной иммунной системы; гомолог Disks large 1 (DLG1) пути передачи сигналов с участием рецептора Т-клеток; спинофилин пути передачи сигналов дендритных клеток; и т.п. Каркасные белки также включают, но не ограничиваются ими, например, те, которые описаны в работе Buday & Tompa. FEBS Journal (2010) 277:4348-4355; содержание которой полностью включено в настоящую заявку посредством ссылки. В некоторых случаях каркасный белок может представлять собой белок, связанный с терминами генной онтологии (GO) каркасный белковый комплекс (GO: 0032947) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к протеинкиназам, включая последовательности, например, представленные на вебсайте www.ebi.ac.uk/QuickGO.Non-limiting examples of scaffold proteins and the signaling pathways in which they function include, for example, scaffold protein Ste5 of the mitogen-activated protein kinase (MAPK) pathway; A-kinase anchor proteins (AKAP) signaling pathways involving protein kinase A (PKA); kinase suppressor Ras 1 (KSR) signaling pathway involving MAPK; B-cell lymphoma protein 10 (BCL-10) of the JUN N-terminal kinase (JNK) signaling pathway and the MAPK signaling pathway; mitogen-activated protein kinase kinase kinase 1 (MEKK1) of the JNK signaling pathway and the MAPK signaling pathway; AHNAK-1 calcium-dependent signaling pathway; HOMER calcium-dependent signaling pathway; Pellino proteins of the signaling pathway of the innate immune system; the NLR family containing pyrine domains (NLRP) proteins of the innate immune signaling pathway; a Disks large 1 (DLG1) homologue of the T cell receptor signaling pathway; spinophilin dendritic cell signaling pathway; and so on. Scaffold proteins also include, but are not limited to, for example those described by Buday & Tompa. FEBS Journal (2010) 277:4348-4355; the contents of which are incorporated herein by reference in their entirety. In some cases, a scaffold protein may be a protein associated with the gene ontology (GO) terms scaffold protein complex (GO: 0032947) and synonymous terms that can be used to obtain information related to protein kinases, including sequences such as those provided on the website www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей протеинкиназ. Протеинкиназы представляют собой белки, которые функционируют путем добавления фосфатных групп к белкамсубстратам для управления активностью белка-субстрата, ассоциацией с другими белками и/или локализацией. Протеинкиназы могут включать белки, которые связаны с терминами GO фосфорилирование белка (GO: 0006468), активность протеинкиназы (GO: 0004672), активность сериновой/треониновой протеинкиназы (GO: 0004674), активность киназы (GO: 0016301) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к протеинкиназам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO. Протеинкиназы содержат один или более доменов киназы, которые осуществляют каталитическую функцию протеинкиназы. Домены протеинкиназы связаны с идентификатором Pfam PF00069, который может быть использован для получения информации о протеинкиназных доменах тех белков, которые содержат протеинкиназные домены, включая последовательности и структуры, представленные, например, на вебсайте pfam.xfam.org.In some instances, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more protein kinase modules. Protein kinases are proteins that function by adding phosphate groups to substrate proteins to control substrate protein activity, association with other proteins, and/or localization. Protein kinases may include proteins that are associated with the terms GO protein phosphorylation (GO: 0006468), protein kinase activity (GO: 0004672), serine/threonine protein kinase activity (GO: 0004674), kinase activity (GO: 0016301), and synonymous terms that may be used to obtain information relating to protein kinases, including sequences such as those provided at www.ebi.ac.uk/QuickGO. Protein kinases contain one or more kinase domains that perform the catalytic function of the protein kinase. The protein kinase domains are associated with the Pfam identifier PF00069, which can be used to obtain information about the protein kinase domains of those proteins that contain protein kinase domains, including sequences and structures presented, for example, on the pfam.xfam.org website.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей протеинфосфатаз. Протеинфосфатазы представляют собой белки, которые функционируют путем удаления фосфатной группы из фосфорилированного остатка аминокислоты своего белка-субстрата, что приводит к дефосфорилированию для управления активностью белка-субстрата, и выполняют функции, обратные таковым протеинкиназ. Протеинфосфатазы сгруппированы в три класса: фосфопротеиновые фосфатазы (например, РРР1СА, РРР1СВ, РРР1СС, РРР2СА, РРР2СВ, РРРЗСА, РРРЗСВ, РРРЗСС, РРР4С, РРР5С, РРР6С и т.д.), протеинтирозинфосфатазы (например, CDC14A, CDC14B, CDC14C, CDKN3, PTEN, SSH1, SSH2, SSH3 и т.д.) и протеинфосфатазы с двойной специфичностью (например, DUSP1, DUSP2, DUSP3, DUSP4, DUSP5, DUSP6, DUSP7, DUSP8, DUSP9, DUSP10, DUSP11, DUSP12, DUSP13, DUSP14, DUSP15, DUSP16, DUSP18, DUSP19, DUSP21, DUSP22, DUSP23, DUSP26, DUSP27, DUSP28 и т.д.); однако некоторые протеинфосфатазы остаются неклассифицированными. Протеинфосфатазы могут включать белки, которые связаны с термином GO активность фосфатазы (GO: 0016791) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к протеинфосфатазам,In some instances, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more protein phosphatase modules. Protein phosphatases are proteins that function by removing a phosphate group from a phosphorylated amino acid residue of their substrate protein, resulting in dephosphorylation to control the activity of the substrate protein, and act inversely to those of protein kinases. Protein phosphatases are grouped into three classes: phosphoprotein phosphatases (for example, PPP1CA, PPP1CB, PPP1CC, PPP2CA, PPP2CB, PPP3CA, PPP3CB, PPP3CC, PPP4C, PPP5C, PPP6C, etc.), protein tyrosine phosphatases (for example, CDC14A, CDC14B, CDC14C, CDKN3 , PTEN, SSH1, SSH2, SSH3, etc.) and dual specific protein phosphatases (e.g., DUSP1, DUSP2, DUSP3, DUSP4, DUSP5, DUSP6, DUSP7, DUSP8, DUSP9, DUSP10, DUSP11, DUSP12, DUSP13, DUSP14, DUSP15, DUSP16, DUSP18, DUSP19, DUSP21, DUSP22, DUSP23, DUSP26, DUSP27, DUSP28, etc.); however, some protein phosphatases remain unclassified. Protein phosphatases may include proteins that are associated with the term GO phosphatase activity (GO: 0016791) and synonymous terms that can be used to obtain information related to protein phosphatases,
- 21 041085 включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO. Протеинфосфатазы содержат один или более фосфатазных доменов, которые осуществляют функцию дефосфорилирования протеинфосфатазы. Домены протеинфосфатаз связаны с идентификатором Pfam PF15698, который может быть использован для получения информации о протеинфосфатазных доменах тех белков, которые содержат протеинфосфатазные домены, включая последовательности, например, представленные на веб-сайте pfam.xfam.org.- 21 041085 including sequences such as those provided on the website www.ebi.ac.uk/QuickGO. Protein phosphatases contain one or more phosphatase domains that perform the function of dephosphorylation of the protein phosphatase. The protein phosphatase domains are associated with the Pfam identifier PF15698, which can be used to obtain information on the protein phosphatase domains of those proteins that contain protein phosphatase domains, including sequences such as those presented on the pfam.xfam.org website.
В некоторых случаях отдельные элементы библиотеки синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка рецепторной тирозинкиназы, также называемых рецепторными тирозинкиназами (RTK). RTK представляют собой связанные с мембраной рецепторы клеточной поверхности. Существует подкласс тирозинкиназ, RTK, которые функционируют посредством связывания внеклеточного лиганда и последующего фосфорилирования цитоплазматической части белка. RTK можно разделить на семейства, включающие, например, семейство рецепторов эпидермального фактора роста, семейство рецепторов фактора роста фибробластов (FGFR), семейство рецепторов фактора роста эндотелия сосудов (VEGFR), семейство рецепторов RET и семейство рецепторов с дискоидиновым доменом (DDR). RTK могут включать белки, которые связаны с терминами GO активность трансмембранной рецепторной тирозинкиназы (GO: 0004714), путь передачи сигналов с участием трансмембранной рецепторной тирозинкиназы (GO: 0007169) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к RTK, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO. RTK содержат один или более тирозинкиназных доменов, которые осуществляют киназную функцию RTK. Киназные домены RTK связаны с идентификатором Pfam PF07714, который может быть использован для получения информации о киназных доменах RTK и белках, содержащих киназные домены RTK, включая последовательности и структуры, например, представленные на веб-сайте pfam.xfam.org.In some instances, individual elements of a synthetic modular polypeptide library may be configured to contain one or more receptor tyrosine kinase protein modules, also referred to as receptor tyrosine kinases (RTKs). RTKs are membrane-bound cell surface receptors. There is a subclass of tyrosine kinases, RTKs, which function by binding an extracellular ligand and subsequent phosphorylation of the cytoplasmic portion of the protein. RTKs can be divided into families including, for example, the epidermal growth factor receptor family, the fibroblast growth factor receptor (FGFR) family, the vascular endothelial growth factor receptor (VEGFR) family, the RET receptor family, and the discoidin domain receptor (DDR) family. RTKs may include proteins that are associated with the terms GO transmembrane receptor tyrosine kinase activity (GO: 0004714), transmembrane receptor tyrosine kinase signaling pathway (GO: 0007169) and synonymous terms that can be used to obtain information related to RTK, including sequences such as those provided on the website www.ebi.ac.uk/QuickGO. RTKs contain one or more tyrosine kinase domains that carry out the RTK kinase function. The RTK kinase domains are linked to the Pfam identifier PF07714, which can be used to obtain information about RTK kinase domains and proteins containing RTK kinase domains, including sequences and structures, such as those provided at the pfam.xfam.org website.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка липидкиназы. Белки липидкиназы фосфорилируют клеточные липиды, что приводит к модуляции реактивности липида, передаче сигнала и/или локализации липидов. Липидкиназы можно разделить на семейства, включая, например, фосфатидилинозитолкиназы и сфингозинкиназы. Липидкиназы могут включать белки, которые связаны с терминами GO активность липидкиназы (GO: 0001727), фосфорилирование липидов (GO: 0046834) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к липидкиназам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some instances, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more lipid kinase protein modules. Lipid kinase proteins phosphorylate cellular lipids, resulting in modulation of lipid reactivity, signal transduction, and/or lipid localization. Lipid kinases can be divided into families including, for example, phosphatidylinositol kinases and sphingosine kinases. Lipid kinases may include proteins that are associated with the terms GO lipid kinase activity (GO: 0001727), lipid phosphorylation (GO: 0046834) and synonymous terms that can be used to obtain information related to lipid kinases, including sequences, for example, presented on the web. www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка липидфосфатазы. Белки липидфосфатаз дефосфорилируют клеточные липиды и их активность противоположна активности липидкиназ, которая приводит к модуляции реактивности липида, передаче сигнала и/или локализации липидов. Липидфосфатазы могут включать белки, которые связаны с терминами GO активность липидфосфатазы (GO: 0042577), дефосфорилирование фосфолипидов (GO: 0046839) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к липидфосфатазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some instances, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more lipid phosphatase protein modules. Lipid phosphatase proteins dephosphorylate cellular lipids and their activity is opposite to that of lipid kinases, which results in modulation of lipid reactivity, signal transduction and/or lipid localization. Lipid phosphatases may include proteins that are related to the terms GO lipid phosphatase activity (GO: 0042577), phospholipid dephosphorylation (GO: 0046839) and synonymous terms that can be used to obtain information related to lipid phosphatases, including sequences such as those shown on the web. www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка убиквитинилазы. Белки убиквитинилазы представляют собой белки, которые опосредуют посттрансляционную модификацию убиквитинирования, присоединение убиквитина к белку-субстрату. Убиквитинирование белка-субстрата может привести к деградации белка-субстрата, перемещению белка-субстрата, модуляции активности белка-субстрата, модуляции белок-белкового взаимодействия белка-субстрата и т.д. Убиквитинилазы могут включать белки, связанные с терминами GO убиквитинирование белка (GO: 0016567), активность убиквитин-протеинтрансферазы (GO: 0004842) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к убиквитинилазам, включая последовательности, представленные, например, на веб-сайте www.ebi.ac.uk/QuickGO.In some instances, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more ubiquitinylase protein modules. Ubiquitinylase proteins are proteins that mediate the post-translational modification of ubiquitination, the addition of ubiquitin to a substrate protein. Ubiquitination of a substrate protein can lead to degradation of the substrate protein, translocation of the substrate protein, modulation of the activity of the substrate protein, modulation of protein-protein interaction of the substrate protein, etc. Ubiquitinylases may include proteins associated with the terms GO protein ubiquitination (GO: 0016567), ubiquitin protein transferase activity (GO: 0004842) and synonymous terms that can be used to obtain information related to ubiquitinylases, including sequences shown, for example, in website www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка деубиквитинилазы. Белки деубиквитинилазы представляют собой белки, которые опосредуют обращение убиквитинирования, удаление убиквитина из белка-субстрата. Деубиквитинирование белка-субстрата может обратить действие убиквитинилаз и предотвратить деградацию белка-субстрата, обратить связанное с убиквитином перемещение белка-субстрата, обратить связанную с убиквитином модуляцию активности белкасубстрата, обратить связанную с убиквитином модуляцию белок-белкового взаимодействия белкасубстрата и т.д. Деубиквитинилазы могут включать белки, которые связаны с термином GO деубиквитинирование белка (GO: 0016579) и синонимичными терминами, которые можно использовать для получения информации, относящейся к деубиквитинилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some instances, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more deubiquitinylase protein modules. Deubiquitinylase proteins are proteins that mediate the reversal of ubiquitination, the removal of ubiquitin from a substrate protein. Deubiquitination of the substrate protein can reverse the action of ubiquitinases and prevent degradation of the substrate protein, reverse ubiquitin-related substrate protein trafficking, reverse ubiquitin-related modulation of substrate protein activity, reverse ubiquitin-related modulation of protein-protein interaction of the substrate protein, etc. Deubiquitinylases may include proteins that are associated with the term GO protein deubiquitination (GO: 0016579) and synonymous terms that can be used to obtain information related to deubiquitinylases, including sequences such as those provided on the website www.ebi.ac.uk/ QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов моIn some cases, individual elements of libraries of synthetic modular polypeptides can
- 22 041085 гут быть сконфигурированы так, чтобы содержать один или более модулей белка SUМОилазы. Белки SUМОилазы представляют собой белки, которые опосредуют посттрансляционную модификацию SUМОилирования, добавление небольшого убиквитинподобного модифицирующего белка (SUMO) к белку-субстрату. SUМОилирование может модулировать различные функции белка, включая стабильность белка, ядерно-цитозольный транспорт, регуляцию транскрипции и т.д. SUМОилазы могут включать белки, связанные с термином GO SUМОилирование белка (GO: 0016925), и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к SUМОилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.- 22 041085 can be configured to contain one or more SUMOylase protein modules. SUMOylase proteins are proteins that mediate post-translational modification of SUMOylation, the addition of a small ubiquitin-like modifying protein (SUMO) to a substrate protein. SUMOylation can modulate various protein functions, including protein stability, nuclear-cytosolic transport, transcriptional regulation, and so on. SUMOylases may include proteins associated with the term GO protein SUMOylation (GO: 0016925) and synonymous terms that can be used to obtain information related to SUMOylases, including sequences such as those provided on the website www.ebi.ac.uk /QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка ацетилазы, также называемых ацетилтрансферазами. Ацетилтрансферазы представляют собой ферменты-трансферазы, которые катализируют перенос ацетильной группы на белок-субстрат и участвуют в эпигенетической и транскрипционной модуляции. Ацетилтрансферазы могут быть классифицированы на группы, включающие, например, гистонацетилтрансферазы, холинацетилтрансферазы, хлорамфениколацетилтрансферазы, серотонин-К-ацетилтрансферазы, NatA-ацетилтрансферазы, NatB-ацетилтрансферазы. Ацетилтрансферазы могут включать белки, которые связаны с термином GO активность ацетилтрансферазы (GO: 0016407) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к ацетилтрансферазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some instances, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more acetylase protein modules, also referred to as acetyltransferases. Acetyltransferases are transferase enzymes that catalyze the transfer of an acetyl group to a protein substrate and are involved in epigenetic and transcriptional modulation. Acetyltransferases can be classified into groups including, for example, histone acetyltransferases, choline acetyltransferases, chloramphenicol acetyltransferases, serotonin K acetyltransferases, NatA acetyltransferases, NatB acetyltransferases. Acetyltransferases may include proteins that are associated with the term GO acetyltransferase activity (GO: 0016407) and synonymous terms that can be used to obtain information related to acetyltransferases, including sequences such as those provided on the website www.ebi.ac.uk /QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка деацетилазы. Белки деацетилазы обращают действие ацетилтрансфераз и удаляют ацетильные группы, перенесенные на белок-субстрат, и, следовательно, также участвуют в эпигенетической и транскрипционной модуляции. Деацетилазы включают, например, гистондеацетилазы и сиртуины. Деацетилазы могут включать белки, которые связаны с термином GO активность деацетилазы (GO: 0019213) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к деацетилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some instances, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more deacetylase protein modules. Deacetylase proteins reverse the action of acetyltransferases and remove acetyl groups transferred to the substrate protein and hence also participate in epigenetic and transcriptional modulation. Deacetylases include, for example, histone deacetylases and sirtuins. Deacetylases may include proteins that are associated with the term GO deacetylase activity (GO: 0019213) and synonymous terms that can be used to obtain information related to deacetylases, including sequences such as those provided on the website www.ebi.ac.uk /QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка метилазы, также называемых метилтрансферазами. Метилтрансферазы алкилируют субстраты (включая такие субстраты как белки и нуклеиновые кислоты) путем переноса метильной группы на субстрат и участвуют в эпигенетической и транскрипционной модуляции. Метилтрансферазы можно разделить на классы на основании их структуры, включая, например, класс I, класс II, класс III, и можно сгруппировать в соответствии с их субстратами или способом метилирования, включая, например, протеинметилтрансферазы, ДНКметилтрансферазы, метилтрансферазы природного продукта и SAM-независимые метилтрансферазы. Метилтрансферазы могут включать белки, которые связаны с терминами GO активность ДНКметилтрансферазы (GO: 0009008), активность гистонметилтрансферазы (GO: 0042054) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к метилтрансферазам, включая последовательности, например, представленные на вебсайте www.ebi.ac.uk/QuickGO.In some instances, individual elements of synthetic modular polypeptide libraries can be configured to contain one or more methylase protein modules, also referred to as methyltransferases. Methyl transferases alkylate substrates (including substrates such as proteins and nucleic acids) by transferring a methyl group to the substrate and are involved in epigenetic and transcriptional modulation. Methyltransferases can be divided into classes based on their structure, including, for example, class I, class II, class III, and can be grouped according to their substrates or mode of methylation, including, for example, protein methyltransferases, DNA methyltransferases, natural product methyltransferases, and SAM-independent methyltransferases. Methyltransferases may include proteins that are associated with the terms GO DNA methyltransferase activity (GO: 0009008), histone methyltransferase activity (GO: 0042054) and synonymous terms that can be used to obtain information related to methyltransferases, including sequences, for example, presented on the website www .ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка деметилазы. Деметилазы обращают действие метилтрансфераз и катализируют удаление метальных групп с субстратов (включая такие субстраты как белки и нуклеиновые кислоты) и, следовательно, также участвуют в эпигенетической и транскрипционной модуляции. Деметилазы могут включать белки, которые связаны с терминами GO активность деметилазы (GO: 0032451), активность ДНК-деметилазы (GO: 0035514), активность гистондеметилазы (GO: 0032452) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к деметилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some instances, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more demethylase protein modules. Demethylases reverse the action of methyltransferases and catalyze the removal of methyl groups from substrates (including substrates such as proteins and nucleic acids) and hence are also involved in epigenetic and transcriptional modulation. Demethylases may include proteins that are associated with the terms GO demethylase activity (GO: 0032451), DNA demethylase activity (GO: 0035514), histone demethylase activity (GO: 0032452) and synonymous terms that can be used to obtain information related to demethylases , including sequences such as those provided on the website www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка нуклеазы. Нуклеазы катализируют расщепление фосфодиэфирных связей между нуклеотидными субъединицами нуклеиновых кислот-субстратов. Нуклеазы можно подразделить на не взаимоисключающие категории, такие как эндонуклеазы и экзонуклеазы. Нуклеазы могут включать белки, которые связаны с терминами GO активность нуклеазы (GO: 0004518), активность дезоксирибонуклеазы I (GO: 0004530), активность рибонуклеазы в отношении гибрида РНК-ДНК (GO: 0004523), гидролиз фосфодиэфирной связи нуклеиновых кислот (GO: 0090305), активность эндонуклеазы (GO: 0004519), активность экзонуклеазы (GO: 0004527) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к нуклеазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some instances, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more nuclease protein modules. Nucleases catalyze the cleavage of phosphodiester bonds between the nucleotide subunits of nucleic acid substrates. Nucleases can be classified into non-mutually exclusive categories such as endonucleases and exonucleases. Nucleases may include proteins that are associated with the terms GO nuclease activity (GO: 0004518), deoxyribonuclease I activity (GO: 0004530), RNA-DNA fusion ribonuclease activity (GO: 0004523), nucleic acid phosphodiester bond hydrolysis (GO: 0090305 ), endonuclease activity (GO: 0004519), exonuclease activity (GO: 0004527), and synonymous terms that can be used to obtain information related to nucleases, including sequences such as those provided on the website www.ebi.ac.uk /QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка рекомбиназы. РекомIn some instances, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more recombinase protein modules. rekom
- 23 041085 биназы катализируют чувствительные к направлению реакции обмена нуклеиновых кислот между последовательностями участков-мишеней, специфичных для каждой рекомбиназы, что приводит к вырезанию/вставке, инверсии, транслокации и обмену фрагментов нуклеиновых кислот. Примеры рекомбиназ включают, но не ограничиваются ими, рекомбиназу Cre, рекомбиназу Hin, рекомбиназу Tre, рекомбиназу FLP и т.п. Рекомбиназы могут включать белки, которые связаны с терминами GO активность рекомбиназы (GO: 0000150), рекомбинация ДНК (GO: 0006310) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к рекомбиназам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.- 23 041085 binases catalyze direction-sensitive nucleic acid exchange reactions between target site sequences specific for each recombinase, resulting in excision/insertion, inversion, translocation and exchange of nucleic acid fragments. Examples of recombinases include, but are not limited to, Cre recombinase, Hin recombinase, Tre recombinase, FLP recombinase, and the like. Recombinases may include proteins that are associated with the terms GO recombinase activity (GO: 0000150), DNA recombination (GO: 0006310) and synonymous terms that can be used to obtain information related to recombinases, including sequences such as those presented on the web. www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка фактора транскрипции. Факторы транскрипции представляют собой белки, которые связываются с определенными последовательностями ДНК и контролируют транскрипцию. Факторы транскрипции могут являться активаторами, которые усиливают транскрипцию, или репрессорами, которые подавляют транскрипцию. Факторы транскрипции могут быть классифицированы на суперклассы на основании структуры их ДНКсвязывающих доменов, включая, например, содержащие основной домен факторы транскрипции, факторы транскрипции, содержащие цинк-координирующий ДНК-связывающий домен, факторы транскрипции спираль-поворот-спираль, факторы транскрипции, содержащие бета-каркасные факторы, и те факторы транскрипции, которые не включены ни в один из вышеуказанных суперклассов (см., например, Stegmaier et al. Genome Inform (2004) 15(2):276-86). Факторы транскрипции содержат один или более ДНК-связывающих доменов. ДНК-связывающие домены факторов транскрипции могут представлять собой один или более ДНК-связывающих доменов, связанных с идентификаторами Pfam PF00010, PF00170, PF00172, PF00046, PF00319, PF08279, PF00096, PF00105 и т.п., которые могут быть использованы для получения информации о последовательностях и структуре доменов, например, на веб-сайте pfam.xfam.org. Факторы транскрипции также могут содержать один или более транс-активирующих доменов, один или более доменов, воспринимающих сигналы. Факторы транскрипции могут включать белки, связанные с термином GO комплекс факторов транскрипции (GO: 0005667), и синонимичными и родственными терминами, которые могут быть использованы для получения информации, относящейся к факторам транскрипции, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.In some instances, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more transcription factor protein modules. Transcription factors are proteins that bind to specific DNA sequences and control transcription. Transcription factors can be activators that increase transcription or repressors that repress transcription. Transcription factors can be classified into superclasses based on the structure of their DNA-binding domains, including, for example, core domain-containing transcription factors, transcription factors containing a zinc-coordinating DNA-binding domain, helix-turn-helix transcription factors, transcription factors containing beta- framework factors, and those transcription factors that are not included in any of the above superclasses (see, for example, Stegmaier et al. Genome Inform (2004) 15(2):276-86). Transcription factors contain one or more DNA binding domains. Transcription factor DNA binding domains can be one or more DNA binding domains associated with Pfam identifiers PF00010, PF00170, PF00172, PF00046, PF00319, PF08279, PF00096, PF00105, etc., which can be used to obtain information about sequences and domain structure, such as the pfam.xfam.org website. Transcription factors may also contain one or more trans-activating domains, one or more signaling domains. Transcription factors may include proteins associated with the term GO transcription factor complex (GO: 0005667) and synonymous and related terms that can be used to obtain information related to transcription factors, including sequences, for example, presented on the website www. ebi.ac.uk/QuickGO.
Другие ДНК-связывающие домены, например ДНК-связывающие домены, полученные не из факторов транскрипции, или ДНК-связывающие домены, не принадлежащие факторам транскрипции, также можно применять в некоторых случаях в одном или более модулях отдельных элементов библиотек синтетических модульных полипептидов, описанных в настоящем документе. Подходящие ДНКсвязывающие домены, полученные не из факторов транскрипции, включают природные и синтетические полипептидные домены, которые неспецифично связываются с ДНК или связываются со специфичными последовательностями ДНК. ДНК-связывающие домены, полученные не из факторов транскрипции, могут включать, но не ограничиваются ими, например, природный или модифицированный ДНКсвязывающий домен из полипептида эндонуклеазы, содержащей цинковый палец, природный или модифицированный ДНК-связывающий домен из полипептида эффекторной нуклеазы, подобной активаторам транскрипции (TALEN), природный или модифицированный ДНК-связывающий домен полипептида Cas9 (включая, например, Cas9 с полной инактивацией нуклеазной активности (dCas9) и тому подобное) и т.д.Other DNA binding domains, such as DNA binding domains not derived from transcription factors or DNA binding domains not belonging to transcription factors, can also be used in some instances in one or more individual element modules of the synthetic modular polypeptide libraries described herein. document. Suitable DNA-binding domains derived from non-transcription factors include natural and synthetic polypeptide domains that bind non-specifically to DNA or bind to specific DNA sequences. DNA-binding domains derived from non-transcription factors may include, but are not limited to, for example, a natural or modified DNA-binding domain from a zinc finger endonuclease polypeptide, a natural or modified DNA-binding domain from a transcription activator-like effector nuclease polypeptide ( TALEN), a natural or modified DNA-binding domain of a Cas9 polypeptide (including, for example, Cas9 with complete nuclease inactivation (dCas9) and the like), etc.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей, описанных в РСТ заявке US 2004/019778, содержание которой полностью включено в настоящую заявку посредством ссылки.In some instances, individual elements of synthetic modular polypeptide libraries may be configured to contain one or more of the modules described in PCT application US 2004/019778, the contents of which are hereby incorporated by reference in their entirety.
Компоновка модулей в синтетические модульные полипептиды, описанные в настоящем документе, позволит получить библиотеку, содержащую множество отдельных модульных функциональных белков, которые могут, но необязательно, обладать общей функцией. Например, отдельные элементы библиотеки могут содержать или могут состоять из синтетических модульных полипептидов, которые представляют собой модульные каркасные белки, синтетических модульных полипептидов, которые представляют собой модульные рецепторные белки, синтетических модульных полипептидов, которые представляют собой модульные белки протеинкиназ или протеинфосфатаз, синтетических модульных полипептидов, которые представляют собой модульные транскрипционные регуляторные белки, синтетических модульных полипептидов, которые представляют собой модульные эпигенетические регуляторные белки, синтетических модульных полипептидов, которые представляют собой модульные белки рекомбиназ или нуклеаз и т.д. Подходящие библиотеки можно подвергать скринингу для определения желательного фенотипа в соответствии со способами, описанными в настоящем документе.The assembly of the modules into the synthetic modular polypeptides described herein will result in a library containing a plurality of individual modular functional proteins, which may, but need not, share a common function. For example, individual library elements may contain or may consist of synthetic modular polypeptides that are modular scaffold proteins, synthetic modular polypeptides that are modular receptor proteins, synthetic modular polypeptides that are protein kinase or protein phosphatase modular proteins, synthetic modular polypeptides, which are modular transcriptional regulatory proteins, synthetic modular polypeptides which are modular epigenetic regulatory proteins, synthetic modular polypeptides which are modular proteins of recombinases or nucleases, etc. Suitable libraries can be screened for the desired phenotype according to the methods described herein.
Репортеры.Reporters.
Библиотеки, описанные в настоящем документе, включают детектируемые сигнальные белки, экспрессия которых кодируется последовательностями нуклеиновых кислот библиотек. Конкретные детектируемые сигнальные белки, используемые в системах библиотек, описанных в настоящем документе, будут варьироваться и частично зависеть от предпочтительного способа детектирования полученногоThe libraries described herein include detectable signal proteins whose expression is encoded by the nucleic acid sequences of the libraries. The specific detectable signal proteins used in the library systems described herein will vary and depend in part on the preferred method for detecting the resulting
- 24 041085 сигнала. Например, если сигнал детектируется оптическими способами, например, с использованием флуоресцентной микроскопии или проточной цитометрии (включая флуоресцентно-активированную сортировку клеток (FACS)), то используется флуоресцентный репортер.- 24 041085 signal. For example, if the signal is detected by optical methods, such as using fluorescence microscopy or flow cytometry (including fluorescence-activated cell sorting (FACS)), then a fluorescent reporter is used.
Подходящие детектируемые сигнальные белки включают, например, флуоресцентные белки; ферменты, которые катализируют реакцию, которая приводит к получению детектируемого сигнала в качестве продукта; эпитопные метки, поверхностные маркеры и т.п. Детектируемые сигнальные белки могут быть обнаружены непосредственно или косвенно. Например, если используется флуоресцентный репортер, то флуоресценцию репортера можно детектировать непосредственно. В некоторых случаях, если используется эпитопная метка или поверхностный маркер, то эпитопную метку или поверхностный маркер можно детектировать косвенно, например, с помощью детектируемого связывающего агента, который специфично связывается с эпитопной меткой или поверхностным маркером, например, с помощью флуоресцентномеченого антитела, которое специфично связывается с эпитопной меткой или поверхностным маркером. В некоторых случаях репортер, который обычно детектируют косвенно, например, эпитопную метку или поверхностный маркер, можно детектировать непосредственно, или репортер, который обычно детектируют непосредственно, можно детектировать косвенно, например, посредством использования детектируемого антитела, которое специфично связывается с флуоресцентным репортером.Suitable detectable signal proteins include, for example, fluorescent proteins; enzymes that catalyze a reaction that results in a detectable signal as a product; epitope marks, surface markers, and the like. Detectable signaling proteins can be detected directly or indirectly. For example, if a fluorescent reporter is used, then reporter fluorescence can be detected directly. In some cases, if an epitope tag or surface marker is used, then the epitope tag or surface marker can be detected indirectly, for example, with a detectable binding agent that specifically binds to the epitope tag or surface marker, for example, with a fluorescently labeled antibody that specifically binds with epitope tag or surface marker. In some cases, a reporter that is normally detected indirectly, such as an epitope tag or surface marker, can be detected directly, or a reporter that is normally detected directly can be detected indirectly, such as by using a detectable antibody that specifically binds to a fluorescent reporter.
Подходящие флуоресцентные белки включают, но не ограничиваются ими, зеленый флуоресцентный белок (GFP) или его варианты, синий флуоресцентный вариант GFP (BFP), голубой флуоресцентный вариант GFP (CFP), желтый флуоресцентный вариант GFP (YFP), улучшенный GFP (EGFP), улучшенный CFP (ECFP), улучшенный YFP (EYFP), GFPS65T, Изумруд, Топаз (TYFP), Venus, Citrine, mCitrine, GFPuv, дестабилизированный EGFP (dEGFP), дестабилизированный ECFP (dECFP), дестабилизированный EYFP (dEYFP), mCFPm, Cerulean, T-Sapphire, CyPet, YPet, mKO, HcRed, t-HcRed, DsRed, DsRed2, мономерный DsRed, J-Red, dimer2, t-dimer2(12), mRFP1, поциллопорин, Renilla GFP, Monster GFP, paGFP, белок Kaede и фотоактивируемый белок, фикобилипротеины и конъюгаты фикобилипротеинов, включая В-фикоэритрин, R-фикоэритрин и аллофикоцианин. Другие примеры флуоресцентных белков включают mHoneydew, mBanana, mOrange, dTomato, tdTomato, mTangerine, mStrawberry, mCherry, mGrape1, mRaspberry, mGrape2, mPlum (Shaner et al. (2005) Nat. Methods 2:905-909) и т.п.Suitable fluorescent proteins include, but are not limited to, green fluorescent protein (GFP) or variants thereof, GFP blue fluorescent variant (BFP), GFP blue fluorescent variant (CFP), GFP yellow fluorescent variant (YFP), GFP enhanced (EGFP), enhanced CFP (ECFP), enhanced YFP (EYFP), GFPS65T, Emerald, Topaz (TYFP), Venus, Citrine, mCitrine, GFPuv, destabilized EGFP (dEGFP), destabilized ECFP (dECFP), destabilized EYFP (dEYFP), mCFPm, Cerulean , T-Sapphire, CyPet, YPet, mKO, HcRed, t-HcRed, DsRed, DsRed2, monomeric DsRed, J-Red, dimer2, t-dimer2(12), mRFP1, pocilloporin, Renilla GFP, Monster GFP, paGFP, protein Kaede and photoactivated protein, phycobiliproteins and phycobiliprotein conjugates including B-phycoerythrin, R-phycoerythrin and allophycocyanin. Other examples of fluorescent proteins include mHoneydew, mBanana, mOrange, dTomato, tdTomato, mTangerine, mStrawberry, mCherry, mGrape1, mRaspberry, mGrape2, mPlum (Shaner et al. (2005) Nat. Methods 2:905-909) and the like.
Любой из множества флуоресцентных и окрашенных белков из видов Anthozoa, описанных, например, Matz et al. (1999) Nature Biotechnol. 17:969-973, подходит для применения.Any of the many fluorescent and stained proteins from Anthozoa species described, for example, by Matz et al. (1999) Nature Biotechnol. 17:969-973, suitable for use.
Подходящие ферменты включают, но не ограничиваются ими, пероксидазу хрена (HRP), щелочную фосфатазу (АР), бета-галактозидазу (GAL), глюкозо-6-фосфатдегидрогеназу, бета-Nацетилглюкозаминидазу, β-глюкуронидазу, инвертазу, ксантиноксидазу, люциферазу светлячков, глюкозооксидазу (GO) и т.п.Suitable enzymes include, but are not limited to, horseradish peroxidase (HRP), alkaline phosphatase (AP), beta-galactosidase (GAL), glucose-6-phosphate dehydrogenase, beta-Nacetylglucosaminidase, β-glucuronidase, invertase, xanthine oxidase, firefly luciferase, glucose oxidase (GO) etc.
Линкеры и соединения.Linkers and connections.
Соединения между модульными компонентами, кодирующими один полипептид, внутри отдельных элементов библиотеки обычно сохраняют рамку считывания, т.е. открытая рамка считывания кодонов многомодульной кодирующей последовательности поддерживается от одного модуля до следующего. Указанные соединения могут быть упомянуты в настоящем документе как соединения с сохранением открытой рамки считывания и/или связи с сохранением открытой рамки считывания. Линкеры между модульными компонентами многомодульных полипептидов обычно будут гибкими и/или не будут содержать остатков аминокислот, которые нарушают функцию модульных доменов.Links between modular components encoding a single polypeptide within individual library elements typically maintain a reading frame, i.e. the open reading frame of codons of a multi-module coding sequence is maintained from one module to the next. These compounds may be referred to herein as open reading frame compounds and/or open reading frame bonds. Linkers between the modular components of multimodular polypeptides will typically be flexible and/or will not contain amino acid residues that interfere with the function of the modular domains.
Подходящие соединения с сохранением открытой рамки считывания могут быть достигнуты, как описано более подробно ниже, с помощью любого удобного способа компоновки кодирующей последовательности и вложенной сборки модульных компонентов для включения линкера с сохранением открытой рамки считывания.Suitable open reading frame connections can be achieved, as described in more detail below, by any convenient method of arranging a coding sequence and nesting modular components to include an open reading frame linker.
Подходящие линкеры могут быть легко выбраны и могут иметь любую подходящую длину, например, от 1 аминокислоты (например, Gly) до 20 аминокислот, от 2 аминокислот до 15 аминокислот, от 3 аминокислот до 12 аминокислот, включая от 4 аминокислот до 10 аминокислот, от 5 аминокислот до 9 аминокислот, от 6 аминокислот до 8 аминокислот или от 7 аминокислот до 8 аминокислот и могут содержать 1, 2, 3, 4, 5, 6, или 7 аминокислот.Suitable linkers can be readily selected and can be of any suitable length, for example, from 1 amino acid (e.g. Gly) to 20 amino acids, from 2 amino acids to 15 amino acids, from 3 amino acids to 12 amino acids, including from 4 amino acids to 10 amino acids, from 5 amino acids to 9 amino acids, 6 amino acids to 8 amino acids, or 7 amino acids to 8 amino acids, and may contain 1, 2, 3, 4, 5, 6, or 7 amino acids.
Типичные линкеры включают полимеры глицина (G)n, полимеры глицин-серин (включая, например, (GS)n, (GSGGS)n (SEQ ID NO: 8) и (GGGS)n (SEQ ID NO: 9), где n представляет собой целое число, по меньшей мере один), полимеры глицин-аланин, полимеры аланин-серин и другие гибкие линкеры, известные в данной области техники. Подходящими для использования являются полимеры глицина и полимеры глицин-серин; Gly и Ser относительно неструктурированы и поэтому могут служить нейтральным линкером между компонентами. Подходящими для использования являются полимеры глицина; глицин получает значительно больше конформационного пространства φ-ψ, даже по сравнению с аланином, и гораздо менее ограничен, чем остатки с более длинными боковыми цепями (см. Scheraga, Rev. Computational Chem. 11173-142 (1992)). Типичные линкеры могут содержать аминокислотные последовательности, включая, но не ограничиваясь ими, GGSG (SEQ ID NO: 10), GGSGG (SEQ ID NO: 11), GSGSGTypical linkers include glycine polymers (G) n , glycine-serine polymers (including, for example, (GS) n , (GSGGS) n (SEQ ID NO: 8) and (GGGS) n (SEQ ID NO: 9), where n is an integer, at least one), glycine-alanine polymers, alanine-serine polymers, and other flexible linkers known in the art. Suitable for use are glycine polymers and glycine-serine polymers; Gly and Ser are relatively unstructured and therefore can serve as a neutral linker between components. Suitable polymers are glycine; glycine receives significantly more φ-ψ conformational space, even compared to alanine, and is much less restricted than residues with longer side chains (see Scheraga, Rev. Computational Chem. 11173-142 (1992)). Typical linkers may contain amino acid sequences including, but not limited to, GGSG (SEQ ID NO: 10), GGSGG (SEQ ID NO: 11), GSGSG
- 25 041085 (SEQ ID NO: 12), GSGGG (SEQ ID NO: 13), GGGSG (SEQ ID NO: 14), GSSSG (SEQ ID NO: 15) и т.п.- 25 041085 (SEQ ID NO: 12), GSGGG (SEQ ID NO: 13), GGGSG (SEQ ID NO: 14), GSSSG (SEQ ID NO: 15) and the like.
В некоторых случаях линкер содержит последовательность сайта распознавания фермента рестрикции BamHI для целей клонирования и как часть линкера, поскольку сайт BamHI кодирует GS.In some instances, the linker contains the BamHI restriction enzyme recognition site sequence for cloning purposes and as part of the linker because the BamHI site encodes GS.
В некоторых случаях линкерные последовательности могут быть устранены с помощью одной или более стадий клонирования (например, с использованием рестрикционных эндонуклеаз типа IIS или гомологичной рекомбинации) или путем прямого расщепления (например, расщепления ферментом рестрикции BamHI).In some cases, linker sequences can be eliminated by one or more cloning steps (eg, using restriction endonucleases type IIS or homologous recombination) or by direct cleavage (eg, cleavage with BamHI restriction enzyme).
В некоторых случаях соединение с сохранением открытой рамки считывания достигается за счет отсутствия линкера в месте соединения двух модульных компонентов. Следовательно, соединение с сохранением открытой рамки считывания может, в некотором смысле, не содержать промежуточной нуклеиновой кислоты, кодирующей аминокислоты, между модульными кодирующими последовательностями. В некоторых случаях соединение с сохранением открытой рамки считывания может содержать две или менее пар промежуточных нуклеиновых оснований между модульными кодирующими последовательностями. В некоторых случаях соединение с сохранением открытой рамки считывания может содержать одну или более пар промежуточных нуклеиновых оснований между модульными кодирующими последовательностями. В некоторых случаях соединение с сохранением открытой рамки считывания может не содержать пар промежуточных нуклеиновых оснований между модульными кодирующими последовательностями.In some cases, an open reading frame connection is achieved by the absence of a linker at the junction of the two modular components. Therefore, an open reading frame compound may, in a sense, not contain an intermediate nucleic acid encoding amino acids between the modular coding sequences. In some instances, an open reading frame compound may contain two or fewer intermediate nucleobase pairs between the modular coding sequences. In some instances, an open reading frame compound may contain one or more intermediate nucleobase pairs between the modular coding sequences. In some cases, an open reading frame compound may not contain intermediate nucleobase pairs between the modular coding sequences.
Нуклеиновые последовательности-штрихкоды.Nucleic sequences-barcodes.
Нуклеиновые последовательности-штрихкоды представляют собой специфичные уникальные последовательности нуклеиновых кислот, которые могут быть идентифицированы любым подходящим способом идентификации последовательности нуклеиновой кислоты, включая, но не ограничиваясь ими, например идентификацию на основе гибридизации (т.е. гибридизацию в условиях in situ), идентификацию на основе амплификации (т.е. идентификацию на основе ПЦР) и секвенирование нуклеиновой кислоты. Нуклеиновые последовательности-штрихкоды согласно настоящему изобретению могут представлять собой нуклеиновые последовательности-штрихкоды, специфичные для модуля, это означает, что каждый уникальный модуль многомодульной библиотеки коррелирован с конкретной уникальной нуклеиновой последовательностью-штрихкодом так, что идентификация конкретной последовательности-штрихкода эквивалентна положительной идентификации соответствующей последовательности, кодирующей модуль.Nucleic barcode sequences are specific, unique nucleic acid sequences that can be identified by any suitable nucleic acid sequence identification method, including but not limited to, for example, hybridization-based identification (i.e., in situ hybridization), identification by amplification-based (i.e. PCR-based identification) and nucleic acid sequencing. The barcode nucleic acid sequences of the present invention may be module specific barcode nucleic acid sequences, meaning that each unique module of the multi-module library is correlated with a particular unique barcode nucleic acid sequence such that identification of a particular barcode sequence is equivalent to a positive identification of the corresponding sequence, encoding module.
Специфичная для модуля нуклеиновая последовательность-штрихкод, описанная в настоящем документе, будет ограничена используемым способом сборки библиотеки. Например, если вложенную сборку многомодульных конструкций осуществляют с помощью способа на основе фермента рестрикции, нуклеиновые последовательности-штрихкоды будут исключать любую последовательность, которая представляет собой сайт распознавания фермента рестрикции для ферментов рестрикции, используемых при сборке. Следовательно, в некоторых случаях последовательности-штрихкоды не будут содержать последовательностей, распознаваемых рестриктазами. В некоторых случаях последовательностиштрихкоды не будут содержать последовательностей, распознаваемых рестриктазой типа IIS.The module-specific nucleic sequence-barcode described herein will be limited by the method used to assemble the library. For example, if nested assembly of multimodule constructs is performed using a restriction enzyme method, the barcode nucleic acid sequences will exclude any sequence that represents a restriction enzyme recognition site for the restriction enzymes used in the assembly. Therefore, in some cases, barcode sequences will not contain sequences recognized by restriction enzymes. In some cases, the barcode sequences will not contain sequences recognized by restriction enzyme type IIS.
В тех случаях, когда идентификацию нуклеиновой последовательности-штрихкода и/или количественную оценку выполняют путем секвенирования, включая, например, методы секвенирования следующего поколения, будут применены стандартные критерии для нуклеиновых последовательностейштрихкодов, детектируемых путем секвенирования. В некоторых случаях коммерчески доступные нуклеиновые последовательности-штрихкоды и/или наборы, содержащие нуклеиновые последовательностиштрихкоды и/или адаптеры нуклеиновых последовательностей-штрихкодов, могут быть использованы или модифицированы для применения в способах, описанных в настоящем документе, включая, например, нуклеиновые последовательности-штрихкоды и/или наборы адаптеров нуклеиновых последовательностей-штрихкодов коммерчески доступные от таких поставщиков как, но не ограничиваясь ими, например, New England Biolabs (Ипсвич, Массачусетс, США), Illumina, Inc. (Хейвард, Калифорния, США), Life Technologies, Inc. (Гранд-Айленд, Нью-Йорк, США), Bioo Scientific Corporation (Остин, Техас, США) и т.п., или могут быть изготовлены на заказ, например, как доступно, например, в Integrated DNA Technologies, Inc. (Коралвилл, Айова, США).Where barcode nucleic acid sequence identification and/or quantification is performed by sequencing, including, for example, next generation sequencing methods, standard criteria for barcode nucleic acid sequences detected by sequencing will apply. In some instances, commercially available barcode nucleotide sequences and/or kits containing barcode nucleotide sequences and/or barcode nucleotide sequence adapters may be used or modified for use in the methods described herein, including, for example, barcode nucleotide sequences and /or barcode nucleic sequence adapter kits commercially available from vendors such as, but not limited to, New England Biolabs (Ipswich, MA, USA), Illumina, Inc. (Hayward, California, USA), Life Technologies, Inc. (Grand Island, New York, USA), Bioo Scientific Corporation (Austin, Texas, USA) and the like, or can be custom made, for example, as available from, for example, Integrated DNA Technologies, Inc. (Coralville, Iowa, USA).
Длина нуклеиновой последовательности-штрихкода будет варьироваться и будет зависеть от сложности библиотеки и используемого метода детектирования последовательности-штрихкода. Поскольку нуклеиновые последовательности-штрихкоды (например, последовательности-штрихкоды ДНК) хорошо известны, то дизайн, синтез и использование нуклеиновых последовательностей-штрихкодов находится в пределах компетенции специалиста в данной области техники.The length of the nucleic barcode sequence will vary and will depend on the complexity of the library and the barcode sequence detection method used. Since nucleic barcode sequences (eg, DNA barcode sequences) are well known, the design, synthesis and use of nucleic barcode sequences is within the skill of the art.
В некоторых случаях длина используемых нуклеиновых последовательностей-штрихкодов также будет зависеть от вероятности того, что отдельная нуклеиновая последовательность-штрихкод случайно появится в каком-либо другом компоненте библиотеки, включая, но не ограничиваясь ими, например кодирующую модуль последовательность, вектор, компонент вектора и т.д., или на стыке двух звеньев нуклеиновых последовательностей-штрихкодов. Например, в некоторых случаях, если существует значительная вероятность того, что последовательность, не относящаяся к нуклеиновой последовательно- 26 041085 сти-штрихкоду, может быть случайно детектирована в виде последовательности-штрихкода, например, как это имеет место в очень сложных библиотеках, могут быть использованы звенья нуклеиновых последовательностей-штрихкодов большей длины. В некоторых случаях метод детектирования нуклеиновой последовательности-штрихкода может быть принят во внимание при определении необходимой длины последовательности-штрихкода, например, в тех случаях, когда нуклеиновую последовательностьштрихкод детектируют путем гибридизации, могут быть использованы более длинные нуклеиновые последовательности-штрихкоды, по сравнению с тем случаем, когда применяют секвенирование с использованием определенных праймеров для секвенирования.In some cases, the length of the barcode nucleic sequences used will also depend on the likelihood that a particular barcode nucleic sequence will accidentally appear in some other component of the library, including, but not limited to, for example, a coding sequence, a vector, a vector component, etc. .d., or at the junction of two links of nucleic barcode sequences. For example, in some cases, if there is a significant possibility that a sequence that is not related to the nucleic 26 041085 sti-barcode sequence can be accidentally detected as a barcode sequence, for example, as is the case in very complex libraries, there may be links of nucleic sequences-barcodes of greater length were used. In some cases, the barcode nucleic acid sequence detection method may be taken into account when determining the required barcode sequence length, for example, in cases where the barcode nucleic acid sequence is detected by hybridization, longer barcode nucleic sequences can be used compared to that case. when sequencing is applied using specific sequencing primers.
В настоящей заявке термин область нуклеиновой последовательности-штрихкода, поскольку он применяется по отношению к отдельным элементам библиотеки нуклеиновых кислот, относится к области каждой нуклеиновой кислоты, которая содержит последовательность нуклеиновой кислоты, специфичную для вариабельной модульной части синтетического полипептида. В некоторых случаях область нуклеиновой последовательности-штрихкода можно использовать для специфичной идентификации вариабельного модуля или модулей, присутствующих в кодирующей области конкретного элемента библиотеки. В некоторых случаях область нуклеиновой последовательности-штрихкода можно использовать для специфичной идентификации вариабельного модуля(ей) и идентификации порядка вариабельных модулей, присутствующих в кодирующей области конкретного элемента библиотеки (т.е. архитектуры). В некоторых случаях область нуклеиновой последовательности-штрихкода можно использовать для количественной оценки, например полуколичественной оценки, частоты конкретного элемента библиотеки или частоты конкретного модуля в популяции, содержащей множество элементов библиотеки.As used herein, the term barcode nucleic sequence region, as applied to individual elements of a nucleic acid library, refers to the region of each nucleic acid that contains a nucleic acid sequence specific for the variable modular portion of a synthetic polypeptide. In some cases, the nucleic sequence-barcode region can be used to specifically identify the variable module or modules present in the coding region of a particular library element. In some cases, the nucleic sequence-barcode region can be used to specifically identify the variable module(s) and identify the order of the variable modules present in the coding region of a particular library element (ie, architecture). In some instances, the barcode nucleic sequence region can be used to quantify, eg, semi-quantify, the frequency of a particular library element or the frequency of a particular module in a population containing multiple library elements.
В пределах синтетического модульного полипептида, содержащего нуклеиновую последовательность-штрихкод, библиотеки, описанной в настоящем документе, звенья нуклеиновых последовательностей-штрихкодов в области последовательностей-штрихкодов будут иметь обратную ориентацию по отношению к последовательностям, кодирующим модули. Помимо этого звенья нуклеиновых последовательностей-штрихкодов в области последовательностей-штрихкодов будут расположены в обратном порядке по отношению к соответствующей им последовательности, кодирующей модуль. Однако по отношению к кодируемому полипептиду область нуклеиновых последовательностей-штрихкодов может быть расположена в направлении N-конца или С-конца относительно последовательности нуклеиновой кислоты, кодирующей синтетический модульный полипептид.Within the synthetic modular barcode nucleic acid sequence library described herein, the barcode nucleic acid sequence units in the barcode sequence region will be in reverse orientation with respect to the sequences encoding the modules. In addition, the units of nucleic barcode sequences in the area of barcode sequences will be located in reverse order with respect to their corresponding sequence encoding the module. However, with respect to the encoded polypeptide, the region of nucleic acid sequences-barcodes can be located in the direction of the N-terminus or C-terminus relative to the nucleic acid sequence encoding the synthetic modular polypeptide.
Специфичные для вектора элементы.Vector-specific elements.
Под специфичными для вектора элементами понимают элементы, которые используют при получении, конструировании, распространении, поддержании и/или количественном исследовании вектора до, во время или после его конструирования. Подходящие специфичные для вектора элементы включают, но не ограничиваются ими, например, элементы вектора, необходимые для распространения, клонирования и выбора вектора во время его использования, и могут включать, но не ограничиваются ими, например, сайт инициации репликации, сайт множественного клонирования, прокариотический промотор, фаговый промотор, селективный маркер (например, ген устойчивости к антибиотикам, кодируемый ферментный белок, кодируемый флуоресцентный или хромогенный белок и т.д.) и т.п. В векторах, описанных в настоящем документе, можно использовать любые подходящие специфичные для вектора элементы, если это необходимо.By vector-specific elements is meant elements that are used in the production, construction, distribution, maintenance and/or quantification of a vector before, during or after its construction. Suitable vector-specific elements include, but are not limited to, for example, vector elements necessary for propagation, cloning, and selection of the vector during use, and may include, but are not limited to, for example, replication origin, multiple cloning site, prokaryotic a promoter, a phage promoter, a selectable marker (eg, an antibiotic resistance gene, an encoded enzyme protein, an encoded fluorescent or chromogenic protein, etc.), and the like. In the vectors described herein, any suitable vector-specific elements can be used, if desired.
Подходящие промоторные и энхансерные элементы, используемые в качестве специфичных для вектора элементов, известны в данной области техники. Промоторы, подходящие для экспрессии в бактериальной клетке включают, но не ограничиваются ими, lacI, lacZ, T3, Т7, gpt, lambda P и trc. Промоторы, подходящие для экспрессии в эукариотической клетке, включают, но не ограничиваются ими, промоторные и энхансерные элементы гена легкой и/или тяжелой цепей иммуноглобулина; немедленный ранний промотор цитомегаловируса; промотор тимидинкиназы вируса простого герпеса; ранние и поздние промоторы SV40; промотор, присутствующий в длинных концевых повторах ретровируса; промотор металлотионеина-1 мыши; и различные тканеспецифичные промоторы, известные в данной области техники.Suitable promoter and enhancer elements to be used as vector-specific elements are known in the art. Promoters suitable for expression in a bacterial cell include, but are not limited to, lacI, lacZ, T3, T7, gpt, lambda P, and trc. Promoters suitable for expression in a eukaryotic cell include, but are not limited to, the promoter and enhancer elements of the immunoglobulin light and/or heavy chain gene; cytomegalovirus immediate early promoter; herpes simplex virus thymidine kinase promoter; SV40 early and late promoters; a promoter present in the long terminal repeats of the retrovirus; mouse metallothionein-1 promoter; and various tissue-specific promoters known in the art.
Подходящие обратимые промоторы, включая обратимые индуцибельные промоторы, известны в данной области техники. Подходящие обратимые промоторы могут быть выделены и получены из многих организмов, например эукариотов и прокариотов. Модификация обратимых промоторов, полученных из первого организма для применения во втором организме, например первый организм является прокариотом, и второй организм является эукариотом, первый организм является эукариотом, и второй организм является прокариотом и т.д., хорошо известна в данной области техники. Подходящие обратимые промоторы и системы, основанные на подходящих обратимых промоторах, при этом также содержащие дополнительные контрольные белки, включают, но не ограничиваются ими, промоторы, регулируемые спиртом (например, промотор гена алкогольдегидрогеназы I (alcA), промоторы, реагирующие на белки, трансактивируемые спиртом (AlcR) и т.д.), регулируемые тетрациклином промоторы (например, промоторные системы, включая TetActivators, TetON, TetOFF и т.д.), регулируемые стероидами промоторы (например, промоторные системы рецептора глюкокортикоидов крысы, промоторные системы рецептора эстрогенов человека, регулируемые ретиноидами промоторные системы, системы промоторов щитовидSuitable reversible promoters, including reversible inducible promoters, are known in the art. Suitable reversible promoters can be isolated and obtained from many organisms, such as eukaryotes and prokaryotes. Modification of reversible promoters derived from a first organism for use in a second organism, eg, the first organism is a prokaryote and the second organism is a eukaryote, the first organism is a eukaryote and the second organism is a prokaryote, etc., is well known in the art. Suitable reversible promoters and systems based on suitable reversible promoters, while also containing additional control proteins, include, but are not limited to, alcohol-regulated promoters (e.g., the alcohol dehydrogenase I (alcA) gene promoter, alcohol-transactivated protein-responsive promoters). (AlcR), etc.), tetracycline-regulated promoters (e.g., promoter systems including TetActivators, TetON, TetOFF, etc.), steroid-regulated promoters (e.g., rat glucocorticoid receptor promoter systems, human estrogen receptor promoter systems, retinoid-regulated promoter systems, thyroid promoter systems
- 27 041085 ной железы, регулируемые экдизоном промоторные системы, регулируемые мифепристоном промоторные системы и т.д.), регулируемые металлом промоторы (например, промоторные системы металлотионеина и т.д.), регулируемые патогенезом промоторы (например, промоторы, регулируемые салициловой кислотой, промоторы, регулируемые этиленом, промоторы, регулируемые бензотиадиазолом и т.д.), регулируемые температурой промоторы (например, индуцируемые тепловым шоком промоторы (например, HSP-70, HSP-90, промотор белка теплового шока сои и т.д.), регулируемые светом промоторы, синтетические индуцибельные промоторы и т.п.- 27 041085, ecdysone-regulated promoter systems, mifepristone-regulated promoter systems, etc.), metal-regulated promoters (for example, metallothionein promoter systems, etc.), pathogenesis-regulated promoters (for example, salicylic acid-regulated promoters, ethylene-regulated promoters, benzothiadiazole-regulated promoters, etc.), temperature-regulated promoters (e.g., heat shock inducible promoters (e.g., HSP-70, HSP-90, soybean heat shock protein promoter, etc.), light promoters, synthetic inducible promoters, and the like.
В некоторых случаях локус или конструкцию или трансген, содержащий подходящий промотор, необратимо переключают посредством индукции индуцируемой системы. Подходящие системы для индукции необратимого переключения хорошо известны в данной области техники, например, индукция необратимого переключения может быть основана на использовании рекомбинации, опосредованной Cre-lox (см., например, работу Fuhrmann-Benzakein, et al., PNAS (2000) 28:e99, содержание которой полностью включено в настоящую заявку посредством ссылки). Любая подходящая комбинация рекомбиназы, эндонуклеазы, лигазы, сайтов рекомбинации и т.д., известная в данной области техники, может быть использована для создания промотора с необратимым переключением. Способы, механизмы и требования к выполнению сайтспецифичной рекомбинации, описанные в другом месте в настоящем документе, могут быть использованы для получения промоторов с необратимым переключением и хорошо известны в данной области техники, см., например, Grindley et al. (2006) Annual Review of Biochemistry, 567-605 и Tropp (2012) Molecular Biology (Jones & Bartlett Publishers, Sudbury, MA), содержание которой включено в настоящую заявку посредством ссылки.In some cases, the locus or construct or transgene containing a suitable promoter is irreversibly switched by inducing an inducible system. Suitable systems for inducing an irreversible switch are well known in the art, for example, induction of an irreversible switch can be based on the use of Cre-lox mediated recombination (see e.g. Fuhrmann-Benzakein, et al., PNAS (2000) 28: e99, the contents of which are incorporated herein by reference in their entirety). Any suitable combination of recombinase, endonuclease, ligase, recombination sites, etc. known in the art can be used to create an irreversible switch promoter. The methods, mechanisms, and requirements for performing site-specific recombination described elsewhere herein can be used to generate irreversible switch promoters and are well known in the art, see, for example, Grindley et al. (2006) Annual Review of Biochemistry, 567-605 and Tropp (2012) Molecular Biology (Jones & Bartlett Publishers, Sudbury, MA), the contents of which are incorporated herein by reference.
Способы получения библиотек.Methods for obtaining libraries.
В настоящем изобретении предложены способы получения библиотек нуклеиновых кислот, кодирующих синтетические модульные полипептиды, причем каждая нуклеиновая кислота библиотеки содержит многозвенную нуклеиновую последовательность-штрихкод, которая идентифицирует вариабельный модуль (модули) модульного полипептида и, если присутствуют несколько вариабельных модулей, ориентацию модулей друг относительно друга. В многочисленных вариантах реализации настоящего изобретения предложены способы поэтапной комбинаторной сборки синтетических модульных полипептидов из кодирующих модули нуклеиновых кислот, содержащих нуклеиновые последовательностиштрихкоды, так, что каждая из полученных нуклеиновых кислот, кодирующих синтетические модульные полипептиды, содержит область, кодирующую модули, встроенную с сохранением открытой рамки считывания, и многозвенную нуклеиновую последовательность-штрихкод, при этом расположение звеньев нуклеиновой последовательности-штрихкода соответствует расположению модулей, встроенных с сохранением открытой рамки считывания. В целом, в тех случаях, когда в каждый элемент библиотеки включено несколько вариабельных модулей, совместно собранная многозвенная нуклеиновая последовательность-штрихкод обеспечивает характеристику сборки вариабельных модулей каждого элемента библиотеки.The present invention provides methods for obtaining nucleic acid libraries encoding synthetic modular polypeptides, each nucleic acid of the library containing a multi-link nucleic barcode sequence that identifies the variable module(s) of the modular polypeptide and, if multiple variable modules are present, the orientation of the modules relative to each other. In numerous embodiments of the present invention, methods are provided for stepwise combinatorial assembly of synthetic modular polypeptides from nucleic acids encoding modules containing barcode nucleic sequences, such that each of the resulting nucleic acids encoding synthetic modular polypeptides contains a region encoding modules inserted while maintaining an open reading frame. , and a multi-link nucleic sequence-barcode, while the arrangement of the nucleic sequence-barcode units corresponds to the arrangement of modules built-in while maintaining an open reading frame. In general, where multiple variable modules are included in each library element, the co-assembled multi-unit barcode nucleic acid sequence provides characterization of the assembly of the variable modules of each library element.
Не желая быть связанными соответствием какой-либо теории, авторы настоящего изобретения полагают, что поэтапная комбинаторная сборка синтетических модульных полипептидов, представленных в настоящем документе, обеспечивает конструирование более крупных и более сложных библиотек, чем было бы возможно или осуществимо с использованием стандартных способов конструирования на основе индивидуальных (т.е. по одному) полипептидов. Авторы настоящего изобретения выявили, что стандартные способы конструирования синтетических модульных полипептидов представляют собой значительное техническое препятствие для высокопроизводительного скрининга синтетических модульных полипептидов. Скоординированная сборка каждого многомодульного синтетического полипептида и соответствующей многозвенной нуклеиновой последовательности-штрихкода, предложенная в настоящем документе, позволяет преодолеть указанное препятствие и обеспечивает сборку в одном реакторе из множества уникальных нуклеиновых кислот, кодирующих синтетические модульные полипептиды, подходящие для скрининга. Упомянутая высокопроизводительная сборка в одном реакторе не может быть выполнена с использованием стандартных способов конструирования полипептидов.Without wishing to be bound by any theory, the present inventors believe that the stepwise combinatorial assembly of the synthetic modular polypeptides provided herein allows for the construction of larger and more complex libraries than would be possible or feasible using standard construction methods based on individual (ie, one at a time) polypeptides. The authors of the present invention have found that standard methods for constructing synthetic modular polypeptides represent a significant technical obstacle to high-throughput screening of synthetic modular polypeptides. The coordinated assembly of each multi-module synthetic polypeptide and the corresponding multi-unit barcode nucleic acid sequence provided herein overcomes this hurdle and allows assembly in a single reactor of a plurality of unique nucleic acids encoding suitable synthetic modular polypeptides for screening. Said high-throughput, single-pot assembly cannot be accomplished using standard polypeptide construction techniques.
Авторы настоящего изобретения также выявили, что стандартные, сгруппированные физически, синтетические полипептидные библиотеки также представляют собой серьезные технические препятствия для высокопроизводительного скрининга. В частности, при скрининге больших библиотек число физически разделенных реакционных камер и изменчивость условий количественного исследования между каждой камерой представляют значительные технические препятствия при попытке скрининга всей сложной большой библиотеки и анализа полученных данных. Авторы настоящего изобретения выявили, что скрининг объединенной библиотеки может решить указанную проблему, однако имеет другие значительные препятствия, такие как трудность или нецелесообразность идентификации и/или количественного определения отдельных полипептидов, обеспечивающих желательный фенотип при скрининге из сложного смешанного пула уникальных модульных полипептидов. Использование короткой многозвенной нуклеиновой последовательности-штрихкода устраняет эту проблему, обеспечивая апостериорную эффективную положительную идентификацию и/или количественную оценку отдельных уникальных синтетических модульных полипептидов, которые обеспечивают желательный фенотип в сложном пуле,The authors of the present invention also found that standard, physically grouped, synthetic polypeptide libraries also represent serious technical barriers to high-throughput screening. Particularly when screening large libraries, the number of physically separated reaction chambers and the variability of assay conditions between each chamber present significant technical hurdles when attempting to screen an entire complex large library and analyze the resulting data. The present inventors have found that pooled library screening can solve this problem, but has other significant hurdles, such as the difficulty or inappropriateness of identifying and/or quantifying individual polypeptides that provide the desired phenotype when screened from a complex mixed pool of unique modular polypeptides. The use of a short multi-link barcode nucleic acid sequence eliminates this problem by providing a posteriori efficient positive identification and/or quantification of individual unique synthetic modular polypeptides that provide the desired phenotype in a complex pool,
- 28 041085 путем секвенирования только многозвенной нуклеиновой последовательности-штрихкода.- 28 041085 by sequencing only the multilink nucleic barcode sequence.
Стратегии клонирования.Cloning strategies.
В целом, в настоящем изобретении предложен способ получения библиотек, описанных в настоящем документе, путем вложенной сборки кодирующих полипептидные модули нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды. Например, как показано на фиг. 12, вектор нуклеиновой кислоты (100), содержащий последовательность, кодирующую полипептидный модуль (101), соединенную со специфичной для модуля нуклеиновой последовательностью-штрихкодом (102), линеаризуют (103) путем расщепления связи между последовательностью, кодирующей полипептидный модуль, и специфичной для модуля нуклеиновой последовательностью-штрихкодом. После линеаризации вектора, содержащего первую кодирующую модуль последовательность и первую специфичную для модуля нуклеиновую последовательность-штрихкод, нуклеиновую кислоту, содержащую вторую кодирующую модуль последовательность (104) и вторую нуклеиновую последовательность-штрихкод (105), специфичную для второго модуля, вставляют (т.е. встраивают) между первой кодирующей модуль последовательностью и первой нуклеиновой последовательностью-штрихкодом (106). Собранная нуклеиновая кислота содержит кодирующую область, кодирующую синтетический модульный полипептид и область нуклеиновой последовательности-штрихкода, которая содержит многозвенную нуклеиновую последовательность-штрихкод (т.е. нуклеиновые последовательности-штрихкоды (ВС)). В некоторых случаях последовательности, кодирующие модули, собирают так, чтобы они соединялись с помощью последовательности, кодирующей желательный линкер, описанный в настоящем документе. В некоторых случаях последовательности, кодирующие модули, собирают так, чтобы они соединялись без использования линкерной последовательности, например без линкерной последовательности, кодирующей одну или более линкерных аминокислот, без каких-либо промежуточных некодирующих нуклеотидов между первой и второй последовательностями, кодирующими модули, и т.д. Следовательно, обозначение желательная линкерная последовательность или линкер, в частности, использованное в чертежах, включает полное отсутствие любого линкера или линкерной последовательности и прямое соединение полипептидных модулей и последовательностей, кодирующих модули.In general, the present invention provides a method for obtaining the libraries described herein by nesting nucleic acids encoding polypeptide modules containing barcode nucleic sequences. For example, as shown in FIG. 12, a nucleic acid vector (100) containing a sequence encoding a polypeptide module (101) linked to a module-specific barcode nucleic sequence (102) is linearized (103) by cleaving the link between the sequence encoding the polypeptide module and the module-specific nucleic sequence-barcode. After linearization of the vector containing the first coding module sequence and the first module-specific barcode sequence, the nucleic acid containing the second module-coding sequence (104) and the second module-specific nucleic acid sequence (105) is inserted (i.e. . embed) between the first coding module sequence and the first nucleic sequence-barcode (106). The assembled nucleic acid contains a coding region encoding a synthetic modular polypeptide and a nucleic barcode sequence region that contains a multi-link nucleic barcode sequence (ie barcode nucleic acid sequences (BCs)). In some cases, sequences encoding modules are assembled so that they are joined by a sequence encoding the desired linker described herein. In some cases, sequences encoding modules are assembled so that they are connected without the use of a linker sequence, for example, without a linker sequence encoding one or more linker amino acids, without any intervening non-coding nucleotides between the first and second sequences encoding modules, etc. d. Therefore, the designation of a desired linker sequence or linker, particularly as used in the drawings, includes the complete absence of any linker or linker sequence and the direct connection of polypeptide modules and sequences encoding modules.
Линеаризация векторной последовательности путем расщепления участка между первой кодирующей модуль последовательностью и первой специфичной для модуля нуклеиновой последовательностью-штрихкодом может быть достигнута с помощью любого удобного и подходящего средства. Например, полинуклеотид, содержащий кодирующую модуль последовательность и нуклеиновую последовательность-штрихкод, может быть сконфигурирован так, чтобы содержать сайт расщепления фермента рестрикции (т.е. рестрикционной эндонуклеазы) между кодирующей модуль последовательностью и нуклеиновой последовательностью-штрихкодом. Сайт расщепления может представлять собой сайт расщепления фермента рестрикции типа II и, более конкретно, может представлять собой сайт расщепления, который содержится в последовательности, распознаваемой используемым ферментом рестрикции типа II. Любой удобный фермент рестрикции типа II, который осуществляет расщепление в пределах своей последовательности распознавания, можно применять для описанной цели, включая ферменты рестрикции типа II, которые осуществляют расщепление в пределах своих последовательностей распознавания, которые известны в данной области техники. В некоторых случаях сайт расщепления может представлять собой сайт расщепления BamHI, который имеет последовательность распознавания 5'GGATCC-3' и расщепляет нити после первого G последовательности распознавания на обеих нитях, оставляя липкий конец 5'-GATC-3'. Другие ферменты рестрикции, которые могут быть использованы для указанной цели, включают, но не ограничиваются ими, например.Linearization of the vector sequence by splitting the region between the first module-encoding sequence and the first module-specific nucleic barcode sequence can be achieved by any convenient and appropriate means. For example, a polynucleotide comprising a module-coding sequence and a barcode nucleic sequence can be configured to contain a restriction enzyme (ie, restriction endonuclease) cleavage site between the module-coding sequence and the barcode nucleic acid sequence. The cleavage site may be a type II restriction enzyme cleavage site, and more specifically, may be a cleavage site that is contained in a sequence recognized by the type II restriction enzyme used. Any convenient type II restriction enzyme that cleaves within its recognition sequence can be used for the described purpose, including type II restriction enzymes that cleave within its recognition sequences, which are known in the art. In some cases, the cleavage site may be a BamHI cleavage site that has a 5'GGATCC-3' recognition sequence and cleaves strands after the first G recognition sequence on both strands, leaving a 5'-GATC-3' sticky end. Other restriction enzymes that can be used for this purpose include, but are not limited to, for example.
В некоторых случаях вложенную сборку осуществляют путем использования сайтов двух ферментов рестрикции (RE1 и RE2), расположенных между первой кодирующей модуль последовательностью и первой специфичной для модуля нуклеиновой последовательностью-штрихкодом, и фланкирующих вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательностьштрихкод (фиг. 13). В случае стратегии сборки, основанной на использовании двух ферментов рестрикции, расщепление в двух сайтах RE1 и RE2 приводит к линеаризации вектора и высвобождению фрагмента, содержащего вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. После лигирования линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй последовательностями, кодирующими модули, и первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.In some cases, nested assembly is performed by using sites of two restriction enzymes (RE1 and RE2) located between the first coding module sequence and the first module-specific barcode nucleic sequence and flanking the second module coding sequence containing the barcode nucleic sequence (Fig. 13). In the case of an assembly strategy based on the use of two restriction enzymes, cleavage at the two sites RE1 and RE2 results in linearization of the vector and release of a fragment containing a second coding module sequence containing a nucleic barcode sequence. After ligation of the linearized vector and the released fragment, the desired linker sequence is present between the first and second module coding sequences, and the first and second barcode nucleic sequences are in reverse orientation with respect to the first and second module coding sequences.
В некоторых случаях вложенную сборку осуществляют путем использования сайтов четырех ферментов рестрикции (RE1, RE2, RE3 и RE4), причем RE1 и RE2 расположены между обеими кодирующими модули последовательностями и соответствующими им нуклеиновыми последовательностямиштрихкодами, тогда как RE3 и RE4 фланкируют вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод (фиг. 14). В случае стратегии сборки с использованием четырех ферментов рестрикции раздельное расщепление первого вектора в сайтах RE1 и RE2 и второго вектора в сайтах RE3 и RE4 приводит к линеаризации вектора и высвобождению фрагмента, содержащего вторую кодирующую модуль последовательность, содержащую нуклеиновую последователь- 29 041085 ность-штрихкод. После лигирования линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй последовательностями, кодирующими модули, тогда как первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.In some cases, nested assembly is carried out by using the sites of four restriction enzymes (RE1, RE2, RE3 and RE4), with RE1 and RE2 located between both coding modules sequences and their respective nucleic barcode sequences, while RE3 and RE4 flank the second coding module sequence containing nucleic sequence-barcode (Fig. 14). In the case of an assembly strategy using four restriction enzymes, separate cleavage of the first vector at the RE1 and RE2 sites and the second vector at the RE3 and RE4 sites results in the linearization of the vector and the release of a fragment containing a second coding module sequence containing a nucleic sequence-barcode. After ligation of the linearized vector and the released fragment, the desired linker sequence is present between the first and second module encoding sequences, while the first and second nucleic barcode sequences are in reverse orientation with respect to the first and second module encoding sequences.
В некоторых случаях ферменты рестрикции намеренно выбирают так, что после лигирования соединения между первой и второй кодирующими модули последовательностями и первой и второй нуклеиновыми последовательностями-штрихкодами не содержат последовательностей распознавания ферментов рестрикции RE1, RE2, RE3 или RE4. В целом, в соответствии с указанной стратегией использованные сайты RE1, RE2, RE3 и RE4 инактивированы после лигирования так, что полученный в результате вектор содержит только активные сайты RE1 и RE2 между второй кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Следовательно, данная стратегия обеспечивает последовательную вложенную сборку не только двумерной конструкции путем повторной линеаризации полученного вектора с помощью расщепления ферментами рестрикции RE1 и RE2 кодирующей модуль последовательности, содержащей нуклеиновую последовательностьштрихкод, которая была вставлена в последнюю очередь.In some cases, the restriction enzymes are deliberately chosen such that, after ligation, the junctions between the first and second coding modules sequences and the first and second nucleic barcode sequences do not contain restriction enzyme recognition sequences RE1, RE2, RE3 or RE4. In general, according to this strategy, the RE1, RE2, RE3 and RE4 sites used are inactivated after ligation so that the resulting vector contains only active RE1 and RE2 sites between the second coding module sequence and its corresponding nucleic barcode sequence. Therefore, this strategy allows sequential nesting of more than just a two-dimensional construct by re-linearizing the resulting vector with restriction enzyme digestion of RE1 and RE2 of the module coding sequence containing the barcode nucleic acid sequence that was inserted last.
В случае способа сборки с использованием четырех ферментов рестрикции RE1 выбирают так, чтобы после расщепления полученный конец линеаризованного вектора был совместимым (т.е. был способен к лигированию) с концом высвобожденного фрагмента, полученного с помощью расщепления ферментом рестрикции RE3. RE2 выбирают так, чтобы после расщепления полученный конец линеаризованного вектора был совместимым (т.е. мог быть лигирован и/или был способен к полной или, по меньшей мере, частичной гибридизации) с концом высвобожденного фрагмента, полученного при расщеплении с помощью фермента рестрикции RE4. В некоторых случаях один или более концов, полученных в результате расщепления с помощью RE1, RE2, RE3 или RE4, могут быть модифицированы, например, путем добавления или удаления одного или более нуклеотидов или другой химической модификации для получения концов, совместимых между RE1 и RE3 или RE2 и RE4. Любой удобный способ концевой модификации можно применять для получения совместимых концов, включая способы концевой модификации, которые хорошо известны в данной области техники, включая, но не ограничиваясь ими, например создание тупых концов, фосфорилирование, дефосфорилирование и т.д.In the case of the assembly method using four restriction enzymes, RE1 is chosen so that after cleavage, the resulting end of the linearized vector is compatible (ie, capable of ligation) with the end of the released fragment obtained by cleavage with the RE3 restriction enzyme. RE2 is chosen such that, after digestion, the resulting end of the linearized vector is compatible (i.e., can be ligated and/or is capable of full or at least partial hybridization) with the end of the released fragment resulting from digestion with the restriction enzyme RE4 . In some cases, one or more of the ends resulting from cleavage with RE1, RE2, RE3, or RE4 may be modified, for example, by adding or removing one or more nucleotides or other chemical modification to obtain ends that are compatible between RE1 and RE3 or RE2 and RE4. Any convenient end modification method can be used to obtain compatible ends, including end modification methods that are well known in the art, including, but not limited to, blunt end generation, phosphorylation, dephosphorylation, and the like.
В некоторых случаях вложенную сборку осуществляют путем использования последовательности распознавания фермента рестрикции типа IIS (RE1), причем два сайта RE1 присутствуют между первой кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностьюштрихкодом, и два сайта RE1 фланкируют вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод (фиг. 15). В случае указанной стратегии, опосредованной ферментом рестрикции типа IIS, расщепление в сайтах, смежных с сайтами распознавания RE1, приводит к линеаризации вектора и высвобождению фрагмента, содержащего вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. Сайты расщепления, смежные с сайтами распознавания RE1, сконфигурированы так, что после расщепления 3'-конец вектора совместим с 5'-концом фрагмента, и 5'-конец вектора совместим с 3'-концом фрагмента. В некоторых случаях указанные совместимые концы могут называться совместимыми липкими концами. Следовательно, при лигировании линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй кодирующими модули последовательностями, тогда как первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.In some cases, nested assembly is performed by using an IIS restriction enzyme recognition sequence (RE1), with two RE1 sites present between the first coding module sequence and its corresponding barcode nucleic sequence, and two RE1 sites flanking the second coding module sequence containing the nucleic barcode sequence ( Fig. 15). In the case of this IIS-type restriction enzyme-mediated strategy, cleavage at sites adjacent to the RE1 recognition sites results in linearization of the vector and release of a fragment containing a second coding module sequence containing a barcode nucleic sequence. The cleavage sites adjacent to the RE1 recognition sites are configured such that, after cleavage, the 3' end of the vector is compatible with the 5' end of the fragment and the 5' end of the vector is compatible with the 3' end of the fragment. In some cases, these compatible ends may be referred to as compatible sticky ends. Therefore, when the linearized vector and the released fragment are ligated, the desired linker sequence is present between the first and second module coding sequences, while the first and second nucleic barcode sequences are in reverse orientation with respect to the first and second module coding sequences.
Любой удобный фермент рестрикции типа IIS можно применять в стратегиях сборки с использованием указанных ферментов, описанных в настоящем документе, включая, но не ограничиваясь ими, например, AceIII, AcuI, AlwI, AarI, BbsI, BbvI, BbvII, BccI, Bce83I, BceAI, Bcefl, BciVI, BfuAI, BmrI, BmuI, BpmI, BpuEI, BsaI, BsbI, BseRI, BsgI, BslFI, BsmAI, BsmFI, BsoMAI, BspCNI, BspGI, BspMI, BspNCI, BspQI, BsrDI, Bst71I, BtgZI, BtsCI, BtsI, BveI, DrdII, EarI, EciI, FaqI, FinI, FokI, HgaI, Hin4II, HphI, HpyAV, LguI, MboII, MmeI, MnlI, NmeAIII, PleI, SapI, SfaNI, SgeI и т.п.Any convenient type IIS restriction enzyme can be used in assembly strategies using the indicated enzymes described herein, including, but not limited to, for example, AceIII, AcuI, AlwI, AarI, BbsI, BbvI, BbvII, BccI, Bce83I, BceAI, Bcefl, BciVI, BfuAI, BmrI, BmuI, BpmI, BpuEI, BsaI, BsbI, BseRI, BsgI, BslFI, BsmAI, BsmFI, BsoMAI, BspCNI, BspGI, BspMI, BspNCI, BspQI, BsrDI, Bst71I, BtgZI, BtsCI, BtsI, BveI, DrdII, EarI, EciI, FaqI, FinI, FokI, HgaI, Hin4II, HphI, HpyAV, LguI, MboII, MmeI, MnlI, NmeAIII, PleI, SapI, SfaNI, SgeI, etc.
В некоторых случаях фермент рестрикции, использованный, например, при линеаризации вектора и/или высвобождении фрагмента, содержащего второй модуль, представляет собой фермент рестрикции, который расщепляет цепи по обе стороны от своего сайта распознавания. Любой удобный фермент рестрикции, обладающий указанной активностью, можно применять в способах сборки, описанных в настоящем документе, включая, но не ограничиваясь им, например BcgI.In some instances, the restriction enzyme used, for example, in linearizing the vector and/or releasing the fragment containing the second module, is a restriction enzyme that cleaves strands on either side of its recognition site. Any convenient restriction enzyme having this activity can be used in the assembly methods described herein, including, but not limited to, for example, BcgI.
В некоторых случаях вложенную сборку осуществляют путем использования нескольких последовательностей распознавания ферментов рестрикции типа IIS, например двух последовательностей распознавания ферментов рестрикции типа IIS (RE1 и RE2), причем два сайта RE1 присутствуют между кодирующими модули последовательностями и соответствующими им нуклеиновыми последовательностямиштрихкодами, и два сайта RE2 фланкируют вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод (фиг. 16). В случае стратегии сборки с использованием двух ферментов рестрикции типа IIS раздельное расщепление первого вектора в сайтах RE1 и второго вектора в сайтах RE2 приводит к линеаризации вектора и высвобождению фрагмента, содержащего вто- 30 041085 рую кодирующую модуль последовательность, содержащую нуклеиновую последовательностьштрихкод. После лигирования линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй кодирующими модули последовательностями, тогда как первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.In some cases, nesting is accomplished by using multiple IIS restriction enzyme recognition sequences, for example two IIS restriction enzyme recognition sequences (RE1 and RE2), where two RE1 sites are present between the module-coding sequences and their corresponding barcode nucleic acid sequences, and two RE2 sites are flanked a second coding module sequence containing a nucleic barcode sequence (Fig. 16). In the case of an assembly strategy using two type IIS restriction enzymes, separate cleavage of the first vector at the RE1 sites and the second vector at the RE2 sites results in vector linearization and release of a fragment containing a second coding module sequence containing a barcode nucleic sequence. After ligation of the linearized vector and the released fragment, the desired linker sequence is present between the first and second module coding sequences, while the first and second nucleic barcode sequences are in reverse orientation with respect to the first and second module coding sequences.
В целом, в соответствии с данной стратегией сайты RE1 и RE2, использованные в первом раунде линеаризации и высвобождения фрагментов, не сохраняются в векторе и встраиваются так, что полученный вектор содержит только активные сайты RE1 между второй кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Следовательно, данная стратегия обеспечивает последовательную вложенную сборку не только двумерной конструкции путем повторной линеаризации полученного вектора с помощью расщепления ферментами рестрикции сайтов распознавания RE1 в кодирующей модуль последовательности, содержащей нуклеиновую последовательность-штрихкод, которая была вставлена в последнюю очередь.In general, according to this strategy, the RE1 and RE2 sites used in the first round of linearization and fragment release are not retained in the vector and inserted so that the resulting vector contains only active RE1 sites between the second coding module sequence and its corresponding nucleic barcode sequence. . Therefore, this strategy allows sequential nesting of more than just a two-dimensional construct by re-linearizing the resulting vector with restriction enzyme cleavage of the RE1 recognition sites in the module coding sequence containing the barcode nucleic acid sequence that was inserted last.
В данном способе сборки с использованием фермента рестрикции типа IIS сайты расщепления, смежные с последовательностями распознавания RE1 и RE2, сконфигурированы так, что после расщепления полученные концы линеаризованного вектора являются совместимыми (т.е. способны к лигированию) с концами высвобожденного фрагмента. В некоторых случаях один или более концов, полученных при расщеплении RE1 и/или RE2, могут быть модифицированы, например, путем добавления или удаления одного или более нуклеотидов или другой химической модификации для получения совместимых концов. Любой удобный способ модификации концов можно применять для получения совместимых концов, включая способы модификации концов, которые хорошо известны в данной области техники, включая, но не ограничиваясь ими, например, получение тупых концов, фосфорилирование, дефосфорилирование и т.д.In this type IIS assembly method, cleavage sites adjacent to the RE1 and RE2 recognition sequences are configured such that, after cleavage, the resulting ends of the linearized vector are compatible (i.e., capable of ligation) with the ends of the released fragment. In some cases, one or more of the ends resulting from RE1 and/or RE2 cleavage may be modified, for example, by adding or removing one or more nucleotides or other chemical modification to obtain compatible ends. Any convenient end modification method can be used to obtain compatible ends, including end modification methods that are well known in the art, including, but not limited to, for example, blunt end preparation, phosphorylation, dephosphorylation, and so on.
В некоторых случаях совместимые концы могут быть получены с помощью фермента с экзонуклеазной активностью, например экзонуклеазы. Например, в некоторых вариантах реализации первый вектор и второй вектор или фрагмент нуклеиновой кислоты сконфигурированы так, что при расщеплении первого вектора первым ферментом рестрикции (RE1) и второго вектора или нуклеиновой кислоты вторым ферментом рестрикции (RE2) полученные новые концы совместимы для лигирования после использования фермента с экзонуклеазной активностью. Способы получения совместимых концов с использованием фермента с экзонуклеазной активностью хорошо известны в данной области техники и включают, но не ограничиваются ими, например, клонирование с помощью системы In-Fusion®, сборку по Гибсону и т.п.In some cases, compatible ends can be obtained using an enzyme with exonuclease activity, such as exonuclease. For example, in some embodiments, the first vector and the second vector or nucleic acid fragment are configured such that when the first vector or nucleic acid is cleaved with a first restriction enzyme (RE1) and the second vector or nucleic acid with a second restriction enzyme (RE2), the resulting new ends are compatible for ligation after use of the enzyme. with exonuclease activity. Methods for producing compatible ends using an enzyme with exonuclease activity are well known in the art and include, but are not limited to, for example, In-Fusion® system cloning, Gibson assembly, and the like.
В некоторых случаях сборку первого вектора, расщепленного ферментом рестрикции, и второй нуклеиновой кислоты, например, второго вектора, содержащего фрагмент нуклеиновой кислоты, осуществляют с помощью реакции In-Fusion®, и, в таких случаях, совместимые концы, полученные в результате использования фермента с экзонуклеазной активностью, могут быть упомянуты как липкие концы In-Fusion® (липкие концы IF) (фиг. 17). Соединение двух липких концов IF может быть сконфигурировано так, чтобы получить желательные линкеры и/или желательные линкерные последовательности между двумя соединенными концами нуклеиновой кислоты. Например, соединенные липкие концы IF между первой кодирующей модуль последовательностью и второй кодирующей модуль последовательностью могут быть сконфигурированы так, что первый и второй модули расположены с сохранением открытой рамки считывания. Как описано более подробно в настоящем документе, кодирующие модули последовательности, которые расположены с сохранением открытой рамки считывания, могут быть разделены последовательностью, кодирующей одну или более линкерных аминокислот, или могут не иметь такой последовательности. Например, как показано на фиг. 17, расщепление первого вектора в сайте распознавания (RE1) первого фермента рестрикции приводит к получению концов, которые могут быть совмещены посредством реакции In-Fusion® с концами, полученными при расщеплении второго вектора или фрагмента нуклеиновой кислоты ферментом рестрикции типа IIS в сайтах расщепления, определенных сайтами распознавания (RE2), присутствующими на втором векторе или фрагменте нуклеиновой кислоты. Совместимые концы лигируют посредством реакции In-Fusion®, что приводит к получению желательной линкерной последовательности между первой и второй кодирующими модули последовательностями и многозвенной нуклеиновой последовательностью-штрихкодом, содержащей первое звено и второе звено нуклеиновых последовательностей-штрихкодов, которые имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям. В некоторых случаях после сборки In-Fusion® первой и второй кодирующих модули последовательностей и многозвенной нуклеиновой последовательности-штрихкода сайт фермента рестрикции присутствует между кодирующей областью и областью последовательности-штрихкода, чтобы обеспечить возможность введения дополнительных последовательностей, кодирующих модули, и звеньев нуклеиновых последовательностейштрихкодов.In some cases, the assembly of the first vector cleaved with the restriction enzyme and the second nucleic acid, such as the second vector containing the nucleic acid fragment, is carried out using the In-Fusion® reaction, and, in such cases, the compatible ends resulting from the use of the enzyme with exonuclease activity can be referred to as In-Fusion® sticky ends (IF sticky ends) (FIG. 17). The connection of the two sticky ends of the IF can be configured to obtain the desired linkers and/or the desired linker sequences between the two joined ends of the nucleic acid. For example, the connected IF sticky ends between the first coding module sequence and the second coding module sequence can be configured such that the first and second modules are arranged in an open reading frame. As described in more detail herein, coding sequence modules that are arranged in an open reading frame may or may not be separated by a sequence encoding one or more linker amino acids. For example, as shown in FIG. 17, cleavage of the first vector at the recognition site (RE1) of the first restriction enzyme results in ends that can be In-Fusion® fused with the ends obtained by cleaving the second vector or nucleic acid fragment with the type IIS restriction enzyme at the cleavage sites defined recognition sites (RE2) present on the second vector or nucleic acid fragment. The compatible ends are ligated via an In-Fusion® reaction resulting in the desired linker sequence between the first and second module-encoding sequences and a multi-unit barcode nucleic sequence containing a first unit and a second unit of barcode nucleic sequences that are in reverse orientation to the first. and a second coding module sequences. In some cases, after In-Fusion® assembly of the first and second coding module sequences and the multi-unit barcode nucleic sequence, a restriction enzyme site is present between the coding region and the barcode sequence region to allow the introduction of additional coding module sequences and barcode nucleic sequence units.
В некоторых случаях после лигирования нуклеиновой кислоты, содержащей первую кодирующую модуль последовательность, со второй нуклеиновой кислотой, содержащей вторую кодирующую модульIn some cases, after ligation of a nucleic acid containing a first coding module sequence with a second nucleic acid containing a second coding module
- 31 041085 последовательность, первая и вторая кодирующие модули последовательности соединены так, что между первой и второй кодирующими модули последовательностями отсутствует линкер и промежуточные некодирующие нуклеотиды. В одном неограничивающем примере первый вектор, содержащий первую кодирующую модуль последовательность и соответствующую ей нуклеиновую последовательностьштрихкод, соединен без линкера или промежуточных некодирующих нуклеотидов со вторым вектором или фрагментом нуклеиновой кислоты, содержащим вторую кодирующую модуль последовательность и соответствующую ей нуклеиновую последовательность-штрихкод, с помощью расщепления ферментом рестрикции (фиг. 18). Первый вектор и второй вектор или фрагмент нуклеиновой кислоты расщепляют с использованием двух разных ферментов рестрикции типа IIS, имеющих два разных сайта распознавания (RE1 и RE2), причем первый фермент рестрикции расщепляет обе нити нуклеиновой кислоты в одном и том же положении на некотором расстоянии от своего сайта распознавания (RE1), оставляя тупой конец, тогда как второй фермент рестрикции расщепляет обе нити нуклеиновой кислоты в разных положениях на некотором расстоянии от своего сайта распознавания (RE2), оставляя выступающий конец или липкий конец. Исходные нуклеиновые кислоты сконфигурированы так, что после расщепления первого вектора и второго вектора вторым ферментом рестрикции образующиеся липкие концы являются совместимыми для лигирования. Следовательно, после лигирования полученных тупых концов и липких концов полученный вектор содержит первую кодирующую модуль последовательность, гибридизованную непосредственно, без линкера или промежуточных некодирующих нуклеиновых кислот, со второй кодирующей модуль последовательностью и многозвенной нуклеиновой последовательностьюштрихкодом, содержащей нуклеиновую последовательность-штрихкод первой кодирующей модуль последовательности и нуклеиновую последовательность-штрихкод второй кодирующей модуль последовательности в обратной ориентации по отношению к первой и второй кодирующим модули последовательностям.- 31 041085 sequence, the first and second coding sequence modules are connected so that between the first and second coding sequences there is no linker and intermediate non-coding nucleotides. In one non-limiting example, a first vector containing a first coding module sequence and its corresponding barcode nucleic sequence is connected without a linker or intermediate non-coding nucleotides to a second vector or nucleic acid fragment containing a second coding module sequence and its corresponding barcode nucleic sequence by enzyme digestion. restriction (Fig. 18). The first vector and the second vector or nucleic acid fragment are cleaved using two different type IIS restriction enzymes having two different recognition sites (RE1 and RE2), wherein the first restriction enzyme cleaves both nucleic acid strands at the same position some distance from its own. recognition site (RE1), leaving a blunt end, while the second restriction enzyme cleaves both strands of nucleic acid at different positions some distance from its recognition site (RE2), leaving an overhang or sticky end. The parent nucleic acids are configured such that after cleavage of the first vector and the second vector with a second restriction enzyme, the resulting sticky ends are compatible for ligation. Therefore, after ligation of the resulting blunt ends and sticky ends, the resulting vector contains the first coding module sequence hybridized directly, without a linker or intermediate non-coding nucleic acids, with the second coding module sequence and a barcode multilink nucleic sequence containing the nucleic sequence-barcode of the first coding module sequence and the nucleic acid a barcode sequence of the second coding module sequence in reverse orientation with respect to the first and second coding module sequences.
Любой удобный фермент рестрикции типа IIS, который приводит к получению тупых концов после расщепления, можно применять в способах, описанных в настоящем документе, с использованием лигирования тупых концов, включая ферменты, которые хорошо известны в данной области техники, включая, но не ограничиваются ими, например SlyI, MlyI и т.д. Помимо этого при необходимости можно использовать способы получения тупых концов после расщепления с помощью рестрикционной эндонуклеазы, которая не образует тупые концы, т.е. может быть использовано затупление, при необходимости, включая, но не ограничиваясь перечисленным, заполнение конца ДНК-полимеразой, такой как, например, большой фрагмент ДНК-полимеразы I (например, фрагмент Кленова), ДНК-полимеразой Т4, нуклеазой золотистой фасоли и т.д., или концевые неспаренные нуклеотиды могут быть удалены ферментом с экзонуклеазной активностью.Any convenient type IIS restriction enzyme that results in blunt ends upon digestion can be used in the methods described herein using blunt end ligation, including enzymes that are well known in the art, including, but not limited to, e.g. SlyI, MlyI, etc. In addition, methods for producing blunt ends after digestion with a restriction endonuclease that does not form blunt ends, i. blunting may be used, as appropriate, including, but not limited to, terminating with a DNA polymerase such as, for example, a large fragment of DNA polymerase I (e.g., a Klenow fragment), T4 DNA polymerase, mung bean nuclease, etc. or the terminal mismatch can be removed by an enzyme with exonuclease activity.
В некоторых случаях, когда последовательность, совместимая с ферментом рестрикции, не относящимся к типу IIS, присутствует на конце кодирующей модуль последовательности, расщепление может быть выполнено с помощью фермента рестрикции, не относящегося к типу IIS, например фермента рестрикции типа II, который расщепляет нити внутри своей последовательность распознавания. В таких случаях может быть использован фермент рестрикции, который образует тупой конец на конце кодирующей модуль последовательности, если кодирующая модуль последовательность содержит всю или часть последовательности распознавания фермента рестрикции на своем 3'-конце или 5'-конце. В некоторых случаях, когда кодирующая модуль последовательность содержит всю или часть последовательности распознавания фермента рестрикции, который разрезает нити внутри своей последовательности распознавания и не образует тупой конец, может быть использован фермент рестрикции, не образующий тупых концов, и полученные липкие концы могут быть затуплены, например, любым удобным способом, включая, но не ограничиваясь ими, например, способы, описанные в настоящем документе.In some cases, where a sequence compatible with a non-type IIS restriction enzyme is present at the end of the module-coding sequence, cleavage can be performed with a non-type IIS restriction enzyme, such as a type II restriction enzyme that cleaves the strands within its recognition sequence. In such cases, a restriction enzyme that forms a blunt end at the end of the coding sequence may be used if the coding sequence contains all or part of the restriction enzyme recognition sequence at its 3' or 5' end. In some cases, where a coding module sequence contains all or part of a restriction enzyme recognition sequence that cuts strands within its recognition sequence and does not form a blunt end, a non-blunt restriction enzyme can be used and the resulting sticky ends can be blunted, e.g. , in any convenient way, including, but not limited to, for example, the methods described herein.
Поскольку последовательности на концах кодирующих модули последовательностей будут ограничены концевыми аминокислотами модуля, то случаи, когда подходящие последовательности распознавания фермента рестрикции присутствуют в удобном положении, или могут быть модифицированы для этого, на одном или нескольких концах кодирующей модуль последовательности, чтобы обеспечить надлежащее расщепление и/или образование тупого конца, могут быть редкими в зависимости от конкретного используемого модуля. Следовательно, во многих случаях эффективное получение большой или многомерной библиотеки синтетических модульных полипептидов будет зависеть от сайтов распознавания ферментов, которые присутствуют за пределами кодирующей модуль последовательности. Следовательно, в некоторых случаях одна или более, включая все, из последовательностей распознавания ферментов рестрикции, используемых при сборке библиотеки, будут присутствовать за пределами кодирующей модуль последовательности. Во многих случаях одна или более, включая все, из последовательностей распознавания ферментов рестрикции, используемых при сборке библиотеки, будут присутствовать за пределами нуклеиновой последовательности-штрихкода.Since the sequences at the ends of the module-coding sequences will be limited to the terminal amino acids of the module, where suitable restriction enzyme recognition sequences are present in a convenient position, or can be modified to do so, at one or more ends of the module-coding sequence to allow for proper cleavage and/or blunt end formation may be rare depending on the specific module used. Therefore, in many cases, efficient production of a large or multidimensional library of synthetic modular polypeptides will depend on enzyme recognition sites that are present outside the module-coding sequence. Therefore, in some cases, one or more, including all, of the restriction enzyme recognition sequences used in library assembly will be present outside of the module-coding sequence. In many cases, one or more, including all, of the restriction enzyme recognition sequences used in library assembly will be present outside of the barcode nucleic sequence.
В некоторых случаях получают синтетический модульный полипептид, в котором кодирующие модули последовательности легко соединяются с концами линкерного домена так, что между кодирующими модули последовательностями и соответствующими им соединениями с линкерным доменом отсутствует промежуточная последовательность. В одном неограничивающем примере указанное непрерывIn some instances, a synthetic modular polypeptide is prepared in which the coding sequence modules are readily fused to the ends of the linker domain such that there is no intervening sequence between the module coding sequences and their corresponding linker domain compounds. In one non-limiting example, said continuous
- 32 041085 ное соединение кодирующих модули последовательностей с линкерным доменом облегчается вектором или фрагментом нуклеиновой кислоты, сконфигурированным так, чтобы содержать часть желательной линкерной последовательности, легко присоединяемой к любому концу кодирующей модуль последовательности. Например, первый вектор, сконфигурированный так, чтобы содержать первую кодирующую модуль последовательность, легко присоединенную к первой части линкерного домена, лигируют со вторым вектором или фрагментом нуклеиновой кислоты, сконфигурированным так, чтобы содержать вторую часть линкерного домена, последовательно присоединенную ко второй кодирующей модуль последовательности (фиг. 19). Первый вектор может быть сконфигурирован так, чтобы содержать два сайта распознавания первого фермента рестрикции типа IIS (RE1) между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Второй вектор, или фрагмент нуклеиновой кислоты, может быть сконфигурирован так, чтобы содержать два сайта распознавания второго фермента рестрикции типа IIS (RE2), фланкирующие вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. Может быть использован третий вектор или фрагмент нуклеиновой кислоты, содержащий оставшуюся, например, среднюю часть линкерного домена, которая фланкирована двумя сайтами распознавания второго фермента рестрикции типа IIS (RE2). Последовательность предварительно расщепленных векторов и/или фрагментов нуклеиновых кислот конфигурируют так, чтобы после расщепления получить совместимые концы между первой частью линкерного домена и средней частью линкерного домена, второй частью линкерного домена и средней частью линкерного домена и двумя нуклеиновыми последовательностями-штрихкодами. После расщепления и лигирования полученный вектор содержит первую кодирующую модуль последовательность, последовательно соединенную с линкерным доменом, последовательно соединенным со второй кодирующей модуль последовательностью, соединенной с областью нуклеиновой последовательности-штрихкода, содержащей первую и вторую нуклеиновые последовательности-штрихкоды в обратной ориентации по отношению к первой и второй кодирующим модули последовательностям (фиг. 19). Последовательная сборка, например, между модулями и линкерными доменами, может быть достигнута с использованием опосредованной экзонуклеазами сборки (например, клонирование с помощью системы In-Fusion®, сборка по Гибсону и т.д.) или без нее.- 32 041085 The specific connection of module-coding sequences to a linker domain is facilitated by a vector or nucleic acid fragment configured to contain a portion of the desired linker sequence readily attached to either end of the module-coding sequence. For example, a first vector configured to contain a first coding module sequence fused to a first linker domain portion is ligated to a second vector or nucleic acid fragment configured to contain a second linker domain portion fused sequentially to a second coding module sequence ( Fig. 19). The first vector can be configured to contain two recognition sites for the first IIS type restriction enzyme (RE1) between the module coding sequence and its corresponding barcode nucleic sequence. The second vector, or nucleic acid fragment, can be configured to contain two second type IIS restriction enzyme (RE2) recognition sites flanking a second coding module sequence containing a nucleic barcode sequence. A third vector or nucleic acid fragment may be used containing the remainder, for example, the middle portion of the linker domain, which is flanked by two recognition sites of a second type IIS restriction enzyme (RE2). The sequence of pre-cleaved vectors and/or nucleic acid fragments is configured so that, after cleavage, compatible ends are obtained between the first part of the linker domain and the middle part of the linker domain, the second part of the linker domain and the middle part of the linker domain and two nucleic barcode sequences. After cleavage and ligation, the resulting vector contains a first coding module sequence connected in series with a linker domain connected in series with a second coding module sequence connected to a region of a nucleic barcode sequence containing the first and second nucleic barcode sequences in reverse orientation with respect to the first and to the second coding sequences (FIG. 19). Sequential assembly, eg between modules and linker domains, can be achieved with or without exonuclease mediated assembly (eg In-Fusion® system cloning, Gibson assembly, etc.).
Вышеописанные стратегии сборки на основе расщепления, в некоторых случаях, можно комбинировать, полностью или частично, любым удобным и подходящим путем, чтобы обеспечить способ, пригодный для получения библиотеки синтетических модульных полипептидов, описанной в настоящем документе. Помимо этого, в тех случаях, когда альтернативные способы сборки на основе расщепления известны в данной области техники и будут совместимы с описанными в настоящем документе способами, подходящие альтернативные способы можно применять при сборке библиотеки синтетических модульных полипептидов, описанной в настоящем документе. В некоторых случаях описанные стратегии на основе расщепления можно комбинировать, полностью или частично, со способами, не связанными с расщеплением, для сборки нуклеиновых кислот.The above-described cleavage-based assembly strategies may, in some instances, be combined, in whole or in part, in any convenient and appropriate way to provide a method suitable for preparing the library of synthetic modular polypeptides described herein. In addition, where alternative cleavage-based assembly methods are known in the art and are compatible with the methods described herein, suitable alternative methods can be used in assembling the synthetic modular polypeptide library described herein. In some instances, the cleavage strategies described can be combined, in whole or in part, with non-cleavage methods to assemble nucleic acids.
Сборка нуклеиновых кислот, кодирующих библиотеку синтетических модульных полипептидов, описанную в настоящем документе, не ограничена стратегиями сборки на основе расщепления, т.е. сборки на основе ферментов рестрикции. В некоторых случаях способы, не связанные с расщеплением, можно применять при сборке библиотеки, описанной в настоящем документе, включая, но не ограничиваясь ими, например, стратегии на основе амплификации, стратегии на основе рекомбинации и т.д. Подходящими для применения являются способы, не связанные с расщеплением, вместо стратегий на основе расщепления, т.е. вся стратегия сборки в целом не связана с расщеплением ферментами рестрикции или может быть использована в комбинации со стратегиями на основе расщепления, т.е., так, что стратегия сборки в целом включает как способы, основанные на использовании ферментов рестрикции, так и способы, не связанные с расщеплением ферментами рестрикции.The assembly of nucleic acids encoding the synthetic modular polypeptide library described herein is not limited to cleavage-based assembly strategies, i. assembly based on restriction enzymes. In some instances, non-cleavage methods may be used in the assembly of the library described herein, including but not limited to, for example, amplification-based strategies, recombination-based strategies, and so on. Non-splitting methods are suitable for use instead of split-based strategies, ie. the assembly strategy as a whole does not involve restriction enzyme digestion, or can be used in combination with cleavage-based strategies, i.e., such that the assembly strategy as a whole includes both restriction enzyme-based methods and methods that do not associated with cleavage by restriction enzymes.
В некоторых случаях библиотека синтетических модульных полипептидов, описанная в настоящем документе, может быть собрана полностью или частично с использованием способа сборки на основе амплификации, включая, но не ограничиваясь ими, например, клонирование ПЦР, клонирование ТА, удлинение концов методом ПЦР и т.п. Подходящие стратегии на основе амплификации будут варьироваться, но обычно будут основаны на использовании множества сайтов связывания праймеров в исходных векторах и/или фрагментах нуклеиновых кислот. Подходящие сайты связывания праймеров, в зависимости от желательного конечного продукта, могут быть специально добавлены к векторам и/или фрагментам нуклеиновых кислот, или ранее существовавшая последовательность, присутствующая в векторе или фрагменте нуклеиновой кислоты, может быть использована в качестве сайта связывания праймера в соответствии с различными стратегиями сборки, основанными на амплификации. Сайты связывания праймеров могут быть расположены в любой удобной конфигурации и/или ориентации, достаточной для получения желательного клонированного продукта, включая, но не ограничиваясь ими: расположение между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом в направлении от 5'-конца к 3'-концу относительно последовательности, кодирующей модуль; расположение между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом в направлении от 5'-конца к 3'-концу относиIn some instances, the synthetic modular polypeptide library described herein may be assembled in whole or in part using an amplification-based assembly method including, but not limited to, e.g., PCR cloning, TA cloning, PCR end extension, and the like. . Suitable strategies based on amplification will vary, but will usually be based on the use of multiple primer binding sites in the original vectors and/or nucleic acid fragments. Suitable primer binding sites, depending on the desired end product, can be specifically added to the vectors and/or nucleic acid fragments, or a pre-existing sequence present in the vector or nucleic acid fragment can be used as the primer binding site, according to various assembly strategies based on amplification. The primer binding sites may be located in any convenient configuration and/or orientation sufficient to produce the desired cloned product, including but not limited to: location between the module coding sequence and its corresponding nucleic barcode sequence in the 5' to 3 direction '-end relative to the sequence encoding the module; the location between the coding sequence of the module and its corresponding nucleic sequence-barcode in the direction from the 5'-end to the 3'-end relative to
- 33 041085 тельно последовательности-штрихкода; расположение перед (т.е. в направлении 5'-конца) кодирующей модуль последовательностью в направлении от 5'-конца к 3'-концу относительно кодирующей модуль последовательности; расположение после (т.е. в направлении 3'-конца) кодирующей модуль последовательности в направлении от 5'-конца к 3'-концу относительно кодирующей модуль последовательности, содержащей нуклеиновую последовательность-штрихкод; и т.п. Последовательности сайтов связывания праймеров могут быть сконфигурированы так, что после клонирования на основе амплификации, в том числе после одного раунда клонирования на основе амплификации, одна или более желательных линкерных последовательностей присутствуют между собранными элементами, включая, например, собранные последовательности, кодирующие модули, собранные нуклеиновые последовательности-штрихкоды и т.д.- 33 041085 barcode sequence; position before (ie, in the direction of the 5'-end) encoding the module sequence in the direction from the 5'-end to the 3'-end relative to the encoding module sequence; the location after (ie, in the direction of the 3'-end) encoding the module sequence in the direction from the 5'-end to the 3'-end relative to the coding module sequence containing the nucleic sequence-barcode; and so on. Primer binding site sequences can be configured such that after amplification-based cloning, including after one round of amplification-based cloning, one or more desired linker sequences are present between assembled elements, including, for example, assembled sequences, coding modules, assembled nucleic barcode sequences, etc.
В качестве неограничивающего примера стратегий сборки на основе амплификации может быть использована стратегия амплификации липких концов методом ПЦР (фиг. 20), при которой первый вектор содержит первый сайт связывания праймера (PBS1) и второй сайт связывания праймера (PBS2), расположенный, в ориентации, противоположной ориентации от 5'-конца к 3'-концу, между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Может быть использован второй вектор или фрагмент нуклеиновой кислоты, содержащий вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод, фланкированную первым и вторым сайтами связывания праймеров (PBS1 и PBS2). После удлинения и амплификации с помощью удлинения липких концов методом ПЦР с использованием праймеров, которые специфично гибридизуются с сайтами PBS1 и PBS2, синтезируется собранный продукт, в котором первая кодирующая модуль последовательность соединена с помощью желательного линкера со второй кодирующей модуль последовательностью, которая соединена с многозвенной нуклеиновой последовательностью-штрихкодом, содержащей первую и вторую нуклеиновые последовательности-штрихкоды в обратной ориентации по отношению к соответствующим им кодирующим модули последовательностям (фиг. 20).As a non-limiting example of amplification-based assembly strategies, the PCR sticky-end amplification strategy (FIG. 20) can be used, in which the first vector contains a first primer binding site (PBS1) and a second primer binding site (PBS2) located, in the orientation opposite orientation from the 5'-end to the 3'-end, between the coding sequence of the module and its corresponding nucleic sequence-barcode. A second vector or nucleic acid fragment can be used containing a second coding module sequence containing a nucleic barcode sequence flanked by first and second primer binding sites (PBS1 and PBS2). After extension and amplification by sticky-end extension by PCR using primers that specifically hybridize to the PBS1 and PBS2 sites, an assembled product is synthesized in which the first coding module sequence is connected via the desired linker to the second coding module sequence, which is connected to the multi-nucleotide nucleic acid a barcode sequence containing the first and second nucleic barcode sequences in reverse orientation with respect to their respective coding modules sequences (FIG. 20).
Ввиду вышеописанных стратегий сборки специалист в данной области техники легко поймет, как любая из вышеописанных стратегий может быть комбинирована, полностью или частично, чтобы привести к желаемому результату и/или обеспечить наибольшие преимущества и/или свести к минимуму недостатки конкретных методик клонирования в соответствии со сборкой с использованием желательной библиотеки и/или компонента библиотеки. В качестве неограничивающего примера, стратегии на основе амплификации можно комбинировать со стратегиями на основе расщепления, когда комбинирование указанных стратегий приводит к сборке желательной библиотеки и/или компонентов библиотеки. Например, как показано на фиг. 21, расщепление ферментом рестрикции первого вектора в соответствии с сайтом распознавания фермента рестрикции (RE1), расположенным между первой кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом, можно комбинировать с амплификацией на основе ПЦР с использованием сайтов связывания праймеров, фланкирующих вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод, содержащуюся в пределах второго вектора или фрагмента нуклеиновой кислоты, чтобы обеспечить вложенную сборку. После сборки с применением описанной гибридной стратегии сборки может быть получен собранный продукт, в котором первая кодирующая модуль последовательность соединена с помощью желательного линкера со второй кодирующей модуль последовательностью, которая соединена с многозвенной нуклеиновой последовательностью-штрихкодом, содержащей первую и вторую нуклеиновые последовательности-штрихкоды в обратной ориентации по отношению к соответствующим им кодирующим модули последовательностям (фиг. 21).In view of the above assembly strategies, one skilled in the art will readily understand how any of the above strategies can be combined, in whole or in part, to produce the desired result and/or provide the greatest advantages and/or minimize the disadvantages of specific assembly-specific cloning techniques. using the desired library and/or library component. As a non-limiting example, amplification-based strategies can be combined with cleavage-based strategies when the combination of these strategies results in the assembly of the desired library and/or library components. For example, as shown in FIG. 21, restriction enzyme digestion of the first vector according to the restriction enzyme recognition site (RE1) located between the first coding module sequence and its corresponding nucleic barcode sequence can be combined with PCR-based amplification using primer binding sites flanking the second coding module sequence. , containing the nucleic barcode sequence contained within the second vector or nucleic acid fragment, to provide a nested assembly. After assembly using the described hybrid assembly strategy, an assembled product can be obtained in which the first coding module sequence is connected via the desired linker to a second coding module sequence that is connected to a multi-link barcode nucleic sequence containing the first and second nucleic acid barcode sequences in reverse order. orientations with respect to their respective module coding sequences (FIG. 21).
Гибридные стратегии не ограничиваются комбинированием стратегий, основанных на расщеплении и амплификации, и могут включать другие способы клонирования и/или синтетической биологии, полностью или частично, включая, но не ограничиваясь ими, например, стратегии клонирования на основе рекомбинации (включая, но не ограничиваясь ими, например, стратегии клонирования на основе технологии Gateway, клонирования на основе рекомбиназы Cre/Flp (включая, стратегии, при которых сайт инактивирован при рекомбинации) и т.д.), сборку последовательности de novo, синтез нуклеиновой кислоты de novo и т.п. В некоторых случаях стратегии клонирования на основе рекомбинации, сборки последовательности de novo, синтеза нуклеиновой кислоты de novo и т.п. могут быть использованы независимо, т.е. по отдельности в качестве независимой стратегии клонирования, а не как часть гибридной стратегии клонирования.Hybrid strategies are not limited to combining cleavage and amplification based strategies and may include other cloning and/or synthetic biology techniques, in whole or in part, including but not limited to, for example, recombination based cloning strategies (including but not limited to eg Gateway cloning strategies, Cre/Flp recombinase cloning (including strategies in which the site is inactivated by recombination), etc.), de novo sequence assembly, de novo nucleic acid synthesis, etc. . In some cases, cloning strategies based on recombination, de novo sequence assembly, de novo nucleic acid synthesis, and the like. can be used independently, i.e. separately as an independent cloning strategy, not as part of a hybrid cloning strategy.
В некоторых случаях, когда используемая конкретная стратегия клонирования приводит к присутствию нежелательной промежуточной последовательности между двумя клонированными элементами, также известной как шрамы или швы клонирования, такие шрамы клонирования могут быть уменьшены и/или удалены путем мономолекулярного расщепления и повторного лигирования вектора, содержащего шрам. Мономолекулярное расщепление и повторное лигирование можно осуществлять любым удобным способом, включая, но не ограничиваясь ими, например, мономолекулярное расщепление, опосредованное ферментами рестрикции, и повторное лигирование, такое как, например, мономолекулярное расщепление ферментами рестрикции типа IIS и повторное лигирование. Например, в некоторых случаях, шов,In some cases, where a particular cloning strategy used results in the presence of an unwanted intermediate sequence between two cloned elements, also known as cloning scars or sutures, such cloning scars can be reduced and/or removed by unimolecular cleavage and religation of the vector containing the scar. Monomolecular cleavage and religation can be performed in any convenient manner, including, but not limited to, for example, restriction enzyme mediated unimolecular cleavage and religation, such as, for example, IIS type unimolecular cleavage and religation. For example, in some cases, the seam,
- 34 041085 который содержит полный сайт рекомбинации или его часть, в результате сборки на основе рекомбинации, может быть частично или полностью удален путем мономолекулярного расщепления и повторного лигирования. В некоторых случаях шрам после расщепления, который содержит весь сайт распознавания фермента рестрикции или его часть в результате стратегии на основе расщепления, может быть частично или полностью удален путем мономолекулярного расщепления и повторного лигирования. В некоторых случаях шов, который содержит весь сайт связывания праймера или его часть в результате сборки на основе амплификации, может быть частично или полностью удален путем мономолекулярного расщепления и повторного лигирования.- 34 041085 which contains a complete recombination site or part thereof, as a result of the assembly based on recombination, can be partially or completely removed by monomolecular cleavage and re-ligation. In some instances, a cleavage scar that contains all or part of the restriction enzyme recognition site as a result of a cleavage strategy may be partially or completely removed by unimolecular cleavage and religation. In some cases, a suture that contains all or part of the primer binding site as a result of amplification-based assembly can be partially or completely removed by unimolecular cleavage and religation.
В одном неограничивающем варианте реализации комбинаторная библиотека получена путем итеративного клонирования компонентов библиотеки каждого типа размерности посредством клонирования на основе расщепления и клонирования с помощью системы In-Fusion®. Например, как показано на фиг. 22, на первом этапе исходную нуклеиновую кислоту (например, вектор), содержащую кодирующую scFv последовательность и смежный линкер Gly/Ser, расщепляют в сайте BamHI в пределах или рядом с линкером Gly/Ser. На втором этапе фрагмент нуклеиновой кислоты, содержащий первую кодирующую модуль последовательность, соединенную со вторым линкером Gly/Ser, гибридизованным с первой специфичной для модуля нуклеиновой последовательностью-штрихкодом, клонируют в расщепленный сайт BamHI путем клонирования с помощью системы In-Fusion®. После лигирования путем клонирования с помощью системы In-Fusion® линкер Gly/Ser между scFv и первой кодирующей модуль последовательностью сохраняется. На третьем этапе нуклеиновую кислоту, собранную на этапе 2, расщепляют в сайте BamHI, импортированном в пределах или рядом с линкером Gly/Ser фрагмента первой кодирующей модуль нуклеиновой кислоты, и повторяют клонирование с помощью системы In-Fusion® со вторым фрагментом нуклеиновой кислоты, содержащим вторую кодирующую модуль последовательность, соединенную с третьим линкером Gly/Ser, гибридизованным со второй нуклеиновой последовательностьюштрихкодом, специфичной для модуля. Как и на этапе 2, после лигирования путем клонирования с помощью системы In-Fusion® линкер Gly/Ser между первой и второй кодирующими модули последовательностями сохраняется. Если необходимы элементы библиотеки большей размерности, этап 3 можно повторять итеративно. На четвертом этапе расщепление в сайте BamHI, импортированном в пределах или рядом с линкером Gly/Ser, кодирующей модуль последовательности, содержащей нуклеиновую кислоту, которая была добавлена в последнюю очередь, позволяет осуществлять клонирование In-Fusion® концевой репортерной последовательности (например, последовательности, кодирующей GFP, которая также содержит последовательность сигнала стоп (например, стоп-кодон)) между готовой кодирующей модуль последовательностью и нуклеиновой последовательностью-штрихкодом, расположенной после нее. В этом варианте реализации каждый готовый элемент библиотеки содержит комбинаторный CAR, встроенный с сохранением открытой рамки считывания, и комбинаторную нуклеиновую последовательность-штрихкод, описывающую архитектуру комбинаторного CAR, встроенного с сохранением открытой рамки считывания.In one non-limiting embodiment, a combinatorial library is generated by iteratively cloning the library components of each dimension type via split-based cloning and In-Fusion® cloning. For example, as shown in FIG. 22, in a first step, a parent nucleic acid (eg, vector) containing the scFv coding sequence and an adjacent Gly/Ser linker is cleaved at a BamHI site within or adjacent to the Gly/Ser linker. In a second step, a nucleic acid fragment containing a first coding module sequence linked to a second Gly/Ser linker hybridized to the first module-specific barcode nucleic sequence is cloned into a cleaved BamHI site by cloning with an In-Fusion® system. After ligation by cloning with the In-Fusion® system, the Gly/Ser linker between the scFv and the first coding module sequence is retained. In the third step, the nucleic acid assembled in step 2 is cleaved at the BamHI site imported within or adjacent to the Gly/Ser linker of the first nucleic acid coding module fragment, and cloning is repeated using the In-Fusion® system with the second nucleic acid fragment containing a second module-encoding sequence linked to a third Gly/Ser linker hybridized to a second module-specific barcode nucleic acid sequence. As in step 2, after ligation by cloning with the In-Fusion® system, the Gly/Ser linker between the first and second coding sequences is preserved. If larger library elements are needed, step 3 can be repeated iteratively. In a fourth step, cleavage at a BamHI site imported within or adjacent to the Gly/Ser linker encoding a module of the last added nucleic acid sequence allows In-Fusion® cloning of the terminal reporter sequence (e.g., the sequence encoding GFP that also contains a stop signal sequence (eg, a stop codon)) between the finished module coding sequence and the nucleic barcode sequence located after it. In this implementation, each completed library element contains a combinatorial CAR embedded in an open reading frame and a combinatorial nucleic barcode sequence describing the architecture of a combinatorial CAR embedded in an open reading frame.
Объединенные библиотеки.United Libraries.
В настоящем изобретении предложены способы получения объединенных библиотек синтетических модульных полипептидов, содержащих нуклеиновые последовательности-штрихкоды. Подразумевают, что в объединенной библиотеке элементы библиотеки присутствуют в общем контейнере и/или общем растворе, и отдельные элементы библиотеки не должны быть физически разделены в пространстве, например отдельные элементы библиотеки могут быть объединены во время конструирования библиотеки (например, как при сборке в одном реакторе) или после создания отдельных элементов библиотеки. Например, в случае объединенной библиотеки синтетических модульных полипептидов, сконструированной путем комбинаторной вложенной сборки, компоненты библиотеки могут быть объединены во время сборки элементов библиотеки, до завершения сборки элементов библиотеки и/или после завершения сборки элементов библиотеки и т.д. В настоящей заявке объединенные библиотеки не ограничены библиотеками только синтетических модульных полипептидов, но также включают объединенные библиотеки клеток, экспрессирующих синтетические модульные полипептиды, объединенные библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды, и т.п.The present invention provides methods for preparing pooled libraries of synthetic modular polypeptides containing nucleic barcode sequences. It is understood that in a pooled library, library elements are present in a common container and/or common solution, and individual library elements do not need to be physically separated in space, for example, individual library elements can be combined during library construction (for example, as when assembled in a single reactor ) or after creating the individual elements of the library. For example, in the case of a combined library of synthetic modular polypeptides constructed by combinatorial nesting, library components can be combined during assembly of library elements, before assembly of library elements is completed, and/or after assembly of library elements is completed, and so on. In the present application, pooled libraries are not limited to libraries of only synthetic modular polypeptides, but also include pooled libraries of cells expressing synthetic modular polypeptides, pooled libraries of nucleic acids encoding synthetic modular polypeptides, and the like.
Соответственно, в некоторых случаях, отдельные компоненты нуклеиновых кислот, используемые для сборки элементов библиотеки, можно комбинировать до сборки и они могут оставаться объединенными во время сборки элементов библиотеки. В других случаях собранные элементы библиотеки могут быть смешаны после сборки, чтобы получить объединенную библиотеку.Accordingly, in some cases, individual nucleic acid components used to assemble library elements may be combined prior to assembly and may remain combined during assembly of the library elements. In other cases, the assembled library elements may be mixed after assembly to form a combined library.
Поскольку библиотеки и способы сборки библиотек, описанные в настоящем документе, включают получение элементов библиотеки, которые могут быть идентифицированы путем секвенирования соответствующей области нуклеиновой последовательности-штрихкода, отдельные нуклеиновые кислоты могут быть объединены в любой момент до, во время или после сборки, при этом сохраняется возможность последующей идентификации и количественного определения отдельных элементов библиотеки в количественных исследованиях. В некоторых случаях конечную размерность библиотеки может контролировать путем объединения компонентов библиотеки в определенные моменты во время сборки. На- 35 041085 пример, библиотека смешанной размерности может быть получена путем раздельной сборки частичных библиотек разной размерности и последующего объединения частичных библиотек (например, с использованием сборки разделить-и-объединить). В некоторых случаях, например, после объединения частичных библиотек различной размерности, может быть выполнена последующая сборка, включая добавление дополнительных вариабельных доменов.Because the libraries and library assembly methods described herein involve generating library elements that can be identified by sequencing the appropriate region of the nucleic barcode sequence, individual nucleic acids can be combined at any time before, during, or after assembly while maintaining the possibility of subsequent identification and quantification of individual elements of the library in quantitative studies. In some cases, the final dimension of a library can be controlled by combining library components at certain points during a build. For example, a mixed dimensional library can be obtained by separately assembling different sized partial libraries and then combining the partial libraries (eg, using split-and-merge assembly). In some cases, for example, after combining partial libraries of different dimensions, a subsequent assembly may be performed, including the addition of additional variable domains.
В одном неограничивающем варианте реализации, как показано на фиг. 23, объединенную библиотеку нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, трансформируют в общую популяцию первичных Т-клеток человека для получения первичных Т-клеток человека, экспрессирующих синтетический модульный полипептид CAR. Необязательно, если кодируемые элементы библиотеки синтетических модульных полипептидов CAR содержат один или более репортерных модулей, трансформированные Т-клетки могут быть отсортированы на основании экспрессии ими репортерного модуля (который указывает на экспрессию синтетического модульного полипептида CAR), чтобы выделить трансформированные клетки с одинаковыми уровнями экспрессии элементов библиотеки синтетических модульных полипептидов CAR. Указанные отсортированные трансформированные Т-клетки с одинаковыми уровнями экспрессии представляют собой объединенную библиотеку Т-клеток, экспрессирующих синтетические модульные полипептиды CAR.In one non-limiting embodiment, as shown in FIG. 23, a pooled library of nucleic acids encoding synthetic modular CAR polypeptides is transformed into a total population of primary human T cells to generate primary human T cells expressing the synthetic modular CAR polypeptide. Optionally, if the encoded elements of the synthetic modular CAR polypeptide library contain one or more reporter modules, the transformed T cells can be sorted based on their expression of the reporter module (which is indicative of the expression of the synthetic modular CAR polypeptide) to isolate transformed cells with similar element expression levels. libraries of synthetic modular CAR polypeptides. These sorted transformed T cells with the same levels of expression represent a pooled library of T cells expressing synthetic modular CAR polypeptides.
В некоторых случаях модулируют трансформационную эффективность нуклеиновых кислот и/или первичных Т-клеток человека, экспрессирующих синтетические модульные полипептиды CAR. Такая модуляция может быть выполнена по различным практическим причинам, например для контроля вероятности экспрессии каждого элемента библиотеки и/или для контроля вероятности экспрессии каждой клеткой не более чем одного элемента библиотеки. Указанная модуляция может быть достигнута любым удобным способом, включая, но не ограничиваясь ими, например, модулирование исходного количества нуклеиновой кислоты, кодирующей синтетический модульный полипептид, присутствующей во время трансформации, контроль исходного количества первичных Т-клеток, присутствующих во время трансформации, контроль соотношения кодирующей нуклеиновой кислоты и первичных Т-клеток во время трансформации и т.п. Следовательно, в некоторых случаях, эффективность трансформации модулируют так, что по существу каждая трансдуцированная Т-клетка экспрессирует один уникальный синтетический модульный полипептид CAR. В некоторых случаях готовые объединенные библиотеки клеток, экспрессирующих уникальные синтетические модульные полипептиды CAR, можно культивировать, размножать, сохранять и т.д. в соответствии с требованиями последующих количественных исследований.In some cases, modulate the transformational efficiency of nucleic acids and/or primary human T cells expressing synthetic modular CAR polypeptides. Such modulation may be performed for various practical reasons, such as to control the probability of expression of each element of the library and/or to control the probability of each cell expressing no more than one element of the library. Said modulation may be achieved by any convenient means, including, but not limited to, for example, modulating the initial amount of nucleic acid encoding the synthetic modular polypeptide present during transformation, controlling the initial amount of primary T cells present during transformation, controlling the ratio of coding nucleic acid and primary T cells during transformation, and the like. Therefore, in some cases, transformation efficiency is modulated such that essentially each transduced T cell expresses one unique synthetic modular CAR polypeptide. In some instances, pooled libraries of cells expressing unique synthetic modular CAR polypeptides can be cultured, expanded, stored, and so forth. in accordance with the requirements of subsequent quantitative studies.
Подходящие объединенные библиотеки, независимо от того, содержат они объединенные нуклеиновые кислоты, объединенные модульные полипептиды, объединенные трансдуцированные клетки и т.д., не ограничены нуклеиновыми кислотами, кодирующими синтетические модульные полипептиды CAR, синтетическими модульными полипептидами CAR или клетками (например, Т-клетками), экспрессирующими синтетические модульные полипептиды CAR. Любая библиотека нуклеиновых кислот, кодирующих модульные полипептиды, модульные полипептиды и/или соответствующие трансдуцированные клетки, экспрессирующие модульные полипептиды, полученные в соответствии со способами, описанными в настоящем документе, могут быть объединены аналогичным способом, чтобы получить объединенную библиотеку, которую можно применять, например, при скрининговых исследованиях.Suitable pooled libraries, whether containing pooled nucleic acids, pooled modular polypeptides, pooled transduced cells, etc., are not limited to nucleic acids encoding synthetic CAR modular polypeptides, synthetic CAR modular polypeptides, or cells (e.g., T cells). ) expressing synthetic modular CAR polypeptides. Any library of nucleic acids encoding modular polypeptides, modular polypeptides and/or corresponding transduced cells expressing modular polypeptides obtained in accordance with the methods described herein can be combined in a similar manner to obtain a combined library that can be used, for example, in screening studies.
Отдельные элементы объединенных библиотек, описанных в настоящем документе, могут быть положительно идентифицированы благодаря специфичной многозвенной нуклеиновой последовательности-штрихкоду, связанной с каждым членом библиотеки. Благодаря специфичной комбинаторной вложенной сборке, которая приводит к предсказуемой позиционной взаимосвязи между каждой кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностьюштрихкодом, идентичность и архитектура каждого синтетического модульного полипептида может быть установлена путем простого секвенирования соответствующей многозвенной нуклеиновой последовательности-штрихкода. Следовательно, в некоторых случаях, идентичность и/или архитектура отдельных элементов библиотеки синтетических модульных полипептидов может быть определена на основании данных о последовательности, связанной с областями нуклеиновых последовательностей-штрихкодов элементов библиотеки. Например, в некоторых случаях, все элементы и/или каждый отдельный элемент объединенной библиотеки, описанной в настоящем документе, могут быть определены, например, после конструирования библиотеки, после использования библиотеки в конкретном количественном исследовании и т.д.The individual elements of the pooled libraries described herein can be positively identified by the specific multi-merged nucleic acid barcode sequence associated with each member of the library. Due to the specific combinatorial nesting that results in a predictable positional relationship between each module coding sequence and its corresponding barcode nucleic acid sequence, the identity and architecture of each synthetic modular polypeptide can be established by simple sequencing of the corresponding multi-unit barcode nucleic sequence. Therefore, in some cases, the identity and/or architecture of individual elements of a library of synthetic modular polypeptides can be determined based on the sequence data associated with the nucleic acid barcode regions of the library elements. For example, in some cases, all elements and/or each individual element of the combined library described herein may be determined, for example, after the library has been constructed, after the library has been used in a particular assay, and so on.
Компартментализованные компоненты библиотеки.Compartmentalized Library Components.
Отдельные нуклеиновые кислоты-элементы, содержащие кодирующую область и область нуклеиновой последовательности-штрихкода, в некоторых случаях могут быть компартментализованы. Объединенные библиотеки и библиотеки с компартментализованными компонентами не обязательно должны быть взаимоисключающими, и, например, в некоторых случаях библиотека может быть объединена и может содержать компартментализованные компоненты в разные моменты времени, например библиотека может быть сконструирована, например, элементы библиотеки могут быть собраны, в виде пула, например, как при сборке в одном реакторе, и затем может быть впоследствии компартментализована, например, путем трансфекции элементов библиотеки нуклеиновых кислот в отдельные клетки или не- 36 041085 клеточные компартменты. В других случаях элементы библиотеки могут быть компартментализованы в ходе их сборки и затем объединены для последующих способов, включая, но не ограничиваясь ими, например, дальнейшую сборку или скрининг. В целом, нуклеиновые кислоты, кодирующие синтетические полипептиды, содержащие нуклеиновые последовательности-штрихкоды, собранные в соответствии со способами вложенной сборки и стратегиями клонирования, описанными в настоящем документе, собирают в виде пула и впоследствии могут подвергать компартментализации или могут оставить без изменений.Individual nucleic acid elements containing a coding region and a nucleic barcode sequence region can, in some cases, be compartmentalized. Bundled libraries and libraries with compartmentalized components need not be mutually exclusive, and for example, in some cases a library may be combined and may contain compartmentalized components at different times, for example, a library may be constructed, for example, library elements may be assembled, in the form the pool, for example, as when assembled in a single reactor, and then can be subsequently compartmentalized, for example, by transfection of nucleic acid library elements into single cells or non-cellular compartments. In other cases, library elements may be compartmentalized during their assembly and then combined for subsequent methods, including, but not limited to, for example, further assembly or screening. In general, nucleic acids encoding synthetic barcode nucleic acid sequence polypeptides assembled according to the nested assembly methods and cloning strategies described herein are pooled and may subsequently be compartmentalized or may be left unchanged.
Компартментализация собранных нуклеиновых кислот, кодирующих синтетические полипептиды, содержащих нуклеиновые последовательности-штрихкоды, может быть достигнута любым подходящим способом, обеспечивающим транскрипцию и трансляцию отдельных элементов библиотек нуклеиновых кислот так, что каждый элемент библиотеки нуклеиновых кислот остается связанным с продуктом, который он кодирует. В некоторых случаях, как описано более подробно ниже, компартментализация может быть достигнута путем создания клеточных библиотек, в которых отдельные клетки служат в качестве компартмента и обеспечивают трансляцию и транскрипцию элементов библиотек нуклеиновых кислот.Compartmentalization of assembled nucleic acids encoding synthetic polypeptides containing nucleic barcode sequences can be achieved by any suitable method that allows the transcription and translation of individual elements of the nucleic acid libraries so that each element of the nucleic acid library remains associated with the product that it encodes. In some cases, as described in more detail below, compartmentalization can be achieved by creating cell libraries in which individual cells serve as a compartment and provide translation and transcription of nucleic acid library elements.
В некоторых случаях компартментализация может быть достигнута посредством создания неклеточных библиотек, например библиотек на основе инкапсуляции. Бесклеточные библиотеки на основе инкапсуляции обычно содержат эмульсию двух или более несмешивающихся жидкостей, причем элементы библиотеки нуклеиновых кислот растворимы в первой жидкости, например в водной жидкости, такой как вода или водный буфер, и нерастворимы во второй жидкости, например в масле или другом органическом растворителе, так, что первая жидкость образует компартменты, например капли, содержащие отдельные элементы библиотеки. Эмульсия, содержащая библиотеку, может быть сконфигурирована так, что каждый компартмент содержит любое количество отдельных элементов библиотеки, включая, но не ограничиваясь этим, не более одного элемента в компартменте. Нуклеиновые кислотыэлементы из инкапсулированных библиотек могут быть транскрибированы (например, в условиях in vitro) и транслированы (например, в условиях in vitro) в условиях, в которых продукты транскрипции и трансляции остаются связанными, т.е. остаются в пределах компартмента, с отдельным элементом библиотеки нуклеиновых кислот, кодировавшим их. Любой удобный и подходящий способ получения инкапсулированной библиотеки полипептидов, кодируемых нуклеиновыми кислотами, может быть использован в способах, описанных в настоящем документе, включая, но не ограничиваясь ими, например, способы, описанные в Bernath et al. Anal Biochem. (2004) 325(1): 151-7; содержание которой полностью включено в настоящую заявку посредством ссылки.In some cases, compartmentalization can be achieved by creating non-cellular libraries, such as libraries based on encapsulation. Encapsulation-based cell-free libraries typically contain an emulsion of two or more immiscible liquids, wherein the nucleic acid library elements are soluble in a first liquid, such as an aqueous liquid, such as water or an aqueous buffer, and insoluble in a second liquid, such as an oil or other organic solvent, so that the first liquid forms compartments, such as drops, containing the individual elements of the library. The library-containing emulsion may be configured such that each compartment contains any number of individual library elements, including, but not limited to, no more than one element per compartment. Nucleic acid elements from encapsulated libraries can be transcribed (eg, in vitro conditions) and translated (eg, in vitro conditions) under conditions in which transcription and translation products remain bound, i. remain within the compartment, with a separate element of the nucleic acid library encoding them. Any convenient and suitable method for obtaining an encapsulated library of polypeptides encoded by nucleic acids can be used in the methods described herein, including, but not limited to, for example, the methods described in Bernath et al. Anal Biochem. (2004) 325(1): 151-7; the contents of which are incorporated herein by reference in their entirety.
После получения кодируемого продукта элемента библиотеки внутри компартмента, элемент библиотеки нуклеиновых кислот и кодируемый синтетический модульный полипептид могут быть, но необязательно, физически соединены. Например, в некоторых случаях, элемент библиотеки нуклеиновых кислот и кодируемый продукт могут быть соединены, например, с помощью любого удобного и подходящего способа, включая химическую связь или конъюгацию (т.е., путем получения ковалентной связи между элементом библиотеки нуклеиновых кислот и кодируемым синтетическим модульным полипептидом) или посредством молекулярного связывания (например, путем прямого связывания элемента библиотеки с кодируемым синтетическим модульным полипептидом или посредством непрямого связывания элемента библиотеки с кодируемым продуктом, которое опосредовано одним или более связывающими промежуточными продуктами (например, партнерами по связыванию, субстратами и т.д.). Любой удобный и подходящий способ соединения компартментализованных кодируемых полипептидов с элементами библиотеки нуклеиновых кислот можно применять в способах, описанных в настоящем документе, включая, но не ограничиваясь ими, использование, например, субстрата, содержащего присоединенный связывающий агент для эпитопной метки, который специфично связывается с эпитопной меткой, кодируемой элементом библиотеки нуклеиновых кислот, например, как описано в Griffiths & Tawfik. EMBO J (20030 22(1):24-35, содержание которой полностью включено в настоящую заявку посредством ссылки. В некоторых случаях после связывания элементы библиотек нуклеиновых кислот могут быть компартментализованы, например объединены, и затем количественно исследованы как объединенная библиотека.Upon receipt of the encoded product of a library element within a compartment, the nucleic acid library element and the encoded synthetic modular polypeptide may optionally be physically linked. For example, in some cases, the nucleic acid library element and the encoded product may be joined, for example, by any convenient and appropriate method, including chemical bonding or conjugation (i.e., by obtaining a covalent bond between the nucleic acid library element and the encoded synthetic modular polypeptide) or via molecular linkage (e.g., direct linkage of a library element to an encoded synthetic modular polypeptide, or indirect linkage of a library element to an encoded product that is mediated by one or more binding intermediates (e.g., binding partners, substrates, etc.). .) Any convenient and appropriate method for linking compartmentalized encoded polypeptides to nucleic acid library elements can be used in the methods described herein, including, but not limited to, using, for example, a substrate containing an attached An epitope tag binding agent that specifically binds to an epitope tag encoded by a nucleic acid library element, for example, as described in Griffiths & Tawfik. EMBO J (20030 22(1):24-35, the contents of which are incorporated herein by reference in their entirety. In some cases, once linked, elements of nucleic acid libraries can be compartmentalized, such as pooled, and then quantified as a pooled library.
В некоторых случаях элемент библиотеки нуклеиновых кислот и кодируемый продукт остаются связанными в достаточной степени, не будучи физически соединенными, например, путем компартментализации внутри компартмента, включая клеточные и неклеточные компартменты.In some cases, the nucleic acid library element and the encoded product remain sufficiently linked without being physically connected, for example, by compartmentalization within a compartment, including cellular and non-cellular compartments.
Компартментализация, как клеточная, так и неклеточная, обычно позволяет идентифицировать синтетический модульный полипептид или его часть, который коррелирует с детектированным фенотипом посредством секвенирования области нуклеиновой последовательности-штрихкода отдельного элемента библиотеки нуклеиновых кислот, кодирующего синтетический модульный полипептид, который остается связанным с синтетическим модульным полипептидом на основании их компартментализации или в результате физической связи, образующейся во время их компартментализации.Compartmentalization, both cellular and non-cellular, typically identifies a synthetic modular polypeptide, or a portion thereof, that correlates with a detected phenotype by sequencing the barcode region of a single element of a nucleic acid library encoding the synthetic modular polypeptide that remains linked to the synthetic modular polypeptide for on the basis of their compartmentalization or as a result of the physical connection formed during their compartmentalization.
Клеточные библиотеки.Cell Libraries.
Как описано более подробно выше, в настоящей заявке библиотеки включают клеточные библиотеки, в которых клетки библиотеки экспрессируют синтетические модульные полипептиды. ТрансформаAs described in more detail above, in the present application, libraries include cell libraries in which the cells of the library express synthetic modular polypeptides. Transform
- 37 041085 ция нуклеиновых кислот, кодирующих синтетические модульные полипептиды, может быть осуществлена любым удобным способом, включая, но не ограничиваясь ими, например, вирусную трансфекцию, электропорацию, липофекцию, бомбардировку, химическую трансформацию, использование подходящего для трансдукции носителя (например, подходящего для трансдукции белка-носителя) и т.п. В некоторых случаях клетка, в которую трансформируют нуклеиновую кислоту, кодирующую синтетический модульный полипептид, упоминается в настоящем документе как клетка-хозяин.- 37 041085 Nucleic acids encoding synthetic modular polypeptides can be carried out by any convenient method, including, but not limited to, for example, viral transfection, electroporation, lipofection, bombardment, chemical transformation, use of a carrier suitable for transduction (for example, suitable for carrier protein transduction), and the like. In some cases, the cell into which the nucleic acid encoding the synthetic modular polypeptide is transformed is referred to herein as the host cell.
Клетки-хозяева могут экспрессировать одну отдельную нуклеиновую кислоту, содержащую нуклеиновую последовательность-штрихкод, кодирующую уникальный синтетический модульный полипептид, или могут экспрессировать множество, включая две или более, отдельных нуклеиновых кислот, содержащих нуклеиновую последовательность-штрихкод, кодирующих уникальные синтетические модульные полипептиды. Следует понимать, что количество отдельных нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которое экспрессирует клетка-хозяин, можно контролировать, например, путем контроля частоты или вероятности доставки рассматриваемых нуклеиновых кислот в клетку-хозяина, например, путем модуляции параметров способа доставки. В некоторых случаях конечное количество отдельных нуклеиновых кислот, содержащих нуклеиновые последовательностиштрихкоды, которые кодируют уникальные синтетические модульные полипептиды, присутствующих в клетке-хозяине, может быть упомянуто как множественность инфекции (MOI) и может быть определено как соотношение нуклеиновых кислот и клеток-хозяев до или после доставки. Стандартные способы модуляции MOI, например, путем увеличения или уменьшения соотношения нуклеиновых кислот и клетокхозяев до доставки могут быть использованы для получения желательного конечного количества отдельных нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, кодирующих уникальные синтетические модульные полипептиды, на клетку-хозяина после доставки.Host cells may express a single nucleic acid containing a nucleic acid barcode sequence encoding a unique synthetic modular polypeptide, or may express multiple, including two or more, individual nucleic acids containing a nucleic acid barcode sequence encoding unique synthetic modular polypeptides. It should be understood that the amount of individual nucleic acids containing nucleic barcode sequences that the host cell expresses can be controlled, for example, by controlling the frequency or likelihood of delivery of the nucleic acids in question to the host cell, for example, by modulating delivery method parameters. In some cases, the final number of single nucleic acids containing barcode nucleic sequences that encode unique synthetic modular polypeptides present in a host cell may be referred to as the multiplicity of infection (MOI) and may be defined as the ratio of nucleic acids and host cells before or after delivery. Standard methods for modulating MOI, for example by increasing or decreasing the ratio of nucleic acids to host cells prior to delivery, can be used to produce the desired final amount of single nucleic acids containing barcode nucleic acid sequences encoding unique synthetic modular polypeptides per host cell after delivery.
Нуклеиновые кислоты, кодирующие синтетические модульные полипептиды, могут быть трансформированы в любую подходящую клетку-хозяина или клеточную линию, включая, например, прокариотические и эукариотические клетки. Выбор типа клетки-хозяина будет зависеть от ряда факторов, включая тип библиотеки синтетических модульных полипептидов, подлежащей скринингу, и конкретное скрининговое количественное исследование. В некоторых случаях клетка-хозяин может представлять собой прокариотическую клетку, включая, но не ограничиваясь ими, Acidobacteria, Actinobacteria, Aquificae, Bacteroidetes, Caldiserica, Chlamydiae, Chlorobi, Chloroflexi, Chrysiogenetes, Cyanobacteria, Deferribacteres, Deinococcus-Thermus, Dictyoglomi, Elusimicrobia, Fibrobacteres, Firmicutes, Fusobacteria, Gemmatimonadetes, Lentisphaerae, Nitrospirae, Planctomycetes, Proteobacteria, Spirochaetes, Synergistetes, Tenericutes, Thermodesulfobacteria, Thermotogae и Verrucomicrobia. Согласно некоторым вариантам реализации настоящего изобретения клетка-хозяин может представлять собой бактериальную клетку, например, Е. coli. В некоторых случаях может быть использован стандартный бактериальный штамм, включая, но не ограничиваясь ими, например, коммерчески доступные штаммы от таких поставщиков как Американская коллекция типовых культур (АТСС) (Манассас, Виргиния, США), Life Technologies, Inc. (Гранд-Айленд, Нью-Йорк, США) и т.п.Nucleic acids encoding synthetic modular polypeptides can be transformed into any suitable host cell or cell line, including, for example, prokaryotic and eukaryotic cells. The choice of host cell type will depend on a number of factors, including the type of synthetic modular polypeptide library to be screened and the particular screening assay. In some cases, the host cell may be a prokaryotic cell, including, but not limited to, Acidobacteria, Actinobacteria, Aquificae, Bacteroidetes, Caldiserica, Chlamydiae, Chlorobi, Chloroflexi, Chrysiogenetes, Cyanobacteria, Deferribacteres, Deinococcus-Thermus, Dictyoglomi, Elusimicrobia, Fibrobacteres , Firmicutes, Fusobacteria, Gemmatimonadetes, Lentisphaerae, Nitrospirae, Planctomycetes, Proteobacteria, Spirochaetes, Synergistetes, Tenericutes, Thermodesulfobacteria, Thermotogae and Verrucomicrobia. In some embodiments of the present invention, the host cell may be a bacterial cell, such as E. coli. In some cases, a standard bacterial strain may be used, including but not limited to, for example, commercially available strains from vendors such as the American Type Culture Collection (ATCC) (Manassas, VA, USA), Life Technologies, Inc. (Grand Island, New York, USA), etc.
Подходящие эукариотические клетки включают первичные клетки и культивируемые клетки, первоначально полученные из животного-хозяина, включая, но не ограничиваясь ими, например, млекопитающих (включая, например, человека, приматов, человекообразных обезьян, копытных, собачьих, кошачьих, кроликов, грызунов и т.д.), рептилий, земноводных (например, шпорцевых лягушек, саламандру, тритона и т.д.), рыб (например, данио и т.д.), птиц (например, курицу и т.д.), беспозвоночных (например, насекомых (например, плодовую муху и т.д.)), червей (например, нематод и т.д.), морских беспозвоночных (например, морского ежа и т.д.) и т.д.), дрожжи и т.п. Согласно некоторым вариантам реализации настоящего изобретения клетки могут представлять собой первичные клетки грызунов или культивированные клетки грызунов, полученные от мыши или крысы. В других вариантах реализации клетки могут представлять собой первичные клетки человека или культивированные клетки человека. Любая подходящая эукариотическая клетка может быть использована в качестве клетки-хозяина в зависимости от конкретной библиотеки, подлежащей скринингу, и конкретного скринингового количественного исследования, однако в некоторых случаях могут быть использованы подходящие линии эукариотических клеток, включая, но не ограничиваясь ими, например, коммерчески доступные от таких поставщиков как Американская коллекция типовых культур (АТСС) (Манассас, Виргиния, США), Life Technologies, Inc. (Гранд-Айленд, Нью-Йорк, США) и т.п.Suitable eukaryotic cells include primary cells and cultured cells originally derived from an animal host, including but not limited to, for example, mammals (including, for example, humans, primates, great apes, ungulates, canines, felines, rabbits, rodents, etc.). .d.), reptiles, amphibians (e.g. clawed frogs, salamander, newt, etc.), fish (e.g. zebrafish, etc.), birds (e.g. chicken, etc.), invertebrates ( e.g. insects (e.g. fruit fly etc.)), worms (e.g. nematodes etc.), marine invertebrates (e.g. sea urchin etc.) etc.), yeasts and etc. In some embodiments of the present invention, the cells may be primary rodent cells or cultured rodent cells derived from a mouse or rat. In other embodiments, the cells may be primary human cells or cultured human cells. Any suitable eukaryotic cell may be used as the host cell depending on the particular library to be screened and the particular screening assay, however, in some cases, suitable eukaryotic cell lines may be used, including but not limited to, for example, commercially available from suppliers such as the American Type Culture Collection (ATCC) (Manassas, VA, USA), Life Technologies, Inc. (Grand Island, New York, USA), etc.
В некоторых случаях клетки клеточной библиотеки представляют собой первичные клетки (например, первичные моноциты, первичные лимфоциты (например, первичные Т-клетки, первичные В-клетки, первичные NK-клетки и т.д.), первичные дендритные клетки и т.д.), первичные эндотелиальные клетки, первичные эпителиальные клетки, первичные фибробласты, первичные гемопоэтические стволовые клетки, первичные кератиноциты, первичные меланоциты, первичные мезенхимальные стволовые клетки, первичные преадипоциты, первичные мышечные клетки (например, первичные клетки гладкой мускулатуры, первичные клетки скелетной мускулатуры и т.д.) и т.д. В некоторых случаях клетки клеточной библиотеки представляют собой известные клеточные линии (например, клетки Jurkat и т.д.). В некоторых случаях клетки клеточной библиотеки представляют собой специфичные для пациента клетки (спе- 38 041085 цифичные для пациента иммунные клетки (например, первичные Т-клетки и т.д.), специфичные для пациента стволовые клетки (например, гемопоэтические стволовые клетки, мезенхимальные стволовые клетки, стволовые клетки, полученные из жировой ткани и т.д.), специфичные для пациента раковые клетки (например, опухолевые клетки, клетки рака крови и т.д.).In some cases, the cells of the cell library are primary cells (e.g., primary monocytes, primary lymphocytes (e.g., primary T cells, primary B cells, primary NK cells, etc.), primary dendritic cells, etc.). ), primary endothelial cells, primary epithelial cells, primary fibroblasts, primary hematopoietic stem cells, primary keratinocytes, primary melanocytes, primary mesenchymal stem cells, primary preadipocytes, primary muscle cells (e.g., primary smooth muscle cells, primary skeletal muscle cells, etc.). etc.), etc. In some cases, the cells of the cell library are known cell lines (eg, Jurkat cells, etc.). In some cases, cells in the cell library are patient-specific cells (patient-specific immune cells (e.g., primary T cells, etc.), patient-specific stem cells (e.g., hematopoietic stem cells, mesenchymal stem cells). cells, adipose-derived stem cells, etc.), patient-specific cancer cells (eg, tumor cells, blood cancer cells, etc.).
Подходящие клетки млекопитающих включают первичные клетки и иммортализованные клеточные линии. Подходящие линии клеток млекопитающих включают линии клеток человека, линии клеток приматов, отличных от человека, линии клеток грызунов (например, мыши, крысы) и т.п. Подходящие линии клеток млекопитающих включают, но не ограничиваются ими, клетки HeLa (например, Американская коллекция типовых культур (АТСС) № CCL-2), клетки СНО (например, АТСС № CRL9618, CCL61, CRL9096), клетки HEK293 (например, АТСС № CrL-1573), клетки Vero, клетки NIH 3T3 (например, АТСС № CRL-1658), клетки Huh-7, клетки BHK (например, АТСС № CCL10), клетки РС12 (АТСС № CRL1721), клетки COS, клетки COS-7 (АТСС № CRL1651), клетки RAT1, L-клетки мыши (АТСС № CCLI.3), клетки мезонефроса человека (HEK) (АТСС №CRL1573), линии клеток HLHepG2, Hut-78, Jurkat, HL-60, NK (например, NKL, NK92 и YTS) и т.п.Suitable mammalian cells include primary cells and immortalized cell lines. Suitable mammalian cell lines include human cell lines, non-human primate cell lines, rodent (eg, mouse, rat) cell lines, and the like. Suitable mammalian cell lines include, but are not limited to, HeLa cells (e.g., American Type Culture Collection (ATCC) No. CCL-2), CHO cells (e.g., ATCC No. CRL9618, CCL61, CRL9096), HEK293 cells (e.g., ATCC No. CrL-1573), Vero cells, NIH 3T3 cells (e.g., ATCC # CRL-1658), Huh-7 cells, BHK cells (e.g., ATCC # CCL10), PC12 cells (ATCC # CRL1721), COS cells, COS- 7 (ATCC # CRL1651), RAT1 cells, mouse L cells (ATCC # CCLI.3), human mesonephros (HEK) cells (ATCC # CRL1573), HLHepG2 cell lines, Hut-78, Jurkat, HL-60, NK ( e.g. NKL, NK92 and YTS), etc.
В некоторых случаях клетка не является клеткой иммортализованной клеточной линии, а, напротив, представляет собой клетку (например, первичную клетку), полученную от индивидуума. Например, в некоторых случаях, клетка представляет собой иммунную клетку, полученную от индивидуума. В качестве примера клетка представляет собой Т-лимфоцит, полученный от индивидуума. В качестве другого примера клетка представляет собой цитотоксическую клетку, полученную от индивидуума. В качестве другого примера клетка представляет собой стволовую клетку или клетку-предшественника, полученную от индивидуума.In some cases, the cell is not from an immortalized cell line, but instead is a cell (eg, a primary cell) derived from an individual. For example, in some cases, the cell is an immune cell obtained from an individual. As an example, the cell is a T-lymphocyte obtained from an individual. As another example, the cell is a cytotoxic cell obtained from an individual. As another example, the cell is a stem or progenitor cell derived from an individual.
После трансформации множества нуклеиновых кислот, кодирующих синтетические модульные полипептиды библиотеки, трансформированные клетки-хозяева могут быть отсортированы на основании экспрессии ими синтетических модульных полипептидов, например, для удаления клеток, которые не экспрессируют синтетические модульные полипептиды, из библиотеки, чтобы выделить только те клетки, которые экспрессируют синтетические модульные полипептиды на уровнях, превышающих определенный порог экспрессии, чтобы выделить только те клетки, которые экспрессируют синтетические модульные полипептиды на уровнях, ниже определенного порога экспрессии, чтобы выделить только те клетки, которые экспрессируют синтетические модульные полипептиды в определенном диапазоне уровней экспрессии, и т.д. В некоторых случаях сортировка трансформированных клеток на основании уровня экспрессии может быть выполнена, чтобы выделить только те клетки в библиотеке, которые имеют одинаковый уровень экспрессии, причем одинаковый уровень экспрессии может варьироваться в зависимости от конкретных способов применения и в некоторых случаях может быть определен как уровень экспрессии в пределах определенного диапазона, который выше и ниже среднего уровня экспрессии популяции.After transforming a plurality of nucleic acids encoding the synthetic modular polypeptides of the library, the transformed host cells can be sorted based on their expression of the synthetic modular polypeptides, for example, to remove cells that do not express the synthetic modular polypeptides from the library to isolate only those cells that expressing synthetic modular polypeptides at levels above a certain expression threshold, to isolate only those cells that express synthetic modular polypeptides at levels below a certain expression threshold, to isolate only those cells that express synthetic modular polypeptides in a certain range of expression levels, and t .d. In some cases, sorting of transformed cells based on expression level can be performed to isolate only those cells in the library that have the same level of expression, the same level of expression may vary depending on specific applications and in some cases can be defined as the level of expression within a certain range, which is above and below the average expression level of the population.
Согласно некоторым вариантам реализации настоящего изобретения сортировка трансформированных клеток на основании уровня экспрессии ими элементов библиотеки, например сортировка клеток, экспрессирующих или имеющих приблизительно равный уровень экспрессии элементов библиотеки, позволяет улучшить оценку влияния элемента библиотеки и/или модулей, входящих в ее состав. Например, при выделении только тех клеток, которые экспрессируют элементы библиотеки в определенном диапазоне уровней, идентификация элементов библиотеки, влияющих на конкретный фенотип, будет основана на фактической функции элементов библиотеки и тех модулей, которые входят в ее состав, а не на эффективности экспрессии конкретного элемента библиотеки. Согласно некоторым вариантам реализации настоящего изобретения, например, при выполнении полуколичественного исследования частоты экспрессии отдельных элементов библиотеки и/или ее модулей, сортировка клеток, экспрессирующих элементы библиотеки в пределах заранее определенного диапазона уровней, обеспечивает более точное количественное исследование и количественное определение элементов библиотеки и/или модулей на основании их влияния на определенный фенотип, а не на основании характерного для них относительного уровня экспрессии.In some embodiments of the present invention, sorting transformed cells based on their level of expression of library elements, such as sorting cells that express or have approximately the same level of expression of library elements, improves the assessment of the influence of the library element and / or modules included in it. For example, by isolating only those cells that express library elements in a certain range of levels, the identification of library elements that affect a particular phenotype will be based on the actual function of the library elements and those modules that are part of it, and not on the efficiency of expression of a particular element. libraries. According to some embodiments of the present invention, for example, when performing a semi-quantitative study of the frequency of expression of individual elements of the library and/or its modules, sorting cells expressing library elements within a predetermined range of levels provides more accurate quantification and quantification of library elements and/or modules on the basis of their influence on a certain phenotype, and not on the basis of their relative level of expression.
Помимо этого сортировка позволяет идентифицировать элементы библиотеки и ее модули, функционирование которых создает или влияет на конкретный фенотип при экспрессии в пределах определенного диапазона уровней экспрессии или выше или ниже определенного порога, включая, например, низкий уровень экспрессии или высокий уровень экспрессии.In addition, sorting allows the identification of library elements and modules whose functioning creates or influences a particular phenotype when expressed within a certain range of expression levels or above or below a certain threshold, including, for example, low expression level or high expression level.
Нормирование библиотеки.Library normalization.
Библиотеки согласно настоящему изобретению могут быть нормированы или могут не быть нормированы в зависимости от ситуации, в которой создается библиотека, и/или предполагаемого окончательного способа применения библиотеки. В настоящей заявке под термином нормированный, применительно к описанным библиотекам, подразумевают, что относительные количества каждого элемента библиотеки корректируют, чтобы, по меньшей мере, уравнять их количества, по сравнению с относительными количествами каждого элемента библиотеки до корректировки. В некоторых случаях нормирование библиотеки приводит к тому, что библиотека имеет меньший диапазон между количеством наиболее представленных элементов библиотеки и количеством наименее представленных элементов биб- 39 041085 лиотеки. В некоторых случаях нормирование приводит к увеличению количества наименее представленного элемента(ов) библиотеки. В некоторых случаях нормирование приводит к уменьшению количества наиболее представленного элемента(ов) библиотеки.Libraries of the present invention may or may not be standardized depending on the situation in which the library is created and/or the intended final use of the library. In this application, the term normalized, in relation to the libraries described, means that the relative amounts of each element of the library are adjusted to at least equalize their amounts, compared with the relative amounts of each element of the library before adjustment. In some cases, library normalization results in the library having a smaller range between the number of the most represented library items and the number of the least represented library items. In some cases, normalization leads to an increase in the number of the least represented element(s) of the library. In some cases, normalization results in a reduction in the number of the most represented element(s) of the library.
В некоторых случаях нормирование библиотеки может включать количественную оценку всех или большинства или репрезентативной выборки (или всей или большей части репрезентативной выборки) элементов библиотеки для определения относительного количества каждого элемента библиотеки в библиотеке. После количественной оценки корректировку проводят на основании количественной оценки, чтобы уравнять относительное присутствие каждого элемента библиотеки в библиотеке. В зависимости от ситуации указанная корректировка может быть выполнена непосредственно в уже полученной библиотеке так, что библиотека подвергается непосредственному нормированию. В другом варианте корректировка может быть выполнена как часть способа получения библиотеки так, что следующая полученная библиотека будет нормирована.In some cases, library normalization may involve quantifying all or most or a representative sample (or all or most of a representative sample) of library items to determine the relative amount of each library item in the library. After quantification, an adjustment is made based on the quantification to equalize the relative presence of each library element in the library. Depending on the situation, said adjustment can be performed directly on the library already obtained, so that the library is subjected to direct normalization. In another embodiment, the adjustment may be performed as part of the library acquisition process such that the next library obtained will be normalized.
Любая библиотека согласно настоящему изобретению может быть нормирована, включая, но не ограничиваясь ими, например, библиотеки нуклеиновых кислот, библиотеки полипептидов, неклеточные инкапсулированные библиотеки, клеточные библиотеки и т.д., и в зависимости от библиотеки, которую нормируют, могут быть использованы различные способы. Например, в зависимости от типа библиотеки, которую нормируют, могут быть использованы различные способы количественной оценки относительных количеств элементов библиотеки. Различные способы количественного определения элементов библиотеки нуклеиновых кислот, которые могут быть использованы, включают, но не ограничиваются ими, например, количественное секвенирование (например, секвенирование следующего поколения), количественную ПЦР, количественную гибридизацию (например, микрочип) и т.п. Могут быть использованы различные способы количественного определения элементов полипептидной библиотеки, включая, но не ограничиваясь ими, например, количественную масс-спектрометрию, ИФА и т.п. Могут быть использованы различные способы количественного определения элементов клеточной библиотеки, включая, но не ограничиваясь ими, проточную цитометрию, иммуногистохимическое исследование, количественное секвенирование (например, секвенирование следующего поколения), количественную ПЦР, количественную гибридизацию (например, микрочип) и т.п.Any library of the present invention may be normalized, including but not limited to, for example, nucleic acid libraries, polypeptide libraries, non-cellular encapsulated libraries, cell libraries, etc., and depending on the library being normalized, various ways. For example, depending on the type of library being normalized, different methods can be used to quantify the relative amounts of library elements. Various methods for quantifying elements of a nucleic acid library that can be used include, but are not limited to, e.g., quantitative sequencing (e.g., next generation sequencing), quantitative PCR, quantitative hybridization (e.g., microarray), and the like. Various methods can be used to quantify elements of a polypeptide library, including but not limited to, for example, quantitative mass spectrometry, ELISA, and the like. Various methods for quantifying cell library elements can be used, including, but not limited to, flow cytometry, immunohistochemistry, quantitative sequencing (e.g., next generation sequencing), quantitative PCR, quantitative hybridization (e.g., microarray), and the like.
В некоторых случаях, когда элементы библиотеки количественно определены, может быть рассчитана корректировка(и), необходимая для нормирования. Любой удобный и подходящий способ расчета нормирования может быть использован в зависимости от типа библиотеки и/или размера библиотеки. В некоторых случаях может быть использовано линейное уравнение, включая, но не ограничиваясь им, линейное уравнение, представленное на фиг. 28.In some cases, when library elements are quantified, the adjustment(s) required for normalization can be calculated. Any convenient and appropriate method for calculating normalization may be used depending on the type of library and/or the size of the library. In some cases, a linear equation may be used, including, but not limited to, the linear equation shown in FIG. 28.
В некоторых случаях, когда нормирование рассчитано для каждого элемента библиотеки, библиотека может быть скорректирована. Могут быть использованы различные способы непосредственной корректировки библиотеки. Например, в некоторых случаях, клеточная библиотека может быть нормирована с использованием FACS для сортировки равного количества клеток, представляющих каждый элемент библиотеки, в пул или в индивидуально доступные компартменты. В некоторых случаях, когда библиотека уже компартментализована, библиотека может быть нормирована путем корректировки объема каждого компартмента, включая, например, те случаи, когда различные концентрации элементов библиотеки в каждом компартменте нормируют путем добавления определенного объема жидкости в каждый компартмент, достаточного для выравнивания концентраций.In some cases, when the normalization is calculated for each element of the library, the library can be adjusted. Various methods of directly updating the library can be used. For example, in some cases, a cell library may be normalized using FACS to sort an equal number of cells representing each element of the library into a pool or individually accessible compartments. In some cases where the library is already compartmentalized, the library can be normalized by adjusting the volume of each compartment, including, for example, those cases where different concentrations of library elements in each compartment are normalized by adding a certain volume of liquid to each compartment, sufficient to equalize the concentrations.
В некоторых случаях может быть выполнено нормирование объединенной библиотеки нуклеиновых кислот. Объединенные библиотеки нуклеиновых кислот могут быть нормированы по разным причинам. В одном варианте реализации объединенная библиотека нуклеиновых кислот может быть нормирована для компенсации избыточной или недостаточной представленности отдельных элементов библиотеки в библиотеке, например, вследствие более или менее эффективного включения отдельных модулей нуклеиновых кислот в элементы библиотеки во время комбинаторной сборки.In some cases, normalization of the pooled nucleic acid library may be performed. Pooled nucleic acid libraries can be normalized for a variety of reasons. In one embodiment, a pooled nucleic acid library may be normalized to compensate for over- or under-representation of individual library elements in the library, for example, due to more or less efficient incorporation of individual nucleic acid modules into library elements during combinatorial assembly.
В некоторых случаях элементы библиотеки нуклеиновых кислот и/или модули нуклеиновых кислот, составляющие элементы библиотеки, могут быть количественно определены (например, путем количественного секвенирования). После такой количественной оценки рассчитывается корректировка каждого элемента, необходимая для нормирования. В одном варианте реализации рассчитанная корректировка может быть применена к следующей комбинаторной сборке библиотеки, например, количество каждого модуля нуклеиновой кислоты, используемое для сборки библиотеки нуклеиновых кислот, может быть скорректировано на основании относительной представленности этого модуля в количественно оцененной библиотеке. Следовательно, готовая комбинаторная библиотека будет нормирована путем корректировки начального количества модулей нуклеиновых кислот перед следующей сборкой библиотеки. Соответственно, в некоторых случаях нормирование библиотеки, описанной в настоящем документе, может включать сборку библиотеки с последующей количественной оценкой собранной библиотеки и повторной сборкой нормированного варианта библиотеки, который основан на количественной оценке.In some instances, the nucleic acid library elements and/or nucleic acid modules that make up the library elements can be quantified (eg, by quantitative sequencing). After such a quantitative assessment, the adjustment of each element necessary for normalization is calculated. In one embodiment, the calculated adjustment may be applied to the next combinatorial assembly of the library, for example, the amount of each nucleic acid module used to assemble the nucleic acid library may be adjusted based on the relative abundance of that module in the quantified library. Therefore, the completed combinatorial library will be normalized by adjusting the initial number of nucleic acid modules before the next assembly of the library. Accordingly, in some instances, normalizing a library described herein may involve assembling the library, followed by quantification of the assembled library, and reassembly of a normalized version of the library that is based on the quantification.
Способы скрининга.Screening methods.
В настоящем изобретении предложены способы скрининга библиотек синтетических модульных полипептидов, включая, но не ограничиваясь ими, например, способы скрининга в условиях in vitro иThe present invention provides methods for screening libraries of synthetic modular polypeptides, including, but not limited to, for example, in vitro screening methods and
- 40 041085 способы скрининга в условиях in vivo. Под скринингом in vivo обычно подразумевают, что библиотеку, содержащую множество уникальных синтетических модульных полипептидов, количественно исследуют в биологической среде живого организма. Живые организмы, которые можно количественно исследовать в условиях in vivo в соответствии со способами, описанными в настоящем документе, включают одноклеточные и многоклеточные организмы.- 40 041085 in vivo screening methods. By in vivo screening is usually meant that a library containing a plurality of unique synthetic modular polypeptides is quantitatively assayed in the biological environment of a living organism. Living organisms that can be quantitatively tested under in vivo conditions in accordance with the methods described herein include unicellular and multicellular organisms.
Скрининг одноклеточного организма в условиях in vivo обычно включает приведение одноклеточного организма в контакт с библиотекой синтетических модульных полипептидов, причем указанная библиотека синтетических модульных полипептидов может представлять собой библиотеку полипептидов или библиотеку клеток, экспрессирующих синтетические модульные полипептиды, и детектирование фенотипа в одноклеточном организме. В других случаях скрининг одноклеточного организма в условиях in vivo может включать приведение одноклеточного организма или множества одноклеточных организмов в контакт с библиотекой нуклеиновых кислот, кодирующих синтетические модульные полипептиды, в условиях, достаточных для экспрессии кодируемых синтетических модульных полипептидов одноклеточными организмами.In vivo screening of a single celled organism typically involves contacting the single celled organism with a library of synthetic modular polypeptides, said library of synthetic modular polypeptides may be a library of polypeptides or a library of cells expressing synthetic modular polypeptides, and detecting the phenotype in the single celled organism. In other instances, in vivo screening of a single-celled organism may involve bringing the single-celled organism, or a plurality of single-celled organisms, into contact with a library of nucleic acids encoding synthetic modular polypeptides under conditions sufficient to allow expression of the encoded synthetic modular polypeptides by single-celled organisms.
Скрининг многоклеточного организма в условиях in vivo обычно включает приведение многоклеточного организма в контакт с библиотекой синтетических модульных полипептидов, причем указанная библиотека синтетических модульных полипептидов может представлять собой библиотеку полипептидов или библиотеку клеток, экспрессирующих синтетические модульные полипептиды, и детектирование фенотипа в многоклеточном организме. В других случаях скрининг многоклеточного организма в условиях in vivo может включать приведение многоклеточного организма или множества многоклеточных организмов в контакт с библиотекой нуклеиновых кислот, кодирующих синтетические модульные полипептиды, в условиях, достаточных для экспрессии кодируемых синтетических модульных полипептидов многоклеточным организмом(ами). Любой подходящий многоклеточный организм может быть использован при скрининге в условиях in vivo библиотеки, описанной в настоящем документе, в зависимости от конкретной библиотеки, подлежащей скринингу, и конкретного используемого количественного исследования в условиях in vivo, причем конкретные многоклеточные организмы включают, но не ограничиваются ими, например, млекопитающих (например, мышей, крыс и т.д.).In vivo screening of a multicellular organism typically involves contacting the multicellular organism with a library of synthetic modular polypeptides, said library of synthetic modular polypeptides may be a library of polypeptides or a library of cells expressing synthetic modular polypeptides, and detecting the phenotype in the multicellular organism. In other instances, in vivo screening of a multicellular organism may involve bringing the multicellular organism or a plurality of multicellular organisms into contact with a library of nucleic acids encoding synthetic modular polypeptides under conditions sufficient for expression of the encoded synthetic modular polypeptides by the multicellular organism(s). Any suitable multicellular organism may be used in the in vivo screening of the library described herein, depending on the particular library to be screened and the particular in vivo assay used, with particular multicellular organisms including, but not limited to, for example, mammals (eg, mice, rats, etc.).
Под термином скрининг в условиях in vitro обычно подразумевают, что библиотеку, содержащую множество уникальных синтетических модульных полипептидов, количественно исследуют вне нормальной биологической среды, например полипептидных модулей библиотеки, биологического материала, используемого при скрининге, или фенотипа, который подвергают скринингу. Например, в некоторых случаях, скрининг в условиях in vitro может быть выполнен с использованием искусственной или синтетической экспериментальной среды, включая, но не ограничиваясь ими, например, выделенный образец, выделенную клетку, культуру клеток, выделенную или иссеченную ткань, определенный образец, определенную среду, искусственную ткань, искусственный орган, клеточный экстракт, тканевой экстракт, множество образцов и т.д. Скрининг в условиях in vitro может быть выполнен в любом удобном и подходящем сосуде, включая, но не ограничиваясь ими, например, реакционный сосуд, реакционную камеру, пробирку, флакон, планшет, колбу, чашку, предметное стекло и т.п.The term in vitro screening generally means that a library containing a plurality of unique synthetic modular polypeptides is quantified outside the normal biological environment, such as the library polypeptide modules, the biological material used in the screening, or the phenotype being screened. For example, in some cases, in vitro screening can be performed using an artificial or synthetic experimental environment, including, but not limited to, for example, an isolated sample, an isolated cell, a cell culture, an isolated or excised tissue, a specific sample, a specific medium. , artificial tissue, artificial organ, cell extract, tissue extract, many samples, etc. In vitro screening can be performed in any convenient and suitable vessel, including but not limited to, for example, a reaction vessel, a reaction chamber, a test tube, a vial, a plate, a flask, a dish, a glass slide, and the like.
Скрининг образца в условиях in vitro, включая клеточный образец или неклеточный образец, обычно включает приведение образца в контакт с библиотекой синтетических модульных полипептидов, причем указанная библиотека синтетических модульных полипептидов может представлять собой библиотеку полипептидов или библиотеку клеток, экспрессирующих синтетические модульные полипептиды, и детектирование клеточного фенотипа или другой реакции или молекулярного фенотипа. Любой подходящий образец может быть использован при скрининге библиотеки, описанной в настоящем документе, в условиях in vitro в зависимости от конкретной библиотеки, подлежащей скринингу, и конкретного используемого количественного исследования в условиях in vitro, причем конкретные образцы включают, но не ограничиваются ими, например, биологические образцы, клеточные образцы, образцы полипептидов, образцы нуклеиновых кислот, химические образцы и т.п.In vitro screening of a sample, including a cellular sample or a non-cellular sample, typically involves contacting the sample with a library of synthetic modular polypeptides, said library of synthetic modular polypeptides may be a library of polypeptides or a library of cells expressing synthetic modular polypeptides, and detecting the cellular phenotype or another reaction or molecular phenotype. Any suitable sample can be used in in vitro screening of the library described herein depending on the particular library to be screened and the particular in vitro assay used, and specific samples include, but are not limited to, for example, biological samples, cellular samples, polypeptide samples, nucleic acid samples, chemical samples, and the like.
В некоторых случаях бесклеточные библиотеки синтетических модульных полипептидов могут быть подвергнуты скринингу в условиях in vitro. Например, компартментализованную библиотеку синтетических модульных полипептидов можно подвергнуть скринингу для определения фенотипа путем приведения компартментализованной библиотеки синтетических модульных полипептидов в контакт с одним или более агентами, с которыми, согласно прогнозам, реагируют отдельные элементы библиотеки. Любые подходящие способы скрининга бесклеточных библиотек полипептидов, как инкапсулированных, так и объединенных, можно применять в способах, описанных в настоящем документе, включая, но не ограничиваясь ими, например, детектирование методом проточной цитометрии или детектирование фенотипа методом флуоресцентно-активированной сортировки клеток в бесклеточных количественных исследованиях, основанных на инкапсуляции, например, описанных в Griffiths & Tawfik. EMBO J (2003) 22(1):24-35 и Bernath et al. Anal Biochem (2004) 325(1): 151-7; содержание которых полностью включено в настоящую заявку посредством ссылки.In some cases, cell-free libraries of synthetic modular polypeptides can be screened in vitro. For example, a compartmentalized library of synthetic modular polypeptides can be screened for phenotype by contacting the compartmentalized library of synthetic modular polypeptides with one or more agents with which certain members of the library are predicted to react. Any suitable methods for screening cell-free libraries of polypeptides, whether encapsulated or pooled, can be used in the methods described herein, including, but not limited to, for example, flow cytometry detection or phenotype detection by fluorescence-activated cell sorting in cell-free quantitative assays. encapsulation based studies such as those described in Griffiths & Tawfik. EMBO J (2003) 22(1):24-35 and Bernath et al. Anal Biochem (2004) 325(1): 151-7; the contents of which are incorporated herein by reference in their entirety.
Фенотипы и способы идентификации.Phenotypes and methods of identification.
Способы скрининга, в условиях in vivo или в условиях in vitro, обычно включают детектированиеScreening methods, either in vivo or in vitro, typically include detection
- 41 041085 фенотипа и идентификацию одного или более элементов библиотеки, связанных с фенотипом. В настоящей заявке термин фенотип обычно относится к характеристике молекулы, клетки, ткани, органа или организма, которую детектируют в конкретном количественном исследовании, и, следовательно, может включать, но не ограничивается ими, например, молекулярные фенотипы, клеточные фенотипы, фенотипы организма, фенотипы тканей, фенотипы органов, фенотипы организма и т.д. Фенотип, детектируемый в конкретном количественном исследовании, может представлять собой заранее определенный фенотип, например известный или ожидаемый фенотип (например, включая известный или ожидаемый уровень определенной характеристики, присутствие или отсутствие известной или ожидаемой характеристики уровня и т.д.) или может быть идентифицирован во время количественного исследования, например, впервые детектируемый или ранее неопределенный фенотип (например, включая впервые детектируемый или ранее неопределенный уровень конкретной характеристики, присутствие или отсутствие впервые детектируемой или ранее неопределенной характеристики и т.д.). Любой подходящий количественный способ исследования для детектирования фенотипа, относящегося к библиотеке синтетических модульных полипептидов, описанной в настоящем документе, можно применять при скрининге указанных библиотек.- 41 041085 phenotype and identification of one or more elements of the library associated with the phenotype. As used herein, the term phenotype generally refers to the characteristic of a molecule, cell, tissue, organ, or organism that is detected in a particular assay, and therefore may include, but is not limited to, e.g., molecular phenotypes, cellular phenotypes, organism phenotypes, phenotypes tissues, organ phenotypes, organism phenotypes, etc. The phenotype detected in a particular assay may be a predetermined phenotype, such as a known or expected phenotype (eg, including a known or expected level of a certain characteristic, the presence or absence of a known or expected level characteristic, etc.) or may be identified in time of assay, eg, a newly detected or previously undetermined phenotype (eg, including a newly detected or previously undetermined level of a particular characteristic, the presence or absence of a first-detected or previously undetermined characteristic, etc.). Any suitable assay method for detecting the phenotype associated with the library of synthetic modular polypeptides described herein can be used in screening said libraries.
Скрининг библиотеки синтетических модульных полипептидов или нуклеиновых кислот, кодирующих библиотеку синтетических модульных полипептидов, позволяет идентифицировать полипептиды и/или их модули, которые эффективно обеспечивают желательный фенотип. Соответственно, в область настоящего изобретения в целом включены полипептиды, идентифицированные путем скрининга описанных в настоящем документе библиотек.Screening of a library of synthetic modular polypeptides or nucleic acids encoding a library of synthetic modular polypeptides allows the identification of polypeptides and/or modules thereof that effectively provide the desired phenotype. Accordingly, polypeptides identified by screening the libraries described herein are generally included within the scope of the present invention.
В некоторых случаях клеточный фенотип детектируют после приведения популяции клеток в контакт с библиотекой, описанной в настоящем документе. Клеточные фенотипы могут включать, но не ограничиваются ими, например, поведение клеток (включая, но не ограничиваясь ими, жизнеспособность клеток, пролиферацию клеток, активацию клеток, морфологию клеток, миграцию клеток, адгезию клеток, дифференцировку клеток, плюрипотентность клеток и т.д.), клеточную экспрессию (включая, но не ограничиваясь ими, экспрессию гена, экспрессию белка, экспрессию некодирующей РНК, активацию гена, репрессию гена и т.д.), экспрессию репортера (включая, но не ограничиваясь ими, например, экспрессию трансгенного репортера, экспрессию маркера) и т.п.In some cases, a cell phenotype is detected after a population of cells is brought into contact with the library described herein. Cellular phenotypes may include, but are not limited to, for example, cell behavior (including but not limited to cell viability, cell proliferation, cell activation, cell morphology, cell migration, cell adhesion, cell differentiation, cell pluripotency, etc. ), cellular expression (including, but not limited to, gene expression, protein expression, non-coding RNA expression, gene activation, gene repression, etc.), reporter expression (including, but not limited to, e.g., transgenic reporter expression, marker expression), and the like.
В некоторых случаях фенотип ткани, органа или организма детектируют после приведения ткани, органа или организма в контакт с библиотекой, описанной в настоящем документе. Фенотипы ткани включают, но не ограничиваются ими, например, жизнеспособность ткани, морфологию ткани, физические характеристики ткани (включая, но не ограничиваясь ими, защитную функцию, механическую прочность, эластичность и т.д.), экспрессию в ткани (включая, но не ограничиваясь ими, например, экспрессию тканевого гена, экспрессию тканевого белка и т.д.), экспрессию репортера в ткани (включая, но не ограничиваясь ими, например, экспрессию трансгенного репортера, экспрессию маркера) и т.п. Фенотипы органа включают, но не ограничиваются ими, например, внешний вид органа, жизнеспособность органа, морфологию органа, функцию органа (включая, но не ограничиваясь ими, производство биомолекулы (например, фермента, метаболита, белка и т.д.), фильтрацию, механическую функцию и т.д.). Фенотипы организма включают, но не ограничиваются ими, например, внешний вид организма, жизнеспособность организма (например, продолжительность жизни), физиологию организма, фертильность организма/плодовитость, поведение организма и т.д.In some cases, the phenotype of a tissue, organ, or organism is detected after the tissue, organ, or organism is brought into contact with the library described herein. Tissue phenotypes include, but are not limited to, for example, tissue viability, tissue morphology, tissue physical characteristics (including, but not limited to, protective function, mechanical strength, elasticity, etc.), tissue expression (including, but not limited to limited to, e.g., tissue gene expression, tissue protein expression, etc.), reporter expression in tissue (including, but not limited to, e.g., transgenic reporter expression, marker expression), and the like. Phenotypes of an organ include, but are not limited to, for example, organ appearance, organ viability, organ morphology, organ function (including, but not limited to, production of a biomolecule (e.g., enzyme, metabolite, protein, etc.), filtration, mechanical function, etc.). The phenotypes of an organism include, but are not limited to, for example, the appearance of the organism, the viability of the organism (eg, lifespan), the physiology of the organism, the fertility of the organism/fertility, the behavior of the organism, and so on.
В некоторых случаях фенотип может быть количественно исследован в отношении патологического состояния, причем указанное патологическое состояние может представлять собой моделируемое патологическое состояние (например, клетку, ткань или организм, который был изменен или обработан, чтобы проявлять характеристики конкретного заболевания) или может представлять собой клиническое патологическое состояние (например, организм, проявляющий характеристики заболевания или у которого диагностировано заболевание, или клетки или ткани, полученные из него). Фенотипы, связанные с заболеванием, могут быть количественно исследованы на любом удобном уровне, включая, но не ограничиваясь ими, например, клеточный уровень, тканевой уровень, органный уровень, уровень организма. В некоторых случаях количественно исследованные фенотипы заболевания могут представлять собой фенотипы самого возбудителя заболевания, включая, но не ограничиваясь ими, например, фенотипы опухолей, фенотипы раковых клеток, фенотипы аутоиммунных клеток, фенотипы инфекционных агентов (бактериальных, вирусных и т.д.) и т.д. В других случаях количественно исследованные фенотипы заболевания могут представлять собой фенотипы клетки, ткани или организма, пораженного указанным заболеванием, или связанные с моделируемым заболеванием, которые обеспечивают информацию о присутствии и/или прогрессировании заболевания, включая, но не ограничиваясь ими, например, активацию клеток (например, активацию иммунных клеток), ответ на заболевание (например, иммунный ответ), биомаркеры, количество клеток, физиологические реакции организма, клинические исходы и т.д.In some instances, a phenotype may be quantified in relation to a pathological condition, wherein said pathological condition may be a simulated pathological condition (e.g., a cell, tissue, or organism that has been altered or manipulated to exhibit characteristics of a particular disease) or may be a clinical pathological condition. a condition (eg, an organism exhibiting the characteristics of a disease or diagnosed with a disease, or cells or tissues derived therefrom). Disease-associated phenotypes can be quantified at any convenient level, including, but not limited to, eg, cellular level, tissue level, organ level, organism level. In some cases, the quantified disease phenotypes may be those of the pathogen itself, including but not limited to, for example, tumor phenotypes, cancer cell phenotypes, autoimmune cell phenotypes, infectious agent phenotypes (bacterial, viral, etc.), etc. .d. In other cases, quantified disease phenotypes may be phenotypes of a cell, tissue, or organism affected by said disease, or associated with the disease being modeled, that provide information about the presence and/or progression of the disease, including, but not limited to, for example, cell activation ( e.g. immune cell activation), disease response (e.g. immune response), biomarkers, cell counts, body responses, clinical outcomes, etc.
В некоторых случаях оценка фенотипа может быть проведена на уровне популяции, например может быть проведена оценка популяции клеток, оценка популяции организмов и т.д. В некоторых случаях при популяционной оценке фенотипа действие конкретного элемента библиотеки на присутствие или отсутствие популяционного фенотипа может быть измерено. Например, можно оценить действие кон- 42 041085 кретного элемента библиотеки на клеточный фенотип популяции клеток. В других случаях можно оценить действие конкретного элемента библиотеки на фенотип организмов в популяции организмов.In some cases, the phenotype assessment may be carried out at the population level, for example, the assessment of a population of cells, an assessment of a population of organisms, etc. can be carried out. In some cases, in a population phenotype assessment, the effect of a particular library element on the presence or absence of a population phenotype can be measured. For example, the effect of a particular library element on the cellular phenotype of a population of cells can be assessed. In other cases, the effect of a particular library element on the phenotype of organisms in a population of organisms can be assessed.
Согласно некоторым вариантам реализации настоящего изобретения фенотип оценивают в ответ на применяемый стимул, причем применение стимула включает, но не ограничивается перечисленными, например, приведение клеток в контакт со стимулом, приведение ткани в контакт со стимулом, приведение органа в контакт со стимулом, приведение организма в контакт со стимулом и т.д. По существу исследуемый образец или исследуемый субъект может быть приведен в контакт со стимулом в условиях in vitro или in vivo в зависимости от используемого количественного способа исследования, в зависимости от стимула и в зависимости от конкретной библиотеки, которую подвергают скринингу. Различные стимулы могут быть использованы по отдельности или в комбинации. Стимул может представлять собой свободный стимул (например, растворимый стимул, свободный лиганд и т.д.), связанный стимул (например, связанный с твердым носителем), экспрессируемый клетками стимул (например, экспрессированная костимулирующая молекула, экспрессированный антиген, экспрессированный клеточный лиганд и т.д.) и т.п.According to some embodiments of the present invention, the phenotype is assessed in response to the applied stimulus, and the application of the stimulus includes, but is not limited to, for example, bringing cells into contact with a stimulus, bringing a tissue into contact with a stimulus, bringing an organ into contact with a stimulus, bringing an organism into contact with a stimulus, etc. As such, the test sample or test subject may be contacted with a stimulus under in vitro or in vivo conditions, depending on the quantitative assay method used, depending on the stimulus, and depending on the particular library being screened. Various stimuli may be used singly or in combination. The stimulus may be a free stimulus (eg, a soluble stimulus, a free ligand, etc.), an associated stimulus (eg, associated with a solid carrier), a cellularly expressed stimulus (eg, an expressed costimulatory molecule, an expressed antigen, an expressed cellular ligand, etc.). .d.), etc.
Согласно некоторым вариантам реализации настоящего изобретения популяцию Т-клеток, экспрессирующую библиотеку синтетических модульных CAR, приводят в контакт со стимулом в условиях in vitro и детектируют полученный в результате фенотип. Стимулы в условиях in vitro, пригодные для скрининга клеточной библиотеки, экспрессирующей синтетические модульные CAR, обычно будут включать антигены, включая, например, свободный антиген, связанный антиген, экспрессируемый клетками антиген (например, экспрессируемый на антигенпрезентирующей клетке, экспрессируемый на клетке-мишени и т.д.) и т.д. Подходящие антигены будут варьироваться в зависимости от конкретной библиотеки CAR, подлежащей скринингу, и желательного результата скрининга. Неограничивающие примеры антигенов включают, но не ограничиваются ими, например, растворимый антиген, антиген, связанный с твердой подложкой (например, связанный с планшетами антиген, связанный с гранулами антиген, связанный с предметным стеклом антиген и т.д.), экспрессируемый антиген (например, трансгенная клетка, экспрессирующая антиген, клетка, экспрессирующая антиген в природных условиях (например, клетка, экспрессирующая нативный антиген, раковая клетка, экспрессирующая раковый антиген и т.д.). Клетки, экспрессирующие нативный антиген, которые можно применять для скрининга библиотеки в условиях in vitro, будут варьироваться и могут включать, но не ограничиваются ими, например, наивные опухолевые клетки (например, полученные при биопсии опухоли).In some embodiments of the present invention, a population of T cells expressing a synthetic modular CAR library is contacted in vitro with a stimulus and the resulting phenotype is detected. In vitro stimuli suitable for screening a cell library expressing synthetic modular CARs will typically include antigens including, for example, free antigen, bound antigen, cell-expressed antigen (e.g., expressed on an antigen-presenting cell, expressed on a target cell, etc.). .d.), etc. Suitable antigens will vary depending on the particular CAR library to be screened and the desired screening result. Non-limiting examples of antigens include, but are not limited to, e.g., soluble antigen, solid support antigen (e.g., plate-bound antigen, bead-bound antigen, slide-bound antigen, etc.), expressed antigen (e.g., , transgenic cell expressing antigen, cell expressing antigen naturally (e.g., cell expressing native antigen, cancer cell expressing cancer antigen, etc.) Cells expressing native antigen that can be used to screen the library under conditions in vitro will vary and may include, but are not limited to, for example, naive tumor cells (eg obtained from tumor biopsy).
Согласно некоторым вариантам реализации настоящего изобретения популяцию Т-клеток, экспрессирующую библиотеку синтетических модульных CAR, приводят в контакт со стимулом в условиях in vivo и детектируют полученный в результате фенотип. Ситуации скрининга библиотеки синтетических модульных CAR в условиях in vivo будут сильно различаться и могут включать, но не ограничивается ими, животные модели. В некоторых случаях скрининг в условиях in vivo может быть выполнен у небольших модельных животных, таких как, например, моделирование на грызунах, включая, но не ограничиваясь ими, например, мышиные модели, крысиные модели и т.д. В некоторых случаях скрининг в условиях in vivo выполняют на мышиных моделях опухолей, включая трансгенные и нетрансгенные мышиные модели опухолей.In some embodiments of the present invention, a population of T cells expressing a synthetic modular CAR library is contacted in vivo with a stimulus and the resulting phenotype is detected. In vivo screening situations for a library of synthetic modular CARs will vary greatly and may include, but are not limited to, animal models. In some instances, in vivo screening may be performed in small animal models such as, for example, rodent models, including but not limited to, for example, mouse models, rat models, and the like. In some instances, in vivo screening is performed in mouse tumor models, including transgenic and non-transgenic mouse tumor models.
В некоторых случаях используемая модель может представлять собой ксенотрансплантатную модель. Например, используемая модель может представлять собой гуманизированную модель, причем указанные гуманизированные модели определяют как имеющие один или более компонентов человеческого происхождения, например гуманизированная иммунная система, гуманизированные Т-клетки, экспрессирующие белок человека, несущие раковые клетки человека и т.д. В этой связи гуманизированные модели могут быть полностью или частично гуманизированы. В других случаях модель может быть не полностью или частично гуманизированной, но вместо этого может быть просто введена с клетками человека или тканью человека посредством инъекции или трансплантации. Например, в некоторых случаях, раковые клетки человека или клетки из клеточных линий рака человека вводят в животную модель. Любые удобные опухолевые клетки человека или линия опухолевых клеток человека может быть использована в указанных моделях, включая, но не ограничиваясь ими, например, клетки K562, клетки лимфомы Дауди и т.д.In some cases, the model used may be a xenograft model. For example, the model used may be a humanized model, said humanized models being defined as having one or more components of human origin, such as a humanized immune system, humanized T cells expressing a human protein, harboring human cancer cells, etc. In this regard, humanized models can be fully or partially humanized. In other cases, the model may not be fully or partially humanized, but may instead be simply administered with human cells or human tissue via injection or transplantation. For example, in some cases, human cancer cells or cells from human cancer cell lines are introduced into an animal model. Any convenient human tumor cell or human tumor cell line can be used in these models, including, but not limited to, K562 cells, Dowdy's lymphoma cells, etc., for example.
Животные модели и/или клетки или ткани, введенные в животные модели, могут быть трансгенными или нетрансгенными, например, могут быть модифицированы для экспрессии одного или более трансгенов. Например, в некоторых случаях, животная модель может быть трансгенно модифицирована для экспрессии гетерологичного гена, например репортерного гена (например, для идентификации клеток животного-хозяина), гена-мишени (например, гена, кодирующего генный продукт, который должен быть мишенью при скрининге в условиях in vivo). В некоторых случаях клетка, введенная в животную модель, может быть трансгенно модифицирована для экспрессии гетерологичного гена, например репортерного гена (например, для идентификации введенной клетки), гена-мишени (например, гена, кодирующего генный продукт, который должен быть мишенью при скрининге в условиях in vivo). В качестве неограничивающего примера мышиная модель опухоли может быть подвергнута скринингу в соответствии со способами, описанными в настоящем документе, при этом мыши вводят опухолевые клетки человека, экспрессирующие раковый трансген-мишень (например, CD19, мезотелин и т.д.).Animal models and/or cells or tissues introduced into animal models may be transgenic or non-transgenic, eg, modified to express one or more transgenes. For example, in some instances, an animal model can be transgenetically modified to express a heterologous gene, e.g., a reporter gene (e.g., to identify cells of a host animal), a target gene (e.g., a gene encoding a gene product to be screened in in vivo conditions). In some instances, a cell introduced into an animal model may be transgenically modified to express a heterologous gene, e.g., a reporter gene (e.g., to identify the introduced cell), a target gene (e.g., a gene encoding a gene product to be screened in in vivo conditions). As a non-limiting example, a mouse tumor model can be screened according to the methods described herein, with mice injected with human tumor cells expressing a target cancer transgene (eg, CD19, mesothelin, etc.).
- 43 041085- 43 041085
Элементы библиотеки, внедренные в системы in vivo, могут быть подвергнуты скринингу для определения любого подходящего фенотипа, причем указанный фенотип может зависеть от конкретной библиотеки, которую подвергают скринингу, конкретной ситуации в условиях in vivo (например, животной модели) и т.д. В некоторых случаях, например, если система в условиях in vivo представляет собой животную модель опухоли, библиотека может быть подвергнута скринингу для определения фенотипов, связанных с селективностью элементов библиотеки в отношении опухолей, например, путем введения библиотеки в животную модель, содержащую две разные опухоли, путем введения библиотеки в животную модель или несколько животных моделей, содержащих опухоли, экспрессирующие различные уровни опухолевого антигена и т.д. Любой удобный способ количественного исследования фенотипа, включая описанные в настоящем документе клеточные и биохимические/молекулярные способы, можно применять при оценке систем in vivo, причем такие оценки обычно включают получение биологического образца из животной модели. В некоторых случаях биологический образец, пригодный для оценки модели в условиях in vivo, может включать образец ткани (например, крови, опухоли и т.д.) или образец органа (например, селезенки).Library elements introduced into in vivo systems may be screened for any suitable phenotype, which phenotype may be dependent on the particular library being screened, the particular in vivo situation (e.g. animal model), etc. In some cases, for example, if the in vivo system is an animal model of a tumor, the library can be screened for phenotypes associated with the selectivity of the library elements for tumors, for example, by introducing the library into an animal model containing two different tumors, by introducing the library into an animal model or several animal models containing tumors expressing different levels of tumor antigen, etc. Any convenient method for quantifying phenotype, including the cellular and biochemical/molecular methods described herein, can be used in evaluating in vivo systems, and such evaluations typically involve obtaining a biological sample from an animal model. In some cases, a biological sample suitable for in vivo model evaluation may include a tissue sample (eg, blood, tumors, etc.) or an organ sample (eg, spleen).
В некоторых случаях библиотека может быть подвергнута скринингу в условиях in vitro или в условиях in vivo в соответствии с фенотипом Т-клеток. Фенотипы Т-клеток будут варьироваться и будут включать стимулированные фенотипы Т-клеток, т.е. ответ на антиген. Неограничивающие примеры фенотипов Т-клеток включают, но не ограничиваются ими, например, пролиферацию Т-клеток, выработку цитокинов (например, ИЛ-2, ИФН-γ, ФНО, ЛТ-α, ИЛ-4, ИЛ-5, ИЛ-6, ИЛ-13, ИЛ-9, ИЛ-10, ИЛ-17А, ИЛ17F, ИЛ-21, ИЛ-22, ИЛ-26, CCL20, ИЛ-21, ФРО-β и т.д.), экспрессию поверхностных маркеров Т-клеток (например, CD3, CD4, CD8 и т.д.), маркеры активации Т-клеток (например, CD69 и т.д.), маркеры внутриклеточной сигнализации (например, фосфорилированную форму ERK1/2, фосфорилированную форму p38MAPK и т.д.) и т.п.In some cases, the library may be screened in vitro or in vivo according to the T cell phenotype. T cell phenotypes will vary and will include stimulated T cell phenotypes, ie. response to an antigen. Non-limiting examples of T cell phenotypes include, but are not limited to, e.g., T cell proliferation, cytokine production (e.g., IL-2, IFN-γ, TNF, LT-α, IL-4, IL-5, IL-6 , IL-13, IL-9, IL-10, IL-17A, IL17F, IL-21, IL-22, IL-26, CCL20, IL-21, FRO-β, etc.), expression of surface markers T cells (eg, CD3, CD4, CD8, etc.), T cell activation markers (eg, CD69, etc.), intracellular signaling markers (eg, phosphorylated form of ERK1/2, phosphorylated form of p38MAPK, and etc.), etc.
Фенотипы Т-клеток могут быть количественно исследованы в условиях in vitro и в условиях in vivo и могут быть детектированы любым удобным способом. В некоторых случаях устройство для подсчета клеток или проточный цитометр можно использовать для количественного исследования фенотипа Тклеток, включая, например, пролиферацию Т-клеток и/или количественную оценку Т-клеток. Например, пролиферация Т-клеток может быть количественно исследована с помощью метода проточной цитометрии путем разбавления красителя для мечения клеток. В некоторых случаях экспрессия маркеров клеточной поверхности также может быть количественно исследована с помощью проточной цитометрии. Экспрессия внутриклеточных маркеров может быть определена клеточными способами (например, с помощью проточной цитометрии, проточной цитометрии с использованием фосфо-специфичных антител, проточной цитометрии внутриклеточных маркеров, иммунофлуориметрии, гибридизации in situ, флуоресцентной гибридизации in situ и т.д.) или может быть количественно исследована с помощью молекулярных и/или биохимических способов (например, ИФА, захвата цитокинов, способов на основе амплификации (например, количественной ПЦР), способов, основанных на секвенировании (например, с помощью количественного секвенирования), количественной масс-спектрометрии и т.д.).T cell phenotypes can be quantified under in vitro and in vivo conditions and can be detected by any convenient method. In some instances, a cell counting device or flow cytometer can be used to quantify T cell phenotype, including, for example, T cell proliferation and/or T cell quantification. For example, T cell proliferation can be quantified by flow cytometry by diluting the cell labeling dye. In some cases, the expression of cell surface markers can also be quantified using flow cytometry. Expression of intracellular markers can be determined by cellular methods (e.g., flow cytometry, flow cytometry using phospho-specific antibodies, flow cytometry of intracellular markers, immunofluorimetry, in situ hybridization, fluorescence in situ hybridization, etc.) or can be quantified investigated by molecular and/or biochemical methods (e.g., ELISA, cytokine capture, amplification-based methods (e.g., quantitative PCR), sequencing-based methods (e.g., quantitative sequencing), quantitative mass spectrometry, etc. .).
В некоторых случаях Т-клетки могут быть количественно исследованы для определения фенотипа активации природных киллеров. Любой подходящий способ оценки активации природных киллеров можно применять в указанных количественных исследованиях. Например, Т-клетки могут быть количественно исследованы для определения экспрессии CD107a/b, например, методом проточной цитометрии.In some cases, T cells can be quantified to determine the natural killer activation phenotype. Any suitable method for assessing natural killer activation can be used in these assays. For example, T cells can be quantified to determine the expression of CD107a/b, for example, by flow cytometry.
В некоторых случаях Т-клетки могут быть количественно исследованы для определения одного или более фенотипов дифференцировки. Любой подходящий способ оценки дифференцировки Т-клеток можно применять в указанных количественных исследованиях. Например, дифференцировку в Т-клетку памяти можно определить, например, путем количественного исследования маркеров Т-клеток памяти (например, Th1, Th2, Th17, Treg и т.д.) с использованием любого подходящего клеточного или молекулярно-биохимического способа. В некоторых случаях может быть проведена оценка экспрессии одного или более факторов внутриклеточной транскрипции, указывающих на дифференцировку в Т-клетки памяти (например, Gata3, Tbet, RORyt, FoxP3, Bcl-6, CCR7, CD45RO, CD45RA, CD69 и т.д.).In some cases, T cells can be quantified to determine one or more differentiation phenotypes. Any suitable method for assessing T cell differentiation can be used in these assays. For example, memory T cell differentiation can be determined, for example, by quantifying memory T cell markers (eg, Th1, Th2, Th17, Treg, etc.) using any suitable cellular or molecular biochemical method. In some cases, expression of one or more intracellular transcription factors indicative of differentiation into memory T cells (e.g., Gata3, Tbet, RORyt, FoxP3, Bcl-6, CCR7, CD45RO, CD45RA, CD69, etc.) can be assessed. ).
Скрининг библиотеки синтетических модульных полипептидов CAR или нуклеиновых кислот, кодирующих библиотеку синтетических модульных полипептидов CAR, позволяет идентифицировать CAR и/или их части (например, антигенсвязывающие домены, первичные сигнальные домены, комодулирующие домены и т.д.), которые эффективно приводят к возникновению желательного фенотипа Т-клеток. Соответственно, в область настоящего изобретения включены CAR, идентифицированные путем скрининга библиотек, описанных в настоящем документе, а также нуклеиновых кислот, кодирующих указанные CAR. В область настоящего изобретения также включены CAR, содержащие подходящие модули CAR (например, антигенсвязывающие домены, первичные сигнальные домены, комодулирующие домены и т.д.), идентифицированные путем скрининга библиотек, описанных в настоящем документе, а также нуклеиновых кислот, кодирующих указанные CAR.Screening of a library of synthetic modular CAR polypeptides or nucleic acids encoding a library of synthetic modular CAR polypeptides allows the identification of CARs and/or portions thereof (e.g., antigen-binding domains, primary signaling domains, comodulatory domains, etc.) that are effective in generating the desired phenotype of T cells. Accordingly, CARs identified by screening the libraries described herein as well as nucleic acids encoding said CARs are included within the scope of the present invention. Also included within the scope of the present invention are CARs containing suitable CAR modules (eg, antigen binding domains, primary signaling domains, comodulatory domains, etc.) identified by screening the libraries described herein as well as nucleic acids encoding said CARs.
В некоторых случаях CAR согласно настоящему изобретению может содержать один или более комодулирующих доменов, идентифицированных как стимулирующие Т-клетки или ингибирующие ТIn some cases, the CAR of the present invention may contain one or more comodulatory domains identified as stimulatory T cells or inhibitory T
- 44 041085 клетки домены при скрининге библиотеки синтетических модульных полипептидов CAR или нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, описанных в настоящем документе. Соответственно, общий Т-клеточный фенотип CAR может заключаться в имитации активности Тклеток или ингибировании активности Т-клеток. Виды активности Т-клеток, которые могут быть подвергнуты стимулированию или ингибированию, включают, но не ограничиваются ими, например, виды активности Т-клеток, описанные в настоящем документе.- 44 041085 cell domains when screening a library of synthetic modular CAR polypeptides or nucleic acids encoding synthetic modular CAR polypeptides described herein. Accordingly, the overall T cell phenotype of CAR may be to mimic T cell activity or to inhibit T cell activity. T cell activities that may be stimulated or inhibited include, but are not limited to, for example, the T cell activities described herein.
В некоторых случаях CAR, идентифицированный путем скрининга библиотеки, может содержать по меньшей мере один комодулирующий домен, перечисленный в табл. 3 или 4, включая, но не ограничиваясь ими, например, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR, идентифицированный путем скрининга библиотеки, может содержать два или более комодулирующих доменов, перечисленных в табл. 3 и 4, включая, но не ограничиваясь ими, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR согласно настоящему изобретению может содержать комодулирующий домен, идентифицированный при скрининге, описанном в настоящем документе, в качестве костимулирующего домена, включая, но не ограничиваясь ими, например, те, которые перечислены в табл. 3, включая, но не ограничиваясь ими, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR согласно настоящему изобретению может содержать комодулирующий домен, идентифицированный при скрининге, описанном в настоящем документе, в качестве коингибирующего домена, включая, но не ограничиваясь ими, например, те, которые перечислены в табл. 4, включая, но не ограничиваясь ими, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR, который содержит один или более коингибирующих доменов, может представлять собой iCAR.In some instances, a CAR identified by library screening may contain at least one comodulatory domain listed in Table 1. 3 or 4, including, but not limited to, for example, comodulatory domains containing an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98% identical to the listed domain sequence. In some instances, a CAR identified by library screening may contain two or more of the co-modulating domains listed in Table 1. 3 and 4, including, but not limited to, comodulatory domains containing an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90% , at least about 95%, at least about 98% identical to the listed domain sequence. In some instances, the CAR of the present invention may contain the co-modulating domain identified in the screening described herein as the co-stimulatory domain, including but not limited to, for example, those listed in Table 1. 3, including, but not limited to, comodulatory domains containing an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98% identical to the listed domain sequence. In some instances, the CAR of the present invention may contain a co-modulating domain identified in the screening described herein as a co-inhibitory domain, including but not limited to, for example, those listed in Table 1. 4, including, but not limited to, comodulatory domains containing an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98% identical to the listed domain sequence. In some cases, a CAR that contains one or more coinhibitory domains may be an iCAR.
В некоторых случаях CAR, содержащий два или более комодулирующих доменов, может содержать два костимулирующих домена, включая, но не ограничиваясь ими, например, два или более костимулирующих доменов, перечисленных в табл. 3. В некоторых случаях CAR, содержащий два или более комодулирующих доменов, может содержать два коингибирующих домена, включая, но не ограничиваясь ими, например, два или более коингибирующих доменов, перечисленных в табл. 4. В некоторых случаях CAR, содержащий два или более комодулирующих доменов, может включать смесь костимулирующих и коингибирующих доменов, включая, но не ограничиваясь ими, по меньшей мере один костимулирующий домен, перечисленный в табл. 3, и по меньшей мере один коингибирующий домен, перечисленный в табл. 4.In some cases, a CAR containing two or more co-modulating domains may contain two co-stimulatory domains, including, but not limited to, for example, two or more co-stimulatory domains listed in table. 3. In some cases, a CAR containing two or more co-inhibitory domains may contain two co-inhibitory domains, including, but not limited to, for example, two or more co-inhibitory domains listed in table. 4. In some cases, a CAR containing two or more co-modulating domains may include a mixture of co-stimulatory and co-inhibitory domains, including, but not limited to, at least one co-stimulatory domain listed in table. 3, and at least one coinhibitory domain listed in table. 4.
Таблица 3. Комодулирующие домены, обладающие стимулирующей функцией (костимулирующие домены)Table 3. Comodulatory domains with a stimulatory function (costimulatory domains)
- 45 041085- 45 041085
Таблица 4. Комодулирующие домены, обладающие ингибиторной функцией (коингибирующие домены)Table 4. Co-modulating domains with inhibitory function (co-inhibitory domains)
CAR, идентифицированный путем скрининга библиотеки синтетических модульных полипептидов CAR или библиотеки нуклеиновых кислот, кодирующих синтетические полипептиды CAR, может содержать любой подходящий антигенсвязывающий домен, включая, но не ограничиваясь ими, те, которые используются в клинических условиях в различных конструкциях CAR, включая, например, ВСМАспецифичный антигенсвязывающий домен, CD123-специфичный антигенсвязывающий домен, CD138специфичный антигенсвязывающий домен, CD171-специфичный антигенсвязывающий домен, CD19специфичный антигенсвязывающий домен, CD22-специфичный антигенсвязывающий домен, CD30специфичный антигенсвязывающий домен, CD33-специфичный антигенсвязывающий домен, CD7специфичный антигенсвязывающий домен, CD70-специфичный антигенсвязывающий домен, СЕАспецифичный антигенсвязывающий домен, EGFRvШ-специфичный антигенсвязывающий домен, ЕРСАМ-специфичный антигенсвязывающий домен, EphA2-сnецифичный антигенсвязывающий домен, ErbB-специфичный антигенсвязывающий домен, FAP-специфичный антигенсвязывающий домен, GD2специфичный антигенсвязывающий домен, GPC3-специфичный антигенсвязывающий домен, HER2специфичный антигенсвязывающий домен, IL1RAP-сπецифичный антигенсвязывающий домен, каппаспецифичный антигенсвязывающий домен, LeY-специфичный антигенсвязывающий домен, Mesoспецифичный антигенсвязывающий домен, MG7-специфичный антигенсвязывающий домен, MUC1специфичный антигенсвязывающий домен, NKG2D-специфичный антигенсвязывающий домен, PSCAспецифичный антигенсвязывающий домен, ROR1-специфичный антигенсвязывающий домен и т.п.A CAR identified by screening a library of synthetic CAR modular polypeptides or a library of nucleic acids encoding synthetic CAR polypeptides may contain any suitable antigen-binding domain, including, but not limited to, those used clinically in various CAR constructs, including, for example, BCMA specific antigen binding domain, CD123 specific antigen binding domain, CD138 specific antigen binding domain, CD171 specific antigen binding domain, CD19 specific antigen binding domain, CD22 specific antigen binding domain, CD30 specific antigen binding domain, CD33 specific antigen binding domain, CD7 specific antigen binding domain, CD70 specific antigen binding domain, CEA-specific antigen-binding domain, EGFRvIII-specific antigen-binding domain, EPCAM-specific antigen-binding domain, EphA2-specific antigen-binding domain, ErbB-specific antigen-binding domain n, FAP-specific antigen-binding domain, GD2-specific antigen-binding domain, GPC3-specific antigen-binding domain, HER2-specific antigen-binding domain, IL1RAP-specific antigen-binding domain, kappa-specific antigen-binding domain, LeY-specific antigen-binding domain, Meso-specific antigen-binding domain, MG7-specific antigen-binding domain, MUC1-specific antigen-binding domain domain, NKG2D specific antigen binding domain, PSCA specific antigen binding domain, ROR1 specific antigen binding domain, and the like.
CAR, идентифицированный путем скрининга библиотеки синтетических модульных полипептидов CAR или библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, может содержать любой подходящий первичный сигнальный домен (также называемый в настоящем документе внутриклеточным сигнальным доменом), включая, но не ограничиваясь ими, например, те, которые содержат один или более иммунорецепторных тирозиновых активирующих мотивов (ITAM).A CAR identified by screening a library of synthetic modular CAR polypeptides or a library of nucleic acids encoding synthetic modular CAR polypeptides may contain any suitable primary signaling domain (also referred to herein as an intracellular signaling domain), including, but not limited to, for example, those which contain one or more immunoreceptor tyrosine activating motifs (ITAM).
Подходящий внутриклеточный сигнальный домен может быть частью, содержащей мотив ITAM, которая получена из полипептида, который содержит мотив ITAM. Например, подходящий внутриклеточный сигнальный домен может представлять собой домен, содержащий мотив ITAM, из любого содержащего мотив ITAM белка. Следовательно, подходящий внутриклеточный сигнальный домен необязательно содержит полную последовательность всего белка, из которого он получен. Примеры подходящих полипептидов, содержащих мотив ITAM, включают, но не ограничиваются ими: DAP12; FCER1G (гамма-цепь рецептора Fcε I); CD3D (CD3-дельта); CD3E (CD3-эпсилон); CD3G (CD3-гаммα); CD3Z (CD3-дзета); и CD79A (альфа-цепь белка, связанного с антигенраспознающим рецепторным комплексом).A suitable intracellular signaling domain may be an ITAM motif-containing portion that is derived from a polypeptide that contains an ITAM motif. For example, a suitable intracellular signaling domain may be an ITAM motif containing domain from any ITAM motif containing protein. Therefore, a suitable intracellular signaling domain does not necessarily contain the complete sequence of the entire protein from which it is derived. Examples of suitable polypeptides containing the ITAM motif include, but are not limited to: DAP12; FCER1G (gamma chain of Fcε I receptor); CD3D (CD3 delta); CD3E (CD3-epsilon); CD3G (CD3-gammaα); CD3Z (CD3-zeta); and CD79A (alpha chain protein associated with the antigen recognition receptor complex).
В некоторых случаях внутриклеточный сигнальный домен получен из DAP12 (также известного как TYROBP; белок, связывающий тирозинкиназу TYRO, KARAP; PLOSL; DNAX-активирующий белок 12; связанный с KAR белок; связывающий тирозинкиназу TYRO белок; активирующий киллеры ассоциированный с рецептором белок; активирующий киллеры рецептор-ассоциированный белок и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотнуюIn some cases, the intracellular signaling domain is derived from DAP12 (also known as TYROBP; TYRO tyrosine kinase binding protein, KARAP; PLOSL; DNAX-activating protein 12; KAR-associated protein; tyrosine kinase-binding protein TYRO; killer-activating receptor-associated protein; activating killers receptor-associated protein, etc.). For example, a suitable intracellular signaling domain polypeptide may comprise an amino acid
- 46 041085 последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична любой из следующих аминокислотных последовательностей (4 изоформы):- 46 041085 a sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98% or 100% identical to any of the following amino acid sequences (4 isoforms):
MGGLEPCSRLLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMGDLVLTVLIAL AVYFLGRLVPRGRGAAEAATRKORITETESPYQELOGORSDVYSDLNTORPYYK (SEQ ID NO: 107);MGGLEPCSRLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMMGDLVLTVLIAL AVYFLGRLVPRGRGAAEAATRKORITETESPYQELOGORSDVYSDLNTORPYYK (SEQ ID NO: 107);
MGGLEPCSRLLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMGDLVLTMGGLEPCSRLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMGDLVLT
VLIALAVYFLGRLVPRGRGAAEATRKORITETESPYQELOGORSDVYSDLNTORPYYK (SEQ ID NO: 108);VLIALAVYFLGRLVPRGRGAAEATRKORITETESPYQELOGORSDVYSDLNTORPYYK (SEQ ID NO: 108);
MGGLEPCSRLLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGRMGGLEPCSRLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGR
LVPRGRGAAEAATRKORITETESPYQELQGORSDVYSDLNTORPYYK (SEQ ID NO: 109); илиLVPRGRGAAEAATRKORITETESPYQELQGORSDVYSDLNTORPYYK (SEQ ID NO: 109); or
MGGLEPCSRLLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGRMGGLEPCSRLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGR
LVPRGRGAAEATRKORITETESPYQELQGORSDVYSDLNTQRPYYK (SEQ ID NO: 110), в которых мотивы ITAM выделены жирным шрифтом и подчеркнуты.LVPRGRGAAEATRKORITETESPYQELQGORSDVYSDLNTQRPYYK (SEQ ID NO: 110) in which the ITAM motifs are bold and underlined.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности DAP12. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:Similarly, a suitable intracellular signaling domain polypeptide may comprise an ITAM motif-containing portion from the full length amino acid sequence of DAP12. Therefore, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the following amino acid sequence:
ESPYQELQGORSDVYSDLNTO (SEQ ID NO: 111), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.ESPYQELQGORSDVYSDLNTO (SEQ ID NO: 111), in which the ITAM motifs are bold and underlined.
В некоторых случаях внутриклеточный сигнальный домен получен из FCER1G (также известного как FCRG; гамма-цепь рецептора Fce I; гамма-цепь рецептора Fc; Fc-эпсилон RI-гамма; FcR-гамма; FcaRI гамма; высокоаффинная гамма-субъединица эпсилон-рецептора иммуноглобулина; рецептор иммуноглобулина Е; высокоаффинная гамма-цепь и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:In some cases, the intracellular signaling domain is derived from FCER1G (also known as FCRG; Fce I receptor gamma chain; Fc receptor gamma chain; Fc epsilon RI-gamma; FcR-gamma; FcaRI gamma; high-affinity immunoglobulin epsilon receptor gamma subunit , immunoglobulin E receptor, high affinity gamma chain, etc.). For example, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the following amino acid sequence:
MIPAVVLLLLLLVEQAAALGEPQLCYILDAILFLYGIVLTLLYCRLKIQVRKAAITSYEKSMIPAVVLLLLLVEQAAALGEPQLCYILDAILFLYGIVLTLLYCRLKIQVRKAAITSYEKS
DGVYTGLSTRNQETYETLKHEKPPQ (SEQ ID NO: 112), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.DGVYTGLSTRNQETYETLKHEKPPQ (SEQ ID NO: 112), in which the ITAM motifs are bold and underlined.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности FCER1G. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:Similarly, a suitable intracellular signaling domain polypeptide may comprise an ITAM motif-containing portion from the full length amino acid sequence of FCER1G. Therefore, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the following amino acid sequence:
DGVYTGLSTRNQETYETLKHE (SEQ ID NO: 113), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.DGVYTGLSTRNQETYETLKHE (SEQ ID NO: 113), in which the ITAM motifs are bold and underlined.
В некоторых случаях внутриклеточный сигнальный домен получен из дельта-цепи поверхностного гликопротеина CD3 Т-клеток (также известного как CD3D; CD3-DELTA; T3D; антиген CD3; дельтасубъединица; CD3-дельта; CD3d-антиген; дельта-полипептид (комплекс TiT3); ОКТ3; дельта-цепь; дельта-цепь Т-клеточного рецептора T3; дельта-цепь поверхностного гликопротеина CD3 Т-клеток и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 до приблизительно 110 аминокислот (а.к.), от приблизительно 110 до приблизительно 115 а.к., от приблизительно 115 до приблизительно 120 а.к., от приблизительно 120 до приблизительно 130 а.к., от приблизительно 130 до приблизительно 140 а.к., от приблизительно 140 до приблизительно 150 а.к. или от приблизительно 150 до приблизительно 170 а.к. любой из следующих аминокислотных последовательностей (2 изоформы):In some cases, the intracellular signaling domain is derived from the T cell CD3 surface glycoprotein delta chain (also known as CD3D; CD3-DELTA; T3D; CD3 antigen; delta subunit; CD3 delta; CD3d antigen; delta polypeptide (TiT3 complex); OKT3, delta chain, delta chain of T-cell receptor T3, delta chain of CD3 surface glycoprotein of T-cells, etc.). For example, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% contiguous amino acid sequence identity from about 100 to about 110 amino acids (a.a.), from about 110 to about 115 a.a., from about 115 to about 120 a.a. .k., from about 120 to about 130 a.k., from about 130 to about 140 a.k., from about 140 to about 150 a.k. or from about 150 to about 170 a.c. any of the following amino acid sequences (2 isoforms):
- 47 041085- 47 041085
MEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLG KRILDPRGIYRCNGTDIYKDKESTVQVHYRMCQSCVELDPATVAGIIVTDVIATLLLALG VFCFAGHETGRLSGAADTOALLRNDOVYQPLRDRDDAOYSHLGGNWARNK (SEQ ID NO: 114) илиMEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLG KRILDPRGIYRCNGTDIYKDKESTVQVHYRMCQSCVELDPATVAGIIVTDVIATLLLALG VFCFAGHETGRLSGAADTOALLRNDOVYQPLRDRDDAOYSHLGGNWARNK (SEQ ID NO: 114) or
MEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLG KRILDPRGIYRCNGTDIYKDKESTVOVHYRTADTOALLRNDOVYQPLRDRDDAQYSHL GGNWARNK (SEQ ID NO: 115), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.MEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLG KRILDPRGIYRCNGTDIYKDKESTVOVHYRTADTOALLRNDOVYQPLRDRDDAQYSHL GGNWARNK (SEQ ID NO: 115), in which the ITAM motifs are in bold and underlined.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3дельта. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:Similarly, a suitable intracellular signaling domain polypeptide may comprise an ITAM motif-containing portion from the full-length CD3 delta amino acid sequence. Therefore, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the following amino acid sequence:
DQVYQPLRDRDDAOYSHLGGN (SEQ ID NO; 116), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.DQVYQPLRDRDDAOYSHLGGN (SEQ ID NO; 116), in which the ITAM motifs are in bold and underlined.
В некоторых случаях внутриклеточный сигнальный домен получен из эпсилон-цепи поверхностного гликопротеина CD3 Т-клеток (также известной как CD3ε; эпсилон-цепь поверхностного антигена T3/Leu-4 Т-клеток; эпсилон-цепь поверхностного гликопротеина CD3 Т-клеток; AI504783; CD3; CD3эпсилон; T3ε и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 до приблизительно 110 аминокислот (а.к.), от приблизительно 110 до приблизительно 115 а.к., от приблизительно 115 до приблизительно 120 а.к., от приблизительно 120 до приблизительно 130 а.к., от приблизительно 130 до приблизительно 140 а.к., от приблизительно 140 до приблизительно 150 а.к. или от приблизительно 150 до приблизительно 205 а.к. следующей аминокислотной последовательности:In some cases, the intracellular signaling domain is derived from the T cell CD3 surface glycoprotein epsilon chain (also known as CD3ε; T cell surface antigen epsilon T3/Leu-4; T cell surface glycoprotein epsilon CD3; AI504783; CD3 ; CD3epsilon; T3ε, etc.). For example, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% contiguous amino acid sequence identity from about 100 to about 110 amino acids (a.a.), from about 110 to about 115 a.a., from about 115 to about 120 a.a. .k., from about 120 to about 130 a.k., from about 130 to about 140 a.k., from about 140 to about 150 a.k. or from about 150 to about 205 a.a. following amino acid sequence:
MQSGTHWRVLGLCLLSVGVWGQDGNEEMGGITQTPYKVSISGTTV1LTCPQYPGSEILW QHNDKNIGGDEDDKNIGSDEDHLSLKEFSELEQSGYYVCYPRGSKPEDANFYLYLRARV CENCMEMDVMSVATIVIVDICITGGLLLLVYYWSKNRKAKAKPVTRGAGAGGRQRGQ NKERPPPVPNPDYEPIRKGORDLYSGLNORRI (SEQ ID NO: 117), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.MQSGTHWRVLGLCLLSVGVWGQDGNEEMGGITQTPYKVSISGTTV1LTCPQYPGSEILW QHNDKNIGGDEDDKNIGSDEDHLSLKEFSELEQSGYYVCYPRGSKPEDANFYLYLRARV CENCMEMDVMSVATIVIVDICITGGLLLLVYYWSKNRKAKAKPVTRGAGAGGRQRGQ NKERPPPVPNPDYEPIRKGORDLYSGLNORRI (SEQ ID NO: 117), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3 эпсилон. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:Similarly, a suitable intracellular signaling domain polypeptide may comprise an ITAM motif-containing portion from the full-length amino acid sequence of CD3 epsilon. Therefore, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the following amino acid sequence:
NPDYEPIRKGQRDLYSGLNOR (SEQ ID NO: 118), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.NPDYEPIRKGQRDLYSGLNOR (SEQ ID NO: 118), in which the ITAM motifs are bold and underlined.
В некоторых случаях внутриклеточный сигнальный домен получен из гамма-цепи поверхностного гликопротеина CD3 Т-клеток (также известной как CD3G; гамма-цепь Т-клеточного рецептора T3; CD3гамма; T3G; гамма-полипептид (комплекс TiT3) и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 до приблизительно 110 аминокислот (а.к.), от приблизительно 110 до приблизительно 115 а.к., от приблизительно 115 до приблизительно 120 а.к., от приблизительно 120 до приблизительно 130 а.к., от приблизительно 130 до приблизительно 140 а.к., от приблизительно 140 до приблизительно 150 а.к. или от приблизительно 150 до приблизительно 180 а.к. следующей аминокислотной последовательности:In some cases, the intracellular signaling domain is derived from the gamma chain of T cell surface glycoprotein CD3 (also known as CD3G; T3 cell receptor gamma chain; CD3gamma; T3G; gamma polypeptide (TiT3 complex), etc.). For example, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% contiguous amino acid sequence identity from about 100 to about 110 amino acids (a.a.), from about 110 to about 115 a.a., from about 115 to about 120 a.a. .k., from about 120 to about 130 a.k., from about 130 to about 140 a.k., from about 140 to about 150 a.k. or from about 150 to about 180 a.c. following amino acid sequence:
MEQGKGLAVLILAIILLQGTLAQSIKGNHLVKVYDYQEDGSVLLTCDAEAKNITWFKDG KMIGFLTEDKKKWNLGSNAKDPRGMYQCKGSQNKSKPLQVYYRMCQNCIELNAATIS GFLFAEIVSIFVLAVGVYFIAGODGVROSRASDKOTLLPNDOLYOPLKDREDDOYSHLO GNQLRRN (SEQ ID NO: 119), в которой ITAM мотивы выделены жирным шрифтом и подчеркнуты.MEQGKGLAVLILAIILLQGTLAQSIKGNHLVKVYDYQEDGSVLLTCDAEAKNITWFKDG KMIGFLTEDKKKWNLGSNAKDPRGMYQCKGSQNKSKPLQVYYRMCQNCIELNAATIS GFLFAEIVSIFVLAVGVYFIAGODGVROSRASDKOTLLPNDOLYOPLKDREDDOYSHLO GNQLRRN (SEQ ID NO: 1111 is underlined) in which the motifs are underlined.
- 48 041085- 48 041085
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3гамма. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:Similarly, a suitable intracellular signaling domain polypeptide may comprise an ITAM motif-containing portion from the full-length CD3gamma amino acid sequence. Therefore, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the following amino acid sequence:
DQLYQPLKDREDDOYSHLOGN (SEQ ID NO: 120), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.DQLYQPLKDREDDOYSHLOGN (SEQ ID NO: 120), in which the ITAM motifs are in bold and underlined.
В некоторых случаях внутриклеточный сигнальный домен получен из дзета-цепи поверхностного гликопротеина CD3 Т-клеток (также известной как CD3Z; дзета-цепь Т-клеточного рецептора T3; CD247; CD3-дзета; CD3H; CD3Q; T3Z; TCRZ и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 до приблизительно 110 аминокислот (а.к.), от приблизительно 110 до приблизительно 115 а.к., от приблизительно 115 до приблизительно 120 а.к., от приблизительно 120 до приблизительно 130 а.к., от приблизительно 130 до приблизительно 140 а.к., от приблизительно 140 до приблизительно 150 а.к. или от приблизительно 150 до приблизительно 160 а. к. любой из следующих аминокислотных последовательностей (2 изоформы):In some cases, the intracellular signaling domain is derived from the T cell surface glycoprotein CD3 zeta chain (also known as CD3Z; T-cell receptor T3 zeta chain; CD247; CD3-zeta; CD3H; CD3Q; T3Z; TCRZ, etc. ). For example, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% contiguous amino acid sequence identity from about 100 to about 110 amino acids (a.a.), from about 110 to about 115 a.a., from about 115 to about 120 a.a. .k., from about 120 to about 130 a.k., from about 130 to about 140 a.k., from about 140 to about 150 a.k. or from about 150 to about 160 a. to. any of the following amino acid sequences (2 isoforms):
MKWKALFTAAILQAQLP1TEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADA PAYQQGONOLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELOKDK MAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMOALPPR (SEQ ID NO: 121)илиMKWKALFTAAILQAQLP1TEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADA PAYQQGONOLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELOKDK MAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMOALPPR (SEQ ID NO: 121) or
MKWKALFTAAILQAQLPITEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADA PAYQOGONOLYNELNLGRREEYDVLDKRRGRDPEMGGKPORRKNPOEGLYNELQKD KMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMOALPPR (SEQ ID NO: 122), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.MKWKALFTAAILQAQLPITEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADA PAYQOGONOLYNELNLGRREEYDVLDKRRGRDPEMGGKPORRKNPOEGLYNELQKD KMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMOALPPR (SEQ ID NO: 122), in which the ITAM motifs are in bold and underlined.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3дзета. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична любой из следующих аминокислотных последовательностей:Similarly, a suitable intracellular signaling domain polypeptide may comprise an ITAM motif-containing portion from the full-length amino acid sequence of CD3zeta. Therefore, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to any of the following amino acid sequences:
RVKFSRSADAPAYOOGONOLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPOEGRVKFSRSADAPAYOOGONOLYNELNLGRREEYDVLDKRRGRRDPEMGGKPRRKNPOEG
LYNELOKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMOALPPR (SEQ ID NO: 123);LYNELOKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMOALPPR (SEQ ID NO: 123);
NQLYNELNLGRREEYDVLDKR (SEQ ID NO: 124); EGLYNELQKDKMAEAYSEIGMK (SEQ ID NO: 125); или DGLYQGLSTATKDTYDALHMO (SEQ ID NO: 126), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.NQLYNELNLGRREEYDVLDKR (SEQ ID NO: 124); EGLYNELQKDKMAEAYSEIGMK (SEQ ID NO: 125); or DGLYQGLSTATKDTYDALHMO (SEQ ID NO: 126) in which the ITAM motifs are bold and underlined.
В некоторых случаях внутриклеточный сигнальный домен получен из CD79A (также известной как альфа-цепь белка, связанного с антигенным рецептором В-клеток; антиген CD79a (ассоциированная с иммуноглобулином альфа-цепь); мембранный гликопротеин МВ-1; ig-альфа; связанный с мембраной ассоциированный с иммуноглобулином белок; поверхностный IgM-ассоциированный белок и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 до приблизительно 110 аминокислот (а.к.), от приблизительно 110 до приблизительно 115 а.к., от приблизительно 115 до приблизительно 120 а.к., от приблизительно 120 до приблизительно 130 а.к., от приблизительно 130 до приблизительно 150 а.к., от приблизительно 150 до приблизительно 200 а.к. или от приблизительно 200 до приблизительно 220 а.к. любой из следующих аминокислотных последовательностей (2 изоформы):In some cases, the intracellular signaling domain is derived from CD79A (also known as B cell antigen receptor-associated protein alpha chain; CD79a antigen (immunoglobulin-associated alpha chain); MB-1 membrane glycoprotein; ig-alpha; membrane-bound immunoglobulin-associated protein, surface IgM-associated protein, etc.). For example, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% contiguous amino acid sequence identity from about 100 to about 110 amino acids (a.a.), from about 110 to about 115 a.a., from about 115 to about 120 a.a. .k., from about 120 to about 130 a.k., from about 130 to about 150 a.k., from about 150 to about 200 a.k. or from about 200 to about 220 a.c. any of the following amino acid sequences (2 isoforms):
- 49 041085- 49 041085
MPGGPGVLQALPAT1FLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNS SNNANVTWWRVLHGNYTWPPEFLGPGEDPNGTLIIQNVNKSHGGIYVCRVQEGNESYQ QSCGTYLRVRQPPPRPFLDMGEGTKNR1ITAEGIILLFCAVVPGTLLLFRKRWQNEKLGL DAGDEYEDENLYEGLNLDDCSMYEDISRGLOGTYODVGSLNIGDVOLEKP (SEQ ID NO: 127); или MPGGPGVLQALPATIFLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNS SNNANVTWWRVLHGNYTWPPEFLGPGEDPNEPPPRPFLDMGEGTKNRIITAEGIILLFCA VVPGTLLLFRKRWQNEKLGLDAGDEYEDENLYEGLNLDDCSMYEDISRGLQGTYQDV GSLNIGDVQLEKP (SEQ ID NO: 128), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.MPGGPGVLQALPAT1FLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNS SNNANVTWWRVLHGNYTWPPEFLGPGEDPNGTLIIQNVNKSHGGIYVCRVQEGNESYQ QSCGTYLRVRQPPPRPFLDMGEGTKNR1ITAEGIILLFCAVVPGTLLLFRKRWQNEKLGL DAGDEYEDENLYEGLNLDDCSMYEDISRGODTY2; or MPGGPGVLQALPATIFLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNS SNNANVTWWRVLHGNYTWPPEFLGPGEDPNEPPPRPFLDMGEGTKNRIITAEGIILLFCA VVPGTLLLFRKRWQNEKLGLDAGDEYEDENLYEGLNLDDCSMYEDISRGLQGTYQDV GSLNIGDVQLEKP (SEQ8 ID NO: 12 ITAM) in which the motive fonts are underlined.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD79A. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности: ENLYEGLNLDDCSMYEDISRG (SEQ ID NO: 129), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты. Внутриклеточные сигнальные домены, подходящие для применения в CAR согласно настоящему изобретению, содержат сигнальную цепь типа DAP10/CD28.Similarly, a suitable intracellular signaling domain polypeptide may comprise an ITAM motif containing portion from the full length amino acid sequence of CD79A. Therefore, a suitable intracellular signaling domain polypeptide may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the following amino acid sequence: ENLYEGLNLDDCSMYEDISRG (SEQ ID NO: 129), in which the ITAM motifs are in bold and underlined. Intracellular signaling domains suitable for use in the CARs of the present invention comprise a DAP10/CD28 type signal chain.
Примером сигнальной цепи DAP10 является аминокислотная последовательность: RPRRSPAODGKVYINMPGRG (SEQ ID NO: 130).An example of a DAP10 signal chain is the amino acid sequence: RPRRSPAODGKVYINMPGRG (SEQ ID NO: 130).
Согласно некоторым вариантам реализации настоящего изобретения подходящий внутриклеточный сигнальный домен содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или по меньшей мере приблизительно на 99% идентична по всей длине аминокислотной последовательностиAccording to some embodiments of the present invention, a suitable intracellular signaling domain comprises an amino acid sequence that is at least about 85%, at least about 90%, at least about 95%, at least about 98%, or at least approximately 99% identical throughout the amino acid sequence
RPRRSPAODGKVYINMPGRG (SEQ ID NO: 130).RPRRSPAODGKVYINMPGRG (SEQ ID NO: 130).
Примером сигнальной цепи CD28 является аминокислотная последовательность:An example of a CD28 signal chain is the amino acid sequence:
FWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAFWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYA
PPRDFAAYRS (SEQ ID NO: 131).PPRDFAAYRS (SEQ ID NO: 131).
Согласно некоторым вариантам реализации настоящего изобретения подходящий внутриклеточный сигнальный домен содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или по меньшей мере приблизительно на 99% идентична по всей длине аминокислотной последовательностиAccording to some embodiments of the present invention, a suitable intracellular signaling domain comprises an amino acid sequence that is at least about 85%, at least about 90%, at least about 95%, at least about 98%, or at least approximately 99% identical throughout the amino acid sequence
FWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYA PPRDFAAYRS (SEQ ID NO: 131).FWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYA PPRDFAAYRS (SEQ ID NO: 131).
Внутриклеточные сигнальные домены, пригодные для применения в CAR согласно настоящему изобретению, включают полипептид ZAP70, например полипептид, содержащий аминокислотную последовательность, которая по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98%, по меньшей мере приблизительно на 99% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 300 до приблизительно 400 аминокислот, от приблизительно 400 до приблизительно 500 аминокислот или от приблизительно 500 до 619 аминокислот следующей аминокислотной последовательности:Intracellular signaling domains suitable for use in the CARs of the present invention include a ZAP70 polypeptide, e.g., a polypeptide containing an amino acid sequence that is at least about 85%, at least about 90%, at least about 95%, at least about 98%, at least about 99%, or 100% identical to a contiguous stretch of amino acid sequence of about 300 to about 400 amino acids, about 400 to about 500 amino acids, or about 500 to 619 amino acids of the following amino acid sequence:
MPDPAAHLPFFYGSISRAEAEEHLKLAGMADGLFLLRQCLRSLGGYVLSLVHDVRFHHF PIERQLNGTYAIAGGKAHCGPAELCEFYSRDPDGLPCNLRKPCNRPSGLEPQPGVFDCLR DAMVRDYVRQTWKLEGEALEQAIISQAPQVEKLIATTAHERMPWYHSSLTREEAERKL YSGAQTDGKFLLRPRKEQGTYALSLIYGKTVYHYLISQDKAGKYCIPEGTKFDTLWQLV EYLKLKADGLIYCLKEACPNSSASNASGAAAPTLPAHPSTLTHPQRRIDTLNSDGYTPEP ARITSPDKPRPMPMDTSVYESPYSDPEELKDKKLFLKRDNLLIADIELGCGNFGSVRQGV YRMRKKQIDVAIKVLKQGTEKADTEEMMREAQIMHQLDNPYIVRLIGVCQAEALMLV MEMAGGGPLHKFLVGKREEIPVSNVAELLHQVSMGMKYLEEKNFVHRDLAARNVLLV NRHYAKISDFGLSKALGADDSYYTARSAGKWPLKWYAPECINFRKFSSRSDVWSYGVT MWEALSYGQKPYKKMKGPEVMAFIEQGKRMECPPECPPELYALMSDCWIYKWEDRPD FLTVEQRMRACYYSLASKVEGPPGSTQKAEAACA (SEQ ID NO: 132).MPDPAAHLPFFYGSISRAEAEEHLKLAGMADGLFLLRQCLRSLGGYVLSLVHDVRFHHF PIERQLNGTYAIAGGKAHCGPAELCEFYSRDPDGLPCNLRKPCNRPSGLEPQPGVFDCLR DAMVRDYVRQTWKLEGEALEQAIISQAPQVEKLIATTAHERMPWYHSSLTREEAERKL YSGAQTDGKFLLRPRKEQGTYALSLIYGKTVYHYLISQDKAGKYCIPEGTKFDTLWQLV EYLKLKADGLIYCLKEACPNSSASNASGAAAPTLPAHPSTLTHPQRRIDTLNSDGYTPEP ARITSPDKPRPMPMDTSVYESPYSDPEELKDKKLFLKRDNLLIADIELGCGNFGSVRQGV YRMRKKQIDVAIKVLKQGTEKADTEEMMREAQIMHQLDNPYIVRLIGVCQAEALMLV MEMAGGGPLHKFLVGKREEIPVSNVAELLHQVSMGMKYLEEKNFVHRDLAARNVLLV NRHYAKISDFGLSKALGADDSYYTARSAGKWPLKWYAPECINFRKFSSRSDVWSYGVT MWEALSYGQKPYKKMKGPEVMAFIEQGKRMECPPECPPELYALMSDCWIYKWEDRPD FLTVEQRMRACYYSLASKVEGPPGSTQKAEAACA (SEQ ID NO: 132).
В некоторых случаях CAR, идентифицированный путем скрининга библиотеки синтетических моIn some cases, a CAR identified by screening a library of synthetic mo
- 50 041085 дульных полипептидов CAR или библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, включая CAR, содержащий по меньшей мере один или два или более комодулирующих доменов, перечисленных в табл. 3 и 4, может быть разделен на две полипептидные цепи, способные соединяться, в присутствии димеризатора, посредством домена димеризации, присутствующего в каждой цепи. Указанные расщепленные CAR являются условно активными и фармакологически индуцируемыми/подавляемыми, например, как те, которые описаны в РСТ публикации патентной заявки WO 2014/127261, содержание которой полностью включено в настоящую заявку посредством ссылки.- 50 041085 muzzle CAR polypeptides or nucleic acid libraries encoding synthetic modular CAR polypeptides, including CAR containing at least one or two or more co-modulating domains listed in table. 3 and 4 can be separated into two polypeptide chains capable of joining, in the presence of a dimerizer, by means of a dimerization domain present in each chain. Said cleaved CARs are conditionally active and pharmacologically inducible/suppressed, such as those described in PCT patent application publication WO 2014/127261, the contents of which are incorporated herein by reference in their entirety.
Соответственно, в некоторых случаях, каждый полипептид расщепленного варианта CAR из CAR, идентифицированного путем скрининга библиотеки, описанной в настоящем документе, может содержать одну половину пары димеризации (также называемой парой, связывающей димеризатор). Неограничивающие примеры подходящих димеров (например, пар, связывающих димеризатор) включают, но не ограничиваются ими: а) FK506-связывающий белок (FKBP) и FKBP; b) FKBP и каталитическая субъединица кальцинейрина А (CnA); с) FKBP и циклофилин; d) FKBP и FKBP-рапамицин-ассоциированный белок (FRB); е) гираза В (GyrB) и GyrB; f) дигидрофолатредуктаза (DHFR) и DHFR; g) DmrB и DmrB; h) PYL и ABI; i) Cry2 и CIB1; и j) GAI и GID1.Accordingly, in some cases, each CAR cleavage variant polypeptide of a CAR identified by screening the library described herein may contain one half of a dimerization pair (also referred to as a dimerizer-binding pair). Non-limiting examples of suitable dimers (eg, dimerizer-binding pairs) include, but are not limited to: a) FK506 binding protein (FKBP) and FKBP; b) FKBP and catalytic subunit of calcineurin A (CnA); c) FKBP and cyclophilin; d) FKBP and FKBP-rapamycin-associated protein (FRB); f) gyrase B (GyrB) and GyrB; f) dihydrofolate reductase (DHFR) and DHFR; g) DmrB and DmrB; h) PYL and ABI; i) Cry2 and CIB1; and j) GAI and GID1.
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) рассматриваемого CAR получен из FKBP. Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:In some instances, the dimer element (eg, dimerizer-binding pair) of the CAR in question is derived from FKBP. For example, a suitable member of a dimerizer-binding pair may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least approximately 95%, at least approximately 98%, or 100% identical to the following amino acid sequence:
MGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKFDSSRDRNKPFKFMLGKQEVIRMGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKFDSSRDRNKPFKFMLGKQEVIR
GWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID NO: 78).GWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID NO: 78).
В некоторых случаях элемент пары, связывающей димеризатор, рассматриваемого CAR получен из каталитической субъединицы А кальцинейрина (также известной как PPP3CA; CALN; CALNA; CALNA1; CCN1; CNA1; РРР2В; каталитическая субъединица CAM-PRP; кальцинейрин А альфа; кальмодулин-зависимая изоформа альфа-субъединицы кальцинейрина А; протеинфосфатаза 2В; каталитическая субъединица, альфа-изоформа и т.д.). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности (домен РР2Ас):In some cases, the member of the dimerizer-binding pair of the CAR in question is derived from the calcineurin A catalytic subunit (also known as PPP3CA; CALN; CALNA; CALNA1; CCN1; CNA1; PPP2B; CAM-PRP catalytic subunit; calcineurin A alpha; calmodulin-dependent isoform alpha calcineurin A subunits, protein phosphatase 2B, catalytic subunit, alpha isoform, etc.). For example, a suitable member of a dimerizer-binding pair may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the following amino acid sequence (PP2Ac domain):
LEESVALRIITEGASILRQEKNLLDIDAPVTVCGDIHGQFFDLMKLFEVGGSPANTRYLFL GDYVDRGYFSIECVLYLWALKILYPKTLFLLRGNHECRHLTEYFTFKQECKIKYSERVY DACMDAFDCLPLAALMNQQFLCVHGGLSPEINTLDDIRKLDRFKEPPAYGPMCDILWSD PLEDFGNEKTQEHFTHNTVRGCSYFYSYPAVCEFLQHNNLLSILRAHEAQDAGYRMYR KSQTTGFPSLITIFSAPNYLDVYNNKAAVLKYENNVMNIRQFNCSPHPYWLPNFM (SEQ ID NO: 79).LEESVALRIITEGASILRQEKNLLDIDAPVTVCGDIHGQFFDLMKLFEVGGSPANTRYLFL GDYVDRGYFSIECVLYLWALKILYPKTLFLLRGNHECRHLTEYFTFKQECKIKYSERVY DACMDAFDCLPLAALMNQQFLCVHGGLSPEINTLDDIRKLDRFKEPPAYGPMCDILWSD PLEDFGNEKTQEHFTHNTVRGCSYFYSYPAVCEFLQHNNLLSILRAHEAQDAGYRMYR KSQTTGFPSLITIFSAPNYLDVYNNKAAVLKYENNVMNIRQFNCSPHPYWLPNFM (SEQ ID NO: 79).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из циклофилина (также известного как циклофилин A; PPIA; CYPA; CYPH; PPIаза А и т.д.). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:In some cases, the dimer element (eg, dimerizer-binding pair) is derived from cyclophilin (also known as cyclophilin A; PPIA; CYPA; CYPH; PPIase A, etc.). For example, a suitable member of a dimerizer-binding pair may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least approximately 95%, at least approximately 98%, or 100% identical to the following amino acid sequence:
MVNPTVFFDIAVDGEPLGRVSFELFADKVPKTAENFRALSTGEKGFGYKGSCFHRIIPGFMVNPTVFFDIAVDGEPLGRVSFELFADKVPKTAENFRALSTGEKGFGYKGSCFHRIIPGF
MCQGGDFTRHNGTGGKSIYGEKFEDENFILKHTGPGILSMANAGPNTNGSQFFICTAKTEMCQGGDFTRHNGTGGKSIYGEKFEDENFILKHTGPGILSMANAGPNTNGSQFFICTAKTE
WLDGKHVVFGKVKEGMNIVEAMERFGSRNGKTSKKITIADCGQLE (SEQ ID NO: 80).WLDGKHVVFGKVKEGMNIVEAMERFGSRNGKTSKKITIADCGQLE (SEQ ID NO: 80).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из MTOR (также известного как с FKBP-рапамицин-ассоциированный белок; FK506-связывающий белок 12-рапамицин-ассоциированный белок 1; FK506-связывающий белок 12-рапамицин-ассоциированный белок 2; FK506-связывающий белок 12-ассоциированный с рапамициновым комплексом белок 1; FRAP; FRAP1; FRAP2; RAFT1; и RAPT1). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности (также известной как Frb: Fbbp-рапамицин-связывающий домен):In some cases, a dimer element (e.g., a dimerizer-binding pair) is derived from MTOR (also known as FKBP-rapamycin-associated protein; FK506-binding protein 12-rapamycin-associated protein 1; FK506-binding protein 12-rapamycin-associated protein 2; FK506-binding protein 12-associated rapamycin complex protein 1; FRAP; FRAP1; FRAP2; RAFT1; and RAPT1). For example, a suitable member of a dimerizer-binding pair may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to the following amino acid sequence (also known as Frb: Fbbp-rapamycin binding domain):
MILWHEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQAYGRMILWHEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQAYGR
DLMEAQEWCRKYMKSGNVKDLLQAWDLYYHVFRRISK (SEQ ID NO: 81).DLMEAQEWCRKYMKSGNVKDLLQAWDLYYHVFRRISK (SEQ ID NO: 81).
- 51 041085- 51 041085
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из GyrB (также известного как субъединица В ДНК-гиразы). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 до приблизительно 200 аминокислот (а.к.), от приблизительно 200 до приблизительно 300 а.к., от приблизительно 300 до приблизительно 400 а.к., от приблизительно 400 до приблизительно 500 а.к., от приблизительно 500 до приблизительно 600 а.к., от приблизительно 600 до приблизительно 700 а.к. или от приблизительно 700 до приблизительно 800 а.к. следующей аминокислотной последовательности GyrB из Escherichia coli (или последовательности субъединицы В ДНКгиразы из любого организма):In some cases, a dimer element (eg, a dimerizer-binding pair) is derived from GyrB (also known as the B subunit of DNA gyrase). For example, a suitable member of a dimerizer-binding pair may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% contiguous amino acid sequence identity from about 100 to about 200 amino acids (a.a.), from about 200 to about 300 a.a., from about 300 to about 400 a.a., from about 400 to about 500 a.a., from about 500 to about 600 a.a., from about 600 to about 700 a.a. or from about 700 to about 800 a.c. the following amino acid sequence of GyrB from Escherichia coli (or the sequence of subunit B of DNA gyrase from any organism):
MSNSYDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNAIDEALAGHCKE IIVTIHADNSVSVQDDGRGIPTGIHPEEGVSAAEVIMTVLHAGGKFDDNSYKVSGGLHGV GVSVVNALSQKLELVIQREGKIHRQIYEHGVPQAPLAVTGETEKTGTMVRFWPSLETFT NVTEFEYEILAKRLRELSFLNSGVSIRLRDKRDGKEDHFHYEGGIKAFVEYLNKNKTPIH PNIFYFSTEKDGIGVEVALQWNDGFQENIYCFTNNIPQRDGGTHLAGFRAAMTRTLNAY MDKEGYSKKAKVSATGDDAREGLIAVVSVKVPDPKFSSQTKDKLVSSEVKSAVEQQM NELLAEYLLENPTDAKIVVGKIIDAARAREAARRAREMTRRKGALDLAGLPGKLADCQ ERDPALSELYLVEGDSAGGSAKQGRNRKNQAILPLKGKILNVEKARFDKMLSSQEVATL ITALGCGIGRDEYNPDKLRYHSIIIMTDADVDGSHIRTLLLTFFYRQMPEIVERGHVYIAQ PPLYKVKKGKQEQYIKDDEAMDQYQISIALDGATLHTNASAPALAGEALEKLVSEYNA TQKMINRMERRYPKAMLKELIYQPTLTEADLSDEQTVTRWVNALVSELNDKEQHGSQ WKFDVHTNAEQNLFEPIVRVRTHGVDTDYPLDHEFITGGEYRRICTLGEKLRGLLEEDA FIERGERRQPVASFEQALDWLVKESRRGLSIQRYKGLGEMNPEQLWETTMDPESRRML RVTVKDAIAADQLFTTLMGDAVEPRRAFIEENALKAANIDI (SEQ ID NO: 82).MSNSYDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNAIDEALAGHCKE IIVTIHADNSVSVQDDGRGIPTGIHPEEGVSAAEVIMTVLHAGGKFDDNSYKVSGGLHGV GVSVVNALSQKLELVIQREGKIHRQIYEHGVPQAPLAVTGETEKTGTMVRFWPSLETFT NVTEFEYEILAKRLRELSFLNSGVSIRLRDKRDGKEDHFHYEGGIKAFVEYLNKNKTPIH PNIFYFSTEKDGIGVEVALQWNDGFQENIYCFTNNIPQRDGGTHLAGFRAAMTRTLNAY MDKEGYSKKAKVSATGDDAREGLIAVVSVKVPDPKFSSQTKDKLVSSEVKSAVEQQM NELLAEYLLENPTDAKIVVGKIIDAARAREAARRAREMTRRKGALDLAGLPGKLADCQ ERDPALSELYLVEGDSAGGSAKQGRNRKNQAILPLKGKILNVEKARFDKMLSSQEVATL ITALGCGIGRDEYNPDKLRYHSIIIMTDADVDGSHIRTLLLTFFYRQMPEIVERGHVYIAQ PPLYKVKKGKQEQYIKDDEAMDQYQISIALDGATLHTNASAPALAGEALEKLVSEYNA TQKMINRMERRYPKAMLKELIYQPTLTEADLSDEQTVTRWVNALVSELNDKEQHGSQ WKFDVHTNAEQNLFEPIVRVRTHGVDTDYPLDHEFITGGEYRRICTLGEKLRGLLEEDA FIERGERRQPVASFEQALDWLVKESRRGLSIQRYKGLGEMNPEQLWETTMDPESRRML RVTVKDAIAADQLFTTLMGDAVEPRRAFIEENALKAANIDI (SEQ ID NO: 82).
В некоторых случаях элемент пары, связывающей димеризатор, содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична аминокислотам 1-220 из вышеуказанной аминокислотной последовательности GyrB из Escherichia coli.In some instances, an element of a dimerizer-binding pair contains an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% identical to amino acids 1-220 of the above GyrB amino acid sequence from Escherichia coli.
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из DHFR (также известного как дигидрофолатредуктаза, DHFRP1 и DYR). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:In some cases, the dimer element (eg, the dimerizer binding pair) is derived from DHFR (also known as dihydrofolate reductase, DHFRP1 and DYR). For example, a suitable member of a dimerizer-binding pair may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least approximately 95%, at least approximately 98%, or 100% identical to the following amino acid sequence:
MVGSLNCIVAVSQNMGIGKNGDLPWPPLRNEFRYFQRMTTTSSVEGKQNLVIMGKKT WFSIPEKNRPLKGRINLVLSRELKEPPQGAHFLSRSLDDALKLTEQPELANKVDMVWIV GGSSVYKEAMNHPGHLKLFVTRIMQDFESDTFFPEIDLEKYKLLPEYPGVLSDVQEEKGI KYKFEVYEKND (SEQ ID NO: 83).(SEQ ID NO: 83).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из DmrB-связывающего домена (т.е. домена гомодимеризации DmrB). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:In some cases, a dimer element (eg, a dimerizer-binding pair) is derived from a DmrB-binding domain (ie, a DmrB homodimerization domain). For example, a suitable member of a dimerizer-binding pair may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least approximately 95%, at least approximately 98%, or 100% identical to the following amino acid sequence:
MASRGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQ EVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID NO: 84).MASRGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQ EVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID NO: 84).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка PYL (также известного как рецептор абсцизовой кислоты и RCAR). Например, элемент рассматриваемой пары, связывающей димеризатор, может быть получен из белков, например белков Arabidopsis thaliana: PYR1, RCAR1(PYL9), PYL1, PYL2, PYL3, PYL4, PYL5, PYL6, PYL7, PYL8 (RCAR3), PYL10, PYL11, PYL12, PYL13. Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере прибли- 52 041085 зительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична любой из следующих аминокислотных последовательностей:In some cases, a dimer element (eg, a dimerizer-binding pair) is derived from the PYL protein (also known as abscisic acid receptor and RCAR). For example, an element of the dimerizer-binding pair in question can be derived from proteins, such as Arabidopsis thaliana proteins: PYR1, RCAR1(PYL9), PYL1, PYL2, PYL3, PYL4, PYL5, PYL6, PYL7, PYL8 (RCAR3), PYL10, PYL11, PYL12, PYL13. For example, a suitable element of a pair that binds a dimerizer may contain an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90% is at least about 95%, at least about 98%, or 100% identical to any of the following amino acid sequences:
PYL10:PYL10:
MNGDETKKVESEYIKKHHRHELVESQCSSTLVKHIKAPLHLVWSIVRRFDEPQKYKPFIS RCVVQGKKLEVGSVREVDLKSGLPATKSTEVLEILDDNEHILGIRIVGGDHRLKNYSSTI SLHSETIDGKTGTLAIESFVVDVPEGNTKEETCFFVEALIQCNLNSLADVTERLQAESME KKI(SEQIDNO: 85).MNGDETKKVESEYIKKHHRHELVESQCSSTLVKHIKAPLHLVWSIVRRFDEPQKYKPFIS RCVVQGKKLEVGSVREVDLKSGLPATKSTEVLEILDDNEHILGIRIVGGDHRLKNYSSTI SLHSETIDGKTGTLAIESFVVDVPEGNTKEETCFFVEALIQCNLNSLADVTERLQAESME KKI(SEQIDNO: 85).
PYL11:PYL11:
METSQKYHTCGSTLVQTIDAPLSLVWSILRRFDNPQAYKQFVKTCNLSSGDGGEGSVRE VTVVSGLPAEFSRERLDELDDESHVMMISIIGGDHRLVNYRSKTMAFVAADTEEKTVVV ESYVVDVPEGNSEEETTSFADTIVGFNLKSLAKLSERVAHLKL (SEQ ID NO: 86).(SEQ ID NO: 86)
PYL12:PYL12:
MKTSQEQHVCGSTVVQTINAPLPLVWSILRRFDNPKTFKHFVKTCKLRSGDGGE GSVREVTVVSDLPASFSLERLDELDDESHVMVISIIGGDHRLVNYQSKTTVFVAAEEEKT VVVESYVVDVPEGNTEEETTLFADTTVGCNLRSLAKLSEKMMELT (SEQ ID NO: 87)(SEQ ID NO: 87)
PYL13:PYL13:
MES SKQKRCRS S VVETIEAPLPLVWSILRSFDKPQ AYQRF VKSCTMRSGGGGGK GGEGKGSVRDVTLVSGFPADFSTERLEELDDESHVMVVSIIGGNHRLVNYKSKTKVVAS PEDMAKKTVVVESYVVDVPEGTSEEDTIFFVDNIIRYNLTSLAKLTKKMMK (SEQ ID NO: 88).MES SKQKRCRS S VVETIEAPLPLVWSILRSFDKPQ AYQRF VKSCTMRSGGGGGK GGEGKGSVRDVTLVSGFPADFSTERLEELDDESHVMVVSIIGGNHRLVNYKSKTKVVAS PEDMAKKTVVVESYVVDVPEGTSEEDTIFFVDNIIRYNLTSLAKLTKKMMK (SEQ ID NO: 88).
PYL1:PYL1:
MANSESSSSPVNEEENSQRISTLHHQTMPSDLTQDEFTQLSQSIAEFHTYQLGNGR CSSLLAQRIHAPPETVWSVVRRFDRPQIYKHFIKSCNVSEDFEMRVGCTRDVNVISGLPA NTSRERLDLLDDDRRVTGFSITGGEHRLRNYKSVTTVHRFEKEEEEERIWTVVLESYVV DVPEGNSEEDTRLFADTVIRLNLQKLASITEAMNRNNNNNNSSQVR (SEQ ID NO: 89).MANSESSSSPVNEEENSQRISTLHQTMPSDLTQDEFTQLSQSIAEFHTYQLGNGR CSSLLAQRIHAPPETVWSVVRRFDRPQIYKHFIKSCNVSEDFEMRVGCTRDVNVISGLPA NTSRERLDLLDDDRRVTGFSITGGEHRLRNYKSVTTVHRFEKEEEEERIWTVVLESYVV DVPEGNSEEDTRLFADTVIRLNLQKLASITEAMNRSENNQVR: NONNQ8.
PYL2:PYL2:
MSSSPAVKGLTDEEQKTLEPVIKTYHQFEPDPTTCTSLITQRIHAPASVVWPLIRRF DNPERYKHFVKRCRLISGDGDVGSVREVTVISGLPASTSTERLEFVDDDHRVLSFRVVG GEHRLKNYKSVTSVNEFLNQDSGKVYTVVLESYTVDIPEGNTEEDTKMFVDTVVKLNL QKLGVAATSAPMHDDE (SEQ ID NO: 90).MSSSPAVKGLTDEEQKTLEPVIKTYHQFEPDPTTCTSLITQRIHAPASVVWPLIRRF DNPERYKHFVKRCRLISGDGDVGSVREVTVISGLPASTSTERLEFVDDDHRVLSFRVVG GEHRLKNYKSVTSVNEFLNQDSGKVYTVVLESYTVDIPEGNTEEDTKMFVDTVVKLNL QKLGVAATSAPMHDDE (SEQ ID: 90).
PYL3:PYL3:
MNLAPIHDPSSSSTTTTSSSTPYGLTKDEFSTLDSIIRTHHTFPRSPNTCTSLIAHRV DAPAHAIWRFVRDFANPNKYKHFIKSCTIRVNGNGIKEIKVGTIREVSVVSGLPASTSVEI LEVLDEEKRILSFRVLGGEHRLNNYRSVTSVNEFVVLEKDKKKRVYSVVLESYIVDIPQG NTEEDTRMFVDTVVKSNLQNLAVISTASPT (SEQ ID NO: 91).MNLAPIHDPSSSSTTTTSSSTPYGLTKDEFSTLDSIIRTHHTFPRSPNTCTSLIAHRV DAPAHAIWRFVRDFANPNKYKHFIKSCTIRVNGNGIKEIKVGTIREVSVVSGLPASTSVEI LEVLDEEKRILSFRVLGGEHRLNNYRSVTSVNEFVVLEKDKKKRVYSVVLESYIVDIPQG NTEEDTRMFVDTVVKSNLQNLAVIST
PYL4:PYL4:
MLAVHRPSSAVSDGDSVQIPMMIASFQKRFPSLSRDSTAARFHTHEVGPNQCCSA VIQEISAPISTVWSVVRRFDNPQAYKHFLKSCSVIGGDGDNVGSLRQVHVVSGLPAASSTMLAVHRPSSAVSDGDSVQIPMMIASFQKRFPSLSRDSTAARFHTHEVGPNQCCSA VIQEISAPISTVWSVVRRFDNPQAYKHFLKSCSVIGGDGDNVGSLRQVHVVSGLPAASST
- 53 041085- 53 041085
ERLDILDDERHVISFSVVGGDHRLSNYRSVTTLHPSPISGTVVVESYVVDVPPGNTKEET CDFVDVIVRCNLQSLAKIAENTAAESKKKMSL (SEQ ID NO: 92).ERLDILDDERHVISFSVVGGDHRLSNYRSVTTLHPSPISGTVVVESYVVDVPPGNTKEET CDFVDVIVRCNLQSLAKIAENTAAESKKKMSL (SEQ ID NO: 92).
PYL5:PYL5:
MRSPVQLQHGSDATNGFHTLQPHDQTDGPIKRVCLTRGMHVPEHVAMHHTHD VGPDQCCSSVVQMIHAPPESVWALVRRFDNPKVYKNFIRQCRIVQGDGLHVGDLREVM VVSGLPAVSSTERLEILDEERHVISFSVVGGDHRLKNYRSVTTLHASDDEGTVVVESYIV DVPPGNTEEETLSFVDTIVRCNLQSLARSTNRQ (SEQ ID NO: 93).MRSPVQLQHGSDATNGFHTLQPHDQTDGPIKRVCLTRGMHVPEHVAMHHTHD VGPDQCCSSVVQMIHAPPESVWALVRRFDNPKVYKNFIRQCRIVQGDGLHVGDLREVM VVSGLPAVSSTERLEILDEERHVISFSVVGGDHRLKNYRSVTTLHASDDEGTVVVESYIV DVPPGNTEEETLSFVDTIVRCNLQSENRQ3.
PYL6:PYL6:
MPTSIQFQRSSTAAEAANATVRNYPHHHQKQVQKVSLTRGMADVPEHVELSHT HVVGPSQCFSVVVQDVEAPVSTVWSILSRFEHPQAYKHFVKSCHVVIGDGREVGSVREV RVVSGLPAAFSLERLEIMDDDRHVISFSVVGGDHRLMNYKSVTTVHESEEDSDGKKRTR VVESYVVDVPAGNDKEETCSFADTIVRCNLQSLAKLAENTSKFS (SEQ ID NO: 94).MPTSIQFQRSSTAAEAANATVRNYPHHHQKQVQKVSLTRGMADVPEHVELSHT HVVGPSQCFSVVVQDVEAPVSTVWSILSRFEHPQAYKHFVKSCHVVIGDGREVGSVREV RVVSGLPAAFSLERLEIMDDDRHVISFSVVGGDHRLMNYKSVTTVQHESEEDSDGKKRTR VVESYVVDVPAGNDKETSLFADTIVRCN4.
PYL7:PYL7:
MEMIGGDDTDTEMYGALVTAQSLRLRHLHHCRENQCTSVLVKYIQAPVHLVWS LVRRFDQPQKYKPFISRCTVNGDPEIGCLREVNVKSGLPATTSTERLEQLDDEEHILGINII GGDHRLKNYSSILTVHPEMIDGRSGTMVMESFVVDVPQGNTKDDTCYFVESLIKCNLKS LACVSERLAAQDITNSIATFCNASNGYREKNHTETNL (SEQ ID NO: 95).MEMIGGDDTDTEMYGALVTAQSLRHLHHCRENQCTSVLVKYIQAPVHLVWS LVRRFDQPQKYKPFISRCTVNGDPEIGCLREVNVKSGLPATTSTERLEQLDDEEHILGINII GGDHRLKNYSSILTVHPEMIDGRSGTMVMESFVVDVPQGNTKDTCYFVESLIKCNLKS LACVSERLAAQDITNSIATFCNASNGYREKNHTETN 5.
PYL8:PYL8:
MEANGIENLTNPNQEREFIRRHHKHELVDNQCSSTLVKHINAPVHIVWSLVRRFD QPQKYKPFISRCVVKGNMEIGTVREVDVKSGLPATRSTERLELLDDNEHILSIRIVGGDH RLKNYSSIISLHPETIEGRIGTLVIESFVVDVPEGNTKDETCYFVEALIKCNLKSLADISERL AVQDTTESRV (SEQ ID NO: 96).MEANGIENLTNPNQEREFIRRHHKHELVDNQCSSTLVKHINAPVHIVWSLVRRFD QPQKYKPFISRCVVKGNMEIGTVREVDVKSGLPATRSTERLELLDDNEHILSIRIVGGDH RLKNYSSIISLHPETIEGRIGTLVIESFVVDVPEGNTKDETCYFVEALIKCNLKSLADISERL AVQDTTESRV (SEQ ID NO: 96).
PYL9:PYL9:
MMDGVEGGTAMYGGLETVQYVRTHHQHLCRENQCTSALVKHIKAPLHLVWSL VRRFDQPQKYKPFVSRCTVIGDPEIGSLREVNVKSGLPATTSTERLELLDDEEHILGIKIIG GDHRLKNYSSILTVHPEIIEGRAGTMVIESFVVDVPQGNTKDETCYFVEALIRCNLKSLA DVSERLASQDITQ (SEQ ID NO: 97).MMDGVEGGTAMYGGLETVQYVRTHHQHLCRENQCTSALVKHIKAPLHLVWSL VRRFDQPQKYKPFVSRCTVIGDPEIGSLREVNVKSGLPATTSTERLELLDDEEHILGIKIIG GDHRLKNYSSILTVHPEIIEGRAGTMVIESFVVDVPQGNTKDETCYFVEALIRCNLKSLA DVSERLASQDITQ (SEQ ID NO: 97).
PYRl:PYRL:
MPSELTPEERSELKNSIAEFHTYQLDPGSCSSLHAQRIHAPPELVWSIVRRFDKPQ TYKHFIKSCSVEQNFEMRVGCTRDVIVISGLPANTSTERLDILDDERRVTGFSIIGGEHRL TNYKSVTTVHRFEKENRIWTVVLESYVVDMPEGNSEDDTRMFADTVVKLNLQKLATV AEAMARNSGDGSGSQVT (SEQ ID NO: 98).MPSELTPEERSELKNSIAEFHTYQLDPGSCSSLHAQRIHAPPELVWSIVRRFDKPQ TYKHFIKSCSVEQNFEMRVGCTRDVIVISGLPANTSTERLDILDDERRVTGFSIIGGEHRL TNYKSVTTVHRFEKENRIWTVVLESYVVDMPEGNSEDDTRMFADTVVKLNLQKLATV AEAMARNSGDGSGSQVT (SEQ ID NO: 98).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка ABI (также известного как нечувствительный к абсцизовой кислоте белок). Например, элемент рассматриваемой пары, связывающей димеризатор, может быть получен из белков, таких как белки Arabidopsis thaliana: ABI1 (также известный как нечувствительный к абсцизовой кислоте белок 1, протеинфосфатаза 2С 56, AtPP2C56, Р2С56 и РР2С ABI1) и/или ABI2 (также известный как Р2С77, протеинфосфатаза 2С 77, AtPP2C77, нечувствительный к абсцизовой кислоте белок 2, протеинфосфатаза 2С ABI2 и РР2С ABI2). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 до приблизительно 110 аминокислот (а.к.), от приблизительно 110 до приблизительно 115 а.к., от приблизительно 115 до приблизительно 120 а.к., от приблизительно 120 до приблизительно 130 а.к., от приблизительно 130 до приблизительно 140 а.к., от приблизительно 140 до приблизительно 150 а.к., от приблизительно 150 до приблизительно 160 а.к., от приблизительно 160 до приблизительно 170 а.к., от приблизительно 170 до приблизительно 180 а.к., от приблизительно 180 до приблизительно 190 а.к. или от приблизительно 190 до приблизительно 200 а.к. любой из следующих аминокислотных последовательностей:In some cases, a dimer element (eg, a dimerizer-binding pair) is derived from an ABI protein (also known as an abscisic acid insensitive protein). For example, an element of the dimerizer binding pair in question can be derived from proteins such as the Arabidopsis thaliana proteins: ABI1 (also known as abscisic acid insensitive protein 1, protein phosphatase 2C56, AtPP2C56, P2C56 and PP2C ABI1) and/or ABI2 (also known as P2C77, protein phosphatase 2C 77, AtPP2C77, abscisic acid insensitive protein 2, protein phosphatase 2C ABI2 and PP2C ABI2). For example, a suitable member of a dimerizer-binding pair may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% contiguous amino acid sequence identity from about 100 to about 110 amino acids (a.a.), from about 110 to about 115 a.a., from about 115 to about 120 a.a., from about 120 to about 130 a.a., from about 130 to about 140 a.a., from about 140 to about 150 a.a., from about 150 to about 160 a.a., about 160 to about 170 a.a., from about 170 to about 180 a.a., from about 180 to about 190 a.a. or from about 190 to about 200 a.c. any of the following amino acid sequences:
- 54 041085- 54 041085
ABIlABIl
MEEVSPAIAGPFRPFSETQMDFTGIRLGKGYCNNQYSNQDSENGDLMVSLPETSSCSVSG SHGSESRKVLISRINSPNLNMKESAAADIVVVDISAGDEINGSDITSEKKMISRTESRSLFEMEEVSPAIAGPFRPFSETQMDFTGIRLGKGYCNNQYSNQDSENGDLMVSLPETSSCSVSG SHGSESRKVLISRINSPNLNMKESAAADIVVVDISAGDEINGSDITSEKKMISRTESRSLFE
FKSVPLYGFTSICGRRPEMEDAVSTIPRFLQSSSGSMLDGRFDPQSAAHFFGVYDGHGGS QVANYCRERMHLALAEEIAKEKPMLCDGDTWLEKWKKALFNSFLRVDSEIESVAPETV GSTSVVAVVFPSHIFVANCGDSRAVLCRGKTALPLSVDHKPDREDEAARIEAAGGKVIQ WNGARVFGVLAMSRSIGDRYLKPSIIPDPEVTAVKRVKEDDCLILASDGVWDVMTDEE ACEMARKRILLWHKKNAVAGDASLLADERRKEGKDPAAMSAAEYLSKLAIQRGSKDN ISVVVVDLKPRRKLKSKPLN (SEQ ID NO: 99).FKSVPLYGFTSICGRRPEMEDAVSTIPRFLQSSSGSMLDGRFDPQSAAHFFGVYDGHGGS QVANYCRERMHLALAEEIAKEKPMLCDGDTWLEKWKKALFNSFLRVDSEIESVAPETV GSTSVVAVVFPSHIFVANCGDSRAVLCRGKTALPLSVDHKPDREDEAARIEAAGGKVIQ WNGARVFGVLAMSRSIGDRYLKPSIIPDPEVTAVKRVKEDDCLILASDGVWDVMTDEE ACEMARKRILLWHKKNAVAGDASLLADERRKEGKDPAAMSAAEYLSKLAIQRGSKDN ISVVVVDLKPRRKLKSKPLN (SEQ ID NO: 99).
ABi2:ABi2:
MDEVSPAVAVPFRPFTDPHAGLRGYCNGESRVTLPESSCSGDGAMKDSSFEINTRQDSL T S S S S AMAGVDIS AGDEINGSDEFDPRSMNQ SEKKVL SRTESRSLFEFKC VPL YGVT SICG RRPEMEDS VSTIPRFLQ VS S S SLLDGRVTNGFNPHLS AHFFGVYDGHGGSQ VANYCRER MHLALTEEIVKEKPEFCDGDTWQEKWKKALFNSFMRVDSEIETVAHAPETVGSTSVVA VVFPTHIFVANCGDSRAVLCRGKTPLALSVDHKPDRDDEAARIEAAGGKVIRWNGARVMDEVSPAVAVPFRPFTDPHAGLRGYCNGESRVTLPESSCSGDGAMKDSSFEINTRQDSL T S S S S AMAGVDIS AGDEINGSDEFDPRSMNQ SEKKVL SRTESRSLFEFKC VPL YGVT SICG RRPEMEDS VSTIPRFLQ VS S S SLLDGRVTNGFNPHLS AHFFGVYDGHGGSQ VANYCRER MHLALTEEIVKEKPEFCDGDTWQEKWKKALFNSFMRVDSEIETVAHAPETVGSTSVVA VVFPTHIFVANCGDSRAVLCRGKTPLALSVDHKPDRDDEAARIEAAGGKVIRWNGARV
FGVLAMSRSIGDRYLKPSVIPDPEVTSVRRVKEDDCLILASDGLWDVMTNEEVCDLARKFGVLAMSRSIGDRYLKPSVIPDPEVTSVRRVKEDDCLILASDGLWDVMTNEEVCDLARK
RILLWHKKNAMAGEALLPAEKRGEGKDPAAMSAAEYLSKMALQKGSKDNISVVVVDL KGIRKFKSKSLN (SEQ ID NO: 100).RILLWHKKNAMAGEALLPAEKRGEGKDPAAMSAAEYLSKMALQKGSKDNISVVVVDL KGIRKFKSKSLN (SEQ ID NO: 100).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка Cry2 (также известного как криптохром 2). Например, элемент рассматриваемого димера (например, пары, связывающей димеризатор) может быть получен из белков Cry2 из любого организма (например, растения), такого как, но не ограничиваясь ими, Arabidopsis thaliana. Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 до приблизительно 110 аминокислот (а.к.), от приблизительно 110 до приблизительно 115 а.к., от приблизительно 115 до приблизительно 120 а.к., от приблизительно 120 до приблизительно 130 а.к., от приблизительно 130 до приблизительно 140 а.к., от приблизительно 140 до приблизительно 150 а.к., от приблизительно 150 до приблизительно 160 а.к., от приблизительно 160 до приблизительно 170 а.к., от приблизительно 170 до приблизительно 180 а.к., от приблизительно 180 до приблизительно 190 а.к. или от приблизительно 190 до приблизительно 200 а.к. любой из следующих аминокислотных последовательностей:In some cases, a dimer element (eg, a dimerizer-binding pair) is derived from the Cry2 protein (also known as cryptochrome 2). For example, a member of the dimer in question (eg, a dimerizer-binding pair) can be derived from Cry2 proteins from any organism (eg, plant), such as, but not limited to, Arabidopsis thaliana. For example, a suitable member of a dimerizer-binding pair may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% contiguous amino acid sequence identity from about 100 to about 110 amino acids (a.a.), from about 110 to about 115 a.a., from about 115 to about 120 a.a., from about 120 to about 130 a.a., from about 130 to about 140 a.a., from about 140 to about 150 a.a., from about 150 to about 160 a.a., about 160 to about 170 a.a., from about 170 to about 180 a.a., from about 180 to about 190 a.a. or from about 190 to about 200 a.c. any of the following amino acid sequences:
Cry2 (Arabidopsis thaliana)Cry2 (Arabidopsis thaliana)
MKMDKKTIVWFRRDLRIEDNPALAAAAHEGSVFPVFIWCPEEEGQFYPGRASRWWMKMKMDKKTIVWFRRDLRIEDNPALAAAAHEGSVFPVFIWCPEEEGQFYPGRASRWWMK
QSLAHLSQSLKALGSDLTLIKTHNTISAILDCIRVTGATKVVFNHLYDPVSLVRDHTVKE KLVERGISVQSYNGDLLYEPWEIYCEKGKPFTSFNSYWKKCLDMSIESVMLPPPWRLMP ITAAAEAIWACSIEELGLENEAEKPSNALLTRAWSPGWSNADKLLNEFIEKQLIDYAKNS KKVVGNSTSLLSPYLHFGEISVRHVFQCARMKQIIWARDKNSEGEESADLFLRGIGLREY SRYICFNFPFTHEQSLLSHLRFFPWDADVDKFKAWRQGRTGYPLVDAGMRELWATGW MHNRIRVIVSSFAVKFLLLPWKWGMKYFWDTLLDADLECDILGWQYISGSIPDGHELDR LDNPALQGAKYDPEGEYIRQWLPELARLPTEWIHHPWDAPLTVLKASGVELGTNYAKPI VDIDTARELLAKAISRTREAQIMIGAAPDEIVADSFEALGANTIKEPGLCPSVSSNDQQVPQSLAHLSQSLKALGSDLTLIKTHNTISAILDCIRVTGATKVVFNHLYDPVSLVRDHTVKE KLVERGISVQSYNGDLLYEPWEIYCEKGKPFTSFNSYWKKCLDMSIESVMLPPPWRLMP ITAAAEAIWACSIEELGLENEAEKPSNALLTRAWSPGWSNADKLLNEFIEKQLIDYAKNS KKVVGNSTSLLSPYLHFGEISVRHVFQCARMKQIIWARDKNSEGEESADLFLRGIGLREY SRYICFNFPFTHEQSLLSHLRFFPWDADVDKFKAWRQGRTGYPLVDAGMRELWATGW MHNRIRVIVSSFAVKFLLLPWKWGMKYFWDTLLDADLECDILGWQYISGSIPDGHELDR LDNPALQGAKYDPEGEYIRQWLPELARLPTEWIHHPWDAPLTVLKASGVELGTNYAKPI VDIDTARELLAKAISRTREAQIMIGAAPDEIVADSFEALGANTIKEPGLCPSVSSNDQQVP
SAVRYNGSKRVKPEEEEERDMKKSRGFDERELFSTAESSSSSSVFFVSQSCSLASEGKNLSAVRYNGSKRVKPEEEEERDMKKSRGFDERELFSTAESSSSSSVFFVSQSCSLASEGKNL
EGIQDSSDQITTSLGKNGCK (SEQ ID NO: 101)EGIQDSSDQITTSLGKNGCK (SEQ ID NO: 101)
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из бел ка CIB1 Arabidopsis thaliana (также известного как транскрипционный фактор bHLH63). Например, подходящий элемент димера (например, пары, связывающий димеризатор) может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 до приблизительно 110 аминокислот (а.к.), от приблизительно 110 до приблизительно 115 а.к., от приблизительно 115 до приблизительно 120 а.к., от приблизительно 120 до приблизительно 130 а.к., от приблизительно 130 до приблизительно 140 а.к., от приблизительно 140 до приблизительно 150 а.к., от приблизительно 150 до приблизительно 160 а.к., от приблизительно 160 до приблизительно 170 а.к., от приблизительно 170 до приблизительно 180 а.к., от приблизительно 180 до приблизительно 190 а.к. или от приблизительно 190 до приблизительно 200 а.к. следующей аминокислотной последовательности:In some cases, the element of the dimer (eg, the dimerizer-binding pair) is derived from the Arabidopsis thaliana CIB1 protein (also known as the bHLH63 transcription factor). For example, a suitable dimer element (e.g., a pair that binds a dimerizer) may contain an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90% , at least about 95%, at least about 98%, or 100% identical to a contiguous stretch of amino acid sequence from about 100 to about 110 amino acids (a.a.), from about 110 to about 115 a.a., from about 115 to about 120 a.a., from about 120 to about 130 a.a., from about 130 to about 140 a.a., from about 140 to about 150 a.a., from about 150 to about 160 a.a. .k., from about 160 to about 170 a.k., from about 170 to about 180 a.k., from about 180 to about 190 a.k. or from about 190 to about 200 a.c. following amino acid sequence:
- 55 041085- 55 041085
MNGAIGGDLLLNFPDMSVLERQRAHLKYLNPTFDSPLAGFFADSSMITGGEMDSYLSTA GLNLPMMYGETTVEGDSRLSISPETTLGTGNFKKRKFD TETKD CNEKKKKMTMNRDDL VEEGEEEKSKITEQNNGSTKSIKKMKHKAKKEENNFSNDSSKVTKELEKTDYIHVRARR GQATDSHSIAERVRREKISERMKFLQDLVPGCDKITGKAGMLDEIINYVQSLQRQIEFLS MKLAIVNPRPDFDMDDIFAKEVASTPMTVVPSPEMVLSGYSHEMVHSGYSSEMVNSGYMNGAIGGDLLLNFPDMSVLERQRAHLKYLNPTFDSPLAGFFADSSMITGGEMDSYLSTA GLNLPMMYGETTVEGDSRLSISPETTLGTGNFKKRKFD TETKD CNEKKKKMTMNRDDL VEEGEEEKSKITEQNNGSTKSIKKMKHKAKKEENNFSNDSSKVTKELEKTDYIHVRARR GQATDSHSIAERVRREKISERMKFLQDLVPGCDKITGKAGMLDEIINYVQSLQRQIEFLS MKLAIVNPRPDFDMDDIFAKEVASTPMTVVPSPEMVLSGYSHEMVHSGYSSEMVNSGY
LHVNPMQQVNTSSDPLSCFNNGEAPSMWDSHVQNLYGNLGV (SEQ ID NO: 102).LHVNPMQQVNTSSDPLSCFNNGEAPSMWDSHVQNLYGNLGV (SEQ ID NO: 102).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка GAI Arabidopsis thaliana (также известного как нечувствительный к гибберелловой кислоте белок и белок GAI семейства DELLA). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 до приблизительно 110 аминокислот (а.к.), от приблизительно 110 до приблизительно 115 а.к., от приблизительно 115 до приблизительно 120 а.к., от приблизительно 120 до приблизительно 130 а.к., от приблизительно 130 до приблизительно 140 а.к., от приблизительно 140 до приблизительно 150 а.к., от приблизительно 150 до приблизительно 160 а.к., от приблизительно 160 до приблизительно 170 а.к., от приблизительно 170 до приблизительно 180 а.к., от приблизительно 180 до приблизительно 190 а.к. или от приблизительно 190 до приблизительно 200 а.к. следующей аминокислотной последовательности:In some cases, a dimer element (eg, a dimerizer-binding pair) is derived from the GAI protein of Arabidopsis thaliana (also known as the gibberellic acid-insensitive protein and the GAI protein of the DELLA family). For example, a suitable member of a dimerizer-binding pair may comprise an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, or 100% contiguous amino acid sequence identity from about 100 to about 110 amino acids (a.a.), from about 110 to about 115 a.a., from about 115 to about 120 a.a., from about 120 to about 130 a.a., from about 130 to about 140 a.a., from about 140 to about 150 a.a., from about 150 to about 160 a.a., about 160 to about 170 a.a., from about 170 to about 180 a.a., from about 180 to about 190 a.a. or from about 190 to about 200 a.c. following amino acid sequence:
MKRDHHHHHHQDKKTMMMNEEDDGNGMDELLAVLGYKVRSSEMADVAQKLEQLEVMKRDHHHHHHQDKKTMMMNEEDDGNGMDELLAVLGYKVRSSEMADVAQKLEQLEV
MMSNVQEDDLSQLATETVHYNPAELYTWLDSMLTDLNPPSSNAEYDLKAIPGDAILNQ FAIDSASSSNQGGGGDTYTTNKRLKCSNGVVETTTATAESTRHVVLVDSQENGVRLVH ALLACAEAVQKENLTVAEALVKQIGFLAVSQIGAMRKVATYFAEALARRIYRLSPSQSPI DHSLSDTLQMHFYETCPYLKFAHFTANQAILEAFQGKKRVHVIDFSMSQGLQWPALMQ ALALRPGGPPVFRLTGIGPPAPDNFDYLHEVGCKLAHLAEAIHVEFEYRGFVANTLADL DASMLELRPSEIESVAVNSVFELHKLLGRPGAIDKVLGVVNQIKPEIFTVVEQESNHNSPI FLDRFTESLHYYSTLFDSLEGVPSGQDKVMSEVYLGKQICNVVACDGPDRVERHETLSQ WRNRFGSAGFAAAHIGSNAFKQASMLLALFNGGEGYRVEESDGCLMLGWHTRPLIATS AWKLSTN (SEQ ID NO: 103).MMSNVQEDDLSQLATETVHYNPAELYTWLDSMLTDLNPPSSNAEYDLKAIPGDAILNQ FAIDSASSSNQGGGGDTYTTNKRLKCSNGVVETTTATAESTRHVVLVDSQENGVRLVH ALLACAEAVQKENLTVAEALVKQIGFLAVSQIGAMRKVATYFAEALARRIYRLSPSQSPI DHSLSDTLQMHFYETCPYLKFAHFTANQAILEAFQGKKRVHVIDFSMSQGLQWPALMQ ALALRPGGPPVFRLTGIGPPAPDNFDYLHEVGCKLAHLAEAIHVEFEYRGFVANTLADL DASMLELRPSEIESVAVNSVFELHKLLGRPGAIDKVLGVVNQIKPEIFTVVEQESNHNSPI FLDRFTESLHYYSTLFDSLEGVPSGQDKVMSEVYLGKQICNVVACDGPDRVERHETLSQ WRNRFGSAGFAAAHIGSNAFKQASMLLALFNGGEGYRVEESDGCLMLGWHTRPLIATS AWKLSTN (SEQ ID NO: 103).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка GID1 Arabidopsis thaliana (также известного как рецептор гибберелловой кислоты GID1). Например, подходящий элемент димера может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 до приблизительно 110 аминокислот (а.к.), от приблизительно 110 до приблизительно 115 а.к., от приблизительно 115 до приблизительно 120 а.к., от приблизительноIn some instances, the dimer element (eg, the dimerizer-binding pair) is derived from the Arabidopsis thaliana GID1 protein (also known as the GID1 gibberellic acid receptor). For example, a suitable dimer element may contain an amino acid sequence that is at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95% , at least about 98% or 100% identical to a contiguous stretch of amino acid sequence from about 100 to about 110 amino acids (a.a.), from about 110 to about 115 a.a., from about 115 to about 120 a.a. ., from approx.
120 до приблизительно 130 а.к., от приблизительно 130 до приблизительно 140 а.к., от приблизительно120 to about 130 a.a., from about 130 to about 140 a.a., from about
140 до приблизительно 150 а.к., от приблизительно 150 до приблизительно 160 а.к., от приблизительно140 to about 150 a.a., from about 150 to about 160 a.a., from about
160 до приблизительно 170 а.к., от приблизительно 170 до приблизительно 180 а.к., от приблизительно160 to about 170 a.a., from about 170 to about 180 a.a., from about
180 до приблизительно 190 а.к. или от приблизительно 190 до приблизительно 200 а.к. любой из следующих аминокислотных последовательностей:180 to about 190 a.a. or from about 190 to about 200 a.c. any of the following amino acid sequences:
GID1A:GID1A:
MAASDEVNLIESRTVVPLNTWVLISNFKVAYNILRRPDGTFNRHLAEYLDRKVTANANP VDGVFSFDVLIDRRINLLSRVYRPAYADQEQPPSILDLEKPVDGDIVPVILFFHGGSFAHS SANSAIYDTLCRRLVGLCKCVVVSVNYRRAPENPYPCAYDDGWIALNWVNSRSWLKS KKDSKVHIFLAGDSSGGNIAHNVALRAGESGIDVLGNILLNPMFGGNERTESEKSLDGK YFVTVRDRDWYWKAFLPEGEDREHPACNPFSPRGKSLEGVSFPKSLVVVAGLDLIRDW QLAYAEGLKKAGQEVKLMHLEKATVGFYLLPNNNHFHNVMDEISAFVNAEC (SEQ ID NO: 104).MAASDEVNLIESRTVVPLNTWVLISNFKVAYNILRRPDGTFNRHLAEYLDRKVTANANP VDGVFSFDVLIDRRINLLSRVYRPAYADQEQPPSILDLEKPVDGDIVPVILFFHGGSFAHS SANSAIYDTLCRRLVGLCKCVVVSVNYRRAPENPYPCAYDDGWIALNWVNSRSWLKS KKDSKVHIFLAGDSSGGNIAHNVALRAGESGIDVLGNILLNPMFGGNERTESEKSLDGK YFVTVRDRDWYWKAFLPEGEDREHPACNPFSPRGKSLEGVSFPKSLVVVAGLDLIRDW QLAYAEGLKKAGQEVKLMHLEKATVGFYLLPNNNHFHNVMDEISAFVNAEC (SEQ ID NO: 104).
- 56 041085- 56 041085
GID IB:GIDIB:
MAGGNEVNLNECKRIVPLNTWVLISNFKLAYKVLRRPDGSFNRDLAEFLDRKVPANSFPMAGGNEVNLNECKRIVPLNTWVLISNFKLAYKVLRRPPDGSFNRDLAEFLDRKVPANSFP
LDGVFSFDHVDSTTNLLTRIYQPASLLHQTRHGTLELTKPLSTTEIVPVLIFFHGGSFTHSS ANSAIYDTFCRRLVTICGVVVVSVDYRRSPEHRYPCAYDDGWNALNWVKSRVWLQSG KDSNVYVYLAGDSSGGNIAHNVAVRATNEGVKVLGNILLHPMFGGQERTQSEKTLDGK YFVTIQDRDWYWRAYLPEGEDRDHPACNPFGPRGQSLKGVNFPKSLVVVAGLDLVQD WQLAYVDGLKKTGLEVNLLYLKQATIGFYFLPNNDHFHCLMEELNKFVHSIEDSQSKSS PVLLTP (SEQ ID NO: 105).LDGVFSFDHVDSTTNLLTRIYQPASLLHQTRHGTLELTKPLSTTEIVPVLIFFHGGSFTHSS ANSAIYDTFCRRLVTICGVVVVSVDYRRSPEHRYPCAYDDGWNALNWVKSRVWLQSG KDSNVYVYLAGDSSGGNIAHNVAVRATNEGVKVLGNILLHPMFGGQERTQSEKTLDGK YFVTIQDRDWYWRAYLPEGEDRDHPACNPFGPRGQSLKGVNFPKSLVVVAGLDLVQD WQLAYVDGLKKTGLEVNLLYLKQATIGFYFLPNNDHFHCLMEELNKFVHSIEDSQSKSS PVLLTP (SEQ ID NO: 105).
GID1C:GID1C:
MAGSEEVNLIESKTVVPLNTWVLISNFKLAYNLLRRPDGTFNRHLAEFLDRKVPANANPMAGSEEVNLIESKTVVPLNTWVLISNFKLAYNLLRRPDGTFNRHLAEFLDRKVPANANP
VNGVFSFDVIIDRQTNLLSRVYRPADAGTSPSITDLQNPVDGEIVPVIVFFHGGSFAHSSAVNGVFSFDVIIDRQTNLLSRVYRPADAGTSPSITDLQNPVDGEIVPVIVFFHGGSFAHSSA
NS AI YDTLC RRLVGLCG A V V VS VN YRR APENR YPC A YDDG W A VLK W VNS S SWLRSKK DSKVRIFLAGDSSGGNIVHNVAVRAVESRIDVLGNILLNPMFGGTERTESEKRLDGKYFV TVRDRDWYWRAFLPEGEDREHPACSPFGPRSKSLEGLSFPKSLVVVAGLDLIQDWQLK YAEGLKKAGQEVKLLYLEQATIGFYLLPNNNHFHTVMDEIAAFVNAECQ (SEQ ID NO: 106).NS AI YDTLC RRLVGLCG A V V VS VN YRR APENR YPC A YDDG W A VLK W VNS S SWLRSKK DSKVRIFLAGDSSGGNIVHNVAVRAVESRIDVLGNILLNPMFGGTERTESEKRLDGKYFV TVRDRDWYWRAFLPEGEDREHPACSPFGPRSKSLEGLSFPKSLVVVAGLDLIQDWQLK YAEGLKKAGQEVKLLYLEQATIGFYLLPNNNHFHTVMDEIAAFVNAECQ (SEQ ID NO: 106).
Как легко понять, CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, или библиотеки синтетических модульных полипептидов CAR, может быть модифицирован, например, путем добавления одного или более доменов (например, комодулирующих доменов), путем удаления одного или более доменов (например, путем удаления флуоресцентного репортера, используемого в процессе скрининга), путем разделения CAR на два полипептида (и добавления доменов димеризации), путем перегруппировки доменов и т.д.As is readily understood, a CAR identified by screening a nucleic acid library encoding synthetic CAR modular polypeptides or a library of synthetic CAR modular polypeptides can be modified, for example, by adding one or more domains (e.g., comodulatory domains), by deleting one or more domains (eg, by removing the fluorescent reporter used in the screening process), by splitting the CAR into two polypeptides (and adding dimerization domains), by rearranging the domains, and so on.
В некоторых случаях библиотека может быть подвергнута скринингу для определения фенотипа, связанного с клеточным ответом на конкретную клеточную среду. В этой связи клеточный фенотип может быть определен по ответу клетки (например, на основании активации или ингибирования) на воздействие определенной среды. Например, ответ Т-клеток можно оценить в ответ на воздействие конкретной клеточной среды. Согласно некоторым вариантам реализации настоящего изобретения ингибирование Тклеток можно оценить в ответ на воздействие микроокружения опухоли.In some cases, the library may be screened to determine the phenotype associated with a cellular response to a particular cellular environment. In this regard, the cellular phenotype can be determined by the response of the cell (for example, based on activation or inhibition) to the impact of a particular environment. For example, the response of T cells can be assessed in response to exposure to a particular cellular environment. In some embodiments of the present invention, T cell inhibition can be assessed in response to exposure to the tumor microenvironment.
В некоторых случаях библиотека может быть подвергнута скринингу для определения фенотипа, связанного с локализацией клеток, например, под влиянием хоуминга или нацеливания на клетку. Следовательно, может быть проведен скрининг, чтобы определить влияние элементов библиотеки на нацеливание на клетку. Например, клеточная библиотека может быть введена в организм-хозяина, и клетки библиотеки могут быть выделены из целевого положения организма-хозяина через некоторое время, чтобы оценить, какие клетки были успешно направлены к целевому положению. В некоторых случаях Тклетки могут быть количественно исследованы, чтобы определить их нацеливание на опухоль в условиях in vivo.In some cases, the library may be screened to determine the phenotype associated with the localization of cells, for example, under the influence of homing or targeting the cell. Therefore, screening can be performed to determine the effect of library elements on cell targeting. For example, a cell library can be introduced into a host organism, and the cells of the library can be isolated from the target position of the host organism after some time to assess which cells were successfully directed to the target position. In some cases, T cells can be quantified to determine their tumor targeting in vivo.
В некоторых случаях библиотека может быть подвергнута скринингу для определения фенотипа, специфичного для состояния пациента. Специфичные для пациента состояния, подвергнутые скринингу указанным способом, будут сильно различаться и могут включать состояния, связанные с конкретным патологическим состоянием пациента, и могут включать скрининг библиотеки для идентификации конкретного элемента(ов) библиотеки, проявляющего усиленный или оптимальный фенотип, специфичный для состояния пациента. В некоторых случаях локализация элементов клеточной библиотеки может быть оценена после контакта с эксплантом или ксенотрансплантатом, полученным от пациента. Например, локализация Т-клеток клеточной библиотеки Т-клеток, экспрессирующих CAR, может быть оценена после контакта с ксенотрансплантатом опухоли, специфичной для пациента. В некоторых случаях пролиферация элементов клеточной библиотеки может быть оценена после контакта с эксплантом или ксенотрансплантатом, полученным от пациента. Например, пролиферация Т-клеток клеточной библиотеки Т-клеток, экспрессирующих CAR, может быть оценена после контакта с ксенотрансплантатом опухоли, специфичной для пациента. В некоторых случаях специфичный для пациента эксплантат или ксенотрансплантат может быть количественно исследован для определения увеличения или уменьшения жизнеспособности после контакта с клеточной библиотекой или конкретными элементами клеточной библиотеки. Например, гибель Т-клеток библиотеки Т-клеток, экспрессирующих CAR, может быть оценена после контакта с ксенотрансплантатом опухоли, специфичной для пациента. В этой связи библиотека может быть подвергнута скринингу для идентификации оптимального элемента(ов) библиотеки для лечения конкретного пациента.In some cases, the library may be screened for a phenotype specific to the patient's condition. Patient-specific conditions screened in this manner will vary greatly and may include conditions associated with a particular pathological condition of the patient and may include library screening to identify specific library element(s) exhibiting an enhanced or optimal phenotype specific to the patient's condition. In some cases, the localization of elements of the cell library can be assessed after contact with the explant or xenograft obtained from the patient. For example, T cell localization of a CAR expressing T cell library can be assessed upon contact with a patient-specific tumor xenograft. In some cases, the proliferation of cell library elements can be assessed after contact with an explant or xenograft obtained from a patient. For example, T cell proliferation of a CAR expressing T cell library can be assessed upon contact with a patient-specific tumor xenograft. In some cases, a patient-specific explant or xenograft can be quantitatively examined to determine the increase or decrease in viability after contact with the cell library or specific elements of the cell library. For example, T cell death of a CAR expressing T cell library can be assessed upon contact with a patient-specific tumor xenograft. In this regard, the library can be screened to identify the optimal element(s) of the library for the treatment of a particular patient.
В некоторых случаях фенотипы могут быть количественно исследованы в условиях in vitro с помощью динамической иммунизации антигеном. Под динамической иммунизацией антигеном подразумевают, что фенотип оценивают не только для определения присутствия или отсутствия антигена, и, следовательно, антиген может динамически варьироваться, например динамически варьироваться в диапазоне концентраций, динамически варьироваться в течение определенного периода времени и т.д. Например,In some cases, phenotypes can be quantified in vitro using dynamic antigen immunization. By dynamic immunization with an antigen, it is meant that the phenotype is not only assessed to determine the presence or absence of an antigen, and therefore the antigen can vary dynamically, for example, dynamically vary over a range of concentrations, dynamically vary over a certain period of time, etc. For example,
- 57 041085 уровни антигена могут быть протитрованы (например, с использованием различных концентраций), чтобы оценить фенотип, который подвергают скринингу, при различных дозах, т.е. для оценки ответа в зависимости от дозы. Антиген может быть представлен в разных концентрациях любым удобным способом. В качестве неограничивающего примера различные количества антигена могут быть представлены с использованием клеток, экспрессирующих антиген на разных уровнях, включая диапазон уровней. В некоторых случаях время применения антигена можно динамически варьировать, например, чтобы оценить фенотип в количественном исследовании в зависимости от времени или оценить кинетику фенотипа, который подвергают скринингу. В некоторых случаях библиотека может быть подвергнута скринингу для определения отличительной черты фенотипа. В настоящей заявке термин отличительная черта фенотипа обычно относится к комбинации отдельных фенотипов. Например, в некоторых случаях клетка может иметь отличительную черту фенотипа, которая включает определенную морфологию в сочетании с экспрессией конкретного маркера. Отличительная черта фенотипа может сочетать фенотипы с аналогичными или различными фенотипическими категориями, например, отличительная черта фенотипа может включать экспрессию двух связанных, но разных маркеров клеточной поверхности, или отличительная черта фенотипа может включать экспрессию маркера клеточной поверхности и маркера клеточной пролиферации, или отличительная черта фенотипа может включать экспрессию маркера клеточной поверхности и конкретного секретируемого маркера (например, цитокина), или отличительная черта фенотипа может включать экспрессию двух разных цитокинов и т.д. Любой подходящий фенотип, включая тот, который описан в настоящем документе, можно применять в качестве компонента отличительной черты фенотипа.- 57 041085 antigen levels can be titrated (eg using different concentrations) to assess the screened phenotype at different doses, ie. to evaluate response in a dose-dependent manner. The antigen can be presented at different concentrations in any convenient way. As a non-limiting example, different amounts of antigen can be presented using cells expressing the antigen at different levels, including a range of levels. In some cases, the time of application of the antigen can be varied dynamically, for example, to assess the phenotype in a time-dependent assay, or to assess the kinetics of the phenotype being screened. In some cases, the library may be screened for a distinctive phenotype. In this application, the term distinctive phenotype generally refers to a combination of distinct phenotypes. For example, in some cases, a cell may have a distinctive phenotype that includes a certain morphology in combination with the expression of a particular marker. A phenotypic feature may combine phenotypes with similar or different phenotypic categories, for example, a phenotypic feature may include the expression of two related but different cell surface markers, or a phenotype feature may include the expression of a cell surface marker and a cell proliferation marker, or a phenotype feature may include the expression of a cell surface marker and a specific secreted marker (eg, a cytokine), or a distinctive phenotype may include the expression of two different cytokines, etc. Any suitable phenotype, including that described herein, can be used as a component of a distinctive phenotype.
Идентификация синтетических модульных полипептидов, связанных с фенотипом В настоящем изобретении предложены способы идентификации элементов библиотеки, которые связаны с определенным детектируемым фенотипом. Не желая быть связанными соответствием какой-либо теории, авторы настоящего изобретения полагают, что скоординированная сборка каждого мультимодульного синтетического полипептида наряду с каждой соответствующей многозвенной нуклеиновой последовательностью-штрихкодом обеспечивает сборку и последующую идентификацию каждого уникального синтетического модульного полипептида. Как описано выше, область нуклеиновой последовательностиштрихкода каждой нуклеиновой кислоты, кодирующей синтетический модульный полипептид, обеспечивает не только идентичность отдельных модулей, которые составляют каждый синтетический модульный полипептид, но также специфичное расположение (именуемое в настоящем документе как архитектура) модулей. Следовательно, идентичность и архитектура каждого элемента библиотеки могут быть определены путем секвенирования области нуклеиновой последовательности-штрихкода.Identification of Synthetic Modular Polypeptides Associated with a Phenotype The present invention provides methods for identifying library elements that are associated with a particular detectable phenotype. Without wishing to be bound by any theory, the present inventors believe that the coordinated assembly of each multimodular synthetic polypeptide along with each corresponding multi-unit barcode nucleic sequence ensures the assembly and subsequent identification of each unique synthetic modular polypeptide. As described above, the barcode nucleic sequence region of each nucleic acid encoding a synthetic modular polypeptide provides not only the identity of the individual modules that make up each synthetic modular polypeptide, but also the specific arrangement (referred to herein as the architecture) of the modules. Therefore, the identity and architecture of each library element can be determined by sequencing a region of the nucleic barcode sequence.
Соответственно, скрининг библиотеки не обязательно должен быть выполнен с использованием физически разделенных элементов библиотеки, и элементы библиотеки можно объединять и подвергать скринингу одновременно. Объединение элементов библиотеки может быть выполнено в условиях in vitro, например, в пробирке или в образце клеток, выделенных из соответствующего организма, или в условиях in vivo, у животного или в ткани. После одновременного скрининга элементы библиотеки и/или их модули, связанные с фенотипом, могут быть идентифицированы путем идентификации и/или количественной оценки связанной области нуклеиновой последовательности-штрихкода. В некоторых случаях объединенный скрининг позволяет проводить скрининг большого количества уникальных элементов библиотеки, что нецелесообразно с помощью стандартного последовательного или параллельного скрининга. Количество уникальных элементов библиотеки, которые могут быть подвергнуты скринингу для определения фенотипа, будет зависеть от размера и сложности библиотеки и, следовательно, может варьироваться в диапазоне от 96 или менее до миллионов и более, включая, но не ограничиваясь перечисленными, например, 100 или более, 200 или более, 300 или более, 400 или более, 500 или более, 1000 или более, 2000 или более, 3000 или более, 4000 или более, 5000 или более, 6000 или более, 7000 или более, 8000 или более, 9000 или более, 10000 или более, 20000 или более, 30000 и более, 40000 и более, 50000 и более, 60000 и более, 70000 и более, 80000 или более, 90000 и более, 100000 и более и т.д.Accordingly, library screening need not be performed using physically separated library elements, and library elements may be combined and screened at the same time. The combination of library elements can be performed in vitro, for example, in a test tube or in a sample of cells isolated from the corresponding organism, or in vivo, in an animal or tissue. Following simultaneous screening, library elements and/or their phenotype-associated modules can be identified by identifying and/or quantifying the associated region of the nucleic barcode sequence. In some cases, pooled screening allows a large number of unique library elements to be screened, which is not feasible with standard serial or parallel screening. The number of unique library elements that can be screened for phenotype will depend on the size and complexity of the library and can therefore range from 96 or less to millions or more, including but not limited to, for example, 100 or more , 200 or more, 300 or more, 400 or more, 500 or more, 1000 or more, 2000 or more, 3000 or more, 4000 or more, 5000 or more, 6000 or more, 7000 or more, 8000 or more, 9000 or more, 10,000 or more, 20,000 or more, 30,000 or more, 40,000 or more, 50,000 or more, 60,000 or more, 70,000 or more, 80,000 or more, 90,000 or more, 100,000 or more, etc.
В некоторых случаях количество или частота конкретной нуклеиновой последовательностиштрихкода может быть измерена для идентификации наиболее представленного модуля. Например, частота каждой нуклеиновой последовательности-штрихкода может быть количественно определена в объединенном образце, содержащем элементы библиотеки и связанные с ней нуклеиновые кислоты, кодирующие элементы библиотеки, так, что нуклеиновые последовательности-штрихкоды с наибольшей частотой обеспечат идентификацию тех модулей, которые наиболее представлены в образце. Согласно некоторым вариантам реализации настоящего изобретения такие образцы могут представлять собой клеточные образцы.In some cases, the amount or frequency of a particular barcode nucleic sequence can be measured to identify the most represented module. For example, the frequency of each barcode nucleic acid sequence can be quantified in a pooled sample containing library elements and its associated nucleic acids encoding library elements, such that the barcode nucleic acid sequences with the highest frequency will identify those modules that are most represented in the sample. . According to some embodiments of the present invention, such samples may be cellular samples.
В некоторых случаях количество или частота конкретной многозвенной нуклеиновой последовательности-штрихкода (например, области последовательности-штрихкода) может быть измерена для идентификации наиболее представленного модульного полипептида. Например, частота каждой многозвенной нуклеиновой последовательности-штрихкода может быть количественно определена в объединенном образце, содержащем элементы библиотеки и связанные с ней нуклеиновые кислоты, кодирующие элементы библиотеки, так, что многозвенные нуклеиновые последовательности-штрихкоды с наи- 58 041085 большей частотой обеспечивают идентификацию указанных модульных полипептидов, наиболее представленных в образце. Согласно некоторым вариантам реализации настоящего изобретения указанные образцы могут представлять собой клеточные образцы.In some instances, the number or frequency of a particular multi-merged nucleic barcode sequence (eg, regions of the barcode sequence) can be measured to identify the most representative modular polypeptide. For example, the frequency of each nucleotide barcode sequence can be quantified in a pooled sample containing library elements and associated nucleic acids encoding the library elements such that the most frequently occurring nucleotide barcode sequences provide identification of said modular elements. polypeptides, the most represented in the sample. According to some variants of implementation of the present invention, these samples may be cellular samples.
В некоторых случаях детектирование фенотипа и идентификация элементов библиотеки и их компонентов могут быть выполнены как часть интегрированного способа. Например, в некоторых случаях, фенотип можно детектировать методом проточной цитометрии, и элементы библиотеки могут быть идентифицированы с помощью секвенирования. Указанные интегрированные способы могут быть выполнены в комбинации с количественными исследованиями в условиях in vitro и/или in vivo, например, как показано на фиг. 24, где FLOW-Seq используется как неограничивающий пример интегрированного способа.In some cases, phenotype detection and identification of library elements and their components may be performed as part of an integrated method. For example, in some cases, the phenotype can be detected by flow cytometry and library elements can be identified by sequencing. These integrated methods can be performed in combination with in vitro and/or in vivo assays, for example as shown in FIG. 24, where FLOW-Seq is used as a non-limiting example of an integrated method.
В настоящей заявке термин FLOW-seq обычно относится к комбинации способов сортировки с помощью проточной цитометрии (например, FACS) с методами секвенирования (например, секвенирования следующего поколения) в одном связанном рабочем процессе. Любой удобный и подходящий способ сортировки с помощью проточной цитометрии и любой удобный и подходящий способ секвенирования можно применять в указанном методе FLOW-Seq. Например, в некоторых случаях, клеточная библиотека, экспрессирующая синтетические модульные полипептиды, содержащие нуклеиновые последовательности-штрихкоды, описанная в настоящем документе, может быть количественно исследована для определения фенотипа методом проточной цитометрии, и те клетки, которые имеют конкретный фенотип, могут быть отсортированы, и их нуклеиновые последовательности-штрихкоды впоследствии секвенированы для идентификации конкретных элементов библиотеки и/или для количественного определения частоты отдельных элементов библиотеки и/или их модулей, экспрессируемых в отсортированных клетках. Сортировка может быть выполнена любым удобным и подходящим способом, включая, например, сортировку в одну или более групп на основании фенотипа, детектированного с помощью проточной цитометрии. После сортировки секвенирование может быть выполнено непосредственно на отсортированном образце и/или отсортированной клетке, или отсортированный образец и/или отсортированная клетка может быть размножена и/или культивирована перед сортировкой, например, для увеличения количества копий нуклеиновых кислот, кодирующих элементы библиотеки. Способы FLOW-seq были использованы, например, для фенотипического измерения уровней белка и идентификации родственных генетических элементов в бактериях (см., например, Kosuri et al. Proc Natl Acad Sci USA (2013) 110(34): 14024-9 и Goodman et al. Science (2013) 342(6157):475-479), помимо этого секвенирование комбинировали с проточной цитометрией для корреляции Т-клеток, отсортированных на основании их функции, с соответствующими им секвенированными генами рецепторов Т-клеток (см., например, Han et al. Nature Biotechnology (2014) 32:684-692).As used herein, the term FLOW-seq generally refers to the combination of flow cytometry (eg, FACS) sorting methods with sequencing (eg, next generation sequencing) methods in one related workflow. Any convenient and suitable flow cytometry sorting method and any convenient and suitable sequencing method can be used in said FLOW-Seq method. For example, in some cases, a cell library expressing the synthetic modular polypeptides containing the barcode nucleic acid sequences described herein can be quantitatively assayed for phenotype determination by flow cytometry, and those cells that have a particular phenotype can be sorted, and their nucleic barcode sequences are subsequently sequenced to identify specific library elements and/or to quantify the frequency of individual library elements and/or their modules expressed in sorted cells. Sorting may be performed in any convenient and suitable manner, including, for example, sorting into one or more groups based on the phenotype detected by flow cytometry. After sorting, sequencing can be performed directly on the sorted sample and/or sorted cell, or the sorted sample and/or sorted cell can be expanded and/or cultured before sorting, for example, to increase the copy number of nucleic acids encoding library elements. FLOW-seq methods have been used, for example, for phenotypic measurement of protein levels and identification of related genetic elements in bacteria (see, for example, Kosuri et al. Proc Natl Acad Sci USA (2013) 110(34): 14024-9 and Goodman et al. Science (2013) 342(6157):475-479), in addition, sequencing was combined with flow cytometry to correlate T cells sorted based on their function with their corresponding sequenced T cell receptor genes (see, e.g., Han et al Nature Biotechnology (2014) 32:684-692).
В некоторых случаях идентификация синтетического модульного полипептида, связанного с конкретным фенотипом, может включать хирургическое выделение ткани или органа из модели in vivo, в которую была введена библиотека. Например, в некоторых случаях, после периода времени, достаточного для проведения количественного исследования, орган или ткань могут быть выделены из животногохозяина, и нуклеиновые кислоты, присутствующие в органе или ткани, могут быть секвенированы для идентификации отдельных элементов библиотеки, присутствующих в органе или ткани. В других случаях нуклеиновая кислота, выделенная из органа или ткани или животного-хозяина, может быть количественно определена, включая полуколичественную оценку, секвенирована для количественного определения относительной частоты или присутствия конкретного элемента библиотеки в органе или ткани. В других случаях нуклеиновая кислота, выделенная из органа или ткани или животного-хозяина, может быть количественно определена, включая полуколичественную оценку, секвенирована для количественного определения относительной частоты или присутствия конкретного модуля в органе или ткани.In some instances, identifying a synthetic modular polypeptide associated with a particular phenotype may involve surgically isolating a tissue or organ from an in vivo model into which the library has been introduced. For example, in some cases, after a period of time sufficient to conduct a quantitative study, the organ or tissue can be isolated from the animal host, and the nucleic acids present in the organ or tissue can be sequenced to identify individual library elements present in the organ or tissue. In other cases, nucleic acid isolated from an organ or tissue or host animal may be quantified, including semi-quantitative evaluation, sequenced to quantify the relative frequency or presence of a particular library element in the organ or tissue. In other instances, nucleic acid isolated from an organ or tissue or host animal may be quantified, including semi-quantification, sequenced to quantify the relative frequency or presence of a particular module in the organ or tissue.
В некоторых случаях, например, когда конкретный модуль высоко представлен после полуколичественной оценки или отдельный модуль идентифицирован как способствующий желательному фенотипу, может быть выполнен следующий раунд сборки новой библиотеки, в котором идентифицированный модуль включен во все вновь созданные элементы библиотеки (т.е. идентифицированный вариабельный модуль используется впоследствии как невариабельный модуль), и вновь созданную библиотеку подвергают скринингу для идентификации дополнительных модулей, которые влияют на фенотип совместно с первоначально идентифицированным модулем. Специалист в данной области техники легко поймет, в каких случаях итеративная сборка и скрининг библиотеки могут быть выполнены для развития библиотек и отдельных элементов библиотеки с желательными фенотипами.In some cases, for example, when a particular module is highly represented after a semi-quantitative evaluation, or a particular module is identified as contributing to a desired phenotype, a next round of new library assembly may be performed in which the identified module is included in all newly created library elements (i.e., the identified variable the module is subsequently used as a non-variable module), and the newly created library is screened to identify additional modules that affect the phenotype in conjunction with the originally identified module. One of skill in the art will readily appreciate in which cases iterative assembly and library screening can be performed to develop libraries and individual library elements with desired phenotypes.
ПримерыExamples
Следующие примеры приведены, чтобы предоставить специалистам в данной области техники полное описание настоящего изобретения, а также описание способов получения и применения настоящего изобретения, и не предназначены для ограничения объема настоящего изобретения согласно мнению авторов настоящего изобретения, также авторы настоящего изобретения не подразумевают, что эксперименты, приведенные ниже, представляют собой все или единственные эксперименты, которые были выполнены. Были предприняты усилия для обеспечения точности в отношении используемых чисел (например, количеств, температуры и т.д.), однако следует учитывать некоторые экспериментальные ошиб- 59 041085 ки и отклонения. Если не указано иное, части представляют собой части по массе, молекулярная масса представляет среднюю молекулярную массу, температура представлена в градусах Цельсия и давление соответствует или приблизительно равно атмосферному давлению. Могут быть использованы стандартные аббревиатуры, например п.о., пара (пары) оснований; тыс.п.о., тысяча (тысячи) пар оснований; пл, пиколитр (пиколитры); с или сек., секунда (секунды); мин, минута (минуты); ч или час, часы; а.к., аминокислота (аминокислоты); тыс.п.о., тысяча (тысячи) пар оснований; п.о., пара (пары) оснований; нук., нуклеотид (нуклеотиды); в/м, внутримышечный (внутримышечно); в/б, внутрибрюшинный (внутрибрюшинно); п/к, подкожный (подкожно); и т.п.The following examples are provided to provide those skilled in the art with a complete description of the present invention, as well as a description of the methods for making and using the present invention, and are not intended to limit the scope of the present invention according to the present inventors, nor do the present inventors imply that experiments, below represent all or the only experiments that have been performed. Efforts have been made to ensure accuracy with respect to the numbers used (eg amounts, temperatures, etc.), however, some experimental errors and deviations should be taken into account. Unless otherwise indicated, parts are parts by weight, molecular weight is average molecular weight, temperature is in degrees Celsius, and pressure is at or about atmospheric pressure. Standard abbreviations may be used, eg b.p., base pair(s); thousand bp, one thousand (thousand) base pairs; pl, picoliter (picolitres); s or sec., second (seconds); min, minute(s); h or hour, hours; a.k., amino acid(s); thousand bp, one thousand (thousand) base pairs; p.o., a pair (pairs) of bases; nuc., nucleotide(s); in / m, intramuscular (intramuscularly); in / b, intraperitoneal (intraperitoneally); s / c, subcutaneous (subcutaneous); and so on.
Пример 1. Конструирование и скрининг модульных библиотек комодулирующих доменов.Example 1 Construction and screening of modular libraries of co-modulating domains.
Для получения фрагментов нуклеиновых кислот, кодирующих модули, содержащих нуклеиновые последовательности-штрихкоды, которые содержат необходимые элементы для конструирования библиотеки, нуклеиновые кислоты, кодирующие полипептидные модули (т.е. комодулирующие домены (т.е. костимулирующие или коингибирующие домены)), субклонировали в вектор для клонирования, подходящий для секвенирования и расщепления ферментами рестрикции типа IIS. После субклонирования вектор содержал: последовательность, кодирующую модуль, оптимальные линкерные последовательности Gly/Ser, фланкирующие последовательность, кодирующую модуль, специфичную для модуля нуклеиновую последовательность-штрихкод, подходящие для клонирования 3'-концевые гомологичные плечи, фланкирующие специфичную для модуля последовательность-штрихкод, сайт рестрикции BamHI между кодирующей модуль последовательностью и специфичной для модуля последовательностьюштрихкодом и сайты ферментов рестрикции типа IIS на 5'-конце кодирующей модуль последовательности и на 3'-конце последовательности-штрихкода, специфичной для модуля (фиг. 1). Субклонированные векторные вставки секвенировали для подтверждения идентичности вставленных комодулирующих доменов. Комодулирующие домены, используемые в данной комбинаторной библиотеке, и соответствующие им последовательности белка представлены в табл. 1.To obtain nucleic acid fragments encoding modules containing nucleic barcode sequences that contain the necessary elements for constructing a library, nucleic acids encoding polypeptide modules (i.e. co-modulating domains (i.e. co-stimulatory or co-inhibitory domains)) were subcloned a cloning vector suitable for sequencing and digestion with type IIS restriction enzymes. After subcloning, the vector contained: the sequence encoding the module, the optimal Gly/Ser linker sequences, flanking the sequence encoding the module, the module-specific nucleic barcode sequence, suitable for cloning, the 3'-terminal homologous arms flanking the module-specific barcode sequence, the site BamHI restriction between the module-coding sequence and the module-specific barcode sequence and type IIS restriction enzyme sites at the 5'end of the module-coding sequence and at the 3'end of the module-specific barcode sequence (FIG. 1). Subcloned vector inserts were sequenced to confirm the identity of the inserted comodulatory domains. The co-modulating domains used in this combinatorial library and their corresponding protein sequences are shown in Table 1. 1.
Векторы для клонирования, содержащие кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод, расщепляли с использованием фермента рестрикции типа IIS для высвобождения нуклеиновых кислот с оптимальной последовательностью, кодирующих каждый полипептидный модуль (фиг. 2). Представлен пример части вектора для клонирования, содержащей описанные элементы и последовательность, кодирующую костимулирующий домен CD28, до и после расщепления ферментом рестрикции типа IIS (фиг. 3), который представляет общую конфигурацию каждой модульной плазмиды/фрагмента, использованных при конструировании библиотеки.Cloning vectors containing a coding module sequence containing a nucleic barcode sequence were digested using a type IIS restriction enzyme to release nucleic acids with the optimal sequence encoding each polypeptide module (FIG. 2). An example of a cloning vector portion containing the described elements and the CD28 co-stimulatory domain coding sequence before and after IIS digestion (FIG. 3) is shown, which represents the general configuration of each modular plasmid/fragment used in the construction of the library.
Вектор экспрессии (т.е. лентивирусный упаковочный вектор pHR (также называемый векторреципиент)) получали путем расщепления 3'-конца промотора вируса некроза селезенки (pSFFV) ферментом рестрикции в сайте BamHI. Конструкции элементов библиотеки собирали поэтапно (фиг. 5). Клонирование In-Fusion® сначала использовали для вставки в вектор экспрессии последовательности, кодирующей одноцепочечный вариабельный фрагмент (scFv) и трансмембранные (ТМ) домены (scFVТМ), общие для всех элементов библиотеки. Реакционную смесь In-Fusion® трансформировали в компетентные клетки Е. coli. Трансформированные клетки высаживали. Колонии отбирали и получали минипрепараты для экстракции ДНК, чтобы выделить сконструированную плазмиду. После успешного конструирования плазмиды для экспрессии, содержащей scFV-TM, каждый последовательный компонент многомодульного полипептида, включая репортер EGFP, вставляли в направлении 3'-конца относительно предыдущего компонента на отдельных стадиях в соответствии с фиг. 5. Каждая стадия включала расщепление с помощью BamHI и сборку In-Fusion® с последующей трансфекцией реакционной смеси InFusion®, отбор колонии и очистку плазмиды.An expression vector (ie pHR lentiviral packaging vector (also referred to as a recipient vector)) was generated by cleaving the 3' end of the spleen necrosis virus (pSFFV) promoter with a restriction enzyme at the BamHI site. The library element designs were assembled step by step (FIG. 5). In-Fusion® cloning was first used to insert into an expression vector a sequence encoding a single chain variable fragment (scFv) and transmembrane (TM) domains (scFVTM) common to all library elements. The In-Fusion® reaction mixture was transformed into competent E. coli cells. The transformed cells were planted. Colonies were selected and DNA extraction minipreparations were prepared to isolate the engineered plasmid. After successfully constructing an expression plasmid containing scFV-TM, each successive component of the multimodule polypeptide, including the EGFP reporter, was inserted 3' from the previous component in separate steps according to FIG. 5. Each step included BamHI digestion and In-Fusion® assembly followed by transfection of the InFusion® reaction mixture, colony selection and plasmid purification.
Как показано на фиг. 5, каждый готовый элемент библиотеки заключительной реакции In-Fusion® содержал общий scFV-TM, соединенный со специфичной для элемента комбинацией двух комодулирующих доменов, соединенных с общим репортером (CD3z-EGFP), и пару специфичных для модуля нуклеиновых последовательностей-штрихкодов в обратной ориентации относительно комодулирующих доменов. Нуклеиновые последовательности-штрихкоды фланкировали сайтами связывания праймеров, обеспечивающими амплификацию и/или секвенирование конкретной комбинации нуклеиновых последовательностей-штрихкодов, соответствующей комбинации комодулирующих доменов, специфичных для элементов библиотеки.As shown in FIG. 5, each final element of the In-Fusion® post reaction library contained a generic scFV-TM coupled to an element-specific combination of two co-modulating domains coupled to a common reporter (CD3z-EGFP) and a pair of module-specific nucleic sequence-barcodes in reverse orientation. with respect to comodulating domains. Nucleic barcode sequences were flanked by primer binding sites allowing amplification and/or sequencing of a specific combination of nucleic barcode sequences corresponding to the combination of comodulatory domains specific to library elements.
После завершения конструирования последней плазмиды для библиотеки отдельные элементы библиотеки трансфицировали в клетки HEK-293, и лентивирусные частицы получали стандартными способами. Полученный лентивирус использовали для инфицирования Т-клеток, чтобы получить модифицированные иммунные клетки, экспрессирующие многомодульные полипептиды.After construction of the last plasmid for the library was completed, individual elements of the library were transfected into HEK-293 cells and lentiviral particles were obtained by standard methods. The obtained lentivirus was used to infect T cells to obtain modified immune cells expressing multimodular polypeptides.
Модифицированные иммунные клетки сортировали методом проточной цитометрии на основании экспрессии репортера EGFP. Сортировку проводили для выделения популяции модифицированных клеток с одинаковыми уровнями экспрессии. Сортированные клетки с одинаковыми уровнями экспрессии многомодульных полипептидов использовали для последующих этапов функционального скрининга.The modified immune cells were sorted by flow cytometry based on the expression of the EGFP reporter. Sorting was performed to isolate a population of modified cells with the same expression levels. Sorted cells with the same levels of expression of multimodular polypeptides were used for subsequent stages of functional screening.
Данную общую стратегию использовали для создания четырех отдельных библиотек. Конструиро- 60 041085 вали одномерные библиотеки (т.е. каждый элемент библиотеки содержал один комодулирующий домен) и двумерные библиотеки (т.е. каждый элемент библиотеки содержал два комодулирующих домена).This general strategy was used to create four separate libraries. One-dimensional libraries (ie, each element of the library contained one co-modulating domain) and two-dimensional libraries (ie, each element of the library contained two co-modulating domains) were constructed.
Элементы двумерных библиотек собирали в соответствии с общей схемой, представленной на фиг. 6.Elements of the 2D libraries were assembled according to the general scheme shown in FIG. 6.
Четыре библиотеки и соответствующие им этапы скрининга были следующими.The four libraries and their respective screening steps were as follows.
1) Конструировали одномерную библиотеку из 20 элементов и использовали для проверки возможности количественного исследования функции Т-клеток с помощью FLOWseq. Каждый элемент библиотеки конфигурировали так, чтобы он содержал домен CD8, гибридизованный с модулем комодулирующего домена, гибридизованным с доменом CD3Z. Модифицированные Т-клетки распределяли на группы в соответствии с экспрессией ими репортера с помощью проточной цитометрии, и библиотеку подвергали скринингу для измерения дозозависимого ответа активации Т-клеток (CD69) на связанные с планшетом антигены.1) A one-dimensional library of 20 elements was constructed and used to test the feasibility of quantifying T cell function with FLOWseq. Each element of the library was configured to contain a CD8 domain fused to a comodulatory domain module fused to a CD3Z domain. The modified T cells were grouped according to their reporter expression by flow cytometry, and the library was screened to measure the dose-dependent response of T cell activation (CD69) to plate-bound antigens.
2) Конструировали одномерную CD19-специфичную библиотеку из 62 элементов и подвергали скринингу в мышиной модели опухоли в условиях in vivo. Каждый элемент библиотеки конфигурировали так, чтобы он содержал CD19-специфичный домен, гибридизованный с модулем комодулирующего домена, гибридизованного с доменом CD3Z, который был гибридизован с репортером EGFP.2) A one-dimensional CD19-specific library of 62 elements was constructed and screened in a mouse tumor model in vivo. Each element of the library was configured to contain a CD19-specific domain fused to a comodulatory domain module fused to a CD3Z domain that was fused to an EGFP reporter.
3) Конструировали двумерную библиотеку, состоящую из 62x62 элементов. Каждый элемент библиотеки содержал CD19-специфичный домен, гибридизованный с первым модулем комодулирующего домена, гибридизованным со вторым модулем комодулирующего домена, гибридизованным с доменом CD3Z, гибридизованным с репортером EGFP.3) Designed a two-dimensional library consisting of 62x62 elements. Each library element contained a CD19-specific domain fused to a first comodulatory domain module fused to a second comodulatory domain module fused to a CD3Z domain fused to an EGFP reporter.
4) Конструировали одномерную мезотелин-специфичную библиотеку из 62 элементов. Каждый элемент библиотеки содержал мезотелин-специфичный домен, гибридизованный с доменом комодулирующего модуля, гибридизованным с доменом CD3Z, гибридизованным с репортером EGFP.4) Designed one-dimensional mesothelin-specific library of 62 elements. Each element of the library contained a mesothelin-specific domain hybridized to a comodulatory module domain hybridized to a CD3Z domain hybridized to an EGFP reporter.
Объединенную одномерную CD19-специфичную библиотеку из 62 элементов подвергали функциональному скринингу для идентификации альтернативных комодулирующих последовательностей в химерных антигенных рецепторах (CAR). Каждый элемент библиотеки содержал CD19-специфичный scFv, который указывает на целевой антиген раковых клеток, один из модулей комодулирующих доменов, перечисленных в табл. 1, и первичный сигнальный домен CD3Z (фиг. 7).The pooled one-dimensional CD19-specific library of 62 elements was subjected to functional screening to identify alternative comodulatory sequences in chimeric antigen receptors (CARs). Each element of the library contained a CD19-specific scFv that points to the target cancer cell antigen, one of the comodulatory domain modules listed in Table 1. 1 and the primary signaling domain of CD3Z (FIG. 7).
После антигенной стимуляции (при концентрации антигена 32, 125 и 1000 нг/мл) модифицированных Т-клеток объединенной библиотеки, Т-клетки функционально сортировали методом проточной цитометрии на группы высокой или низкой стимуляции на основании экспрессии CD69 (фиг. 8). Относительное обогащение специфичных последовательностей-штрихкодов, соответствующих индивидуальным комодулирующим доменам, определяли количественно в клетках с высокой и низкой стимуляцией путем секвенирования (при концентрации антигена 1000 нг/мл) (фиг. 9). Данный подход позволил сравнить стимулирующий и ингибирующий эффект каждого комодулирующего домена в CD19-CD3Zспецифичных CAR и в отношении конкретной использованной антигенной стимуляции. Например, результаты скрининга дополнительно анализировали при разных уровнях вносимого антигена, что позволило быстро оценить зависимый от дозы ответ отдельных комодулирующих доменов (фиг. 10).After antigen challenge (at 32, 125 and 1000 ng/ml antigen) of the pooled library modified T cells, T cells were functionally sorted by flow cytometry into high or low challenge groups based on CD69 expression (FIG. 8). The relative enrichment of specific barcode sequences corresponding to individual comodulatory domains was quantified in high and low stimulated cells by sequencing (at an antigen concentration of 1000 ng/mL) (FIG. 9). This approach made it possible to compare the stimulatory and inhibitory effects of each comodulatory domain in CD19-CD3Z-specific CARs and in relation to the specific antigen stimulation used. For example, screening results were further analyzed at different levels of applied antigen, allowing a rapid assessment of the dose-dependent response of individual comodulatory domains (FIG. 10).
Пример 2. Подтверждение полной сборки двумерной библиотеки из 61x61 элементов.Example 2. Confirmation of the complete assembly of a two-dimensional library of 61x61 elements.
Шестьдесят один вариабельный модуль CAR (табл. 2, представленная на фиг. 25) собирали в библиотеку нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, кодирующих двумерные (2D) синтетические модульные полипептиды CAR, с помощью вложенной сборки. Библиотеку глубоко секвенировали с помощью метода секвенирования посредством синтеза (SBS) с использованием системы MiSeq (Illumina Inc., Хейворд, Калифорния, США) и определяли количество считываний каждого элемента собранной библиотеки (фиг. 26).Sixty-one CAR variable modules (Table 2 shown in FIG. 25) were assembled into a nucleic acid library containing barcode nucleic acid sequences encoding two-dimensional (2D) synthetic modular CAR polypeptides using a nested assembly. The library was deeply sequenced by sequencing by synthesis (SBS) using the MiSeq system (Illumina Inc., Hayward, CA, USA) and the number of reads of each element of the assembled library was determined (FIG. 26).
Из всего 3721 возможного элемента библиотеки (т.е. вариантов CAR) все возможные элементы библиотеки детектировали путем секвенирования с максимальной частотой 1216 считываний и минимальной частотой 2 считывания. Среднее количество считываний по всей библиотеке составило 333 с медианой 311 считываний и стандартным отклонением 140. 90% элементов библиотеки были представлены считываниями, количество которых находилось в пределах двукратного значения медианы, и 98% элементов библиотеки были представлены считываниями, количество которых находилось в пределах трехкратного значения медианы.Out of a total of 3721 possible library elements (ie CAR variants), all possible library elements were detected by sequencing at a maximum of 1216 reads and a minimum of 2 reads. The mean number of reads across the entire library was 333 with a median of 311 reads and a standard deviation of 140. 90% of library items were represented by reads that were within two times the median value, and 98% of library items were represented by reads that were within three times the median value. medians.
Следовательно, результаты секвенирования подтвердили, что способ вложенной сборки способен обеспечить 2D-библиотеку, содержащую элементы библиотеки, которые представляют все возможные комбинации вариабельных модулей.Therefore, the sequencing results confirmed that the nested assembly method is capable of providing a 2D library containing library elements that represent all possible combinations of variable modules.
Пр имер 3. Нормирование частей библиотеки.Example 3. Rationing parts of the library.
Был разработан способ повышения распределения клонов в комбинаторной библиотеке с использованием нормирования частей библиотеки.A method has been developed to increase the distribution of clones in a combinatorial library using normalization of parts of the library.
В любой реакции комбинаторной сборки некоторые части (например, модули) интегрированы в собранные продукты более эффективно, чем другие. Как следствие, собранные продукты (например, варианты белка), которые содержат части, которые интегрируются относительно неэффективно, представлены в недостаточном количестве или отсутствуют в готовой комбинаторной библиотеке. По аналогичнымIn any combinatorial assembly reaction, some parts (such as modules) are more efficiently integrated into the assembled products than others. As a consequence, assembled products (eg, protein variants) that contain parts that integrate relatively inefficiently are under-represented or absent from the finished combinatorial library. For similar
--
Claims (11)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62/212,999 | 2015-09-01 |
Publications (1)
Publication Number | Publication Date |
---|---|
EA041085B1 true EA041085B1 (en) | 2022-09-12 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230212557A1 (en) | Modular polypeptide libraries and methods of making and using same | |
US20240084253A1 (en) | Method of assessing activity of recombinant antigen receptors | |
US9732392B2 (en) | Modular sensor architecture for cell based biosensors | |
JP7335224B2 (en) | A Two-Component Vector Library System for Rapid Assembly and Diversification of Full-Length T-Cell Receptor Open Reading Frames | |
US10053683B2 (en) | Intercellular labeling of ligand-receptor interactions | |
BR112015013557B1 (en) | SYSTEM, METHOD, METHOD FOR DETERMINING THE EFFECT OF A PREDETERMINED AMINO ACID RESIDUE OF A FIRST PROTEIN ON BINDING OF THE FIRST PROTEIN TO A SECOND PROTEIN AND MUTANT PD-L1 POLYPEPTIDE | |
CA3124432A1 (en) | Compositions of streptavidin-oligo conjugates of pmhc occupancy | |
US20220348657A1 (en) | Bioassay for t-cell co-stimulatory proteins containing fc domains | |
WO2018167481A1 (en) | Method of selecting for antibodies | |
EA041085B1 (en) | LIBRARIES OF MODULAR POLYPEPTIDES AND METHODS FOR THEIR PRODUCTION AND APPLICATION | |
EA046546B1 (en) | LIBRARIES OF MODULAR POLYPEPTIDES AND METHODS FOR THEIR PREPARATION AND APPLICATION | |
US20100203509A1 (en) | Inducible fluorescently-tagged protein expression system | |
GB2569144A (en) | Method for screening the activity of expressed polypeptides | |
Zeller Jr | Transcriptional control of spatially regulated genes in the early sea urchin embryo |