RU2816876C1 - NUCLEASE Cpf1 FROM BACTERIUM RUMINOCOCCUS BROMII, DNA MOLECULE OR RNA CODING NUCLEASE, VECTOR CONTAINING SAID DNA MOLECULE, CRISPR/Cpf1 SYSTEM CONTAINING SAID NUCLEASE AND GUIDE RNA, HOST CELL FOR PRODUCING NUCLEASE Cpf1, METHOD OF PRODUCING NUCLEASE Cpf1 AND USE THEREOF - Google Patents

NUCLEASE Cpf1 FROM BACTERIUM RUMINOCOCCUS BROMII, DNA MOLECULE OR RNA CODING NUCLEASE, VECTOR CONTAINING SAID DNA MOLECULE, CRISPR/Cpf1 SYSTEM CONTAINING SAID NUCLEASE AND GUIDE RNA, HOST CELL FOR PRODUCING NUCLEASE Cpf1, METHOD OF PRODUCING NUCLEASE Cpf1 AND USE THEREOF Download PDF

Info

Publication number
RU2816876C1
RU2816876C1 RU2022135486A RU2022135486A RU2816876C1 RU 2816876 C1 RU2816876 C1 RU 2816876C1 RU 2022135486 A RU2022135486 A RU 2022135486A RU 2022135486 A RU2022135486 A RU 2022135486A RU 2816876 C1 RU2816876 C1 RU 2816876C1
Authority
RU
Russia
Prior art keywords
nuclease
protein
cpf1
dna
vector
Prior art date
Application number
RU2022135486A
Other languages
Russian (ru)
Inventor
Руслан Алексеевич ВАСИЛЬЕВ
Наталья Михайловна ГУНИЦЕВА
Максим Владимирович Патрушев
Петр Андреевич Каменский
Анна Александровна Борисова
Марта Алексеевна ЕВТЕЕВА
Original Assignee
Федеральное государственное бюджетное образовательное учреждение высшего образования "Московский государственный университет имени М.В.Ломоносова" (МГУ)
Filing date
Publication date
Application filed by Федеральное государственное бюджетное образовательное учреждение высшего образования "Московский государственный университет имени М.В.Ломоносова" (МГУ) filed Critical Федеральное государственное бюджетное образовательное учреждение высшего образования "Московский государственный университет имени М.В.Ломоносова" (МГУ)
Application granted granted Critical
Publication of RU2816876C1 publication Critical patent/RU2816876C1/en

Links

Abstract

FIELD: biotechnology.
SUBSTANCE: present invention relates to a nuclease enzyme and use of said enzyme. Invention relates to a Cpf1 nuclease enzyme from a Ruminococcus bromii bacterium and a DNA molecule coding said enzyme. Present invention also relates to a vector containing said DNA molecule, a CRISPR/Cpf1 system containing said nuclease and a guide RNA, a host cell for producing nuclease Cpf1, a method of producing nuclease Cpf1, using said nuclease Cpf1 to form a break in a DNA or RNA molecule, a method of forming a break in a DNA or RNA molecule using said nuclease, a delivery system comprising said nuclease Cpf1, a molecule or vector, a combination of delivery methods comprising said nuclease Cpf1, a DNA molecule or a vector, a method for modifying a target DNA locus using said nuclease, using said Cpf1 nuclease for genome editing or gene therapy and detecting nucleic acids.
EFFECT: invention widens the pool of available nucleases for genome editing.
21 cl, 15 dwg, 1 ex

Description

Область техникиField of technology

Настоящее изобретение относится к области биотехнологии, молекулярной биологии и медицины, в частности к белку, обладающему активностью нуклеазы, и различным вариантам применения такого белка. Более конкретно, настоящее изобретение относится к ферменту нуклеазе Cpf1 из бактерии Ruminococcus bromii и молекуле ДНК или РНК, кодирующей указанный фермент. Настоящее изобретение также относится к вектору, содержащему указанную молекулу ДНК, системе CRISPR/Cpf1, содержащую указанную нуклеазу в дополнение к другим элементам CRISPR-кассеты, клетке-хозяину для получения нуклеазы Cpf1, способу получения нуклеазы Cpf1, применению указанной нуклеазы Cpf1 для образования двунитевого или однонитевого разрыва в молекуле ДНК или РНК, способу образования двунитевого или однонитевого разрыва в молекуле ДНК или РНК с использованием указанной нуклеазы, системе доставки, содержащей указанную нуклеазу Cpf1, молекулу ДНК или вектор, комплексу, содержащему указанную нуклеазу Cpf1, молекулу ДНК или вектор, способу модификации целевого локуса ДНК или РНК с использованием указанной нуклеазы, применению указанной нуклеазы Cpf1 для редактирования генома или генной терапии или детекции нуклеиновых кислот.The present invention relates to the field of biotechnology, molecular biology and medicine, in particular to a protein having nuclease activity and various uses of such a protein. More specifically, the present invention relates to the Cpf1 nuclease enzyme from the bacterium Ruminococcus bromii and a DNA or RNA molecule encoding the enzyme. The present invention also relates to a vector containing said DNA molecule, a CRISPR/Cpf1 system containing said nuclease in addition to other elements of the CRISPR cassette, a host cell for producing Cpf1 nuclease, a method for producing Cpf1 nuclease, use of said Cpf1 nuclease to form double-stranded or single-strand break in a DNA or RNA molecule, a method of forming a double-strand or single-strand break in a DNA or RNA molecule using the specified nuclease, a delivery system containing the specified Cpf1 nuclease, DNA molecule or vector, a complex containing the specified Cpf1 nuclease, DNA molecule or vector, method modifying a target DNA or RNA locus using said nuclease, using said Cpf1 nuclease for genome editing or gene therapy or detection of nucleic acids.

Уровень техникиState of the art

Недавние достижения в области технологий секвенирования генома и методов анализа значительно ускорили каталогизацию и картирование генетических факторов, связанных с широким спектром биологических функций и заболеваний. Точные технологии нацеливания на геном необходимы для обеспечения систематической обратной инженерии причинно-следственных генетических вариаций, позволяя избирательно изменять отдельные генетические элементы, а также для продвижения синтетических биологических, биотехнологических и медицинских приложений. Хотя для создания целевых изменений генома доступны такие методы и средства редактирования генома, такие как дизайнерские цинковые пальцы, эффекторы, подобные активаторам транскрипции (TALE) или самонаводящиеся мегануклеазы, остается потребность в новых технологиях и средствах геномной инженерии, которые используют новые стратегии и молекулярные механизмы и являются доступными, простыми в настройке, масштабируемыми и доступными для нацеливания на несколько положений в геноме. Такие решения составят основной ресурс для новых приложений в области геномной инженерии и биотехнологии.Recent advances in genome sequencing technologies and analytical techniques have greatly accelerated the cataloging and mapping of genetic factors associated with a wide range of biological functions and diseases. Precision genome targeting technologies are needed to enable systematic reverse engineering of causal genetic variation, allowing selective modification of individual genetic elements, and to advance synthetic biological, biotechnological and medical applications. Although genome editing techniques and tools such as designer zinc fingers, transcription activator-like effectors (TALEs), or homing meganucleases are available to create targeted genome changes, there remains a need for new technologies and genome engineering tools that utilize new strategies and molecular mechanisms and are affordable, easy to customize, scalable, and available for targeting multiple positions in the genome. Such solutions will constitute a major resource for new applications in the field of genome engineering and biotechnology.

В последние годы было установлено, что редактирование генома, опосредуемое CRISPR-Cas, является полезным инструментом для генной инженерии. Известно, что прокариотические системы CRISPR служат своим хозяевам как адаптивные иммунные системы (Jinek et al., 2012, Science 337: 816-821) и могут быть использованы для быстрой и эффективной генной инженерии (например, Mali et al., 2013, Nat Methods 10: 957-963), требуя только модификации направляющей последовательности.In recent years, CRISPR-Cas-mediated genome editing has been found to be a useful tool for genetic engineering. Prokaryotic CRISPR systems are known to serve their hosts as adaptive immune systems (Jinek et al., 2012, Science 337: 816-821) and can be used for rapid and efficient genetic engineering (e.g., Mali et al., 2013, Nat Methods 10: 957-963), requiring only modification of the guide sequence.

Системы CRISPR-Cas адаптивного иммунитета бактерий и архей демонстрируют чрезвычайное разнообразие белкового состава и архитектуры геномных локусов. В локусах системы CRISPR-Cas имеется более 50 семейств генов, и не существует строго универсальных генов, что указывает на быструю эволюцию и чрезвычайное разнообразие архитектуры локусов. На сегодняшний день с использованием многостороннего подхода проведена комплексная идентификация гена cas примерно из 395 профилей для 93 белков Cas. Классификация включает профили сигнатурных генов плюс сигнатуры архитектуры локуса. Предложена новая классификация систем CRISPR-Cas, в которой эти системы в целом разделены на два класса: класс 1 с эффекторными комплексами из нескольких субъединиц и класс 2 с эффекторными модулями из одной субъединицы, примером которых является белок Cas9. Новые эффекторные белки, связанные с системами CRISPR-Cas класса 2, могут быть разработаны в качестве мощных инструментов геномной инженерии, и важно предсказывать предполагаемые новые эффекторные белки, а также их конструирование и оптимизацию.Bacterial and archaeal CRISPR-Cas adaptive immunity systems exhibit extreme diversity in the protein composition and architecture of genomic loci. There are more than 50 gene families within the CRISPR-Cas system loci, and there are no strictly universal genes, indicating rapid evolution and extreme diversity in loci architecture. To date, comprehensive identification of the cas gene from approximately 395 profiles for 93 Cas proteins has been carried out using a multi-pronged approach. The classification includes signature gene profiles plus locus architecture signatures. A new classification of CRISPR-Cas systems has been proposed, in which these systems are broadly divided into two classes: class 1 with multi-subunit effector complexes and class 2 with single-subunit effector modules, exemplified by the Cas9 protein. New effector proteins associated with class 2 CRISPR-Cas systems can be developed as powerful genome engineering tools, and it is important to predict putative new effector proteins as well as their design and optimization.

Известна нуклеаза системы CRISPR-Cas9 из бактерии Defluviimonas sp. 20V17, описанная в патенте РФ № 2712492. Известна нуклеаза системы CRISPR-Cas9 из бактерии Pasteurella pneumotropica, описанная в патенте РФ № 2722934. Известны нуклеазы системы CRISPR-Cas9 из бактерий Streptococcus pyogenes, Streptococcus thermophilus, Neisseria meningitidis и Treponema denticola, описанные в патенте РФ № 2704981. Известна нуклеаза системы CRISPR-Cas9 из губок Homoeodictya palmate, описанная в патенте РФ № 2706298. Известно использование нуклеаз системы CRISPR-Cas9 из бактерий Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens и Porphyromonas macacae в искусственной системе, описанной в патенте РФ № 2737537. Известны способы, системы и компоненты для редактирования генома, содержащие полипептид Cpf1 из Acidaminococcus sp. BV3L6, Thiomicrospira sp. XS5, Moraxella bovoculi AAX08_00205, Moraxella bovoculi AAX11_00205 и Lachnospiraceae bacterium MA2020, описанные в международной заявке, опубликованной как WO2017184768.The nuclease of the CRISPR-Cas9 system is known from the bacterium Defluviimonas sp . 20V17, described in RF patent No. 2712492. The nuclease of the CRISPR-Cas9 system is known from the bacterium Pasteurella pneumotropica , described in the RF patent No. 2722934. The nucleases of the CRISPR-Cas9 system are known from the bacteria Streptococcus pyogenes , Streptococcus thermophilus , Neisseria meningitidis and Treponema denticola , described in the patent RF No. 2704981. The nuclease of the CRISPR-Cas9 system from the sponges Homoeodictya palmate is known, described in RF patent No. 2706298. It is known to use nucleases of the CRISPR-Cas9 system from the bacteria Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens and Porphyromonas macacae in an artificial system described in RF patent No. 2 737537. Known methods, systems and components for genome editing containing the Cpf1 polypeptide from Acidaminococcus sp. BV3L6, Thiomicrospira sp. XS5, Moraxella bovoculi AAX08_00205, Moraxella bovoculi AAX11_00205 and Lachnospiraceae bacterium MA2020 , described in the international application published as WO2017184768.

Изученные в настоящее время нуклеазы систем CRISPR/Cas имеют ограниченное применение в связи с проблемами, связанными со скоростью функционирования, чувствительностью к температурным условиям, и, что наиболее важно - требованиям к последовательности РАМ. Данные ограничения характерны для всех изученных на данный момент Cas нуклеаз. Поиск новых ферментов Cpf1 с другими последовательностями РАМ позволит расширить арсенал имеющихся средств для образования двунитевого или однонитевого разрыва в необходимых, строго определенных местах в молекулах нуклеиновых кислот разных организмов.Currently studied nucleases of CRISPR/Cas systems have limited application due to problems associated with speed of operation, sensitivity to temperature conditions, and, most importantly, PAM sequence requirements. These limitations are typical for all Cas nucleases studied to date. The search for new Cpf1 enzymes with other PAM sequences will expand the arsenal of available tools for the formation of double-stranded or single-stranded breaks in the required, strictly defined places in the nucleic acid molecules of different organisms.

Наиболее близкий к заявляемому RbCpf1 ортологу, известный на данный момент, LbCpf1, полученный из Lachnospiraceae bacterium ND2006, аминокислотная последовательность которого имеет 46 % идентичности с аминокислотной последовательностью RbCpf1, в нативном виде распознает канонические 5'-TTTV последовательности PAM (где V - A, G или C), а также неканонические 5'-CTTV, 5'-TCTV, 5'-TTCV последовательности PAM, которые встречаются относительно редко в геномах прокариотических и эукариотических клеток. Такие же PAM распознает и AsCpf1 [Peng Chen, Jin Zhou, Yibin Wan, Huan Liu, Yongzheng Li, Zhaoxin Liu, Hongjian Wang, Jun Lei, Kai Zhao, Yiliang Zhang, Yan Wang, Xinghua Zhang & Lei Yin. (2020). A Cas12a ortholog with stringent PAM recognition followed by low off-target editing rates for genome editing. Genome biology, 21(1), 1-13]. В то же время LbCpf1 не способен распознавать более вырожденные PAM последовательности, которые встречаются гораздо чаще в большинстве геномов с охарактеризованной нуклеотидной последовательностью.The closest ortholog to the claimed RbCpf1 currently known is LbCpf1, obtained from Lachnospiraceae bacterium ND2006, the amino acid sequence of which has 46% identity with the amino acid sequence of RbCpf1, in its native form recognizes the canonical 5'-TTTV PAM sequences (where V - A, G or C), as well as non-canonical 5'-CTTV, 5'-TCTV, 5'-TTCV PAM sequences, which are relatively rare in the genomes of prokaryotic and eukaryotic cells. The same PAM is also recognized by AsCpf1 [Peng Chen, Jin Zhou, Yibin Wan, Huan Liu, Yongzheng Li, Zhaoxin Liu, Hongjian Wang, Jun Lei, Kai Zhao, Yiliang Zhang, Yan Wang, Xinghua Zhang & Lei Yin. (2020). A Cas12a ortholog with stringent PAM recognition followed by low off-target editing rates for genome editing. Genome biology, 21(1), 1-13]. At the same time, LbCpf1 is not able to recognize more degenerate PAM sequences, which are much more common in most genomes with a characterized nucleotide sequence.

Поэтому в настоящее время сохраняется насущная потребность в разработке новых агентов с улучшенной специфичностью к последовательности-мишени, дающих возможность расщепления мишеней в различных экспериментальных условиях для применения в области генетических исследований, редактирования генома и генной терапии, а также в детекции нуклеиновых кислот.Therefore, there remains an urgent need to develop new agents with improved target sequence specificity, enabling target cleavage under a variety of experimental conditions, for applications in genetic research, genome editing and gene therapy, and nucleic acid detection.

Технической проблемой, на решение которой направлено заявляемое изобретение, является создание новых инструментов для изменения последовательности геномной ДНК одноклеточных или многоклеточных организмов на основе систем CRISPR-Cas.The technical problem to be solved by the claimed invention is the creation of new tools for changing the genomic DNA sequence of unicellular or multicellular organisms based on CRISPR-Cas systems.

Раскрытие изобретенияDisclosure of the Invention

Техническая проблема решается заявляемой нуклеазой 2 класса V-A подтипа RbCpf1 бактерии Ruminococcus bromii, которая может применяться для внесения направленных изменений в геном как этого, так и других организмов. Направленные изменения могут вноситься путем осуществления разрыва в молекулу ДНК в положении, заданном природным свойством белка, при нуклеотидной последовательности PAM 5'-YYN-3' в указанной молекуле ДНК.The technical problem is solved by the claimed class 2 nuclease VA of the RbCpf1 subtype of the bacterium Ruminococcus bromii , which can be used to make targeted changes in the genome of both this and other organisms. Targeted changes can be made by making a break in the DNA molecule in a position specified by the natural property of the protein, with the nucleotide sequence PAM 5'-YYN-3' in the specified DNA molecule.

Техническим результатом заявляемой группы изобретений является увеличение пула доступных Cas нуклеаз для геномного редактирования в целом, и расширяющее количество потенциальных мишеней в геноме модифицируемых клеток или другой молекуле ДНК с помощью Cpf1 нуклеаз в частности.The technical result of the claimed group of inventions is to increase the pool of available Cas nucleases for genome editing in general, and to expand the number of potential targets in the genome of modified cells or another DNA molecule using Cpf1 nucleases in particular.

Как известно, в большинстве случаев для эффективного распознавания мишени эффекторным комплексам CRISPR/Cas систем требуется относительно короткая последовательность, примыкающая к протоспейсеру - PAM (англ. Protospacer adjacent motif). PAM-специфичность обусловлена природными свойствами белков - эффекторных нуклеаз в составе комплексов с РНК, и различается у разных представителей Cas нуклеаз. Последнее ограничивает применение каждой отдельно взятой Cas нуклеазы, поскольку количество возможных потенциальных локусов для внесения направленных разрывов в молекулы ДНК обусловлено PAM-специфичностью, выбранной Cas нуклеазы. В целях преодоления этого барьера в рамках данного изобретения была охарактеризована РНК-направляемая ДНК-эндонуклеаза RbCpf1, способная эффективно распознавать PAM-последовательности 5'-YYN-3' в составе молекул ДНК. Особенностями данной нуклеазы RbCpf1 являются: а) наименее строгая из известных Cpf1 PAM-последовательность, исходя из доступных литературных источников; б) расширенный температурный диапазон работы нуклеазы от 20 до 42°C; в) сравнительно небольшой размер среди ортологов нуклеаз Cpf1 (1245 аминокислотных остатков).As is known, in most cases, for effective target recognition, effector complexes of CRISPR/Cas systems require a relatively short sequence adjacent to the protospacer - PAM (Protospacer adjacent motif). PAM specificity is due to the natural properties of proteins - effector nucleases in complexes with RNA, and differs among different representatives of Cas nucleases. The latter limits the use of each individual Cas nuclease, since the number of possible potential loci for introducing targeted breaks into DNA molecules is determined by the PAM specificity of the selected Cas nuclease. In order to overcome this barrier, the present invention characterized the RNA-guided DNA endonuclease RbCpf1, which is capable of efficiently recognizing 5'-YYN-3' PAM sequences in DNA molecules. The features of this RbCpf1 nuclease are: a) the least strict known Cpf1 PAM sequence, based on the available literature; b) extended temperature range of nuclease operation from 20 to 42°C; c) relatively small size among the orthologs of Cpf1 nucleases (1245 amino acid residues).

Настоящее изобретение относится в целом к новому белку, обладающему активностью нуклеазы, вариантам его применения и содержащим его средствам, в частности, к ферменту нуклеазе Cpf1 из бактерии Ruminococcus bromii. Настоящее изобретение также относится к фрагменту ДНК или РНК, кодирующему указанный фермент, вектору, содержащему указанную молекулу ДНК, системе CRISPR/Cpf1, содержащей указанную нуклеазу и направляющую РНК, клетке-хозяину для получения нуклеазы Cpf1, способу получения нуклеазы Cpf1, применению указанной нуклеазы Cpf1 для образования разрыва в молекуле ДНК или РНК, способу образования разрыва в молекуле ДНК или РНК с использованием указанной нуклеазы, системе доставки, содержащей указанную нуклеазу Cpf1, молекулу ДНК или РНК или вектор, комбинации способов доставки, содержащей указанную нуклеазу Cpf1, молекулу ДНК или РНК или вектор, способу модификации целевого локуса ДНК или РНК с использованием указанной нуклеазы, применению указанной нуклеазы Cpf1 для редактирования генома или генной терапии или детекции нуклеиновых кислот.The present invention relates generally to a new protein having nuclease activity, uses thereof and agents containing it, in particular to the nuclease enzyme Cpf1 from the bacterium Ruminococcus bromii . The present invention also relates to a fragment of DNA or RNA encoding the specified enzyme, a vector containing the specified DNA molecule, a CRISPR/Cpf1 system containing the specified nuclease and guide RNA, a host cell for producing the Cpf1 nuclease, a method for producing the Cpf1 nuclease, the use of the specified Cpf1 nuclease for creating a break in a DNA or RNA molecule, a method for creating a break in a DNA or RNA molecule using the specified nuclease, a delivery system containing the specified Cpf1 nuclease, a DNA or RNA molecule or a vector, a combination of delivery methods containing the specified Cpf1 nuclease, a DNA or RNA molecule or a vector, a method of modifying a target DNA or RNA locus using said nuclease, using said Cpf1 nuclease for genome editing or gene therapy or nucleic acid detection.

Фразу «разрыв вносится в молекулу ДНК в положении, заданном природным свойством белка, при нуклеотидной последовательности PAM в указанной молекуле ДНК» стоит трактовать как внесение разрыва в молекулу ДНК на расстоянии от 0 до 30 нуклеотидов от нуклеотидной последовательности PAM.The phrase “a break is introduced into the DNA molecule at a position specified by a natural property of the protein, with a PAM nucleotide sequence in the specified DNA molecule” should be interpreted as the introduction of a break into the DNA molecule at a distance from 0 to 30 nucleotides from the PAM nucleotide sequence.

Аминокислотная последовательность нуклеазы RbCpf1 представлена в SEQ ID NO: 1.The amino acid sequence of RbCpf1 nuclease is shown in SEQ ID NO: 1.

Последовательность ДНК, кодирующая нуклеазу RbCpf1, представлена в SEQ ID NO: 2.The DNA sequence encoding the RbCpf1 nuclease is shown in SEQ ID NO: 2.

В частности, в качестве средств для решения задачи настоящего изобретения предложены, обладающий активностью нуклеазы, который содержит аминокислотную последовательность SEQ ID NO: 1; последовательность, которая по меньшей мере на 80% идентична аминокислотной последовательности SEQ ID NO: 1 или фрагменту аминокислотной последовательности SEQ ID NO: 1, и кодирующая такой белок молекула ДНК, содержащая нуклеотидную последовательность, по меньшей мере на 70% идентичную SEQ ID NO: 2.In particular, as means for solving the problem of the present invention are proposed, having nuclease activity, which contains the amino acid sequence SEQ ID NO: 1; a sequence that is at least 80% identical to the amino acid sequence of SEQ ID NO: 1 or a fragment of the amino acid sequence of SEQ ID NO: 1, and a DNA molecule encoding such a protein containing a nucleotide sequence that is at least 70% identical to SEQ ID NO: 2 .

Их применение позволяет повышать универсальность доступных систем CRISPR-Cas, использовать нуклеазу RbCpf1 для разрезания геномной или плазмидной ДНК в большем количестве специфических сайтов и специфических условий.Their use makes it possible to increase the versatility of available CRISPR-Cas systems and to use the RbCpf1 nuclease to cut genomic or plasmid DNA at a greater number of specific sites and specific conditions.

В частности, в различных вариантах осуществления настоящее изобретение включает следующие аспекты.In particular, in various embodiments, the present invention includes the following aspects.

Белок, обладающий активностью нуклеазы, который содержит аминокислотную последовательность SEQ ID NO: 1; последовательность, которая по меньшей мере на 80% идентична аминокислотной последовательности SEQ ID NO: 1; или фрагмент аминокислотной последовательности SEQ ID NO: 1. Предпочтительно когда белок содержит аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности SEQ ID NO: 1, более предпочтительно когда аминокислотная последовательность по меньшей мере на 95% идентична последовательности SEQ ID NO: 1, наиболее предпочтительно когда аминокислотная последовательность по меньшей мере на 98% идентична последовательности SEQ ID NO: 1, очень предпочтительно когда аминокислотная последовательность по меньшей мере на 99% идентична последовательности SEQ ID NO: 1.A protein having nuclease activity, which contains the amino acid sequence SEQ ID NO: 1; a sequence that is at least 80% identical to the amino acid sequence of SEQ ID NO: 1; or a fragment of the amino acid sequence of SEQ ID NO: 1. Preferably, the protein contains an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 1, more preferably, the amino acid sequence is at least 95% identical to the sequence of SEQ ID NO: 1 , most preferably when the amino acid sequence is at least 98% identical to the sequence of SEQ ID NO: 1, very preferably when the amino acid sequence is at least 99% identical to the sequence of SEQ ID NO: 1.

Возможен вариант осуществления, согласно которому белок представляет собой природный белок, то есть полученный или используемый непосредственно из бактерии Ruminococcus bromii sp. или внутри клетки Ruminococcus bromii sp.A possible embodiment is that the protein is a natural protein, that is, obtained or used directly from the bacterium Ruminococcus bromii sp . or inside the cell of Ruminococcus bromii sp .

Возможен вариант осуществления, согласно которому белок представляет собой искусственно синтезированный белок.A possible embodiment is that the protein is an artificially synthesized protein.

Возможен вариант осуществления, согласно которому белок представляет собой рекомбинантный белок, выделенный из гетерологичных систем экспрессии, таких как бактерии, дрожжи и другие эукариотические системы экспрессии.It is possible that the protein is a recombinant protein isolated from heterologous expression systems such as bacteria, yeast and other eukaryotic expression systems.

Возможен вариант осуществления, согласно которому белок получен в бесклеточной системе трансляции.A possible embodiment is where the protein is produced in a cell-free translation system.

Возможен вариант осуществления, согласно которому белок представляет собой искусственно гибридный белок.A possible embodiment is that the protein is an artificially hybrid protein.

Молекула ДНК, кодирующая белок, обладающий активностью нуклеазы.A DNA molecule encoding a protein that has nuclease activity.

Возможен вариант осуществления, согласно которому молекула ДНК содержит нуклеотидную последовательность, по меньшей мере на 70% идентичную SEQ ID NO: 2, предпочтительно по меньшей мере на 80%, более предпочтительно на 90% идентичную SEQ ID NO: 2. Возможен вариант, когда последовательность идентична по меньшей мере на 95%, предпочтительно на 98%, более предпочтительно, по меньшей мере на 99% идентичную SEQ ID NO: 2. Возможен вариант осуществления, согласно которому молекула ДНК содержит нуклеотидную последовательность SEQ ID NO: 2, предпочтительно молекула ДНК состоит из нуклеотидной последовательности SEQ ID NO: 2. Возможен вариант осуществления, согласно которому молекула РНК состоит из нуклеотидной последовательности, в ходе трансляции которой образуется аминокислотная последовательность SEQ ID NO: 1.It is possible that the DNA molecule contains a nucleotide sequence that is at least 70% identical to SEQ ID NO: 2, preferably at least 80%, more preferably 90% identical to SEQ ID NO: 2. It is possible that the sequence is at least 95% identical, preferably 98% identical, more preferably at least 99% identical to SEQ ID NO: 2. It is possible that the DNA molecule contains the nucleotide sequence of SEQ ID NO: 2, preferably the DNA molecule consists from the nucleotide sequence SEQ ID NO: 2. An embodiment is possible, according to which the RNA molecule consists of a nucleotide sequence, during translation of which the amino acid sequence SEQ ID NO: 1 is formed.

Вектор, содержащий нуклеиновую кислоту согласно заявляемому изобретению изобретения и элементы, обеспечивающие поддержание целостности и/или копийности и/или функциональности вектора. Элементы, обеспечивающие поддержание целостности и/или копийности и/или функциональности молекулы ДНК, включают ориджины репликации, гены устойчивости к антибиотикам, промоторные, операторные, энхансерные и терминаторные регионы генов, регионы связывания транскрипционных факторов. Возможен вариант осуществления, согласно которому вектор является экспрессионным вектором.A vector containing a nucleic acid according to the claimed invention and elements ensuring the maintenance of the integrity and/or copy number and/or functionality of the vector. Elements that ensure the maintenance of the integrity and/or copy number and/or functionality of the DNA molecule include origins of replication, antibiotic resistance genes, promoter, operator, enhancer and terminator gene regions, and transcription factor binding regions. A possible embodiment is that the vector is an expression vector.

Предпочтительно вектор для экспрессии RbCpf1 в клетках человека включает следующие последовательно расположенные элементы: Энхансер цитомегаловируса (CMV) - 235 - 614 п.о.; Промотор цитомегаловируса (CMV) - 615 - 818 п.о.; T7 промотор - 863 - 881 п.о.; Ген RbCpf1 - 917 - 4651 п.о.; Сигнал ядерной локализации нуклеоплазмина NLS - 4652 - 4699 п.о.; Аффинная метка гемаглютинина вируса гриппа HA - 4700 - 4726 п.о.; Сигнал полиаденилирования бычьего гормона роста bGH-poly(A) - 4832 - 5056 п.о.; Ориджин репликации f1 - 5102 - 5530 п.о.; Промотор и энхансер обезьяньего вируса SV40 - 5544 - 5873 п.о.; Ориджин репликации обезьяньего вируса SV40 - 5724 - 5859 п.о.; Ген устойчивости к канамицину, неомицину, G418 NeoR/KanR - 5940 - 6734 п.о.; Сигнал полиаденилирования обезьяньего вируса SV40 - 6908 - 7029 п.о.; Lac оператор - 7102 - 7118 п.о.; Промотор lac - 7126 - 7156 п.о.; Сайт связывания CAP - 7171- 7192 п.о.; Ориджин репликации ColE1/pMB1/pBR322/pUC - 7480 - 8065 п.о.; Ген устойчивости к ампициллину AmpR - 8236 - 9096 п.о.; Промотор гена AmpR - 9097 - 9201 п.о.Preferably, the vector for the expression of RbCpf1 in human cells includes the following sequential elements: Cytomegalovirus (CMV) enhancer - 235 - 614 bp; Cytomegalovirus (CMV) promoter - 615 - 818 bp; T7 promoter - 863 - 881 bp; RbCpf1 gene - 917 - 4651 bp; Nuclear localization signal for nucleoplasmin NLS - 4652 - 4699 bp; Affinity tag of influenza virus hemagglutinin HA - 4700 - 4726 bp; Bovine growth hormone polyadenylation signal bGH-poly(A) - 4832 - 5056 bp; Origin of replication f1 - 5102 - 5530 bp; Promoter and enhancer of the simian virus SV40 - 5544 - 5873 bp; Origin of replication of the simian virus SV40 - 5724 - 5859 bp; Resistance gene to kanamycin, neomycin, G418 NeoR/KanR - 5940 - 6734 bp; Polyadenylation signal of simian virus SV40 - 6908 - 7029 bp; Lac operator - 7102 - 7118 bp; lac promoter - 7126 - 7156 bp; CAP binding site - bp 7171-7192; Origin of replication ColE1/pMB1/pBR322/pUC - 7480 - 8065 bp; Ampicillin resistance gene AmpR - 8236 - 9096 bp; AmpR gene promoter - 9097 - 9201 bp.

Предпочтительно вектор для экспрессии в клетках Escherichia coli включает следующие последовательно расположенные элементы: T7 терминатор - 26-73 п.о.; 6xHis аффинная метка - 140-157 п.о.; Ген RbCpf1 - 159-3898 п.о.; Сайт связывания рибосом из гена 10 фага T7 (RBS) - 3909-3931 п.о.; Lac оператор - 3946-3970 п.о.; T7 промотор - 3971 - 3989 п.о.; lacI промотор - 4302 - 4379 п.о.; Ген lacI - 4380 - 5462 п.о.; Ген rop - 6271 - 6462 п.о.; bom элемент - 6564 - 6706 п.о.; Ориджин репликации ColE1/pMB1/pBR322/pUC - 6892 - 7480 п.о.; Ген устойчивости к канамицину KanR - 7602 - 8417 п.о.; Ориджин репликации фага f1 - 8510 - 8965 п.о. (фиг. 16).Preferably, the vector for expression in Escherichia coli cells includes the following sequential elements: T7 terminator - 26-73 bp; 6xHis affinity tag - 140-157 bp; RbCpf1 gene - 159-3898 bp; Ribosome binding site from phage T7 gene 10 (RBS) - bp 3909-3931; Lac operator - 3946-3970 bp; T7 promoter - 3971 - 3989 bp; lacI promoter - 4302 - 4379 bp; Gene lacI - 4380 - 5462 bp; Gene rop - 6271 - 6462 bp; bom element - 6564 - 6706 bp; Origin of replication ColE1/pMB1/pBR322/pUC - 6892 - 7480 bp; Kanamycin resistance gene KanR - 7602 - 8417 bp; Origin of replication of phage f1 - 8510 - 8965 bp. (Fig. 16).

Клетка-хозяин для продуцирования белка, содержащая нуклеиновую кислоту, кодирующую белок, обладающий активностью нуклеазы, или вектор, содержащий нуклеиновую кислоту. Клетка-хозяин представляет собой прокариотическую или эукариотическую клетку. Предпочтительно клетка-хозяин представляет собой клетку бактерии, гриба, растения или животного, в частности, насекомого или млекопитающего.A protein-producing host cell containing a nucleic acid encoding a protein having nuclease activity or a vector containing the nucleic acid. The host cell is a prokaryotic or eukaryotic cell. Preferably the host cell is a bacterial, fungal, plant or animal cell, in particular an insect or mammal.

Клетка-хозяин может быть представлена клеткой, приспособленной для производства и последующего выделения и очистки рекомбинатного белка. Подобные клетки используются в лабораторной практике и известны специалистам. Возможен вариант осуществления, согласно которому клетка-хозяин представляет собой клетку организма, например, из рода Escherichia (Ao, Xiang, Yi Yao, Tian Li, Ting-Ting Yang, Xu Dong, Ze-Tong Zheng, Guo-Qiang Chen, Qiong Wu, and Yingying Guo. "A multiplex genome editing method for Escherichia coli based on CRISPR-Cas12a." Frontiers in microbiology 9 (2018): 2307), Bacillus (Sachla, Ankita J., Alexander J. Alfonso, and John D. Helmann. "A simplified method for CRISPR-Cas9 engineering of Bacillus subtilis." Microbiology spectrum 9, no. 2 (2021): e00754-21), Saccharomyces (Ryan, Owen W., Snigdha Poddar, and Jamie HD Cate. "Crispr-cas9 genome engineering in Saccharomyces cerevisiae cells." Cold Spring Harbor Protocols 2016, no. 6 (2016): pdb-prot086827), Schizosaccharomyces (Ozaki, Aiko, Rie Konishi, Chisako Otomo, Mayumi Kishida, Seiya Takayama, Takuya Matsumoto, Tsutomu Tanaka, and Akihiko Kondo. "Metabolic engineering of Schizosaccharomyces pombe via CRISPR-Cas9 genome editing for lactic acid production from glucose and cellobiose." Metabolic engineering communications 5 (2017): 60-67), Pichia (Liu, Qi, Xiaona Shi, Lili Song, Haifeng Liu, Xiangshan Zhou, Qiyao Wang, Yuanxing Zhang, and Menghao Cai. "CRISPR-Cas9-mediated genomic multiloci integration in Pichia pastoris." Microbial cell factories 18, no. 1 (2019): 1-11), Synechocystis (Cengic, Ivana, Inés C. Cañadas, Nigel P. Minton, and Elton P. Hudson. "Inducible CRISPR/Cas9 allows for multiplexed and rapidly segregated single target genome editing in Synechocystis sp. PCC 6803." bioRxiv (2022)), Chlamydomonas (Shin, Sung-Eun, Jong-Min Lim, Hyun Gi Koh, Eun Kyung Kim, Nam Kyu Kang, Seungjib Jeon, Sohee Kwon et al. "CRISPR/Cas9-induced knockout and knock-in mutations in Chlamydomonas reinhardtii." Scientific reports 6, no. 1 (2016): 1-15), Anabaena (Niu, Tian-Cai, Gui-Ming Lin, Li-Rui Xie, Zi-Qian Wang, Wei-Yue Xing, Ju-Yuan Zhang, and Cheng-Cai Zhang. "Expanding the potential of CRISPR-Cpf1-based genome editing technology in the cyanobacterium Anabaena PCC 7120." ACS synthetic biology 8, no. 1 (2018): 170-180), Arabidopsis (Miki, Daisuke, Wenxin Zhang, Wenjie Zeng, Zhengyan Feng, and Jian-Kang Zhu. "CRISPR/Cas9-mediated gene targeting in Arabidopsis using sequential transformation." Nature Communications 9, no. 1 (2018): 1-9), Solanum (Maioli, Alex, Silvia Gianoglio, Andrea Moglia, Alberto Acquadro, Danila Valentino, Anna Maria Milani, Jaime Prohens et al. "Simultaneous CRISPR/Cas9 Editing of Three PPO Genes Reduces Fruit Flesh Browning in Solanum melongena L." Frontiers in plant science 11 (2020): 607161), Triticum (Tanaka, Jaclyn, Bastian Minkenberg, Snigdha Poddar, Brian Staskawicz, and Myeong-Je Cho. "Improvement of Gene Delivery and Mutation Efficiency in the CRISPR-Cas9 Wheat (Triticum aestivum L.) Genomics System via Biolistics." Genes(Basel) 13, no. 7 (2022): 1180), Nicotiana (Huang, Teng‐Kuei, Brittney Armstrong, Patrick Schindele, and Holger Puchta. "Efficient gene targeting in Nicotiana tabacum using CRISPR/SaCas9 and temperature tolerant LbCas12a." Plant biotechnology journal 19, no. 7 (2021): 1314-1324), Hordeum (Gasparis, Sebastian, Maciej Kała, Mateusz Przyborowski, Leszek A. Łyżnik, Wacław Orczyk, and Anna Nadolska-Orczyk. "A simple and efficient CRISPR/Cas9 platform for induction of single and multiple, heritable mutations in barley (Hordeum vulgare L.)." Plant methods 14, no. 1 (2018): 1-14), Drosophila (Port, Fillip, Maja Starostecka, and Michael Boutros. "Multiplexed conditional genome editing with Cas12a in Drosophila." Proceedings of the National Academy of Sciences 117, no. 37 (2020): 22890-22899), Mus (Pelletier, Stephane, Sebastien Gingras, and Douglas R. Green. "Mouse genome engineering via CRISPR-Cas9 for study of immune function." Immunity 42, no. 1 (2015): 18-27), Rattus (Remy, Séverine, Vanessa Chenouard, Laurent Tesson, Claire Usal, Séverine Ménoret, Lucas Brusselle, Jean-Marie Heslan et al. "Generation of gene-edited rats by delivery of CRISPR/Cas9 protein and donor DNA into intact zygotes using electroporation." Scientific reports 7, no. 1 (2017): 1-13), Homo (Ma, Hong, Nuria Marti-Gutierrez, Sang-Wook Park, Jun Wu, Yeonmi Lee, Keiichiro Suzuki, Amy Koski et al. "Correction of a pathogenic gene mutation in human embryos." Nature 548, no. 7668 (2017): 413-419.; Zhang, Liyang, John A. Zuris, Ramya Viswanathan, Jasmine N. Edelstein, Rolf Turk, Bernice Thommandru, H. Tomas Rube et al. "AsCas12a ultra nuclease facilitates the rapid generation of therapeutic cell medicines." Nature communications 12, no. 1 (2021): 1-15) или других прокариотических или эукариотических клеток, а также представляет собой ткань, орган, органоид или целый организм.The host cell may be a cell adapted to produce and subsequently isolate and purify the recombinant protein. Such cells are used in laboratory practice and are known to specialists. A possible embodiment is where the host cell is a cell of an organism, for example from the genus Escherichia (Ao, Xiang, Yi Yao, Tian Li, Ting-Ting Yang, Xu Dong, Ze-Tong Zheng, Guo-Qiang Chen, Qiong Wu , and Yingying Guo, "A multiplex genome editing method for Escherichia coli based on CRISPR-Cas12a." Frontiers in microbiology 9 (2018): 2307), Bacillus (Sachla, Ankita J., Alexander J. Alfonso, and John D. Helmann "A simplified method for CRISPR-Cas9 engineering of Bacillus subtilis." Microbiology spectrum 9, no. 2 (2021): e00754-21), Saccharomyces (Ryan, Owen W., Snigdha Poddar, and Jamie HD Cate. "Crispr- cas9 genome engineering in Saccharomyces cerevisiae cells." Cold Spring Harbor Protocols 2016, no. 6 (2016): pdb-prot086827), Schizosaccharomyces (Ozaki, Aiko, Rie Konishi, Chisako Otomo, Mayumi Kishida, Seiya Takayama, Takuya Matsumoto, Tsutomu Tanaka , and Akihiko Kondo. "Metabolic engineering of Schizosaccharomyces pombe via CRISPR-Cas9 genome editing for lactic acid production from glucose and cellobiose." Metabolic engineering communications 5 (2017): 60-67), Pichia (Liu, Qi, Xiaona Shi, Lili Song, Haifeng Liu, Xiangshan Zhou, Qiyao Wang, Yuanxing Zhang, and Menghao Cai. "CRISPR-Cas9-mediated genomic multiloci integration in Pichia pastoris." Microbial cell factories 18, no. 1 (2019): 1-11), Synechocystis (Cengic, Ivana, Inés C. Cañadas, Nigel P. Minton, and Elton P. Hudson. "Inducible CRISPR/Cas9 allows for multiplexed and rapidly segregated single target genome editing in Synechocystis sp . PCC 6803." bioRxiv (2022)), Chlamydomonas (Shin, Sung-Eun, Jong-Min Lim, Hyun Gi Koh, Eun Kyung Kim, Nam Kyu Kang, Seungjib Jeon, Sohee Kwon et al. "CRISPR/Cas9-induced knockout and knock-in mutations in Chlamydomonas reinhardtii." Scientific reports 6, no. 1 (2016): 1-15), Anabaena (Niu, Tian-Cai, Gui-Ming Lin, Li-Rui Xie, Zi-Qian Wang, Wei-Yue Xing, Ju-Yuan Zhang, and Cheng-Cai Zhang, "Expanding the potential of CRISPR-Cpf1-based genome editing technology in the cyanobacterium Anabaena PCC 7120." ACS synthetic biology 8, no. 1 (2018): 170 -180), Arabidopsis (Miki, Daisuke, Wenxin Zhang, Wenjie Zeng, Zhengyan Feng, and Jian-Kang Zhu. "CRISPR/Cas9-mediated gene targeting in Arabidopsis using sequential transformation." Nature Communications 9, no. 1 (2018) : 1-9), Solanum (Maioli, Alex, Silvia Gianoglio, Andrea Moglia, Alberto Acquadro, Danila Valentino, Anna Maria Milani, Jaime Prohens et al. "Simultaneous CRISPR/Cas9 Editing of Three PPO Genes Reduces Fruit Flesh Browning in Solanum melongena L." Frontiers in plant science 11 (2020): 607161), Triticum (Tanaka, Jaclyn, Bastian Minkenberg, Snigdha Poddar, Brian Staskawicz, and Myeong-Je Cho. "Improvement of Gene Delivery and Mutation Efficiency in the CRISPR-Cas9 Wheat (Triticum aestivum L.) Genomics System via Biolistics." Genes(Basel) 13, no. 7 (2022): 1180), Nicotiana (Huang, Teng‐Kuei, Brittney Armstrong, Patrick Schindele, and Holger Puchta. "Efficient gene targeting in Nicotiana tabacum using CRISPR/SaCas9 and temperature tolerant LbCas12a." Plant biotechnology journal 19, no. 7 (2021): 1314-1324), Hordeum (Gasparis, Sebastian, Maciej Kała, Mateusz Przyborowski, Leszek A. Łyżnik, Wacław Orczyk, and Anna Nadolska -Orczyk, "A simple and efficient CRISPR/Cas9 platform for induction of single and multiple, heritable mutations in barley (Hordeum vulgare L.)." Plant methods 14, no. 1 (2018): 1-14), Drosophila (Port , Fillip, Maja Starostecka, and Michael Boutros, “Multiplexed conditional genome editing with Cas12a in Drosophila.” Proceedings of the National Academy of Sciences 117, no. 37 (2020): 22890-22899), Mus (Pelletier, Stephane, Sebastien Gingras, and Douglas R. Green. "Mouse genome engineering via CRISPR-Cas9 for studying immune function." Immunity 42, no. 1 (2015): 18-27), Rattus (Remy, Séverine, Vanessa Chenouard, Laurent Tesson, Claire Usal, Séverine Ménoret, Lucas Brusselle, Jean-Marie Heslan et al. “Generation of gene-edited rats by delivery of CRISPR/Cas9 protein and donor DNA into intact zygotes using electroporation." Scientific reports 7, no. 1 (2017): 1-13), Homo (Ma, Hong, Nuria Marti-Gutierrez, Sang-Wook Park, Jun Wu, Yeonmi Lee, Keiichiro Suzuki, Amy Koski et al., "Correction of a pathogenic gene mutation in human embryos." Nature 548, no. 7668 (2017): 413-419; Zhang, Liyang, John A. Zuris, Ramya Viswanathan, Jasmine N. Edelstein, Rolf Turk, Bernice Thommandru, H. Tomas Rube et al. "AsCas12a ultra nuclease facilitates the rapid generation of therapeutic cell medicines." Nature communications 12, no. 1 (2021): 1-15) or other prokaryotic or eukaryotic cells, and also represents tissue, organ, organoid or whole organism.

Способ получения белка, обладающего активностью нуклеазы, включает этапы культивирования клетки-хозяина согласно четвертому объекту настоящего изобретения в культуральной среде в условиях, подходящих для продуцирования белка. Например, трансформированные клетки экспрессионного штамма Escherichia coli (такие как BL21(DE3) и его деривативные штаммы (Rosetta, Rosetta2 и аналогичные), либо другие DE3-штаммы) растят в среде Luria-Bertoni (LB) или других подходящих средах (M9, N-C-, LeMaster-Richards (LR)) при 30-37 °С и 100-200 оборотах в минуту до достижения значения оптической плотности 0.4-0.6. Далее к суспензии добавляют ИПТГ (изопропил-β-D-1-тиогалактопиранозид) до концентрации 0.1-1 мМ, снижают температуру до 18-22°С и инкубируют 3-8 часов при 100-150 оборотах в минуту. Осадок клеток, содержащих рекомбинантный белок, суспензируют в стартовом буфере, содержащемдо 100 мМ Tris-HCl pH 7-7.8, до 400 мМ NaCl, 5-10 мМ имидазола, 0-0.2% Triton-X100, 0-5 Мм β-МЭ, 0-1 мМ PMSF при +4 С. Лизат центрифугируют при 20000-28000g в течение 10-60 мин при +4°C и наносят супернатант на металлохелатную колонку Ni-NTA Superflow, предварительно уравновешенную буфером, содержащемдо 100 мМ Tris-HCl pH 7-7.8, до 400 мМ NaCl, 5-10 мМ имидазола, 0-0.1% Triton-X100. Затем колонку промывают последовательно стартовым буфером, промывочным буфером, содержащем до 100 мМ Tris-HCl pH 7-7.8, до 400 мМ NaCl, 40-50 мМ имидазола и элюирующим буфером, содержащем до 100 мМ Tris-HCl pH 7-7.8, до 400 мМ NaCl, 150-500 мМ имидазола. Полученные фракции объединяют, концентрируют и переводят в 20-100 мМ Na-фосфатный буфер с рН 7-7.4 с помощью хроматографии на колонке fast desalting (например, PD-10). Полученный раствор наносят на колонку MonoS 10/100 (GE LifeScience) и проводят элюцию линейным градиентом (0-0.6 М, 10-30 объемов колонки) концентрации NaCl в 20-100-мМ Na-фосфатном буфере рН 7-7.4. Фракции, содержащие целевой белок, объединяют, переводят в буфер для хранения, содержащий 10-50 мМ Tris-HCl pH 7-7.5, 250-500 мМ NaCl, 0-2 мМ ДТТ, 0-10% (об/об) глицерин). Пример хода выделения RbCpf1 проиллюстрирован на фиг. 8-12.A method for producing a protein having nuclease activity includes the steps of culturing a host cell according to a fourth aspect of the present invention in a culture medium under conditions suitable for producing the protein. For example, transformed cells of an Escherichia coli expression strain (such as BL21(DE3) and its derivative strains (Rosetta, Rosetta2 and the like), or other DE3 strains) are grown in Luria-Bertoni (LB) medium or other suitable media (M9, N-C -, LeMaster-Richards (LR)) at 30-37 °C and 100-200 rpm until an optical density of 0.4-0.6 is achieved. Next, IPTG (isopropyl-β-D-1-thiogalactopyranoside) is added to the suspension to a concentration of 0.1-1 mM, the temperature is reduced to 18-22°C and incubated for 3-8 hours at 100-150 rpm. The cell pellet containing the recombinant protein is suspended in a starting buffer containing up to 100 mM Tris-HCl pH 7-7.8, up to 400 mM NaCl, 5-10 mM imidazole, 0-0.2% Triton-X100, 0-5 mM β-ME, 0-1 mM PMSF at +4 C. The lysate is centrifuged at 20000-28000g for 10-60 min at +4°C and the supernatant is applied to a Ni-NTA Superflow metal chelate column, pre-equilibrated with a buffer containing up to 100 mM Tris-HCl pH 7 -7.8, up to 400 mM NaCl, 5-10 mM imidazole, 0-0.1% Triton-X100. Then the column is washed sequentially with a starting buffer, a wash buffer containing up to 100 mM Tris-HCl pH 7-7.8, up to 400 mM NaCl, 40-50 mM imidazole and an elution buffer containing up to 100 mM Tris-HCl pH 7-7.8, up to 400 mM NaCl, 150-500 mM imidazole. The resulting fractions are combined, concentrated and transferred to 20-100 mM Na-phosphate buffer with pH 7-7.4 using chromatography on a fast desalting column (for example, PD-10). The resulting solution is applied to a MonoS 10/100 column (GE LifeScience) and eluted with a linear gradient (0-0.6 M, 10-30 column volumes) of NaCl concentration in 20-100 mM Na-phosphate buffer pH 7-7.4. Fractions containing the target protein are combined and transferred to a storage buffer containing 10-50 mM Tris-HCl pH 7-7.5, 250-500 mM NaCl, 0-2 mM DTT, 0-10% (v/v) glycerol) . An example of the progression of RbCpf1 isolation is illustrated in FIG. 8-12.

Дополнительно способ может включать этапы выделения и/или очистки продуцированного белка.Additionally, the method may include the steps of isolating and/or purifying the protein produced.

Система CRISPR/Cpf1, включающая направляющую (crispr) РНК для белка и содержащая белок, обладающий активностью нуклеазы, либо молекулы ДНК и РНК, кодирующие направляющую РНК и белок.The CRISPR/Cpf1 system, which includes a guide RNA (crispr) for a protein and contains a protein with nuclease activity, or DNA and RNA molecules encoding a guide RNA and a protein.

Применение белка, обладающего активностью нуклеазы, для образования разрыва в молекуле нуклеиновой кислоты, при этом разрыв представляет собой однонитевой разрыв или двунитевой разрыв. Молекула нуклеиновой кислоты представляет собой ДНК или РНК. Предпочтительно разрыв вносится в молекулу ДНК в положении, заданном природным свойством белка, при нуклеотидной последовательности PAM 5'-YYN-3' в указанной молекуле ДНК, или в положении, заданном свойством белка, измененным в ходе внесения направленных или случайных мутаций в аминокислотной SEQ ID NO: 1 или нуклеотидной SEQ ID NO: 2 последовательностях, при нуклеотидной последовательности PAM, распознаваемой белком после внесения направленных или случайных мутаций в SEQ ID NO: 1 и SEQ ID NO: 2.The use of a protein having nuclease activity to create a break in a nucleic acid molecule, wherein the break is a single-strand break or a double-strand break. A nucleic acid molecule is DNA or RNA. Preferably, the break is introduced into the DNA molecule at a position specified by a natural property of the protein, with the nucleotide sequence PAM 5'-YYN-3' in the specified DNA molecule, or at a position specified by a property of the protein changed during the introduction of directed or random mutations in the amino acid SEQ ID NO: 1 or SEQ ID NO: 2 nucleotide sequences, with the PAM nucleotide sequence recognized by the protein after targeted or random mutations in SEQ ID NO: 1 and SEQ ID NO: 2.

Способ внесения разрыва в молекулу нуклеиновой кислоты включает использование молекулы нуклеиновой кислоты с белком, обладающим активностью нуклеазы, или молекулы ДНК, кодирующей белок, обладающий активностью нуклеазы. Способ осуществляют in vitro или in vivo. Молекула нуклеиновой кислоты представляет собой молекулу ДНК или молекулу РНК. Предпочтительно разрыв представляет собой однонитевой разрыв или двунитевой разрыв. При этом контакт молекулы нуклеиновой кислоты с белком осуществляют путем введения указанного белка в клетку. Клетка представляет собой эукариотическую или прокариотическую клетку, в частности, клетку бактерии, растения, гриба или животного, например, млекопитающего, в частности, человека.A method for introducing a break in a nucleic acid molecule involves using a nucleic acid molecule with a protein having nuclease activity, or a DNA molecule encoding a protein having nuclease activity. The method is carried out in vitro or in vivo . A nucleic acid molecule is a DNA molecule or an RNA molecule. Preferably, the break is a single-strand break or a double-strand break. In this case, the contact of a nucleic acid molecule with a protein is carried out by introducing the specified protein into the cell. The cell is a eukaryotic or prokaryotic cell, in particular a bacterial, plant, fungal or animal cell, for example a mammal, in particular a human.

Способ образования двунитевого разрыва в последовательности геномной ДНК одноклеточного или многоклеточного организма, непосредственно примыкающей к последовательности 5'-YYN-3', или последовательности, содержащей 5'-YYN-3', включающий введение в по меньшей мере одну клетку этого организма эффективного количества: а) белка, обладающего активностью нуклеазы, или молекулы ДНК или РНК, кодирующей белок, обладающий активностью нуклеазы, и б) направляющей РНК, содержащей последовательность, образующую дуплекс с нуклеотидной последовательностью участка геномной ДНК организма, непосредственно примыкающей к нуклеотидной последовательности 5'-YYN-3' или последовательности, содержащей 5'-YYN-3', и взаимодействующей с указанным белком при образовании дуплекса, или последовательности ДНК, кодирующей указанную направляющую РНК.A method of causing a double-strand break in a genomic DNA sequence of a unicellular or multicellular organism immediately adjacent to a 5'-YYN-3' sequence, or a sequence containing 5'-YYN-3', comprising introducing into at least one cell of that organism an effective amount of: a) a protein having nuclease activity, or a DNA or RNA molecule encoding a protein having nuclease activity, and b) a guide RNA containing a sequence that forms a duplex with the nucleotide sequence of a region of the genomic DNA of an organism immediately adjacent to the nucleotide sequence 5'-YYN- 3' or a sequence containing 5'-YYN-3' and interacting with the specified protein to form a duplex, or a DNA sequence encoding the specified guide RNA.

Под эффективным количеством вводимых в клетку белка и РНК понимается количество белка и РНК, способное осуществлять направленное, с помощью указанной РНК, внесение двунитевого разрыва в последовательность ДНК, непосредственно примыкающей к последовательности PAM на ДНК, с помощью указанного белка.An effective amount of protein and RNA introduced into a cell is understood to mean an amount of protein and RNA capable of causing a directed, with the help of said RNA, introduction of a double-strand break into the DNA sequence immediately adjacent to the PAM sequence on the DNA, with the help of the said protein.

Система доставки, содержащая белок, молекулу ДНК или вектор. При этом вектор представляет собой молекулу ДНК, содержащую вместе с элементами, кодирующими белок Cpf1 и/или направляющую РНК, элементы, необходимые для поддержания целостности и/или копийности и/или функциональности данной молекулы ДНК. Например, в случае плазмидного вектора элементами, необходимыми для поддержания целостности и/или копийности и/или функциональности плазмидного вектора, являются ориджин репликации, ген или гены устойчивости к антибиотикам, а также регуляторные элементы для генов в составе плазмидного вектора, например, промоторы, операторы, энхансеры и терминаторы транскрипции, либо комбинации этих элементов.A delivery system containing a protein, DNA molecule or vector. In this case, the vector is a DNA molecule containing, together with elements encoding the Cpf1 protein and/or guide RNA, elements necessary to maintain the integrity and/or copy number and/or functionality of this DNA molecule. For example, in the case of a plasmid vector, the elements necessary to maintain the integrity and/or copy number and/or functionality of the plasmid vector are the origin of replication, the antibiotic resistance gene or genes, as well as regulatory elements for genes within the plasmid vector, for example, promoters, operators , enhancers and transcription terminators, or combinations of these elements.

Возможен вариант комбинации методов доставки к целевой ДНК нуклеазы Cpf1, молекулы ДНК или РНК, кодирующей нуклеазу Cpf1, молекулы направляющей РНК или ДНК, кодирующей направляющую РНК, а также вектора, кодирующего нуклеазу Cpf1 и/или направляющую РНК. При этом нуклеаза Cpf1 доставляется в клетку в виде гена в составе молекулы ДНК, например, вектора, а направляющая или направляющие РНК доставляются в форме РНК.It is possible to combine methods of delivering Cpf1 nuclease, a DNA or RNA molecule encoding Cpf1 nuclease, a guide RNA molecule or DNA encoding guide RNA, as well as a vector encoding Cpf1 nuclease and/or guide RNA to the target DNA. In this case, the Cpf1 nuclease is delivered into the cell in the form of a gene as part of a DNA molecule, for example, a vector, and the guide or guide RNAs are delivered in the form of RNA.

Возможен вариант осуществления, согласно которому нуклеаза Cpf1 доставляется в клетку в виде белка или РНК, кодирующей нуклеазу Cpf1, а направляющая или направляющие РНК доставляются в виде гена в составе молекулы ДНК, в том числе вектора.A possible embodiment is that the Cpf1 nuclease is delivered into the cell in the form of a protein or RNA encoding the Cpf1 nuclease, and the guide or guide RNAs are delivered as a gene within a DNA molecule, including a vector.

Возможен вариант осуществления, согласно которому нуклеаза Cpf1 доставляется в клетку в виде белка или РНК, кодирующей нуклеазу Cpf1, а направляющая или направляющие РНК доставляются в форме РНК.One possible embodiment is that the Cpf1 nuclease is delivered into the cell in the form of a protein or RNA encoding the Cpf1 nuclease, and the guide or guide RNAs are delivered in the form of RNA.

Возможен вариант осуществления, согласно которому нуклеаза Cpf1 доставляется в клетку в виде гена в составе молекулы ДНК, например, вектора, и направляющая или направляющие РНК доставляются в виде гена или генов в составе молекулы ДНК, в том числе, вектора.A possible embodiment is that the Cpf1 nuclease is delivered into the cell as a gene as part of a DNA molecule, for example, a vector, and the guide or guide RNAs are delivered as a gene or genes as part of a DNA molecule, including a vector.

Способ модификации целевого локуса нуклеиновой кислоты, включающий доставку к указанному локусу и использование для внесения изменений в ДНК белка Cpf1, молекулы ДНК, РНК или вектора и подходящей направляющей РНК или системы CRISPR/Cpf1.A method for modifying a target nucleic acid locus, including delivery to the specified locus and use of a Cpf1 protein, DNA molecule, RNA or vector and a suitable guide RNA or CRISPR/Cpf1 system to make changes in DNA.

Применение в области биотехнологии, молекулярной биологии и медицины белка, молекулы ДНК или вектора заявляемого изобретения для редактирования генома. Предпочтительно редактируют геном одноклеточного или многоклеточного организма. При этом организм представляет собой прокариотический или эукариотический организм, в частности, относится к простейшим, бактериям, растениям, грибам, животным, в частности, представляет собой млекопитающее, такое как человек.Application in the field of biotechnology, molecular biology and medicine of a protein, DNA molecule or vector of the claimed invention for genome editing. Preferably, the genome of a unicellular or multicellular organism is edited. In this case, the organism is a prokaryotic or eukaryotic organism, in particular, it refers to protozoa, bacteria, plants, fungi, animals, in particular, it is a mammal such as a human.

Возможен вариант осуществления, согласно которому применение осуществляют для коррекции генетического дефекта в виде геномных мутаций в организме, включающих в себя однонуклеотидные полиморфизмы и/или инсерции и/или делеции и/или транслокации и/или инверсии, в частности, в терапевтических целях, путем внесения однонитевых или двунитевых разрывов в молекулы ДНК в присутствии или без такового донорной последовательности, или в виде нарушений экспрессии генов, таких как снижение или повышение экспрессии генов, путем направленного изменения экспрессии, опосредованного использованием белка Cpf1, молекулы ДНК, РНК или вектора и подходящей направляющей РНК или системы CRISPR/Cpf1.An embodiment is possible, according to which the use is carried out for the correction of a genetic defect in the form of genomic mutations in the body, including single nucleotide polymorphisms and/or insertions and/or deletions and/or translocations and/or inversions, in particular for therapeutic purposes, by introducing single-strand or double-strand breaks in DNA molecules with or without a donor sequence, or in the form of disturbances in gene expression, such as decrease or increase in gene expression, by targeted changes in expression mediated by the use of the Cpf1 protein, DNA molecule, RNA or vector and suitable guide RNA or CRISPR/Cpf1 systems.

Белок, молекула ДНК или РНК или вектор заявляемого изобретения для применения для редактирования генома одноклеточного или многоклеточного организма. При этом организм представляет собой прокариотический или эукариотический организм, в частности, относится к простейшим, бактериям, растениям, грибам, животным, в частности, представляет собой млекопитающее, такое как человек. Предпочтительно применение осуществляют для коррекции генетического дефекта в виде геномных мутаций в организме, включающих в себя однонуклеотидные полиморфизмы и/или инсерции и/или делеции и/или транслокации и/или инверсии, в частности, в терапевтических целях, путем внесения однонитевых или двунитевых разрывов в молекулы ДНК в присутствии или без такового донорной последовательности, или в виде нарушений экспрессии генов, таких как снижение или повышение экспрессии генов, путем направленного изменения экспрессии, опосредованного использованием белка Cpf1, молекулы ДНК, РНК или вектора заявляемого изобретения и подходящей направляющей РНК или системы CRISPR/Cpf1.A protein, DNA or RNA molecule or vector of the claimed invention for use in editing the genome of a unicellular or multicellular organism. In this case, the organism is a prokaryotic or eukaryotic organism, in particular, it refers to protozoa, bacteria, plants, fungi, animals, in particular, it is a mammal such as a human. Preferably, the application is carried out for the correction of a genetic defect in the form of genomic mutations in the body, including single-nucleotide polymorphisms and/or insertions and/or deletions and/or translocations and/or inversions, in particular for therapeutic purposes, by introducing single-strand or double-strand breaks into DNA molecules in the presence or absence of a donor sequence, or in the form of disturbances in gene expression, such as a decrease or increase in gene expression, by targeted changes in expression mediated by the use of a Cpf1 protein, a DNA molecule, an RNA molecule or a vector of the claimed invention and a suitable guide RNA or CRISPR system /Cpf1.

Способ редактирования генома одноклеточного или многоклеточного организма, включающий внесение в, по меньшей мере, одну клетку указанного организма белка, молекулы ДНК, вектора или системы CRISPR/Cpf1 заявляемого изобретения для внесения разрыва в геномную ДНК указанного организма.A method for editing the genome of a unicellular or multicellular organism, including introducing into at least one cell of the said organism a protein, DNA molecule, vector or CRISPR/Cpf1 system of the claimed invention to introduce a break in the genomic DNA of the said organism.

Возможен вариант осуществления, дополнительно включающий встраивание в геном экзогенной последовательности ДНК за счет гомологичной репарации, путем использования донора гомологии в виде молекулы ДНК.A possible embodiment further includes inserting an exogenous DNA sequence into the genome through homologous repair, by using a homology donor in the form of a DNA molecule.

Возможен вариант осуществления, согласно которому экзогенная последовательность ДНК представляет собой один или более участков двунитевой или однонитевой ДНК из генома организма, отличного от организма, геном которого редактируют, или из генома организма, геном которого редактируют, измененный по одному или большему числу положений нуклеотидов, или искусственно синтезированный участок или участки ДНК.It is possible that the exogenous DNA sequence is one or more double-stranded or single-stranded DNA sequences from the genome of an organism other than the organism whose genome is being edited, or from the genome of the organism whose genome is being edited that has been altered at one or more nucleotide positions, or an artificially synthesized section or sections of DNA.

Возможен вариант осуществления, согласно которому организм представляет собой прокариотический или эукариотический организм, в частности, относится к простейшим, бактериям, растениям, грибам, животным, в частности, представляет собой млекопитающее, такое как человек.A possible embodiment is where the organism is a prokaryotic or eukaryotic organism, in particular protozoa, bacteria, plants, fungi, animals, in particular a mammal such as a human.

Возможен вариант осуществления, согласно которому редактирование осуществляют в терапевтических целях. Например, с целью изменения уровня экспрессии генов, в том числе полного выключения экспрессии путем внесения мутаций в кодирующую или регуляторную области этих генов.A possible embodiment is where editing is carried out for therapeutic purposes. For example, in order to change the level of gene expression, including completely turning off expression by introducing mutations into the coding or regulatory regions of these genes.

Белок, молекула ДНК, РНК или вектор или система CRISPR/Cpf1 согласно заявляемого изобретения для применения в терапии.A protein, DNA molecule, RNA or vector or CRISPR/Cpf1 system according to the claimed invention for use in therapy.

Комбинация способов доставки белка для образования разрывов в молекуле нуклеиновой кислоты, содержащая белок или молекулу ДНК или РНК, кодирующих нуклеазу, согласно заявляемого изобретения.A combination of protein delivery methods for the formation of breaks in a nucleic acid molecule containing a protein or a DNA or RNA molecule encoding a nuclease, according to the claimed invention.

Белок, молекула ДНК или РНК или система CRISPR/Cpf1, заявляемого изобретения для применения в целях детекции нуклеиновой кислоты.A protein, DNA or RNA molecule or CRISPR/Cpf1 system of the claimed invention for use in nucleic acid detection.

Возможен вариант осуществления, согласно которому система CRISPR/Cpf1 вносит разрыв в молекулу целевой нуклеиновой кислоты в присутствии молекулы ДНК или РНК, меченной детектируемой меткой или метками. Например, флуоресцентными (Broughton J.P., Deng X., Yu G., Fasching C.L., Servellita V., Singh J., Miao X., Streithorst J.A., Granados A., Sotomayor-Gonzalez A., Zorn K., Gopez A., Hsu E., Gu W., Miller S., Pan C.Y., Guevara H., Wadford D.A., Chen J.S., Chiu C.Y. CRISPR-Cas12-based detection of SARS-CoV-2 // Nat.Biotechnol. - 2020. - V. 38. - № 7. - P. 870-874), такими как FAM, HEX, ROX, VIC, Cy5, Cy3 и другими, люменесцентными (Li, Cheng-Yu, Bei Zheng, Jiang-Tao Li, Jia-ling Gao, Yu-Heng Liu, Dai-Wen Pang, and Hong-Wu Tang. "Holographic optical tweezers and boosting upconversion luminescent resonance energy transfer combined clustered regularly interspaced short palindromic repeats (CRISPR)/Cas12a biosensors." ACS nano 15, no. 5 (2021): 8142-8154), например, апконверсионными наночастицами, колориметрическими, такими как наночастицы золота, (Jiang Y., Hu M., Liu A.A., Lin Y., Liu L., Yu B., Zhou X., Pang D.W. Detection of SARS-CoV-2 by CRISPR/Cas12a-Enhanced Colorimetry // ACS Sensors. - 2021. - V. 6. - № 3. - P. 1086-1093) молекулами в качестве детектируемых меток.One possible embodiment is where the CRISPR/Cpf1 system introduces a break in the target nucleic acid molecule in the presence of a DNA or RNA molecule labeled with a detectable label or labels. For example, fluorescent (Broughton J.P., Deng X., Yu G., Fasching C.L., Servellita V., Singh J., Miao X., Streithorst J.A., Granados A., Sotomayor-Gonzalez A., Zorn K., Gopez A. , Hsu E., Gu W., Miller S., Pan C.Y., Guevara H., Wadford D.A., Chen J.S., Chiu C.Y. CRISPR-Cas12-based detection of SARS-CoV-2 // Nat.Biotechnol. - 2020. - V. 38. - No. 7. - P. 870-874), such as FAM, HEX, ROX, VIC, Cy5, Cy3 and others, luminescent (Li, Cheng-Yu, Bei Zheng, Jiang-Tao Li, Jia- Ling Gao, Yu-Heng Liu, Dai-Wen Pang, and Hong-Wu Tang. "Holographic optical tweezers and boosting upconversion luminescent resonance energy transfer combined clustered regularly interspaced short palindromic repeats (CRISPR)/Cas12a biosensors." ACS nano 15, no 5 (2021): 8142-8154), for example, upconversion nanoparticles, colorimetric, such as gold nanoparticles (Jiang Y., Hu M., Liu A.A., Lin Y., Liu L., Yu B., Zhou X. , Pang D.W. Detection of SARS-CoV-2 by CRISPR/Cas12a-Enhanced Colorimetry // ACS Sensors. - 2021. - V. 6. - No. 3. - P. 1086-1093) molecules as detectable labels.

Краткое описание чертежейBrief description of drawings

Изобретение поясняется следующими чертежами.The invention is illustrated by the following drawings.

На фиг. 1 представлена электрофореграмма in vitro разрезания для определения времени разрезания ДНК-матриц нуклеазой RbCpf1 по сравнению с AsCpf1. Эффективность разрезания ДНК-мишени в зависимости от времени инкубации с помощью RbCpf1 и AsCpf1. В реакции добавляли эквимолярные количества рекомбинантных AsCpf1 или RbCpf1. Соотношение ДНК-матрица:Cpf1:РНК 1:3:30. Концентрация crРНК 0.5 мМ. Показаны средние эффективности разрезания и стандартные отклонения, рассчитанные по трем независимым экспериментам. Н. - негидролизованные фрагменты ДНК-матрицы, П. - гидролизованные фргаменты ДНК-матрицы, напр.РНК -направляющая РНК. Дорожки с реакциями без напр.РНК обозначены минусом «-».In fig. Figure 1 shows an in vitro cutting electropherogram to determine the time of cutting of DNA templates by the RbCpf1 nuclease compared to AsCpf1. Target DNA cutting efficiency as a function of incubation time by RbCpf1 and AsCpf1. Equimolar amounts of recombinant AsCpf1 or RbCpf1 were added to the reaction. The DNA-template:Cpf1:RNA ratio is 1:3:30. The crRNA concentration is 0.5 mM. Shown are the average cutting efficiencies and standard deviations calculated from three independent experiments. N. - non-hydrolyzed fragments of the DNA matrix, P. - hydrolyzed fragments of the DNA matrix, for example, RNA - guide RNA. Lanes with reactions without eg RNA are marked with a minus “-”.

На фиг. 2 представлена электрофореграмма in vitro разрезания нуклеазой RbCpf1 для определения активности RbCpf1 в различных буферах. Эффективности разрезания RbCpf1 в различных буферах. Реакции проводили в присутствии RbCpf1 и 0.5 мМ направляющей РНК. Соотношение ДНК-матрицы: RbCpf1: РНК 1:3:30. Исследовали активности в NEBuffer 1.1 (1.1), NEBuffer 2.1 (2.1), NEBuffer 3.1 (3.1), NEBuffer 4 (4), CutSmart (CS) (New England Biolabs) и буфера для разрезания (CB) с добавлением или без добавления 5 мМ дитиотрейтола (ДТТ). Снизу показаны средние значения эффективности разрезания по результатам трех независимых экспериментов. Непор. - непорезанные фрагменты ДНК, порез. - порезанные фрагменты ДНК, напр.РНК -направляющая РНК.In fig. Figure 2 shows an electropherogram of in vitro cutting with RbCpf1 nuclease to determine the activity of RbCpf1 in various buffers. Cutting efficiencies of RbCpf1 in different buffers. Reactions were carried out in the presence of RbCpf1 and 0.5 mM guide RNA. Template DNA ratio: RbCpf1:RNA 1:3:30. Activities were assayed in NEBuffer 1.1 (1.1), NEBuffer 2.1 (2.1), NEBuffer 3.1 (3.1), NEBuffer 4 (4), CutSmart (CS) (New England Biolabs), and cutting buffer (CB) with or without 5 mM. dithiothreitol (DTT). Shown below are the average cutting efficiencies from three independent experiments. Nepor. - uncut DNA fragments, cut. - cut DNA fragments, for example RNA - guide RNA.

На фиг. 3 представлена электрофореграмма in vitro разрезания нуклеазой RbCpf1 для определения температурного оптимума работы нуклеазы. Влияние температуры на эффективность разрезания in vitro RbCpf1. Разрезание ДНК-мишени с помощью RbCpf1, в присутствии 0.5 мМ направляющей РНК при соотношении ДНК-матрицы:RbCpf1:РНК 1:3:30. Показаны средние эффективности разрезания и стандартные отклонения, рассчитанные по трем независимым экспериментам. Непор. - непорезанные фрагменты ДНК, порез. - порезанные фрагменты ДНК, напр.РНК -направляющая РНК.In fig. Figure 3 shows an in vitro electropherogram of cutting with RbCpf1 nuclease to determine the temperature optimum for nuclease operation. Effect of temperature on in vitro cutting efficiency of RbCpf1. Cutting target DNA with RbCpf1 in the presence of 0.5 mM guide RNA at a template DNA:RbCpf1:RNA ratio of 1:3:30. Shown are the average cutting efficiencies and standard deviations calculated from three independent experiments. Nepor. - uncut DNA fragments, cut. - cut DNA fragments, for example RNA - guide RNA.

На фиг. 4 представлены результаты определения PAM последовательности нуклеазы RbCpf1. График полученной при анализе данных высокопроизводительного секвенирования (NGS) консенсусной PAM-последовательности RbCpf1 - 5′-YYN-3′. Нумерация нуклеотидов по оси абсцисс соответствует 5′-3′ направлению, начиная с первого вырожденного нуклеотида по нетаргетной цепи PAM-библиотеки (он же нуклеотид -8). Напр.РНК - направляющая РНК. Как видно из графика, для RbCpf1 последовательность PAM была определена как трехнуклеотидный мотив 5′-YYN-3′, где Y-пиримидиновый нуклеотид (либо С, либо Т), а N - любой нуклеотид.In fig. Figure 4 shows the results of determining the PAM sequence of the RbCpf1 nuclease. Graph of the consensus PAM sequence of RbCpf1, 5′-YYN-3′, obtained from analysis of high-throughput sequencing (NGS) data. The numbering of nucleotides along the abscissa corresponds to the 5′-3′ direction, starting from the first degenerate nucleotide along the non-target strand of the PAM library (aka nucleotide -8). For example, RNA is guide RNA. As can be seen from the graph, for RbCpf1 the PAM sequence was defined as a three-nucleotide motif 5′-YYN-3′, where Y is a pyrimidine nucleotide (either C or T), and N is any nucleotide.

На фиг. 5 представлена электрофореграмма in vitro разрезания для подтверждения PAM-специфичности нуклеазы RbCpf1. Изучение PAM-специфичности нуклеазы RbCpf1 в условиях in vitro. На верхней части (А) показана электрофореграмма разрезаний ДНК-матрицы с одним и тем же протоспейсером, но разными нуклеотидами в последней 3′-концевой позиции PAM (позиция -1). В качестве контроля использовалась матрица с PAM 5′-TTG без добавления направляющей РНК (-напр.РНК). На нижней части (Б) показана электрофореграмма разрезаний pUC119 с использованием различных направляющих РНК на протоспейсеры с различными поcледовательностями PAM вида 5′-YYN-3′, на последней дорожке контрольная матрица без добавления направляющей РНК. Под каждой дорожкой на обоих частях рисунка столбики, иллюстрирующие средние значения относительных эффективностей разрезания в % по трем повторам ± стандартное отклонение. Н. - непорезанные фрагменты ДНК, П. - порезанные фрагменты ДНК, напр.РНК -направляющая РНК.In fig. Figure 5 shows an in vitro cutting electropherogram to confirm the PAM specificity of the RbCpf1 nuclease. Study of PAM specificity of RbCpf1 nuclease in vitro . The top panel (A) shows an electropherogram of DNA template cuts with the same protospacer but different nucleotides at the last 3′-terminal position of the PAM (position -1). A template with PAM 5′-TTG without the addition of guide RNA (-egRNA) was used as a control. The lower part (B) shows an electropherogram of pUC119 cuts using different guide RNAs to protospacers with different PAM sequences of the form 5′-YYN-3′; the last lane contains a control template without adding guide RNA. Below each lane in both parts of the figure are bars illustrating the average relative cutting efficiencies in % for three replicates ± standard deviation. N. - uncut DNA fragments, P. - cut DNA fragments, for example RNA - guide RNA.

На фиг. 6 представлены результаты испытания нуклеазы RbCpf1 в клетках человека с формированием делеции в гене DNMT1. Редактирование гена DNMT1 с помощью двух направляющих РНК (crРНК1 и crРНК2) и RbCpf1. Сверху: электрофореграмма ампликонов фрагмента гена DNMT1 после трансфекции культуры клеток HEK293T тремя плазмидными векторами, кодирующими соответственно: crРНК1, crРНК2 и RbCpf1. Три независимых эксперимента пронумерованы 1-3 на второй и четвертый день после трансфекции. Показана схема ПЦР-продукта, содержащего два протоспейсера (№1 и №2), узнаваемых соответственно направляющими РНК crРНК1 и crРНК2. Снизу: детальная карта делеции с нуклеотидной последовательностью, выявленной с помощью секвенирования по Сэнгеру. Сайты посадки crРНК выделены черным цветом, PAM-последовательности выделены красным. Красно-белыми стрелками показаны выравненные хроматограммы после секвенирования по Сэнгеру; красные части стрелок - выравнивающиеся последовательности, белые - отсутствующие в хроматограммах. Продемонстрирована активность RbCpf1 в клетках человека с формированием делеции в гене DNMT1.In fig. Figure 6 shows the results of testing the RbCpf1 nuclease in human cells with the formation of a deletion in the DNMT1 gene. Editing of the DNMT1 gene by two guide RNAs (crRNA1 and crRNA2) and RbCpf1. Top: electropherogram of amplicons of the DNMT1 gene fragment after transfection of a HEK293T cell culture with three plasmid vectors encoding, respectively: crRNA1, crRNA2 and RbCpf1. Three independent experiments are numbered 1–3 on the second and fourth days after transfection. Shown is a diagram of a PCR product containing two protospacers (No. 1 and No. 2), recognized respectively by the guide RNAs crRNA1 and crRNA2. Bottom: Detailed map of the deletion with the nucleotide sequence identified by Sanger sequencing. CraRNA landing sites are highlighted in black, PAM sequences are highlighted in red. Red and white arrows show aligned chromatograms after Sanger sequencing; red parts of the arrows are aligned sequences, white parts are missing in the chromatograms. RbCpf1 activity has been demonstrated in human cells with the formation of a deletion in the DNMT1 gene.

На фиг. 7 представлено выравнивание аминокислотных последовательностей нуклеаз CeCpf1 (CeCas12a), LbCpf1 (LbCas12a), RbCpf1 (RbCas12a).In fig. Figure 7 shows the alignment of the amino acid sequences of the nucleases CeCpf1 (CeCas12a), LbCpf1 (LbCas12a), RbCpf1 (RbCas12a).

На фиг. 8-12 представлена очистка RbCpf1 хроматографическим методом. На фиг. 8 представлена электрофореграмма в денатурирующем полиакриламидном геле фракций, полученных после металло-аффинной хроматографии. Дорожки слева направо: 1 - клеточный лизат, 2 - осадок, 3 - проскок через колонку, 4 - фракция W с колонки, 5 - фракция Е с колонки, 6 - маркер молекулярных масс PageRuler Plus (ThermoFisher Scientific). На фиг. 9 представлено распределение целевого белка RbCpf1 в промывочной W и элюирующей E фракциях. Левый пик - проскок. По оси абсцисс показано время в минутах, по оси ординат - оптическая плотность в mAU. На фиг. 10 представлено распределение элюата с целевым белком RbCpf1. По оси абсцисс указан объем в мл, по оси ординат - оптическая плотность в mAU. На фиг. 11 представлена электрофореграмма в денатурирующем полиакриламидном геле фракций, полученных после катионно-обменной хроматографии. Дорожки слева направо: 1 - нанесение на колонку, 2-9 - фракции, 10 - маркер молекулярных масс PageRuler Plus (ThermoFisher Scientific). На фиг. 12 представлено распределение целевого белка RbCpf1 в ходе гель-фильтрации. По оси абсцисс указан объем в мл, по оси ординат - оптическая плотность в mAU.In fig. 8-12 shows the purification of RbCpf1 by chromatographic method. In fig. Figure 8 shows an electropherogram in a denaturing polyacrylamide gel of the fractions obtained after metal affinity chromatography. Lanes from left to right: 1 - cell lysate, 2 - sediment, 3 - column breakthrough, 4 - fraction W from the column, 5 - fraction E from the column, 6 - molecular weight marker PageRuler Plus (ThermoFisher Scientific). In fig. Figure 9 shows the distribution of the target protein RbCpf1 in the washing W and eluting E fractions. The left peak is a breakthrough. The abscissa axis shows time in minutes, the ordinate axis shows optical density in mAU. In fig. Figure 10 shows the distribution of the eluate with the target protein RbCpf1. The abscissa axis indicates the volume in ml, the ordinate axis indicates the optical density in mAU. In fig. Figure 11 shows an electropherogram in a denaturing polyacrylamide gel of fractions obtained after cation exchange chromatography. Lanes from left to right: 1 - application to the column, 2-9 - fractions, 10 - PageRuler Plus molecular weight marker (ThermoFisher Scientific). In fig. 12 shows the distribution of the target protein RbCpf1 during gel filtration. The abscissa axis indicates the volume in ml, the ordinate axis indicates the optical density in mAU.

На фиг. 13 представлена электрофореграмма in vitro разрезания ДНК-матрицы нуклеазами RbCpf1, RbCpf1_mut, RbCpf1_mut2. Дорожки слева направо: негативный контроль (без нуклеазы), разрезание с RbCpf1, разрезание с RbCpf1_mut, разрезание с RbCpf1_mut2, маркер молекулярных масс ThermoFisher UltraLow Range. Нижние полосы - направляющая РНК.In fig. Figure 13 shows an electropherogram of in vitro cutting of the DNA template with the nucleases RbCpf1, RbCpf1_mut, RbCpf1_mut2. Lanes from left to right: negative control (no nuclease), RbCpf1 cut, RbCpf1_mut cut, RbCpf1_mut2 cut, ThermoFisher UltraLow Range molecular weight marker. Bottom bands are guide RNA.

На фиг. 14 выравнивание аминокислотных последовательностей RbCpf1 и RbCpf1_mut. Гомология двух последовательностей 97%.In fig. 14 alignment of the amino acid sequences of RbCpf1 and RbCpf1_mut. The homology of the two sequences is 97%.

На фиг. 15 выравнивание аминокислотных последовательностей RbCpf1 и RbCpf1_mut2. Гомология двух последовательностей 97%.In fig. 15 alignment of the amino acid sequences of RbCpf1 and RbCpf1_mut2. The homology of the two sequences is 97%.

На фиг. 16 представлена карта примера плазмидного экспрессионного вектора для экспрессии в клетках Escherichia coli нуклеазы RbCpf1 с целью дальнейшего выделения и очистки белка.In fig. 16 shows a map of an example of a plasmid expression vector for expressing the RbCpf1 nuclease in Escherichia coli cells for the purpose of further isolation and purification of the protein.

На фиг. 17 представлена карта примера плазмидного вектора для экспрессии RbCpf1 в клетках человека.In fig. 17 is a map of an example plasmid vector for the expression of RbCpf1 in human cells.

Осуществление изобретенияCarrying out the invention

Ниже представлено более подробное описание заявляемого изобретения. Настоящее изобретение может подвергаться различным изменениям и модификациям, понятным специалисту на основе прочтения данного описания. Такие изменения не ограничивают объем притязаний. Например, могут быть изменены неконсервативные аминокислотные остатки, изменения в которых не оказывают влияния на функцию белка.Below is a more detailed description of the claimed invention. The present invention is subject to various changes and modifications that will become apparent to those skilled in the art based on reading this specification. Such changes do not limit the scope of the claims. For example, non-conservative amino acid residues may be changed, changes in which do not affect the function of the protein.

Как указано выше, задача настоящего изобретения решена при помощи белка, обладающего активностью нуклеазы, содержащего аминокислотную последовательность SEQ ID NO: 1, или содержащего аминокислотную последовательность, которая по меньшей мере на 80% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в аминокислотных остатках, изменения в которых не приводят к изменению или уничтожению функции белка. Неконсервативные аминокислотные остатки RbCpf1 представлены на фиг. 7. Изменения могут быть представлены, например, заменами неконсервативных аминокислотных остатков на гомологичные. Замены аминокислотных остатков на гомологичные можно провести методами, известными специалистам в области генной инженерии, например с помощью сайт-направленного мутагенеза методом ПЦР последовательностей ДНК (Reikofski, Julia, and Bernard Y. Tao. "Polymerase chain reaction (PCR) techniques for site-directed mutagenesis." Biotechnology advances 10, no. 4 (1992): 535-547), кодирующих белок нуклеазу RbCpf1. Этот белок может образовывать разрыв в молекуле ДНК в точке, непосредственно примыкающей к последовательности 5'-YYN-3', или последовательности, содержащей 5'-YYN-3' в указанной молекуле ДНК. В некоторых вариантах осуществления образование двунитевого разрыва in vitro в молекуле ДНК происходит за 1 секунду. В предпочтительных вариантах изобретения белок применяется в качестве средства для образования двунитевого разрыва in vitro на протяжении 20 минут.As stated above, the object of the present invention is achieved by using a protein having nuclease activity containing the amino acid sequence of SEQ ID NO: 1, or containing an amino acid sequence that is at least 80% identical to the amino acid sequence of SEQ ID NO: 1 and differs from with SEQ ID NO: 1 only in amino acid residues, changes in which do not lead to a change or destruction of protein function. Non-conserved amino acid residues of RbCpf1 are shown in Fig. 7. Changes can be represented, for example, by replacement of non-conservative amino acid residues with homologous ones. Replacement of amino acid residues with homologous ones can be carried out using methods known to specialists in the field of genetic engineering, for example, using site-directed mutagenesis using PCR of DNA sequences (Reikofski, Julia, and Bernard Y. Tao. "Polymerase chain reaction (PCR) techniques for site-directed mutagenesis." Biotechnology advances 10, no. 4 (1992): 535-547), encoding the protein nuclease RbCpf1. This protein can form a break in the DNA molecule at a point immediately adjacent to the sequence 5'-YYN-3', or a sequence containing 5'-YYN-3' in the specified DNA molecule. In some embodiments, in vitro double-strand break formation in a DNA molecule occurs within 1 second. In preferred embodiments, the protein is used as a double-strand break agent in vitro for 20 minutes.

Дополнительно предложен способ образования двунитевого разрыва в последовательности геномной ДНК одноклеточного или многоклеточного организма, примыкающей к последовательности 5'-YYN-3', включающего введение в по меньшей мере одну клетку этого организма эффективного количества: а) белка, содержащего аминокислотную последовательность SEQ ID NO: 1, или нуклеиновой кислоты, кодирующей белок, содержащий аминокислотную последовательность SEQ ID NO: 2, и б) направляющей РНК, содержащей последовательность, образующую дуплекс с нуклеотидной последовательностью участка геномной ДНК организма, примыкающей к нуклеотидной последовательности 5'-YYN-3' или содержащей последовательность 5'-YYN-3', и взаимодействующей с указанным белком при образовании дуплекса, или последовательности ДНК, кодирующей указанную направляющую РНК; при этом взаимодействие указанного белка с направляющей РНК и нуклеотидной последовательностью, содержащей 5'-YYN-3', приводит к образованию двунитевого разрыва в последовательности геномной ДНК. В некоторых вариантах изобретения данный способ характеризуется тем, что дополнительно включает введение экзогенной последовательности ДНК одновременно с направляющей РНК.Additionally, a method is proposed for the formation of a double-strand break in the genomic DNA sequence of a unicellular or multicellular organism adjacent to the sequence 5'-YYN-3', comprising introducing into at least one cell of this organism an effective amount of: a) a protein containing the amino acid sequence SEQ ID NO: 1, or a nucleic acid encoding a protein containing the amino acid sequence of SEQ ID NO: 2, and b) a guide RNA containing a sequence that forms a duplex with the nucleotide sequence of a region of the genomic DNA of the organism adjacent to the nucleotide sequence 5'-YYN-3' or containing the sequence 5'-YYN-3', and interacting with the specified protein to form a duplex, or a DNA sequence encoding the specified guide RNA; in this case, the interaction of the specified protein with the guide RNA and the nucleotide sequence containing 5'-YYN-3' leads to the formation of a double-strand break in the genomic DNA sequence. In some embodiments, the method is further characterized by introducing an exogenous DNA sequence simultaneously with the guide RNA.

Изобретение может быть использовано как для разрезания целевой ДНК in vitro, так и для модификации генома живого организма. Модификация генома может проводиться путем разрезания генома в соответствующем сайте и вставки экзогенной последовательности ДНК за счет гомологичной репарации.The invention can be used both for cutting target DNA in vitro and for modifying the genome of a living organism. Genome modification can be carried out by cutting the genome at the appropriate site and inserting an exogenous DNA sequence through homologous repair.

Введение в клетки нуклеиновых кислот, кодирующих RbCpf1 и/или направляющие РНК и/или сами направляющие РНК, может быть осуществлено путем трансфекции или трансформации клеток различными методами, известными специалистам (липофекция, электропорация, вирусная трансдукция, микроинъекция и т.д.).Introduction into cells of nucleic acids encoding RbCpf1 and/or guide RNAs and/or guide RNAs themselves can be accomplished by transfection or transformation of cells by various methods known to those skilled in the art (lipofection, electroporation, viral transduction, microinjection, etc.).

Введение в клетки белка RbCpf1 может быть осуществлено путем трансфекции или трансформации клеток различными методами, известными специалистам (липофекция, электропорация, микроинъекция и т.д.).Introduction of the RbCpf1 protein into cells can be carried out by transfection or transformation of cells by various methods known to specialists (lipofection, electroporation, microinjection, etc.).

Введение в клетки комплексов RbCpf1 с направляющими РНК может быть осуществлено путем трансфекции или трансформации клеток различными методами, известными специалистам (липофекция, электропорация, микроинъекция и т.д.).The introduction of RbCpf1 complexes with guide RNAs into cells can be carried out by transfection or transformation of cells using various methods known to specialists (lipofection, electroporation, microinjection, etc.).

В качестве экзогенной последовательности ДНК может быть использован любой участок двунитевой или однонитевой ДНК из генома организма, отличного от организма, используемого при введении (или смесь таких участков между собой и с другими фрагментами нуклеиновых кислот), при этом этот участок (или смесь участков) предназначен для интеграции в место разрыва в целевой ДНК, образованного под действием нуклеазы RbCpf1. В некоторых вариантах изобретения в качестве экзогенной последовательности ДНК может быть использован участок двуцепочечной или одноцепочечной ДНК из генома организма, используемого при введении белка RbCpf1, но при этом измененный мутациями (заменой нуклеотидов), а также вставками, делециями, транслокациями, инверсиями одного или нескольких нуклеотидов.Any region of double-stranded or single-stranded DNA from the genome of an organism other than the organism used during administration (or a mixture of such regions with each other and with other fragments of nucleic acids) can be used as an exogenous DNA sequence, and this region (or mixture of regions) is intended for integration into the site of a break in the target DNA formed under the action of the RbCpf1 nuclease. In some embodiments of the invention, a section of double-stranded or single-stranded DNA from the genome of the organism used when introducing the RbCpf1 protein, but modified by mutations (nucleotide substitutions), as well as insertions, deletions, translocations, inversions of one or more nucleotides, can be used as an exogenous DNA sequence .

ПримерыExamples

1. Нуклеаза RbCpf1 была выделена из бактерии Ruminococcus bromii из микробиома образцов кала человека. Для обнаружения нуклеазы проводили поиск белка (гипотетического или с неизвестной функцией). Для ДНК бактериальных геномов из нашей локальной базы данных был идентифицирован участок CRISPR-Cas, определенный как нуклеотидный локус, который содержал 25 т.п.н. последовательности геномной ДНК, фланкирующей массив CRISPR и гены белков cas. Открытые рамки считывания (ORF) в геномной ДНК были идентифицированы с помощью программы Prodigal (алгоритм поиска генов PROkaryotic DYnamic programming) (10.1186 / 1471-2105-11-119). Каждую ORF аннотировали с помощью поиска BLAST в базе данных non-redundant (nr) белков NCBI. Для обеспечения максимальной чувствительности обнаружения поиск проводился по модифицированным профилям последовательностей Cas1, Cas2, Cas4 и белку-эффектору в транслируемых геномных и метагеномных последовательностях (10.1038 / s41579-019-0299-x). Чтобы гарантировать, что массив CRISPR был обнаружен с высоким уровнем чувствительности, данные предсказаний, сделанные с использованием методов Piler-CR (10.1186 / 1471-2105-8-18) и CRISPRfinder (10.1093 / nar / gkm360), были объединены и использованы в качестве окончательного набора CRISPR. Участок CRISPR-Cas был извлечен, чтобы идентифицировать предсказанные гены, кодирующие белок, в непосредственной близости. Для гипотетических и ранее не идентифицированных последовательностей для предсказания доменной структуры использовали HHpred (10.1093 / nar / gki408). Алгоритм PSI-BLAST был использован для поиска отдаленных гомологов каждого обнаруженного белка (10.1093 / nar / 25.17.3389). Обнаруженные последовательности были отсортированы по следующим критериям: процент сходства с известными белками, размер (700-1400 аминокислот) и оптимальная температура для бактерий-хозяев. Этот алгоритм поиска помог нам сузить область поиска до последовательности из Ruminococcus sp. Сравнительный анализ последовательности и архитектуры белка показал, что нуклеаза из Ruminococcus bromii наиболее близка к семейству ферментов CRISPR-Cas V-A подтипа, которые содержат единственный нуклеазный домен RuvC, который отвечает за РНК-управляемое расщепление ДНК. Установлено, что размер гена нуклеазы RbCpf1 составляет 3736 пар нуклеотидов (b.p.).1. The RbCpf1 nuclease was isolated from the bacterium Ruminococcus bromii from the microbiome of human stool samples. To detect nuclease, a protein search (hypothetical or with unknown function) was carried out. For the DNA of bacterial genomes, a CRISPR-Cas region was identified from our local database, defined as a nucleotide locus that contained 25 kb. sequences of genomic DNA flanking the CRISPR array and cas protein genes. Open reading frames (ORFs) in genomic DNA were identified using the Prodigal program (PROkaryotic DYnamic programming gene search algorithm) (10.1186 / 1471-2105-11-119). Each ORF was annotated using a BLAST search against the NCBI non-redundant (nr) protein database. To ensure maximum detection sensitivity, searches were performed against modified Cas1, Cas2, Cas4 and effector protein sequence profiles in translated genomic and metagenomic sequences (10.1038/s41579-019-0299-x). To ensure that the CRISPR array was detected with a high level of sensitivity, prediction data made using the Piler-CR (10.1186/1471-2105-8-18) and CRISPRfinder (10.1093/nar/gkm360) methods were combined and used as final CRISPR kit. The CRISPR-Cas region was extracted to identify predicted protein-coding genes in the immediate vicinity. For hypothetical and previously unidentified sequences, HHpred (10.1093/nar/gki408) was used to predict domain structure. The PSI-BLAST algorithm was used to search for distant homologues of each detected protein (10.1093/nar/25.17.3389). The detected sequences were sorted according to the following criteria: percentage of similarity to known proteins, size (700-1400 amino acids) and optimal temperature for host bacteria. This search algorithm helped us narrow the search to sequences from Ruminococcus sp. Comparative analysis of the protein sequence and architecture revealed that the nuclease from Ruminococcus bromii is most closely related to the family of CRISPR-Cas VA subtype enzymes, which contain a single nuclease domain, RuvC, which is responsible for RNA-guided DNA cleavage. The size of the RbCpf1 nuclease gene was found to be 3736 nucleotide pairs (bp).

Для получения последовательности гена белка-нуклеазы RbCpf1 использовали ПЦР (использовали 5’-фосфорилированные праймеры: прямой (5’-TGAACATATGATGCAAGAGCGTAAAAAAATATCGCATC-3’) и обратный (5’-ATCTACTCGAGATTATTCGCCATATCATTCTCCTGAACA-3’)). Полученные последовательности, содержащие ген белка RbCpf1, клонировали в линеаризованный вектор pUC118. Плазмидную ДНК трансформировали в штамм E. coli TOP10 и нарабатывали необходимое количество для секвенирования. Секвенирование проводили с помощью Illumina MiSeq. Ген RbCpf1 клонировали в вектор pET30a+ для трансформации экспрессионного штамма E. coli Rosetta2. Белок RbCpf1 выделяли и очищали из клеток E. coli Rosetta2 с использованием хроматографической системы GE AKTA Purifier 100 FPLC.To obtain the sequence of the RbCpf1 nuclease protein gene, PCR was used (5'-phosphorylated primers were used: forward (5'-TGAACATATGATGCAAGAGCGTAAAAAAATATCGCATC-3') and reverse (5'-ATCTACTCGAGATTATTCGCCATATCATTCTCCTGAACA-3')). The resulting sequences containing the RbCpf1 protein gene were cloned into the linearized vector pUC118. Plasmid DNA was transformed into E. coli strain TOP10 and the required amount was obtained for sequencing. Sequencing was performed using Illumina MiSeq. The RbCpf1 gene was cloned into the pET30a+ vector to transform the E. coli Rosetta2 expression strain. RbCpf1 protein was isolated and purified from E. coli Rosetta2 cells using a GE AKTA Purifier 100 FPLC chromatography system.

Для клеток человека впоследствии была проведена оптимизация кодонового состава гена RbCpf1, после чего химически синтезирован плазмидный вектор, кодирующий кодон-оптимизированный ген RbCpf1 (синтез выполнен компанией GenScript LCC).For human cells, the codon composition of the RbCpf1 gene was subsequently optimized, after which a plasmid vector encoding the codon-optimized RbCpf1 gene was chemically synthesized (synthesis performed by GenScript LCC).

Установлено, что нуклеаза RbCpf1 обладает сравнительно небольшим размером среди ортологов нуклеаз Cpf1, измеряемым в аминокислотных остатках (aa), что является несомненным преимуществом, так как размер является важной характеристикой для доставки нуклеаз внутрь клетки. Нуклеазы большего размера с доказанной эффективностью в клетках человека, в том числе RbCpf1:It has been established that the RbCpf1 nuclease has a relatively small size among the orthologues of Cpf1 nucleases, measured in amino acid residues (aa), which is an undoubted advantage, since size is an important characteristic for the delivery of nucleases into the cell. Larger nucleases with proven effectiveness in human cells, including RbCpf1:

MbCpf1 - 1373 aaMbCpf1 - 1373 aa

AsCpf1 - 1318 ааAsCpf1 - 1318 aa

HkCpf1 - 1310 aaHkCpf1 - 1310 aa

LpCpf1 - 1306 aaLpCpf1 - 1306 aa

TsCpf1 - 1306 aaTsCpf1 - 1306 aa

FnCpf1 - 1300 aaFnCpf1 - 1300 aa

CeCpf1 - 1286 aaCeCpf1 - 1286 aa

EeCpf1 - 1282 aaEeCpf1 - 1282 aa

ArCpf1 - 1263 aaArCpf1 - 1263 aa

ErCpf1 - 1263 aaErCpf1 - 1263 aa

Mb3Cpf1 - 1261 aaMb3Cpf1 - 1261 aa

Mb2Cpf1 - 1259 aaMb2Cpf1 - 1259 aa

RbCas12a - 1245 aaRbCas12a - 1245 aa

Определение времени разрезания ДНК-матриц по сравнению с AsCpf1. Инкубация RbCpf1, crРНК и ДНК-матрицы, несущей протоспейсер, фланкированный последовательностью PAM, приводила к эффективному расщеплению RbCpf1 мишени в диапазоне от 1 секунды до 20 минут. Установлено, что RbCpf1 способен расщеплять субстрат ДНК, полученный с помощью ПЦР, всего за одну секунду после добавления нуклеазы в смесь для расщепления. Половина ДНК-субстрата расщепляется за 15 секунд для RbCpf1 и за 30 секунд для AsCas12a. Практически весь субстрат ДНК расщепляется обеими нуклеазами за 20 мин (фиг. 1).Determination of cutting time of DNA templates compared to AsCpf1. Incubation of RbCpf1, crRNA, and template DNA carrying a protospacer flanked by a PAM sequence resulted in efficient RbCpf1 cleavage of the target in a range of 1 second to 20 minutes. RbCpf1 was found to be able to cleave DNA substrate obtained by PCR in just one second after adding nuclease to the cleavage mixture. Half of the DNA substrate is cleaved in 15 seconds for RbCpf1 and 30 seconds for AsCas12a. Almost the entire DNA substrate is cleaved by both nucleases within 20 minutes (Fig. 1).

In vitro разрезание проводили в объеме 30 мкл в буфере Cleavage Buffer, а также 1хNEB2 buffer (New England Biolabs Inc.). 10 нМ ДНК матрицы, 500 нМ нуклеазы, 5000 нМ crРНК инкубировали от 5 до 60 минут при температуре 37 градусов Цельсия. Реакцию останавливали добавлением Proteinase K (New England Biolabs Inc.) (1 единица активности) и инкубировали 15 минут при комнатной температуре. Анализировали результат разрезания с помощью электрофореза в 1% агарозном геле в 1хTAE буфере. Окрашенный EtBr гель помещали в Gel Doc EZ Imager (Bio-Rad) и оценивали с помощью программного обеспечения Image Lab Software 6.0.1 (Bio-Rad). Показано, что нуклеаза RbCpf1 проводит разрезание быстрее AsCpf1. In vitro cutting was carried out in a volume of 30 μl in Cleavage Buffer, as well as 1xNEB2 buffer (New England Biolabs Inc.). 10 nM template DNA, 500 nM nuclease, 5000 nM crRNA were incubated for 5 to 60 minutes at 37 degrees Celsius. The reaction was stopped by adding Proteinase K (New England Biolabs Inc.) (1 activity unit) and incubated for 15 minutes at room temperature. The cutting result was analyzed using electrophoresis in a 1% agarose gel in 1xTAE buffer. The EtBr-stained gel was loaded into a Gel Doc EZ Imager (Bio-Rad) and evaluated using Image Lab Software 6.0.1 (Bio-Rad). It has been shown that the RbCpf1 nuclease cuts faster than AsCpf1.

Матрица для in vitro разрезания представляла собой фрагменты ДНК, амплифицированные с помощью ПЦР в Q5® High-Fidelity 2X Master Mix (M0492L, NEB). В качестве матрицы использовали геномную ДНК, выделенную из линии клеток T-REx (линия клеток T-REx™ -293, Invitrogen, кат. № R71007) с помощью набора для очистки геномной ДНК GeneJET (K0722, Thermo Scientific™). Концентрацию ДНК измеряли флуорометром Qubit 3.0 с использованием набора Qubit DNA BR Assay Kit (Q32853, Thermo Scientific™).The in vitro cutting template consisted of DNA fragments amplified by PCR in Q5® High-Fidelity 2X Master Mix (M0492L, NEB). The template used was genomic DNA isolated from the T-REx cell line (T-REx™ -293 cell line, Invitrogen, cat. no. R71007) using the GeneJET genomic DNA purification kit (K0722, Thermo Scientific™). DNA concentration was measured with a Qubit 3.0 fluorometer using the Qubit DNA BR Assay Kit (Q32853, Thermo Scientific™).

2. Определение активности RbCpf1 в различных буферах при проведении реакций разрезания in vitro показало активность нуклеазы во всех тестированных буферах. Для этого смешивали рекомбинантный белок RbCpf1, соответствующую crРНК и линеаризованную ДНК-матрицу в виде PAM-библиотеки в соотношении 3:30:1 соответственно, с конечной концентрацией РНК 0.5 мМ, смесь далее инкубировали при 37 °C в течение 30 минут, после чего инактивировали нуклеазу добавлением 1 ед.акт. протеиназы К (New England Biolabs). В качестве буферов тестировали коммерчески-доступные буферы, упомянутые в работах по ортологичным ферментам: Nebbuffer1.1, Nebbuffer2.1, Nebbuffer3.1, Nebbuffer4, CutSmart, а также эти буферы с добавлением 5 мМ дитиотрейтола (ДТТ) и дополнительно буфер для разрезания (CB) (100 мМ HEPES pH 7.5; 500 мМ KCl; 25 мМ MgCl2; 5 мМ DTT). Эффективности разрезаний определяли с помощью программного обеспечения Bio-Rad ImageLab при подсчете интенсивностей полос на электрофореграммах (фиг. 2).2. Determination of RbCpf1 activity in various buffers during in vitro cutting reactions showed nuclease activity in all tested buffers. To do this, the recombinant RbCpf1 protein, the corresponding crRNA and the linearized DNA template in the form of a PAM library were mixed in a ratio of 3:30:1, respectively, with a final RNA concentration of 0.5 mM, the mixture was then incubated at 37 °C for 30 minutes, and then inactivated nuclease by adding 1 unit act. proteinase K (New England Biolabs). As buffers, we tested commercially available buffers mentioned in works on orthologous enzymes: Nebbuffer1.1, Nebbuffer2.1, Nebbuffer3.1, Nebbuffer4, CutSmart, as well as these buffers with the addition of 5 mM dithiothreitol (DTT) and additionally a cutting buffer ( CB) (100 mM HEPES pH 7.5; 500 mM KCl; 25 mM MgCl2; 5 mM DTT). Cutting efficiencies were determined using Bio-Rad ImageLab software by calculating band intensities on the electropherograms (Fig. 2).

Матрица для in vitro разрезания представляла собой фрагменты ДНК, амплифицированные с помощью ПЦР в Q5® High-Fidelity 2X Master Mix (M0492L, NEB). В качестве матрицы использовали геномную ДНК, выделенную из линии клеток T-REx (линия клеток T-REx™-293, Invitrogen, кат. № R71007) с помощью набора для очистки геномной ДНК GeneJET (K0722, Thermo Scientific™). Концентрацию ДНК измеряли флуорометром Qubit 3.0 с использованием набора Qubit DNA BR Assay Kit (Q32853, Thermo Scientific™).The in vitro cutting template consisted of DNA fragments amplified by PCR in Q5® High-Fidelity 2X Master Mix (M0492L, NEB). The template used was genomic DNA isolated from the T-REx cell line (T-REx™-293 cell line, Invitrogen, cat. no. R71007) using the GeneJET genomic DNA purification kit (K0722, Thermo Scientific™). DNA concentration was measured with a Qubit 3.0 fluorometer using the Qubit DNA BR Assay Kit (Q32853, Thermo Scientific™).

3. Нуклеаза RbCpf1 активна в диапазоне температур от 20 до 42 градусов Цельсия. В качестве стандартного буфера для разрезания in vitro брали Nebbuffer 2.1. Для определения температурного оптимума использовали точки в 15 °C, 20 °C, 25 °C, 30 °C, 37 °C, 42 °C, 48 °C. Соотношения ДНК-матрицы:РНК:RbCpf1 использовали 1:30:3. Фрагменты анализировали электрофоретически в 1х ТАЕ 1 % агарозном геле с добавлением этидия бромида (фиг. 3).3. RbCpf1 nuclease is active in the temperature range from 20 to 42 degrees Celsius. Nebbuffer 2.1 was used as a standard buffer for in vitro cutting. To determine the temperature optimum, points at 15 °C, 20 °C, 25 °C, 30 °C, 37 °C, 42 °C, 48 °C were used. Template DNA:RNA:RbCpf1 ratios were used at 1:30:3. The fragments were analyzed electrophoretically in a 1x TAE 1% agarose gel with the addition of ethidium bromide (Fig. 3).

Матрица для in vitro разрезания представляла собой фрагменты ДНК, амплифицированные с помощью ПЦР в Q5® High-Fidelity 2X Master Mix (M0492L, NEB). В качестве матрицы использовали геномную ДНК, выделенную из линии клеток T-REx (линия клеток T-REx™ -293, Invitrogen, кат. № R71007) с помощью набора для очистки геномной ДНК GeneJET (K0722, Thermo Scientific™). Концентрацию ДНК измеряли флуорометром Qubit 3.0 с использованием набора Qubit DNA BR Assay Kit (Q32853, Thermo Scientific™).The in vitro cutting template consisted of DNA fragments amplified by PCR in Q5® High-Fidelity 2X Master Mix (M0492L, NEB). The template used was genomic DNA isolated from the T-REx cell line (T-REx™ -293 cell line, Invitrogen, cat. no. R71007) using the GeneJET genomic DNA purification kit (K0722, Thermo Scientific™). DNA concentration was measured with a Qubit 3.0 fluorometer using the Qubit DNA BR Assay Kit (Q32853, Thermo Scientific™).

4. Определяли наиболее частый контекст РАМ, при опознавании которого происходило разрезание. Установлено, что оптимальным является PAM, содержащий 5’-YYN-3’, либо представленный только 5’-YYN-3. Для поиска РАМ проверяли способность RbCpf1 расщеплять линейные библиотеки PAM ДНК, содержащие сайт-мишень, фланкированный восемью рандомизированными нуклеотидами на 5’-конце. RbCas12a в комплексе с crРНК инкубировали с библиотекой PAM при 37 °С в течение 1 часа, расщепленные и нерасщепленные молекулы очищали после электрофореза в агарозном геле и секвенировали с использованием платформы Illumina. Биоинформатический анализ в программном обеспечении WebLogo3.7.4 позволил определить PAM. Результаты показали, что RbCpf1 предпочитает мишени, примыкающие к 5’-YYN-3’ PAM (см. фиг. 4).4. The most frequent RAM context was determined, upon recognition of which cutting occurred. It has been established that the optimal PAM is one containing 5'-YYN-3', or only 5'-YYN-3. To search for PAM, the ability of RbCpf1 to cleave linear PAM DNA libraries containing a target site flanked by eight random nucleotides at the 5′ end was tested. RbCas12a complexed with crRNA was incubated with the PAM library at 37°C for 1 hour, and cleaved and uncleaved molecules were purified after agarose gel electrophoresis and sequenced using the Illumina platform. Bioinformatics analysis in WebLogo3.7.4 software determined the PAM. The results showed that RbCpf1 prefers targets adjacent to the 5′-YYN-3′ PAM (see Fig. 4 ).

В качестве матриц в независимых реакциях ПЦР (ДНК-полимераза Q5, NEB) использовали два M13-фланкированных обратно-комплементарных олигонуклеотида размером 100 п.н. с вырожденными фрагментами длиной 8 п.о. (Синтол, Россия), примыкающими к протоспейсеру. Ампликоны анализировали с помощью электрофореза в агарозном геле с последующей экстракцией из геля (Qiagen Gel Extraction Kit). Проводили рестрикцию полученных фрагментов с помощью EaeI (NEB) и клонировали в вектор pBR322, линеаризованный с помощью EagI и PvuII (NEB), с последующей трансформацией в штамм E.coli Top10. Через шестнадцать часов после трансформации с планшетов было смыто более 180 000 колоний, и библиотека плазмид была экстрагирована с помощью GenElute™ HP Plasmid Maxiprep Kit (Sigma). Последовательности используемых праймеров: прямой - GTAAAACGACGGCCAGTgccgcagtactgatcatNNNNNNNNcccctctattgatccccacctccaaatatctcatcaacaacGTCATAGCTGTTTCCTG, обратный - CAGGAAACAGCTATGACgttgttgatgagatatttggaggtggggatcaatagaggggNNNNNNNNatgatcagtactgcggcACTGGCCGTCGTTTTAC.Two M13-flanked reverse complementary oligonucleotides of 100 bp in size were used as templates in independent PCR reactions (DNA polymerase Q5, NEB). with degenerate fragments 8 bp long. (Syntol, Russia), adjacent to the protospacer. Amplicons were analyzed using agarose gel electrophoresis followed by gel extraction (Qiagen Gel Extraction Kit). The resulting fragments were restricted with EaeI (NEB) and cloned into vector pBR322, linearized with EagI and PvuII (NEB), followed by transformation into E. coli strain Top10. Sixteen hours after transformation, over 180,000 colonies were washed off the plates and the plasmid library was extracted using the GenElute™ HP Plasmid Maxiprep Kit (Sigma). Последовательности используемых праймеров: прямой - GTAAAACGACGGCCAGTgccgcagtactgatcatNNNNNNNNcccctctattgatccccacctccaaatatctcatcaacaacGTCATAGCTGTTTCCTG, обратный - CAGGAAACAGCTATGACgttgttgatgagatatttggaggtggggatcaatagaggggNNNNNNNNatgatcagtactgcggcACTGGCCGTCGTTTTAC.

5. Результаты фиг. 4 подтверждали in vitro в два этапа. Для этого на первом этапе получили синтетические конструкции, содержащие один протоспейсер, но разные 3'-концевые нуклеотиды в последовательности PAM 5-TTN-3. Используя пары праймеров, вносящих мутации в третий нуклеотид PAM, и набор Q5® Site-Directed Mutagenesis Kit, получили 4 генетические конструкции, содержащие один протоспейсер и один из четырех PAM: 5'-TTC-3', 5'-TTG-3', 5'-TTA-3', 5'-TTT-3'. Полученные векторы линеаризовали ScaI рестриктазой (New England Biolabs) и гидролизовали с использованием RbCpf1 и направляющей РНК. Реакции проводили в трех повторах. Результаты гидролиза анализировали электрофоретически в 1х ТАЕ 1 % агарозе с окраской этидием бромидом. Чтобы подтвердить данные, полученные после NGS и отображенные на фиг. 4, на втором этапе к плазмидному вектору pUC119 были подобраны 13 crРНК на 5'-YYN-3' PAM: 12 РНК на 5'-CTN-3' и 5'-TCN-3' PAM, и одна дополнительная на 5'-TTC-3' PAM в качестве контроля. Используя полученные crРНК, ставили реакции разрезания in vitro с RbCas12a и HindIII рестриктазой (New England Biolabs) в трех. Результаты гидролиза анализировали электрофоретически в 1х ТАЕ 1 % агарозе с окраской этидием бромидом. Результаты представлены на фиг. 5.5. Results of Fig. 4 was confirmed in vitro in two steps. To do this, at the first stage, synthetic constructs were obtained containing one protospacer, but different 3'-terminal nucleotides in the PAM 5-TTN-3 sequence. Using pairs of primers introducing mutations in the third nucleotide of PAM and the Q5® Site-Directed Mutagenesis Kit, we obtained 4 genetic constructs containing one protospacer and one of four PAMs: 5'-TTC-3', 5'-TTG-3' , 5'-TTA-3', 5'-TTT-3'. The resulting vectors were linearized with ScaI restriction enzyme (New England Biolabs) and digested using RbCpf1 and guide RNA. Reactions were carried out in triplicate. The results of hydrolysis were analyzed electrophoretically in 1x TAE 1% agarose stained with ethidium bromide. To confirm the data obtained after NGS and displayed in Fig. 4, at the second stage, 13 crRNAs at 5'-YYN-3' PAM were selected for the plasmid vector pUC119: 12 RNAs at 5'-CTN-3' and 5'-TCN-3' PAM, and one additional at 5'- TTC-3' PAM as control. Using the obtained crRNAs, in vitro cutting reactions were performed with RbCas12a and HindIII restriction enzyme (New England Biolabs) in three. The results of hydrolysis were analyzed electrophoretically in 1x TAE 1% agarose stained with ethidium bromide. The results are presented in Fig. 5.

6. Нуклеазу испытывали в клетках эукариот на примере человеческой клеточной линии HEK293T. Результаты представлены на фиг. 6. Кодон-оптимизированный ген RbCas12a клонировали в плазмидный вектор под регуляцией промотора CMV. Последовательности, кодирующие последовательности crРНК, клонировали в независимые плазмидные векторы под контролем промотора U6 (фиг. 17). RbCpf1 с помощью двух направляющих РНК нацеливали на человеческий ген DNMT1.6. The nuclease was tested in eukaryotic cells using the human HEK293T cell line as an example. The results are presented in Fig. 6. The codon-optimized RbCas12a gene was cloned into a plasmid vector under the regulation of the CMV promoter. Sequences encoding crRNA sequences were cloned into independent plasmid vectors under the control of the U6 promoter (Fig. 17). RbCpf1 was targeted using two guide RNAs to the human DNMT1 gene.

Для определения разрезания в клетках эукариот клеточная линия HEK293T культивировалась в среде DMEM с добавлением 10% FBS при 37 градусах Цельсия и 5 % углекислоты. Смена среды на OptiMEM производилась за час до трансфекции. Трансфекция производилась в 6-луночном планшете с помощью реагента Lipofectamine3000 (ThermoScientific). Трансфецировали 2000 нг плазмид, кодирующих RbCpf1 и две направляющих РНК. Через 48 часов клетки снимали и производили выделение ДНК с помощью набора Qiamp DNA MINI KIT (Qiagen). Далее амплифицировали участок, содержащий ген DNMT1, с помощью фосфорилированных праймеров, анализировали с помощью гель-электрофореза и проводили очистку фрагментов ДНК из агарозного геля. Выделенные фрагменты клонировали в составе плазмидного вектора pUC119 и секвенировали по Сэнгеру.To determine cutting in eukaryotic cells, the HEK293T cell line was cultured in DMEM supplemented with 10% FBS at 37 degrees Celsius and 5% carbon dioxide. The medium was changed to OptiMEM one hour before transfection. Transfection was performed in a 6-well plate using Lipofectamine3000 reagent (ThermoScientific). 2000 ng of plasmids encoding RbCpf1 and two guide RNAs were transfected. After 48 hours, cells were removed and DNA was isolated using the Qiamp DNA MINI KIT (Qiagen). Next, the region containing the DNMT1 gene was amplified using phosphorylated primers, analyzed using gel electrophoresis, and DNA fragments were purified from an agarose gel. The isolated fragments were cloned into the pUC119 plasmid vector and Sanger sequenced.

7. Нуклеазу испытывали в условиях in vitro, где в качестве белка Cpf1 использовали рекомбинантные препараты с 97 % (RbCpf1_mut и RbCpf1_mut2) гомологии с SEQ ID NO:1. Результаты разрезаний приведены на фиг. 13. Мутации в последовательностях RbCpf1_mut и RbCpf1_mut2 обозначены на фиг. 14-15.7. The nuclease was tested in vitro, where recombinant preparations with 97% homology with SEQ ID NO: 1 (RbCpf1_mut and RbCpf1_mut2) were used as the Cpf1 protein. The cutting results are shown in Fig. 13. Mutations in the sequences RbCpf1_mut and RbCpf1_mut2 are indicated in FIG. 14-15.

Claims (52)

1. Белок, обладающий активностью нуклеазы, характеризующийся тем, что содержит аминокислотную последовательность SEQ ID NO: 1.1. A protein having nuclease activity, characterized in that it contains the amino acid sequence SEQ ID NO: 1. 2. Белок по п. 1, характеризующийся тем, что представляет собой природный белок, или искусственно синтезированный белок, или рекомбинантный белок, или белок, полученный в бесклеточной системе трансляции, или искусственно гибридный белок.2. The protein according to claim 1, characterized in that it is a natural protein, or an artificially synthesized protein, or a recombinant protein, or a protein obtained in a cell-free translation system, or an artificially hybrid protein. 3. Молекула нуклеиновой кислоты, кодирующая белок по п. 1, характеризующаяся тем, что содержит нуклеотидную последовательность SEQ ID NO: 2 или последовательность, которая по меньшей мере на 98% идентична нуклеотидной последовательности SEQ ID NO: 2.3. A nucleic acid molecule encoding a protein according to claim 1, characterized in that it contains the nucleotide sequence of SEQ ID NO: 2 or a sequence that is at least 98% identical to the nucleotide sequence of SEQ ID NO: 2. 4. Вектор экспрессии, содержащий молекулу нуклеиновой кислоты по п. 3 и элементы, обеспечивающие поддержание целостности и/или копийности и/или функциональности вектора.4. An expression vector containing a nucleic acid molecule according to claim 3 and elements ensuring the maintenance of the integrity and/or copy number and/or functionality of the vector. 5. Вектор по п. 4, характеризующийся тем, что содержит элементы, обеспечивающие поддержание целостности и/или копийности и/или функциональности молекулы ДНК, включающие ориджины репликации, гены устойчивости к антибиотикам, промоторные, операторные, энхансерные и терминаторные регионы генов, регионы связывания транскрипционных факторов.5. The vector according to claim 4, characterized in that it contains elements that ensure the maintenance of the integrity and/or copy number and/or functionality of the DNA molecule, including origins of replication, antibiotic resistance genes, promoter, operator, enhancer and terminator regions of genes, binding regions transcription factors. 6. Вектор по п. 4, характеризующийся тем, что вектор для экспрессии RbCpf1 в клетках человека включает следующие последовательно расположенные элементы:6. The vector according to claim 4, characterized in that the vector for the expression of RbCpf1 in human cells includes the following sequential elements: Энхансер цитомегаловируса (CMV)-235-614 п.о.Cytomegalovirus (CMV) enhancer - 235-614 bp. Промотор цитомегаловируса (CMV)-615-818 п.о.Cytomegalovirus (CMV) promoter -615-818 bp. T7 промотор-863-881 п.о.T7 promoter-863-881 bp Ген RbCpf1-917-4651 п.о.Gene RbCpf1-917-4651 bp Сигнал ядерной локализации нуклеоплазмина NLS-4652-4699 п.о.Nuclear localization signal for nucleoplasmin NLS-4652-4699 bp. Аффинная метка гемаглютинина вируса гриппа HA-4700-4726 п.о.Affinity tag of influenza virus hemagglutinin HA-4700-4726 bp. Сигнал полиаденилирования бычьего гормона роста bGH-poly(A)-4832-5056 п.о.Bovine growth hormone polyadenylation signal bGH-poly(A)-4832-5056 bp. Ориджин репликации f1-5102-5530 п.о.Origin of replication f1-5102-5530 bp Промотор и энхансер обезьяньего вируса SV40-5544-5873 п.о.Promoter and enhancer of simian virus SV40-5544-5873 bp. Ориджин репликации обезьяньего вируса SV40-5724-5859 п.о.Origin of replication of simian virus SV40-5724-5859 bp. Ген устойчивости к канамицину, неомицину, G418 NeoR/KanR-5940-6734 п.о.Resistance gene to kanamycin, neomycin, G418 NeoR/KanR-5940-6734 bp. Сигнал полиаденилирования обезьяньего вируса SV40-6908-7029 п.о.Simian virus polyadenylation signal SV40-6908-7029 bp. Lac оператор-7102-7118 п.о.Lac operator-7102-7118 p.o. Промотор lac-7126-7156 п.о.Promoter lac-7126-7156 bp Сайт связывания CAP-717-7192 п.о.Binding site CAP-717-7192 bp. Ориджин репликации ColE1/pMB1/pBR322/pUC-7480-8065 п.о.Origin of replication ColE1/pMB1/pBR322/pUC-7480-8065 bp. Ген устойчивости к ампициллину AmpR-8236-9096 п.о.Ampicillin resistance gene AmpR-8236-9096 bp. Промотор гена AmpR-9097-9201 п.о.Gene promoter AmpR-9097-9201 bp. 7. Вектор по п. 4, характеризующийся тем, что является вектором для экспрессии в клетках Escherichia coli, включает следующие последовательно расположенные элементы:7. Vector according to claim 4, characterized in that it is a vector for expression in cellsEscherichia coli, includes the following sequential elements: T7 терминатор-26-73 п.оT7 terminator-26-73 p.o 6xHis аффинная метка-140-157 п.о.6xHis affinity tag-140-157 bp Ген RbCpf1-159-3898 п.о.Gene RbCpf1-159-3898 bp Сайт связывания рибосом из гена 10 фага T7 (RBS)-3909-3931 п.о.Ribosome binding site from phage T7 gene 10 (RBS) - 3909-3931 bp. Lac оператор-3946-3970 п.о.Lac operator-3946-3970 p.o. T7 промотор-3971-3989 п.о.T7 promoter-3971-3989 bp lacI промотор-4302-4379 п.о.lacI promoter-4302-4379 bp Ген lacI-4380-5462 п.о.Gene lacI-4380-5462 bp Ген rop-6271-6462 п.о.Gene rop-6271-6462 bp bom элемент-6564-6706 п.о.bom element-6564-6706 p.o. Ориджин репликации ColE1/pMB1/pBR322/pUC-6892-7480 п.о.Origin of replication ColE1/pMB1/pBR322/pUC-6892-7480 bp. Ген устойчивости к канамицину KanR-7602-8417 п.о.Kanamycin resistance gene KanR-7602-8417 bp. Ориджин репликации фага f1-8510-8965 п.о.Origin of replication of phage f1-8510-8965 bp. 8. Клетка-хозяин для продуцирования белка по п. 1, характеризующаяся тем, что содержит молекулу нуклеиновой кислоты по п. 3 или вектор по п. 4.8. A host cell for producing a protein according to claim 1, characterized in that it contains a nucleic acid molecule according to claim 3 or a vector according to claim 4. 9. Клетка-хозяин по п. 8, характеризующаяся тем, что представляет собой прокариотическую или эукариотическую клетку.9. The host cell according to claim 8, characterized in that it is a prokaryotic or eukaryotic cell. 10. Клетка-хозяин по п. 9, характеризующаяся тем, что клетка-хозяин представляет собой клетку бактерии, гриба, растения или животного, насекомого или млекопитающего.10. The host cell according to claim 9, characterized in that the host cell is a cell of a bacterium, fungus, plant or animal, insect or mammal. 11. Клетка-хозяин по п. 10, характеризующаяся тем, что представляет собой клетку организма, выбранного из родов, включающих Escherichia, Bacillus, Saccharomyces, Schizosaccharomyces, Pichia, Synechocystis, Chlamydomonas, Anabaena, Arabidopsis, Solanum, Triticum, Nicotiana, Hordeum, Drosophila, Mus, Rattus, Homo.11. The host cell according to claim 10, characterized in that it is a cell of an organism selected from the genera including Escherichia, Bacillus, Saccharomyces, Schizosaccharomyces, Pichia, Synechocystis, Chlamydomonas, Anabaena, Arabidopsis, Solanum, Triticum, Nicotiana, Hordeum, Drosophila, Mus, Rattus, Homo . 12. Способ получения белка по п. 1, характеризующийся тем, что включает этапы культивирования клетки-хозяина по п. 8 в культуральной среде, подходящей для культивирования клетки-хозяина в условиях, обеспечивающих продуцирование белка. 12. The method for producing protein according to claim 1, characterized in that it includes the steps of cultivating the host cell according to claim 8 in a culture medium suitable for culturing the host cell under conditions that ensure protein production. 13. Способ по п. 12, характеризующийся тем, что включает этапы выделения и/или очистки продуцированного белка.13. The method according to claim 12, characterized in that it includes the steps of isolating and/or purifying the produced protein. 14. Система CRISPR/Cpf1, характеризующаяся тем, что включает направляющую (crispr) РНК для белка и содержащая белок по п. 1. 14. The CRISPR/Cpf1 system, characterized in that it includes a guide (crispr) RNA for the protein and contains the protein according to claim 1. 15. Применение белка по п. 1 для образования разрыва в молекуле нуклеиновой кислоты.15. Use of a protein according to claim 1 to form a gap in a nucleic acid molecule. 16. Применение по п. 15, характеризующееся тем, что разрыв может быть однонитевым или двунитевым.16. Application according to claim 15, characterized in that the break can be single-stranded or double-stranded. 17. Применение по п. 15, характеризующееся тем, что молекула нуклеиновой кислоты представляет собой ДНК или РНК.17. Use according to claim 15, characterized in that the nucleic acid molecule is DNA or RNA. 18. Система доставки нуклеазы в живые клетки, характеризующаяся тем, что включает белок по п. 1, молекулу нуклеиновой кислоты по п. 3 или вектор по п. 4, при этом система содержит элементы, обеспечивающие поддержание целостности и/или копийности и/или функциональности молекулы ДНК, включающие ориджины репликации, гены устойчивости к антибиотикам, промоторные, операторные, энхансерные и терминаторные регионы генов, регионы связывания транскрипционных факторов.18. A system for delivering nuclease to living cells, characterized in that it includes a protein according to claim 1, a nucleic acid molecule according to claim 3 or a vector according to claim 4, wherein the system contains elements that ensure the maintenance of integrity and/or copy number and/or functionality of the DNA molecule, including origins of replication, antibiotic resistance genes, promoter, operator, enhancer and terminator gene regions, transcription factor binding regions. 19. Применение по п. 15, характеризующееся тем, что образование разрывов осуществляют для редактирования генома одноклеточного или многоклеточного организма, или для коррекции генетического дефекта в виде геномных мутаций в организме, включающее внесение в по меньшей мере одну клетку указанного организма белка по п. 1, или молекулы ДНК или РНК по п. 3, или вектора по п. 4 или системы CRISPR/Cpf1 по п. 14.19. Application according to claim 15, characterized in that the formation of breaks is carried out to edit the genome of a unicellular or multicellular organism, or to correct a genetic defect in the form of genomic mutations in the body, including the introduction of a protein according to claim 1 into at least one cell of said organism , or a DNA or RNA molecule according to claim 3, or a vector according to claim 4 or a CRISPR/Cpf1 system according to claim 14. 20. Применение по п. 19, характеризующееся тем, что организм представляет собой прокариотический или эукариотический организм, предпочтительно простейшее, бактерию, растение, грибы, животное, предпочтительно млекопитающее, в частности человек.20. Use according to claim 19, characterized in that the organism is a prokaryotic or eukaryotic organism, preferably a protozoan, a bacterium, a plant, a fungus, an animal, preferably a mammal, in particular a human. 21. Применение по п. 15, характеризующееся тем, что коррекцию генетического дефекта осуществляют путем внесения однонитевых или двунитевых разрывов в молекулы ДНК в присутствии или без такового донорной последовательности или в виде нарушений экспрессии генов, таких как снижение или повышение экспрессии генов, путем направленного изменения экспрессии, опосредованного использованием белка Cpf1 по п. 1, молекулы ДНК или РНК по п. 3, или вектора по п. 4, или системы CRISPR/Cpf1 по п. 14.21. Application according to claim 15, characterized in that the correction of a genetic defect is carried out by introducing single-strand or double-strand breaks into DNA molecules in the presence or without a donor sequence or in the form of disturbances in gene expression, such as a decrease or increase in gene expression, by targeted changes expression mediated by the use of the Cpf1 protein according to claim 1, a DNA or RNA molecule according to claim 3, or a vector according to claim 4, or the CRISPR/Cpf1 system according to claim 14.
RU2022135486A 2022-12-30 NUCLEASE Cpf1 FROM BACTERIUM RUMINOCOCCUS BROMII, DNA MOLECULE OR RNA CODING NUCLEASE, VECTOR CONTAINING SAID DNA MOLECULE, CRISPR/Cpf1 SYSTEM CONTAINING SAID NUCLEASE AND GUIDE RNA, HOST CELL FOR PRODUCING NUCLEASE Cpf1, METHOD OF PRODUCING NUCLEASE Cpf1 AND USE THEREOF RU2816876C1 (en)

Publications (1)

Publication Number Publication Date
RU2816876C1 true RU2816876C1 (en) 2024-04-08

Family

ID=

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015006294A2 (en) * 2013-07-10 2015-01-15 President And Fellows Of Harvard College Orthogonal cas9 proteins for rna-guided gene regulation and editing
WO2017048969A1 (en) * 2015-09-17 2017-03-23 The Regents Of The University Of California Variant cas9 polypeptides comprising internal insertions
RU2712492C1 (en) * 2018-11-26 2020-01-29 Автономная некоммерческая образовательная организация высшего образования Сколковский институт науки и технологий DNA PROTEASE CUTTING AGENT BASED ON Cas9 PROTEIN FROM DEFLUVIIMONAS SP.
RU2722934C1 (en) * 2019-06-11 2020-06-05 Автономная некоммерческая образовательная организация высшего образования Сколковский институт науки и технологий Dna protease cutting agent based on cas9 protein from pasteurella pneumotropica bacteria
RU2749307C1 (en) * 2020-10-30 2021-06-08 Федеральное государственное бюджетное научное учреждение "Всероссийский научно-исследовательский институт сельскохозяйственной биотехнологии" (ФГБНУ ВНИИСБ) New compact type ii cas9 nuclease from anoxybacillus flavithermus
RU2762830C1 (en) * 2020-10-05 2021-12-23 Федеральное государственное бюджетное научное учреждение "Всероссийский научно-исследовательский институт сельскохозяйственной биотехнологии" (ФГБНУ ВНИИСБ) Genetic construct based on crispr/cas9 genome editing system encoding cas9 nuclease for genome editing of monocotyledonous grain crops based on double selection of plants

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015006294A2 (en) * 2013-07-10 2015-01-15 President And Fellows Of Harvard College Orthogonal cas9 proteins for rna-guided gene regulation and editing
WO2017048969A1 (en) * 2015-09-17 2017-03-23 The Regents Of The University Of California Variant cas9 polypeptides comprising internal insertions
RU2712492C1 (en) * 2018-11-26 2020-01-29 Автономная некоммерческая образовательная организация высшего образования Сколковский институт науки и технологий DNA PROTEASE CUTTING AGENT BASED ON Cas9 PROTEIN FROM DEFLUVIIMONAS SP.
RU2722934C1 (en) * 2019-06-11 2020-06-05 Автономная некоммерческая образовательная организация высшего образования Сколковский институт науки и технологий Dna protease cutting agent based on cas9 protein from pasteurella pneumotropica bacteria
RU2762830C1 (en) * 2020-10-05 2021-12-23 Федеральное государственное бюджетное научное учреждение "Всероссийский научно-исследовательский институт сельскохозяйственной биотехнологии" (ФГБНУ ВНИИСБ) Genetic construct based on crispr/cas9 genome editing system encoding cas9 nuclease for genome editing of monocotyledonous grain crops based on double selection of plants
RU2749307C1 (en) * 2020-10-30 2021-06-08 Федеральное государственное бюджетное научное учреждение "Всероссийский научно-исследовательский институт сельскохозяйственной биотехнологии" (ФГБНУ ВНИИСБ) New compact type ii cas9 nuclease from anoxybacillus flavithermus

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GenBank: *
найдено в интернете по адресу https://www.ncbi.nlm.nih.gov/protein/RGY72854.1?report=genbank&log$=protalign&blast_rank=1&RID=DPKTBF73016;. *

Similar Documents

Publication Publication Date Title
JP7502537B2 (en) Enzymes with RUVC domains
US11713471B2 (en) Class II, type V CRISPR systems
US20240209332A1 (en) Enzymes with ruvc domains
WO2021178934A1 (en) Class ii, type v crispr systems
JP2024535672A (en) Class II, Type V CRISPR system
JP2024533038A (en) Systems and methods for translocating cargo nucleotide sequences
EP4165177A1 (en) Enzymes with ruvc domains
RU2816876C1 (en) NUCLEASE Cpf1 FROM BACTERIUM RUMINOCOCCUS BROMII, DNA MOLECULE OR RNA CODING NUCLEASE, VECTOR CONTAINING SAID DNA MOLECULE, CRISPR/Cpf1 SYSTEM CONTAINING SAID NUCLEASE AND GUIDE RNA, HOST CELL FOR PRODUCING NUCLEASE Cpf1, METHOD OF PRODUCING NUCLEASE Cpf1 AND USE THEREOF
US12123014B2 (en) Class II, type V CRISPR systems
WO2023039377A1 (en) Class ii, type v crispr systems
EP4330386A2 (en) Enzymes with ruvc domains
WO2023164590A2 (en) Fusion proteins
WO2023164592A2 (en) Fusion proteins
GB2617659A (en) Enzymes with RUVC domains
CN113614247A (en) DNA cleavage agent