RU2794774C1 - Crispr/cas9 type ii genome editing system and its use - Google Patents

Crispr/cas9 type ii genome editing system and its use Download PDF

Info

Publication number
RU2794774C1
RU2794774C1 RU2022104506A RU2022104506A RU2794774C1 RU 2794774 C1 RU2794774 C1 RU 2794774C1 RU 2022104506 A RU2022104506 A RU 2022104506A RU 2022104506 A RU2022104506 A RU 2022104506A RU 2794774 C1 RU2794774 C1 RU 2794774C1
Authority
RU
Russia
Prior art keywords
crispr
sequence
seq
acid sequence
cas9
Prior art date
Application number
RU2022104506A
Other languages
Russian (ru)
Inventor
Жуй ТЯНЬ
Лун ХУАН
Хунсянь СЕ
Original Assignee
Чжухай Шу Тун МЕДИКЛ ТЕКНОЛОДЖИ КО., ЛТД.
Filing date
Publication date
Application filed by Чжухай Шу Тун МЕДИКЛ ТЕКНОЛОДЖИ КО., ЛТД. filed Critical Чжухай Шу Тун МЕДИКЛ ТЕКНОЛОДЖИ КО., ЛТД.
Application granted granted Critical
Publication of RU2794774C1 publication Critical patent/RU2794774C1/en

Links

Images

Abstract

FIELD: biotechnology.
SUBSTANCE: invention relates to a type II CRISPR/Cas9 genome editing system, characterized in that the system contains the Cas9 protein, auxiliary proteins, crRNA (CRISPR RNA) and tracrRNA (transactivated CRISPR RNA) in the functional form of the RNP complex (ribonucleoprotein complex) Cas9 protein and guide RNA formed by hybridization of crRNA with tracrRNA.
EFFECT: invention is effective for DNA editing.
22 cl, 14 dwg, 11 ex

Description

Изобретение относится к системе редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, и имеет отношение к области техники редактирования генома.The invention relates to a type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium and relates to the field of genome editing technology.

ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯBACKGROUND OF THE INVENTION

Технология редактирования генов позволяет модифицировать точки локализации последовательности ДНК. Например, первое поколение инструментов редактирования генома, нуклеазы цинковые пальцы (ZFN), второе поколение инструментов редактирования генома, такие как эффекторные нуклеазы, подобные активаторам транскрипции (TALEN), могут использоваться для трансформации геномов-мишеней. Однако эти способы сложны в конструировании, непросты в производстве, дороги и не универсальны.Gene editing technology allows you to modify the localization points of the DNA sequence. For example, first generation genome editing tools, zinc finger nucleases (ZFN), second generation genome editing tools such as effector nucleases like transcription activators (TALEN) can be used to transform target genomes. However, these methods are complex in design, difficult to manufacture, expensive and not universal.

Система CRISPR (короткие палиндромные повторы, регулярно расположенные группами)/Cas (CRISPR-ассоциированный белок) представляет собой врожденную иммунную систему, полученную из архей и бактерий, и служит инструментом редактирования генома третьего поколения. В отличие от предыдущих инструментов редактирования генома (распознавание белок-ДНК), этот метод использует принцип комплементарной пары оснований нуклеиновых кислот для определения последовательности ДНК-мишени и направления эффекторного белка Cas для выполнения сайт-специфического расщепления и отличается широкими возможностями применения, простой конструкцией, низкой стоимостью и высокой эффективностью. Белок Cas содержит множество различных эффекторных доменов, которые участвуют в различных процессах, таких как распознавание нуклеиновых кислот, стабилизация сложных структур и гидролиз фосфодиэфирных связей ДНК. Среди них система CRISPR/Cas9 типа II, полученная из Streptococcus pyogene Cas (SpCas9), стала наиболее широко используемой системой CRISPR/Cas вследствие ее высокой эффективности к расщеплению. Эта система идентифицирует и расщепляет последовательность мотива, смежного с протоспейсером (РАМ), то есть «NGG» на полинуклеотиде-мишени, оставляя выступ с тупым концом, влияя на редактирование генома.The CRISPR (Regularly Clustered Short Palindromic Repeats)/Cas (CRISPR Associated Protein) system is an innate immune system derived from archaea and bacteria and serves as a third generation genome editing tool. Unlike previous genome editing tools (protein-DNA recognition), this method uses the principle of a complementary base pair of nucleic acids to determine the target DNA sequence and direct the Cas effector protein to perform site-specific cleavage, and is characterized by wide application, simple design, low cost and high efficiency. The Cas protein contains many different effector domains that are involved in various processes such as nucleic acid recognition, stabilization of complex structures, and hydrolysis of DNA phosphodiester bonds. Among them, the type II CRISPR/Cas9 system derived from Streptococcus pyogene Cas (SpCas9) has become the most widely used CRISPR/Cas system due to its high cleavage efficiency. This system identifies and cleaves the motif sequence adjacent to the protospacer (PAM), i.e. "NGG" on the target polynucleotide, leaving a blunt-ended overhang, affecting genome editing.

В больших и разнообразных метагеномах, содержащих некультивируемые или даже неизвестные микроорганизмы, может существовать большое количество неисследованных систем CRISPR/Cas9, активность которых в прокариотах и эукариотах, а также в средах in vitro требует подтверждения.In large and diverse metagenomes containing uncultivated or even unknown microorganisms, there may be a large number of unexplored CRISPR/Cas9 systems, the activity of which in prokaryotes and eukaryotes, as well as in vitro media, requires confirmation.

В 2015 году команда доктора Бьюнг-Чана Кима выделила новый анаэробный штамм AL017 из фекалий лабораторных мышей линии C57BL/6J и проанализировала филогенетическую связь штамма с 16SrRNA генетической последовательностью прокариот и, при этом, обнаружила, что штамм тесно связан с Holdemanellabiformis DSM 3989Т, Faecalicoccuspleomorphus АТСС 29734Т, Faecalitaleacylindroides АТСС 27803Т и Allobaculumstercoricanis DSM 13633Т (гомология с последовательностей составляет 87,4%, 87,3%, 86,9% и 86,9% соответственно). На основании многочисленных таксономических данных этот вид считается новым родом семейства Erysipelothricaceae и назван Faecalibaculum rodentium Gen.nov., sp.nov. За последние пять лет ученые разных стран мира проводили исследования этого штамма в двух областях: микробная среда кишечника и диета с высоким содержанием жиров, и микробная среда кишечника и онкогенез. Однако не сообщалось о подобных исследованиях в области редактирования генома.In 2015, Dr. Byung-Chan Kim's team isolated a new anaerobic strain, AL017, from the faeces of C57BL/6J laboratory mice and analyzed the phylogenetic relationship of the strain to the 16SrRNA genetic sequence of prokaryotes and, in doing so, found that the strain is closely related to Holdemanellabiformis DSM 3989T, Faecalicoccus pleomorphus ATCC 29734T, Faecalitaleacylindroides ATCC 27803T and Allobaculumstercoricanis DSM 13633T (sequence homology is 87.4%, 87.3%, 86.9% and 86.9%, respectively). Based on numerous taxonomic data, this species is considered a new genus of the Erysipelothricaceae family and is named Faecalibaculum rodentium Gen.nov., sp.nov. Over the past five years, scientists around the world have been conducting research on this strain in two areas: gut microbial environment and high-fat diet, and gut microbial environment and tumorigenesis. However, no similar genome editing research has been reported.

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯBRIEF DESCRIPTION OF THE INVENTION

Цель изобретения состоит в том, чтобы преодолеть недостатки предшествующего уровня техники и представить систему редактирования генома CRISPR/Cas9 типа II, полученную из Faecalibaculum rodentium, где система редактирования генома имеет новые физические и химические свойства и может идентифицировать множество различных последовательностей РАМ (мотив, смежный с протоспейсером), включая NGTA и NNTA (N представляет собой А, С, G или Т).The aim of the invention is to overcome the shortcomings of the prior art and provide a type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium, where the genome editing system has novel physical and chemical properties and can identify many different PAM sequences (motif adjacent to protospacer), including NGTA and NNTA (N is A, C, G, or T).

Для достижения цели техническое решение, применяющееся в изобретении, заключается в следующем.To achieve the goal, the technical solution used in the invention is as follows.

Система редактирования генома CRISPR/Cas9 типа II, отличающаяся тем, что система содержит белок Cas9, вспомогательные белки, crPHK (CRISPR РНК) и tracrPHK (трансактивированную CRISPR РНК) в функциональной форме комплекса РНП (комплекс рибонуклеопротеин) белка Cas9 и направляющей РНК, образованной путем гибридизации crPHK с tracrPHK;Type II CRISPR/Cas9 genome editing system, characterized in that the system contains the Cas9 protein, accessory proteins, crPHK (CRISPR RNA) and tracrPHK (transactivated CRISPR RNA) in the functional form of the RNP complex (ribonucleoprotein complex) of the Cas9 protein and a guide RNA formed by hybridization of crRNA with tracrRNA;

при этом белок Cas9 представляет собой ДНК-эндонуклеазу, и белок Cas9 имеет аминокислотную последовательность, как показано в SEQ ID NO: 1, или аминокислотную последовательность, имеющую по меньшей мере 80%, 85%, 90%, 95%, 98%, или 99% гомологию с аминокислотной последовательностью, как показано в SEQ ID NO: 1.wherein the Cas9 protein is a DNA endonuclease and the Cas9 protein has an amino acid sequence as shown in SEQ ID NO: 1, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% homology to the amino acid sequence as shown in SEQ ID NO: 1.

Белок Cas9 расщепляет двухцепочечную ДНК, комплементарную crPHK выше последовательности РАМ, с помощью нуклеазного домена, где нуклеазный домен выбран из HNH-подобного нуклеазного домена, RuvC-подобного нуклеазного домена или их комбинации.The Cas9 protein cleaves double-stranded DNA complementary to crRNA upstream of the PAM sequence with a nuclease domain, where the nuclease domain is selected from an HNH-like nuclease domain, a RuvC-like nuclease domain, or a combination thereof.

Предпочтительно система редактирования генома CRISPR/Cas9 типа II получена из Faecalibaculum rodentim.Preferably, the type II CRISPR/Cas9 genome editing system is derived from Faecalibaculum rodentim.

В некоторых вариантах осуществления термин «рибонуклеопротеиновый комплекс» предпочтительно относится к «белковому комплексу FrCas9» в соответствии с изобретением.In some embodiments, the term "ribonucleoprotein complex" preferably refers to "FrCas9 protein complex" in accordance with the invention.

Мутации на нескольких ключевых аминокислотных сайтах специфического белка Cas9 подробно объясняются следующим образом. Мутация Е в А в положении 796 аминокислоты приведет к образованию нуклеазы никазы. Мутация N в А в положении 902 аминокислоты приведет к образованию нуклеазы никазы. Мутация Н в А в положении 1010 аминокислоты приведет к образованию нуклеазы никазы. Мутация D в А в положении 1013 аминокислоты приведет к образованию нуклеазы никазы.Mutations at several key amino acid sites of the specific Cas9 protein are explained in detail as follows. Mutation of E to A at amino acid position 796 will result in the formation of the nickase nuclease. Mutation of N to A at amino acid position 902 will result in the formation of the nickase nuclease. Mutation of H to A at amino acid position 1010 will result in the formation of the nickase nuclease. A D to A mutation at amino acid position 1013 will result in the formation of the nickase nuclease.

Одновременная мутация Е в А в положении 796 аминокислоты и D в А в положении 1013 аминокислоты приведет к образованию нуклеазы Cas9, которая не обладает способностью к расщеплению, но сохраняет способность к связыванию (т.е. мертвая Cas9).Simultaneous mutation of E to A at amino acid position 796 and D to A at amino acid position 1013 will result in a Cas9 nuclease that is incapable of cleavage but retains binding capacity (ie dead Cas9).

Вспомогательные белки включают вспомогательный белок Cas1, вспомогательный белок Cas2 и вспомогательный белок Csn2;Accessory proteins include Cas1 accessory protein, Cas2 accessory protein, and Csn2 accessory protein;

при этом вспомогательный белок Cas1 имеет аминокислотную последовательность, как показано в SEQ ID NO: 2, или аминокислотную последовательность, имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с аминокислотной последовательностью, как показано в SEQ ID NO: 2;wherein the Cas1 accessory protein has an amino acid sequence as shown in SEQ ID NO: 2, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98% or 99% homology with the amino acid sequence as shown in SEQ ID NO: 2;

при этом вспомогательный белок Cas2 имеет аминокислотную последовательность, как показано в SEQ ID NO: 3, или аминокислотную последовательность, имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с аминокислотной последовательностью, как показано в SEQ ID NO: 3;wherein the Cas2 accessory protein has an amino acid sequence as shown in SEQ ID NO: 3, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98% or 99% homology with the amino acid sequence as shown in SEQ ID NO: 3;

при этом вспомогательный белок Csn2 имеет аминокислотную последовательность,while the auxiliary protein Csn2 has an amino acid sequence,

как показано в SEQ ID NO: 4, или аминокислотную последовательность, имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с аминокислотной последовательностью, как показано в SEQ ID NO: 4.as shown in SEQ ID NO: 4, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98% or 99% homology with the amino acid sequence as shown in SEQ ID NO: 4.

CRISPR РНК генерируется путем транскрипции массива CRISPR и имеет последовательность РНК, как показано в SEQ ID NO: 5, или последовательность РНК, имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с последовательностью нуклеиновой кислоты, как показано в SEQ ID NO: 5; при этом массив CRISPR содержит последовательность прямого повтора и спейсерную последовательность, при этом последовательность прямого повтора имеет последовательность нуклеиновой кислоты, как показано в SEQ ID NO: 6, или последовательность нуклеиновой кислоты, имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с последовательностью нуклеиновой кислоты, как показано в SEQ ID NO: 6; и при этом спейсерная последовательность имеет последовательность нуклеиновой кислоты, как показано в SEQ ID NO: 7, или последовательность нуклеиновой кислоты, имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с последовательностью нуклеиновой кислоты, как показано в SEQ ID NO: 7.CRISPR RNA is generated by transcription of a CRISPR array and has an RNA sequence as shown in SEQ ID NO: 5, or an RNA sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the nucleic acid sequence. acids as shown in SEQ ID NO: 5; wherein the CRISPR array contains a direct repeat sequence and a spacer sequence, wherein the direct repeat sequence has a nucleic acid sequence as shown in SEQ ID NO: 6, or a nucleic acid sequence having at least 80%, 85%, 90%, 95 %, 98% or 99% homology to the nucleic acid sequence as shown in SEQ ID NO: 6; and wherein the spacer sequence has a nucleic acid sequence as shown in SEQ ID NO: 7, or a nucleic acid sequence having at least 80%, 85%, 90%, 95%, 98% or 99% homology with the nucleic acid sequence as shown in SEQ ID NO: 7.

Трансактивированная CRISPR РНК содержит последовательность, комплементарную последовательности прямого повтора CRISPR РНК, и трансактивированная CRISPR РНК имеет последовательность нуклеиновой кислоты, как показано в SEQ ID NO: 8, или последовательность нуклеиновой кислоты, имеющую по меньшей мере 70%, 80%, 85%, 90%, 95%, 98% или 99% гомологию с последовательностью нуклеиновой кислоты, как показано в SEQ ID NO: 8.The transactivated CRISPR RNA contains a sequence complementary to the CRISPR RNA direct repeat sequence, and the transactivated CRISPR RNA has a nucleic acid sequence as shown in SEQ ID NO: 8, or a nucleic acid sequence having at least 70%, 80%, 85%, 90 %, 95%, 98% or 99% homology to the nucleic acid sequence as shown in SEQ ID NO: 8.

Направляющая РНК, образованная путем гибридизации crPHK с tracrРНК, имеет каркас, состоящий из последовательности 7-24 нуклеотидов последовательности прямого повтора crPHK и последовательности tracrPHK; предпочтительно две части слиты линкером "GAAA", "TGAA" или "АААС" с образованием каркаса sgPHK; предпочтительно каркас sgPHK, образованный путем слияния последовательности прямого повтора crPHK из 20 нуклеотидов и полноразмерной последовательности tracrPHK с помощью «GAAA», показан в SEQ ID NO: 9, и на этой основе предпочтительно высокоэффективный вариант каркаса sgPHK представляет собойA guide RNA formed by hybridization of crRNA with tracrRNA has a scaffold consisting of a 7-24 nucleotide sequence of a crRNA direct repeat sequence and a tracrRNA sequence; preferably the two parts are fused with a "GAAA", "TGAA" or "AAAC" linker to form an sgRNA backbone; preferably an sgPHK framework formed by fusing a 20 nucleotide crRNA direct repeat sequence and a full-length tracrPHK sequence with "GAAA" is shown in SEQ ID NO: 9, and on this basis, preferably a highly efficient sgRNA framework variant is

каркас sgPHK, образованный путем слияния первых 18 14 нуклеотидов последовательности прямого повтора crPHK и последних 69-65 нуклеотидов tracrPHK с помощью линкерной последовательности («GAAA» и т.д.), предпочтительно выбран из следующих пяти каркасов:the sgPHK framework formed by fusing the first 18 14 nucleotides of the crRNA direct repeat sequence and the last 69-65 nucleotides of tracrPHK with a linker sequence ("GAAA" etc.) is preferably selected from the following five frameworks:

(1) каркас sgPHK длиной 91 нуклеотид, который содержит 18 нуклеотидов последовательности прямого повтора и 69 нуклеотидов tracrPHK, как показано в SEQ ID NO: 10;(1) a 91 nucleotide long sgPHK framework that contains 18 nucleotides of the direct repeat sequence and 69 nucleotides of tracrPHK as shown in SEQ ID NO: 10;

(2) каркас sgPHK длиной 89 нуклеотидов, который содержит 17 нуклеотидов последовательности прямого повтора и 68 нуклеотидов tracrPHK, как показано в SEQ ID NO: 11;(2) an 89 nt long sgPHK framework that contains 17 nt of direct repeat sequence and 68 nt of tracrPHK as shown in SEQ ID NO: 11;

(3) каркас sgPHK длиной 87 нуклеотидов, который содержит 16 нуклеотидов последовательности прямого повтора и 67 нуклеотидов tracrPHK, как показано в SEQ ID NO: 12;(3) an 87 nt long sgPHK framework that contains 16 nt of direct repeat sequence and 67 nt of tracrPHK as shown in SEQ ID NO: 12;

(4) каркас sgPHK длиной 85 нуклеотидов, который содержит 15 нуклеотидов последовательности прямого повтора и 66 нуклеотидов tracrPHK, как показано в SEQ ID NO: 13;(4) an 85 nt sgRNA backbone that contains 15 nt of direct repeat sequence and 66 nt of tracrPHK as shown in SEQ ID NO: 13;

(5) каркас sgPHK длиной 83 нуклеотида, который содержит 14 нуклеотидов последовательности прямого повтора и 65 нуклеотидов tracrPHK, как показано в SEQ ID NO: 14;(5) an 83 nucleotide long sgPHK framework that contains 14 nucleotides of the direct repeat sequence and 65 nucleotides of tracrPHK as shown in SEQ ID NO: 14;

необязательно каркас sgPHK имеет последовательность нуклеиновой кислоты, имеющую по меньшей мере 70%, 80%, 85%, 90%, 95%, 98% или 99% гомологии с любой из SEQ ID NO: 9-14.optionally, the sgRNA framework has a nucleic acid sequence having at least 70%, 80%, 85%, 90%, 95%, 98%, or 99% homology with any of SEQ ID NOs: 9-14.

Система редактирования генома CRISPR/Cas9 типа II, полученная из Faecalibaculum rodentium, связывает или расщепляет специфическую ДНК в биологическом процессе (например, в процессе редактирования генома) путем распознавания комплементарного спаривания направляющей РНК и мишени специфической ДНК, и при этом длина спаренной связывающей части направляющей РНК и мишени специфической ДНК составляет от 14 до 30 пар оснований (предпочтительно от 20 до 23 пар оснований); где специфическая ДНК представляет собой ДНК прокариот или эукариот.The type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium binds or cleaves specific DNA in a biological process (e.g., genome editing process) by recognizing the complementary pairing of the guide RNA and target specific DNA, and the length of the paired binding portion of the guide RNA and the target specific DNA is 14 to 30 base pairs (preferably 20 to 23 base pairs); where specific DNA is prokaryotic or eukaryotic DNA.

Длина спаренной связывающей части направляющей РНК и мишени специфической ДНК составляет 21 пару оснований, 22 пары оснований или 23 пары оснований, при этом комплекс РНП высокочувствителен к несоответствию оснований на 14 пар оснований вблизи мотива, смежного с протоспейсером, и 14 пар оснований - это начальная область.The length of the paired binding portion of the guide RNA and target specific DNA is 21 base pairs, 22 base pairs, or 23 base pairs, with the RNP complex being highly sensitive to a base mismatch of 14 base pairs near the motif adjacent to the protospacer, and 14 base pairs is the initial region .

Мотив, смежный с протоспейсером, необходимый для функции связывания или расщепления ДНК, расположен на 5'-NNTA-3' ниже последовательности распознавания направляющей PHK/sgPHK.A protospacer-adjacent motif required for DNA binding or cleavage function is located 5'-NNTA-3' downstream of the guide RNA/sgRNA recognition sequence.

В изобретении также предлагается применение вышеупомянутой системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, для редактирования ДНК, CRISPR активации или интерференции. Предпочтительно ДНК представляет собой прокариотическую или эукариотическую ДНК.The invention also provides the use of the aforementioned type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium for DNA editing, CRISPR activation or interference. Preferably the DNA is prokaryotic or eukaryotic DNA.

В качестве еще одного аспекта настоящего изобретения в нем дополнительно предлагается применение вышеуказанной системы редактирования генома CRISPR/Cas9 типа II для получения никазы, мертвой Cas9, базового редактора или основного редактора. Предпочтительно никазу, мертвый Cas9, базовый редактор или основной редактор получают в прокариотах или эукариотах.As another aspect of the present invention, it further proposes the use of the above type II CRISPR/Cas9 genome editing system to produce a nickase, a dead Cas9, a base editor or a main editor. Preferably, the niqase, dead Cas9, base editor or base editor is produced in prokaryotes or eukaryotes.

По сравнению с предшествующим уровнем техники изобретение обеспечивает следующие полезные эффекты.Compared with the prior art, the invention provides the following beneficial effects.

(1) Согласно изобретению, посредством биоинформатического анализа в Faecalibaculum rodentium обнаружена система редактирования генома CRSIPR/Cas9 типа II, указанная система редактирования генома применена для редактирования прокариотических или эукариотических генов и предоставляет новую возможность применения набора инструментов для редактирования генома.(1) According to the invention, a CRSIPR/Cas9 type II genome editing system has been found in Faecalibaculum rodentium by bioinformatic analysis, said genome editing system has been applied to edit prokaryotic or eukaryotic genes, and provides a new opportunity to apply a genome editing toolkit.

(2) В изобретении представлена система редактирования генома CRISPR/Cas9 типа II, полученная из Faecalibaculum rodentium, которая обладает новыми физическими и химическими свойствами и может идентифицировать множество различных последовательностей РАМ, при этом специфическая последовательность РАМ, распознаваемая системой редактирования генома, расположена на 5'-NNTA-3' ниже последовательности распознавания направляющей PHK/sgPHK.(2) The invention provides a type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium, which has novel physical and chemical properties and can identify many different PAM sequences, wherein the specific PAM sequence recognized by the genome editing system is located at 5' -NNTA-3' below the RNA/sgPHK guideline recognition sequence.

(3) В изобретении представлена система редактирования генома CRISPR/Cas9 типа II, полученная из Faecalibaculum rodentium, которая имеет высокую эффективность расщепления на одном и том же сайте ДНК по сравнению с наиболее распространенным SpCas9, в то время как отклонение от мишени ниже, чем у наиболее распространенного SpCas9, так что это более безопасный и эффективный инструмент редактирования генома.(3) The invention provides a type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium, which has a high cleavage efficiency at the same DNA site compared to the most common SpCas9, while the target deviation is lower than that of the most common SpCas9, so it is a safer and more efficient genome editing tool.

(4) В изобретении представлена система редактирования генома CRISPR/Cas9 типа II, полученная из Faecalibaculum rodentium, в которой РАМ, распознаваемый на уровне системы редактирования генома, имеет характеристики палиндрома, и поэтому мишени распределяются «хвост к хвосту» в геноме, который имеет более высокую плотность, чем SpCas9.(4) The invention provides a type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium, in which the PAM recognized at the level of the genome editing system has the characteristics of a palindrome, and therefore the targets are tail-to-tail distributed in the genome, which has more higher density than SpCas9.

(5) В изобретении представлена система редактирования генома CRISPR/Cas9 типа II, полученная из Faecalibaculum rodentium, которая обладает высокой гибкостью и может быть преобразована в базовый редактор и главный редактор, а также представляет собой инструмент редактирования генома, который можно широко применять при различных сценариях.(5) The invention provides a CRISPR/Cas9 type II genome editing system derived from Faecalibaculum rodentium, which is highly flexible and can be converted into a basic editor and a master editor, and is a genome editing tool that can be widely applied in various scenarios. .

КРАТКОЕ ОПИСАНИЕ ИЗОБРАЖЕНИЙBRIEF DESCRIPTION OF IMAGES

На Фигуре 1 представлена композиционная схема системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением.Figure 1 shows a compositional diagram of a type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium, in accordance with the invention.

На Фигуре 2 представлена структурная схема белка Cas9 системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением.Figure 2 is a structural diagram of the Cas9 protein of the type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium, in accordance with the invention.

На Фигуре 3 (3A-3F) представлена схема прогнозирования вторичной структуры РНК и схема оптимального каркаса sgPHK для направляющей молекулы РНК, распознаваемой системой редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением. На Фигуре 3А показана полноразмерная gPHK длиной 95 нуклеотидов. На Фигуре 3В показан каркас sgPHK длиной 91 нуклеотид, который включает 18 нуклеотидов последовательности прямого повтора и 69 нуклеотидов tracrPHK. На Фигуре 3С показан каркас sgPHK длиной 89 нуклеотидов, который включает 17 нуклеотидов последовательности прямого повтора и 68 нуклеотидов tracrPHK. На Фигуре 3D показан каркас sgPHK длиной 87 нуклеотидов, который включает 16 нуклеотидов последовательности прямого повтора и 67 нуклеотидов tracrPHK. На Фигуре 3Е показан каркас sgPHK длиной 85 нуклеотидов, который включает 15 нуклеотидов последовательности прямого повтора и 66 нуклеотидов tracrPHK. На Фигуре 3F показан каркас sgPHK длиной 83 нуклеотида, который включает 14 нуклеотидов последовательности прямого повтора и 65 нуклеотидов tracrPHK.Figure 3 (3A-3F) shows an RNA secondary structure prediction scheme and an optimal sgRNA scaffold scheme for a guide RNA molecule recognized by the type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium, in accordance with the invention. Figure 3A shows a full-length gRNA 95 nucleotides long. Figure 3B shows a 91 nucleotide long sgRNA backbone that includes 18 nucleotides of the direct repeat sequence and 69 nucleotides of tracrPHK. Figure 3C shows an 89 nt sgRNA backbone that includes 17 nt of the direct repeat sequence and 68 nt of tracrPHK. Figure 3D shows an 87 nt sgRNA backbone that includes 16 nt of the direct repeat sequence and 67 nt of tracrPHK. Figure 3E shows an 85 nt sgRNA backbone that includes 15 nt of the direct repeat sequence and 66 nt of tracrPHK. Figure 3F shows an 83 nt sgPHK backbone that includes 14 nt of the direct repeat sequence and 65 nt of tracrPHK.

На Фигуре 4 представлена диаграмма прокариотических последовательностей РАМ системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением.Figure 4 is a diagram of the PAM prokaryotic sequences of the type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium, in accordance with the invention.

На Фигуре 5 представлена схематическая диаграмма экспериментов по интерференции прокариот системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением.Figure 5 is a schematic diagram of the prokaryotic interference experiments of the type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium, in accordance with the invention.

На Фигуре 6 представлена схематическая диаграмма эукариотического расщепления системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением. Фигура 6А представляет собой гелевую диаграмму ОДН-ПЦР. Фигура 6 В представляет собой пик последовательности Сэнгера.Figure 6 is a schematic diagram of eukaryotic cleavage of a type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium, in accordance with the invention. Figure 6A is an ODN-PCR gel chart. Figure 6B is a Sanger sequence peak.

На Фигуре 7 представлена диаграмма, показывающую оптимальную длину sgPHK в системе редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением. Фигура 7А представляет собой график, показывающий эффективность расщепления sgPHK различной длины в сайте НЕК293 SITE2-T2. Фигура 7 В представляет собой график, показывающий эффективность расщепления sgPHK различной длины в сайте DNMT1-T3. Фигура 7С представляет собой график, показывающий эффективность расщепления sgPHK различной длины в сайте RNF2-T6.Figure 7 is a diagram showing the optimal length of sgRNA in the type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium according to the invention. Figure 7A is a graph showing the efficiency of sgRNA cleavage of various lengths at the HEK293 site of SITE2-T2. Figure 7B is a graph showing the efficiency of sgRNA cleavage of various lengths at the DNMT1-T3 site. Figure 7C is a graph showing the efficiency of sgRNA cleavage of various lengths at the RNF2-T6 site.

На Фигуре 8 представлена схематическая диаграмма, показывающая оптимальную длину последовательности распознавания sgPHK системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением.Figure 8 is a schematic diagram showing the optimal length of the sgRNA recognition sequence of a type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium according to the invention.

На Фигуре 9 представлена схематическая диаграмма, показывающая сравнение эффективности нацеливания и отклонения от мишени GUIDE-seq в системе редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением по сравнению с SpCas9.Figure 9 is a schematic diagram showing a comparison of the targeting efficiency and off-targeting of GUIDE-seq in the type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium according to the invention compared to SpCas9.

На Фигуре 10 представлена диаграмма, показывающая экспериментальные результаты базового редактора FrCas9-BE; при этом Фигура 10А представляет собой схематическую диаграмму и результаты подтверждения формы никазы FrCas9 с помощью ПЦР с точкой разрыва ОДН; Фигура 10В представляет собой окно редактирования для nFrCas9-BE4Gram; Фигура 10С представляет собой окно редактирования для nFrCas9-АВЕ7.10; Фигура 10D представляет собой диаграмму Венна патогенных мутаций в базе данных ClinVar, которая может быть однозначно скорректирована базовыми редакторами SpCas9 и FrCas9; на Фигуре 10Е показана эффективность редактирования С>Т для FrCas9-BE4Gam с одновременным использованием 2 sgPHK «хвост к хвосту».Figure 10 is a diagram showing the experimental results of the basic editor FrCas9-BE; while Figure 10A is a schematic diagram and the results of confirming the shape of the FrCas9 nickase by PCR with a breakpoint ODN; Figure 10B is an edit box for nFrCas9-BE4Gram; Figure 10C is an edit window for nFrCas9-ABE7.10; Figure 10D is a Venn diagram of pathogenic mutations in the ClinVar database, which can be unambiguously adjusted by the base editors SpCas9 and FrCas9; Figure 10E shows the efficiency of C>T editing for FrCas9-BE4Gam with simultaneous use of 2 sgRNA tail-to-tail.

На Фигуре 11 представлена диаграмма, показывающая распределение мишеней FrCas9 и SpCas9 в геноме человека, при этом на Фигуре 11А показано распределение 5'-GG-3' (представляющего SpCas9 РАМ) в геноме человека GRCh38; на Фигуре 11В показано распределение 5'-ТА-3' (представляющего FrCas9 РАМ) в геноме человека GRCh38.Figure 11 is a diagram showing the distribution of FrCas9 and SpCas9 targets in the human genome, with Figure 11A showing the distribution of 5'-GG-3' (representing SpCas9 PAM) in the human GRCh38 genome; Figure 11B shows the distribution of 5'-TA-3' (representing FrCas9 PAM) in the human GRCh38 genome.

На Фигуре 12 показано применение FrCa89-специфического, нацеленного на ТАТА-бокс, при CRISPR интерференции и CRISPR активации, где Фигура 12А представляет собой схематическую диаграмму ТАТА-бокса гена АВСА1, на который нацелен FrCas9; На Фигуре 12В показана CRISPR интерференция FrCas9 и SpCas9 путем нацеливания на ТАТА-бокс и CRISPR активация FrCas9 и SpCas9 путем нацеливания на ТАТА-бокс; На Фигуре 12С показана CRISPR активация FrCas9 и SpCas9 путем нацеливания на ТАТА-бокс.Figure 12 shows the use of FrCa89-specific TATA box-targeted CRISPR interference and CRISPR activation, where Figure 12A is a schematic diagram of the TATA box of the ABCA1 gene targeted by FrCas9; Figure 12B shows CRISPR interference of FrCas9 and SpCas9 by targeting the TATA box and CRISPR activation of FrCas9 and SpCas9 by targeting the TATA box; Figure 12C shows CRISPR activation of FrCas9 and SpCas9 by targeting the TATA box.

На Фигуре 13 представлена схема системы редактирования генома по технологии Праймированного Редактирования (Prime Editing).Figure 13 shows a diagram of a genome editing system using Prime Editing technology.

На Фигуре 14 показан эффект редактирования генома системы Праймированного Редактирования FrCas9-PE, верифицированный секвенированием по Сэнгеру, где измеренной последовательностью была CGAACACTCAAGGTAAT (SEQ ID NO: 33).Figure 14 shows the effect of editing the genome of the FrCas9-PE Primed Edit system verified by Sanger sequencing, where the measured sequence was CGAACACTCAAGGTAAT (SEQ ID NO: 33).

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION

Чтобы лучше объяснить цели, технические решения и преимущества изобретения, изобретение будет дополнительно описано ниже со ссылкой на конкретные варианты осуществления.In order to better explain the objects, technical solutions and advantages of the invention, the invention will be further described below with reference to specific embodiments.

Система редактирования генома CRISPR/Cas9 типа II, полученная из Faecalibaculum rodentium, включает белок Cas9, вспомогательные белки, CRISPR РНК и трансактивированную CRISPR РНК, как показано на Фигуре 1. Белок Cas9 представляет собой ДНК-эндонуклеазу и имеет аминокислотную последовательность, как показано в SEQ ID NO: 1, или аминокислотную последовательность, имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с аминокислотной последовательностью, как показано в SEQ ID NO: 1.The type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium includes the Cas9 protein, accessory proteins, CRISPR RNA and CRISPR transactivated RNA as shown in Figure 1. The Cas9 protein is a DNA endonuclease and has an amino acid sequence as shown in SEQ ID NO: 1, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98% or 99% homology with the amino acid sequence as shown in SEQ ID NO: 1.

В качестве предпочтительного варианта осуществления системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением белок Cas9 расщепляет двухцепочечную ДНК, комплементарную crPHK выше последовательности РАМ, с помощью нуклеазного домена, как показано на Фигуре 2. Нуклеазный домен выбран из HNH-подобного нуклеазного домена или RuvC-подобного нуклеазного домена.As a preferred embodiment of the Faecalibaculum rodentium derived CRISPR/Cas9 type II genome editing system according to the invention, the Cas9 protein cleaves double-stranded DNA complementary to crRNA upstream of the PAM sequence with a nuclease domain as shown in Figure 2. The nuclease domain is selected from HNH-like nuclease domain or RuvC-like nuclease domain.

Белок Cas9 (Faecalibaculum rodentium Cas9), сокращенно обозначаемый как белок FrCas9, содержит 1372 аминокислоты (SEQ ID NO: 1) и представляет собой многодоменную и многофункциональную ДНК-эндонуклеазу. Он эффективно расщепляет двухцепочечную ДНК, комплементарную sgPHK выше последовательности РАМ, с помощью нуклеазного домена, например, расщепляет цепь ДНК, комплементарную последовательности sgPHK, с помощью HNH-подобного нуклеазного домена или расщепляет некомплементарную цепь ДНК с помощью RuvC-подобного нуклеазного домена. При этом мутация Е в А в положении 796 аминокислоты приведет к образованию нуклеазы никазы; мутация N в А в положении 902 аминокислоты приведет к образованию нуклеазы никазы; мутация Н в А в положении 1010 аминокислоты приведет к образованию нуклеазы никазы; мутация D в А в положении 1013 аминокислоты приведет к образованию нуклеазы никазы; одновременная мутация Е в А в положении 796 аминокислоты и D в А в положении 1013 аминокислоты приведет к образованию нуклеазы Cas9, которая не обладает способностью к расщеплению, но сохраняет способность к связыванию.The Cas9 protein (Faecalibaculum rodentium Cas9), abbreviated as FrCas9 protein, contains 1372 amino acids (SEQ ID NO: 1) and is a multidomain and multifunctional DNA endonuclease. It effectively cleaves double-stranded DNA complementary to sgPHK upstream of the PAM sequence with a nuclease domain, for example, cleaves a DNA strand complementary to an sgPHK sequence with an HNH-like nuclease domain, or cleaves a non-complementary DNA strand with a RuvC-like nuclease domain. In this case, the mutation of E to A at position 796 of the amino acid will lead to the formation of the nickase nuclease; mutation of N to A at amino acid position 902 will result in the formation of nickase nuclease; mutation of H to A at amino acid position 1010 will result in the formation of nickase nuclease; a D to A mutation at amino acid position 1013 will result in the formation of the nickase nuclease; simultaneous mutation of E to A at amino acid position 796 and D to A at amino acid position 1013 will result in the formation of the Cas9 nuclease, which does not have the ability to cleave, but retains the ability to bind.

В качестве предпочтительного варианта осуществления системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением вспомогательные белки включают вспомогательный белок Cas1, вспомогательный белок Cas2 и вспомогательный белок Csn2. Вспомогательный белок Cas1 имеет аминокислотную последовательность, как показано в SEQ ID NO: 2, или аминокислотную последовательность, имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с аминокислотной последовательностью, как показано в SEQ ID NO: 2. Вспомогательный белок Cas2 имеет аминокислотную последовательность, как показано в SEQ ID NO: 3, или аминокислотную последовательность, имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с аминокислотной последовательностью, как показано в SEQ ID NO: 3. Вспомогательный белок Csn2 имеет аминокислотную последовательность, как показано в SEQ ID NO: 4, или аминокислотную последовательность, имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с аминокислотной последовательностью, как показано в SEQ ID NO: 4.As a preferred embodiment of the Faecalibaculum rodentium derived CRISPR/Cas9 type II genome editing system according to the invention, the accessory proteins include the Cas1 accessory protein, the Cas2 accessory protein, and the Csn2 accessory protein. The Cas1 accessory protein has an amino acid sequence as shown in SEQ ID NO: 2, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99% homology with the amino acid sequence as shown in SEQ ID NO: 2. Cas2 accessory protein has an amino acid sequence as shown in SEQ ID NO: 3, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98% or 99% homology with the amino acid sequence as shown in SEQ ID NO: 3. The Csn2 accessory protein has an amino acid sequence as shown in SEQ ID NO: 4, or an amino acid sequence having at least 80%, 85%, 90%, 95%, 98%, or 99 % homology to the amino acid sequence as shown in SEQ ID NO: 4.

Вспомогательные белки Casl, Cas2 и Csn2 в соответствии с изобретением участвуют в захвате экзогенного гена и созревании crPHK.The accessory proteins Casl, Cas2 and Csn2 according to the invention are involved in exogenous gene uptake and crRNA maturation.

В качестве предпочтительного варианта осуществления системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением CRISPR РНК создается путем транскрипции массива CRISPR. CRISPR РНК имеет последовательность РНК, как показано в SEQ ID NO: 5, или последовательность РНК, имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологии с последовательностью нуклеиновой кислоты, как показано в SEQ ID NO: 5. Массив CRISPR содержит последовательность прямого повтора и спейсерную последовательность. Последовательность прямого повтора представлена в SEQ ID NO: 6. Спейсерная последовательность представлена в SEQ ID NO: 7.As a preferred embodiment of the Faecalibaculum rodentium derived CRISPR/Cas9 type II genome editing system according to the invention, CRISPR RNA is generated by transcription of the CRISPR array. CRISPR RNA has an RNA sequence as shown in SEQ ID NO: 5, or an RNA sequence having at least 80%, 85%, 90%, 95%, 98% or 99% homology with the nucleic acid sequence as shown in SEQ ID NO: 5. The CRISPR array contains a direct repeat sequence and a spacer sequence. The direct repeat sequence is shown in SEQ ID NO: 6. The spacer sequence is shown in SEQ ID NO: 7.

CRISPR РНК (crPHK) в соответствии с изобретением направляет белок Cas на распознавание вторгшегося чужеродного генома в форме, комплементарной основаниям. Когда бактерии подвергаются вторжению бактериофага или вируса, короткий сегмент чужеродной ДНК интегрируется в качестве нового спейсера между последовательностями повтора спейсеров CRISPR в хромосоме хозяина, тем самым обеспечивая генетическую запись инфекции. Когда в организм снова вторгается чужеродный ген, массив CRISPR транскрибирует и продуцирует прекурсор crPHK (pre-crPHK) со спейсерной последовательностью на 5'-конце и длиной 30 пар оснований, комплементарной последовательности от чужеродного гена. 3'-конец представляет собой последовательность повтора длиной 36 пар оснований.The CRISPR RNA (crPHK) according to the invention directs the Cas protein to recognize an invading foreign genome in base-complementary form. When bacteria are invaded by a bacteriophage or virus, a short segment of foreign DNA integrates as a new spacer between CRISPR spacer repeat sequences on the host chromosome, thereby providing a genetic record of the infection. When the foreign gene invades the organism again, the CRISPR array transcribes and produces a crRNA precursor (pre-crPHK) with a 30 bp spacer sequence at the 5' end, complementary to the sequence from the foreign gene. The 3' end is a 36 bp repeat sequence.

В качестве предпочтительного варианта осуществления системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением трансактивированная CRISPR РНК содержит последовательность, комплементарную последовательности прямого повтора CRISPR РНК, как показано в SEQ ID NO: 8.As a preferred embodiment of the Faecalibaculum rodentium derived CRISPR/Cas9 type II genome editing system according to the invention, the transactivated CRISPR RNA contains a sequence complementary to the CRISPR RNA direct repeat sequence as shown in SEQ ID NO: 8.

Трансактивированная crPHK (tracrPHK) согласно настоящему изобретению представляет собой РНК, которая не кодируется белком, и участвует в созревании crPHK и образовании sgPHK. Под действием tracrPHK и нуклеазы Cas9 pre-crPHK удаляет от 0 до 16 нуклеотидов выше спейсерной последовательности и от 12 до 29 нуклеотидов ниже последовательности повтора с образованием зрелой crPHK и связывает tracrPHK с образованием комплекса tracrPHK-crPHK, который содержит часть, распознающую чужеродную последовательность ДНК, и имеет длину от 14 до 30 пар оснований. Тетрапетля (например, последовательность «GAAA», «TGAA» или «АААС») из четырех оснований может быть добавлена между нижним концом crPHK и верхним концом tracrPHK для связывания tracrPHK и crPHK, чтобы образовать sgPHK, содержащую две выпуклые и три дуплексные структуры по направлению к верхнему концу а также структуру "шпилька" по направлению к нижнему концу, которую можно дополнительно разделить на часть, которая распознает чужеродную последовательность ДНК, и часть каркаса.The transactivated crRNA (tracrPHK) according to the present invention is an RNA that is not encoded by a protein and is involved in the maturation of crRNA and the formation of sgRNA. Under the action of tracrPHK and Cas9 nuclease, pre-crPHK removes from 0 to 16 nucleotides upstream of the spacer sequence and from 12 to 29 nucleotides downstream of the repeat sequence to form mature crRNA and binds tracrPHK to form the tracrPHK-crPHK complex, which contains a portion that recognizes a foreign DNA sequence, and has a length of 14 to 30 base pairs. A tetraloop (e.g., the sequence "GAAA", "TGAA", or "AAAC") of four bases can be added between the lower end of crPHK and the upper end of tracrPHK to bind tracrPHK and crPHK to form an sgPHK containing two convex and three duplex structures in direction towards the upper end and a hairpin structure towards the lower end, which can be further divided into a part that recognizes a foreign DNA sequence and a scaffold part.

Расщепление эндонуклеазой можно дополнительно оптимизировать, регулируя длину части sgPHK, распознающей последовательность чужеродной ДНК, и длину tracrPHK. Ранние эксперименты по настоящему изобретению доказывают, что оптимальная длина части sgPHK, распознающей экзогенную последовательность ДНК, составляет 21 пару оснований, 22 пары оснований или 23 пары оснований (как показано на Фигуре 8), а оптимальная длина каркасной части - одна из следующих 5 типов, как показано на Фигурах 3 и 7: 91 нуклеотид (18 нуклеотидов прямого повтора crPHK+69 нуклеотидов tracrPHK), 89 нуклеотидов (17 нуклеотидов прямого повтора crPHK+68 нуклеотидов tracrPHK), 87 нуклеотидов (16 нуклеотидов прямого повтора crPHK+67 нуклеотидов). tracrPHK), 85 нуклеотидов (15 нуклеотидов прямого повтора crPHK+66 нуклеотидов tracrPHK) и 83 нуклеотида (14 нуклеотидов прямого повтора crPHK+65 нуклеотидов tracrPHK).Endonuclease digestion can be further optimized by adjusting the length of the foreign DNA sequence recognition portion of sgPHK and the length of tracrPHK. Early experiments of the present invention prove that the optimal length of the sgRNA portion that recognizes an exogenous DNA sequence is 21 base pairs, 22 base pairs, or 23 base pairs (as shown in Figure 8), and the optimal length of the framework portion is one of the following 5 types, as shown in Figures 3 and 7: 91 nt (18 nt crPHK direct repeat+69 tracrPHK nt), 89 nt (17 nt crPHK direct repeat+68 tracrPHK nt), 87 nt (16 crPHK direct repeat+67 nt). tracrPHK), 85 nt (15 nt crRNA direct repeat + 66 tracrPHK nucleotides), and 83 nt (14 crRNA direct repeat nt + 65 tracrPHK nucleotides).

В качестве предпочтительного варианта осуществления системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением система редактирования генома CRISPR/Cas9 типа II, полученная из Faecalibaculum rodentium, связывает или расщепляет структуры ДНК, участвующие в процессе редактирования генома.As a preferred embodiment of the Faecalibaculum rodentium derived CRISPR/Cas9 type II genome editing system according to the invention, the Faecalibaculum rodentium derived CRISPR/Cas9 type II genome editing system binds or cleaves DNA structures involved in the genome editing process.

В качестве предпочтительного варианта осуществления системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением ДНК представляет собой ДНК прокариот или эукариот.As a preferred embodiment of the type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium, according to the invention, the DNA is prokaryotic or eukaryotic DNA.

В некоторых вариантах осуществления изобретения FrCas9, согласно настоящему изобретению, может распознавать множество двухцепочечных разрывов ДНК (DSB), прилегающих к протоспейсеру (РАМ), непосредственно ниже последовательности нацеливания. Белку FrCas9 необходимы два важных фактора для распознавания последовательности нацеливания: один представляет собой нуклеотид, комплементарный спейсеру crPHK; а другой представляет собой последовательность мотива, смежного с протоспейсером (РАМ), примыкающую к комплементарной последовательности. Эксперимент по деплеции показывает, что FrCas9 оказывая эффект расщепления в прокариотической системе, и предварительно верифицирует третье и четвертое положения последовательности РАМ, распознаваемые этой недавно открытой системой CRISPR/Cas9 типа II, которые представляют собой ТА, как показано на Фигуре 4. Дополнительно подтверждено экспериментом по интерференции, что РАМ ниже последовательности нацеливания, распознаваемой FrCas9, представляет собой 5'-NNTA-3', как показано на Фигуре 5. Все вышеперечисленные РАМ верифицированы посредством эксперимента с эукариотами, как показано на Фигуре 6. Путем искусственного конструирования спейсерной последовательности в crPHK, эта система CRISPR-Cas9 может нацеливаться почти на все последовательности ДНК в геноме, представляющие интерес, производя сайт-специфический двухцепочечный разрыв с тупым концом (DSB). Восстановление DSB негомологичными концами приводит к небольшим случайным вставками/удалениями (инделам) в сайте расщепления для инактивации интересующего гена. В качестве альтернативы, с помощью высокоточной гомологичной репарации точные геномные модификации в сайте DSB могут быть выполнены с использованием шаблонов гомологичной репарации.In some embodiments, FrCas9 of the present invention can recognize a plurality of DNA double-strand breaks (DSBs) adjacent to a protospacer (PAM) immediately below the targeting sequence. The FrCas9 protein requires two important factors to recognize a targeting sequence: one is a nucleotide complementary to the crRNA spacer; and the other is a protospacer adjacent motif (PAM) sequence adjacent to a complementary sequence. The depletion experiment shows that FrCas9 has a cleavage effect in the prokaryotic system and tentatively verifies the third and fourth positions of the PAM sequence recognized by this newly discovered type II CRISPR/Cas9 system, which are TA, as shown in Figure 4. Further confirmed by experiment on interference that the PAM downstream of the targeting sequence recognized by FrCas9 is 5'-NNTA-3' as shown in Figure 5. All of the above PAMs were verified by eukaryotic experiment as shown in Figure 6. By artificially constructing a spacer sequence in crRNA, this CRISPR-Cas9 system can target almost all DNA sequences in the genome of interest, producing a site-specific blunt-ended double-strand break (DSB). DSB repair with non-homologous ends results in small random insertions/deletions (indels) at the cleavage site to inactivate the gene of interest. Alternatively, with high fidelity homologous repair, precise genomic modifications at the DSB site can be performed using homologous repair templates.

Большинство генетических заболеваний человека представляют собой мутации с одним основанием, которые не поддаются лечению традиционными способами. Базовый редактор - один из новейших и наиболее эффективных способов точного редактирования генома. Он характеризуется использованием белка CRISPR-Cas в форме разрыва для обнаружения специфических ДНК-мишеней и использованием ДНК-дезаминазы для модификации и мутации этой ДНК-мишени с целью исправления пораженных оснований без образования двухцепочечной фрагментации ДНК. В некоторых вариантах осуществления комбинация Е796А nFrCas9 с оптимизированным редактором цитидиновых оснований четвертого поколения BE4Gam может успешно сконструировать редактор цитозиновых оснований Е796А nFrCas9-BEGam (СВЕ), так, что пара оснований C:G в ДНК может быть мутирована в Т:А. Комбинация Е796А nFrCas9 с редактором адениновых оснований 7-го поколения АВЕ7.10 может успешно сконструировать редактор адениновых оснований Е796А nFrCas9-BABE7.10 (ABE), так, что пара оснований А:Т в ДНК может быть мутирована в G:C.Most human genetic diseases are single base mutations that are not treatable by conventional means. The base editor is one of the newest and most efficient ways to precisely edit the genome. It is characterized by the use of a break-shaped CRISPR-Cas protein to locate specific target DNAs and the use of DNA deaminase to modify and mutate this target DNA to repair damaged bases without generating double-stranded DNA fragmentation. In some embodiments, the combination of E796A nFrCas9 with the optimized fourth generation cytidine base editor BE4Gam can successfully construct the E796A nFrCas9-BEGam cytosine base editor (CBE) such that the C:G base pair in DNA can be mutated to T:A. The combination of E796A nFrCas9 with the 7th generation adenine base editor ABE7.10 can successfully construct the E796A nFrCas9-BABE7.10 adenine base editor (ABE) so that the DNA A:T base pair can be mutated to G:C.

В некоторых вариантах осуществления специфический РАМ FrCas9 по настоящему изобретению представляет собой NNTA со специфическим нацеливанием на ТАТА-бокс (один из элементов, составляющих эукариотический промотор), так, что FrCas9 специфически нацеливается на ТАТА-бокс для создания уникального эффекта CRISPR интерференции (CRISPRi) / CRISPR активации (CRISPRa). Из них CRISPRi может быть достигнута путем прямого нацеливания на расщепление ТАТА-бокса с помощью активной формы FrCas9 и разрушение ТАТА-бокса или путем прямого связывания с ТАТА-боксом с помощью dFrCas9 (т.е., мертвого Cas9) без осуществления расщепления. CRISPRa может быть достигнута, помимо прочего, путем нацеливания dFrCas9-VP64 на сайт ТАТА-бокса.In some embodiments, the FrCas9 specific PAM of the present invention is an NNTA specifically targeted to the TATA box (one of the elements that make up the eukaryotic promoter), such that FrCas9 specifically targets the TATA box to create a unique CRISPR interference effect (CRISPRi)/ CRISPR activation (CRISPRa). Of these, CRISPRi can be achieved by directly targeting the cleavage of the TATA box with the active form of FrCas9 and destroying the TATA box, or by direct binding to the TATA box with dFrCas9 (i.e., dead Cas9) without performing cleavage. CRISPRa can be achieved, among other things, by targeting dFrCas9-VP64 to the site of the TATA box.

Праймированное Редактирование (РЕ) - это совершенно новый инструмент для точного редактирования генома. С помощью этой технологии можно осуществить свободную замену единого основания и точную вставку и удаление нескольких оснований, значительно уменьшая вредные побочные продукты, создаваемые инделами в процессе редактирования генома, и значительно повышая точность редактирования. Принято считать, что это является значительным достижением в редактировании генома. В некоторых вариантах осуществления FrCas9 по настоящему изобретению слит с обратной транскриптазой, и соответствующая regPHK может быть сконструирована в соответствии с ее последовательностью РАМ для создания системы редактирования генома FrCas9-PE. В частности, две последовательности добавляются к последовательности regPHK на 3'-конце. Первая последовательность представляет собой сайт связывания праймера (PBS), который может быть комплементарен концу разорванной цепи-мишени ДНК для инициации процесса обратной транскрипции, а вторая последовательность представляет собой матрицу обратной транскрипции (RT матрица), которая осуществляет мутацию точки-мишени или мутацию вставки/удаления для достижения точного редактирования генома.Prime Editing (PE) is a brand new tool for precise genome editing. With this technology, free single base substitution and precise insertion and deletion of multiple bases can be realized, greatly reducing the harmful by-products created by indels in the genome editing process and greatly improving editing accuracy. It is generally accepted that this is a significant achievement in genome editing. In some embodiments, the FrCas9 of the present invention is fused to a reverse transcriptase and the corresponding regRNA can be engineered according to its PAM sequence to create an FrCas9-PE genome editing system. In particular, two sequences are added to the regPHK sequence at the 3' end. The first sequence is a primer binding site (PBS) that can be complementary to the end of a broken target DNA strand to initiate the reverse transcription process, and the second sequence is a reverse transcription template (RT template) that performs a target point or insertion mutation. deletions to achieve precise genome editing.

Еще одной целью изобретения является обеспечение применения системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, для редактирования прокариотических или эукариотических генов, CRISPR активации или CRISPR интерференции.Yet another object of the invention is to provide the use of a type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium for prokaryotic or eukaryotic gene editing, CRISPR activation or CRISPR interference.

В качестве предпочтительного варианта применения в соответствии с изобретением система редактирования генома CRISPR/Cas9 типа II, полученная из Faecalibaculum rodentium, используется для связывания или расщепления структур ДНК, участвующих на уровне ДНК.As a preferred application according to the invention, a type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium is used to bind or cleave DNA structures involved at the DNA level.

Пример 1Example 1

В примере была спрогнозирована вторичная структура РНК направляющей молекулы РНК, распознаваемая системой редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением, структура РНК после транскрипции tracrPHK и повтора была спрогнозирована с помощью моделирования процесса связывания двух РНК, полученная вторичная структура РНК показана на Фигуре 3.In the example, the RNA secondary structure of the RNA guide molecule recognized by the CRISPR/Cas9 type II genome editing system derived from Faecalibaculum rodentium according to the invention was predicted, the RNA structure after tracrPHK transcription and repeat was predicted by modeling the two RNA binding process, the resulting secondary the RNA structure is shown in Figure 3.

(1) Материалы: спрогнозированные последовательности tracrPHK и повторов, а также спрогнозированные последовательности анти-повторов.(1) Materials: predicted tracrRNA and repeat sequences, and predicted anti-repeat sequences.

(2) Программное обеспечение: NUPACK (http://www.nupack.org/partition/new)(2) Software: NUPACK (http://www.nupack.org/partition/new)

(3) Способ прогнозирования: процесс взаимодействия 1 мкл каждой из двух РНК при 37°С in vitro моделировался с помощью онлайн-приложения NUPACK, в результате была спрогнозирована вторичная структура полученной композиции РНК для получения вторичной структуры РНК, как показано на Фигуре 2.(3) Prediction method: The interaction process of 1 µl of each of two RNAs at 37°C in vitro was simulated using the NUPACK online application, as a result, the secondary structure of the resulting RNA composition was predicted to obtain the secondary structure of RNA, as shown in Figure 2.

Как показано на на Фигуре 3, pre-crPHK удаляла от 0 до 16 нуклеотидов по выше спейсерной последовательности и от 12 до 29 нуклеотидов ниже последовательности повтора под действием tracrPHK и нуклеазы Cas9 с образованием зрелой crPHK, которая сливалась с tracrPHK с образованием комплекса tracrPHK-crPHK, содержащего экзогенную последовательность ДНК, комплементарную спейсерной последовательности, при этом длина последовательности составляла от 14 до 30 пар оснований. Они были соединены с образованием sgPHK путем добавления тетрапетли из четырех оснований между нижним концом crPHK и верхним концом tracrPHK, содержащей две выпуклые и три дуплексные структуры по направлению к верхнему концу и три структуры "шпилька" по направлению к нижнему концу.As shown in Figure 3, pre-crRNA removed 0 to 16 nucleotides upstream of the spacer sequence and 12 to 29 nucleotides downstream of the repeat sequence by tracrPHK and Cas9 nuclease to form mature crRNA, which fused to tracrPHK to form the tracrPHK-crPHK complex. containing an exogenous DNA sequence complementary to the spacer sequence, while the length of the sequence ranged from 14 to 30 base pairs. They were linked to form sgRNA by adding a four-base tetraloop between the lower end of the crRNA and the upper end of the tracrRNA, containing two convex and three duplex structures towards the upper end and three hairpin structures towards the lower end.

Пример 2Example 2

В примере мотив, смежный с протоспейсером (РАМ), распознаваемый системой редактирования генома CRTSPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в прокариотической системе представляет собой 5'-NNTA-3'.In an example, the protospacer adjacent motif (PAM) recognized by the CRTSPR/Cas9 type II genome editing system derived from Faecalibaculum rodentium is 5'-NNTA-3' in the prokaryotic system.

(1) Материалы: гены, относящиеся к системе редактирования генома CRISPR/Cas9, спрогнозированные путем вышеописанной реализации.(1) Materials: genes related to the CRISPR/Cas9 genome editing system predicted by the implementation described above.

(2) Способ проверки: в этом примере была сконструирована прокариотическая система проверки в отношении системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением для проверки эффекта ее расщепления и предварительного исследования распознанной последовательности РАМ с помощью второго поколения технологии секвенирования, при этом результат показан на Фигуре 4.(2) Inspection method: In this example, a prokaryotic inspection system was constructed with respect to the CRISPR/Cas9 type II genome editing system obtained from Faecalibaculum rodentium according to the invention to test the effect of its cleavage and preliminary study of the recognized PAM sequence by the second generation of technology sequencing, with the result shown in Figure 4.

Подробные протоколы приведены ниже.Detailed protocols are given below.

(a) Систему редактирования генома CRISPR/Cas9 типа II, полученного из Faecalibaculum rodentium (содержащую эндонуклеазу Cas9, вспомогательные белки Casl, Cas2, Csn2, массив CRISPR и некодирующую РНК tracrPHK), в соответствии с изобретением встраивали в вектор pACYC184, где белок Cas9 был подвергнут оптимизации кодонов Escherichia coli. Последовательности естественных спейсеров и последовательности спейсеров в библиотеке добавляли в массив CRISPR, а сильный гетерологичный промотор J23119 добавляли к белку Cas9 и массиву CRISPR для конструирования прокариотической экспрессионной плазмиды pACYC184-FrCas9.(a) The CRISPR/Cas9 type II genome editing system derived from Faecalibaculum rodentium (comprising Cas9 endonuclease, Casl, Cas2, Csn2 accessory proteins, CRISPR array and tracrPHK non-coding RNA) according to the invention was inserted into the pACYC184 vector, where the Cas9 protein was subjected to Escherichia coli codon optimization. The natural spacer sequences and the spacer sequences in the library were added to the CRISPR array, and the strong heterologous J23119 promoter was added to the Cas9 protein and the CRISPR array to construct the pACYC184-FrCas9 prokaryotic expression plasmid.

(b) Семь случайных оснований (всего 16 384 вставки) были добавлены в спейсерную последовательность 3' библиотеки. Два сайта рестрикционных эндонуклеаз EcoRI и Ncol были выбраны из поликлонального MCS вектора pUC19. Библиотеку клонировали в вектор и конструировали плазмиду библиотеки мишени.(b) Seven random bases (total 16,384 inserts) were added to the 3' spacer sequence of the library. The two restriction endonuclease sites EcoRI and Ncol were selected from the polyclonal MCS vector pUC19. The library was cloned into a vector and a target library plasmid was constructed.

(c) Плазмиду, содержащую pACYC184-FrCas9 или пустую pACYC184 и библиотеку мишени, коэлектрически трансфицировали в Е. coli DH5a. После восстановления функций при 25°С в течение 2 ч их равномерно распределяли в среде SOB, обладающей двойной резистентностью к ампициллину натрия (100 мкг/мл) и хлорамфениколу (34 мкг/мл) для инкубации при 25°С в течение 30 часов, при этом плазмиду собирали щелочным лизисом.(c) A plasmid containing pACYC184-FrCas9 or empty pACYC184 and a target library was coelectrically transfected into E. coli DH5a. After restoration of functions at 25°C for 2 h, they were evenly distributed in SOB medium, which has dual resistance to ampicillin sodium (100 μg/ml) and chloramphenicol (34 μg/ml) for incubation at 25°C for 30 hours, at The plasmid was then harvested by alkaline lysis.

(d) Была проведена ПЦР-амплификация на сайте, содержащем спейсерную последовательность и семь случайных оснований. Вторичное секвенирование проводили на двух концах продукта ПЦР путем добавления линкера. Рассчитывали значение деплеции РАМ (PPDV) относительно группы контроля отсутствия нагрузки. Последовательность РАМ системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, была создана с использованием Weblogo, где последовательность РАМ представляет собой 5'-NNTA-3'.(d) PCR amplification was performed on a site containing a spacer sequence and seven random bases. Secondary sequencing was performed at the two ends of the PCR product by adding a linker. PAM depletion value (PPDV) was calculated relative to the no-load control group. The PAM sequence of the CRISPR/Cas9 type II genome editing system derived from Faecalibaculum rodentium was generated using Weblogo, where the PAM sequence is 5'-NNTA-3'.

Фигура 3 представляет собой схематическую диаграмму консервативной последовательности РАМ, распознаваемой системой редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением в прокариотической системе. Для расчета значения деплеции РАМ (PPDV) относительно группы контроля отсутствия нагрузки был выполнен анализ секвенирования второго поколения ДНК библиотеки, полученной в ходе эксперимента по деплеции. Последовательность РАМ FrCas9, сгенерированная Weblogo, представляет собой 5'-NNTA-3'.Figure 3 is a schematic diagram of a conserved PAM sequence recognized by the Faecalibaculum rodentium derived CRISPR/Cas9 type II genome editing system according to the invention in a prokaryotic system. To calculate the PAM depletion value (PPDV) relative to the no-load control group, a second-generation sequencing analysis of the DNA library obtained from the depletion experiment was performed. The FrCas9 PAM sequence generated by Weblogo is 5'-NNTA-3'.

Пример 3Example 3

В примере посредством эксперимента по интерференции был верифицирован мотив, смежный с протоспейсером (РАМ), распознаваемый в системе редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением, при этом были определены его способность к расщеплению на прокариотическом уровне и потенциальная способность к редактированию генома в эукариотах. Результаты экспериментов по интерференции показаны на Фигуре 5, при этом схематические диаграммы различных возможных последовательностей РАМ, распознаваемых системой редактирования генома CRISPR7Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением показаны на Фигуре 5.In the example, the motif adjacent to the protospacer (PAM) recognized in the CRISPR/Cas9 type II genome editing system obtained from Faecalibaculum rodentium according to the invention was verified by means of an interference experiment, and its cleavage ability at the prokaryotic level and potential ability to edit the genome in eukaryotes. The results of the interference experiments are shown in Figure 5, with schematic diagrams of various possible PAM sequences recognized by the type II CRISPR7Cas9 genome editing system derived from Faecalibaculum rodentium according to the invention shown in Figure 5.

(1) Материалы: pACYC184-FrCas9, плазмида библиотеки мишени, полученная в примере 2, и предварительно распознанный РАМ.(1) Materials: pACYC184-FrCas9, target library plasmid prepared in Example 2, and pre-recognized PAM.

(2) Способ проверки: в этом примере мотив, смежный с протоспейсером (РАМ), распознаваемый системой редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением в прокариотической системе, дополнительно определяли с помощью интерференционного эксперимента.(2) Test method: In this example, the protospacer adjacent motif (PAM) recognized by the CRISPR/Cas9 type II genome editing system obtained from Faecalibaculum rodentium according to the invention in the prokaryotic system was further determined by an interference experiment.

Подробные протоколы приведены ниже.Detailed protocols are given below.

(a) Всего было получено 16 комбинированных последовательностей путем добавления NNTA в положение 3' спейсерной последовательности, а плазмида-мишень была сконструирована путем клонирования в pUC19 через эндонуклеазные сайты рестрикции EcoRI и NcoI соответственно.(a) A total of 16 combined sequences were generated by adding NNTA at position 3' of the spacer sequence, and the target plasmid was constructed by cloning into pUC19 through the EcoRI and NcoI endonuclease restriction sites, respectively.

(b) 16 плазмид-мишеней соответственно трансфицировали в электрогенную компетентность Е. coli DH5a, содержащую FrCas9-родственные локусы, при этом плазмиды постепенно разбавляли после восстановления функций при 25°С в течение 2 часов. Плазм иды-мишени инкубировали в течение ночи при 25°С в среде SOB, обладающей двойной резистентностью к ампициллину натрия (100 мкг/мл) и хлорамфениколу (34 мкг/мл) с помощью дот-блоттинга, чтобы определить количество моноклональных бактерий.(b) 16 target plasmids, respectively, were transfected into E. coli DH5a electrogenic competence containing FrCas9-related loci, with the plasmids gradually diluted after recovery at 25° C. for 2 hours. Target id plasmas were incubated overnight at 25° C. in SOB media dually resistant to ampicillin sodium (100 μg/mL) and chloramphenicol (34 μg/mL) by dot blotting to determine the number of monoclonal bacteria.

Фигура 5 представляет собой схематическую диаграмму эксперимента по интерференции системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением. На основе NNTA, обнаруженного в эксперименте по деплеции, было сконструировано 16 плазмид-мишеней с различными комбинациями NN. Число моноклональных колоний наблюдали посредством интерференционного эксперимента. На Фигуре 5А крайний левый столбец был обозначен как одиночный FrCas9, а правая сторона была обозначена как плазмида-мишень, на которую нацелено расщепление FrCas9. Результаты показали, что количество колоний в правом столбце уменьшилось. Фигура 5В представляет собой статистическую диаграмму эффектов расщепления множества последовательностей РАМ, распознаваемых системой редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением и иллюстрирует, что количество колониеобразующих единиц (KOE/CFU) плазмид-мишеней 14 различных комбинаций NN снижено по сравнению с контрольной группой. Приведенные выше результаты показали, что мотив, смежный с протоспейсером (РАМ), распознанный недавно открытой системой CRISPR/Cas9 в прокариотической системе методом интерференционного эксперимента, представлял собой 5'-NNTA-3' (N представляет собой любое основание, выбранное из группы, состоящей из А, Т, С и G).Figure 5 is a schematic diagram of an interference experiment of a type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium in accordance with the invention. Based on the NNTA found in the depletion experiment, 16 target plasmids were constructed with different combinations of NN. The number of monoclonal colonies was observed by means of an interference experiment. In Figure 5A, the leftmost column was labeled single FrCas9 and the right side was labeled the target plasmid targeted by FrCas9 cleavage. The results showed that the number of colonies in the right column decreased. Figure 5B is a statistical diagram of the cleavage effects of multiple PAM sequences recognized by the CRISPR/Cas9 type II genome editing system derived from Faecalibaculum rodentium according to the invention and illustrates that the number of colony forming units (KOE/CFU) of target plasmids of 14 different combinations of NN reduced compared to the control group. The above results showed that the protospacer adjacent motif (PAM) recognized by the newly discovered CRISPR/Cas9 system in the prokaryotic system by interference experiment was 5'-NNTA-3' (N is any base selected from the group consisting of from A, T, C and G).

Пример 4Example 4

В примере посредством экспериментов по интерференции был верифицирован диапазон tracrPHK, необходимый для расщепления последовательностей-мишеней ДНК в системе редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением, и результаты экспериментов по интерференции показаны на Фигуре 5С.In the example, the range of tracrRNA required for cleavage of target DNA sequences in the Faecalibaculum rodentium derived CRISPR/Cas9 type II genome editing system according to the invention was verified by interference experiments, and the results of the interference experiments are shown in Figure 5C.

(1) Материалы: pACYC 184-FrCas9, плазмида-мишень, предварительно распознанный РАМ, полученный в примере 2.(1) Materials: pACYC 184-FrCas9, target plasmid, previously recognized by PAM prepared in Example 2.

(2) Способ проверки: в этом примере диапазон tracrPHK, необходимый для расщепления последовательности-мишени ДНК, был дополнительно определен с помощью системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в прокариотической системе.(2) Verification Method: In this example, the range of tracrRNA required for cleavage of the target DNA sequence was further determined using the Faecalibaculum rodentium-derived CRISPR/Cas9 type II genome editing system in a prokaryotic system.

Подробные протоколы приведены ниже.Detailed protocols are given below.

(а) В общей сложности шесть генных последовательностей всех возможных некодирующих областей в Faecalibaculum rodentium дикого типа были клонированы в плазмиду-мишень методом клонирования Гибсона для конструирования плазмид-мишеней NC от 1 до 6, где NC6 образуется путем сплайсинга полной длины некодирующих областей, a NC от 1 до 5, соответственно, представляют возможные некодирующие области сегментов с первого по пятый. В каждую плазмиду NC был добавлен сильный гетерологичный промотор J23119 по направлению к верхней части некодирующей области, где "+" представлял собой прямую некодирующую область, а "-" представлял собой обратную некодирующую область, соответственно;(a) A total of six gene sequences of all possible non-coding regions in wild-type Faecalibaculum rodentium were cloned into the target plasmid by Gibson cloning to construct target plasmids NC 1 to 6, where NC6 is generated by splicing the full length of the non-coding regions, and NC 1 to 5, respectively, represent the possible non-coding regions of segments one through five. A strong heterologous J23119 promoter was added to each NC plasmid towards the top of the non-coding region, where "+" was the forward non-coding region and "-" was the reverse non-coding region, respectively;

(b) Из pACYC184-FrCas9, полученного в Примере 2, были удалены все возможные некодирующие области с помощью метода гомологичной рекомбинации ПЦР, а белок, родственный CRISPR, и последовательность генов массива CRISPR были сохранены, таким образом сконструировав pACYC184-ΔFrCas9;(b) From pACYC184-FrCas9 obtained in Example 2, all possible non-coding regions were removed by the PCR homologous recombination method, and the CRISPR-related protein and CRISPR array gene sequence were preserved, thus constructing pACYC184-ΔFrCas9;

(c) 12 плазмид-мишеней соответственно трансфицировали в электрогенную компетентность E.coli DH5a, содержащую pACYC184-ΔFrCas9, при этом плазмиды постепенно разбавляли после восстановления функций при 25°С в течение 2 часов. Плазмиды-мишени инкубировали в течение ночи при 25°С в среде SOB, обладающий двойной резистентностью к ампициллину натрия (100 мкг/мл) и хлорамфениколу (34 мкг/ мл) с помощью дот-блоттинга, чтобы определить количество моноклональных бактерий.(c) 12 target plasmids, respectively, were transfected into E. coli DH5a electrogenic competence containing pACYC184-ΔFrCas9, with the plasmids gradually diluted after recovery at 25° C. for 2 hours. Target plasmids were incubated overnight at 25° C. in SOB media dually resistant to ampicillin sodium (100 μg/mL) and chloramphenicol (34 μg/mL) by dot blotting to determine the number of monoclonal bacteria.

Фигура 5С представляет собой схематическую диаграмму эксперимента по интерференции системы редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением при этом результаты показывают, что моноклональные колонии NC1 и NC6 были значительно меньше, чем колонии NC от 2 до 5, что указывает на то, что альтернативная некодирующая область в первом сегменте может оказать помощь FrCas9 в эффективном и нацеленном расщеплении последовательностей ДНК в Е. coli.Figure 5C is a schematic diagram of an interference experiment of the type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium according to the invention, the results show that the monoclonal colonies of NC1 and NC6 were significantly smaller than the colonies of NC from 2 to 5, indicating that an alternative non-coding region in the first segment may assist FrCas9 in efficient and targeted cleavage of DNA sequences in E. coli.

Пример 5Example 5

В примере посредством эксперимента с ОДН была верифицирована способность расщеплять последовательности-мишени ДНК в эукариотических клетках в системе редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium. Результат ОДН-ПЦР показан на диаграмме на Фигуре 6А, а результат секвенирования по Сэнгеру показан на диаграмме на Фигуре 6В.In an example, the ability to cleave target DNA sequences in eukaryotic cells in a type II CRISPR/Cas9 genome editing system derived from Faecalibaculum rodentium was verified through an ODN experiment. The ODN-PCR result is plotted in Figure 6A and the Sanger sequencing result is plotted in Figure 6B.

(1) Материалы: все аминокислотные последовательности, последовательности матрицы CRISPR, последовательности tracrPHK и распознанный РАМ редактируемого гена Faecalibaculum rodentium, полученные в примерах 1-4.(1) Materials: All amino acid sequences, CRISPR template sequences, tracrPHK sequences, and the recognized PAM of the Faecalibaculum rodentium edited gene obtained in Examples 1-4.

(2) Способ проверки: в этом примере способность расщеплять последовательности-мишени ДНК в эукариотических клетках была верифицирована посредством эксперимента с ОДН в системе редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium.(2) Verification Method: In this example, the ability to cleave target DNA sequences in eukaryotic cells was verified by ODN experiment in the CRISPR/Cas9 type II genome editing system derived from Faecalibaculum rodentium.

Подробные протоколы приведены ниже.Detailed protocols are given below.

(a) Оптимизированная последовательность белка FrCas9 человека была синтезирована и клонирована в эукариотический вектор РХ330 для создания плазмиды PX330-FrCas9.(a) An optimized human FrCas9 protein sequence was synthesized and cloned into the PX330 eukaryotic vector to create the PX330-FrCas9 plasmid.

(b) 30 пар оснований по направлению к верхнему концу NGTA, NATA, NCTA и NTTA гена RNF2 человека были выбраны в качестве последовательности-мишени. Массив CRISPR был сконструирован методом Гибсона. Сильный промотор эукариот человека U6 добавляли выше матрицы CRISPR, чтобы сконструировать плазмиду матрицы РХ330-FrCas9.(b) 30 base pairs upstream of the NGTA, NATA, NCTA and NTTA of the human RNF2 gene were chosen as the target sequence. The CRISPR array was constructed using the Gibson method. The strong human eukaryotic U6 promoter was added upstream of the CRISPR template to construct the PX330-FrCas9 template plasmid.

(c) Эукариотический сильный промотор U6, полученный от мыши, добавляли выше tracrPHK, показанной в примере 4, для конструирования плазмиды PX330-FrCas9-array-tracrRNA.(c) A mouse-derived eukaryotic strong U6 promoter was added upstream of the tracrRNA shown in Example 4 to construct the PX330-FrCas9-array-tracrRNA plasmid.

(d) Плазмида PX330-FrCas9-array-tracrRNA, нацеленная на различные сайты генов, сконструированная, как указано выше, с 2,5 мкг и 1,5 мкл ОДН, была электрически трансфицирована в клетки НЕК293Т в хорошем состоянии. Все клетки собирали через 72 часа для выделения ДНК.(d) PX330-FrCas9-array-tracrRNA targeting various gene sites, constructed as above with 2.5 μg and 1.5 μl ODN, was electrically transfected into HEK293T cells in good condition. All cells were harvested after 72 hours for DNA extraction.

(e) ОДН-ПЦР выполняли путем конструирования пары праймеров рядом с сайтом гена-мишени RNF2 и на последовательности ОДН, а также проводили электрофорез в агарозном геле для наблюдения за наличием полосы чтобы предварительно определить, произошло ли расщепление мишени или нет.(e) ODN-PCR was performed by designing a primer pair adjacent to the RNF2 target gene site and on the ODN sequence, and agarose gel electrophoresis was performed to observe the presence of a band to preliminarily determine whether target cleavage occurred or not.

(f) Посредством секвенирования по Сэнгеру была верифицирована успешная вставка ОДН в сайт-мишень и было подтверждено, что FrCas9 обладает способностью редактировать ДНК-мишень в эукариотических клетках.(f) Successful insertion of ODN into the target site was verified by Sanger sequencing and FrCas9 was confirmed to have the ability to edit target DNA in eukaryotic cells.

Результаты ОДН-ПЦР показаны на Фигуре 6А. NGTA, NATA, NCTA и NTTA имели полосы-мишени правильного размера. Как показано на Фигуре 8 с результатами секвенирования по Сэнгеру, положение вставки ОДН происходило в 3-4 пары оснований по направлению к верхнему концу РАМ, что указывает на то, что диапазон расщепления последовательности гена-мишени в FrCas9 соответствовал таковому в предыдущем SpCas9.The results of ODN-PCR are shown in Figure 6A. NGTA, NATA, NCTA and NTTA had target strips of the correct size. As shown in Figure 8 with Sanger sequencing results, the position of the ODN insert occurred 3-4 base pairs towards the upper end of the PAM, indicating that the cleavage range of the target gene sequence in FrCas9 was consistent with that of previous SpCas9.

Пример 6Example 6

В примере посредством эксперимента с ОДН была верифицирована оптимальная длина части распознавания sgPHK в эукариотических клетках в системе редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением, и результаты показаны на Фигуре 7.In the example, the optimal length of the sgRNA recognition portion in eukaryotic cells in the CRISPR/Cas9 type II genome editing system derived from Faecalibaculum rodentium according to the invention was verified by ODN experiment, and the results are shown in Figure 7.

(1) Материалы: все аминокислотные последовательности, последовательности sgPHK и распознанные РАМ редактируемого гена Faecalibaculum rodentium, полученные в примерах 1-4;(1) Materials: all amino acid sequences, sgPHK sequences and recognized PAMs of the edited Faecalibaculum rodentium gene obtained in Examples 1-4;

(2) Способ проверки: в этом примере оптимальная длина части распознавания sgPHK в эукариотических клетках в системе редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, была верифицирована посредством эксперимента ОДН.(2) Verification Method: In this example, the optimal length of the sgRNA recognition portion in eukaryotic cells in the CRISPR/Cas9 type II genome editing system derived from Faecalibaculum rodentium was verified by ODN experiment.

Подробные протоколы приведены ниже.Detailed protocols are given below.

(a) Оптимизированная последовательность белка FrCas9, полученного от человека, была синтезирована и клонирована в эукариотический вектор РХ330 для конструирования плазмиды PX330-FrCas9.(a) An optimized human-derived FrCas9 protein sequence was synthesized and cloned into the PX330 eukaryotic vector to construct the PX330-FrCas9 plasmid.

(b) В качестве последовательности нацеливания была выбрана последовательность-мишень в 30 пар оснований выше GGTA рядом с сайтом-мишенью SpCas9, которая, как было обнаружено в предыдущем исследовании, обладала хорошим эффектом расщепления, при этом sgPHK с длиной распознавания от 19 до 23 пар оснований была сконструирована по методу Гибсона. Сильный промотор эукариот человека U6 добавляли по направлению к верхнему концу sgPHK для конструирования плазмиды PX330-FrCas9-sgRNA.(b) A target sequence 30 base pairs upstream of GGTA near the SpCas9 target site was chosen as the targeting sequence, which was found in a previous study to have a good cleavage effect, with sgRNA with a recognition length of 19 to 23 pairs bases was constructed according to the Gibson method. The strong human eukaryotic U6 promoter was added towards the upper end of the sgRNA to construct the PX330-FrCas9-sgRNA plasmid.

(c) Плазмида PX330-FrCas9-sgRNA, нацеленная на различные сайты генов, сконструированная, как указано выше, с использованием 2,5 мкг и 1,5 мкл ОДН, была электрически трансфицирована в клетки НЕК293Т в хорошем состоянии. Все клетки собирали через 72 часа для выделения ДНК.(c) PX330-FrCas9-sgRNA targeting different gene sites, constructed as above using 2.5 μg and 1.5 μl ODN, was electrically transfected into HEK293T cells in good condition. All cells were harvested after 72 hours for DNA extraction.

(d) ОДН-ПЦР была выполнена путем конструирования пары праймеров рядом с сайтом гена-мишени и на последовательности ОДН, при этом был проведен электрофорез в агарозном геле для наблюдения за наличием полосы, чтобы предварительно определить, произошло ли расщепление мишени или нет, и сравнить интенсивность полос sgPHK с длиной распознавания от 19 до 23 пар оснований.(d) ODN-PCR was performed by designing a pair of primers adjacent to the target gene site and on the ODN sequence, and agarose gel electrophoresis was performed to observe the presence of a band to preliminarily determine whether target cleavage occurred or not and compare intensity of sgRNA bands with recognition length from 19 to 23 base pairs.

(e) Для количественного определения вставок в области мишени была сформирована высокопроизводительная библиотека Amplicon, при этом сравнивались эффекты расщепления sgPHK с длиной распознавания от 19 до 23 пар оснований.(e) A high-throughput Amplicon library was generated to quantify inserts in the target region, comparing the effects of sgRNA cleavage with a recognition length of 19 to 23 base pairs.

Как показано на Фигуре 7, оптимальная длина распознавания sgPHK для FrCas9 составляет 21 пару оснований, 22 пары оснований или 23 пары оснований.As shown in Figure 7, the optimal sgRNA recognition length for FrCas9 is 21 bp, 22 bp, or 23 bp.

Пример 7Example 7

В примере посредством эксперимента с ОДН была верифицирована оптимальная длина каркаса sgPHK в эукариотических клетках в системе редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением, и результаты показаны на Фигуре 8.In the example, the optimal sgRNA backbone length in eukaryotic cells in the Faecalibaculum rodentium derived CRISPR/Cas9 type II genome editing system according to the invention was verified by ODN experiment and the results are shown in Figure 8.

(1) Материалы: все аминокислотные последовательности, последовательности sgPHK и распознанные РАМ редактируемого гена Faecalibaculum rodentium, полученные в примерах 1-6.(1) Materials: all amino acid sequences, sgPHK sequences and recognized PAMs of the edited Faecalibaculum rodentium gene obtained in Examples 1-6.

(2) Способ проверки: в этом примере эксперимент с ОДН использовался для верификации оптимальной длины каркаса sgPHK эукариотических клеток в системе редактирования генома CRISPR7Cas9 типа II, полученной из Faecalibaculum rodentium.(2) Verification Method: In this example, the ODN experiment was used to verify the optimal length of the eukaryotic cell sgRNA framework in the type II CRISPR7Cas9 genome editing system derived from Faecalibaculum rodentium.

Подробные протоколы приведены ниже.Detailed protocols are given below.

(a) Оптимизированная последовательность белка FrCas9, полученного от человека, была синтезирована и клонирована в эукариотический вектор РХ330 для конструирования плазмиды PX330-FrCas9.(a) An optimized human-derived FrCas9 protein sequence was synthesized and cloned into the PX330 eukaryotic vector to construct the PX330-FrCas9 plasmid.

(b) В качестве последовательности нацеливания была выбрана последовательность-мишень в 30 пар оснований выше GGTA рядом с сайтом-мишенью SpCas9, которая, как было обнаружено в предыдущем исследовании, обладала хорошим эффектом расщепления, при этом sgPHK с длиной каркаса от 71 нуклеотида до 95 нуклеотидов была сконструирована по методу Гибсона. Сильный промотор эукариот человека U6 добавляли выше sgPHK для конструирования плазмиды PX330-FrCas9-sgPHK.(b) A target sequence 30 base pairs upstream of GGTA near the SpCas9 target site was chosen as the targeting sequence, which was found in a previous study to have a good cleavage effect, with sgRNA with a framework length of 71 nucleotides to 95 nucleotides was constructed according to the Gibson method. The strong human eukaryotic U6 promoter was added upstream of sgRNA to construct the PX330-FrCas9-sgRNA plasmid.

(c) Плазмида PX330-FrCas9-sgPHK, нацеленная на различные сайты генов, сконструированная, как указано выше, с использованием 2,5 мкг и 1,5 мкл ОДН, была электрически трансфицирована в клетки НЕК293Т в хорошем состоянии. Все клетки собирали через 72 часа для выделения ДНК.(c) The plasmid PX330-FrCas9-sgRNA, targeting various gene sites, constructed as above using 2.5 μg and 1.5 μl of ODN, was electrically transfected into HEK293T cells in good condition. All cells were harvested after 72 hours for DNA extraction.

(d) ОДН-ПЦР проводили путем конструирования пары праймеров рядом с сайтом гена-мишени и на последовательности ОДН, при этом был проведен электрофорез в агарозном геле для наблюдения за наличием полос, чтобы предварительно определить, произошло ли расщепление мишени или нет, и сравнить интенсивность полос sgPHK с длиной каркаса от 71 нуклеотида до 95 нуклеотидов.(d) ODN-PCR was performed by designing a primer pair near the target gene site and on the ODN sequence, and agarose gel electrophoresis was performed to observe the presence of bands to preliminarily determine whether the target was cleaved or not and compare the intensity sgRNA bands with a framework length from 71 nucleotides to 95 nucleotides.

(e) Для количественного определения вставок в области мишени была сформирована высокопроизводительная библиотека Amplicon, при этом сравнивались эффекты расщепления sgPHK с длиной каркаса от 71 нуклеотида до 95 нуклеотидов.(e) A high-throughput Amplicon library was generated to quantify inserts in the target region, comparing the effects of sgRNA cleavage with a framework length of 71 nt to 95 nt.

Как показано на Фигурах 8 и 3, оптимальный каркас sgPHK для FrCas9 составляет от 83 до 91 нуклеотида.As shown in Figures 8 and 3, the optimal sgRNA backbone for FrCas9 is 83 to 91 nucleotides.

Пример 8Example 8

В примере посредством эксперимента с ОДН верифицировано, что эффект расщепления в эукариотических клетках в системе редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, выше, чем у SpCas9, а частота отклонения от мишени ниже, чем у SpCas9.In the example, the cleavage effect in eukaryotic cells in the CRISPR/Cas9 type II genome editing system derived from Faecalibaculum rodentium was verified through an ODN experiment to be higher than that of SpCas9, and the off-target rate was lower than that of SpCas9.

(1) Материалы: все аминокислотные последовательности, последовательность sgPHK длиной 22 пары оснований, последовательность 5'-GGTA-3' РАМ, аминокислотная последовательность SpCas9, последовательность sgPHK SpCas9 и последовательность SpCas9 5'-NGG-3' РАМ редактируемого гена Faecalibaculum rodentium, полученные в примерах 1-6;(1) Materials: all amino acid sequences, 22 bp sgPHK sequence, 5'-GGTA-3' PAM sequence, SpCas9 amino acid sequence, SpCas9 sgPHK sequence and SpCas9 5'-NGG-3' PAM sequence of edited Faecalibaculum rodentium gene obtained in examples 1-6;

(2) Способ проверки: в этом примере эксперимент GUIDE-seq использовали для проверки того, что эффект расщепления в ядерных клетках эукариотических клеток системой редактирования генома CRISPR/Cas9 типа II, полученной из Faecalibaculum rodentium, в соответствии с изобретением был выше, чем у SpCas9 и частота отклонения от мишени была ниже, чем у SpCas9.(2) Verification method: In this example, the GUIDE-seq experiment was used to verify that the cleavage effect in the nucleated cells of eukaryotic cells of the CRISPR/Cas9 type II genome editing system derived from Faecalibaculum rodentium according to the invention was higher than that of SpCas9 and the off-target frequency was lower than that of SpCas9.

Подробные протоколы приведены ниже.Detailed protocols are given below.

(a) Оптимизированная последовательность белка FrCas9, полученного от человека, была синтезирована и клонирована в эукариотический вектор РХ330 для конструирования плазмиды PX330-FrCas9.(a) An optimized human-derived FrCas9 protein sequence was synthesized and cloned into the PX330 eukaryotic vector to construct the PX330-FrCas9 plasmid.

(b) В качестве последовательности нацеливания была выбрана последовательность-мишень в 30 пар оснований выше GGTA рядом с сайтом-мишенью SpCas9, которая, как было обнаружено в предыдущем исследовании, обладала хорошим эффектом расщепления, при этом sgPHK с длиной распознавания 22 пары оснований была сконструирована по методу Гибсона. Сильный промотор эукариот человека U6 добавляли выше sgPHK для конструирования плазмиды PX330-FrCas9-sgPHK и, одновременно, конструирования плазмиды PX330-SpCas9-sgPHK из 20 пар оснований sgPHK SpCas9.(b) A target sequence 30 base pairs upstream of GGTA near the target site of SpCas9 was chosen as the targeting sequence, which was found to have a good cleavage effect in a previous study, and an sgRNA with a recognition length of 22 base pairs was constructed by the Gibson method. The strong human eukaryotic promoter U6 was added upstream of sgPHK to construct the PX330-FrCas9-sgPHK plasmid and, concurrently, construct the PX330-SpCas9-sgPHK plasmid from the 20 bp sgRNA SpCas9.

(c) Плазмида PX330-FrCas9-sgPHK и плазмида PX330-SpCas9-sgPHK, нацеленные на различные сайты генов, сконструированные, как указано выше, с 2,5 мкг и 1,5 мкл ОДН, были электрически трансфицированы в клетки НЕК293Т в хорошем состоянии. Все клетки собирали через 72 часа для выделения ДНК.(c) Plasmid PX330-FrCas9-sgRNA and plasmid PX330-SpCas9-sgRNA targeting different gene sites, constructed as above with 2.5 μg and 1.5 μl of ODN, were electrically transfected into HEK293T cells in good condition . All cells were harvested after 72 hours for DNA extraction.

(d) ОДН-ПЦР выполняли путем конструирования пары праймеров рядом с сайтом гена-мишени и на последовательности ОДН, при этом проводили электрофорез в агарозном геле для наблюдения за наличием полос, чтобы предварительно определить, произошло ли расщепление мишени или нет, и из полос ДНК создавали библиотеку GUIDE-seq.(d) ODN-PCR was performed by designing a primer pair adjacent to the target gene site and on the ODN sequence, while agarose gel electrophoresis was performed to observe the presence of bands to preliminarily determine whether the target was cleaved or not, and from the DNA bands created the GUIDE-seq library.

(e) С помощью биоинформатического анализа сравнивались эффекты расщепления мишени и отклонения от мишени SpCas9 и FrCas9 в одном и том же сайте.(e) Using bioinformatics analysis, the effects of target cleavage and detargeting of SpCas9 and FrCas9 at the same site were compared.

Как показано на Фигуре 9, FrCas9 находился на значении числа считываний мишени 3257 на сайте DYRK1A-T2, что выше, чем у SpCas9 при значении числа считываний мишени 2456. Между тем, отклонение от мишени в отношении FrCas9 не было обнаружено, в то время как SpCas9 показал отклонение от мишени на трех сайтах. FrCas9 находился на значении числа считываний мишени 34970 на сайте GRIB2B-T9, что было выше, чем у SpCas9 при значении числа считываний мишени 20434. Между тем в отношении FrCas9 отклонение от мишени не было обнаружено, в то время как SpCas9 показал отклонение от мишени на трех сайтах. Приведенные выше данные показали, что FrCas9 был белком Cas9, превосходящим SpCas9 по эффективности и специфичности расщепления.As shown in Figure 9, FrCas9 was at a target read value of 3257 at the DYRK1A-T2 site, which is higher than SpCas9 at a target read value of 2456. Meanwhile, no off-target for FrCas9 was detected, while SpCas9 showed off-target at three sites. FrCas9 was at a target read value of 34970 at the GRIB2B-T9 site, which was higher than SpCas9 at a target read value of 20434. three sites. The above data showed that FrCas9 was a Cas9 protein superior to SpCas9 in cleavage efficiency and specificity.

Пример 9. FrCas9 можно использовать для Праймированного Редактирования (Prime Editing, РЕ)Example 9. FrCas9 can be used for Prime Editing (PE)

Большинство генетических заболеваний человека связаны с мутациями, которые не поддаются лечению традиционными способами. Базовый редактор - один из новейших и наиболее эффективных способов точного редактирования генома. Он характеризуется использованием белка CRISPR-Cas в форме разрыва для обнаружения специфических ДНК-мишеней и использованием ДНК-дезаминазы для модификации и мутации этой ДНК-мишени с целью исправления пораженных оснований без образования двухцепочечной фрагментации ДНК. Редактор оснований цитозина (СВЕ) мутировал пару оснований C:G в ДНК в Т:А, а редактор оснований аденина (ABE) мутировал пару оснований А:Т в G:C.Most human genetic diseases are associated with mutations that are not amenable to conventional treatment. The base editor is one of the newest and most efficient ways to precisely edit the genome. It is characterized by the use of a break-shaped CRISPR-Cas protein to locate specific target DNAs and the use of DNA deaminase to modify and mutate this target DNA to repair damaged bases without generating double-stranded DNA fragmentation. The cytosine base editor (CBE) mutated the C:G DNA base pair to T:A, and the adenine base editor (ABE) mutated the A:T base pair to G:C.

Во-первых, три точечные мутации Е796А, Н1010А и D1013A соответственно были инкорпорированы для получения различных никаз FrCas9 (nFrCas9). Затем E796A nFrCas9 были объединены с оптимизированным редактором цитидиновых оснований четвертого поколения BE4Gam и редактором адениновых оснований седьмого поколения АВЕ7.10. Было замечено, что окно редактирования FrCas9-BE4Gam представляло собой 6-10-е основания (Фигура 10В), а окно FrCas9-ABE7.10 - 6-8-е основания (Фигура 10С). На основе вышеуказанных характеристик были рассчитаны области нацеливания FrCas9-BE4Gam и FrCas9-ABE7.10 в базах данных ClinVar. В отношении патогенных мутаций, которые можно было точно скорректировать с помощью FrCas9-BE4Gam, 90,38% (235/260) уникальных событий отличались от SpCas9-BE4Gam. В отношении патогенных мутаций, которые можно было точно скорректировать с помощью FrCas9-ABE7.10, 92,21% (1196/1297) уникальных событий отличались от SpCas9-ABE7.10 (Фигура 10D). Таким образом РАМ FrCas9, обогащенный ТА, значительно расширил мишени в геноме человека для редактора оснований для исправления мутаций, связанных с заболеванием человека.First, three point mutations, E796A, H1010A, and D1013A, respectively, were incorporated to produce different FrCas9 (nFrCas9) nicases. E796A nFrCas9 were then combined with the optimized fourth generation cytidine base editor BE4Gam and the seventh generation adenine base editor ABE7.10. It was observed that the FrCas9-BE4Gam edit window was 6-10th bases (Figure 10B) and the FrCas9-ABE7.10 window was 6-8th bases (Figure 10C). Based on the above characteristics, the targeting regions of FrCas9-BE4Gam and FrCas9-ABE7.10 were calculated in the ClinVar databases. For pathogenic mutations that could be accurately corrected for by FrCas9-BE4Gam, 90.38% (235/260) of the unique events were different from SpCas9-BE4Gam. For pathogenic mutations that could be fine-tuned by FrCas9-ABE7.10, 92.21% (1196/1297) of unique events were different from SpCas9-ABE7.10 (Figure 10D). Thus, TA-enriched PAM FrCas9 significantly expanded the targets in the human genome for the base editor to correct human disease-associated mutations.

Кроме того, РАМ FrCas9 (5'-NNTA-3') был палиндромным, что предполагало попарное существование sgPHK «хвост к хвосту» (Фигура 10Е). Этот признак может расширить возможности базовых редакторов FrCas9 путем одновременного изменения двух близких окон редактирования (Фигура 10Е) и увеличить распределение мишеней и плотность sgPHK FrCas9. Было рассчитано распределение 5'-GG-3' (представлено для SpCas9 РАМ) и 5'-ТА-3' (представлено для FrCas9 РАМ) в геномах человека (Фигуры 11А и 11 В). По сравнению с SpCas9 (медиана=5 пар оснований, среднее=8,66 пар оснований), FrCas9 показал более интенсивное распределение (медиана=1 пар оснований, среднее=6,16 пар оснований) в геномах человека, обеспечивая дополнительные применимые локусы.In addition, PAM FrCas9 (5'-NNTA-3') was palindromic, suggesting tail-to-tail pairing of sgRNA (Figure 10E). This feature can enhance the capabilities of the basic FrCas9 editors by simultaneously changing two close editing windows (Figure 10E) and increase the distribution of targets and the density of FrCas9 sgPHK. The distribution of 5'-GG-3' (represented for SpCas9 PAM) and 5'-TA-3' (represented for FrCas9 PAM) in human genomes was calculated (Figures 11A and 11B). Compared to SpCas9 (median=5 bp, mean=8.66 bp), FrCas9 showed a more intense distribution (median=1 bp, mean=6.16 bp) in human genomes, providing additional applicable loci.

Пример 10. FrCas9 может нацеливаться на ТАТА-бокс для модуляции экспрессии генов в качестве эффективного инструмента для активации и ингибирования CRISPR.Example 10 FrCas9 can target the TATA box to modulate gene expression as an effective tool for activating and inhibiting CRISPR.

ТАТА-бокс (TATA-box/бокс Хогнесса) является одним из элементов, входящих в состав промотора эукариот. Его последовательный порядок: ТАТА(А/Т)А(А/Т) (нематричная последовательность цепочек). Он находится примерно на -30 пар оснований (от -25 до -32 пар оснований) выше точки инициации транскрипции у большинства эукариотических генов и в основном состоит из пар оснований А-Т, что является критерием отбора для определения инициации транскрипции генов. Транскрипция может начаться только после прочного связывания с ТАТА-боксом одного из сайтов связывания РНК-полимеразы. Поскольку последовательность РАМ FrCas9 представляет собой NNTA, она имеет естественные преимущества при нацеливании на ТАТА-бокс.TATA-box (TATA-box/Hogness box) is one of the elements that make up the eukaryotic promoter. Its sequential order is TATA(A/T)A(A/T) (non-matrix sequence of strings). It is located about -30 base pairs (-25 to -32 base pairs) upstream of the transcription initiation point of most eukaryotic genes and is primarily composed of A-T base pairs, which is a selection criterion for determining the transcriptional initiation of genes. Transcription can begin only after strong binding to the TATA box of one of the RNA polymerase binding sites. Because the FrCas9 PAM sequence is NNTA, it has natural advantages when targeting the TATA box.

Интерференция FrCas9 CRISPR (CRISPRi) была протестирована в трех генах, промотированных ТАТА-боксом, АВСА1, UCP3 и RANKL (Фигура 12А). Расщепляя ТАТА-бокс, FrCas9 снижал экспрессию АВСА1, UCP3 и RANKL на 31,37%, 49,91% и 39,62% соответственно. В то же время, для прямого связывания с ТАТА-боксом также использовался dFrCas9 без осуществления расщепления, при этом экспрессия АВСА1, UCP3 и RANKL снизилась на 61,67%, 45,61% и 42,60% за счет прямого связывания dFrCas9 с ТАТА-боксом соответственно (Фигура 12 В). Таким образом, FrCas9 обладает уникальным потенциалом для эффективной инженерии генома генетических заболеваний, связанных с ТАТА-боксом.FrCas9 CRISPR interference (CRISPRi) was tested in three TATA box promoted genes, ABCA1, UCP3 and RANKL (Figure 12A). By cleaving the TATA box, FrCas9 reduced the expression of ABCA1, UCP3, and RANKL by 31.37%, 49.91%, and 39.62%, respectively. At the same time, dFrCas9 was also used for direct binding to the TATA box without cleavage, while the expression of ABCA1, UCP3 and RANKL decreased by 61.67%, 45.61% and 42.60% due to direct binding of dFrCas9 to TATA -box, respectively (Figure 12B). Thus, FrCas9 has a unique potential for efficient genome engineering of genetic diseases associated with the TATA box.

Кроме того, была протестирована активация FrCas9 CRISPR (CRISPRa) с использованием dFrCas9-VP64, непосредственно нацеленного на ТАТА-бокс, при этом его эффективность сравнивалась с dSpCas9-VP64, нацеленным по направлению в вверх от ТАТА-бокса. Эксперименты CRISPRa проводились с генами АВСА1, SOD1, GH1 и BLM2. Результаты показали, что dFrCas9-VP64 обеспечивает эффективную активацию транскрипции. Более того, кратность активации dFrCas9-VP64 в АВСА1, GH1 и BLM2 была выше, чем таковая у dSpCas9-VP64, а кратность активации гена SOD1 была сравнима с таковой у dSpCas9-VP64 (Фигура 12С). Таким образом, FrCas9 является многообещающим инструментом для скрининга CRISPR благодаря своему уникальному 5'-NNTA-3' РАМ.In addition, FrCas9 CRISPR activation (CRISPRa) was tested using dFrCas9-VP64 directly targeted to the TATA box and compared with dSpCas9-VP64 targeted upstream from the TATA box. CRISPRa experiments were carried out with the ABCA1, SOD1, GH1, and BLM2 genes. The results showed that dFrCas9-VP64 provided efficient transcriptional activation. Moreover, the activation fold of dFrCas9-VP64 in ABCA1, GH1 and BLM2 was higher than that of dSpCas9-VP64, and the activation fold of the SOD1 gene was comparable to that of dSpCas9-VP64 (Figure 12C). Thus, FrCas9 is a promising tool for CRISPR screening due to its unique 5'-NNTA-3' PAM.

Пример 11. FrCas9 можно использовать для Праймированного Редактирования (Prime Editing, РЕ)Example 11. FrCas9 can be used for Prime Editing (PE)

Праймированное Редактирование (РЕ) - это совершенно новый инструмент для точного редактирования генов. Эта технология может значительно уменьшить количество вредных побочных продуктов, образующихся вследствие инделов в процессе редактирования генов, значительно повысить точность редактирования и, в перспективе, преодолеть фундаментальные барьеры на пути лечения генетических заболеваний с помощью существующих методов редактирования генов. Система РЕ состоит из двух компонентов, таких как сконструированная направляющая РНК (regPHK) и белок первичного редактора. regPHK выполняют двойную функцию: имеют способность направлять отредактированный белок в сайт-мишень и содержат отредактированную последовательность матрицы. Белок главного редактора состоит из мутировавшей никазы Cas9 (которая разрывает только одну цепь ДНК) и слитой обратной транскриптазы. После того, как Cas9 расщепляет сайт-мишень, обратная транскриптаза использует regPHK в качестве матрицы для обратной транскрипции, тем самым производя требуемое редактирование в цепи ДНК, при этом скорректированная последовательность предпочтительно заменяет исходную геномную ДНК, тем самым постоянно редактируя сайт-мишень (Фигура 13).Primed Editing (PE) is a completely new tool for precise gene editing. This technology has the potential to significantly reduce the amount of harmful by-products generated by indels in the gene editing process, greatly improve the accuracy of editing, and potentially overcome fundamental barriers to treating genetic diseases with existing gene editing techniques. The PE system consists of two components such as an engineered guide RNA (regPHK) and a primary editor protein. regPHKs perform a dual function: they have the ability to direct the edited protein to the target site and contain the edited template sequence. The editor-in-chief protein consists of a mutated Cas9 nickase (which breaks only one strand of DNA) and a fused reverse transcriptase. After Cas9 cleaves the target site, reverse transcriptase uses regPHK as a template for reverse transcription, thereby making the required editing in the DNA strand, with the corrected sequence preferentially replacing the original genomic DNA, thereby permanently editing the target site (Figure 13 ).

Основываясь на биологических характеристиках FrCas9, был слит FrCas9 с обратной транскриптазой, была сконструирована соответствующая regPHK в соответствии с ее последовательностью РАМ, была создана система редактирования генов FrCas9-PE, при этом была оптимизирована ее эффективность редактирования генов. regPHK была сконструирована в соответствии с последовательностью РАМ FrCas9. По сравнению с sgPHK последовательность regPHK в области 3'-конца имеет две дополнительные последовательности. Первая последовательность представляет собой сайт связывания праймера (PBS), который может быть комплементарным концу разорванной цепи ДНК-мишени для инициации обратной транскрипции. При этом вторая последовательность представляет собой матрицу обратной транскрипции (RT матрица), которая осуществляет мутации точки-мишени или индел мутации для достижения точного редактирования генов. Предыдущие исследования показали, что длина матричных последовательностей PBS и RT значительно влияет на эффективность редактирования генов в системе РЕ, и зависит от локуса гена. Поэтому мы исследовали оптимизацию эффективности редактирования за счет комбинации матричных последовательностей PBS и RT разной длины.Based on the biological characteristics of FrCas9, FrCas9 was fused with reverse transcriptase, the corresponding regPHK was constructed according to its PAM sequence, the FrCas9-PE gene editing system was created, and its gene editing efficiency was optimized. regRNA was constructed according to the PAM sequence of FrCas9. Compared to sgPHK, the regPHK sequence has two additional sequences at the 3' end. The first sequence is a primer binding site (PBS), which may be complementary to the end of the broken strand of the target DNA to initiate reverse transcription. The second sequence is a reverse transcription template (RT template) that performs target point mutations or indel mutations to achieve precise gene editing. Previous studies have shown that the length of the PBS and RT template sequences significantly affects the efficiency of gene editing in the PE system, and depends on the gene locus. Therefore, we investigated the optimization of editing efficiency by combining PBS and RT template sequences of different lengths.

На клеточном уровне был предварительно проверен эффект редактирования генов системой FrCas9-PE. В клетках НЕК293Т локус гена HEK293T-RNF2, который обычно используется для оценки эффективности редактирования генов CRISPR, был нацелен на верификацию функции редактирования генов системы FrCas9-PE. Наши текущие экспериментальные результаты показывают, что FrCas9-PE может оказывать эффекты, связанные с сайт-специфическим редактированием основания. После этого мы будем дополнительно трансформировать существующую FrCas9-PE, включая оптимизацию кодонов, оптимизацию положения и количества последовательностей ядерной локализации, модификацию обратной транскриптазы и т.д. В итоге была разработана новая система редактирования генома FrCas9-PE с высокой эффективностью редактирования базы, с меньшим количеством реакций, связанных с отклонением от мишени, и меньшим количеством побочных продуктов редактирования генов (инделов) (Фигура 14).At the cellular level, the effect of gene editing by the FrCas9-PE system was previously tested. In HEK293T cells, the HEK293T-RNF2 gene locus, which is commonly used to assess the efficiency of CRISPR gene editing, was targeted to verify the gene editing function of the FrCas9-PE system. Our current experimental results indicate that FrCas9-PE may have site-specific base editing effects. After that, we will further transform the existing FrCas9-PE, including codon optimization, optimization of the position and number of nuclear localization sequences, reverse transcriptase modification, etc. As a result, a novel FrCas9-PE genome editing system was developed with high base editing efficiency, fewer off-target reactions, and fewer gene editing by-products (indels) (Figure 14).

--->--->

Перечень последовательностей Sequence listing

SEQUENCE LISTING SEQUENCE LISTING

<110> ZHUHAI SHU TONG MEDICAL TECHNOLOGY CO., LTD<110> ZHUHAI SHU TONG MEDICAL TECHNOLOGY CO.,LTD

<120> TYPE II CRISPR/CAS9 GENOME EDITING SYSTEM AND THE APPLICATION THEREOF<120> TYPE II CRISPR/CAS9 GENOME EDITING SYSTEM AND THE APPLICATION THEREOF

<130> <130>

<160> 33 <160> 33

<170> PatentIn version 3.3<170> PatentIn version 3.3

<210> 1<210> 1

<211> 1372<211> 1372

<212> PRT<212> PRT

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 1<400> 1

Met Cys Thr Lys Glu Ser Glu Lys Leu Asn Lys Asn Ala Asp Tyr Tyr Met Cys Thr Lys Glu Ser Glu Lys Leu Asn Lys Asn Ala Asp Tyr Tyr

1 5 10 15 1 5 10 15

Ile Gly Leu Asp Met Gly Thr Ser Ser Ala Gly Trp Ala Val Ser Asp Ile Gly Leu Asp Met Gly Thr Ser Ser Ala Gly Trp Ala Val Ser Asp

20 25 30 20 25 30

Ser Glu Tyr Asn Leu Ile Arg Arg Lys Gly Lys Asp Leu Trp Gly Val Ser Glu Tyr Asn Leu Ile Arg Arg Lys Gly Lys Asp Leu Trp Gly Val

35 40 45 35 40 45

Arg Gln Phe Glu Glu Ala Lys Thr Ala Ala Glu Arg Arg Gly Phe Arg Arg Gln Phe Glu Glu Ala Lys Thr Ala Ala Glu Arg Arg Gly Phe Arg

50 55 60 50 55 60

Val Ala Arg Arg Arg Lys Gln Arg Gln Gln Val Arg Asn Arg Leu Leu Val Ala Arg Arg Arg Lys Gln Arg Gln Gln Val Arg Asn Arg Leu Leu

65 70 75 80 65 70 75 80

Ser Glu Glu Phe Gln Asn Glu Ile Thr Lys Ile Asp Ser Gly Phe Leu Ser Glu Glu Phe Gln Asn Glu Ile Thr Lys Ile Asp Ser Gly Phe Leu

85 90 95 85 90 95

Lys Arg Met Glu Asp Ser Arg Phe Val Ile Ser Asp Lys Arg Val Pro Lys Arg Met Glu Asp Ser Arg Phe Val Ile Ser Asp Lys Arg Val Pro

100 105 110 100 105 110

Glu Lys Tyr Thr Leu Phe Asn Asp Ser Gly Tyr Thr Asp Val Glu Tyr Glu Lys Tyr Thr Leu Phe Asn Asp Ser Gly Tyr Thr Asp Val Glu Tyr

115 120 125 115 120 125

Tyr Asn Gln Tyr Pro Thr Ile Tyr His Leu Arg Lys Ala Leu Ile Glu Tyr Asn Gln Tyr Pro Thr Ile Tyr His Leu Arg Lys Ala Leu Ile Glu

130 135 140 130 135 140

Ser Asn Glu Arg Phe Asp Ile Arg Leu Val Phe Leu Gly Ile His Ser Ser Asn Glu Arg Phe Asp Ile Arg Leu Val Phe Leu Gly Ile His Ser

145 150 155 160 145 150 155 160

Leu Phe Gln His Pro Gly His Phe Leu Asp Lys Gly Asp Val Asp Thr Leu Phe Gln His Pro Gly His Phe Leu Asp Lys Gly Asp Val Asp Thr

165 170 175 165 170 175

Asp Asn Thr Gly Pro Glu Glu Leu Ile Gln Phe Leu Glu Asp Cys Met Asp Asn Thr Gly Pro Glu Glu Leu Ile Gln Phe Leu Glu Asp Cys Met

180 185 190 180 185 190

Asn Glu Ile Gln Ile Ser Ile Pro Leu Val Ser Asn Gln Lys Val Leu Asn Glu Ile Gln Ile Ser Ile Pro Leu Val Ser Asn Gln Lys Val Leu

195 200 205 195 200 205

Thr Asp Ile Leu Thr Asp Ser Arg Ile Thr Arg Arg Asp Lys Glu Gln Thr Asp Ile Leu Thr Asp Ser Arg Ile Thr Arg Arg Asp Lys Glu Gln

210 215 220 210 215 220

Gln Ile Leu Glu Ile Leu Gln Pro Asn Lys Glu Ser Lys Lys Ala Val Gln Ile Leu Glu Ile Leu Gln Pro Asn Lys Glu Ser Lys Lys Ala Val

225 230 235 240 225 230 235 240

Ser Gln Phe Val Lys Val Leu Thr Gly Gln Lys Ala Lys Leu Gly Asp Ser Gln Phe Val Lys Val Leu Thr Gly Gln Lys Ala Lys Leu Gly Asp

245 250 255 245 250 255

Leu Ile Met Met Glu Asp Lys Asp Thr Glu Glu Tyr Lys Tyr Ser Phe Leu Ile Met Met Glu Asp Lys Asp Thr Glu Glu Tyr Lys Tyr Ser Phe

260 265 270 260 265 270

Ser Phe Arg Glu Lys Thr Leu Glu Glu Ile Leu Pro Asp Ile Glu Gly Ser Phe Arg Glu Lys Thr Leu Glu Glu Ile Leu Pro Asp Ile Glu Gly

275 280 285 275 280 285

Val Ile Asp Gly Leu Ala Leu Glu Tyr Ile Glu Ser Ile Tyr Ser Leu Val Ile Asp Gly Leu Ala Leu Glu Tyr Ile Glu Ser Ile Tyr Ser Leu

290 295 300 290 295 300

Tyr Ser Trp Ser Leu Leu Asn Ser Tyr Met Lys Asp Thr Leu Thr Gly Tyr Ser Trp Ser Leu Leu Asn Ser Tyr Met Lys Asp Thr Leu Thr Gly

305 310 315 320 305 310 315 320

His Tyr Tyr Ser Tyr Leu Ala Glu Ala Arg Val Ala Ala Tyr Asp Lys His Tyr Tyr Ser Tyr Leu Ala Glu Ala Arg Val Ala Ala Tyr Asp Lys

325 330 335 325 330 335

His His Ser Asp Leu Val Lys Leu Lys Thr Leu Phe Arg Glu Tyr Ile His His Ser Asp Leu Val Lys Leu Lys Thr Leu Phe Arg Glu Tyr Ile

340 345 350 340 345 350

Pro Glu Glu Tyr Asp Asn Phe Phe Arg Lys Met Glu Lys Ala Asn Tyr Pro Glu Glu Tyr Asp Asn Phe Phe Arg Lys Met Glu Lys Ala Asn Tyr

355 360 365 355 360 365

Ser His Tyr Ile Gly Ser Thr Glu Tyr Asp Gly Glu Lys Arg Cys Arg Ser His Tyr Ile Gly Ser Thr Glu Tyr Asp Gly Glu Lys Arg Cys Arg

370 375 380 370 375 380

Thr Ala Lys Ala Lys Gln Glu Asp Phe Tyr Lys Ser Ile Asn Lys Met Thr Ala Lys Ala Lys Gln Glu Asp Phe Tyr Lys Ser Ile Asn Lys Met

385 390 395 400 385 390 395 400

Leu Glu Lys Ile Pro Glu Cys Ser Glu Lys Thr Glu Ile Gln Lys Glu Leu Glu Lys Ile Pro Glu Cys Ser Glu Lys Thr Glu Ile Gln Lys Glu

405 410 415 405 410 415

Ile Ile Glu Gly Thr Phe Leu Leu Lys Gln Thr Gly Pro Gln Asn Gly Ile Ile Glu Gly Thr Phe Leu Leu Lys Gln Thr Gly Pro Gln Asn Gly

420 425 430 420 425 430

Phe Val Pro Asn Gln Leu Gln Leu Lys Glu Leu Arg Lys Ile Leu Gln Phe Val Pro Asn Gln Leu Gln Leu Lys Glu Leu Arg Lys Ile Leu Gln

435 440 445 435 440 445

Asn Ala Ser Lys His Tyr Pro Phe Leu Thr Glu Lys Asp Glu Arg Asp Asn Ala Ser Lys His Tyr Pro Phe Leu Thr Glu Lys Asp Glu Arg Asp

450 455 460 450 455 460

Met Thr Ala Ile Asp Arg Ile Glu Ala Leu Phe Ser Phe Arg Ile Pro Met Thr Ala Ile Asp Arg Ile Glu Ala Leu Phe Ser Phe Arg Ile Pro

465 470 475 480 465 470 475 480

Tyr Tyr Ile Gly Pro Leu Lys Asn Thr Asp Asn Gln Gly His Gly Trp Tyr Tyr Ile Gly Pro Leu Lys Asn Thr Asp Asn Gln Gly His Gly Trp

485 490 495 485 490 495

Ala Val Arg Arg Asp Gly His Glu Gln Ile Pro Val Arg Pro Trp Asn Ala Val Arg Arg Asp Gly His Glu Gln Ile Pro Val Arg Pro Trp Asn

500 505 510 500 505 510

Phe Glu Glu Ile Ile Asp Glu Ser Ala Ser Ala Asp Leu Phe Ile Lys Phe Glu Glu Ile Ile Asp Glu Ser Ala Ser Ala Asp Leu Phe Ile Lys

515 520 525 515 520 525

Asn Leu Val Asn Ser Cys Thr Tyr Leu Arg Thr Glu Lys Val Leu Pro Asn Leu Val Asn Ser Cys Thr Tyr Leu Arg Thr Glu Lys Val Leu Pro

530 535 540 530 535 540

Lys Ser Ser Leu Leu Tyr Gln Glu Phe Glu Val Leu Asn Glu Leu Asn Lys Ser Ser Leu Leu Tyr Gln Glu Phe Glu Val Leu Asn Glu Leu Asn

545 550 555 560 545 550 555 560

Asn Leu Arg Ile Asn Gly Met Tyr Pro Asp Glu Ile Gln Pro Gly Leu Asn Leu Arg Ile Asn Gly Met Tyr Pro Asp Glu Ile Gln Pro Gly Leu

565 570 575 565 570 575

Lys Arg Met Ile Phe Glu Gln Cys Phe Tyr Ser Gly Lys Lys Val Thr Lys Arg Met Ile Phe Glu Gln Cys Phe Tyr Ser Gly Lys Lys Val Thr

580 585 590 580 585 590

Gly Lys Lys Leu Gln Leu Phe Leu Arg Ser Val Leu Thr Asn Ser Ser Gly Lys Lys Leu Gln Leu Phe Leu Arg Ser Val Leu Thr Asn Ser Ser

595 600 605 595 600 605

Thr Glu Glu Phe Val Leu Thr Gly Ile Asp Lys Asp Phe Lys Ser Ser Thr Glu Glu Phe Val Leu Thr Gly Ile Asp Lys Asp Phe Lys Ser Ser

610 615 620 610 615 620

Leu Ser Ser Tyr Lys Lys Phe Cys Glu Leu Phe Gly Val Lys Thr Leu Leu Ser Ser Tyr Lys Lys Phe Cys Glu Leu Phe Gly Val Lys Thr Leu

625 630 635 640 625 630 635 640

Asn Asp Thr Gln Lys Val Met Ala Glu Gln Ile Ile Glu Trp Ser Thr Asn Asp Thr Gln Lys Val Met Ala Glu Gln Ile Ile Glu Trp Ser Thr

645 650 655 645 650 655

Val Tyr Gly Asp Ser Arg Lys Phe Leu Lys Arg Lys Leu Glu Asp Asn Val Tyr Gly Asp Ser Arg Lys Phe Leu Lys Arg Lys Leu Glu Asp Asn

660 665 670 660 665 670

Tyr Pro Glu Leu Thr Asp Gln Gln Ile Arg Arg Ile Ala Gly Phe Lys Tyr Pro Glu Leu Thr Asp Gln Gln Ile Arg Arg Ile Ala Gly Phe Lys

675 680 685 675 680 685

Phe Ser Glu Trp Gly Asn Leu Ser Arg Ala Phe Leu Glu Met Glu Gly Phe Ser Glu Trp Gly Asn Leu Ser Arg Ala Phe Leu Glu Met Glu Gly

690 695 700 690 695 700

Tyr Lys Asp Glu Ala Gly Asn Pro Val Thr Ile Ile Arg Ala Leu Arg Tyr Lys Asp Glu Ala Gly Asn Pro Val Thr Ile Ile Arg Ala Leu Arg

705 710 715 720 705 710 715 720

Asp Thr Gln Lys Asn Leu Met Gln Leu Leu Ser Asn Asp Ser Ala Phe Asp Thr Gln Lys Asn Leu Met Gln Leu Leu Ser Asn Asp Ser Ala Phe

725 730 735 725 730 735

Ala Lys Lys Leu Gln Glu Leu Asn Asp Tyr Val Thr Arg Asp Ile Trp Ala Lys Lys Leu Gln Glu Leu Asn Asp Tyr Val Thr Arg Asp Ile Trp

740 745 750 740 745 750

Ser Ile Glu Pro Asp Asp Leu Asp Gly Met Tyr Leu Ser Ala Pro Val Ser Ile Glu Pro Asp Asp Leu Asp Gly Met Tyr Leu Ser Ala Pro Val

755 760 765 755 760 765

Arg Arg Met Ile Trp Gln Thr Phe Leu Ile Leu Arg Glu Val Val Asp Arg Arg Met Ile Trp Gln Thr Phe Leu Ile Leu Arg Glu Val Val Asp

770 775 780 770 775 780

Thr Ile Gly Tyr Ser Pro Lys Lys Ile Phe Met Glu Met Ala Arg Gly Thr Ile Gly Tyr Ser Pro Lys Lys Ile Phe Met Glu Met Ala Arg Gly

785 790 795 800 785 790 795 800

Glu Gln Glu Lys Lys Arg Thr Ala Ser Arg Lys Lys Gln Leu Ile Asp Glu Gln Glu Lys Lys Arg Thr Ala Ser Arg Lys Lys Gln Leu Ile Asp

805 810 815 805 810 815

Leu Tyr Lys Glu Ala Gly Met Lys Asn Asp Glu Leu Phe Gly Asp Leu Leu Tyr Lys Glu Ala Gly Met Lys Asn Asp Glu Leu Phe Gly Asp Leu

820 825 830 820 825 830

Glu Ser Leu Glu Glu Ala Gln Leu Arg Ser Lys Lys Leu Tyr Leu Tyr Glu Ser Leu Glu Glu Ala Gln Leu Arg Ser Lys Lys Leu Tyr Leu Tyr

835 840 845 835 840 845

Phe Arg Gln Met Gly Arg Asp Ile Tyr Ser Gly Lys Leu Ile Asp Phe Phe Arg Gln Met Gly Arg Asp Ile Tyr Ser Gly Lys Leu Ile Asp Phe

850 855 860 850 855 860

Met Asp Val Leu His Gly Asn Arg Tyr Asp Ile Asp His Ile His Pro Met Asp Val Leu His Gly Asn Arg Tyr Asp Ile Asp His Ile His Pro

865 870 875 880 865 870 875 880

Gln Ser Lys Lys Lys Asp Asp Ser Leu Glu Asn Asn Leu Val Leu Thr Gln Ser Lys Lys Lys Asp Asp Ser Leu Glu Asn Asn Leu Val Leu Thr

885 890 895 885 890 895

Ser Lys Asp Phe Asn Asn His Ile Lys Gln Asp Val Tyr Pro Ile Pro Ser Lys Asp Phe Asn Asn His Ile Lys Gln Asp Val Tyr Pro Ile Pro

900 905 910 900 905 910

Glu Gln Ile Gln Ser Arg Gln Lys Gly Phe Trp Ala Met Leu Leu Lys Glu Gln Ile Gln Ser Arg Gln Lys Gly Phe Trp Ala Met Leu Leu Lys

915 920 925 915 920 925

Gln Gly Phe Met Ser Gln Glu Lys Tyr Asn Arg Leu Met Arg Thr Thr Gln Gly Phe Met Ser Gln Glu Lys Tyr Asn Arg Leu Met Arg Thr Thr

930 935 940 930 935 940

Pro Phe Thr Asp Glu Glu Leu Ala Glu Phe Val Asn Arg Gln Leu Val Pro Phe Thr Asp Glu Glu Leu Ala Glu Phe Val Asn Arg Gln Leu Val

945 950 955 960 945 950 955 960

Glu Thr Arg Gln Gly Thr Lys Ala Ile Ile Ser Leu Ile Asn Gln Cys Glu Thr Arg Gln Gly Thr Lys Ala Ile Ile Ser Leu Ile Asn Gln Cys

965 970 975 965 970 975

Phe Pro Asp Ser Glu Val Val Tyr Val Lys Ala Gly Asn Thr Ser Asp Phe Pro Asp Ser Glu Val Val Tyr Val Lys Ala Gly Asn Thr Ser Asp

980 985 990 980 985 990

Phe Arg Gln Arg Phe Asp Ile Pro Lys Ser Arg Asp Leu Asn Asn Tyr Phe Arg Gln Arg Phe Asp Ile Pro Lys Ser Arg Asp Leu Asn Asn Tyr

995 1000 1005 995 1000 1005

His His Ala Val Asp Ala Tyr Leu Asn Ile Val Val Gly Asn Val Tyr His His Ala Val Asp Ala Tyr Leu Asn Ile Val Val Gly Asn Val Tyr

1010 1015 1020 1010 1015 1020

Asp Thr Lys Phe Thr Lys Asn Pro Ile Asn Phe Ile Lys Lys Met Arg Asp Thr Lys Phe Thr Lys Asn Pro Ile Asn Phe Ile Lys Lys Met Arg

1025 1030 1035 1040 1025 1030 1035 1040

Lys Ser Gly Asn Leu His Ser Tyr Ser Leu Arg Arg Met Tyr Asp Phe Lys Ser Gly Asn Leu His Ser Tyr Ser Leu Arg Arg Met Tyr Asp Phe

1045 1050 1055 1045 1050 1055

Asn Val Gln Arg Gly Asp Gln Thr Ala Trp Val Ala Glu Asn Asp Thr Asn Val Gln Arg Gly Asp Gln Thr Ala Trp Val Ala Glu Asn Asp Thr

1060 1065 1070 1060 1065 1070

Thr Leu Lys Thr Val Lys Lys Thr Ala Phe Lys Thr Ser Pro Met Val Thr Leu Lys Thr Val Lys Lys Thr Ala Phe Lys Thr Ser Pro Met Val

1075 1080 1085 1075 1080 1085

Thr Lys Arg Thr Tyr Glu Arg Lys Gly Gly Leu Ala Asp Ser Val Leu Thr Lys Arg Thr Tyr Glu Arg Lys Gly Gly Leu Ala Asp Ser Val Leu

1090 1095 1100 1090 1095 1100

Ile Ala Ala Lys Lys Ala Lys Pro Gly Val His Leu Pro Val Lys Thr Ile Ala Ala Lys Lys Ala Lys Pro Gly Val His Leu Pro Val Lys Thr

1105 1110 1115 1120 1105 1110 1115 1120

Ser Asp Ser Arg Phe Ala Asn Gln Val Ser Thr Tyr Gly Gly Tyr Asp Ser Asp Ser Arg Phe Ala Asn Gln Val Ser Thr Tyr Gly Gly Tyr Asp

1125 1130 1135 1125 1130 1135

Asn Val Lys Gly Ser His Phe Phe Leu Val Glu His Gln Gln Lys Lys Asn Val Lys Gly Ser His Phe Phe Leu Val Glu His Gln Gln Lys Lys

1140 1145 1150 1140 1145 1150

Lys Thr Ile Arg Ser Ile Glu Asn Val Pro Ile His Leu Lys Glu Lys Lys Thr Ile Arg Ser Ile Glu Asn Val Pro Ile His Leu Lys Glu Lys

1155 1160 1165 1155 1160 1165

Leu Lys Thr Lys Glu Glu Leu Glu His Tyr Cys Ala Gln Val Leu Gly Leu Lys Thr Lys Glu Glu Leu Glu His Tyr Cys Ala Gln Val Leu Gly

1170 1175 1180 1170 1175 1180

Met Val Gln Pro Asp Val Arg Leu Thr Arg Ile Pro Met Tyr Ser Leu Met Val Gln Pro Asp Val Arg Leu Thr Arg Ile Pro Met Tyr Ser Leu

1185 1190 1195 1200 1185 1190 1195 1200

Leu Leu Ile Asp Gly Tyr Tyr Tyr Tyr Leu Thr Gly Arg Thr Gly Gly Leu Leu Ile Asp Gly Tyr Tyr Tyr Tyr Leu Thr Gly Arg Thr Gly Gly

1205 1210 1215 1205 1210 1215

Asn Leu Ser Leu Ser Asn Ala Val Glu Leu Cys Leu Pro Ala Lys Glu Asn Leu Ser Leu Ser Asn Ala Val Glu Leu Cys Leu Pro Ala Lys Glu

1220 1225 1230 1220 1225 1230

Gln Ala His Ile Arg Met Ile Ser Lys Ile Ala Gly Gly Arg Ser Thr Gln Ala His Ile Arg Met Ile Ser Lys Ile Ala Gly Gly Arg Ser Thr

1235 1240 1245 1235 1240 1245

Asp Ala Leu Ser Ala Glu Ala Lys Asp Asp Phe Arg Lys Lys Asn Leu Asp Ala Leu Ser Ala Glu Ala Lys Asp Asp Phe Arg Lys Lys Asn Leu

1250 1255 1260 1250 1255 1260

Arg Leu Tyr Asp Glu Leu Ala Glu Lys His Arg Ser Thr Ile Phe Ser Arg Leu Tyr Asp Glu Leu Ala Glu Lys His Arg Ser Thr Ile Phe Ser

1265 1270 1275 1280 1265 1270 1275 1280

Lys Arg Lys Asn Pro Ile Gly Pro Lys Leu Leu Lys Tyr Arg Glu Ala Lys Arg Lys Asn Pro Ile Gly Pro Lys Leu Leu Lys Tyr Arg Glu Ala

1285 1290 1295 1285 1290 1295

Phe Val Lys Gln Thr Ile Glu Asn Gln Cys Lys Val Ile Leu Gln Ile Phe Val Lys Gln Thr Ile Glu Asn Gln Cys Lys Val Ile Leu Gln Ile

1300 1305 1310 1300 1305 1310

Leu Lys Leu Thr Ser Thr Asn Cys Lys Thr Ser Ala Asp Leu Lys Leu Leu Lys Leu Thr Ser Thr Asn Cys Lys Thr Ser Ala Asp Leu Lys Leu

1315 1320 1325 1315 1320 1325

Ile Gly Gly Ser Gly Gln Glu Gly Val Met Ser Ile Ser Lys Leu Leu Ile Gly Gly Ser Gly Gln Glu Gly Val Met Ser Ile Ser Lys Leu Leu

1330 1335 1340 1330 1335 1340

Arg Ala Glu Lys Tyr Ala Glu Phe Tyr Leu Ile Cys Gln Ser Pro Ser Arg Ala Glu Lys Tyr Ala Glu Phe Tyr Leu Ile Cys Gln Ser Pro Ser

1345 1350 1355 1360 1345 1350 1355 1360

Gly Ile Tyr Glu Thr Arg Lys Asn Leu Leu Thr Ile Gly Ile Tyr Glu Thr Arg Lys Asn Leu Leu Thr Ile

1365 1370 1365 1370

<210> 2<210> 2

<211> 294<211> 294

<212> PRT<212> PRT

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 2<400> 2

Met Thr Trp Arg Thr Ile Thr Ile Ser Ser His Ser Lys Leu Asp Tyr Met Thr Trp Arg Thr Ile Thr Ile Ser Ser His Ser Lys Leu Asp Tyr

1 5 10 15 1 5 10 15

Gln Met Gly Tyr Leu Val Val Arg Gly Glu Ser Ile Lys Arg Ile His Gln Met Gly Tyr Leu Val Val Arg Gly Glu Ser Ile Lys Arg Ile His

20 25 30 20 25 30

Leu Ser Glu Ile Ser Val Leu Ile Ile Glu Asn Thr Ala Val Ser Leu Leu Ser Glu Ile Ser Val Leu Ile Ile Glu Asn Thr Ala Val Ser Leu

35 40 45 35 40 45

Thr Ala Tyr Leu Val Ser Glu Leu Val Lys Asn Lys Ile Lys Leu Leu Thr Ala Tyr Leu Val Ser Glu Leu Val Lys Asn Lys Ile Lys Leu Leu

50 55 60 50 55 60

Phe Cys Asp Glu Lys Arg Ser Pro Leu Ala Glu Val Ser Glu Leu Tyr Phe Cys Asp Glu Lys Arg Ser Pro Leu Ala Glu Val Ser Glu Leu Tyr

65 70 75 80 65 70 75 80

Gly Gly His Asp Ser Ser Asp Met Val Arg Lys Gln Ile Glu Ile Pro Gly Gly His Asp Ser Ser Asp Met Val Arg Lys Gln Ile Glu Ile Pro

85 90 95 85 90 95

Gln Glu Arg Lys Asp Ile Ala Trp Gln Ser Ile Ile Met Ser Lys Ile Gln Glu Arg Lys Asp Ile Ala Trp Gln Ser Ile Ile Met Ser Lys Ile

100 105 110 100 105 110

Ser Asn Gln Phe Ala Val Leu His Asn Phe Asp Cys Pro Asn Gln Glu Ser Asn Gln Phe Ala Val Leu His Asn Phe Asp Cys Pro Asn Gln Glu

115 120 125 115 120 125

Leu Leu Leu Gln Tyr Ile Asn Glu Val Leu Pro Gly Asp Val Thr Asn Leu Leu Leu Gln Tyr Ile Asn Glu Val Leu Pro Gly Asp Val Thr Asn

130 135 140 130 135 140

Arg Glu Gly His Ala Ala Lys Val Tyr Phe Asn Ser Leu Phe Gly Lys Arg Glu Gly His Ala Ala Lys Val Tyr Phe Asn Ser Leu Phe Gly Lys

145 150 155 160 145 150 155 160

Ser Phe Tyr Arg Ala Ser Glu Cys Ala Leu Asn Ala Ala Leu Asn Tyr Ser Phe Tyr Arg Ala Ser Glu Cys Ala Leu Asn Ala Ala Leu Asn Tyr

165 170 175 165 170 175

Gly Tyr Ser Val Leu Leu Ser Ala Val Ser Arg Glu Ile Ala Gly Tyr Gly Tyr Ser Val Leu Leu Ser Ala Val Ser Arg Glu Ile Ala Gly Tyr

180 185 190 180 185 190

Gly Phe Leu Thr Gln Leu Gly Ile Phe His Asp Asn Cys Asp Asn Lys Gly Phe Leu Thr Gln Leu Gly Ile Phe His Asp Asn Cys Asp Asn Lys

195 200 205 195 200 205

Tyr Asn Leu Ser Cys Asp Leu Met Glu Pro Phe Arg Pro Val Val Asp Tyr Asn Leu Ser Cys Asp Leu Met Glu Pro Phe Arg Pro Val Val Asp

210 215 220 210 215 220

Tyr Leu Val Lys Ser Asn Ile Val Glu Val Phe Glu Lys Glu Gln Lys Tyr Leu Val Lys Ser Asn Ile Val Glu Val Phe Glu Lys Glu Gln Lys

225 230 235 240 225 230 235 240

Gln Lys Ile Leu Gln Leu Leu Gln Phe Lys Ile Gln Ile Asn Asp Arg Gln Lys Ile Leu Gln Leu Leu Gln Phe Lys Ile Gln Ile Asn Asp Arg

245 250 255 245 250 255

Gln Glu Thr Val Gln Asn Ala Ile Ser Ile Phe Val His Ser Val Leu Gln Glu Thr Val Gln Asn Ala Ile Ser Ile Phe Val His Ser Val Leu

260 265 270 260 265 270

Asp Tyr Leu Leu Asp Pro Ser Val Tyr Ile Lys Val Pro Arg Ile Asp Asp Tyr Leu Leu Asp Pro Ser Val Tyr Ile Lys Val Pro Arg Ile Asp

275 280 285 275 280 285

Phe Thr Lys Asn Val Val Phe Thr Lys Asn Val Val

290 290

<210> 3<210> 3

<211> 68<211> 68

<212> PRT<212> PRT

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 3<400> 3

Met Met Gln Glu Ser Val Tyr Cys Lys Leu Thr Thr Asn Gln Ser Ser Met Met Gln Glu Ser Val Tyr Cys Lys Leu Thr Thr Asn Gln Ser Ser

1 5 10 15 1 5 10 15

Ala Glu Thr Val Leu Lys Met Val Arg Ala Asn Lys Pro Pro Glu Gly Ala Glu Thr Val Leu Lys Met Val Arg Ala Asn Lys Pro Pro Glu Gly

20 25 30 20 25 30

Leu Ile Gln Thr Leu Ile Ile Thr Glu Lys Gln Phe Ser Lys Met Asp Leu Ile Gln Thr Leu Ile Ile Thr Glu Lys Gln Phe Ser Lys Met Asp

35 40 45 35 40 45

Phe Ile Leu Gly Gln Pro Asn Ser Asp Val Val Ala Thr Asp Glu Ser Phe Ile Leu Gly Gln Pro Asn Ser Asp Val Val Ala Thr Asp Glu Ser

50 55 60 50 55 60

Val Leu Asp Leu Val Leu Asp Leu

65 65

<210> 4<210> 4

<211> 223<211> 223

<212> PRT<212> PRT

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 4<400> 4

Met Arg Leu Leu Ile Asp Arg Leu Leu Leu Ser Ala Glu Leu Asn Ile Met Arg Leu Leu Ile Asp Arg Leu Leu Leu Ser Ala Glu Leu Asn Ile

1 5 10 15 1 5 10 15

Asp Lys Ala Thr Thr Ile Ile Ile Glu Asn Pro Lys Ala Phe Arg Met Asp Lys Ala Thr Thr Ile Ile Ile Glu Asn Pro Lys Ala Phe Arg Met

20 25 30 20 25 30

Val Ile Lys Asp Leu Ile Glu Gln Glu Asn Gly Gln Gly Gly Leu Leu Val Ile Lys Asp Leu Ile Glu Gln Glu Asn Gly Gln Gly Gly Leu Leu

35 40 45 35 40 45

Arg Ile Val Glu Gly Asp Lys Glu Leu Cys Leu Ser Lys Ser Ala Ile Arg Ile Val Glu Gly Asp Lys Glu Leu Cys Leu Ser Lys Ser Ala Ile

50 55 60 50 55 60

Leu Val Leu Asn Pro Tyr Leu Ala Asp Leu Asn Cys Arg Lys Phe Leu Leu Val Leu Asn Pro Tyr Leu Ala Asp Leu Asn Cys Arg Lys Phe Leu

65 70 75 80 65 70 75 80

Gln Leu Ala Tyr Ser Glu Leu Gln Ala Met Thr Gly Glu Phe Leu Glu Gln Leu Ala Tyr Ser Glu Leu Gln Ala Met Thr Gly Glu Phe Leu Glu

85 90 95 85 90 95

Asp Gln Ala Val Val Leu Ser Ala Met Thr Gly Tyr Leu Ser Lys Ile Asp Gln Ala Val Val Leu Ser Ala Met Thr Gly Tyr Leu Ser Lys Ile

100 105 110 100 105 110

Cys Asp Gln Ser Arg Phe Asp Phe Leu Glu Phe Ser Ala Ile Pro Asp Cys Asp Gln Ser Arg Phe Asp Phe Leu Glu Phe Ser Ala Ile Pro Asp

115 120 125 115 120 125

Trp Ala Ser Val Phe Lys Ala Trp Gly Leu Arg Phe Glu Gln Ala Ile Trp Ala Ser Val Phe Lys Ala Trp Gly Leu Arg Phe Glu Gln Ala Ile

130 135 140 130 135 140

Pro Gly Leu Leu Pro Ser Leu Ile Gln Tyr Leu Gln Leu Ala Ala Thr Pro Gly Leu Leu Pro Ser Leu Ile Gln Tyr Leu Gln Leu Ala Ala Thr

145 150 155 160 145 150 155 160

Phe Pro Gln Phe Lys Leu Ile Ile Phe Ile Asn Leu Lys Gln Tyr Leu Phe Pro Gln Phe Lys Leu Ile Ile Phe Ile Asn Leu Lys Gln Tyr Leu

165 170 175 165 170 175

Leu Pro Glu Glu Gln Phe Glu Leu Phe Lys Met Ala Glu Tyr Leu Gln Leu Pro Glu Glu Gln Phe Glu Leu Phe Lys Met Ala Glu Tyr Leu Gln

180 185 190 180 185 190

Leu Lys Val Leu Leu Val Glu Ser Ala Gln Asn Tyr Lys Ser Asp Arg Leu Lys Val Leu Leu Val Glu Ser Ala Gln Asn Tyr Lys Ser Asp Arg

195 200 205 195 200 205

Glu Asp Leu Ile Ile Ile Asp Lys Asp Leu Cys Glu Ile Gln Ser Glu Asp Leu Ile Ile Ile Asp Lys Asp Leu Cys Glu Ile Gln Ser

210 215 220 210 215 220

<210> 5<210> 5

<211> 20<211> 20

<212> RNA<212>RNA

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 5<400> 5

guuugagugu cuuguuaauu 20guuugagugu cuuguuaauu 20

<210> 6<210> 6

<211> 36<211> 36

<212> DNA<212> DNA

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 6<400> 6

gtttgagtgt cttgttaatt cggaagtatt tcaaac 36gtttgagtgt cttgttaatt cggaagtatt tcaaac 36

<210> 7<210> 7

<211> 216<211> 216

<212> DNA<212> DNA

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 7<400> 7

gtttgagtgt cttgttaatt cgggagtagc tctctcgttt gagtgtcttg ttaattcgga 6060

agtaagctca acttttgagt gtcttgttaa ttcggaagta tctcaaacgt ttgagtgtct 120120

tgttaattca gaagtatttc aaacgtttga gtgtcttgtt aattcggaag tattccaaac 180180

gtttgagtgt cttgttaatt cggaagtatt tcaaac 216gtttgagtgt cttgttaatt cggaagtatt tcaaac 216

<210> 8<210> 8

<211> 71<211> 71

<212> RNA<212>RNA

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 8<400> 8

aauuaacaag augaguucaa aucaggcucc uagagagauc cgaacuuacc uucauggcgg 60aauuaacaag augaguucaa aucaggcucc uagagagauc cgaacuuacc uucauggcgg 60

gcauugugcc c 71gcauugugcc c 71

<210> 9<210> 9

<211> 95<211> 95

<212> RNA<212>RNA

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 9<400> 9

guuugagugu cuuguuaauu gaaaaauuaa caagaugagu ucaaaucagg cuccuagaga 60guuugagugu cuuguuaauu gaaaaauuaa caagaugagu ucaaaucagg cuccuagaga 60

gauccgaacu uaccuucaug gcgggcauug ugccc 95gauccgaacu uaccuucaug gcgggcauug ugccc 95

<210> 10<210> 10

<211> 91<211> 91

<212> RNA<212>RNA

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 10<400> 10

guuugagugu cuuguuaaga aauuaacaag augaguucaa aucaggcucc uagagagauc 60guuugagugu cuuguuaaga aauuaacaag augaguucaa aucaggcucc uagagagauc 60

cgaacuuacc uucauggcgg gcauugugcc c 91cgaacuuacc uucauggcgg gcauugugcc c 91

<210> 11<210> 11

<211> 89<211> 89

<212> RNA<212>RNA

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 11<400> 11

guuugagugu cuuguuagaa auaacaagau gaguucaaau caggcuccua gagagauccg 60guuugagugu cuuguuagaa auaacaagau gaguucaaau caggcuccua gagagauccg 60

aacuuaccuu cauggcgggc auugugccc 89aacuuaccuu cauggcgggc auugugccc 89

<210> 12<210> 12

<211> 87<211> 87

<212> RNA<212>RNA

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 12<400> 12

guuugagugu cuuguugaaa aacaagauga guucaaauca ggcuccuaga gagauccgaa 60guuugagugu cuuguugaaa aacaagauga guucaaauca ggcuccuaga gagauccgaa 60

cuuaccuuca uggcgggcau ugugccc 87cuuaccuuca uggcgggcau ugugccc 87

<210> 13<210> 13

<211> 85<211> 85

<212> RNA<212>RNA

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 13<400> 13

guuugagugu cuugugaaaa caagaugagu ucaaaucagg cuccuagaga gauccgaacu 60guuugagugu cuugugaaaa caagaugagu ucaaaucagg cuccuagaga gauccgaacu 60

uaccuucaug gcgggcauug ugccc 85uaccuucaug gcgggcauug ugccc 85

<210> 14<210> 14

<211> 83<211> 83

<212> RNA<212>RNA

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 14<400> 14

guuugagugu cuuggaaaca agaugaguuc aaaucaggcu ccuagagaga uccgaacuua 60guuugagugu cuuggaaaca agaugaguuc aaaucaggcu ccuagagaga uccgaacuua 60

ccuucauggc gggcauugug ccc 83ccuucauggc gggcauugug ccc 83

<210> 15<210> 15

<211> 79<211> 79

<212> RNA<212>RNA

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 15<400> 15

guuugagugu cugaaaagau gaguucaaau caggcuccua gagagauccg aacuuaccuu 60guuugagugu cugaaaagau gaguucaaau caggcuccua gagagauccg aacuuaccuu 60

cauggcgggc auugugccc 79cauggcggc auugugccc 79

<210> 16<210> 16

<211> 75<211> 75

<212> RNA<212>RNA

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 16<400> 16

guuugagugu gaaaaugagu ucaaaucagg cuccuagaga gauccgaacu uaccuucaug 60guuugagugu gaaaaugagu ucaaaucagg cuccuagaga gauccgaacu uaccuucaug 60

gcgggcauug ugccc 75gcgggcauug ugccc 75

<210> 17<210> 17

<211> 71<211> 71

<212> RNA<212>RNA

<213> Faecalibaculum rodentium<213> Faecalibaculum rodentium

<400> 17<400> 17

guuugaguga aagaguucaa aucaggcucc uagagagauc cgaacuuacc uucauggcgg 60guuugaguga aagaguucaa aucaggcucc uagagagauc cgaacuuacc uucauggcgg 60

gcauugugcc c 71gcauugugcc c 71

<210> 18<210> 18

<211> 69<211> 69

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<223> Synthetic<223> Synthetic

<400> 18<400> 18

ctacctgcat accgttatta acatatgaca actcaattaa acgccacatc catcggcgct 60ctacctgcat accgttatta acatatgaca actcaattaa acgccacatc catcggcgct 60

ttggtcggc 69ttggtcggc 69

<210> 19<210> 19

<211> 62<211> 62

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<223> Synthetic<223> Synthetic

<400> 19<400> 19

atgttaccac tggattgagg ataccgttat taacatatga caactcaatt aaactctggt 60atgttaccac tggattgagg ataccgttat taacatatga caactcaatt aaactctggt 60

ac 62ac62

<210> 20<210> 20

<211> 69<211> 69

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<223> Synthetic<223> Synthetic

<400> 20<400> 20

tcagtttata tgagttacaa cgaacaccgt ttaattgagt tgtcatatgt taataacggt 60tcagtttata tgagttacaa cgaacaccgt ttaattgagt tgtcatatgt taataacggt 60

attcaggta 69attcaggta 69

<210> 21<210> 21

<211> 69<211> 69

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<223> Synthetic<223> Synthetic

<400> 21<400> 21

ctacctacat accgttatta acatatgaca actcaattaa acgtcagcac ctgggacccc 60ctacctacat accgttatta acatatgaca actcaattaa acgtcagcac ctgggacccc 60

gccaccgtg 69gccaccgtg 69

<210> 22<210> 22

<211> 34<211> 34

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<223> Synthetic<223> Synthetic

<400> 22<400> 22

gtttaattga gttgtcatat gttaataacg gtat 34gtttaattga gttgtcatat gttaataacg gtat 34

<210> 23<210> 23

<211> 26<211> 26

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<221> misc_feature<221> misc_feature

<222> (22)..(26)<222> (22)..(26)

<223> n is a, c, g, or t;r is a or g;w is a or t<223> n is a, c, g, or t;r is a or g;w is a or t

<400> 23<400> 23

tgttaccact ggattgaggt cnnrwr 26tgttaccact ggattgaggt cnnrwr 26

<210> 24<210> 24

<211> 26<211> 26

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<223> Synthetic<223> Synthetic

<400> 24<400> 24

tgttaccact ggattgaggt ctggta 26tgttaccact ggattgaggt ctggta 26

<210> 25<210> 25

<211> 26<211> 26

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<223> Synthetic<223> Synthetic

<400> 25<400> 25

aagaaccact ggattgaggt ctggct 26aagaaccact ggattgaggt ctggct 26

<210> 26<210> 26

<211> 26<211> 26

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<223> Synthetic<223> Synthetic

<400> 26<400> 26

gggaaccact ggattaaggt ccagat 26gggaaccact ggattaaggt ccagat 26

<210> 27<210> 27

<211> 26<211> 26

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<223> Synthetic<223> Synthetic

<400> 27<400> 27

agttaccaat ggattgagat ggggag 26agttaccaat ggattgagat ggggag 26

<210> 28<210> 28

<211> 26<211> 26

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<221> misc_feature<221> misc_feature

<222> (22)..(26)<222> (22)..(26)

<223> n is a, c, g, or t;r is a or g;w is a or t<223> n is a, c, g, or t;r is a or g;w is a or t

<400> 28<400> 28

aaaaaggaag gagttctttg tnnrwr 26aaaaaggaag gagttctttg tnnrwr 26

<210> 29<210> 29

<211> 26<211> 26

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<223> Synthetic<223> Synthetic

<400> 29<400> 29

aaaaaggaag gagttctttg taggta 26aaaaaggaag gagttctttg taggta 26

<210> 30<210> 30

<211> 26<211> 26

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<223> Synthetic<223> Synthetic

<400> 30<400> 30

taaaaggaag gtgttctttg tggggt 26taaaaggaag gtgttctttg tggggt 26

<210> 31<210> 31

<211> 26<211> 26

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<223> Synthetic<223> Synthetic

<400> 31<400> 31

gaaaaggaag gtgctctttg tgggtg 26gaaaaggaag gtgctctttg tgggtg 26

<210> 32<210> 32

<211> 26<211> 26

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<223> Synthetic<223> Synthetic

<400> 32<400> 32

ggaaaaggtg gaattctttg ttggta 26ggaaaaggtg gaattctttg ttggta 26

<210> 33<210> 33

<211> 17<211> 17

<212> DNA<212> DNA

<213> Artificial Sequence<213> Artificial Sequence

<223> Synthetic<223> Synthetic

<400> 33<400> 33

cgaacacctc aggtaat 17cgaacacctc aggtaat 17

<---<---

Claims (37)

1. Система редактирования генома CRISPR/Cas9 типа II, отличающаяся тем, что система содержит белок Cas9, вспомогательные белки, crРНК (CRISPR РНК) и tracrРНК (трансактивированную CRISPR РНК) в функциональной форме комплекса РНП (рибонуклеопротеиновый комплекс) белка Cas9 и направляющей РНК, образованной путем гибридизации crРНК с tracrРНК;1. Type II CRISPR/Cas9 genome editing system, characterized in that the system contains the Cas9 protein, accessory proteins, crRNA (CRISPR RNA) and tracrRNA (transactivated CRISPR RNA) in the functional form of the RNP complex (ribonucleoprotein complex) of the Cas9 protein and guide RNA, formed by hybridization of crRNA with tracrRNA; при этом белок Cas9 представляет собой ДНК-эндонуклеазу и имеет аминокислотную последовательность, как показано в SEQ ID NO: 1, или аминокислотную последовательность, имеющую ту же функцию аминокислотной последовательности, как показано в SEQ ID NO: 1, и имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с аминокислотной последовательностью, как показано в SEQ ID NO: 1;wherein the Cas9 protein is a DNA endonuclease and has an amino acid sequence as shown in SEQ ID NO: 1, or an amino acid sequence having the same function of the amino acid sequence as shown in SEQ ID NO: 1 and having at least 80% , 85%, 90%, 95%, 98% or 99% homology with the amino acid sequence as shown in SEQ ID NO: 1; где CRISPR РНК создается путем транскрипции массива CRISPR и имеет последовательность РНК, как показано в SEQ ID NO: 5, или последовательность РНК, имеющую ту же функцию последовательности РНК, как показано в SEQ ID NO: 5, и имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с последовательностью нуклеиновой кислоты, как показано в SEQ ID NO: 5; иwhere CRISPR RNA is generated by transcription of a CRISPR array and has an RNA sequence as shown in SEQ ID NO: 5, or an RNA sequence having the same function as an RNA sequence as shown in SEQ ID NO: 5 and having at least 80%, 85%, 90%, 95%, 98% or 99% homology to the nucleic acid sequence as shown in SEQ ID NO: 5; And где трансактивированная CRISPR РНК содержит последовательность, комплементарную последовательности прямого повтора CRISPR РНК, а трансактивированная CRISPR РНК имеет последовательность нуклеиновой кислоты, как показано в SEQ ID NO: 8, или последовательность нуклеиновой кислоты, имеющую ту же функцию последовательности нуклеиновой кислоты, как показано в SEQ ID NO: 8, и имеющую по меньшей мере 70%, 80%, 85%, 90%, 95%, 98% или 99% гомологию с последовательностью нуклеиновой кислоты, как показано в SEQ ID NO: 8.where the transactivated CRISPR RNA contains a sequence complementary to the CRISPR RNA direct repeat sequence and the transactivated CRISPR RNA has a nucleic acid sequence as shown in SEQ ID NO: 8 or a nucleic acid sequence having the same function as a nucleic acid sequence as shown in SEQ ID NO: 8, and having at least 70%, 80%, 85%, 90%, 95%, 98% or 99% homology with the nucleic acid sequence as shown in SEQ ID NO: 8. 2. Система редактирования генома CRISPR/Cas9 типа II по п. 1, отличающаяся тем, что белок Cas9 расщепляет двухцепочечную ДНК, комплементарную crРНК выше последовательности PAM, с помощью нуклеазного домена, при этом нуклеазный домен выбран из HNH-подобного домена нуклеазы, RuvC-подобного домена нуклеазы или их комбинации.2. Type II CRISPR/Cas9 genome editing system according to claim 1, characterized in that the Cas9 protein cleaves double-stranded DNA complementary to crRNA above the PAM sequence using a nuclease domain, while the nuclease domain is selected from the HNH-like nuclease domain, RuvC- a similar nuclease domain; or a combination thereof. 3. Система редактирования генома CRISPR/Cas9 типа II по п. 1, отличающаяся тем, что вспомогательные белки включают вспомогательный белок Cas1, вспомогательный белок Cas2 и вспомогательный белок Csn2;3. The type II CRISPR/Cas9 genome editing system according to claim 1, wherein the accessory proteins include the Cas1 accessory protein, the Cas2 accessory protein, and the Csn2 accessory protein; при этом вспомогательный белок Cas1 имеет аминокислотную последовательность, как показано в SEQ ID NO: 2, или аминокислотную последовательность, имеющую ту же функцию аминокислотной последовательности, как показано в SEQ ID NO: 2, и имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с аминокислотной последовательностью, как показано в SEQ ID NO: 2;wherein the Cas1 accessory protein has an amino acid sequence as shown in SEQ ID NO: 2, or an amino acid sequence having the same function of the amino acid sequence as shown in SEQ ID NO: 2 and having at least 80%, 85%, 90 %, 95%, 98% or 99% homology to the amino acid sequence as shown in SEQ ID NO: 2; при этом вспомогательный белок Cas2 имеет аминокислотную последовательность, как показано в SEQ ID NO: 3, или аминокислотную последовательность, имеющую ту же функцию аминокислотной последовательности, как показано в SEQ ID NO: 3, и имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с аминокислотной последовательностью, как показано в SEQ ID NO: 3;wherein the Cas2 accessory protein has an amino acid sequence as shown in SEQ ID NO: 3, or an amino acid sequence having the same function of the amino acid sequence as shown in SEQ ID NO: 3 and having at least 80%, 85%, 90 %, 95%, 98% or 99% homology to the amino acid sequence as shown in SEQ ID NO: 3; при этом вспомогательный белок Csn2 имеет аминокислотную последовательность, как показано в SEQ ID NO: 4, или аминокислотную последовательность, имеющую ту же функцию аминокислотной последовательности, как показано в SEQ ID NO: 4, и имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с аминокислотной последовательностью, как показано в SEQ ID NO: 4.wherein the Csn2 accessory protein has an amino acid sequence as shown in SEQ ID NO: 4, or an amino acid sequence having the same function of the amino acid sequence as shown in SEQ ID NO: 4 and having at least 80%, 85%, 90 %, 95%, 98% or 99% homology to the amino acid sequence as shown in SEQ ID NO: 4. 4. Система редактирования генома CRISPR/Cas9 типа II по п. 1, отличающаяся тем, что массив CRISPR содержит последовательность прямого повтора и спейсерную последовательность, где последовательность прямого повтора имеет последовательность нуклеиновой кислоты, как показано в SEQ ID NO: 6, или последовательность нуклеиновой кислоты, имеющую ту же функцию последовательности нуклеиновой кислоты, как показано в SEQ ID NO: 6, и имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с последовательностью нуклеиновой кислоты, как показано в SEQ ID NO: 6; и где спейсерная последовательность имеет последовательность нуклеиновой кислоты, как показано в SEQ ID NO: 7, или последовательность нуклеиновой кислоты, имеющую ту же функцию последовательности нуклеиновой кислоты, как показано в SEQ ID NO: 7, и имеющую по меньшей мере 80%, 85%, 90%, 95%, 98% или 99% гомологию с последовательностью нуклеиновой кислоты, как показано в SEQ ID NO: 7.4. Type II CRISPR/Cas9 genome editing system according to claim 1, characterized in that the CRISPR array contains a direct repeat sequence and a spacer sequence, where the direct repeat sequence has a nucleic acid sequence as shown in SEQ ID NO: 6, or a nucleic acid sequence acid having the same function of the nucleic acid sequence as shown in SEQ ID NO: 6 and having at least 80%, 85%, 90%, 95%, 98% or 99% homology with the nucleic acid sequence as shown in SEQ ID NO: 6; and where the spacer sequence has a nucleic acid sequence as shown in SEQ ID NO: 7, or a nucleic acid sequence having the same function as a nucleic acid sequence as shown in SEQ ID NO: 7, and having at least 80%, 85% , 90%, 95%, 98% or 99% homology to the nucleic acid sequence as shown in SEQ ID NO: 7. 5. Система редактирования генома CRISPR/Cas9 типа II по п. 1, отличающаяся тем, что направляющая РНК, образованная путем гибридизации crРНК с tracrРНК, имеет каркас, состоящий из последовательности 7–24 нуклеотидов последовательности прямого повтора crРНК и последовательности tracrРНК; предпочтительно две части слиты линкером "GAAA", "TGAA" или "AAAC" с образованием каркаса sgРНК;5. Type II CRISPR/Cas9 genome editing system according to claim 1, characterized in that the guide RNA formed by hybridization of crRNA with tracrRNA has a framework consisting of a sequence of 7–24 nucleotides of a crRNA direct repeat sequence and a tracrRNA sequence; preferably the two parts are fused with a "GAAA", "TGAA" or "AAAC" linker to form an sgRNA backbone; предпочтительно каркас sgРНК, образованный путем слияния последовательности прямого повтора crРНК из 20 нуклеотидов и полноразмерной последовательности tracrРНК с помощью «GAAA», показан в SEQ ID NO: 9, и на этой основе предпочтительно высокоэффективным вариантом каркаса sgРНК являетсяpreferably an sgRNA framework formed by fusing a 20 nt crRNA direct repeat sequence and a full-length tracrRNA sequence with "GAAA" is shown in SEQ ID NO: 9, and on this basis, preferably a highly efficient variant of the sgRNA framework is каркас sgРНК, образованный путем слияния первых 18–14 нуклеотидов последовательности прямого повтора crРНК и последних 69–65 нуклеотидов tracrРНК с помощью линкерной последовательности, которая представляет собой GAAA, предпочтительно выбранной из следующих пяти каркасов:an sgRNA backbone formed by fusing the first 18-14 nucleotides of a crRNA direct repeat sequence and the last 69-65 nucleotides of tracrRNA with a linker sequence that is GAAA, preferably selected from the following five scaffolds: (1) каркас sgРНК длиной 91 нуклеотид, который содержит 18 нуклеотидов последовательности прямого повтора и 69 нуклеотидов tracrРНК, как показано в SEQ ID NO: 10;(1) a 91 nucleotide long sgRNA backbone that contains 18 nucleotides of the direct repeat sequence and 69 nucleotides of tracrRNA as shown in SEQ ID NO: 10; (2) каркас sgРНК длиной 89 нуклеотидов, который содержит 17 нуклеотидов последовательности прямого повтора и 68 нуклеотидов tracrРНК, как показано в SEQ ID NO: 11;(2) an 89 nt sgRNA backbone that contains 17 nt of the direct repeat sequence and 68 nt of tracrRNA as shown in SEQ ID NO: 11; (3) каркас sgРНК длиной 87 нуклеотидов, который содержит 16 нуклеотидов последовательности прямого повтора и 67 нуклеотидов tracrРНК, как показано в SEQ ID NO: 12;(3) an 87 nt sgRNA backbone that contains 16 nt of direct repeat sequence and 67 nt of tracrRNA as shown in SEQ ID NO: 12; (4) каркас sgРНК длиной 85 нуклеотидов, который содержит 15 нуклеотидов последовательности прямого повтора и 66 нуклеотидов tracrРНК, как показано в SEQ ID NO: 13;(4) an 85 nt sgRNA backbone that contains 15 nt of direct repeat sequence and 66 nt of tracrRNA as shown in SEQ ID NO: 13; (5) каркас sgРНК длиной 83 нуклеотида, который содержит 14 нуклеотидов последовательности прямого повтора и 65 нуклеотидов tracrРНК, как показано в SEQ ID NO: 14;(5) an 83 nucleotide long sgRNA backbone that contains 14 nucleotides of the direct repeat sequence and 65 nucleotides of tracrRNA as shown in SEQ ID NO: 14; необязательно каркас sgРНК имеет последовательность нуклеиновой кислоты, имеющую по меньшей мере 70%, 80%, 85%, 90%, 95%, 98% или 99% гомологию с любой из SEQ ID NO: 9 – 14.optionally, the sgRNA backbone has a nucleic acid sequence having at least 70%, 80%, 85%, 90%, 95%, 98%, or 99% homology to any of SEQ ID NOs: 9-14. 6. Система редактирования генома CRISPR/Cas9 типа II по п. 1, отличающаяся тем, что система редактирования генома CRISPR/Cas9 типа II получена из Faecalibaculum rodentium, и в которой специфическая ДНК связывается или расщепляется в процессе редактирования генома, путем распознавания комплементарного спаривания направляющей РНК и мишени специфической ДНК, причем длина спаренной связывающей части направляющей РНК и мишени специфической ДНК составляет от 14 до 30 пар оснований;6. Type II CRISPR/Cas9 genome editing system according to claim 1, characterized in that the type II CRISPR/Cas9 genome editing system is derived from Faecalibaculum rodentium , and in which specific DNA is bound or cleaved during the genome editing process, by recognizing complementary guide pairing. RNA and specific DNA targets, wherein the length of the paired binding portion of the guide RNA and specific DNA target is 14 to 30 base pairs; ри этом специфическая ДНК представляет собой ДНК прокариот или эукариот.Wherein the specific DNA is prokaryotic or eukaryotic DNA. 7. Система редактирования генома CRISPR/Cas9 типа II по п. 6, отличающаяся тем, что длина спаренной связывающей части направляющей РНК и мишени специфической ДНК составляет 21 пару оснований, 22 пары оснований или 23 пары оснований, и при этом комплекс РНП очень чувствителен к несоответствию 14 пар оснований, близких к мотиву, смежному с протоспейсером, а 14 пар оснований являются затравочной областью.7. Type II CRISPR/Cas9 genome editing system according to claim 6, characterized in that the length of the paired binding portion of the guide RNA and the specific DNA target is 21 base pairs, 22 base pairs, or 23 base pairs, and the RNP complex is very sensitive to mismatch of 14 base pairs close to the motif adjacent to the protospacer, and 14 base pairs are the seed region. 8. Система редактирования генома CRISPR/Cas9 типа II по п. 7, в которой мотив, смежный с протоспейсером, необходимый для функции связывания или расщепления ДНК, представляет собой 5'-NNTA-3' по направлению к нижнему концу последовательности распознавания направляющей РНК/sgРНК, где N является A, T, C или G.8. The type II CRISPR/Cas9 genome editing system of claim 7, wherein the motif adjacent to the protospacer required for DNA binding or cleavage function is 5'-NNTA-3' towards the lower end of the guide RNA recognition sequence/ sgRNA where N is A, T, C or G. 9. Применение системы редактирования генома CRISPR/Cas9 типа II по любому из пп.1-8 для редактирования ДНК.9. Use of the type II CRISPR/Cas9 genome editing system according to any one of claims 1 to 8 for DNA editing. 10. Применение по п. 9, где ДНК представляет собой прокариотическую или эукариотическую ДНК.10. Use according to claim 9, wherein the DNA is prokaryotic or eukaryotic DNA. 11. Применение системы редактирования генома CRISPR/Cas9 типа II по любому из пп. 1-8 для связывания ДНК.11. The use of the CRISPR/Cas9 type II genome editing system according to any one of paragraphs. 1-8 for DNA binding. 12. Применение по п. 11, где ДНК представляет собой прокариотическую или эукариотическую ДНК.12. Use according to claim 11, wherein the DNA is prokaryotic or eukaryotic DNA. 13. Применение системы редактирования генома CRISPR/Cas9 типа II по любому из пп. 1-8 для CRISPR активации.13. The use of the CRISPR/Cas9 type II genome editing system according to any one of paragraphs. 1-8 for CRISPR activation. 14. Применение системы редактирования генома CRISPR/Cas9 типа II по любому из пп. 1-8 для CRISPR интерференции.14. The use of the CRISPR/Cas9 type II genome editing system according to any one of paragraphs. 1-8 for CRISPR interference. 15. Применение системы редактирования генома CRISPR/Cas9 типа II по любому из пп. 1-8 для получения никазы.15. The use of the CRISPR/Cas9 type II genome editing system according to any one of paragraphs. 1-8 to get a niqaza. 16. Применение по п. 15, где никазу получают в прокариоте или эукариоте.16. Use according to claim 15, wherein the niqase is produced in a prokaryote or eukaryote. 17. Применение системы редактирования генома CRISPR/Cas9 типа II по любому из пп. 1-8 для получения мертвого Cas9.17. The use of the CRISPR/Cas9 type II genome editing system according to any one of paragraphs. 1-8 to get a dead Cas9. 18. Применение по п. 17, где мертвый Cas9 получают в прокариоте или эукариоте.18. Use according to claim 17, wherein the dead Cas9 is obtained in a prokaryote or eukaryote. 19. Применение системы редактирования генома CRISPR/Cas9 типа II по любому из пп. 1-8 для получения редактора оснований.19. The use of the CRISPR/Cas9 type II genome editing system according to any one of paragraphs. 1-8 to get the reason editor. 20. Применение по п. 19, где редактор оснований получают в прокариоте или эукариоте.20. Use according to claim 19, wherein the base editor is produced in a prokaryote or eukaryote. 21. Применение системы редактирования генома CRISPR/Cas9 типа II по любому из пп. 1-8 для получения главного редактора.21. The use of the CRISPR/Cas9 type II genome editing system according to any one of paragraphs. 1-8 to get the chief editor. 22. Применение по п. 21, где главный редактор получают в прокариоте или эукариоте.22. Use according to claim 21, where the chief editor is obtained in a prokaryote or eukaryote.
RU2022104506A 2022-02-21 Crispr/cas9 type ii genome editing system and its use RU2794774C1 (en)

Publications (1)

Publication Number Publication Date
RU2794774C1 true RU2794774C1 (en) 2023-04-24

Family

ID=

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018039145A1 (en) * 2016-08-20 2018-03-01 Avellino Lab Usa, Inc. Single guide rna, crispr/cas9 systems, and methods of use thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018039145A1 (en) * 2016-08-20 2018-03-01 Avellino Lab Usa, Inc. Single guide rna, crispr/cas9 systems, and methods of use thereof

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
База данных NCBI Reference Sequence: WP_217947137.1, 18.02.2022. XUELIAN WANG et al., CRISPR-Cas9 System as a Versatile Tool for Genome Engineering in Human Cells, Mol Ther Nucleic Acids. 2016 Nov; 5(11): e388. *
ПУГАЧ К.С. и др. "CRISPR-системы адаптивного иммунитета прокариот", Молекулярная биология, март-апрель 2012, 46(2):195-203. *

Similar Documents

Publication Publication Date Title
US11168324B2 (en) Crispr DNA targeting enzymes and systems
Schmid-Burgk et al. Highly parallel profiling of Cas9 variant specificity
JP7223377B2 (en) Thermostable CAS9 nuclease
US11459588B2 (en) Methods of use of CRISPR CPF1 hybrid DNA/RNA polynucleotides
Li et al. SWISS: multiplexed orthogonal genome editing in plants with a Cas9 nickase and engineered CRISPR RNA scaffolds
WO2022199511A1 (en) Lt1cas13d protein and gene editing system
CN114075559B (en) 2-type CRISPR/Cas9 gene editing system and application thereof
CN113234701B (en) Cpf1 protein and gene editing system
Chen et al. Cas12n nucleases, early evolutionary intermediates of type V CRISPR, comprise a distinct family of miniature genome editors
JP2023121643A (en) Type ii crispr/cas9 genome editing system and the application thereof
RU2794774C1 (en) Crispr/cas9 type ii genome editing system and its use
EP4230734A1 (en) Type ii crispr/cas9 genome editing system and the application thereof
US20230265421A1 (en) Type ii crispr/cas9 genome editing system and the application thereof
AU2022201166B2 (en) Type ii crispr/cas9 genome editing system and the application thereof
KR20230125680A (en) Type ii crispr/cas9 genome editing system and the application thereof
WO2024017189A1 (en) Tnpb-based genome editor
US20240132873A1 (en) Site-specific genome modification technology
US20210395709A1 (en) Methods and compositions involving thermostable cas9 protein variants
JP2023501524A (en) Use of Cas9 protein from the bacterium Pasteurella pneumotropica
Esquerra et al. Identification of the EH CRISPR-Cas9 system on a metagenome and its application to genome engineering
KR20210118817A (en) DNA cutting material