EA041935B1 - DNA CUTTER BASED ON Cas9 PROTEIN FROM BACTERIA Pasteurella Pneumotropica - Google Patents

DNA CUTTER BASED ON Cas9 PROTEIN FROM BACTERIA Pasteurella Pneumotropica Download PDF

Info

Publication number
EA041935B1
EA041935B1 EA202290026 EA041935B1 EA 041935 B1 EA041935 B1 EA 041935B1 EA 202290026 EA202290026 EA 202290026 EA 041935 B1 EA041935 B1 EA 041935B1
Authority
EA
Eurasian Patent Office
Prior art keywords
sequence
dna
protein
ppcas9
amino acid
Prior art date
Application number
EA202290026
Other languages
Russian (ru)
Inventor
Константин Викторович Северинов
Сергей Анатольевич Шмаков
Дарья Николаевна Артамонова
Игнатий Игоревич Горянин
Ольга Сергеевна Мушарова
Юлия Валерьевна Андреева
Татьяна Игоревна Зюбко
Яна Витальевна Федорова
Михаил Алексеевич Ходорковский
Георгий Евгеньевич Побегалов
Анатолий Николаевич Арсениев
Полина Анатольевна Селькова
Александра Андреевна Васильева
Татьяна Олеговна Артамонова
Марина Викторовна Абрамова
Original Assignee
Закрытое Акционерное Общество "Биокад"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Закрытое Акционерное Общество "Биокад" filed Critical Закрытое Акционерное Общество "Биокад"
Publication of EA041935B1 publication Critical patent/EA041935B1/en

Links

Description

Изобретение относится к биотехнологии, а именно к новым ферментам Cas нуклеазам систем CRISPR-Cas, применяемым для разрезания ДНК и редактирования генома различных организмов. Данная технология может применяться в будущем для генной терапии наследственных заболеваний человека, а также для редактирования генома других организмов.SUBSTANCE: invention relates to biotechnology, namely to new Cas enzymes, nucleases of CRISPR-Cas systems, used for cutting DNA and editing the genome of various organisms. This technology can be used in the future for gene therapy of human hereditary diseases, as well as for editing the genome of other organisms.

Уровень техникиState of the art

Изменение последовательности ДНК - одна из актуальных задач биотехнологии на сегодняшний день. Редактирование и изменение геномов эукариотических и прокариотических организмов, а также манипуляции с ДНК in vitro требуют направленного внесения двунитевых разрывов в последовательности ДНК.Changing the DNA sequence is one of the urgent tasks of biotechnology today. Editing and modifying the genomes of eukaryotic and prokaryotic organisms, as well as manipulations with DNA in vitro, require the targeted introduction of double-strand breaks in DNA sequences.

Для решения этой задачи в настоящее время используют следующие методики: искусственные нуклеазные системы, содержащие домены типа цинковые пальцы, TALEN-системы и бактериальные CRISPR-Cas системы. Первые два метода требуют трудозатратой оптимизации аминокислотной последовательности нуклеазы для узнавания конкретной последовательности ДНК. В отличие от них в случае CRISPR-Cas систем структурами, узнающими ДНК-мишень, являются не белки, а короткие направляющие РНК. Разрезание конкретной ДНК-мишени не требует синтеза нуклеазы или ее гена de novo, a обеспечивается за счет использования направляющих РНК, комплементарных целевой последовательности. Это делает CRISPR Cas системы удобными и эффективными инструментами разрезания различных ДНК-последовательностей. Методика позволяет осуществлять единовременное разрезание ДНК в нескольких участках при использовании направляющих РНК разных последовательностей. Такой подход используется в том числе для одновременного изменения нескольких генов в эукариотических организмах.To solve this problem, the following methods are currently used: artificial nuclease systems containing zinc finger domains, TALEN systems, and bacterial CRISPR-Cas systems. The first two methods require labor-intensive optimization of the nuclease amino acid sequence to recognize a particular DNA sequence. In contrast to them, in the case of CRISPR-Cas systems, the structures that recognize the target DNA are not proteins, but short guide RNAs. Cutting a specific target DNA does not require de novo synthesis of the nuclease or its gene, but is achieved through the use of guide RNAs complementary to the target sequence. This makes CRISPR Cas systems convenient and efficient tools for cutting various DNA sequences. The technique allows one-time cutting of DNA in several regions using guide RNAs of different sequences. This approach is used, among other things, to simultaneously change several genes in eukaryotic organisms.

По своей природе CRISPR-Cas системы являются иммунными системами прокариот, способными высокоспецифично вносить разрывы в генетический материал вирусов (Mojica F.J.M. et al. Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements // Journal of molecular evolution. - 2005. - Vol. 80. - No. 2. - P. 174-182). Аббревиатура CRISPR-Cas расшифровывается как Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR associated genes (Jansen R. et al. identification of genes that are associated with DMA repeats in prokaryotes // Molecular microbiology. - 2002. Vol. 43. - No. 8. - P. 1565-1575), что переводе с английского обозначает короткие палиндромные повторы, регулярно расположенные группами, и ассоциированные с ними гены. Все CRISPR-Cas системы состоят из CRISPR кассет и генов, кодирующих различные Cas белки (Jansen R. et al., Molecular microbiology. - 2002. - Vol. 43. - No. 6. - P. 1565-1575). CRISPR кассеты состоят из последовательностейспейсеров, каждая из которых имеет уникальную нуклеотидную последовательность, и повторяющихся палиндромных повторов (Jansen R. et al., Molecular microbiology. - 2002. - Vol. 43. - No. 6. - P. 1565-1575). В результате транскрипции CRISPR кассет и их последующего процессинга образуются направляющие крРНК, которые вместе с Cas белками формируют эффекторный комплекс (Brouns S.J.J. et al. Small CRISPR RNAs guide antiviral defense in prokaryotes // Science. - 2008. - Vol. 321. - No. 5891. - P. 960-984). За счет комплементарного спаривания крРНК с целевым участком ДНК, именуемым протоспейсером, Cas-нуклеаза узнает ДНК-мишень и высокоспецифично вносит в нее разрыв.By their nature, CRISPR-Cas systems are prokaryotic immune systems capable of highly specific ruptures in the genetic material of viruses (Mojica F.J.M. et al. Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements // Journal of molecular evolution. - 2005. - Vol 80. - No. 2. - P. 174-182). The abbreviation CRISPR-Cas stands for Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR associated genes (Jansen R. et al. identification of genes that are associated with DMA repeats in prokaryotes // Molecular microbiology. - 2002. Vol. 43. - No. 8 . - P. 1565-1575), which translated from English means short palindromic repeats, regularly arranged in groups, and the genes associated with them. All CRISPR-Cas systems consist of CRISPR cassettes and genes encoding various Cas proteins (Jansen R. et al., Molecular microbiology. - 2002. - Vol. 43. - No. 6. - P. 1565-1575). CRISPR cassettes consist of spacer sequences, each having a unique nucleotide sequence, and repetitive palindromic repeats (Jansen R. et al., Molecular microbiology. - 2002. - Vol. 43. - No. 6. - P. 1565-1575). As a result of transcription of CRISPR cassettes and their subsequent processing, guide crRNAs are formed, which, together with Cas proteins, form an effector complex (Brouns S.J.J. et al. Small CRISPR RNAs guide antiviral defense in prokaryotes // Science. - 2008. - Vol. 321. - No. 5891. - P. 960-984). By complementary pairing of crRNA with a target DNA region, called a protospacer, Cas nuclease recognizes the target DNA and introduces a break in it in a highly specific manner.

CRISPR-Cas системы, представленные одиночным белком-эффектором, разделяют на шесть различных типов (от I до VI) в зависимости от Cas белков, входящих в состав систем. В 2013 году впервые было предложено использовать систему CRISPR-Cas9, относящуюся к типу II, для редактирования геномной ДНК клеток человека (Cong L., et al., Multiplex genome engineering using CRISPR/Cas systems. Science. 2013 Feb 15; 339(6121):819-23). Система CRISPR-Cas9 II типа отличается простотой состава и механизма работы: для ее функционирования необходимо формирование эффекторного комплекса, состоящего лишь из одного белка Cas9 и двух коротких РНК: крРНК (crRNA) и трейсерной РНК (tracrRNA). Трейсерная РНК комплементарно спаривается с участком крРНК, происходящим из CRISPR повтора, образуя вторичную структуру, необходимую для связывания направляющих РНК с Cas эффектором. Определение последовательности направляющих РНК является важным шагом в характеризации неизученных ранее Cas-ортологов. Эффекторный белок Cas9 является РНК-зависимой ДНК эндонуклеазой с двумя нуклеазными доменами (HNH и RuvC), вносящими разрывы в комплементарные нити целевой ДНК, таким образом образуя двунитевой разрыв ДНК (Deitcheva E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III //Nature. - 2011. - Vol. 471. - No. 7340. - P. 602).CRISPR-Cas systems represented by a single effector protein are divided into six different types (from I to VI) depending on the Cas proteins that make up the systems. In 2013, it was first proposed to use the type II CRISPR-Cas9 system for editing the genomic DNA of human cells (Cong L., et al., Multiplex genome engineering using CRISPR/Cas systems. Science. 2013 Feb 15; 339(6121 ):819-23). The type II CRISPR-Cas9 system is characterized by a simple composition and mechanism of operation: its functioning requires the formation of an effector complex consisting of only one Cas9 protein and two short RNAs: crRNA (crRNA) and tracer RNA (tracrRNA). The tracer RNA pairs complementarily with a region of crRNA derived from the CRISPR repeat, forming a secondary structure necessary for binding guide RNAs to the Cas effector. Guide RNA sequencing is an important step in the characterization of previously unstudied Cas orthologues. The effector protein Cas9 is an RNA-dependent DNA endonuclease with two nuclease domains (HNH and RuvC) that introduce breaks in the complementary strands of the target DNA, thus forming a double-strand DNA break (Deitcheva E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III //Nature.-2011.-Vol.471.-No.7340.-P.602).

На сегодняшний день известно несколько CRISPR-Cas нуклеаз, способных направлено и специфично вносить двунитевые разрывы в ДНК. Технология CRISPR-Cas9 является одной из самых современных и быстроразвивающихся методик внесения разрывов в ДНК различных организмов, начиная от бактериальных штаммов и заканчивая клетками человека, а также in vitro (Song M. The CRISPR/Cas9 system: Their delivery, in vivo and ex vivo applications and clinical development by startups. Biotechnol Prog. 2017 Jul; 33(4):1035-1045).To date, several CRISPR-Cas nucleases are known that can introduce double-strand breaks in DNA in a targeted and specific manner. CRISPR-Cas9 technology is one of the most modern and rapidly developing methods for introducing breaks into the DNA of various organisms, ranging from bacterial strains to human cells, as well as in vitro (Song M. The CRISPR/Cas9 system: Their delivery, in vivo and ex vivo applications and clinical development by startups Biotechnol Prog 2017 Jul 33(4):1035-1045).

Эффекторному рибонуклеиновому комплексу, состоящему из Cas9 и дуплекса крРНК и тракрРНК, для распознавания и последующего гидролиза ДНК, помимо комплементарного соответствия спейсера крРНК и протоспейсера, необходимо присутствие PAM (от англ.PAM - protospacer adjusted motif) наThe effector ribonucleic complex, consisting of Cas9 and a duplex of crRNA and tracrRNA, for recognition and subsequent hydrolysis of DNA, in addition to the complementary correspondence of the crRNA spacer and protospacer, requires the presence of PAM (from the English PAM - protospacer adjusted motif) on

- 1 041935- 1 041935

ДНК мишени (Mojica F.J.M. et al., 2009). PAM представляет собой строго определенную последовательность из нескольких нуклеотидов, расположенных в системах типа II вплотную либо в нескольких нуклеотидах от 3'-конца протоспейсера на нетаргетной цепи. При отсутствии PAM гидролиза связей в ДНК с образованием двунитевого разрыва не происходит. Необходимость присутствия PAM последовательности на мишени повышает специфичность узнавания, но в то же время накладывает ограничение в выборе целевых участков ДНК, в которые необходимо внести разрыв. Таким образом, наличие нужной PAM последовательности, фланирующей ДНК-мишень с 3'-конца, является характеристикой, ограничивающей применение CRISPR-Cas систем на любых участках ДНК.Target DNA (Mojica F.J.M. et al., 2009). PAM is a strictly defined sequence of several nucleotides located in type II systems close to or a few nucleotides from the 3'-end of the protospacer on the non-targeted strand. In the absence of PAM, hydrolysis of DNA bonds with the formation of a double-strand break does not occur. The need for the presence of a PAM sequence on the target increases the specificity of recognition, but at the same time imposes a restriction on the choice of target DNA regions in which a break must be introduced. Thus, the presence of the desired PAM sequence, which flanking the target DNA from the 3' end, is a characteristic that limits the use of CRISPR-Cas systems on any DNA regions.

Различные CRISPR-Cas белки используют для своей работы разные, оригинальные PAM последовательности. Использование CRISPR-Cas белков с новыми разнообразными PAM последовательностями необходимо для обеспечения возможности изменения любого участка ДНК, как in vitro, так и в геноме живых организмов. Изменение эукариотических геномов также требует использования нуклеаз малого размера для обеспечения доставки CRISPR-Cas систем в клетки посредством AAV вирусов.Different CRISPR-Cas proteins use different, original PAM sequences for their work. The use of CRISPR-Cas proteins with new diverse PAM sequences is necessary to ensure the possibility of changing any DNA region, both in vitro and in the genome of living organisms. Altering eukaryotic genomes also requires the use of small nucleases to enable delivery of CRISPR-Cas systems to cells via AAV viruses.

Несмотря на известность ряда способов разрезания ДНК и изменения последовательности геномной ДНК, на сегодняшний день сохраняется потребность в новых эффективных инструментах для модификации ДНК в различных организмах и в строго определенных местах последовательности ДНК.Despite the popularity of a number of methods for cutting DNA and changing the sequence of genomic DNA, today there is a need for new effective tools for modifying DNA in various organisms and at strictly defined places in the DNA sequence.

Сущность изобретенияThe essence of the invention

Задачей настоящего изобретения является создание новых инструментов для изменения последовательности геномной ДНК одноклеточных или многоклеточных организмов на основе систем CRISPR-Cas9. Существующие в настоящее время системы имеют ограниченное применение из-за специфичной последовательности PAM, которая должна присутствовать на 3'-конце участка ДНК, подвергающегося модификации. Поиск новых ферментов Cas9 с другими PAM последовательностями позволит расширить арсенал имеющихся средств для образования двунитевого разрыва в необходимых, строго определенных местах в молекулах ДНК разных организмов. Для решения этой задачи авторами была охарактеризована ранее предсказанная для бактерии Pasteurella pneumotropica (P. pneumotropica) CRISPR нуклеаза II типа PpCas9, которая может быть применена для внесения направленных изменений в геном как этого, так и других организмов. Существенными признаками, отличающими настоящее изобретение, являются (а) короткая, отличающаяся от других известных последовательность PAM; (б) относительно малый размер охарактеризованного белка PpCas9 - 1055 аминокислотных остатков (а.о.).The objective of the present invention is to create new tools for changing the sequence of genomic DNA of unicellular or multicellular organisms based on CRISPR-Cas9 systems. Current systems are of limited use due to the specific PAM sequence that must be present at the 3' end of the DNA region to be modified. The search for new Cas9 enzymes with other PAM sequences will expand the arsenal of available tools for the formation of a double-strand break in the necessary, strictly defined places in the DNA molecules of different organisms. To solve this problem, the authors characterized the CRISPR type II nuclease PpCas9, previously predicted for the bacterium Pasteurella pneumotropica (P. pneumotropica), which can be used to introduce targeted changes in the genome of both this and other organisms. The essential features that distinguish the present invention are (a) a short PAM sequence different from other known ones; (b) the relatively small size of the characterized PpCas9 protein - 1055 amino acid residues (a.a.).

Указанная задача решается путем применения белка, содержащего аминокислотную последовательность SEQ ID NO: 1 или содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5'-NNNN(A/G)T-3' в указанной молекуле ДНК. В некоторых вариантах изобретения данное применение характеризуется тем, что образование двунитевого разрыва в молекуле ДНК происходит при температуре от 35 до 45°C.This problem is solved by using a protein containing the amino acid sequence of SEQ ID NO: 1 or containing an amino acid sequence that is at least 95% identical to the amino acid sequence of SEQ ID NO: 1 and differs compared to SEQ ID NO: 1 only in non-conservative amino acids. residues, to form a double-strand break in the DNA molecule, located immediately before the nucleotide sequence 5'-NNNN(A/G)T-3' in the specified DNA molecule. In some embodiments of the invention, this application is characterized in that the formation of a double-strand break in the DNA molecule occurs at a temperature of from 35 to 45°C.

Указанная задача также решается путем создания способа изменения последовательности геномной ДНК одноклеточного или многоклеточного организма, включающего введение по меньшей мере в одну клетку этого организма эффективного количества а) либо белка, содержащего аминокислотную последовательность SEQ ID NO: 1, либо нуклеиновой кислоты, кодирующей белок, содержащий аминокислотную последовательность SEQ ID NO: 1; и б) либо направляющей РНК, содержащей последовательность, образующую дуплекс с нуклеотидной последовательностью участка геномной ДНК организма, непосредственно примыкающей к нуклеотидной последовательности 5'-NNNN(A/G)T-3', и взаимодействующей с указанным белком после образования дуплекса, либо последовательности ДНК, кодирующей указанную направляющую РНК; при этом взаимодействие указанного белка с направляющей РНК и нуклеотидной последовательностью 5'-NNNN(A/G)T-3' приводит к образованию двунитевого разрыва в последовательности геномной ДНК, непосредственно примыкающей к последовательности 5'-NNNN(A/G)T-3'. В некоторых вариантах изобретения данный способ характеризуется тем, что дополнительно включает введение экзогенной последовательности ДНК одновременно с направляющей РНК.This problem is also solved by creating a method for changing the genomic DNA sequence of a unicellular or multicellular organism, which includes introducing into at least one cell of this organism an effective amount of a) either a protein containing the amino acid sequence of SEQ ID NO: 1, or a nucleic acid encoding a protein containing amino acid sequence SEQ ID NO: 1; and b) either a guide RNA containing a sequence that forms a duplex with the nucleotide sequence of a portion of the organism's genomic DNA immediately adjacent to the 5'-NNNN(A/G)T-3' nucleotide sequence and interacts with said protein after duplex formation, or the sequence DNA encoding said guide RNA; in this case, the interaction of the specified protein with the guide RNA and the 5'-NNNN(A/G)T-3' nucleotide sequence leads to the formation of a double-strand break in the genomic DNA sequence immediately adjacent to the 5'-NNNN(A/G)T-3 sequence '. In some embodiments of the invention, this method is characterized in that it further includes the introduction of an exogenous DNA sequence simultaneously with the guide RNA.

В качестве направляющей РНК может быть использована смесь из крРНК (crRNA) и трейсерной РНК (tracrRNA), способных образовать комплекс с участком целевой ДНК и белком PpCas9. В предпочтительных вариантах изобретения в качестве направляющей РНК может быть использована гибридная РНК, сконструированная на основе крРНК и трейсерной РНК. Методы конструирования гибридной направляющей РНК известны специалистам (Hsu P.D., et al., DNA targeting specificity of RNA-guided Cas9 nucleases. Nat. Biotechnol. 2013 Sep; 31(9):827-32). Один из вариантов конструирования гибридной РНК раскрыт в примерах ниже.As a guide RNA, a mixture of crRNA (crRNA) and tracer RNA (tracrRNA) can be used, capable of forming a complex with the target DNA site and the PpCas9 protein. In preferred embodiments of the invention, a hybrid RNA constructed from crRNA and tracer RNA can be used as guide RNA. Methods for constructing a hybrid guide RNA are known in the art (Hsu P.D., et al., DNA targeting specificity of RNA-guided Cas9 nucleases. Nat. Biotechnol. 2013 Sep; 31(9):827-32). One of the options for constructing hybrid RNA is disclosed in the examples below.

Изобретение может быть использовано как для разрезания целевой ДНК in vitro, так и для модификации генома какого-либо живого организма. Модификация генома может проводиться прямым способом - разрезанием генома в соответствующем сайте, а также вставкой экзогенной последовательности ДНК за счет гомологичной репарации.The invention can be used both for cutting the target DNA in vitro and for modifying the genome of any living organism. Genome modification can be carried out in a direct way - by cutting the genome at the appropriate site, as well as by inserting an exogenous DNA sequence due to homologous repair.

В качестве экзогенной последовательности ДНК может быть использован любой участок двунитеAny part of a double strand can be used as an exogenous DNA sequence.

- 2 041935 вой или однонитевой ДНК из генома организма, отличного от организма, используемого при введении (или смесь таких участков между собой и с другими фрагментами ДНК), при этом этот участок (или смесь участков) предназначен для интеграции в место двухцепочечного разрыва в целевой ДНК, образованного под действием нуклеазы PpCas9. В некоторых вариантах изобретения в качестве экзогенной последовательности ДНК может быть использован участок двухцепочечной ДНК из генома организма, используемого при введении белка PpCas9, но при этом измененный мутациями (заменой нуклеотидов), а также вставками или делециями одного или нескольких нуклеотидов.- 2 041935 howling or single-stranded DNA from the genome of an organism other than the organism used for administration (or a mixture of such regions with each other and with other DNA fragments), while this region (or a mixture of regions) is intended to be integrated into the site of a double-strand break in the target DNA formed by the action of PpCas9 nuclease. In some embodiments of the invention, a portion of double-stranded DNA from the genome of an organism used when introducing the PpCas9 protein, but altered by mutations (substitution of nucleotides), as well as insertions or deletions of one or more nucleotides, can be used as an exogenous DNA sequence.

Техническим результатом настоящего изобретения является повышение универсальности доступных систем CRISPR-Cas9, позволяющее использовать нуклеазу Cas9 для разрезания геномной или плазмидной ДНК в большем количестве специфических сайтов и специфических условий.The technical result of the present invention is to increase the versatility of available CRISPR-Cas9 systems, allowing the use of the Cas9 nuclease to cut genomic or plasmid DNA at more specific sites and specific conditions.

Краткое описание чертежейBrief description of the drawings

Фиг. 1. Схема устройства локуса CRISPR PpCas9 системы. DR - direct repeat, или прямой повтор регулярно повторяющийся участок, входящий в состав CRISPR кассеты.Fig. Fig. 1. Scheme of the CRISPR PpCas9 system locus. DR - direct repeat, or direct repeat is a regularly repeated section that is part of a CRISPR cassette.

Фиг. 2. PAM скрининг in vitro. Схема эксперимента.Fig. 2. PAM screening in vitro. Scheme of the experiment.

Фиг. 3. Разрезание нуклеазой PpCas9 фрагментов 7N библиотеки при разных температурах проведения реакции.Fig. Fig. 3. Cutting fragments of the 7N library with PpCas9 nuclease at different reaction temperatures.

Фиг. 4. (А) Анализ результатов in vitro скрининга нуклеазы PpCas9 с использованием расчета логарифма изменения доли каждого конкретного нуклеотида в каждой позиции PAM (FC). (Б) PAM Logo нуклеазы PpCas9. Для каждой позиции обозначены частоты представленности аденина, цитозина, тимина и гуанина. Высота букв соответствует частоте представленности нуклеотида в данной позиции PAM последовательности.Fig. 4. (A) Analysis of the results of in vitro screening of PpCas9 nuclease using the calculation of the logarithm of the change in the proportion of each specific nucleotide at each PAM position (FC). (B) PAM Logo nuclease PpCas9. For each position, the frequencies of representation of adenine, cytosine, thymine, and guanine are indicated. The height of the letters corresponds to the frequency of the presence of the nucleotide in the given position of the PAM sequence.

Фиг. 5. Проверка влияния однонуклеотидных замен в первой позиции PAM на эффективность разрезания нуклеазой PpCas9 ДНК-мишени.Fig. 5. Testing the effect of single nucleotide substitutions in the first position of PAM on the efficiency of cutting the target DNA with the PpCas9 nuclease.

Фиг. 6. Проверка значимости нуклеотидных позиций в PAM последовательности PpCas9.Fig. 6. Checking the significance of nucleotide positions in the PAM sequence of PpCas9.

Фиг. 7. Проверка влияния замены A на G в 6-й позиции PAM на эффективность разрезания нуклеазой PpCas9 ДНК-мишени.Fig. Fig. 7. Checking the effect of the substitution of A for G at the 6th position of PAM on the efficiency of cutting the target DNA with the PpCas9 nuclease.

Фиг. 8. Проверка влияния однонуклеотидных замен в 7-й позиции PAM на эффективность разрезания нуклеазой PpCas9 ДНК-мишени.Fig. 8. Testing the effect of single nucleotide substitutions in the 7th position of PAM on the efficiency of cutting the target DNA with the PpCas9 nuclease.

Фиг. 9. Разрезание различных сайтов ДНК с помощью белка PpCas9. Дорожки 1 и 2 положительный контроль.Fig. 9. Cutting various DNA sites using the PpCas9 protein. Lanes 1 and 2 are positive controls.

Фиг. 10. Проверка распознавания нуклеазой PpCas9 PAM последовательности CAGCATT. Дорожки 1 и 2 - положительный контроль.Fig. 10. Verification of PpCas9 PAM nuclease recognition of the CAGCATT sequence. Lanes 1 and 2 are positive controls.

Фиг. 11. Схема инструмента разрезания ДНК PpCas9.Fig. 11. Schematic of the PpCas9 DNA cutting tool.

Фиг. 12. Эксперимент по разрезанию ДНК-мишени. Использованы гибридные направляющие РНК разной длины.Fig. 12. Target DNA cutting experiment. Hybrid guide RNAs of various lengths were used.

Фиг. 13. Выравнивание аминокислотных последовательностей белков PpCas9 и Cas9 из Staphylococcus aureus при помощи программы NCBI BLASTp (default parameters).Fig. 13. Alignment of the amino acid sequences of PpCas9 and Cas9 proteins from Staphylococcus aureus using the NCBI BLASTp program (default parameters).

Подробное раскрытие изобретенияDetailed disclosure of the invention

В описании данного изобретения термины включает и включающий интерпретируются как означающие включает, помимо всего прочего. Указанные термины не предназначены для того, чтобы их истолковывали как состоит только из. Если не определено отдельно, технические и научные термины в данном документе имеют стандартные значения, общепринятые в научной и технической литературе.In the description of this invention, the terms includes and including are interpreted as meaning includes, among other things. These terms are not intended to be construed as consisting solely of. Unless otherwise defined, technical and scientific terms in this document have the standard meanings generally accepted in the scientific and technical literature.

Используемый здесь термин процент гомологии двух последовательностей эквивалентен термину процент идентичности двух последовательностей. Идентичность последовательностей определяется на основании референсной последовательности. Алгоритмы для анализа последовательности известны в данной области, такие как BLAST, описанный в Altschul et al., J. Mol. Biol., 215, p. 403-10 (1990). Для целей настоящего изобретения для определения уровня идентичности и сходства между нуклеотидными последовательностями и аминокислотными последовательностями может быть использовано сравнение нуклеотидных и аминокислотных последовательностей, производимое с помощью пакета программ BLAST, предоставляемого National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/blast) с использованием содержащего разрывы выравнивания со стандартными параметрами. Процент идентичности двух последовательностей определяется числом положений идентичных аминокислот в этих двух последовательностях с учетом числа пробелов и длины каждого пробела, которые необходимо ввести для оптимального сопоставления двух последовательностей путем выравнивания. Процент идентичности равен числу идентичных аминокислот в данных положениях с учетом выравнивания последовательностей, разделенному на общее число положений и умноженному на 100.As used herein, the term percent homology of two sequences is equivalent to the term percent identity of two sequences. Sequence identity is determined based on the reference sequence. Algorithms for sequence analysis are known in the art, such as BLAST as described in Altschul et al., J. Mol. Biol., 215, p. 403-10 (1990). For the purposes of the present invention, comparison of nucleotide and amino acid sequences using the BLAST software package provided by the National Center for Biotechnology Information (http://www.ncbi.nlm.nih) can be used to determine the level of identity and similarity between nucleotide sequences and amino acid sequences. .gov/blast) using a broken alignment with default settings. The percent identity of two sequences is determined by the number of positions of identical amino acids in these two sequences, taking into account the number of gaps and the length of each gap, which must be entered for optimal matching of two sequences by alignment. The percent identity is equal to the number of identical amino acids at given positions, taking into account the alignment of the sequences, divided by the total number of positions and multiplied by 100.

Термин специфически гибридизуется относится к ассоциации между двумя одноцепочечными молекулами нуклеиновых кислот или в достаточной степени комплементарными последовательностями, что разрешает такую гибридизацию в предопределенных условиях, обычно использующихся в данной области.The term specifically hybridizes refers to an association between two single-stranded nucleic acid molecules, or sufficiently complementary sequences, to permit such hybridization under predetermined conditions commonly used in the art.

Фраза двунитевой разрыв, расположенный непосредственно перед нуклеотидной последовательPhrase double-strand break located immediately before the nucleotide sequence

- 3 041935 ностью PAM означает, что двунитевой разрыв в целевой последовательности ДНК будет произведен на расстоянии от 0 до 25 нуклеотидов перед нуклеотидной последовательностью PAM.- 3 041935 PAM accuracy means that a double-strand break in the target DNA sequence will be made at a distance of 0 to 25 nucleotides before the PAM nucleotide sequence.

Под экзогенной последовательностью ДНК, вводимой одновременно с направляющей РНК, следует понимать последовательность ДНК, подготовленную специально для специфической модификации двухцепочечной целевой ДНК в месте разрыва, определяемого специфичностью направляющей РНК. Подобной модификацией может быть, например, вставка или делеция определенных нуклеотидов в месте разрыва целевой ДНК. Экзогенной ДНК может служить как участок ДНК из другого организма, так и участок ДНК из того же организма, что и целевая ДНК.An exogenous DNA sequence introduced simultaneously with a guide RNA is to be understood as a DNA sequence prepared specifically for the specific modification of a double-stranded target DNA at the break site determined by the specificity of the guide RNA. Such a modification may be, for example, the insertion or deletion of certain nucleotides at the site of a break in the target DNA. Exogenous DNA can be either a stretch of DNA from another organism or a stretch of DNA from the same organism as the target DNA.

Под белком, содержащим определенную аминокислотную последовательность, следует понимать белок, имеющий аминокислотную последовательность, составленную из указанной аминокислотной последовательности и, возможно, других последовательностей, соединённых пептидными связями с указанной аминокислотной последовательностью. Примером других последовательностей может служить последовательность сигнала ядерной локализации (NLS) или другие последовательности, обеспечивающие повышенную функциональность для указанной аминокислотной последовательности.A protein containing a specific amino acid sequence is to be understood as a protein having an amino acid sequence composed of the specified amino acid sequence and possibly other sequences linked by peptide bonds to the specified amino acid sequence. Other sequences are exemplified by the nuclear localization signal (NLS) sequence or other sequences that provide increased functionality for the specified amino acid sequence.

Под экзогенной последовательностью ДНК, вводимой одновременно с направляющей РНК, следует понимать последовательность ДНК, подготовленную специально для специфической модификации двухцепочечной целевой ДНК в месте разрыва, определяемого специфичностью направляющей РНК. Подобной модификацией может быть, например, вставка или делеция определенных нуклеотидов в месте разрыва целевой ДНК. Экзогенной ДНК может служить как участок ДНК из другого организма, так и участок ДНК из того же организма, что и целевая ДНК.An exogenous DNA sequence introduced simultaneously with a guide RNA is to be understood as a DNA sequence prepared specifically for the specific modification of a double-stranded target DNA at the break site determined by the specificity of the guide RNA. Such a modification may be, for example, the insertion or deletion of certain nucleotides at the site of a break in the target DNA. Exogenous DNA can be either a stretch of DNA from another organism or a stretch of DNA from the same organism as the target DNA.

Под эффективным количеством вводимых в клетку белка и РНК следует понимать такое количество белка и РНК, которое при попадании в указанную клетку будет способно образовать функциональный комплекс, т.е. комплекс, который будет специфически связываться с целевой ДНК и производить в ней двунитевой разрыв в месте, определяемом направляющей РНК и PAM последовательностью на ДНК. Эффективность этого процесса может быть оценена при помощи анализа целевой ДНК, выделенной из указанной клетки с помощью стандартных методов, известных специалистам.An effective amount of protein and RNA introduced into a cell should be understood as such an amount of protein and RNA that, when it enters the specified cell, will be able to form a functional complex, i.e. a complex that will specifically bind to the target DNA and produce a double-strand break in it at a location determined by the guide RNA and PAM sequence on the DNA. The efficiency of this process can be assessed by analyzing the target DNA isolated from said cell using standard methods known to those skilled in the art.

Доставка белка и РНК в клетку может быть осуществлена различными способами. Например, белок может быть доставлен в виде ДНК-плазмиды, которая кодирует ген этого белка, как мРНК для трансляции этого белка в цитоплазме клетки или как рибонуклеопротеидный комплекс, включающий этот белок и направляющую РНК. Доставка может быть осуществлена различными методами, известными специалистам.Delivery of protein and RNA into the cell can be carried out in various ways. For example, a protein can be delivered as a DNA plasmid that encodes the gene for that protein, as an mRNA for translation of that protein in the cytoplasm of a cell, or as a ribonucleoprotein complex that includes the protein and a guide RNA. Delivery can be accomplished by various methods known to those skilled in the art.

Нуклеиновая кислота, кодирующая компоненты системы, может быть введена в клетку, непосредственно или опосредованно, за счет трансфекции или трансформации клеток известными специалистам способами, за счет использования рекомбинантного вируса, за счет манипуляций с клеткой, таких как микроинъекция ДНК и т.п.The nucleic acid encoding the components of the system can be introduced into the cell, directly or indirectly, by transfection or transformation of cells by methods known to those skilled in the art, by the use of a recombinant virus, by cell manipulation such as DNA microinjection, and the like.

Доставка рибонуклеинового комплекса, состоящего из нуклеазы и направляющих РНК и экзогенной ДНК (при необходимости), может осуществляться путем трансфекции комплексов в клетку или за счет механического введения комплекса внутрь клетки, например микроинъекции.Delivery of a ribonucleic complex consisting of a nuclease and guide RNAs and exogenous DNA (if necessary) can be carried out by transfection of the complexes into the cell or by mechanical introduction of the complex into the cell, for example, microinjection.

Молекула нуклеиновой кислоты, кодирующая белок, который необходимо ввести в клетку, может быть интегрирована в хромосому или может представлять собой внехромосомно реплицирующуюся ДНК. В некоторых вариантах для обеспечения эффективной экспрессии гена белка с вводимой в клетку ДНК необходимо изменить последовательность этой ДНК в соответствии с типом клетки в целях оптимизации кодонов при экспрессии, обусловленной неравномерностью частот встречаемости синонимичных кодонов в кодирующих областях генома различных организмов. Оптимизация кодонов необходима для увеличения экспрессии в клетках животных, растений, грибов или микроорганизмов.The nucleic acid molecule encoding the protein to be introduced into the cell may be integrated into a chromosome or may be extrachromosomally replicating DNA. In some embodiments, to ensure efficient expression of a protein gene with DNA introduced into a cell, it is necessary to change the sequence of this DNA in accordance with the cell type in order to optimize codons during expression due to the uneven frequency of occurrence of synonymous codons in the coding regions of the genome of different organisms. Codon optimization is required to increase expression in animal, plant, fungal, or microbial cells.

Для функционирования белка, имеющего последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1, в эукариотической клетке необходимо, чтобы этот белок оказался в ядре этой клетки. Поэтому в некоторых вариантах изобретения для образования двунитевых разрывов в целевой ДНК используют белок, имеющий последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1, и который дополнительно модифицирован с одного или с обоих концов добавлением одного или нескольких сигналов ядерной локализации. Например, может быть использован сигнал ядерной локализации из вируса SV40. Для эффективной доставки в ядро сигнал ядерной локализации может быть отделен от основной последовательности белка спейсерной последовательностью, например, описанной в Shen В., et al. Generation of gene-modified mice via Cas9/RNA-mediated gene targeting, Cell Res. 2013 May; 23(5):720-3. Также в других вариантах осуществления может быть использован другой сигнал ядерной локализации или альтернативный метод доставки указанного белка в ядро клетки.For a protein having a sequence that is at least 95% identical to the amino acid sequence of SEQ ID NO: 1 to function in a eukaryotic cell, the protein must be in the nucleus of that cell. Therefore, in some embodiments of the invention, a protein having a sequence that is at least 95% identical to the amino acid sequence of SEQ ID NO: 1 is used to form double-strand breaks in the target DNA, and which is further modified at one or both ends with the addition of one or more nuclear signals. localization. For example, a nuclear localization signal from the SV40 virus can be used. For efficient delivery to the nucleus, the nuclear localization signal can be separated from the main protein sequence by a spacer sequence, such as that described in Shen B., et al. Generation of gene-modified mice via Cas9/RNA-mediated gene targeting, Cell Res. May 2013; 23(5):720-3. Also, in other embodiments, a different nuclear localization signal or alternative method of delivering said protein to the cell nucleus can be used.

Настоящее изобретение охватывает применение белка из организма P. pneumotropica, гомологичного ранее охарактеризованным белкам Cas9, для внесения двухцепочечных разрывов в молекулы ДНК в строго определенных положениях. Использование CRISPR нуклеаз для внесения направленных изменений в геном имеет ряд преимуществ. Во-первых, специфичность действия системы определяется последовательностью крРНК, что позволяет использовать один тип нуклеазы для всех локусов-мишеней. ВоThe present invention encompasses the use of a protein from P. pneumotropica homologous to previously characterized Cas9 proteins to introduce double-strand breaks in DNA molecules at well-defined positions. The use of CRISPR nucleases to introduce targeted changes in the genome has a number of advantages. First, the specificity of the system's action is determined by the crRNA sequence, which makes it possible to use one type of nuclease for all target loci. In

- 4 041935 вторых, методика позволяет доставить в клетку сразу несколько направляющих РНК, комплементарных разным генам-мишеням, что позволяет осуществлять единовременное изменение сразу нескольких генов.- 4 041935 secondly, the technique makes it possible to deliver into the cell several guide RNAs that are complementary to different target genes at once, which makes it possible to carry out a one-time change in several genes at once.

PpCas9 - Cas нуклеаза, найденная в бактериях Pasteurella pneumotropica ATCC 35149, являющихся патогенами грызунов, обитающих в легких животных. Pasteurella pneumotropica (P. pneumotropica) CRISPR Cas9 система (далее CRISPR PpCas9) относится к IIC типу CRISPR Cas систем и состоит из CRISPR кассеты, несущей четыре прямых повтора (direct repeats, DR) последовательностью 5’ATTATAGCACTGCGAAATGAAAAAGGGAGCTACAAC3’ разделенных последовательностями уникальных спейсеров. Ни один из спейсеров системы не совпадает по последовательности с известными на сегодня бактериофагами или плазмидами, что не позволяет определить требуемый PpCas9 PAM биоинформатическим анализом. К CRISPR кассете прилегает ген эффекторного Cas9 белка PpCas9, а также гены белков Casl и Cas2, участвующих в адаптации, встраивании новых спейсеров. Рядом с Cas генами была обнаружена последовательность, частично комплементарная прямым повторам, складывающаяся в характерную вторичную структуру, - предполагаемая трейсерная РНК (tracrRNA) (фиг. 1).PpCas9 - Cas nuclease found in the bacteria Pasteurella pneumotropica ATCC 35149, which are pathogens of rodents that live in the lungs of animals. Pasteurella pneumotropica (P. pneumotropica) CRISPR Cas9 system (hereinafter CRISPR PpCas9) belongs to type IIC CRISPR Cas systems and consists of a CRISPR cassette carrying four direct repeats (DR) with a sequence of 5'ATTATAGCACTGCGAAATGAAAAAGGGAGCTACAAC3' separated by sequences of unique spacers. None of the spacers of the system matches in sequence with currently known bacteriophages or plasmids, which makes it impossible to determine the required PpCas9 PAM by bioinformatic analysis. The CRISPR cassette is adjacent to the gene of the Cas9 effector protein PpCas9, as well as the genes of the Casl and Cas2 proteins involved in adaptation and incorporation of new spacers. Next to the Cas genes, a sequence partially complementary to direct repeats was found, folding into a characteristic secondary structure, the putative tracer RNA (tracrRNA) (Fig. 1).

Знание характерной архитектуры PHK-Cas белкового комплекса систем ПС типа позволило предсказать направление транскрипции CRISPR кассеты: пре-крРНК транскрибируется в противоположном от Cas генов направлении (фиг. 1).Knowledge of the characteristic architecture of the PHK-Cas protein complex of PS-type systems made it possible to predict the direction of transcription of the CRISPR cassette: pre-crRNA is transcribed in the opposite direction from Cas genes (Fig. 1).

Таким образом, анализ последовательности локуса PpCas9 позволил предсказать последовательности трейсерной и направляющих РНК (табл. 1).Thus, sequence analysis of the PpCas9 locus made it possible to predict the tracer and guide RNA sequences (Table 1).

Таблица 1 Определенные биоинформатическими методами последовательности направляющих РНК системы CRISPR PpCas9.Table 1 Bioinformatically determined guide RNA sequences of the CRISPR PpCas9 system.

Жирным шрифтом обозначена последовательность прямого повтора DRBold indicates the direct repeat sequence DR

Название Name Последовательность Subsequence РрСа&9 трРНК ppCa&9 tRNA 5GCGAAATGAAAAAOGUUGUUACAAUAAGAGAUGAAUUUCUCGCAAAG CTCUGQCUCUUGAAAUUUGGGUUUCAAGAGGCAUCUUUUU-a' 5GCGAAATGAAAAAOGUUGUUACAAUAAGAGAUGAAUUUCUCGCAAAG CTCUGQCUCUUGAAAUUUGGGUUUCAAGAGGCAUCUUUUU-a' PpCas9 крРНК PpCas9 crRNA 5-xxxxxxxxkXXXXXXXxxxxGUUGUAGCUCCCUUUUUCAUUUCGC-3' 5-xxxxxxxxkXXXXXXXxxxxGUUGUAGCUCCCUUUUUCAUUUCGC-3'

Для проверки активности PpCas9 нуклеазы и определения требуемого PpCas9 PAM мотива, были проведены эксперименты по воссозданию реакции разрезания ДНК in vitro. Для определения PAM последовательности белка PpCas9 использовали in vitro разрезание двунитевых PAM библиотек. Для этого необходимо было получить все компоненты эффекторного комплекса PpCas9: направляющие РНК и нуклеазу в рекомбинантной форме. Определение последовательности направляющих РНК позволило синтезировать in vitro молекулы crRNA и tracrRNA. Синтез осуществляли с помощью набора NEB Hi Scribe T7 RNA synthesis. Двунитевые ДНК библиотеки представляли собой фрагменты размером 374 пар нуклеотидов (п.н.), содержащие последовательность протоспейсера, фланкированную рандомизированными семью нуклеотидами (5'-NNNNNNN-3') с 3'- конца:To test PpCas9 nuclease activity and determine the required PpCas9 PAM motif, experiments were performed to recreate the DNA cutting reaction in vitro. To determine the PAM sequence of the PpCas9 protein, in vitro cutting of double-stranded PAM libraries was used. To do this, it was necessary to obtain all components of the PpCas9 effector complex: guide RNA and nuclease in recombinant form. Sequencing of guide RNAs made it possible to synthesize crRNA and tracrRNA molecules in vitro. Synthesis was performed using the NEB Hi Scribe T7 RNA synthesis kit. Double-stranded DNA libraries were fragments of 374 base pairs (bp) containing the protospacer sequence flanked by randomized seven nucleotides (5'-NNNNNNNN-3') from the 3'-end:

5’cccggggtaccacggagagatggtggaaatcatctttctcgtgggcatccttgatggccacctcgtcggaagtgcccacgaggatga cagcaatgccaatgctgggggggctcttctgagaacgagctctgctgcctgacacggccaggacggccaacaccaaccagaactt gggagaacagcactccgctctgggcttcatcttcaactcgtcgactccctgcaaacacaaagaaagagcatgttaaaataggatcta catcacgtaacctgtcttagaagaggctagatactgcaattcaaggaccttatctcctttcattgagcacNNNNNNNaactccatcta ccagcctactctcttatctctggtatt -3 ’5’cccggggtaccacggagagatggtggaaatcatctttttcgtgggcatccttgatggccacctcgtcggaagtgcccacgaggatga cagcaatgccaatgctgggggggctcttctgagaacgagctctgctgcctgacacggccaggacggccaacaccaaccagaactt gggagaacagcactccgctctgggcttcatcttcaactcg -3

Для разрезания этой мишени использовали направляющие РНК следующей последовательности: tracrRNA:Guide RNAs of the following sequence were used to cut this target: tracrRNA:

’ GCGAAATGAAAAACGUUGUUAC AAUAAGAGAUGAAUUUCUCGC AAAGCTCUGCC UCUUGAAAUUUCGGUUUCAAGAGGCAUCUUUUU и crRNA:’ GCGAAATGAAAAACGUUGUUAC AAUAAGAGAUGAAUUUCUCGC AAAGCTCUGCC UCUUGAAAUUUCGGUUUCAAGAGGCAUCUUUUU and crRNA:

5’ uaucuccuuucauugagcacGUUGUAGCUCCCUUUUUCAUUUCGC.5' uaucuccuuucauugagcacGUUGUAGCUCCCUUUUUCAUUUCGC.

Жирным шрифтом выделена последовательность crRNA, комплементарная протоспейсеру (целевой ДНК последовательности).The crRNA sequence complementary to the protospacer (target DNA sequence) is highlighted in bold.

Для получения рекомбинантного белка PpCas9 его ген был клонирован в плазмиду рЕТ21a. В качестве кодирующей ген ДНК, использовалась ДНК, синтезированная в компании Integrated DNA Technologies. Последовательность была кодон-оптимизирована для исключения редких кодонов, встречающихся в геноме P. pneumotropica. Клетки E.coli Rosetta были трансформированы полученной плазмидой рЕТ21 a-6xHis-PpCas9.To obtain the recombinant PpCas9 protein, its gene was cloned into the pET21a plasmid. The DNA synthesized by Integrated DNA Technologies was used as the DNA encoding the gene. The sequence was codon-optimized to eliminate rare codons found in the P. pneumotropica genome. E. coli Rosetta cells were transformed with the resulting plasmid pET21 a-6xHis-PpCas9.

500 мкл ночной культуры разводили в 500 мл среды LB и растили клетки при температуре 37°C до500 µl of overnight culture were diluted in 500 ml of LB medium and the cells were grown at 37°C until

- 5 041935 достижения оптической плотности 0,6 отн.ед. Синтез целевого белка индуцировали добавлением ИПТГ до концентрации 1 мМ, после чего клетки инкубировали при температуре 20°C в течение 6 ч. Затем проводили центрифугирование клеток на скорости 5000xg в течение 30 мин, полученные осадки клеток замораживали при температуре -20°C.- 5 041935 achieve an optical density of 0.6 rel. The synthesis of the target protein was induced by adding IPTG to a concentration of 1 mM, after which the cells were incubated at 20°C for 6 h. Then, the cells were centrifuged at a speed of 5000xg for 30 min, and the resulting cell pellets were frozen at -20°C.

Осадки размораживали на льду в течение 30 мин, ресуспендировали в 15 мл лизисного буфера (Tris-HCl 50мМ pH 8, 500 мМ NaCl, β-меркаптоэтанол 1 мМ, имидазол 10 мМ) с добавлением 15 мг лизоцима и снова инкубировали на льду в течение 30 мин. Затем клетки разрушали воздействием ультразвука в течение 30 мин и центрифугировали в течение 40 мин на скорости 16000xg. Полученный супернатант пропускали через фильтр 0,2 мкм и наносили на колонку HisTrap HP 1 mL (GE Healthcare) на скорости 1 мл/мин.The pellets were thawed on ice for 30 min, resuspended in 15 ml of lysis buffer (Tris-HCl 50 mM pH 8, 500 mM NaCl, β-mercaptoethanol 1 mM, imidazole 10 mM) supplemented with 15 mg of lysozyme, and again incubated on ice for 30 min. The cells were then disrupted by sonication for 30 min and centrifuged for 40 min at 16000xg. The resulting supernatant was passed through a 0.2 µm filter and applied to a HisTrap HP 1 mL column (GE Healthcare) at a rate of 1 mL/min.

Хроматографию проводили при помощи FPLC хроматографа AKTA (GE Healthcare) на скорости 1 мл/мин. Колонку с нанесенным белком промывали 20 мл лизисного буфера с добавлением 30 мМ имидазола, после чего белок смывали лизисным буфером с добавлением 300 мМ имидазола.Chromatography was performed using an AKTA FPLC chromatograph (GE Healthcare) at 1 ml/min. The protein loaded column was washed with 20 ml of lysis buffer with the addition of 30 mM imidazole, after which the protein was washed with lysis buffer with the addition of 300 mM imidazole.

Затем фракцию белка, полученную в ходе аффинной хроматографии, пропускали через гельфильтрационную колонку Superdex 200 10/300 GL (24 мл), уравновешенную следующим буфером: Tris-HCl 50 мМ pH 8, 500 мМ NaCl, 1 мМ DTT. При помощи концентратора Amicon (с фильтром на 30 кДа) фракции, соответствующие мономерной форме белка PpCas9, сконцентрировали до 3 мг/мл, после чего очищенный белок хранили при температуре -80°C в буфере, содержащем 10% глицерин.The affinity chromatography protein fraction was then passed through a Superdex 200 10/300 GL gel filtration column (24 ml) equilibrated with the following buffer: Tris-HCl 50 mM pH 8, 500 mM NaCl, 1 mM DTT. Using an Amicon concentrator (with a 30 kDa filter), fractions corresponding to the monomeric form of the PpCas9 protein were concentrated to 3 mg/ml, after which the purified protein was stored at -80°C in a buffer containing 10% glycerol.

In vitro реакцию порезки линейных PAM библиотек проводили в объёме 20 мкл в следующих условиях. Реакционная смесь состояла из 1X CutSmart буфера (NEB), 5 мМ DTT, 100 нМ PAM-библиотеки, 2 мкМ трРНК/крРНК, 400 нМ белка PpCas9. В качестве контроля аналогичным образом были приготовлены пробы, не содержащие РНК. Пробы инкубировали при различных температурах и анализировали методом гель-электрофореза в 2% агарозном геле. В случае правильного узнавания и специфического разрезания ДНК белком PpCas9 должны формироваться два фрагмента ДНК длиной порядка 326 и 48 пар оснований (см. фиг. 2).In vitro cutting reaction of linear PAM libraries was carried out in a volume of 20 µl under the following conditions. The reaction mixture consisted of 1X CutSmart buffer (NEB), 5 mM DTT, 100 nM PAM library, 2 μM tRNA/crRNA, 400 nM PpCas9 protein. Samples containing no RNA were prepared in a similar way as controls. Samples were incubated at different temperatures and analyzed by gel electrophoresis in 2% agarose gel. In the case of correct recognition and specific cutting of DNA by the PpCas9 protein, two DNA fragments of the order of 326 and 48 base pairs in length should be formed (see Fig. 2).

Результаты опыта показали, что PpCas9 обладает нуклеазной активностью и разрезает часть фрагментов PAM библиотеки. Градиент температур (фиг. 3) показал, что белок активен в диапазоне температур 35-45°C. В дальнейшем в работе в качестве рабочей использовалась температура 42°C.The results of the experiment showed that PpCas9 has nuclease activity and cuts part of the PAM library fragments. The temperature gradient (Fig. 3) showed that the protein is active in the temperature range of 35-45°C. Subsequently, the working temperature was 42°C.

Реакцию разрезания библиотеки повторяли в подобранных условиях. Продукты реакции наносили на 1,5% агарозный гель и подвергали электрофорезу. Непорезанные фрагменты ДНК длиной 374 п.н. экстрагировали из геля и подготавливали для высокоэффективного секвенирования с помощью набора NEB NextUltra II. Образцы секвенировали на платформе lllumina и далее проводили анализ последовательностей биоформатическими методами: определяли разницу в представленности нуклеотидов в отдельных позициях PAM (NNNNNNN) в сравнении с контрольным образцом с использованием подхода, описанного в (Maxwell C.S., et al., A detailed cell-free transcription-translation-based assay to decipher CRISPR protospacer-adjacent motifs. Methods. 2018 Jul 1; 143:48-57). Кроме того, для анализа результатов построили PAM лого (фиг. 4).The library cutting reaction was repeated under adjusted conditions. The reaction products were loaded onto a 1.5% agarose gel and subjected to electrophoresis. Uncut DNA fragments 374 bp long. were extracted from the gel and prepared for high throughput sequencing using the NEB NextUltra II kit. The samples were sequenced on the lllumina platform and then the sequences were analyzed by bioformational methods: the difference in the presence of nucleotides in individual PAM positions (NNNNNNNN) was determined in comparison with the control sample using the approach described in (Maxwell C.S., et al., A detailed cell-free transcription -translation-based assay to decipher CRISPR protospacer-adjacent motifs Methods 2018 Jul 1; 143:48-57). In addition, a PAM logo was built to analyze the results (Fig. 4).

Оба подхода к анализу данных (фиг. 4) указывают на значимость 5, 6 и 7 позиций PAM. Таким образом, в результате in vitro анализа удалось установить предположительную PAM последовательность для PpCas9: NNNNATT. Однако эта последовательность является лишь предположительной в силу неточности результатов, получаемых скрининговыми подходами к определению PAM.Both approaches to data analysis (Fig. 4) indicate the significance of 5, 6 and 7 PAM positions. Thus, as a result of in vitro analysis, it was possible to establish a putative PAM sequence for PpCas9: NNNNATT. However, this sequence is only conjectural due to the inaccuracy of the results obtained by screening approaches to the determination of PAM.

В связи с этим для уточнения последовательности была произведена проверка значимости отдельных позиций последовательности PAM. Для этого проводили реакции in vitro разрезания ДНК фрагментов, содержащих ДНК-мишень 5'-atctcctttcattgagcac-3', фланкированную PAM последовательностью CAACATT или ее производных:In this regard, in order to clarify the sequence, the significance of individual positions of the PAM sequence was checked. For this, in vitro reactions were carried out for cutting DNA fragments containing the target DNA 5'-atctcctttcattgagcac-3' flanked by the PAM sequence CAACATT or its derivatives:

5’cccggggtaccacggagagatggtggaaatcatctttctcgtgggcatccttgatggccacctcgtcggaagtgcccacgaggatga cagcaatgccaatgctgggggggctcttctgagaacgagctctgctgcctgacacggccaggacggccaacaccaaccagaactt gggagaacagcactccgctctgggcttcatcttcaactcgtcgactccctgcaaacacaaagaaagagcatgttaaaataggatctacatcac gtaacctgtcttagaagaggctagatactgcaattcaaggaccttatctcctttcattgagcacCAACATTaactccatcta ccagcctactctcttatctctggtatt- 3 ’5’cccggggtaccacggagagatggtggaaatcatctttttcgtgggcatccttgatggccacctcgtcggaagtgcccacgaggatga cagcaatgccaatgctgggggggctcttctgagaacgagctctgctgcctgacacggccaggacggccaacaccaaccagaactt gggagaacagcactccgctctgggcttcatcttcaactcg tcgactccctgcaaacacaaagaaagagcatgttaaaataggatctacatcac gtaacctgtcttagaagaggctagatactgcaattcaaggaccttatctcctttcattgagcacCAACATTaactccatcta ccagcctactctcttatctctggtatt-3’

Все реакции разрезания ДНК проводили в следующих условиях:All DNA cutting reactions were carried out under the following conditions:

IxCutSmart буфер,ixCutSmart buffer,

400 нМ PpCas9, нМ ДНК, мкМ crRNA, мкМ tracrRNA, время инкубации - 30 мин, температура проведения реакции - 42°C.400 nM PpCas9, nM DNA, μM crRNA, μM tracrRNA, incubation time - 30 min, reaction temperature - 42°C.

Замена первой позиции PAM на все четыре возможных варианта нуклеотидов не повлияла на эффективность работы белка (фиг. 5).The replacement of the first position of PAM with all four possible nucleotide variants did not affect the efficiency of the protein (Fig. 5).

- 6 041935- 6 041935

Предсказанная значимость пятой и шестой позиций была подтверждена экспериментально путем однонуклеотидных замен (пурин на пиримидин, и наоборот) в каждой из позиций PAM. При заменах в пятой и шестой позициях белок практически переставал работать. При замене в седьмой позиции эффективность работы PpCas9 снижалась в два раза, что отражает сниженные требования к нуклеотиду в этой позиции (фиг. 6). Таким образом, согласно полученным результатам in vitro PAM скрининга нуклеазы PpCas9 в пятой позиции PAM наиболее вероятными нуклеотидами являются аденин или гуанин, что удалось подтвердить экспериментально (фиг. 7). Замена A на G никак не снижала эффективность разрезания фрагмента.The predicted significance of the fifth and sixth positions was confirmed experimentally by single nucleotide substitutions (purine to pyrimidine and vice versa) at each of the PAM positions. With substitutions in the fifth and sixth positions, the protein practically stopped working. The substitution at the seventh position reduced the efficiency of PpCas9 by a factor of two, reflecting the reduced requirements for the nucleotide at this position (Fig. 6). Thus, according to the results of in vitro PAM screening of the PpCas9 nuclease in the fifth position of PAM, the most probable nucleotides are adenine or guanine, which was confirmed experimentally (Fig. 7). Replacing A with G did not reduce the efficiency of cutting the fragment in any way.

Согласно результатам in vitro скрининга фрагменты с T либо с C в седьмой позиции должны распознаваться более эффективно. Для окончательной проверки значимости нуклеотидов в этой позиции были проведены дополнительные эксперименты. Результаты проведенных in vitro тестов показали, что при замене нуклеотида 'T' в седьмой позиции на A или G эффективность разрезания снижается на 40-50% (фиг. 8). Таким образом, седьмая позиция PAM является менее консервативной в сравнении с пятой и шестой: пурины в седьмом положении лишь снижают эффективность узнавания, но не препятствуют белку PpCas9 вносить двунитевые разрывы в ДНК.According to the results of in vitro screening, fragments with T or C in the seventh position should be recognized more efficiently. To finally check the significance of nucleotides in this position, additional experiments were carried out. The results of in vitro tests showed that when the nucleotide 'T' in the seventh position is replaced by A or G, the cutting efficiency is reduced by 40-50% (Fig. 8). Thus, the seventh position of PAM is less conservative compared to the fifth and sixth positions: purines in the seventh position only reduce the recognition efficiency, but do not prevent the PpCas9 protein from making double-strand breaks in DNA.

В результате проведенных исследований удалось сделать следующий вывод: PAM, распознаваемый нуклеазой PpCas9, соответствует следующей формуле: 5'-NNNN(A/G)T-3’. Последовательности NNNNRTY (NNNN(A/G)-T-(T/C)) распознаются более эффективно, чем последовательности NNNNRTR (NNNN-(A/G)-T-(A/G)).As a result of the research, the following conclusion was made: PAM recognized by the PpCas9 nuclease corresponds to the following formula: 5'-NNNN(A/G)T-3'. The sequences NNNNRTY (NNNN(A/G)-T-(T/C)) are recognized more efficiently than the sequences NNNNRTR (NNNN-(A/G)-T-(A/G)).

Нижеследующие примеры осуществления способа приведены в целях раскрытия характеристик настоящего изобретения, и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения.The following examples of the implementation of the method are given in order to disclose the characteristics of the present invention, and should not be construed as in any way limiting the scope of the invention.

Пример 1. Тестирование активности белка PpCas9 в разрезании различных ДНК мишеней.Example 1 Testing the activity of the PpCas9 protein in cutting various target DNAs.

Для того чтобы проверить способность PpCas9 узнавать различные последовательности ДНК, фланкированные 5'-NNNN(A/G)T-3' последовательностью, были проведены эксперименты по in vitro разрезанию ДНК-мишеней из последовательности гена grin2b человека (см. табл. 2).In order to test the ability of PpCas9 to recognize different DNA sequences flanked by the 5'-NNNN(A/G)T-3' sequence, in vitro cutting experiments on DNA targets from the human grin2b gene sequence were performed (Table 2).

Таблица 2table 2

ДНК-мишени гена grin2b человека____DNA targets of the human grin2b gene____

последовательностъ sequence РАМ RAM TATGTGGTTTGATTGAGGAG TATGTGGTTTGATTGAGGAG G G А A А A А A С WITH С WITH G G CAGCTGAAGTAATGTTAGAG CAGCTGAAGTAATGTTAGAG С WITH С WITH А A С WITH А A Т T т T AATAAGAAAAACATTATTAT AATAAGAAAAAACATTATTAT С WITH А A С WITH С WITH А A т T т T GGGGGTATAAGTAGAGAAGC GGGGGTATAAGTAGAGAAGC G G С WITH Т T G G С WITH А A т T CGTTCTCAGAAGAGCCCCCC CGTTCTCAGAAGAGCCCCCC С WITH А A G G С WITH А A Т T т T CCCACGAGAAAGATGATTTC CCCACGAGAAAGATGATTTC С WITH А A С WITH С WITH А A т T с With

В реакции разрезания в качестве мишени использовался ПЦР фрагмент гена grin2b, несущий сайты узнавания (табл. 2), предположительно распознаваемые PpCas9 в соответствии с PAM консенсусом 5'-NNNN(A/G)T-3'. Для узнавания этих последовательностей были синтезированы крРНК, направляющие PpCas9 на данные сайты.In the cutting reaction, the PCR fragment of the grin2b gene carrying recognition sites (Table 2) presumably recognized by PpCas9 according to the PAM consensus 5'-NNNN(A/G)T-3' was used as a target. To recognize these sequences, crRNAs were synthesized that direct PpCas9 to these sites.

Реакции разрезания проводились в подобранных для PpCas9 условиях, результат представлен на фиг. 9. Из фиг. 9 видно, что фермент PpCas9 успешно порезал три из четырех мишеней с подходящим PAM.The cutting reactions were carried out under the conditions adjusted for PpCas9, the result is shown in FIG. 9. From FIG. 9 shows that the PpCas9 enzyme successfully cut three of the four targets with the appropriate PAM.

Мишень на шестой дорожке имела PAM последовательность CAGCATT, которая согласно предсказаниям на основании результатов depletion analysis должна эффективно распознаваться белком. Однако в данном эксперименте узнавание данного фрагмента не произошло.The target in lane six had the PAM sequence CAGCATT, which, according to the predictions based on the results of depletion analysis, should be effectively recognized by the protein. However, this fragment was not recognized in this experiment.

Поэтому была произведена дополнительная проверка PAM CAGCATT на другой мишенипротоспейсере, ограниченной таким же PAM (фиг. 10). В этом случае PAM эффективно распознавался, что приводило к порезке ДНК. Таким образом, белок имеет некие дополнительные предпочтения к последовательности ДНК мишени, возможно связанные со вторичной структурой ДНК.Therefore, an additional check of PAM CAGCATT was made on another target protospacer, limited by the same PAM (Fig. 10). In this case, PAM was effectively recognized, leading to DNA cutting. Thus, the protein has some additional preference for the target DNA sequence, possibly related to the secondary structure of the DNA.

Таким образом, проведенные исследовательские испытания показали наличие нуклеазной активности у PpCas9, а также позволили определить его PAM последовательность и верифицировать последовательности направляющих РНК.Thus, the conducted research tests showed the presence of nuclease activity in PpCas9, and also made it possible to determine its PAM sequence and verify the sequences of guide RNAs.

PpCas9 рибонуклеопротеиновый комплекс специфически вносит разрывы в мишени, ограниченные PAM 5'-NNNN(A/G)T-3' с 5'-конца протоспейсера. Схема PpCas9-PHK комплекса представлена на фиг. 11.The PpCas9 ribonucleoprotein complex specifically introduces breaks in the target, limited by PAM 5'-NNNN(A/G)T-3' from the 5' end of the protospacer. A schematic of the PpCas9-RNA complex is shown in FIG. eleven.

Пример 2. Использование гибридной направляющей РНК для разрезания ДНК мишени.Example 2 Use of a hybrid guide RNA to cut a target DNA.

sgRNA - форма направляющих РНК, которая представляет собой слитые воедино tracrRNA (трейсерная РНК) и crRNA. Для подбора оптимальной sgRNA были сконструированы три варианта этой последовательности, отличающиеся длиной tracrRNA - crRNA дуплекса. РНК синтезировали in vitro и проводили с ними эксперименты по разрезанию ДНК-мишени (фиг. 12).sgRNA is a form of guide RNA that is a fusion of tracrRNA (tracer RNA) and crRNA. To select the optimal sgRNA, three variants of this sequence were constructed, differing in the length of the tracrRNA - crRNA duplex. RNA was synthesized in vitro and subjected to target DNA cutting experiments (FIG. 12).

В качестве гибридных РНК были использованы следующие РНК последовательности:The following RNA sequences were used as fusion RNAs:

- 7 041935- 7 041935

- sgRNAI 25DR: UAUCUCCUUUCAUUGAGCACGUUGUAGCUCCCUUUUUCAUUUCGCGAAAGCGAA AUGA AAAACGUUGUUACAAUAAGAGAUGAAUUUCUCGCAAAGCTCTGCCUCUUGAAAUU UCGG UUUCAAGAGGCAUCUUUUU- sgRNAI 25DR: UAUCUCCUUUCAUUGAGCACGUUGUAGCUCCCUUUUUCAUUUCGCGAAAGCGAA AUGA AAAACGUUGUUACAAUAGAGAUGAAUUUCUCGCAAAGCTCTGCCUCUUGAAAUU UCGG UUUCAAGAGGCAUCUUUUU

- sgRNA2 36DR- sgRNA2 36DR

UAUCUCCUUUCAUUGAGCACGUUGUAGCUCCCUUUUUUCAUUUCGCAGUGCUAU AAUG AAAAUUAUAGCACUGCGAAAUGAAAAACGUUGUUACAAUAAGAGAUGAAUUUCU CGCAAA GCUCUGCCUCUUGAAAUUUCGGUUUCAAGAGGCAUCUUUUUUAUCUCCUUUCAUUGAGCACGUUGUAGCUCCCUUUUUCAUUUCGCAGUGCUAU AAUG AAAAUUAUAGCACUGCGAAAUGAAAAAACGUUGUUACAAUAAGAGAUGAAUUUCU CGCAAA GCUCUGCCUCUUGAAAUUUCGGUUUCAAGAGGCAUCUUUUU

Жирным шрифтом обозначена 20-нуклеотидная последовательность, обеспечивающая спаривание с ДНК-мишенью (вариабельная часть sgRNA). Кроме того, в эксперименте делали контрольную пробу без РНК, а также положительный контроль - порезка мишени с помощью crRNA + trRNA.Bold indicates the 20-nucleotide sequence that provides pairing with the target DNA (variable part of sgRNA). In addition, a control sample without RNA was made in the experiment, as well as a positive control - cutting the target with crRNA + trRNA.

В качестве ДНК мишени использовалась последовательность, содержащая сайт узнавания 5'tatctcctttcattgagcac3' с соответствующим консенсусу PAMCAACATT:The sequence containing the recognition site 5'tatctcctttcattgagcac3' with the corresponding PAMCAACATT consensus was used as the target DNA:

5’cccggggtaccacggagagatggtggaaatcatctttctcgtgggcatccttgatggccacctcgtcggaagtgcccacgaggatga cagcaatgccaatgctgggggggctcttctgagaacgagctctgctgcctgacacggccaggacggccaacaccaaccagaactt gggagaacagcactccgctctgggcttcatcttcaactcgtcgactccctgcaaacacaaagaaagagcatgttaaaataggatcta catcacgtaacctgtcttagaagaggctagatactgcaattcaaggaccttatctcctttcattgagcacCAACATTcaactccat ctaccagcctactctcttatctctggtatt - 35’cccggggtaccacggagagatggtggaaatcatctttttcgtgggcatccttgatggccacctcgtcggaagtgcccacgaggatga cagcaatgccaatgctgggggggctcttctgagaacgagctctgctgcctgacacggccaggacggccaacaccaaccagaactt gggagaacagcactccgctctgggcttcatcttcaactcg - 3

Жирным шрифтом обозначен сайт узнавания, прописными буквами - PAM.The recognition site is indicated in bold type, PAM in capital letters.

Реакцию проводили в следующих условиях:The reaction was carried out under the following conditions:

концентрация ДНК последовательности, содержащей PAM (CAACATT), - 20 нМ;concentration of DNA sequence containing PAM (CAACATT), 20 nM;

концентрация белка - 400 нМ;protein concentration - 400 nm;

концентрация РНК -2 мкМ;RNA concentration -2 μM;

время инкубирования - 30 мин;incubation time - 30 min;

температура инкубирования - 37°C.incubation temperature - 37°C.

Подобранные sgRNA1 и sgRNA2 оказались так же эффективны, как и нативные последовательности tracrRNA и crRNA: разрезание произошло в более 80% ДНК-мишенях (фиг. 12).The matched sgRNA1 and sgRNA2 proved to be as efficient as native tracrRNA and crRNA sequences, with cleavage occurring in over 80% of the target DNA (FIG. 12).

Эти варианты гибридной РНК могут быть использованы для разрезания любой другой целевой ДНК при изменении последовательности, непосредственно спаривающейся с ДНК-мишенью.These fusion RNA variants can be used to cut any other target DNA by changing the sequence that directly pairs with the target DNA.

Пример 3. Белки Cas9 из близкородственных организмов, относящихся к P. pneumotropica.Example 3 Cas9 proteins from closely related organisms belonging to P. pneumotropica.

На сегодняшний день в P. pneumotropica не охарактеризовано ни одного фермента системы CRISPR-Cas9. Сравнимый по размерам белок Cas9 из Staphylococcus aureus идентичен PpCas9 на 28% (фиг. 13, степень идентичности была рассчитана по программе BLASTp, default parameters). Похожая степень идентичности существует и для других известных белков Cas9 (не показано).To date, not a single enzyme of the CRISPR-Cas9 system has been characterized in P. pneumotropica. Comparable in size, the Cas9 protein from Staphylococcus aureus is 28% identical to PpCas9 (Fig. 13, the degree of identity was calculated using the BLASTp program, default parameters). A similar degree of identity exists for other known Cas9 proteins (not shown).

Таким образом, белок PpCas9 существенно отличается по аминокислотной последовательности от других Cas9 белков, изученных на сегодняшний день.Thus, the PpCas9 protein differs significantly in amino acid sequence from other Cas9 proteins studied to date.

Специалисту в области генетической инженерии очевидно, что полученный и охарактеризованный в данном описании вариант последовательности белка PpCas9 может быть изменен без изменения функции самого белка (например, направленным мутагенезом аминокислотных остатков, напрямую не влияющих на функциональную активность (Sambrook et al., Molecular Cloning: ALaboratory Manual, (1989), CSHPress, p. 15.3-15.108)). В частности, специалисту известно, что могут быть изменены неконсервативные аминокислотные остатки, не затрагивающие остатки, определяющие функциональность белка (определяющие его функцию или структуру). Примерами таких изменений могут служить замены неконсервативных аминокислотных остатков на гомологичные. Некоторые из участков, содержащих неконсервативные аминокислотные остатки, приведены на фиг. 12. В некоторых вариантах осуществления изобретения возможно использование белка, содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5'-NNNN(A/G)T-3' в указанной молекуле ДНК. Гомологичные белки могут быть получены путем мутагенеза (например, сайт-направленного или ПЦР-опосредуемого мутагенеза) соответствующих молекул нуклеиновых кислот с последующим тестированием кодируемого модифицированного белка Cas9 на сохранение его функций в соответствии с описанными здесь функциональными анализами.It is obvious to a specialist in the field of genetic engineering that the PpCas9 protein sequence variant obtained and characterized in this description can be changed without changing the function of the protein itself (for example, by site-directed mutagenesis of amino acid residues that do not directly affect functional activity (Sambrook et al., Molecular Cloning: ALaboratory Manual, (1989), CSHPress, pp. 15.3-15.108)). In particular, one skilled in the art will be aware that non-conservative amino acid residues can be changed without affecting residues that determine the functionality of the protein (determining its function or structure). Examples of such changes are the replacement of non-conservative amino acid residues with homologous ones. Some of the regions containing non-conservative amino acid residues are shown in FIG. 12. In some embodiments of the invention, it is possible to use a protein containing an amino acid sequence that is at least 95% identical to the amino acid sequence of SEQ ID NO: 1 and differs from SEQ ID NO: 1 only in non-conservative amino acid residues to form a double-stranded break in the DNA molecule located immediately before the nucleotide sequence 5'-NNNN(A/G)T-3' in the specified DNA molecule. Homologous proteins can be obtained by mutagenesis (eg, site-directed or PCR-mediated mutagenesis) of the appropriate nucleic acid molecules, followed by testing the encoded modified Cas9 protein for retention of its functions in accordance with the functional assays described here.

Пример 4.Example 4

Описанная в настоящем изобретении система PpCas9 в комплексе с направляющими РНК может быть использована для изменения последовательности геномной ДНК многоклеточного организма, в том числе эукариотического. Для введения системы PpCas9 в комплексе с направляющими РНК в клетки этого организма (во все клетки или в часть клеток) могут быть применены различные подходы, известныеThe PpCas9 system described in the present invention in combination with guide RNAs can be used to change the genomic DNA sequence of a multicellular organism, including a eukaryotic one. To introduce the PpCas9 system in complex with guide RNAs into the cells of this organism (in all cells or in some cells), various approaches can be applied, known

- 8 041935 специалистам. Например, методы доставки CRISPR-Cas9 систем в клетки организмов раскрыты в источниках (Liu С. et al., Delivery strategies of the CRISPR-Cas9 gene-editing system for therapeutic applications. J. Control Release. 2017 Nov 28; 266:17-26; Lino C.A. et al., Delivering CRISPR: a review of the challenges and approaches. Drug Deliv. 2018 Nov; 25(1):1234-1257) и в источниках, раскрытых внутри этих источников.- 8 041935 specialists. For example, delivery strategies of the CRISPR-Cas9 gene-editing system for therapeutic applications. J. Control Release. 2017 Nov 28; 266:17- 26; Lino C.A. et al., Delivering CRISPR: a review of the challenges and approaches. Drug Deliv. 2018 Nov; 25(1):1234-1257) and in the sources disclosed within those sources.

Для эффективной экспрессии нуклеазы PpCas9 в эукариотических клетках будет желательно провести оптимизацию кодонов для аминокислотной последовательности белка PpCas9 методами, известными специалистам (например, IDT codon optimization tool).For efficient expression of the PpCas9 nuclease in eukaryotic cells, it will be desirable to perform codon optimization for the amino acid sequence of the PpCas9 protein by methods known to those skilled in the art (eg, IDT codon optimization tool).

Для эффективной работы нуклеазы PpCas9 в эукариотических клетках необходимо обеспечить импорт этого белка внутрь ядра эукариотической клетки. Для этого можно использовать сигнал ядерной локализации из Т-антигена вируса SV40 (Lanford et al., Cell, 1986, 46:575-582), соединённый с последовательностью PpCas9 с помощью спейсерной последовательности, описанной в Shen В., et al. Generation of gene-modified mice via Cas9/RNA-mediated gene targeting, Cell Res. 2013 May; 23(5):720-3, или без нее. Таким образом, полная аминокислотная последовательность нуклеазы, транспортируемой внутрь ядра эукариотической клетки, будет представлять собой следующую последовательность: MAPKKKRKVGIHGVPAA-PpCas9-KRPAATKKAGQAKKKK (далее PpCas9 NLS). Для доставки белка с приведенной выше аминокислотной последовательностью могут быть использованы по меньшей мере два подхода.For the PpCas9 nuclease to work effectively in eukaryotic cells, it is necessary to ensure the import of this protein into the eukaryotic cell nucleus. This can be done using the nuclear localization signal from the SV40 T antigen (Lanford et al., Cell, 1986, 46:575-582) fused to the PpCas9 sequence using the spacer sequence described in Shen B., et al. Generation of gene-modified mice via Cas9/RNA-mediated gene targeting, Cell Res. May 2013; 23(5):720-3, or without it. Thus, the complete amino acid sequence of a nuclease transported into the nucleus of a eukaryotic cell will be the following sequence: MAPKKKRKVGIHGVPAA-PpCas9-KRPAATKKAGQAKKKK (hereinafter PpCas9 NLS). At least two approaches can be used to deliver a protein with the above amino acid sequence.

Доставка в виде гена осуществляется путем создания плазмиды, несущей ген PpCas9 NLS под регуляцией промотора (например, CMV промотора) и последовательности, кодирующей направляющие РНК под регуляцией U6 промотора. В качестве ДНК-мишеней используются ДНК последовательности, фланкированные 5'-NNNN(G/A)T-3', например последовательности гена grin2b человека:Delivery as a gene is accomplished by creating a plasmid carrying the PpCas9 NLS gene under the regulation of a promoter (eg CMV promoter) and a sequence encoding guide RNAs under the regulation of the U6 promoter. As DNA targets, DNA sequences flanked by 5'-NNNN(G/A)T-3' are used, for example, sequences of the human grin2b gene:

’ -С AGCTGAAGTAATGTTAGAG-3 ’’-C AGCTGAAGTAATGTTAGAG-3 ’

Таким образом, кассета для экспрессии sgPHK выглядит следующим образом: gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaa cacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatgg actatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccg CAGCTGAAGTAATGTTAGAGGTTGTAGCTCCCTTTTTCATTTCGCGAAAGCGAAATG AAAAThus, the sgPHK expression cassette looks like this: gtaacttgaaagtatttcgatttcttggcttttatatcttgtggaaaggacgaaacaccg CAGCTGAAGTAATGTTAGAGGTTGTAGCTCCCTTTTTCATTTCGCGAAAGCGAAATG AAAA

ACGTTGTTACAATAAGAGATGAATTTCTCGCAAAGCTCTGCCTCTTGAAATTTCGGTT TCAAACGTTGTTACATAAGAGATGAATTTCTCGCAAAGCTCTGCCTCTTGAAATTTCGGTT TCAA

GAGGCATCTTTTTGAGGCATCTTTTT

Жирным шрифтом выделена последовательность U6 промотора, далее идет последовательность, необходимая для узнавания целевой ДНК, а далее идет последовательность, образующая структуру sgRNA.The sequence of the U6 promoter is in bold, followed by the sequence necessary for recognition of the target DNA, and then comes the sequence that forms the sgRNA structure.

Плазмидную ДНК очищают и трансфицируют в клетки человека HEK293 с помощью реагента Lipofectamine 2000 (Thermo Fisher Scientific). Клетки инкубируют в течение 72 ч, после чего из них выделяется геномная ДНК с помощью колонок для очистки геномной ДНК (Thermo Fisher Scientific). Целевой ДНК сайт анализируется с помощью секвенирования на платформе lllumina с целью определения числа вставок-делеций в ДНК, происходящих в целевом сайте по причине направленного двунитевого разрыва и последующей его репарации.Plasmid DNA was purified and transfected into human HEK293 cells using the Lipofectamine 2000 reagent (Thermo Fisher Scientific). Cells are incubated for 72 hours, after which genomic DNA is isolated using genomic DNA purification columns (Thermo Fisher Scientific). The target DNA site is analyzed by sequencing on the lllumina platform to determine the number of DNA insertion-deletions occurring at the target site due to directed double-strand break and its subsequent repair.

Для амплификации целевых фрагментов используют праймеры, фланкирующие предположительное место внесения разрыва.To amplify the target fragments, primers flanking the presumed site of the break are used.

После амплификации пробы готовятся по протоколу реагента Ultra II DNA Library Prep Kit for lllumina (NEB) для подготовки образцов к высокопроизводительному секвенированию. Затем проводится секвенирование на платформе lllumina 300 cycles, прямое прочтение. Результаты секвенирования анализируются биоинформатическими методами. В качестве детекции разрезания принимается вставка или делеция нескольких нуклеотидов в целевой последовательности ДНК.After amplification, samples are prepared using the Ultra II DNA Library Prep Kit for lllumina (NEB) reagent protocol to prepare samples for high throughput sequencing. This is followed by sequencing on the lllumina 300 cycles platform, direct reading. The sequencing results are analyzed by bioinformatic methods. The insertion or deletion of several nucleotides in the target DNA sequence is taken as a cut detection.

Доставка в виде рибонуклеинового комплекса осуществляется путем инкубации рекомбинантной формы PpCas9 NLS с направляющими РНК в CutSmart буфере (NEB). Рекомбинантный белок получают из бактериальных клеток-продуцентов, очищая его с помощью аффинной хроматографии (NiNTA, Qiagen) разделением по размеру (Superdex 200).Delivery in the form of a ribonucleic complex is carried out by incubation of the recombinant form of PpCas9 NLS with guide RNAs in CutSmart Buffer (NEB). The recombinant protein is obtained from bacterial producer cells by purifying it by size separation affinity chromatography (NiNTA, Qiagen) (Superdex 200).

Белок смешивают с РНК в соотношении 1:2 (PpCas9 NLS:sgRNA), инкубируют в течение 10 мин при комнатной температуре, затем смесь трансфицируют в клетки.The protein is mixed with RNA in a ratio of 1:2 (PpCas9 NLS:sgRNA), incubated for 10 min at room temperature, then the mixture is transfected into cells.

Далее проводится анализ экстрагированной из них ДНК на предмет вставок-делеций в целевом ДНК сайте (как описано выше).Next, the DNA extracted from them is analyzed for insertions-deletions in the target DNA site (as described above).

Охарактеризованная в настоящем изобретении нуклеаза PpCas9 из бактерии Pasieureila prseumotropsca имеет ряд преимуществ относительно ранее охарактеризованных Cas9 белков.The nuclease PpCas9 from the bacterium Pasieureila prseumotropsca characterized in the present invention has a number of advantages over previously characterized Cas9 proteins.

PpCas9 обладает коротким, двухбуквенным, отличным от других известных Cas нуклеаз PAM мотивом, необходимым для функционирования системы. В изобретении было показано, что для функционирования PpCas9 достаточно присутствия короткого PAM мотива (RT), распложенного в 4 нуклеотидах от протоспейсера.PpCas9 has a short, two-letter motif, different from other known PAM Cas nucleases, which is necessary for the functioning of the system. The invention showed that the presence of a short PAM motif (RT) located 4 nucleotides from the protospacer is sufficient for PpCas9 to function.

Известное на сегодняшний день большинство Cas нуклеаз, способных вносить двунитевые разрывы в ДНК, имеют сложные многобуквенные PAM последовательности, ограничивающие выбор последоваThe majority of Cas nucleases known to date that are capable of introducing double-strand breaks in DNA have complex multi-letter PAM sequences that limit the choice of sequence.

- 9 041935 тельностей, пригодных для разрезания. Среди изученных Cas нуклеаз, распознающих короткие PAM, только PpCas9 может распознавать последовательности, фланкированные RT мотивом.- 9 041935 pieces suitable for cutting. Among the studied Cas nucleases that recognize short PAMs, only PpCas9 can recognize sequences flanked by the RT motif.

Второе преимущество PpCas9 - малый размер белка (1055 а.о). На сегодняшний день это единственный изученный малоразмерный белок, обладающий двухбуквенной RT PAM последовательностью.The second advantage of PpCas9 is the small size of the protein (1055 a.a.). To date, it is the only small-sized protein studied that has a two-letter RT PAM sequence.

PpCas9 - новая, малоразмерная Cas нуклеаза, имеющая короткий, простой в использовании PAM, отличающийся от известных на сегодняшний день PAM последовательностей других нуклеаз. Белок PpCas9 разрезает с высокой эффективностью различные ДНК-мишени, в том числе и при 37°C и может стать основой нового инструмента геномного редактирования.PpCas9 is a novel, small-sized Cas nuclease that has a short, easy-to-use PAM that differs from currently known PAM sequences from other nucleases. The PpCas9 protein cuts various DNA targets with high efficiency, including at 37°C, and can become the basis of a new tool for genomic editing.

Несмотря на то что изобретение описано со ссылкой на раскрываемые варианты воплощения, для специалистов в данной области должно быть очевидно, что конкретные подробно описанные случаи приведены лишь в целях иллюстрирования настоящего изобретения и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения. Должно быть понятно, что возможно осуществление различных модификаций без отступления от сути настоящего изобретения.While the invention has been described with reference to the disclosed embodiments, it should be apparent to those skilled in the art that the specific instances described in detail are for the purpose of illustrating the present invention only and should not be construed as limiting the scope of the invention in any way. It should be clear that various modifications are possible without departing from the essence of the present invention.

Claims (5)

1. Применение белка, содержащего аминокислотную последовательность SEQ ID NO: 1 или содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5'-NNNN(A/G)T-3' в указанной молекуле ДНК.1. The use of a protein containing the amino acid sequence of SEQ ID NO: 1 or containing an amino acid sequence that is at least 95% identical to the amino acid sequence of SEQ ID NO: 1 and differs from SEQ ID NO: 1 only in non-conservative amino acid residues, for the formation of a double-strand break in the DNA molecule, located immediately before the nucleotide sequence 5'-NNNN(A/G)T-3' in the specified DNA molecule. 2. Применение по п.1, характеризующееся тем, что образование двунитевого разрыва в молекуле ДНК происходит при температуре от 35 до 45°C.2. The use according to claim 1, characterized in that the formation of a double-strand break in the DNA molecule occurs at a temperature of from 35 to 45°C. 3. Применение белка по п.1, где белок содержит аминокислотную последовательность SEQ ID NO: 1.3. The use of a protein according to claim 1, where the protein contains the amino acid sequence of SEQ ID NO: 1. 4. Способ изменения последовательности геномной ДНК одноклеточного или многоклеточного организма, включающий введение по меньшей мере в одну клетку этого организма эффективного количества а) либо белка, содержащего аминокислотную последовательность SEQ ID NO: 1, либо нуклеиновой кислоты, кодирующей белок, содержащий аминокислотную последовательность SEQ ID NO: 1; и б) либо направляющей РНК, содержащей последовательность, образующую дуплекс с нуклеотидной последовательностью участка геномной ДНК организма, непосредственно примыкающей к нуклеотидной последовательности 5'-NNNN(A/G)T-3', и взаимодействующей с указанным белком после образования дуплекса, либо последовательности ДНК, кодирующей указанную направляющую РНК; при этом взаимодействие указанного белка с направляющей РНК и нуклеотидной последовательностью 5'-NNNN(A/G)T-3’ приводит к образованию двунитевого разрыва в последовательности геномной ДНК, непосредственно примыкающей к последовательности 5'-NNNN(A/G)T-3'.4. A method for altering the genomic DNA sequence of a unicellular or multicellular organism, comprising introducing into at least one cell of this organism an effective amount of a) either a protein containing the amino acid sequence of SEQ ID NO: 1, or a nucleic acid encoding a protein containing the amino acid sequence of SEQ ID NO: 1; and b) either a guide RNA containing a sequence that forms a duplex with the nucleotide sequence of a portion of the organism's genomic DNA immediately adjacent to the 5'-NNNN(A/G)T-3' nucleotide sequence and interacts with said protein after duplex formation, or the sequence DNA encoding said guide RNA; in this case, the interaction of the specified protein with the guide RNA and the 5'-NNNN(A/G)T-3' nucleotide sequence leads to the formation of a double-strand break in the genomic DNA sequence immediately adjacent to the 5'-NNNN(A/G)T-3 sequence '. 5. Способ по п.4, дополнительно включающий введение экзогенной последовательности ДНК одновременно с направляющей РНК.5. The method of claim 4, further comprising administering the exogenous DNA sequence simultaneously with the guide RNA.
EA202290026 2019-06-11 2020-06-30 DNA CUTTER BASED ON Cas9 PROTEIN FROM BACTERIA Pasteurella Pneumotropica EA041935B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2019118061 2019-06-11

Publications (1)

Publication Number Publication Date
EA041935B1 true EA041935B1 (en) 2022-12-16

Family

ID=

Similar Documents

Publication Publication Date Title
Dong et al. A single digestion, single-stranded oligonucleotide mediated PCR-independent site-directed mutagenesis method
RU2788197C1 (en) DNA-CUTTING AGENT BASED ON Cas9 PROTEIN FROM THE BACTERIUM STREPTOCOCCUS UBERIS NCTC3858
RU2778156C1 (en) DNA-CUTTING AGENT BASED ON THE Cas9 PROTEIN FROM THE BACTERIUM CAPNOCYTOPHAGA OCHRACEA
RU2722934C1 (en) Dna protease cutting agent based on cas9 protein from pasteurella pneumotropica bacteria
EA041935B1 (en) DNA CUTTER BASED ON Cas9 PROTEIN FROM BACTERIA Pasteurella Pneumotropica
EP4056705A1 (en) Use of cas9 protein from the bacterium pasteurella pneumotropica
RU2722933C1 (en) Dna protease cutting agent based on cas9 protein from demequina sediminicola bacteria
RU2771626C1 (en) Tool for cutting double-stranded dna using cas12d protein from katanobacteria and hybrid rna produced by fusion of guide crispr rna and scout rna
EA044419B1 (en) APPLICATION OF CAS9 PROTEIN FROM PASTEURELLA PNEUMOTROPICA BACTERIA
RU2712492C1 (en) DNA PROTEASE CUTTING AGENT BASED ON Cas9 PROTEIN FROM DEFLUVIIMONAS SP.
RU2791447C1 (en) DNA CUTTER BASED ON THE ScCas12a PROTEIN FROM THE BACTERIUM SEDIMENTISPHAERA CYANOBACTERIORUM
OA20812A (en) Use of CAS9 protein from the bacterium pasteurella pneumotropica.
OA20443A (en) DNA-cutting agent based on CAS9 protein from the bacterium pasteurella pneumotropica
RU2712497C1 (en) DNA POLYMER BASED ON Cas9 PROTEIN FROM BIOTECHNOLOGICALLY SIGNIFICANT BACTERIUM CLOSTRIDIUM CELLULOLYTICUM
EA041933B1 (en) DNA CUTTER
OA20197A (en) DNA-cutting agent.
EA042517B1 (en) DNA CUTTER
Esquerra et al. Identification of the EH CRISPR-Cas9 system on a metagenome and its application to genome engineering
OA20196A (en) DNA-cutting agent.