EA042493B1 - SYSTEM AND METHOD FOR GENOME EDITING - Google Patents

SYSTEM AND METHOD FOR GENOME EDITING Download PDF

Info

Publication number
EA042493B1
EA042493B1 EA201991849 EA042493B1 EA 042493 B1 EA042493 B1 EA 042493B1 EA 201991849 EA201991849 EA 201991849 EA 042493 B1 EA042493 B1 EA 042493B1
Authority
EA
Eurasian Patent Office
Prior art keywords
guide rna
cas9 nuclease
nucleotide sequence
sequence encoding
rna
Prior art date
Application number
EA201991849
Other languages
Russian (ru)
Inventor
Саиксиа Гао
Хуавей Чжанг
Дингбо Чжанг
Original Assignee
Сучжоу Чи Биодизайн Биотехнолоджи Компани Лимитид
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Сучжоу Чи Биодизайн Биотехнолоджи Компани Лимитид filed Critical Сучжоу Чи Биодизайн Биотехнолоджи Компани Лимитид
Publication of EA042493B1 publication Critical patent/EA042493B1/en

Links

Description

Область техники, к которой относится изобретениеThe field of technology to which the invention belongs

Настоящее изобретение относится к области генной инженерии. В частности, настоящее изобретение относится к способу редактирования генома, который обладает высокой эффективностью и высокой специфичностью. Более конкретно, настоящее изобретение относится к способу повышения эффективности сайт-направленной модификации последовательности-мишени в геноме организма при помощи высокоспецифичного варианта нуклеазы Cas9.The present invention relates to the field of genetic engineering. In particular, the present invention relates to a genome editing method that has high efficiency and high specificity. More specifically, the present invention relates to a method for increasing the efficiency of site-directed modification of a target sequence in the genome of an organism using a highly specific Cas9 nuclease variant.

Предшествующий уровень техникиPrior Art

Наиболее распространенными средствами редактирования генома являются короткие палиндромные повторы, регулярно расположенные группами (CRISPR), и связанная с ними система (CRISPR/Cas9). В этой системе для создания двухцепочечного разрыва (DSB) белок Cas9 расщепляет специфическую последовательность ДНК под воздействием gPHK. Двухцепочечный разрыв может активировать внутриклеточные механизмы репарации негомологичного соединения концов (NHEJ) и гомологичной рекомбинации (HR) для восстановления повреждения ДНК в клетках таким образом, что в процессе восстановления конкретная последовательность ДНК может быть отредактирована. В настоящее время наиболее часто используемым белком Cas9 является Cas9, полученный из Streptococcus pyogenes (SpCas9). Одним из недостатков системы редактирования генома CRISPR/Cas9 является ее низкая специфичность и ненаправленное действие, что существенно ограничивает ее применение.The most common genome editing tools are regularly spaced short palindromic repeats (CRISPR) and the associated system (CRISPR/Cas9). In this double-strand break (DSB) system, the Cas9 protein cleaves a specific DNA sequence under the influence of gRNA. A double-strand break can activate intracellular non-homologous end-joining (NHEJ) and homologous recombination (HR) repair mechanisms to repair DNA damage in cells such that a particular DNA sequence can be edited during the repair process. Currently, the most commonly used Cas9 protein is Cas9, derived from Streptococcus pyogenes (SpCas9). One of the disadvantages of the CRISPR/Cas9 genome editing system is its low specificity and non-targeted action, which significantly limits its application.

В данной области техники остается потребность в способе и инструментальном средстве, которые обеспечили бы эффективное высокоспецифичное редактирование генома.There remains a need in the art for a method and tool that enables efficient, highly specific genome editing.

Сущность изобретенияThe essence of the invention

Один объект настоящего изобретения предусматривает систему редактирования генома для сайтнаправленной модификации последовательности-мишени в геноме клетки, которая содержит по меньшей мере один элемент, выбранный из следующих с i) по iii):One aspect of the present invention provides a genome editing system for site-directed modification of a target sequence in the genome of a cell, which contains at least one element selected from i) to iii):

i) вариант нуклеазы Cas9 и экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую слияние tPHK- направляющей РНК;i) a Cas9 nuclease variant and an expression construct containing a nucleotide sequence encoding a tRNA-guide RNA fusion;

ii) экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую вариант нуклеазы Cas9, и экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую слияние tPHK -направляющей РНК; и iii) экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую вариант нуклеазы Cas9, и нуклеотидную последовательность, кодирующую слияние tPHK-направляющей РНК;ii) an expression construct containing a nucleotide sequence encoding a Cas9 nuclease variant and an expression construct containing a nucleotide sequence encoding a tRNA-guide RNA fusion; and iii) an expression construct comprising a nucleotide sequence encoding a Cas9 nuclease variant and a nucleotide sequence encoding a tRNA-guide RNA fusion;

в котором вариант нуклеазы Cas9 имеет повышенную специфичность по сравнению с нуклеазой Cas9 дикого типа, в котором конец 5' направляющей РНК связан с концом 3' tPHK, в котором слияние расщепляется на конце 5' направляющей РНК после транскрибирования в клетку, вследствие чего формируется направляющая РНК, которая не несет дополнительный нуклеотид на конце 5'.in which the Cas9 nuclease variant has increased specificity compared to the wild-type Cas9 nuclease, in which the 5' end of the guide RNA is linked to the 3' end of the tRNA, in which the fusion is cleaved at the 5' end of the guide RNA after being transcribed into the cell, whereby the guide RNA is formed , which does not carry an extra nucleotide at the 5' end.

Второй объект настоящего изобретения предусматривает систему редактирования генома для сайтнаправленной модификации последовательности-мишени в геноме клетки, которая содержит по меньшей мере один элемент, выбранный из следующих с i) по iii):A second aspect of the present invention provides a genome editing system for site-directed modification of a target sequence in the genome of a cell, which contains at least one element selected from i) to iii):

i) вариант нуклеазы Cas9 и экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую слияние рибозима-направляющей РНК;i) a Cas9 nuclease variant and an expression construct containing a nucleotide sequence encoding a ribozyme-guide RNA fusion;

ii) экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую вариант нуклеазы Cas9, и экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую слияние рибозима-направляющей РНК; и iii) экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую вариант нуклеазы Cas9, и нуклеотидную последовательность, кодирующую слияние рибозиманаправляющей РНК;ii) an expression construct containing a nucleotide sequence encoding a Cas9 nuclease variant and an expression construct containing a nucleotide sequence encoding a ribozyme-guide RNA fusion; and iii) an expression construct comprising a nucleotide sequence encoding a Cas9 nuclease variant and a nucleotide sequence encoding a ribozyme guide RNA fusion;

в котором вариант нуклеазы Cas9 имеет повышенную специфичность по сравнению с нуклеазой Cas9 дикого типа, в котором конец 5' направляющей РНК связан с концом 3' первого рибозима, в котором первый рибозим предназначен для расщепления слияния на конце 5' направляющей РНК, вследствие чего формируется направляющая РНК, которая не несет дополнительный нуклеотид на конце 5'.wherein the Cas9 nuclease variant has increased specificity compared to the wild-type Cas9 nuclease, wherein the 5' end of the guide RNA is linked to the 3' end of the first ribozyme, wherein the first ribozyme is designed to cleave the fusion at the 5' end of the guide RNA, thereby forming the guide RNA that does not carry an extra nucleotide at the 5' end.

Третий объект настоящего изобретения предусматривает способ для генетического модифицирования клетки, содержащий введение в клетку системы редактирования генома по настоящему изобретению, посредством которого вариант нуклеазы Cas9 нацеливается на последовательность-мишень в геноме клетки при помощи gPHK, а результат заключается в замене, делеции и/или добавлении одного или более нуклеотидов в последовательность-мишень.A third aspect of the present invention provides a method for genetically modifying a cell, comprising introducing into the cell a genome editing system of the present invention, whereby a Cas9 nuclease variant is targeted to a target sequence in the genome of the cell by gRNA, and the result is a substitution, deletion and/or addition one or more nucleotides in the target sequence.

Четвертый объект настоящее изобретение предусматривает генетически модифицированный организм, который содержит генетически модифицированную клетку, полученную способом по настоящему изобретению.The fourth object of the present invention provides a genetically modified organism that contains a genetically modified cell obtained by the method of the present invention.

- 1 042493- 1 042493

Краткое описание фигурBrief description of the figures

На фиг. 1 показаны стратегии конструирования одиночной направляющей РНК (sgPHK) для последовательностей-мишеней с разными 5' концевыми нуклеотидами при использовании U3 или U6. А: путем слияния с tPHK, sgPHK может быть спроектирована без учета 5' концевого нуклеотида последовательности-мишени; В: точное расщепление слияния tPHK-sgPHK.In FIG. 1 shows strategies for constructing a single guide RNA (sgRNA) for target sequences with different 5' terminal nucleotides using U3 or U6. A: By fusion with tRNA, sgRNA can be designed without considering the 5' terminal nucleotide of the target sequence; B: Precise cleavage of the tPHK-sgPHK fusion.

На фиг. 2 показана эффективность редактирования WT SpCas9 (дикий тип SpCas9), eSpCas9(1.0), eSpCas9(1.1), SpCas9-HF1 на мишенях класса (1).In FIG. Figure 2 shows the efficiency of editing WT SpCas9 (wild type SpCas9), eSpCas9(1.0), eSpCas9(1.1), SpCas9-HF1 on targets of class (1).

На фиг. 3 показана эффективность редактирования WT SpCas9 (дикий тип SpCas9), eSpCas9(1.0), eSpCas9(1.1), SpCas9-HF1 на мишенях класса (2).In FIG. Figure 3 shows the efficiency of editing WT SpCas9 (wild type SpCas9), eSpCas9(1.0), eSpCas9(1.1), SpCas9-HF1 on targets of class (2).

На фиг. 4 показано, что дополнительный нуклеотид на конце 5' sgPHK влияет на эффективность редактирования при использовании промотора U6.In FIG. 4 shows that an additional nucleotide at the 5' end of sgRNA affects editing efficiency when using the U6 promoter.

На фиг. 5 показано, что для локуса OsMKK4 tPHK-sgPHK способно улучшить эффективность редактирования и обеспечить высокий уровень специфичности по сравнению с sgPHK.In FIG. 5 shows that for the OsMKK4 locus, tPHK-sgPHK is able to improve editing efficiency and provide a high level of specificity compared to sgRNA.

На фиг. 6 показано, что для локуса OsCDKB2 использование tPHK-sgPHK может повысить эффективность редактирования до уровня SpCas9 дикого типа, с одновременным обеспечением высокой специфичности.In FIG. 6 shows that for the OsCDKB2 locus, the use of tRNA-sgRNA can increase editing efficiency to that of wild-type SpCas9 while providing high specificity.

На фиг. 7 показана специфичность редактирования варианта Cas9 для нарушения комплементарности между gPHK и последовательностью-мишенью.In FIG. 7 shows the specificity of editing the Cas9 variant to break complementarity between gRNA and the target sequence.

На фиг. 8 показано tPHK-sgPHK, улучшающее эффективность редактирования eSpCas9(1.1) и SpCas9-HF1 до уровня SpCas9 дикого типа в клетках организма человека.In FIG. 8 shows tRNA-sgRNA improving the editing efficiency of eSpCas9(1.1) and SpCas9-HF1 to the level of wild-type SpCas9 in human cells.

На фиг. 9 показана структура последовательности вектора pUC57-U3-tPHK-sgPHK для экспрессии слияния tPHK-sgPHK.In FIG. 9 shows the sequence structure of the pUC57-U3-tPHK-sgPHK vector for expression of the tPHK-sgPHK fusion.

Подробное описание изобретенияDetailed description of the invention

1) Определение.1) Definition.

В настоящем изобретении, если не указано иное, используемые в данном документе научные и технологические термины имеют значения, общепринятые у специалистов в данной области техники. Также, используемые в данном документе терминология и порядок проведения экспериментов, относящиеся к химии белков и нуклеотидов, молекулярной биологии, культивированию клеток и тканей, микробиологии, иммунологии, относятся к терминологии и стандартным способам, обычно используемым в данной области техники. Например, используемая здесь стандартная технология рекомбинации ДНК и молекулярного клонирования хорошо известна специалистам в данной области и подробно описана в следующих справочных материалах: Sambrook, J., Fritsch, E.F. and Maniatis, Т., Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory Press: Cold Spring Harbor, 1989. Тем не менее, для лучшего понимания настоящего изобретения ниже приведены определения и пояснения для соответствующих терминов.In the present invention, unless otherwise indicated, the scientific and technological terms used herein have the meanings generally accepted by those skilled in the art. Also, the terminology and experimental procedures used herein relating to protein and nucleotide chemistry, molecular biology, cell and tissue culture, microbiology, immunology refer to the terminology and standard methods commonly used in the art. For example, the standard DNA recombination and molecular cloning technology used here is well known to those skilled in the art and is detailed in the following references: Sambrook, J., Fritsch, E.F. and Maniatis, T., Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory Press: Cold Spring Harbor, 1989. However, for a better understanding of the present invention, definitions and explanations for the respective terms are provided below.

Нуклеаза Cas9 и Cas9 в данном документе могут использоваться взаимозаменяемо, и относятся к РНК-направленной нуклеазе, включая белок Cas9 или его фрагменты (такие как белок, содержащий активный домен Cas9 расщепления ДНК и/или домен Cas9 связывания gPHK). Cas9 является компонентом системы редактирования генома CRISPR/Cas (короткие палиндромные повторы, регулярно расположенные группами, и связанная с ними система), которая под влиянием направляющей РНК таргетируется и расщепляет последовательность-мишень ДНК с образованием двухцепочечных разрывов ДНК (DSB).The nuclease Cas9 and Cas9 may be used interchangeably herein, and refer to an RNA-directed nuclease, including the Cas9 protein or fragments thereof (such as a protein containing an active Cas9 DNA cleavage domain and/or a Cas9 gRNA binding domain). Cas9 is a component of the CRISPR/Cas (Regularly Clustered Short Palindromic Repeats and Associated System) genome editing system that, under the influence of a guide RNA, targets and cleaves a target DNA sequence to form DNA double-strand breaks (DSBs).

Направляющая РНК и gPHK в данном документе могут использоваться взаимозаменяемо, и, как правило, состоят из молекул crPHK и tracrPHK, образующих комплексы посредством частичного комплемента, в которых crPHK содержит последовательность, которая является достаточно комплементарной по отношению к последовательности-мишени для гибридизации и направляет комплекс CRISPR (Cas9+crPHK+tracrPHK) на специфическое связывание с последовательностью-мишенью. Однако в данной области техники известно, что может быть сконструирована одиночная направляющая РНК (sgPHK), которая содержит характеристики как crPHK, так и tracrPHK.Guide RNA and gRNA can be used interchangeably herein, and typically consist of crRNA and tracrPHK molecules complexed by partial complement, in which the crRNA contains a sequence that is sufficiently complementary to the target sequence for hybridization and directs the complex. CRISPR (Cas9+crPHK+tracrPHK) for specific binding to the target sequence. However, it is known in the art that a single guide RNA (sgPHK) can be constructed that contains the characteristics of both crPHK and tracrPHK.

В данном документе термины tPHK и транспортная РНК могут использоваться взаимозаменяемо и относятся к малоразмерным молекулам РНК, которые имеют функцию переноса и транспортировки аминокислот. Молекула tPHK обычно состоит из короткой цепи, в которой имеются примерно 70-90 нуклеотидов, упакованных в форме клевера. В эукариотах гены tPHK в геноме транскрибируются в прекурсоры tPHK, которые затем перерабатываются в зрелую tPHK после удаления дополнительных последовательностей 5' и 3' с помощью рибонуклеазы Р (RNase Р) и рибонуклеазы Z (RNase Z).In this document, the terms tRNA and transfer RNA can be used interchangeably and refer to small RNA molecules that have the function of transferring and transporting amino acids. The tRNA molecule usually consists of a short chain that has about 70-90 nucleotides packed in a clover shape. In eukaryotes, tRNA genes in the genome are transcribed into tRNA precursors, which are then processed into mature tRNA after removal of additional 5' and 3' sequences by ribonuclease P (RNase P) and ribonuclease Z (RNase Z).

В данном документе термин рибозим относится к молекуле РНК, имеющей каталитическую функцию, которая участвует в расщеплении и процессинге РНК, катализируя реакции гидролиза трансфосфатной и фосфодиэфирной связи.As used herein, the term ribozyme refers to an RNA molecule having a catalytic function that participates in the cleavage and processing of RNA by catalyzing the transphosphate and phosphodiester bond hydrolysis reactions.

Термин геном, используемый в настоящем документе, охватывает не только хромосомную ДНК, присутствующую в ядре, но также и ДНК органелл, присутствующую в субклеточных компонентах клетки (например, митохондриях, пластидах).The term genome as used herein encompasses not only chromosomal DNA present in the nucleus, but also organelle DNA present in subcellular components of the cell (eg, mitochondria, plastids).

В данном документе термин организм включает в себя любой организм, пригодный для геномного редактирования. Типовые организмы включают в себя, не ограничиваясь только перечисленным, мле- 2 042493 копитающих, таких как человек, мышь, крыса, обезьяна, собака, свинья, овца, крупный рогатый скот, кошка; домашнюю птицу, такую как курица, утка, гусь; растения, включающие в себя однодольные и двудольные растения, такие как рис, кукуруза, пшеница, сорго, ячмень, соя, арахис, арабидопсис и т.п.As used herein, the term organism includes any organism suitable for genomic editing. Typical organisms include, but are not limited to, mammals such as humans, mice, rats, monkeys, dogs, pigs, sheep, cattle, cats; poultry such as chicken, duck, goose; plants including monocots and dicots such as rice, corn, wheat, sorghum, barley, soybeans, peanuts, Arabidopsis, and the like.

Генетически модифицированный организм или генетически модифицированная клетка означает организм или клетку, которая содержит в своем геноме экзогенный полинуклеотид, или модифицированный ген, или последовательность, которая контролирует экспрессию. Например, экзогенный полинуклеотид устойчиво интегрируется в геном организма или клетки и наследуется в последующих поколениях. Экзогенный полинуклеотид может быть интегрирован в геном отдельно или как часть конструкта рекомбинантной ДНК. Модифицированный ген или последовательность контроля экспрессии представляют собой последовательность в геноме организма или клетки, которая состоит из одной или нескольких дезоксинуклеотидных замен, делеций и присоединений.Genetically modified organism or genetically modified cell means an organism or cell that contains in its genome an exogenous polynucleotide or a modified gene or sequence that controls expression. For example, an exogenous polynucleotide is stably integrated into the genome of an organism or cell and is inherited in subsequent generations. The exogenous polynucleotide may be integrated into the genome alone or as part of a recombinant DNA construct. A modified gene or expression control sequence is a sequence in the genome of an organism or cell that consists of one or more deoxynucleotide substitutions, deletions, and additions.

Термин экзогенный в отношении последовательности означает последовательность, которая происходит от чужеродного вида или, если она происходит от того же вида, существенно изменена по сравнению с его нативной формой по составу и/или геномному локусу вследствие преднамеренного вмешательства человека.The term "exogenous" in relation to a sequence means a sequence that is derived from a foreign species or, if derived from the same species, is substantially altered from its native form in composition and/or genomic locus due to intentional human interference.

Термины полинуклеотид, последовательность нуклеиновой кислоты, нуклеотидная последовательность или фрагмент нуклеиновой кислоты используются взаимозаменяемо для обозначения полимера РНК или ДНК, который является одно- или двухцепочечным и, возможно, содержит синтетические, неприродные или измененные нуклеотидные основания. Нуклеотиды (обычно встречающиеся в их 5'-монофосфатной форме) обозначаются одной буквой следующим образом: А для аденилата или дезоксиаденилата (для РНК или ДНК, соответственно), С для цитидилата или дезоксицитидилата, G для гуанилата или дезоксигуанилата, U для уридилата, Т для дезокситимидилата, R для пуринов (А или G), Y для пиримидинов (С или Т), К для G или Т, Н для А, или С, или Т, I для инозина и N для любого нуклеотида.The terms polynucleotide, nucleic acid sequence, nucleotide sequence, or nucleic acid fragment are used interchangeably to refer to an RNA or DNA polymer that is single or double stranded and optionally contains synthetic, non-natural, or altered nucleotide bases. Nucleotides (usually occurring in their 5'-monophosphate form) are designated by a single letter as follows: A for adenylate or deoxyadenylate (for RNA or DNA, respectively), C for cytidylate or deoxycytidylate, G for guanylate or deoxyguanylate, U for uridylate, T for deoxythymidylate, R for purines (A or G), Y for pyrimidines (C or T), K for G or T, H for A or C, or T, I for inosine, and N for any nucleotide.

Термины полипептид, пептид, аминокислотная последовательность и белок используются в данном документе взаимозаменяемо для обозначения полимера из аминокислотных остатков. Эти термины применяются к аминокислотным полимерам, в которых один или более аминокислотных остатков представляют собой искусственный химический аналог соответствующей аминокислоты, встречающейся в природе, а также встречающихся в природе аминокислотных полимеров. Термины полипептид, пептид, аминокислотная последовательность и белок также охватывают модификации, включая, но не ограничиваясь только перечисленным, гликозилирование, липидное присоединение, сульфатирование, гамма-карбоксилирование остатков глутаминовой кислоты, гидроксилирование и АДФрибозилирование.The terms polypeptide, peptide, amino acid sequence, and protein are used interchangeably herein to refer to a polymer of amino acid residues. These terms apply to amino acid polymers in which one or more amino acid residues is an artificial chemical analogue of the corresponding naturally occurring amino acid, as well as naturally occurring amino acid polymers. The terms polypeptide, peptide, amino acid sequence, and protein also encompass modifications including, but not limited to, glycosylation, lipid addition, sulfation, gamma-carboxylation of glutamic acid residues, hydroxylation, and ADPribosylation.

В данном документе термин экспрессионный конструкт относится к вектору, пригодному для экспрессии в организм представляющей интерес нуклеотидной последовательности, такой, как рекомбинантный вектор. Термин экспрессия относится к производству функционального продукта. Например, экспрессия нуклеотидной последовательности может относиться к транскрипции нуклеотидной последовательности (такой как транскрипция для получения mPHK или функциональной РНК) и/или трансляции РНК в прекурсор белка или зрелый белок.As used herein, the term expression construct refers to a vector suitable for expression in an organism of a nucleotide sequence of interest, such as a recombinant vector. The term expression refers to the production of a functional product. For example, expression of a nucleotide sequence may refer to the transcription of a nucleotide sequence (such as transcription to produce mRNA or functional RNA) and/or translation of an RNA into a protein precursor or mature protein.

Экспрессионный конструкт по данному изобретению может представлять собой линейный фрагмент нуклеиновой кислоты, кольцевую плазмиду, вирусный вектор или, в некоторых вариантах осуществления, РНК, которая может быть транслирована (такая как mPHK).The expression construct of the invention may be a linear nucleic acid fragment, a circular plasmid, a viral vector, or, in some embodiments, RNA that can be translated (such as mRNA).

Экспрессионный конструкт по данному изобретению может содержать регуляторные последовательности и представляющие интерес нуклеотидные последовательности, которые получены из разных источников, или регуляторные последовательности и представляющие интерес нуклеотидные последовательности, полученные из одного и того же источника, но упорядоченные способом, отличающимся от того, который обычно встречается в природе.The expression construct of this invention may contain regulatory sequences and nucleotide sequences of interest that are obtained from different sources, or regulatory sequences and nucleotide sequences of interest obtained from the same source but ordered in a manner different from that normally found in nature.

Термины регуляторная последовательность или регуляторный элемент используются взаимозаменяемо и относятся к нуклеотидным последовательностям, расположенным перед (5' некодирующие последовательности), внутри или после (3' некодирующие последовательности) кодирующей последовательности, которые влияют на транскрипцию, процессинг или стабильность РНК, или трансляцию связанной кодирующей последовательности. Регуляторные последовательности могут включать в себя, не ограничиваясь только перечисленным, промоторы, лидерные последовательности трансляции, интроны и последовательности распознавания полиаденилирования.The terms regulatory sequence or regulatory element are used interchangeably and refer to nucleotide sequences located before (5' non-coding sequences), within, or after (3' non-coding sequences) a coding sequence that affect transcription, processing, or stability of RNA, or translation of the associated coding sequence. . Regulatory sequences may include, but are not limited to, promoters, translation leader sequences, introns, and polyadenylation recognition sequences.

Термин промотор относится к фрагменту нуклеиновой кислоты, который способен контролировать транскрипцию другого фрагмента нуклеиновой кислоты. В некоторых вариантах осуществления настоящего изобретения промотор представляет собой промотор, способный контролировать транскрипцию гена в клетку, независимо от того, получен он из такой клетки или нет. Промотор может являться конститутивным промотором, или тканеспецифичным промотором, или промотором, регулируемым развитием, или индуцируемым промотором.The term promoter refers to a nucleic acid fragment that is capable of controlling the transcription of another nucleic acid fragment. In some embodiments, the implementation of the present invention, the promoter is a promoter capable of controlling the transcription of a gene into a cell, whether it is derived from such a cell or not. The promoter may be a constitutive promoter, or a tissue-specific promoter, or a developmental promoter, or an inducible promoter.

Термин конститутивный промотор относится к промотору, который в большинстве обстоятельств может вызвать экспрессию гена в большинстве типов клеток. Термины тканеспецифичный промотор иThe term constitutive promoter refers to a promoter that, under most circumstances, can cause gene expression in most cell types. The terms tissue-specific promoter and

- 3 042493 тканепредпочтительный промотор используются взаимозаменяемо и относятся к промотору, который экспрессируется преимущественно, но не обязательно исключительно, в одну ткань или орган, но который также может быть экспрессирован в одну конкретную клетку или тип клетки. Термин промотор, регулируемый развитием относится к промотору, активность которого определяется событиями, связанными с развитием. Индуцируемый промотор селективно экспрессирует последовательность ДНК, функционально связанную с ним, в ответ на эндогенный или экзогенный стимул (среда, гормоны или химические сигналы и т.д.).Tissue-preferred promoter is used interchangeably and refers to a promoter that is predominantly, but not necessarily exclusively, expressed in one tissue or organ, but which may also be expressed in one particular cell or cell type. The term developmentally regulated promoter refers to a promoter whose activity is determined by developmental events. An inducible promoter selectively expresses a DNA sequence operably linked to it in response to an endogenous or exogenous stimulus (environment, hormones or chemical signals, etc.).

В данном документе термин функционально связанный означает, что регуляторный элемент (например, не ограничиваясь только перечисленным, последовательность промотора, последовательность терминации транскрипции и т.д.) связан с последовательностью нуклеиновой кислоты (такой как кодирующая последовательность или открытая рамка считывания), таким образом, что транскрипция нуклеотидной последовательности контролируется и регулируется транскрипционным регуляторным элементом. В данной области техники известны технологии для функционального связывания области регуляторного элемента с молекулой нуклеиновой кислоты.As used herein, the term operably linked means that a regulatory element (for example, but not limited to, a promoter sequence, a transcription termination sequence, etc.) is linked to a nucleic acid sequence (such as a coding sequence or an open reading frame), such that that transcription of a nucleotide sequence is controlled and regulated by a transcriptional regulatory element. Techniques are known in the art for operably linking a region of a regulatory element to a nucleic acid molecule.

Введение молекулы нуклеиновой кислоты (например, плазмиды, линейного фрагмента нуклеиновой кислоты, РНК и т.д.) или белка в организм означает, что нуклеиновая кислота или белок используются для трансформации клетки организма таким образом, что нуклеиновая кислота или белок функционирует в такой клетке. При использовании в настоящем изобретении, термин трансформация включает в себя как стабильные, так и транзиентные трансформации. Стабильная трансформация относится к введению в геном экзогенной нуклеотидной последовательности, обеспечивающему в результате устойчивое наследование инородных генов. После стабильной трансформации последовательность экзогенной нуклеиновой кислоты устойчиво интегрируется в геном организма и его любых последующих поколений. Транзиентная трансформация относится к введению молекулы нуклеиновой кислоты или белка в клетку, выполняющих свою функцию без устойчивого наследования экзогенного гена. При транзиентной трансформации последовательность экзогенной нуклеиновой кислоты не интегрируется в геном.The introduction of a nucleic acid molecule (eg, plasmid, linear nucleic acid fragment, RNA, etc.) or protein into an organism means that the nucleic acid or protein is used to transform a cell of the body such that the nucleic acid or protein functions in such a cell. As used in the present invention, the term transformation includes both stable and transient transformations. Stable transformation refers to the introduction into the genome of an exogenous nucleotide sequence resulting in stable inheritance of foreign genes. After stable transformation, the exogenous nucleic acid sequence is stably integrated into the genome of the organism and any subsequent generations. Transient transformation refers to the introduction of a nucleic acid molecule or protein into a cell that performs its function without sustained inheritance of an exogenous gene. In transient transformation, the exogenous nucleic acid sequence is not integrated into the genome.

2) Система редактирования генома с высокой эффективностью и высокой специфичностью.2) Genome editing system with high efficiency and high specificity.

Как сообщалось, нуклеаза Cas9 в варианте eSpCas9(1.0) (K810A/K1003A/R1060A), eSpCas9(1.1) (K848A/K1003A/R1060A), разработанная Feng Zhang и др., и нуклеаза Cas9 в варианте SpCas9-HF1 (N497A/R661A/Q695A/Q926A), разработанная J. Keith Joung и др., способны существенно снизить уровень ненаправленности геномного редактирования, т.е. обладают высокой специфичностью. Однако неожиданно авторы настоящего изобретения обнаружили, что эти три варианта нуклеазы Cas9, обладая высокой специфичностью, имеют гораздо более низкую эффективность редактирования генов по сравнению с Cas9 дикого типа.As reported, Cas9 nuclease variant eSpCas9(1.0) (K810A/K1003A/R1060A), eSpCas9(1.1) (K848A/K1003A/R1060A) developed by Feng Zhang et al., and Cas9 nuclease variant SpCas9-HF1 (N497A/R661A /Q695A/Q926A), developed by J. Keith Joung et al., can significantly reduce the level of non-targeted genomic editing, i.e. have high specificity. Surprisingly, however, the present inventors have found that these three variants of the Cas9 nuclease, while having high specificity, have a much lower gene editing efficiency compared to wild-type Cas9.

Авторы настоящего изобретения неожиданно обнаружили, что эффективность редактирования высокоспецифичным вариантом нуклеазы Cas9 может быть повышена путем слияния конца 5' направляющей РНК с tPHK, даже до уровня дикого типа при сохранении высокой специфичности.The present inventors have surprisingly found that editing efficiency with a highly specific Cas9 nuclease variant can be improved by fusing the 5' end of the guide RNA with tRNA, even to the wild-type level while maintaining high specificity.

Не рассматривая ограничения, налагаемые какой-либо теорией, предполагается, что снижение эффективности редактирования высокоспецифичных вариантов нуклеазы Cas9 связана с тем, может ли быть точно инициирована транскрипция направляющей РНК или нет. В данной области техники промоторы, обычно используемые для получения in vivo направляющей РНК, включают в себя, например, промоторы snPHK U6 или U3, для которых транскрипция управляется РНК-полимеразой III. Промотор U6 требуется для инициирования транскрипции в G, и, таким образом, для последовательностеймишеней с первым нуклеотидом А, С или Т, дополнительный G будет присутствовать на конце 5' транскрибируемой sgPHK. Промотор U3 инициирует транскрипцию в А, и, таким образом, для последовательностей-мишеней с первым нуклеотидом G, С или Т, дополнительный А будет присутствовать на конце 5' транскрибируемой sgPHK. Авторы изобретения обнаружили, что эффективность редактирования высокоспецифичных вариантов нуклеазы Cas9 снижается в случае, если на конце 5' sgPHK присутствует дополнительный нуклеотид. sgPHK без дополнительного нуклеотида на конце 5' легко может быть получена даже с использованием промоторов U6 или U3 путем слияния транскрипции с tPHK, благодаря механизму точного процессинга tPHK (точному удалению дополнительной последовательности 5' и 3' прекурсора tPHK для образования зрелой tPHK), без необходимости учитывать тип первого нуклеотида последовательности-мишени. Таким образом, может быть улучшена эффективность редактирования высокоспецифичных вариантов нуклеазы Cas9, а также расширен диапазон выбора последовательностеймишеней. Кроме того, не рассматривая ограничения, налагаемые какой-либо теорией, слияние с tPHK может повысить уровень экспрессии sgPHK, что также может способствовать улучшению эффективности редактирования высокоспецифичными вариантами нуклеазы Cas9.Without considering the limitations imposed by any theory, it is assumed that the reduction in the editing efficiency of highly specific Cas9 nuclease variants is related to whether transcription of the guide RNA can be accurately initiated or not. Promoters commonly used in the art for in vivo production of guide RNA include, for example, the snRNA U6 or U3 promoters, for which transcription is driven by RNA polymerase III. The U6 promoter is required to initiate transcription at G, and thus for target sequences with an A, C, or T first nucleotide, an additional G will be present at the 5' end of the transcribed sgRNA. The U3 promoter initiates transcription at A, and thus for target sequences with a G, C, or T first nucleotide, an additional A will be present at the 5' end of the transcribed sgRNA. The inventors have found that the efficiency of editing highly specific Cas9 nuclease variants is reduced if an additional nucleotide is present at the 5' end of sgRNA. sgPHK without an extra nucleotide at the 5' end can easily be generated even with the U6 or U3 promoters by fusion of the transcription with tRNA, thanks to the precise tPHK processing mechanism (precisely removing the extra 5' and 3' tRNA precursor sequence to form mature tRNA), without the need take into account the type of the first nucleotide of the target sequence. Thus, the editing efficiency of highly specific Cas9 nuclease variants can be improved, as well as the range of target sequence selection can be expanded. In addition, without being bound by any theory, tRNA fusion may increase the level of sgRNA expression, which may also improve editing efficiency with highly specific Cas9 nuclease variants.

Таким образом, настоящее изобретение предусматривает систему редактирования генома для сайтнаправленной модификации последовательности-мишени в геноме клетки, которая содержит по меньшей мере один элемент, выбранный из следующих с i) по iii):Thus, the present invention provides a genome editing system for site-directed modification of a target sequence in the genome of a cell, which contains at least one element selected from i) to iii):

i) вариант нуклеазы Cas9 и экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую слияние tPHK-направляющей РНК;i) a Cas9 nuclease variant and an expression construct containing a nucleotide sequence encoding a tRNA-guide RNA fusion;

ii) экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую вари-ii) an expression construct containing a nucleotide sequence encoding a variant

- 4 042493 ант нуклеазы Cas9, и экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую слияние tPHK -направляющей РНК; и iii) экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую вариант нуклеазы Cas9, и нуклеотидную последовательность, кодирующую слияние tPHK-направляющей- 4 042493 ant Cas9 nuclease, and an expression construct containing a nucleotide sequence encoding a tRNA-guide RNA fusion; and iii) an expression construct comprising a nucleotide sequence encoding a Cas9 nuclease variant and a nucleotide sequence encoding a fusion guide tRNA

РНК;RNA;

в котором вариант нуклеазы Cas9 имеет повышенную специфичность по сравнению с нуклеазой Cas9 дикого типа, в котором конец 5' направляющей РНК связан с концом 3' tPHK, в котором слияние расщепляется на конце 5' направляющей РНК после транскрибирования в клетку, вследствие чего формируется направляющая РНК, которая не несет дополнительный нуклеотид на конце 5'.in which the Cas9 nuclease variant has increased specificity compared to the wild-type Cas9 nuclease, in which the 5' end of the guide RNA is linked to the 3' end of the tRNA, in which the fusion is cleaved at the 5' end of the guide RNA after being transcribed into the cell, whereby the guide RNA is formed , which does not carry an extra nucleotide at the 5' end.

В некоторых вариантах осуществления tPHK и клетка, подлежащая модифицированию, относятся к одному виду.In some embodiments, the tRNA and the cell to be modified are of the same species.

В некоторых особых вариантах осуществления tPHK кодируется следующей последовательностью aacaaagcaccagtg^^ (SEQ id no:1).In some specific embodiments, the tRNA is encoded by the following sequence aacaaagcaccagtg^^ (SEQ id no:1).

Дизайн слияния tPHK-направляющей РНК находится в компетенции специалистов в данной области техники. Например, можно сослаться на работу Xie и др., PNAS, Mar 17, 2015; vol. 112, по. 11,35703575.The design of the tRNA-guide RNA fusion is within the skill of the art. For example, reference may be made to Xie et al., PNAS, Mar 17, 2015; vol. 112, by. 11.35703575.

В настоящем изобретении также рассматривается слияние направляющей РНК и рибозима. На основании того, что по данному изобретению эффективность редактирования при помощи высокоспецифичных вариантов нуклеазы Cas9 связана с точностью инициации транскрипции sgPHK, используя способность рибозима разрезать РНК в конкретном сайте, sgPHK без дополнительного нуклеотида на конце 5' можно получать путем рационального конструирования слияния РНК и рибозима, что позволяет улучшить эффективность редактирования при сохранении высокой специфичности.The present invention also contemplates the fusion of a guide RNA and a ribozyme. Based on the fact that, according to the invention, the efficiency of editing with highly specific variants of the Cas9 nuclease is related to the accuracy of transcription initiation of sgRNA, using the ability of the ribozyme to cut RNA at a specific site, sgRNA without an additional nucleotide at the 5' end can be obtained by rationally designing the fusion of RNA and ribozyme, which improves editing efficiency while maintaining high specificity.

Таким образом, настоящее изобретение предусматривает систему редактирования генома для сайтнаправленной модификации последовательности-мишени в геноме клетки, которая содержит по меньшей мере один элемент, выбранный из следующих с i) по iii):Thus, the present invention provides a genome editing system for site-directed modification of a target sequence in the genome of a cell, which contains at least one element selected from i) to iii):

i) вариант нуклеазы Cas9 и экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую слияние рибозима-направляющей РНК;i) a Cas9 nuclease variant and an expression construct containing a nucleotide sequence encoding a ribozyme-guide RNA fusion;

ii) экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую вариант нуклеазы Cas9, и экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую слияние рибозима-направляющей РНК; и iii) экспрессионный конструкт, содержащий нуклеотидную последовательность, кодирующую вариант нуклеазы Cas9, и нуклеотидную последовательность, кодирующую слияние рибозиманаправляющей РНК;ii) an expression construct containing a nucleotide sequence encoding a Cas9 nuclease variant and an expression construct containing a nucleotide sequence encoding a ribozyme-guide RNA fusion; and iii) an expression construct comprising a nucleotide sequence encoding a Cas9 nuclease variant and a nucleotide sequence encoding a ribozyme guide RNA fusion;

в котором вариант нуклеазы Cas9 имеет повышенную специфичность по сравнению с нуклеазой Cas9 дикого типа, в котором конец 5' направляющей РНК связан с концом 3' первого рибозима, в котором первый рибозим предназначен для расщепления слияния на конце 5' направляющей РНК, вследствие чего формируется направляющая РНК, которая не несет дополнительный нуклеотид на конце 5'.wherein the Cas9 nuclease variant has increased specificity compared to the wild-type Cas9 nuclease, wherein the 5' end of the guide RNA is linked to the 3' end of the first ribozyme, wherein the first ribozyme is designed to cleave the fusion at the 5' end of the guide RNA, thereby forming the guide RNA that does not carry an extra nucleotide at the 5' end.

В одном варианте осуществления, где конец 3' направляющей РНК связан с концом 5' второго рибозима, такой второй рибозим предназначен для расщепления слияния на конце 3' направляющей РНК, вследствие чего формируется направляющая РНК, которая не несет дополнительный нуклеотид на конце 3'.In one embodiment, where the 3' end of the guide RNA is linked to the 5' end of a second ribozyme, that second ribozyme is designed to cleave the fusion at the 3' end of the guide RNA, thereby forming a guide RNA that does not carry an extra nucleotide at the 3' end.

Дизайн первого рибозима или второго рибозима находится в компетенции специалиста в данной области техники. Например, можно сослаться на работу Gao и пр., JIPB, Apr , 2014; Vol 56, Issue 4,343349.The design of the first ribozyme or the second ribozyme is within the skill of the art. For example, reference may be made to Gao et al., JIPB, Apr , 2014; Vol 56, Issue 4,343349.

В одном особом варианте осуществления первый рибозим кодируется следующей последовательностьюIn one particular embodiment, the first ribozyme is encoded by the following sequence

WCTGATGAGTCCGT^^ (SEQ ro NO: 12), в которой N независимо выбран из A, G, С и Т, a (N)6 относится к последовательности, обратно комплементарной первым 6 нуклеотидам на конце 5' направляющей РНК. В одном особом варианте осуществления второй рибозим кодируется следующей последовательностьюWCTGATGAGTCCGT^^ (SEQ ro NO: 12) wherein N is independently selected from A, G, C, and T, and (N) 6 refers to the sequence reversely complementary to the first 6 nucleotides at the 5' end of the guide RNA. In one particular embodiment, the second ribozyme is encoded by the following sequence

5’-GGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCnCGGCATGGCGAA TGGGAC-3’ (SEQ ID NO: 13).5'-GGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCnCGGCATGGCGAATGGGAC-3' (SEQ ID NO: 13).

Вариант нуклеазы Cas9 по данному изобретению, который обладает более высокой специфичностью по сравнению с нуклеазой Cas9 дикого типа, может быть получен из Cas9 различных видов, например, полученных из Cas9 Streptococcus pyogenes (SpCas9, нуклеотидная последовательность, показанная в SEQ ID NO: 2, аминокислотная последовательность, показанная в SEQ ID NO: 3).The Cas9 nuclease variant of the present invention, which has a higher specificity than the wild-type Cas9 nuclease, can be obtained from Cas9 of various species, for example, those obtained from Cas9 of Streptococcus pyogenes (SpCas9, nucleotide sequence shown in SEQ ID NO: 2, amino acid the sequence shown in SEQ ID NO: 3).

В некоторых вариантах осуществления изобретения вариант нуклеазы Cas9 представляет собойIn some embodiments, the Cas9 nuclease variant is

- 5 042493- 5 042493

SEQ ID NO: 2, которая содержит аминокислотную замену на позиции 855 в SEQ ID NO: 2. В некоторых особых вариантах осуществления аминокислотная замена на позиции 855 представляет собой К855А.SEQ ID NO: 2, which contains the amino acid substitution at position 855 of SEQ ID NO: 2. In some specific embodiments, the amino acid substitution at position 855 is K855A.

В некоторых вариантах осуществления изобретения вариант нуклеазы Cas9 представляет собой вариант SEQ ID NO: 2, которая содержит аминокислотные замены на позициях 810, 1003 и 1060 в SEQ ID NO: 2. В некоторых особых вариантах осуществления аминокислотными заменами являются, соответственно, К810А, К1003А и R1060A.In some embodiments, the Cas9 nuclease variant is a SEQ ID NO: 2 variant that contains amino acid substitutions at positions 810, 1003, and 1060 of SEQ ID NO: 2. In some specific embodiments, the amino acid substitutions are, respectively, K810A, K1003A, and R1060A.

В некоторых вариантах осуществления изобретения вариант нуклеазы Cas9 представляет собой SEQ ID NO: 2, которая содержит аминокислотные замены на позициях 848, 1003 и 1060 в SEQ ID NO: 2. В некоторых особых вариантах осуществления аминокислотными заменами являются, соответственно, K848A, K1003A и R1060A.In some embodiments, the Cas9 nuclease variant is SEQ ID NO: 2, which contains amino acid substitutions at positions 848, 1003, and 1060 of SEQ ID NO: 2. In some specific embodiments, the amino acid substitutions are K848A, K1003A, and R1060A, respectively. .

В некоторых вариантах осуществления изобретения вариант нуклеазы Cas9 представляет собой вариант SEQ ID NO: 2, которая содержит аминокислотные замены на позициях 611, 695 и 926 в SEQ ID NO: 2. В некоторых особых вариантах осуществления аминокислотными заменами являются, соответственно, R611A, Q695A и Q926A.In some embodiments, the Cas9 nuclease variant is a SEQ ID NO: 2 variant that contains amino acid substitutions at positions 611, 695, and 926 of SEQ ID NO: 2. In some specific embodiments, the amino acid substitutions are, respectively, R611A, Q695A, and Q926A.

В некоторых вариантах осуществления изобретения вариант нуклеазы Cas9 представляет собой вариант SEQ ID NO: 2, которая содержит аминокислотные замены на позициях 497, 611, 695 и 926 в SEQ ID NO: 2. В некоторых особых вариантах осуществления аминокислотными заменами являются, соответственно, N497A, R611A, Q695A и Q926A.In some embodiments, the Cas9 nuclease variant is a variant of SEQ ID NO: 2 that contains amino acid substitutions at positions 497, 611, 695, and 926 of SEQ ID NO: 2. In some specific embodiments, the amino acid substitutions are, respectively, N497A, R611A, Q695A and Q926A.

В некоторых особых вариантах осуществления изобретения вариант нуклеазы Cas9 содержит последовательность аминокислоты, показанную в SEQ ID NO: 4 (eSpCas9(1.0)), SEQ ID NO: 5 (eSpCas9(1.1)) или SEQ ID NO: 6 (SpCas9-HF1).In some specific embodiments, the Cas9 nuclease variant comprises the amino acid sequence shown in SEQ ID NO: 4 (eSpCas9(1.0)), SEQ ID NO: 5 (eSpCas9(1.1)) or SEQ ID NO: 6 (SpCas9-HF1).

В некоторых вариантах осуществления изобретения вариант нуклеазы Cas9 по данному изобретению дополнительно содержит последовательность ядерной локализации (NLS). Как правило, одна или более NLS в варианте нуклеазы Cas9 должны обладать достаточным количественным содержанием, чтобы управлять накоплением варианта нуклеазы Cas9 в ядре клетки в количестве, достаточном для функции редактирования генома. Как правило, количественная активность ядерной локализации определяется количеством и положением последовательностей ядерной локализации (NLS), и в варианте нуклеазы Cas9 используется одна или несколько NLS, или их комбинация.In some embodiments, the Cas9 nuclease variant of the invention further comprises a nuclear localization sequence (NLS). In general, one or more NLSs in the Cas9 nuclease variant should be present in sufficient abundance to drive the accumulation of the Cas9 nuclease variant in the cell nucleus in an amount sufficient for genome editing function. Typically, nuclear localization activity is quantified by the number and position of nuclear localization sequences (NLSs), and the Cas9 nuclease variant uses one or more NLSs, or a combination thereof.

В некоторых вариантах осуществления изобретения последовательности NLS варианта нуклеазы Cas9 по данному изобретению могут быть расположены в N-конце и/или в С-конце. В некоторых вариантах осуществления вариант нуклеазы Cas9 содержит около 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS. В некоторых вариантах осуществления вариант нуклеазы Cas9 содержит около 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS на N-конце или в его окрестности. В некоторых вариантах осуществления вариант нуклеазы Cas9 содержит около 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS на С-конце или в его окрестности. В некоторых вариантах осуществления вариант нуклеазы Cas9 содержит их комбинации, такие как одна или более NLS на N-конце или одна или более NLS на С-конце. Если имеется более одной NLS, каждая NLS может быть выбрана независимо от других NLS. В некоторых предпочтительных вариантах осуществления изобретения вариант нуклеазы Cas9 содержит две NLS, например, эти две NLS расположены на Nконце и С-конце, соответственно.In some embodiments, NLS sequences of the Cas9 nuclease variant of the invention may be located at the N-terminus and/or at the C-terminus. In some embodiments, the Cas9 nuclease variant contains about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more NLSs. In some embodiments, the Cas9 nuclease variant contains about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more NLSs at or near the N-terminus. In some embodiments, the Cas9 nuclease variant contains about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more NLSs at or near the C-terminus. In some embodiments, the Cas9 nuclease variant contains combinations thereof, such as one or more NLSs at the N-terminus or one or more NLSs at the C-terminus. If there is more than one NLS, each NLS may be selected independently of the other NLSs. In some preferred embodiments, the Cas9 nuclease variant contains two NLSs, for example, these two NLSs are located at the N-terminus and C-terminus, respectively.

В целом, NLS состоит из одной или более коротких последовательностей положительно заряженного лизина или аргинина, находящихся на поверхности белка, но в данной области техники известны также и другие типы NLS. Неограничивающие примеры NLS включают в себя KKRKV (нуклеотидная последовательность 5 -AAGAAGAGAAAGGTC-3 ), PKKKRKV (нуклеотидная последовательность 5’-CCCAAGAAGAAGAGGAAGGTG-3’: или CCAAAGAAGAAGAGGAAGGTT) или SGGSPKKKRKV (нуклеотидная последовательность 5’- TCGGGGGGGAGCCCAAAGAAGAAGCGGAAGGTG-3’).In general, an NLS consists of one or more short sequences of positively charged lysine or arginine located on the surface of a protein, but other types of NLS are also known in the art. Non-limiting examples of NLS include KKRKV (nucleotide sequence 5 -AAGAAGAGAAAGGTC-3), PKKKRKV (nucleotide sequence 5'-CCCAAGAAGAAGAGGAAGGTG-3' : or CCAAAGAAGAAGAGGAAGGTT) or SGGSPKKKRKV (nucleotide sequence 5'-TCGGGGGGAGCCCAAAGAAGAAGCGGAAGGTG-3').

В некоторых вариантах осуществления изобретения N-конец варианта нуклеазы Cas9 содержит NLS с аминокислотной последовательностью, показанной как PKKKRKV.In some embodiments, the N-terminus of the Cas9 nuclease variant contains an NLS with the amino acid sequence shown as PKKKRKV.

В некоторых вариантах осуществления изобретения С-конец варианта нуклеазы Cas9 содержит NLS с аминокислотной последовательностью, показанной как SGGSPKKKRKV.In some embodiments, the C-terminus of the Cas9 nuclease variant contains an NLS with the amino acid sequence shown as SGGSPKKKRKV.

Кроме того, вариант нуклеазы Cas9 по настоящему изобретению также может включать в себя другие последовательности локализации, такие как последовательности цитоплазматической локализации, последовательности локализации хлоропластов, последовательности митохондриальной локализации и тому подобное, в зависимости от расположения редактируемой ДНК.In addition, the Cas9 nuclease variant of the present invention may also include other localization sequences such as cytoplasmic localization sequences, chloroplast localization sequences, mitochondrial localization sequences, and the like, depending on the location of the DNA to be edited.

Для получения эффективной экспрессии в клетке-мишени, в некоторых вариантах осуществления изобретения нуклеотидная последовательность, кодирующая вариант нуклеазы Cas9, кодоноптимизирована для организма, из которого происходит клетка, подлежащая редактированию генома.To obtain efficient expression in the target cell, in some embodiments of the invention, the nucleotide sequence encoding the Cas9 nuclease variant is codon-optimized for the organism from which the cell to be edited is derived.

Кодон-оптимизация относится к процессу модификации последовательности нуклеиновой кислоты для усиления экспрессии в представляющих интерес клетках-хозяевах путем замены по меньшей мере одного кодона (например, приблизительно или более 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более кодонов) нативной последовательности с кодонами, которые достаточно часто или чаще всего используются в генах этой клетки-хозяина при обеспечении нативной аминокислотной последовательности. Различные виды прояв- 6 042493 ляют особое предпочтение к определенным кодонам конкретной аминокислоты. Предпочтение к кодону (отличия в использовании кодонов между организмами) часто коррелирует с эффективностью трансляции информационной РНК (mPHK), которая, в свою очередь, как полагают, зависит, помимо прочего, от свойств транслируемых кодонов и наличия молекул конкретной транспортной РНК (tPHK). Преобладание выбранных tPHK в клетке, как правило, является отражением кодонов, наиболее часто используемых при синтезе пептидов. Соответственно, гены могут быть адаптированы для оптимальной экспрессии гена в данном организме на основе кодон-оптимизации. Таблицы использования кодонов доступны, например, в Базе данных использования кодонов, которая находится по адресу www.kazusa.oijp/codon/, и эти таблицы могут быть адаптированы различными способами. См. Nakamura, Y., и др. Codon usage tabulated from the international DNA sequence databases: status for the year 2000 Nucl. Acids Res. 28:292 (2000).Codon optimization refers to the process of modifying a nucleic acid sequence to enhance expression in host cells of interest by changing at least one codon (e.g., about or more than 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 or more codons) of a native sequence with codons that are frequently or most frequently used in the genes of that host cell while providing a native amino acid sequence. Different species show particular preference for certain codons of a particular amino acid. Codon preference (differences in codon usage between organisms) often correlates with the efficiency of messenger RNA (mRNA) translation, which in turn is thought to depend, among other things, on the properties of the codons being translated and the presence of particular messenger RNA (tRNA) molecules. The predominance of selected tRNAs in a cell is usually a reflection of the codons most frequently used in peptide synthesis. Accordingly, genes can be adapted for optimal gene expression in a given organism based on codon optimization. Codon usage tables are available, for example, in the Codon Usage Database located at www.kazusa.oijp/codon/ and these tables can be adapted in various ways. See Nakamura, Y., et al. Codon usage tabulated from the international DNA sequence databases: status for the year 2000 Nucl. Acids Res. 28:292 (2000).

Организм, из которого происходит клетка, геном которой может быть отредактирован с помощью системы по настоящему изобретению, может быть, не ограничиваясь только перечисленным, млекопитающим, таким как человек, мышь, крыса, обезьяна, собака, свинья, овца, корова и кошка; домашней птицей, такой как курица, утка и гусь; растением, включая однодольные и двудольные, например, рис, кукуруза, пшеница, сорго, ячмень, соя, арахис, Arabidopsis thaliana и тому подобное.The organism from which the cell originated, the genome of which can be edited using the system of the present invention, can be, but not limited to, mammals such as human, mouse, rat, monkey, dog, pig, sheep, cow and cat; poultry such as chicken, duck and goose; plant, including monocots and dicots, for example, rice, corn, wheat, sorghum, barley, soybeans, peanuts, Arabidopsis thaliana and the like.

В некоторых особых вариантах осуществления изобретения кодон-оптимизированной нуклеотидной последовательностью, кодирующей вариант нуклеазы Cas9, является последовательность, показанная в SEQ ID NO: 7 (eSpCas9(1.0)), SEQ ID NO: 8 (eSpCas9(1.1)) или SEQ ID NO: 9 (SpCas9-HF1).In some specific embodiments, the codon-optimized nucleotide sequence encoding the Cas9 nuclease variant is the sequence shown in SEQ ID NO: 7 (eSpCas9(1.0)), SEQ ID NO: 8 (eSpCas9(1.1)) or SEQ ID NO: 9 (SpCas9-HF1).

В некоторых вариантах осуществления изобретения направляющая РНК представляет собой одиночную направляющую РНК (sgPHK). В данной области техники известны способы конструирования подходящих sgPHK в соответствии с заданной последовательностью-мишенью. См., например, Wang, Y. и др. Simultaneous editing of three homoeoalleles in hexapioid bread wheat confers heritable resistance to powdery mildew. Nat. Biotechnol. 32, 947-951 (2014); Shan, Q. и др. Targeted genome modification of crop plants using a CRISPR-Cas system. Nat. Biotechnol. 31, 686-688 (2013); Liang, Z. и др. Targeted mutagenesis in Zea mays using TALENs and the CRISPR/Cas system. J Genet Genomics. 41, 63-68 (2014).In some embodiments, the guide RNA is a single guide RNA (sgRNA). Methods for constructing suitable sgRNAs according to a given target sequence are known in the art. See, for example, Wang, Y. et al. Simultaneous editing of three homoeoalleles in hexapioid bread wheat confers heritable resistance to powdery mildew. Nat. Biotechnol. 32, 947-951 (2014); Shan, Q. et al. Targeted genome modification of crop plants using a CRISPR-Cas system. Nat. Biotechnol. 31, 686-688 (2013); Liang, Z. et al. Targeted mutagenesis in Zea mays using TALENs and the CRISPR/Cas system. J Genet Genomics. 41, 63-68 (2014).

В некоторых вариантах осуществления изобретения нуклеотидная последовательность, кодирующая вариант нуклеазы Cas9, и/или нуклеотидная последовательность, кодирующая слияние направляющей РНК, функционально связана с элементом, регулирующим экспрессию, таким как промотор.In some embodiments, the nucleotide sequence encoding the Cas9 nuclease variant and/or the nucleotide sequence encoding the guide RNA fusion is operably linked to an expression control element, such as a promoter.

Примеры промоторов, которые можно использовать в настоящем изобретении, включают в себя, не ограничиваясь только перечисленным, промоторы полимеразы (pol) I, pol II или pol III. Примеры промоторов pol I включают в себя промотор pol I РНК курицы. Примеры промоторов pol II включают в себя, не ограничиваясь только перечисленным, немедленно-ранний промотор цитомегаловируса (CMV), промотор с длинным концевым повтором вируса саркомы Рауса (RSV-LTR) и немедленно-ранний промотор вируса обезьян 40 (SV40). Примеры промоторов pol III включают в себя промоторы U6 и H1. Может быть использован индуцируемый промотор, такой как металлотионеин. Другие примеры промоторов включают в себя промотор бактериофага Т7, промотор бактериофага ТЗ, промотор (3-галактозидазы, промотор бактериофага Sp6 и т.д. При использовании для растений можно применять промоторы, которые включают в себя, не ограничиваясь только перечисленным, промотор 35S вируса мозаики цветной капусты, промотор Ubi-1 кукурузы, промотор пшеницы U6, промотор риса U3, промотор кукурузы U3, промотор актина риса и т.д.Examples of promoters that can be used in the present invention include, but are not limited to, polymerase (pol) I, pol II, or pol III promoters. Examples of pol I promoters include the chicken RNA pol I promoter. Examples of pol II promoters include, but are not limited to, the cytomegalovirus immediate-early (CMV) promoter, the Rous sarcoma virus long terminal repeat (RSV-LTR) promoter, and the simian virus 40 immediate-early (SV40) promoter. Examples of pol III promoters include the U6 and H1 promoters. An inducible promoter such as metallothionein may be used. Other examples of promoters include the bacteriophage T7 promoter, the bacteriophage TK promoter, the (3-galactosidase) promoter, the bacteriophage Sp6 promoter, etc. When used in plants, promoters can be used that include, but are not limited to, the mosaic virus 35S promoter cauliflower, corn Ubi-1 promoter, U6 wheat promoter, U3 rice promoter, U3 corn promoter, rice actin promoter, etc.

3) Способ генетического модифицирования клетки.3) The method of genetic modification of the cell.

Еще один объект изобретения предусматривает способ для генетического модифицирования клетки, содержащий: введение в клетку системы редактирования генома по настоящему изобретению, посредством которого вариант нуклеазы Cas9 нацеливается на последовательность-мишень в геноме клетки при помощи направляющей РНК, а результат заключается в замене, делеции и/или добавлении одного или более нуклеотидов в последовательность-мишень.Another object of the invention provides a method for genetically modifying a cell, comprising: introducing into the cell a genome editing system of the present invention, whereby a Cas9 nuclease variant is targeted to a target sequence in the genome of the cell using a guide RNA, and the result is a replacement, deletion and/ or adding one or more nucleotides to the target sequence.

Разработка последовательности-мишени, которая может быть распознана и обеспечить нацеливание комплексом Cas9 и направляющей РНК, находится в пределах технических навыков специалиста средней квалификации в данной области. Как правило, последовательность-мишень представляет собой последовательность, которая является комплементарной лидерной последовательности из примерно 20 нуклеотидов, содержащихся в направляющей РНК, и конец 3' которой является смежным с мотивом, примыкающим к протоспейсеру (РАМ) NGG.Development of a target sequence that can be recognized and targeted by the Cas9 complex and guide RNA is within the technical skill of one of ordinary skill in the art. Typically, the target sequence is a sequence that is complementary to a leader sequence of about 20 nucleotides contained in the guide RNA and whose 3' end is adjacent to the NGG protospacer (PAM) adjacent motif.

Например, в некоторых вариантах осуществления изобретения последовательность-мишень имеет структуру: 5'-Nx-NGG-3', в которой N выбирается независимо от A, G, С и Т; X является целым в пределах 14<Х<30; NX представляет X перекрывающихся нуклеотидов, a NGG является последовательностью мотива, примыкающего к протоспейсеру (РАМ). В некоторых особых вариантах осуществления изобретения, X равно 20.For example, in some embodiments of the invention, the target sequence has the structure: 5'-N x -NGG-3', in which N is selected independently of A, G, C and T; X is an integer within 14<X<30; NX represents X overlapping nucleotides, and NGG is the protospacer adjacent motif (PAM) sequence. In some specific embodiments of the invention, X is equal to 20.

По настоящему изобретению модифицируемая последовательность-мишень может быть расположена в любом месте генома, например, внутри функционального гена, такого как ген, кодирующий белок, или, например, может быть расположена в регуляторной области экспрессии гена, такой как область промотора или область энхансера, и, таким образом, может выполнить функциональную модификацию указанного гена или выполнить модификацию экспрессии гена.According to the present invention, the target sequence to be modified may be located anywhere in the genome, for example, within a functional gene, such as a gene encoding a protein, or, for example, may be located in a regulatory region of gene expression, such as a promoter region or an enhancer region, and , thus, can perform a functional modification of the specified gene or perform a modification of the expression of the gene.

- 7 042493- 7 042493

Замена, делеция и/или добавление в целевой последовательности клетки могут быть обнаружены с помощью Т7Е1, PCR/RE или способов секвенирования, см., например, Shan Q., Wang Y., Li, J. & Gao, C.A substitution, deletion and/or addition in the target sequence of a cell can be detected by T7E1, PCR/RE or sequencing methods, see e.g. Shan Q., Wang Y., Li, J. & Gao, C.

Genome editing in rice and wheat using the CRISPR/Cas system. Nat. Protoc. 9, 2395-2410 (2014).Genome editing in rice and wheat using the CRISPR/Cas system. Nat. Protocol. 9, 2395-2410 (2014).

В способе по настоящему изобретению система редактирования генома может быть введена в клетку с использованием различных способов, хорошо известных специалистам в данной области техники.In the method of the present invention, a genome editing system can be introduced into a cell using various methods well known to those skilled in the art.

Способы введения системы редактирования генома в клетку по настоящему изобретению включают в себя, не ограничиваясь только перечисленным, трансфекцию фосфата кальция, слияние протопластов, электропорацию, трансфекцию липосом, микроинъекцию, вирусную инфекцию (такую как бакуловирус, вирус коровьей оспы, аденовирус и другие вирусы), бомбардировку частицами, ПЭГ-опосредованную трансформацию протопласта или трансформацию посредством агробактерий.Methods for introducing a genome editing system into a cell of the present invention include, but are not limited to, calcium phosphate transfection, protoplast fusion, electroporation, liposome transfection, microinjection, viral infection (such as baculovirus, vaccinia virus, adenovirus, and other viruses), particle bombardment, PEG-mediated protoplast transformation, or transformation by agrobacteria.

Клетка, геном которой может быть отредактирован с помощью системы по настоящему изобретению, может принадлежать, например, млекопитающим, таким как человек, мышь, крыса, обезьяна, собака, свинья, овца, корова и кошка; домашней птице, такой как курица, утка и гусь; и растениям, включая однодольные и двудольные, такие как рис, кукуруза, пшеница, сорго, ячмень, соя, арахис, Arabidopsis thaliana и тому подобное.The cell whose genome can be edited with the system of the present invention may be, for example, mammals such as humans, mice, rats, monkeys, dogs, pigs, sheep, cows and cats; poultry such as chicken, duck and goose; and plants, including monocots and dicots such as rice, corn, wheat, sorghum, barley, soybeans, peanuts, Arabidopsis thaliana, and the like.

В некоторых вариантах осуществления способ по настоящему изобретению выполняется in vitro. Например, такая клетка является изолированной клеткой. В некоторых других вариантах осуществления способ по настоящему изобретению может быть выполнен in vivo. Например, такая клетка представляет собой клетку в организме, и система по настоящему изобретению может быть введена в указанную клетку in vivo с использованием, например, вирус-опосредованного способа. В некоторых вариантах осуществления такая клетка представляет собой зародышевую клетку. В некоторых вариантах осуществления такая клетка является соматической клеткой.In some embodiments, the method of the present invention is performed in vitro. For example, such a cell is an isolated cell. In some other embodiments, the implementation of the method of the present invention can be performed in vivo. For example, such a cell is a cell in the body, and the system of the present invention can be introduced into said cell in vivo using, for example, a virus-mediated method. In some embodiments, such a cell is a germ cell. In some embodiments, such a cell is a somatic cell.

Другой объект настоящего изобретения дополнительно предусматривает генетически модифицированный организм, который содержит генетически модифицированную клетку, полученную способом по настоящему изобретению.Another object of the present invention further provides a genetically modified organism that contains a genetically modified cell obtained by the method of the present invention.

Такие организмы включают в себя, не ограничиваясь только перечисленным, млекопитающих, таких как человек, мышь, крыса, обезьяна, собака, свинья, овца, корова и кошка; домашнюю птицу, такую как курица, утка, и гусь; растения, включающие в себя однодольные и двудольные растения, такие как рис, кукуруза, пшеница, сорго, ячмень, соя, арахис и Arabidopsis thaliana.Such organisms include, but are not limited to, mammals such as humans, mice, rats, monkeys, dogs, pigs, sheep, cows, and cats; poultry such as chicken, duck, and goose; plants including monocots and dicots such as rice, corn, wheat, sorghum, barley, soybeans, peanuts and Arabidopsis thaliana.

ПримерыExamples

Материалы и способы.Materials and methods.

Конструирование бинарных векторов экспрессии pJIT163-SpCas9. pJIT163-eSpCas9(1.0), рЛТ163eSpCas9( 1.1) и рЛТ163 -SpCas9-HF 1.Construction of binary expression vectors pJIT163-SpCas9. pJIT163-eSpCas9(1.0), rLT163eSpCas9(1.1), and rLT163-SpCas9-HF 1.

Последовательности SpCas9, eSpCas9(1.0), eSpCas9(l.l) и SpCas9-HFl были кодон-оптимизированы для риса, SpCas9, eSpCas9(1.0), eSpCas9(l.l) и SpCas9-HFI были получены путем сайт-направленного мутагенеза с использованием системы Fast MultiSite Metagenesis System (TransGen) с плазмидой рЛТ163SpCas9 (SEQ ID NO: 10) в качестве матрицы.SpCas9, eSpCas9(1.0), eSpCas9(l.l) and SpCas9-HFl sequences were codon optimized for rice, SpCas9, eSpCas9(1.0), eSpCas9(l.l) and SpCas9-HFI were generated by site-directed mutagenesis using the Fast MultiSite system Metagenesis System (TransGen) with plasmid pLT163SpCas9 (SEQ ID NO: 10) as template.

Конструирование вектора экспрессии sgPHK.Construction of the sgPHK expression vector.

Последовательности-мишени sgPHK, использованные в экспериментах, показаны в табл. 1 далее.The sgRNA target sequences used in the experiments are shown in Table 1. 1 next.

Таблица 1. Целевой ген и последовательность-мишень sgPHKTable 1. Target gene and sgRNA target sequence

sgPHK sgPHK Последовательность- мишень Subsequence- target Олиго-F Oligo-F Олиго-R Oligo-R Скгт-нт Skgt-nt AGGTCGGGGAGGGGACGTACGGG AGGTCGGGGAGGGGACGTACGGG GGCAAGGT( OGG ~UGGGG ?GTA< GGCAAGGT( OGG ~UGGGG ?GTA< AAACGTACGTCCCCTCCCCGACCT : AACGTACGTCCCCTCCCCGACCCT : j-mkk ; j-mkk ; GACGTCGGCGAGGAAGGCCTCGG GACGTCGGCGAGGAAGGCCTCGG GGCAGACGTCGGCGAGGAAGGCCT GGCAGACGTCGGCGAGGAAGGCCT A A ACAGGCCTTCCTCGCCGACGTC A A ACAGGCCTTCCTCGCCGACGTC Al Al CATGGTGGGGAAAGCTTGGAGGG CATGGTGGGGAAAGCTTGGAGGG GGCACATGGTGG ЗА: GGCACATGGTGG FOR: А ч A~T< V s XGCTTTCCCCACC V >. Ah A~T< V s XGCTTTCCCCACC V >. А2 ; A2; CCGGACGACGACGTCGACGACGG CCGGACGACGACGTCGACGACGG GGCACCGGACGACGACGTCGACGA GGCACCGGACGACGACGTCGACGA ’A v^TCGTCGACGTCGTCGTCrGG 'A v^TCGTCGACGTCGTCGTCrGG АЗ AZ TTGAAGTCCCTTCTAGATGGAGG TTGAAGTCCCTTCTAGATGGAGG CGCАТТС А лGTCCCTTCTAGATGG : CGCATTC A lGTCCCTTCTAGATGG : AAACCCATCTAGAAGGGACTTCAA AAACCCATCTAGAAGGGACTTCAA Al Al Alo .CGaCACCCAGAToTC· Ж IC Alo .CGaCACCCAGAToTC F IC GG rAiTG- 3 MVCOCAGATATCG GG rAiTG- 3 MVCOCAGATATCG АААГС^^Т^ ATGTCGCAGT AAAGS^^T^ ATGTCGCAGT WS WS GTTGGTrTTTGCTn-TGF A., GTTGGTrTTTGCTn-TGF A., GGCA<iΠuGTCTTTGCTCCTGCAG GGCA<iΠuGTCTTTGCTTCCTGCAG AAACCTGCAi 1GAGOAAAGACCAAC AAACCTGCAi 1GAGOAAAGACCAAC

Векторы экспрессии sgPHK: pOsU3-CDKB2-sgPHK, pOsU3-MKK4-sgPHK, pOsU3-AT'sgPHK, a также pOsU3-A2-sgPHK, pOsU3-A3-sgPHK, pOsU3-A4-sgPHK и pOsU3-PDS-sgPHK сконструированы на основе pOsU3-sgPHK(Addgene ID53063), как описывалось ранее (Shan, Q. и др. Targeted genome modification of crop plants using a CRISPR-Cas system. Nat. Biotechnol. 31, 686-688, 2013).The sgPHK expression vectors pOsU3-CDKB2-sgPHK, pOsU3-MKK4-sgPHK, pOsU3-AT'sgPHK, as well as pOsU3-A2-sgPHK, pOsU3-A3-sgPHK, pOsU3-A4-sgPHK and pOsU3-PDS-sgPHK are constructed based on pOsU3-sgPHK (Addgene ID53063) as previously described (Shan, Q. et al. Targeted genome modification of crop plants using a CRISPR-Cas system. Nat. Biotechnol. 31, 686-688, 2013).

Конструирование векторов экспрессии tPHK-sgPHK.Construction of tPHK-sgPHK expression vectors.

Векторы экспрессии tPHK-sgPHK конструируются на основе вектора pUC57-U3-tPHK-sgPHK. (SEQ ID NO: 11, фиг. 6). Линейный вектор получают после расщепления pUC57-U3-tPHK-sgPHK с Bsal, соответствующие олиго-F и олиго-R гибридизированы и соединены в линейный вектор, а последующие этапы аналогичны конструированию векторов экспрессии sgPHK.The tPHK-sgPHK expression vectors are constructed based on the pUC57-U3-tPHK-sgPHK vector. (SEQ ID NO: 11, FIG. 6). A linear vector is obtained after pUC57-U3-tPHK-sgPHK is cleaved with Bsal, the corresponding oligo-F and oligo-R are hybridized and connected into a linear vector, and the subsequent steps are similar to the construction of sgRNA expression vectors.

-8042493-8042493

Таблица 2. Целевые гены и олигонуклеотидные последовательности для конструирования векторов экспрессии tPHK-sgPHKTable 2. Target genes and oligonucleotide sequences for constructing tRNA-sgRNA expression vectors

sgPHK sgPHK Последовательность- мишень Subsequence- target Олиго-F Oligo-F Олиго-R Oligo-R OsCDKB2 OsCDKB2 AGGTCGGGGAGGGGACGTACGGG AGGTCGGGGAGGGGACGTACGGG TGCAAGGTCGGC TGCAAGGTCGGC 4АЧ A <4 CCCTCCCCGACCT 4AH A <4 CCCTCCCCGACCT OsMKK4 OsMKK4 GACGTCGGCGAC GACGTCGGCGAC ко· к.,- O'O 3CGAGGAAGGC'7 co.,- O'O 3CGAGGAAGGC'7 , x iGGCCTTCCTC< 7G- 7- , x iGGCCTTCCTC< 7G- 7- Al i Al i CATGGTGGGGAAAGCTTGGAGGG CATGGTGGGGAAAGCTTGGAGGG “ ,T KOIGGAAAGCI I',o < “ ,T KOIGGAAAGCI I',o < GCAAGCTTTCCCCACCATG GCAAGCTTTCCCCACCATG /V /V .CGACGACGTCGACGACGG .CGACGACGTCGACGAGGG TGCAC .CGTCGACGA · TGCAC .CGTCGACGA AAACTCGTCGACGTCGTCGTCCGG AAACTCGTCGACGTCGTCGTCCGG АЗ AZ 3 3 TGCATTGA; TGCATTGA; AAACCCATCTAGAAG GG ACTTC AA AAACCCATCTAGAAG GG ACTTC AA А4 A4 , ”7 >гасСС‘ ϊ’τη,ΤΌ , ”7 >gasSS‘ ϊ’τη,ΤΌ ΤΑ·' KTGCOACACCCpG ·τ'ΤιΗΤΑ ' KTGCOACACCCpG τ 'ΤιΗ AAACCGATATCTGGGTGTCGCAGT AAACCGATATCTGGGTGTCGCAGT PDS PDS GTTGGTCTTTGC3A<n GV ,, GTTGGTCTTTGC3A<n GV ,, Н.г.АЗТКлЦСТТТОС I· N.g.AZTKlTSTTTOS I AAACCTGCAGGAGCAAAGACC; AAACCTGCAGGAGCAAAGACC;

Анализы протопласта.protoplast analyses.

В исследовании использован сорт риса nipponbare. Трансформация протопластов осуществляется как описано ниже. Трансформация осуществляется для 10 мкг каждой плазмиды путем трансфекции, опосредованной полиэтиленгликолем. Протопласты были собраны после 48 ч, а ДНК была извлечена в ходе анализа PCR-RE.The study used the nipponbare rice variety. Protoplast transformation is carried out as described below. Transformation is performed for 10 μg of each plasmid by polyethylene glycol-mediated transfection. Protoplasts were harvested after 48 h and DNA was extracted during PCR-RE analysis.

Приготовление и трансформация рисового протопласта.Preparation and transformation of rice protoplast.

1) Для изоляции протопластов использовалась оболочка листьев рассады, прорезанная острым лезвием на части шириной 0,5 мм.1) For the isolation of protoplasts, the sheath of seedling leaves was used, cut with a sharp blade into pieces 0.5 mm wide.

2) Сразу после разреза образец был перенесен в 0,6 М раствор маннитола и помещен в темноту на 10 мин.2) Immediately after incision, the sample was transferred to a 0.6 M mannitol solution and placed in the dark for 10 min.

3) Раствор маннитола был удален путем фильтрации, а продукты были перенесены в раствор для ферментолиза и подвергнуты вакуумированию в течение 30 мин.3) The mannitol solution was removed by filtration and the products were transferred to the fermentolysis solution and subjected to vacuum for 30 minutes.

4) Ферментолиз проводился в течение 5-6 часов, в темноте и при осторожном встряхивании (обесцвечивание в шейкере, скорость 10).4) Fermentolysis was carried out for 5-6 hours, in the dark and with gentle shaking (discoloration in a shaker, speed 10).

5) По завершении ферментолиза был добавлен равный объем W5 и выполнено горизонтальное встряхивание в течение 10 с, чтобы высвободить протопласты.5) At the end of the enzymatic lysis, an equal volume of W5 was added and horizontal shaking was performed for 10 s to release the protoplasts.

6) Протопласты были отфильтрованы в пробирку для центрифуги с круглым дном объемом 50 мл с нейлоновой мембраной 40 мкм и промыты раствором W5.6) The protoplasts were filtered into a 50 ml round bottom centrifuge tube with a 40 µm nylon membrane and washed with W5 solution.

7) Для осаждения протопластов была выполнена горизонтальная обработка на центрифуге при 250 g в течение 3 мин с удалением супернатанта.7) To precipitate the protoplasts, a horizontal centrifuge treatment at 250 g for 3 min was performed to remove the supernatant.

8) Протопласты были повторно приведены во взвешенное состояние путем добавления 10 мл W5, а затем обработаны на центрифуге при 250g в течение 3 мин с удалением супернатанта.8) The protoplasts were re-suspended by adding 10 ml of W5 and then centrifuged at 250g for 3 min to remove the supernatant.

9) Соответствующее количество раствора MMG было добавлено для повторного приведения протопластов во взвешенное состояние с концентрацией 2х106 /мл.9) An appropriate amount of MMG solution was added to re-suspend the protoplasts at a concentration of 2x10 6 /ml.

Примечание: все предыдущие этапы осуществлялись при комнатной температуре.Note: All previous steps were carried out at room temperature.

10) 10-20 мкг плазмид, 200 мкл протопластов (около 4х105 клеток) и 220 мкг свежего раствора ПЭГ были добавлены в пробирку для центрифуги объемом 2 мл, перемешаны и помещены при комнатной температуре в темноту на 10-20 мин, чтобы вызвать трансформацию.10) 10-20 µg of plasmids, 200 µl of protoplasts (about 4x10 5 cells) and 220 µg of fresh PEG solution were added to a 2 ml centrifuge tube, mixed and placed at room temperature in the dark for 10-20 min to induce transformation .

11) После завершения трансформации были медленно добавлены 880 мкл раствора W5, для перемешивания пробирки осторожно переворачивали вверх дном, а затем обрабатывали на центрифуге при 250 g в течение 3 мин с удалением супернатанта.11) After completion of the transformation, 880 µl of W5 solution were slowly added, the tubes were carefully turned upside down to mix, and then centrifuged at 250 g for 3 min to remove the supernatant.

12) Полученные продукты были повторно приведены во взвешенное состояние путем добавления 2 мл раствора WI, перенесены на планшет с шестью ячейками и культивированы при комнатной температуре (или 25°С) в темноте. Для выделения геномной ДНК протопласта продукты необходимо культивировать в течение 48 часов.12) The resulting products were resuspended by adding 2 ml of WI solution, transferred to a six-well plate and cultured at room temperature (or 25°C) in the dark. To isolate protoplast genomic DNA, the products must be cultured for 48 hours.

Идентификация мутаций с помощью глубокого секвенирования.Mutation identification using deep sequencing.

Анализ методом глубокого секвенирования выполняется с применением методики Liang, Z., Chen, К., Li, T, Zhang, Y., Wang, Y., Zhao, Q., Liu, J., Zhang, H., Liu, C, Ran, Y., и др. (2017). Efficient DNA-free genome editing of bread wheat using CRISPR/Cas9 ribonucleoprotein complexes. Nature Communications 8, 14261.Deep sequencing analysis performed using Liang, Z., Chen, K., Li, T, Zhang, Y., Wang, Y., Zhao, Q., Liu, J., Zhang, H., Liu, C , Ran, Y., et al. (2017). Efficient DNA-free genome editing of bread wheat using CRISPR/Cas9 ribonucleoprotein complexes. Nature Communications 8, 14261.

Пример 1. Сравнение возможностей редактирования WT SpCas9 и ее вариантов для сайтовмишеней.Example 1. Comparison of editing capabilities of WT SpCas9 and its options for target sites.

WT SpCas9, eSpCas9(1.0), eSpCas9(1.1) и SpCas9-HF1 были соответственно сконструированы в транзиентный вектор экспрессии pJIT163, а экспрессии WT SpCas9, eSpCas9(1.0), eSpCas9(1.1) и SpCas9HF1 управляются промотором гена убиквитина кукурузы. sgPHK были сконструированы в векторе pOsU3-sgPHK, а экспрессия sgPHK управляется промотором OsU3. Протопласты риса были трансформированы, и ДНК протопласта экстрагировали для анализа PCR-RE с целью оценки эффективности мутации. Для сравнения различий в способности к редактированию SpCas9 дикого типа и eSpCas9(1.0), eSpCas9(1.1) и SpCas9-HF1 выбраны пять целевых сайтов (А1, А2, A3, А4 и PDS, см. фиг. 2 и 3).WT SpCas9, eSpCas9(1.0), eSpCas9(1.1), and SpCas9-HF1, respectively, were constructed into the pJIT163 transient expression vector, and WT SpCas9, eSpCas9(1.0), eSpCas9(1.1), and SpCas9HF1 expressions are driven by the maize ubiquitin gene promoter. sgRNAs were constructed in the pOsU3-sgPHK vector, and sgRNA expression is driven by the OsU3 promoter. Rice protoplasts were transformed and protoplast DNA was extracted for PCR-RE analysis to evaluate mutation efficiency. Five target sites (A1, A2, A3, A4 and PDS, see FIGS. 2 and 3) were selected to compare differences in editing ability between wild-type SpCas9 and eSpCas9(1.0), eSpCas9(1.1) and SpCas9-HF1.

Транскрипцию с нуклеотидом А должен инициировать промотор OsU3, следовательно, конструи- 9 042493 рование векторов экспрессии sgPHK для сайтов-мишеней можно разделить в соответствии с двумя условиями следующим образом.Transcription with nucleotide A must be initiated by the OsU3 promoter, therefore, the construction of sgRNA expression vectors for target sites can be divided according to two conditions as follows.

(1) Если первый нуклеотид на конце 5' требуемой последовательности-мишени sgPHK (20 п.о.) представляет собой любой из G/T/C, поскольку промотор U3 инициирует транскрипцию с А, на конец 5' транскрибируемой sgPHK будет добавлен дополнительный А, и, кроме того, транскрибируемая sgPHK может не полностью совпадать с последовательностью-мишенью. Вектор экспрессии sgPHK может быть сконструирован как U3+AN20 на фиг. 1, где N20 представляет собой последовательность-мишень, А - это дополнительный нуклеотид на конце 5'.(1) If the first nucleotide at the 5' end of the desired sgPHK target sequence (20 bp) is either G/T/C, since the U3 promoter initiates transcription from A, an additional A will be added to the 5' end of the transcribed sgRNA , and furthermore, the sgRNA being transcribed may not exactly match the target sequence. The sgPHK expression vector can be designed as U3+AN 20 in FIG. 1, where N 20 is the target sequence, A is the extra nucleotide at the 5' end.

(2) Если первым нуклеотидом на конце 5' требуемой последовательности-мишени sgPHK (20 п.о.) является А, он может быть использован промотором U3 для инициирования транскрипции, и, следовательно, на конце 5' транскрибируемой sgPHK не будет иметься никаких дополнительных нуклеотидов. Вектор экспрессии sgPHK может быть сконструирован как U3+AN19 на фиг. 1, где AN19 представляет собой последовательность-мишень.(2) If the first nucleotide at the 5' end of the desired sgRNA target sequence (20 bp) is A, it can be used by the U3 promoter to initiate transcription, and therefore there will be no additional nucleotides at the 5' end of the transcribed sgRNA nucleotides. The sgPHK expression vector can be designed as U3+AN 19 in FIG. 1, where AN 19 is the target sequence.

Выбранные сайты-мишени A1, A2, A3 и PDS относятся к сайтам-мишеням класса (1), а сайтмишень А4 относится к сайтам-мишеням класса (2).Selected target sites A1, A2, A3 and PDS belong to target sites of class (1), and target site A4 refers to target sites of class (2).

Результаты эксперимента показывают (фиг. 2), что эффективность редактирования eSpCas9 (1.0), eSpCas9 (1.1) и SpCas9-HF1 для сайтов-мишеней класса (1) чрезвычайно низка. Отличия в эффективности редактирования eSpCas9(1.0), eSpCas9(1.1) и SpCas9-HF1 и эффективности редактирования WT SpCas9 не являются значительными для сайтов-мишеней класса (2). Это показывает, что дополнительный нуклеотид на конце 5' sgPHK, полученный в результате транскрипции, может снизить эффективность редактирования eSpCas9 (1.0), eSpCas9 (1.1) и SpCas9-HF1.The results of the experiment show (FIG. 2) that the editing efficiency of eSpCas9 (1.0), eSpCas9 (1.1) and SpCas9-HF1 for class (1) target sites is extremely low. The differences in the editing efficiency of eSpCas9(1.0), eSpCas9(1.1), and SpCas9-HF1 and the editing efficiency of WT SpCas9 are not significant for class (2) target sites. This indicates that an extra nucleotide at the 5' end of sgRNA resulting from transcription can reduce the editing efficiency of eSpCas9 (1.0), eSpCas9 (1.1), and SpCas9-HF1.

Аналогично промотору OsU3, промотор U6 кукурузы (TaU6) должен инициировать транскрипцию с нуклеотидом G, и, следовательно, конструирование векторов экспрессии sgPHK для сайтов-мишеней можно разделить в соответствии с двумя условиями следующим образом.Similar to the OsU3 promoter, the maize U6 promoter (TaU6) must initiate transcription from the G nucleotide, and therefore the construction of sgRNA expression vectors for target sites can be divided according to two conditions as follows.

(1) Если первый нуклеотид на конце 5' требуемой последовательности-мишени sgPHK (20 п.о.) представляет собой любой из А/Т/С, поскольку промотор U6 инициирует транскрипцию с G, на конец 5' транскрибируемой sgPHK будет добавлен дополнительный нуклеотид G и, кроме того, транскрибируемая sgPHK может не полностью совпадать с последовательностью-мишенью.(1) If the first nucleotide at the 5' end of the desired sgPHK target sequence (20 bp) is any of A/T/C, since the U6 promoter initiates transcription from G, an additional nucleotide will be added to the 5' end of the transcribed sgRNA G and, in addition, the transcribed sgRNA may not completely match the target sequence.

(2) Если первым нуклеотидом на конце 5' требуемой последовательности-мишени sgPHK (20 п.о.) является G, он может быть использован промотором U6 для инициирования транскрипции, при этом на конце 5' транскрибируемой sgPHK не имеется никаких дополнительных нуклеотидов.(2) If the first nucleotide at the 5' end of the desired sgRNA target sequence (20 bp) is G, it can be used by the U6 promoter to initiate transcription, with no additional nucleotides at the 5' end of the transcribed sgRNA.

Сайт-мишень OsPDS относится к сайтам-мишеням класса (2). Управление транскрипцией sgPHK GN19 и GN20 для сайта-мишени OsPDS осуществлялось при помощи промотора TaU6, где GN20 может имитировать сайты-мишени класса (1), а именно сайты с дополнительным нуклеотидом G на конце 5' sgPHK.The OsPDS target site belongs to class (2) target sites. Transcriptional control of sgPHK GN 19 and GN 20 for the OsPDS target site was performed using the TaU6 promoter, where GN 20 can mimic class (1) target sites, namely sites with an additional G nucleotide at the 5' end of sgRNA.

Таблица 3. Целевой ген и олигонуклеотидные последовательности для конструирования векторов экспрессии TaU6-sgPHKTable 3. Target gene and oligonucleotide sequences for constructing TaU6-sgRNA expression vectors

sgPHK sgPHK Последовательность- ; мишень Subsequence- ; target Олиго-F : Oligo-F : : Олиго-R : Oligo-R 1 OsPDS-GNi9 1 OsPDS-GNi9 . GTTGGTCTTTGCTCCTGCAGAGG.....; . GTTGGTCTTTGCTCCCTGCAGAGG.....; GGCGTTGGTCTTTGCTCCTGCAG : : GGCGTTGGTCTTTGCTCCTGCAG : : AAACCTGCAGGAG! AAACCTGCAGGAG! OsPDS-GN-o OsPDS-GN-o ' ..... ......... ' ;g ' ..... ......... ' ;g : GGCGGTTGGTCTTTGCTCCTGCAC : GGCGGTTGGTCTTTGCTCCCTGCAC ^ACCTGCAGGAGC A' ^ACCTGCAGGAGC A'

Результаты показывают (фиг. 2), что один дополнительный нуклеотид G на конце 5' sgPHK значительно снижает эффективность редактирования eSpCas9(1.0), eSpCas9(1.1) и SpCas9-HF1.The results show (FIG. 2) that one additional G nucleotide at the 5' end of sgRNA significantly reduces the editing efficiency of eSpCas9(1.0), eSpCas9(1.1) and SpCas9-HF1.

Пример 2. Увеличение эффективности редактирования вариантов Cas9 путем слияния tPHK-sgPHK.Example 2 Increasing the Efficiency of Cas9 Variant Editing by tPHK-sgPHK Fusion.

В соответствии с результатом примера 1, важным фактором, влияющим на эффективность редактирования eSpCas9(1.0), eSpCas9(1,1) и SpCas9-HF1, является то, точно ли инициируется sgPHK или нет.According to the result of Example 1, an important factor affecting the editing efficiency of eSpCas9(1.0), eSpCas9(1,1) and SpCas9-HF1 is whether sgPHK is accurately initiated or not.

Согласно предыдущему отчету, слияние tPHK с концом 5' sgPHK может активировать экспрессию sgPHK и приводить к точному расщеплению на конце 5' sgPHK, и, таким образом, избегать наличия дополнительного нуклеотида на конце 5' sgPHK. (см. Xie К, Minkenberg В, Yang Y. Boosting CRISPR/Cas9 multiplex editing capability with the endogenous tRNA-processing system. Proc NatI Acad Sci USA. 2015Mar 17; 112(11):3570-5. doi: 10.1073/pnas. 1420294112. Epub 2015 Mar 2.) sgPHK для каждого сайта-мишени в примере 1 была слита с tPHK и экспрессирована под контролем промотора OsU3. Эксперименты были проведены по способу Примера 1 с tPHK-sgPHK вместо sgPHK. Как показано на фиг. 2, для сайтовмишеней A1, A2, A3 и PDS эффективность редактирования eSpCas9(1.0), eSpCas9(1.1) и SpCas9-HF1 значительно повышается с использованием tPHK-sgPHK вместо sgPHK.According to a previous report, tRNA fusion to the 5' end of sgRNA can activate sgRNA expression and result in a precise cleavage at the 5' end of sgRNA, and thus avoid having an extra nucleotide at the 5' end of sgRNA. (See Xie K, Minkenberg B, Yang Y. Boosting CRISPR/Cas9 multiplex editing capability with the endogenous tRNA-processing system. Proc NatI Acad Sci USA. 2015 Mar 17; 112(11):3570-5. doi: 10.1073/pnas 1420294112. Epub 2015 Mar 2.) The sgRNA for each target site in Example 1 was fused to tRNA and expressed under the control of the OsU3 promoter. Experiments were carried out as in Example 1 with tPHK-sgPHK instead of sgPHK. As shown in FIG. 2, for A1, A2, A3 and PDS target sites, the editing efficiency of eSpCas9(1.0), eSpCas9(1.1) and SpCas9-HF1 is significantly improved by using tPHK-sgPHK instead of sgPHK.

Пример 3. Влияние слияния tPHK-sgPHK на специфичность редактирования вариантов Cas9 3.1 Сайт-мишень OsMKK4 риса.Example 3 Effect of tRNA-sgRNA fusion on the specificity of editing Cas9 variants 3.1 Rice OsMKK4 target site.

Для конструирования sgPHK и tPHK-sgPHK был выбран сайт-мишень GACGTCGGCGAGGAAGGCCT'CGG в гене риса MKK4, Этот сайт-мишень имеет два возможных нецелевых сайта, как показано на фиг. 5. Вектор для экспрессирования sgPHK или tPHK-sgPHK и векторы для экспрессирования WTSpCas9, eSpCas9(1.0), eSpCas9(1.1) и SpCas9-HF1 были соответствующим образом совместно транс- 10 042493 формированы в протопласты риса. Через два дня после трансформации был извлечен протопласт ДНК, а геномные фрагменты сайта-мишени и нецелевых сайтов были амплифицированы с использованием специфичных праймеров. Частота мутаций трех этих сайтов была проанализирована с использованием технологии секвенирования второго поколения.The target site GACGTCGGCGAGGAAGGCCT'CGG in the rice MKK4 gene was chosen for the construction of sgRNA and tPHK-sgPHK. This target site has two possible non-target sites, as shown in FIG. 5. The sgPHK or tPHK-sgPHK expression vector and the WTSpCas9, eSpCas9(1.0), eSpCas9(1.1) and SpCas9-HF1 expression vectors were appropriately co-transformed into rice protoplasts. Two days after transformation, protoplast DNA was extracted, and genomic fragments of the target site and non-target sites were amplified using specific primers. The mutation rates of these three sites were analyzed using second generation sequencing technology.

Результаты эксперимента показаны на фиг. 5.The results of the experiment are shown in Fig. 5.

Когда были использованы sgPHK, eSpCas9(1.0), eSpCas9(1.1) и SpCas9-HF1 по сравнению с WT SpCas9 демонстрируют чрезвычайно низкий нецелевой эффект, но имеют значительно более низкую эффективность редактирования.When sgPHKs were used, eSpCas9(1.0), eSpCas9(1.1) and SpCas9-HF1 compared to WT SpCas9 showed extremely low off-target effect but had significantly lower editing efficiency.

Когда были использованы tPHK-sgPHK, эффективность редактирования каждой группы была увеличена, однако, eSpCas9(1.0), eSpCas9(1.1) и SpCas9-HF1 способны обеспечить относительно высокую специфичность. В частности, для SpCas9-HF1 могут быть обнаружены только две крайне низкоуровневых мутации для обоих нецелевых сайтов. Следовательно, комбинация tPHK-sgPHK и SpCas9-HF1 особенно подходит для редактирования генома с высокой эффективностью и высокой специфичностью.When tRNA-sgPHK were used, the editing efficiency of each group was increased, however, eSpCas9(1.0), eSpCas9(1.1) and SpCas9-HF1 are able to provide relatively high specificity. In particular, for SpCas9-HF1, only two extremely low-level mutations could be detected for both non-target sites. Therefore, the combination of tRNA-sgRNA and SpCas9-HF1 is particularly suitable for genome editing with high efficiency and high specificity.

3.2 Сайт-мишень OsCDKB2 риса.3.2 OsCDKB2 target site in rice.

Для конструирования sgPHK был выбран сайт-мишень AGGTCGGGGAGGGGACGIACGGG в гене риса OsCDKB2. Этот сайт-мишень имеет три возможных нецелевых сайта, как показано на фиг. 6. Вектор для экспрессирования sgPHK или tPHK-sgPHK и векторы для экспрессирования WTSpCas9, eSpCas9(1.0), eSpCas9(1.1) и SpCas9-HF1 были соответствующим образом совместно трансформированы в протопласты риса. Через два дня после трансформации был извлечен протопласт ДНК, а геномные фрагменты сайта-мишени и нецелевых сайтов были амплифицированы с использованием специфичных праймеров. Частота мутаций четырех этих сайтов была проанализирована с использованием технологии глубокого секвенирования.The AGGTCGGGGGAGGGGACGIACGGG target site in the rice OsCDKB2 gene was chosen for sgRNA construction. This target site has three possible non-target sites, as shown in FIG. 6. The sgPHK or tPHK-sgPHK expression vector and the WTSpCas9, eSpCas9(1.0), eSpCas9(1.1) and SpCas9-HF1 expression vectors were appropriately co-transformed into rice protoplasts. Two days after transformation, protoplast DNA was extracted, and genomic fragments of the target site and non-target sites were amplified using specific primers. The mutation rates of these four sites were analyzed using deep sequencing technology.

Результаты эксперимента показаны на фиг. 6. Эффективность редактирования eSpCas9 (1.0), eSpCas9 (1.1) и SpCas9-HF1 сайтов-мишеней заметно повышается при использовании tPHK-sgPHK вместо sgPHK. В частности, эффективность редактирования SpCas9-HF1 может быть восстановлена до уровня дикого типа с обеспечением высокой специфичности. Поскольку эта последовательность-мишень начинается с нуклеотида А, с помощью которого промотор U3 может точно инициировать транскрипцию, повышенная эффективность редактирования может быть результатом повышенного уровня экспрессии sgPHK из-за слияния с tPHK.The results of the experiment are shown in Fig. 6. The efficiency of editing eSpCas9 (1.0), eSpCas9 (1.1), and SpCas9-HF1 target sites is markedly improved when using tPHK-sgPHK instead of sgPHK. In particular, the editing efficiency of SpCas9-HF1 can be restored to wild-type levels with high specificity. Since this target sequence starts at nucleotide A, from which the U3 promoter can accurately initiate transcription, the increased editing efficiency may be the result of increased sgRNA expression due to tRNA fusion.

Пример 4. Специфичность редактирования вариантов Cas9 по несоответствию между gPHK и последовательностью-мишенью.Example 4: Specificity of editing Cas9 variants by mismatch between gPHK and target sequence.

При конструировании sgPHK для сайта-мишени GACGlCGGCGAGGAAGGCC 1CGG в гене риса MKK4, были искусственно введены несовпадения двух смежных оснований (пурин для пурина и пиримидин для пиримидина). Было выявлено редактирование при условии, что sgPHK может не полностью соответствовать сайту-мишени. Если редактирование может быть обнаружено, оно считается нецелевым. Эксперименты проводились способом, аналогичным описанному в примере 3.1.When constructing sgRNA for the target site GACGlCGGCGAGGAAGGCC 1CGG in the rice MKK4 gene, two adjacent base mismatches (purine for purine and pyrimidine for pyrimidine) were artificially introduced. An edit has been identified under the assumption that the sgRNA may not fully match the target site. If the edit can be detected, it is considered inappropriate. The experiments were carried out in a manner similar to that described in example 3.1.

Результаты эксперимента показаны на фиг. 7. При использовании tPHK-sgPHK варианты SpCas9 показали более высокую чувствительность к несоответствиям между gPHK и последовательностьюмишенью (в особенности, когда несоответствие ближе к одному из концов).The results of the experiment are shown in Fig. 7. When using tRNA-sgRNA, SpCas9 variants showed higher sensitivity to mismatches between gRNA and target sequence (especially when the mismatch is closer to one of the ends).

Пример 5. Эффективность и специфичность редактирования вариантов Cas9 на почке эмбриона человека, 293 клетки.Example 5 Efficiency and Specificity of Cas9 Variant Editing in Human Embryonic Kidney, 293 Cells.

sgPHK были сконструированы для последовательности-мишениsgRNAs were designed for the target sequence

GG JGAG FGAG 1 G rGlGCGlGTCG в гене человека VEGFA. U6:sgPHK-GNj9 и U6:tPHK-sgPHK-N20 показывают, что sgPHK, транскрибированные при помощи промотора U6, имеют длину 20 нуклеотидов и полностью совпадают с последовательностью-мишенью; U6:sgPHK-GN20 показывает, что sgPHK, транскрибированная при помощи промотора U6, имеет длину 21 нуклеотид и содержит дополнительный G на конце 5'.GG JGAG FGAG 1 G rGlGCGlGTCG in the human VEGFA gene. U6:sgPHK-GNj 9 and U6:tPHK-sgPHK-N 20 show that sgPHKs transcribed with the U6 promoter are 20 nucleotides long and completely match the target sequence; U6:sgPHK-GN 20 shows that sgPHK transcribed with the U6 promoter is 21 nucleotides long and has an extra G at the 5' end.

Результаты исследования Т7Е1 показывают (фиг. 8), что WT Cas9 демонстрирует сходную эффективность редактирования при использовании разных стратегий транскрибирования sgPHK. Однако эффективность редактирования eSpCas9(1.1) и SpCas9-HF1 была значительно снижена в том случае, когда sgPHK содержит дополнительный нуклеотид на конце 5'. А при использовании слияний tPHK-sgPHK эффективность редактирования eSpCas9(1.1) и SpCas9-HF1 повышалась до уровня WT Cas9 или даже больше.The results of the T7E1 study show (FIG. 8) that WT Cas9 shows similar editing efficiency when using different sgRNA transcription strategies. However, the editing efficiency of eSpCas9(1.1) and SpCas9-HF1 was significantly reduced when the sgRNA contains an extra nucleotide at the 5' end. And when using tPHK-sgPHK fusions, the efficiency of editing eSpCas9(1.1) and SpCas9-HF1 increased to the level of WT Cas9 or even more.

Что касается специфичности редактирования, WT Cas9 привела к нецелевому редактированию на обоих сайтах нецелевой 1 и нецелевой 2, а при использовании слияний tPHK-sgPHK eSpCas9(1.1) и SpCas9-HF1 не привели к нецелевому редактированию.In terms of edit specificity, WT Cas9 resulted in off-target editing at both off-target 1 and off-target 2 sites, and did not result in off-target editing using tPHK-sgPHK eSpCas9(1.1) and SpCas9-HF1 fusions.

--

Claims (9)

Таблица 4. Целевой ген и олигонуклеотидные последовательности для конструирования векторов экспрессии sgPHK sgPHK Последовательностьмишень Олиго-F Олиго-R vegfa-gnI9 GGTGAGTGAGTGTGT GCGTGTGG ' GAGTGAGTGTGTG CGTG AAACCACGCiCACACTCACIC ACC vegfa-gn20 GGTGAGTGAGTGTGT GCGTGTGG CACCGGGTGAGTGAGTGTGT GCGTG AAACCACGCACACACTCACTC ACCC :Таблица 4. Целевой ген и олигонуклеотидные последовательности для конструирования векторов экспрессии sgPHK sgPHK Последовательностьмишень Олиго-F Олиго-R vegfa-gn I9 GGTGAGTGAGTGTGT GCGTGTGG ' GAGTGAGTGTGTG CGTG AAACCACGCiCACACTCACIC ACC vegfa-gn 20 GGTGAGTGAGTGTGT GCGTGTGG CACCGGGTGAGTGAGTGTGT GCGTG AAACCACGCACACACTCACTC ACCC : VEGFA-tRNA- N2o GGTGAGTGAGTGTGT GCGTGTGG CACCGaacaaagcaccagtggtctagtgg tagaatagtaccctgccacggtacagacccgg gttcgattcccggctggtgcaGGTGAGT GAGTGTGTGC AAACCACGCACACACTCACTC ACCtgcaccagccgggaatcgaacccgggtc tgtaccgtggcagggtactattctaccactagacc ;ctttgttCVEGFA-tRNA- N 2 o GGTGAGTGAGTGTGT GCGTGTGG CACCGaacaaagcaccagtggtctagtgg tagaatagtaccctgccacggtacagacccgg gttcgattcccggctggtgcaGGTGAGT GAGTGTGTGC AAACCACGCACACACTCACTC ACCtgcaccagccgggaatcccactcgggtc tgtaccactgtggcaggggtgtggcagggtg ФОРМУЛА ИЗОБРЕТЕНИЯCLAIM 1. Система редактирования генома для сайт-направленной модификации последовательностимишени в геноме клетки, которая содержит по меньшей мере один элемент из следующих с i) по iii):1. A genome editing system for site-directed modification of a target sequence in the genome of a cell, which contains at least one element from i) to iii): i) вариант нуклеазы Cas9 и экспрессионная конструкция, содержащая нуклеотидную последовательность РНК, кодирующую слияние tPHK и направляющей РНК;i) a Cas9 nuclease variant and an expression construct containing an RNA nucleotide sequence encoding a fusion of a tRNA and a guide RNA; ii) экспрессионная конструкция, содержащая нуклеотидную последовательность, кодирующую вариант нуклеазы Cas9, и экспрессионная конструкция, содержащая нуклеотидную последовательность РНК, кодирующую слияние tPHK и направляющей РНК; и iii) экспрессионная конструкция, содержащая нуклеотидную последовательность, кодирующую вариант нуклеазы Cas9, и нуклеотидную последовательность РНК, кодирующую слияние tPHK и направляющей РНК;ii) an expression construct containing a nucleotide sequence encoding a Cas9 nuclease variant and an expression construct containing an RNA nucleotide sequence encoding a tRNA-guide RNA fusion; and iii) an expression construct comprising a nucleotide sequence encoding a Cas9 nuclease variant and an RNA nucleotide sequence encoding a tRNA-guide RNA fusion; при этом вариант нуклеазы Cas9 имеет повышенную специфичность редактирования по сравнению с нуклеазой Cas9 дикого типа, при этом 5'-конец направляющей РНК соединен с 3'-концом tPHK, при этом РНК расщепляется на 5'-конце направляющей РНК после ее транскрибирования в клетке, вследствие чего формируется направляющая РНК, которая не несет дополнительный нуклеотид на 5'конце.at the same time, the Cas9 nuclease variant has an increased editing specificity compared to wild-type Cas9 nuclease, while the 5'-end of the guide RNA is connected to the 3'-end of tRNA, while the RNA is cleaved at the 5'-end of the guide RNA after its transcription in the cell, as a result, a guide RNA is formed that does not carry an extra nucleotide at the 5' end. 2. Система редактирования генома для сайт-направленной модификации последовательностимишени в геноме клетки, которая содержит по меньшей мере один элемент из следующих с i) по iii):2. A genome editing system for site-directed modification of a target sequence in the genome of a cell, which contains at least one of the following i) to iii): i) вариант нуклеазы Cas9 и экспрессионная конструкция, содержащая нуклеотидную последовательность РНК, кодирующую слияние рибозима и направляющей РНК;i) a Cas9 nuclease variant and an expression construct containing an RNA nucleotide sequence encoding a ribozyme-guide RNA fusion; ii) экспрессионная конструкция, содержащая нуклеотидную последовательность, кодирующую вариант нуклеазы Cas9, и экспрессионная конструкция, содержащая нуклеотидную последовательность РНК, кодирующую слияние рибозима и направляющей РНК; и iii) экспрессионная конструкция, содержащая нуклеотидную последовательность, кодирующую вариант нуклеазы Cas9, и нуклеотидную последовательность, кодирующую слияние рибозима и направляющей РНК;ii) an expression construct comprising a nucleotide sequence encoding a Cas9 nuclease variant and an expression construct comprising an RNA nucleotide sequence encoding a ribozyme-guide RNA fusion; and iii) an expression construct comprising a nucleotide sequence encoding a Cas9 nuclease variant and a nucleotide sequence encoding a ribozyme-guide RNA fusion; при этом вариант нуклеазы Cas9 имеет повышенную специфичность редактирования по сравнению с нуклеазой Cas9 дикого типа, при этом 5'-конец направляющей РНК соединен с 3'-концом первого рибозима, при этом первый рибозим предназначен для расщепления РНК на 5'-конце направляющей РНК, вследствие чего формируется направляющая РНК, которая не несет дополнительный нуклеотид на 5'конце.at the same time, the Cas9 nuclease variant has an increased editing specificity compared to wild-type Cas9 nuclease, while the 5'-end of the guide RNA is connected to the 3'-end of the first ribozyme, while the first ribozyme is designed to cleave the RNA at the 5'-end of the guide RNA, as a result, a guide RNA is formed that does not carry an extra nucleotide at the 5' end. 3. Система по п.1, в которой tPHK и клетка, подлежащая модифицированию, получены от одного вида.3. The system of claim 1, wherein the tRNA and the cell to be modified are from the same species. 4. Система по п.1, в которой tPHK кодируется последовательностью, показанной в SEQ ID NO: 1.4. The system of claim 1, wherein the tRNA is encoded by the sequence shown in SEQ ID NO: 1. 5. Система по п.1 или 2, в которой вариант нуклеазы Cas9 содержит последовательность аминокислоты, показанную в SEQ ID NO: 4, SEQ ID NO: 5 или SEQ ID NO: 6.5. The system of claim 1 or 2, wherein the Cas9 nuclease variant contains the amino acid sequence shown in SEQ ID NO: 4, SEQ ID NO: 5, or SEQ ID NO: 6. 6. Система по п. 1 или 2, в которой нуклеотидная последовательность, кодирующая вариант нуклеазы Cas9, является кодон-оптимизированной для организма, из которого происходит клетка, подлежащая модифицированию.6. The system according to claim 1 or 2, wherein the nucleotide sequence encoding the Cas9 nuclease variant is codon-optimized for the organism from which the cell to be modified originates. 7. Система по п.1 или 2, в которой направляющая РНК является одиночной направляющей РНК (sgPHK).7. The system of claim 1 or 2, wherein the guide RNA is a single guide RNA (sgRNA). 8. Система по п.1 или 2, в которой нуклеотидная последовательность, кодирующая слитую направляющую РНК, функционально связана с промотором pol III, при этом промотор pol III выбран из группы, состоящей из промотора U3, промотора U6 или промотора H1.8. The system of claim 1 or 2, wherein the nucleotide sequence encoding the fused guide RNA is operably linked to a pol III promoter, the pol III promoter being selected from the group consisting of a U3 promoter, a U6 promoter, or an H1 promoter. 9. Способ генетического модифицирования клетки, содержащий введение в клетку системы по любому из пп.1-8, посредством которого вариант нуклеазы Cas9 нацеливается на последовательность-9. A method for genetically modifying a cell, comprising introducing into the cell a system according to any one of claims 1 to 8, by means of which the Cas9 nuclease variant targets the sequence - --
EA201991849 2017-02-20 2018-02-22 SYSTEM AND METHOD FOR GENOME EDITING EA042493B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710089494.9 2017-02-20

Publications (1)

Publication Number Publication Date
EA042493B1 true EA042493B1 (en) 2023-02-20

Family

ID=

Similar Documents

Publication Publication Date Title
US20240011052A1 (en) Genome editing method
US10314297B2 (en) DNA knock-in system
AU2015269187B2 (en) Methods and compositions for modifying a targeted locus
US11702643B2 (en) System and method for genome editing
JP7138712B2 (en) Systems and methods for genome editing
JP6958917B2 (en) How to make gene knock-in cells
US11739322B2 (en) Method for genome editing using a self-inactivating CRISPR nuclease
JP7361109B2 (en) Systems and methods for C2c1 nuclease-based genome editing
CN117264998A (en) Dual-function genome editing system and use thereof
EA042493B1 (en) SYSTEM AND METHOD FOR GENOME EDITING
WO2021081384A1 (en) Synthetic nucleases
CA3174615A1 (en) Improved cytosine base editing system
CN115552002A (en) Genome modification method and genome modification kit
US20230287459A1 (en) Single generation targeted gene integration
Hryhorowicz et al. Programmable site-specific nucleases for target genome engineering