EA042506B1 - METHODS FOR SCREENING BACTERIA, ARCHAEA, ALGAE AND YEAST USING CRISPR NUCLEIC ACIDS - Google Patents

METHODS FOR SCREENING BACTERIA, ARCHAEA, ALGAE AND YEAST USING CRISPR NUCLEIC ACIDS Download PDF

Info

Publication number
EA042506B1
EA042506B1 EA201792663 EA042506B1 EA 042506 B1 EA042506 B1 EA 042506B1 EA 201792663 EA201792663 EA 201792663 EA 042506 B1 EA042506 B1 EA 042506B1
Authority
EA
Eurasian Patent Office
Prior art keywords
repeat
crispr
sequence
spacer
type
Prior art date
Application number
EA201792663
Other languages
Russian (ru)
Inventor
Родольф БАРРАНГУ
Курт М. Селль
Original Assignee
Норт Каролина Стейт Юниверсити
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Норт Каролина Стейт Юниверсити filed Critical Норт Каролина Стейт Юниверсити
Publication of EA042506B1 publication Critical patent/EA042506B1/en

Links

Description

Притязания на приоритетPriority Claims

Настоящая заявка притязает на приоритет, согласно 35 U.S.C. 119 (е), предварительной заявки на патент США № 62/168355, поданной 29 мая 2015 г., и предварительной заявки на патент США № 62/296,853, поданной 18 февраля 2016 г., содержание которых включено в настоящее описание полностью в виде ссылки.This application claims priority under 35 U.S.C. 119(e), U.S. Provisional Application No. 62/168355, filed May 29, 2015, and U.S. Provisional Application No. 62/296,853, filed February 18, 2016, the contents of which are incorporated herein in their entirety by reference .

Область техники, к которой относится изобретениеThe technical field to which the invention belongs

Настоящее изобретение относится к нуклеиновым кислотам CRISPR для скрининга в отношении жизненно важных и нежизненно важных генов и инородных геномных островов в бактериях, археях, водорослях и/или дрожжах для уничтожения бактерий, архей, водорослей и/или дрожжей, для идентификации фенотипа гена или генов и/или для скрининга в отношении уменьшенного размера генома и/или делеции гена в бактериях, археях, водорослях и/или дрожжах.The present invention relates to CRISPR nucleic acids for screening for vital and non-essential genes and foreign genomic islands in bacteria, archaea, algae and/or yeast to kill bacteria, archaea, algae and/or yeast, to identify the phenotype of a gene or genes, and /or to screen for reduced genome size and/or gene deletion in bacteria, archaea, algae and/or yeast.

Уровень техникиState of the art

Короткие палиндромные повторы, регулярно расположенные группами (CRISPR), в комбинации с ассоциированными последовательностями (cas), составляют CRISPR-Cas систему, которая обеспечивает многим бактериям адаптивный иммунитет. CRISPR-опосредованная иммунизация осуществляется путем поглощения ДНК из инвазивных генетических элементов, таких как плазмиды и фаги, в виде новых спейсеров.Regularly arranged short palindromic repeats (CRISPR), in combination with associated sequences (cas), constitute the CRISPR-Cas system, which provides many bacteria with adaptive immunity. CRISPR-mediated immunization is accomplished by uptake of DNA from invasive genetic elements such as plasmids and phages into novel spacers.

CRISPR-Cas системы состоят из массива коротких ДНК повторов, разделенных гипервариабельными последовательностями, фланкированных cas генами, которые обеспечивают адаптивный иммунитет к инвазивным генетическим элементам, таким как фаги и плазмиды, путем нацеливания на специфические последовательности и интерференции (Barrangou et al., 2007, Science, 315:1709-1712; Brouns et al., 2008, Science, 321:960-4; Horvath and Barrangou, 2010, Science, 327:167-70; Marraffini and Southerner, 2008, Science, 322:1843-1845; Bhaya et al., 2011, Annu. Rev. Genet., 45:273-297; Terns and Terns, 2011, Curr. Opin. Microbiol., 14:321-327; Westra et al., 2012, Annu. Rev. Genet., 46:311-339; Barrangou R., 2013, RNA, 4:267-278). Обычно инвазивные ДНК последовательности приобретаются в виде новых спейсеров (Barrangou et al., 2007, Science, 315:1709-1712), где каждая последовательность спарена с повтором CRISPR и вставлена в виде новой единицы повтор-спейсер в локус CRISPR. Впоследствии массив повтор-спейсер транскрибируется в виде длинной pre-CRISPR РНК (pre-crРНК) (Brouns et al., 2008, Science, 321:960-4), которая процессируется с образованием коротких интерферирующих CRISPR РНК (crРНК), которые управляют распознаванием специфических последовательностей. По существу стРНК направляют нуклезы на комплементарные мишени для опосредованного эндонуклеазами Cas расщепления нуклеиновой кислоты со специфической последовательностью (Garneau et al., 2010, Nature, 468:67-71; Haurwitz et al., 2010, Science, 329:1355-1358; Sapranauskas et al., 2011, Nucleic Acid Res., 39:9275-9282; Jinek et al., 2012, Science, 337:816-821; Gasiunas et al., 2012, Proc. Natl. Acad. Sci., 109:E2579-E2586; Magadan et al., 2012, PLoS One, 7:e40913; Karvelis et al., 2013, RNA Biol., 10:841-851). Эти широко распространенные системы встречаются почти у половины бактерий (~46%) и у большинстве археев (~90%).CRISPR-Cas systems consist of an array of short DNA repeats separated by hypervariable sequences flanked by cas genes that confer adaptive immunity to invasive genetic elements such as phages and plasmids by targeting specific sequences and interferences (Barrangou et al., 2007, Science , 315:1709-1712; Brouns et al., 2008, Science, 321:960-4; Horvath and Barrangou, 2010, Science, 327:167-70; Marraffini and Southerner, 2008, Science, 322:1843-1845; Bhaya et al., 2011, Annu Rev. Genet., 45:273-297; Terns and Terns, 2011, Curr. Opin. Microbiol., 14:321-327; Westra et al., 2012, Annu. Rev. Genet., 46:311-339; Barrangou R., 2013, RNA, 4:267-278). Typically, invasive DNA sequences are acquired as new spacers (Barrangou et al., 2007, Science, 315:1709-1712), where each sequence is paired with a CRISPR repeat and inserted as a new repeat-spacer unit into the CRISPR locus. Subsequently, the repeat-spacer array is transcribed as long pre-CRISPR RNA (pre-crRNA) (Brouns et al., 2008, Science, 321:960-4), which is processed to produce short CRISPR interfering RNA (crRNA) that drive recognition specific sequences. Essentially, strRNAs target nucleases to complementary targets for Cas endonuclease-mediated cleavage of a sequence-specific nucleic acid (Garneau et al., 2010, Nature, 468:67-71; Haurwitz et al., 2010, Science, 329:1355-1358; Sapranauskas et al., 2011, Nucleic Acid Res., 39:9275-9282; Jinek et al., 2012, Science, 337:816-821; Gasiunas et al., 2012, Proc. Natl. Acad. Sci., 109: E2579-E2586; Magadan et al., 2012, PLoS One, 7:e40913; Karvelis et al., 2013, RNA Biol., 10:841-851). These widespread systems are found in almost half of bacteria (~46%) and in most archaea (~90%).

В общих чертах, имеется два класса (Makarova et al., Nat. Rev. Microbiol., 13:722-736 (2015)) CRISPR-Cas систем, которые охватывают пять больших типов и 16 разных подтипов, исходя из содержания cas генов, строения cas оперона, последовательностей белков Cas и этапов процесса (Makarova et al., Biol. Direct., 6:38 (2011); Makarova and Koonin, Methods Mol. Biol., 1311:47-75 (2015); Barrangou, R., Genome Biology, 16:247 (2015)). В типах I и III специализированные эндонуклеазы Cas осуществляют процессинг pre-crРНК, которые впоследствии образуют крупный комплекс мульти-Cas белков, способный распознавать и расщеплять нуклеиновые кислоты, комплементарные crРНК. Системы типа I являются наиболее часто встречающимися и широко распространенными системами, которые нацеливаются на ДНК Cascade-управляемым и PAM-зависимым способом, разрушая целевые нуклеиновые кислоты при помощи сигнатурного белка Cas3. CRISPR-Cas система типа II имеет другой процесс. В этом случае процессинг pre-CRNA происходит по механизму, при котором транс-активирующая crРНК (tracrРНК) гибридизуется с областями повтора crРНК. Гибридизованные crРНК-tracrРНК расщепляются RNase III, и после второго события, при котором происходит удаление 5'-конца каждого спейсера, продуцируются зрелые crРНК, которые остаются связанными как с tracrРНК, так и Cas9. Затем зрелый комплекс располагается на dsДНК последовательности-мишени ('протоспейсерная' последовательность), которая является комплементарной спейсерной последовательности в этом комплексе, и разрезает обе нити. Для узнавания и расщепления этим комплексом в системе типа II требуется наличие не только комплементарной последовательности между спейсерной последовательностью комплекса crРНК-tracrРНК и 'протоспейсерной' последовательностью-мишенью, но также требуется последовательность прилегающего к протоспейсеру мотива (PAM), расположенная на 3'-конце протоспейсерной последовательности.Broadly speaking, there are two classes (Makarova et al., Nat. Rev. Microbiol., 13:722-736 (2015)) of CRISPR-Cas systems, which cover five large types and 16 different subtypes, based on the content of cas genes, cas operon structure, Cas protein sequences, and process steps (Makarova et al., Biol. Direct., 6:38 (2011); Makarova and Koonin, Methods Mol. Biol., 1311:47-75 (2015); Barrangou, R ., Genome Biology, 16:247 (2015)). In types I and III, specialized Cas endonucleases process pre-crRNAs, which subsequently form a large complex of multi-Cas proteins capable of recognizing and cleaving nucleic acids complementary to crRNAs. Type I systems are the most common and widespread systems that target DNA in a Cascade-driven and PAM-dependent manner, degrading the target nucleic acids via the signature Cas3 protein. The CRISPR-Cas type II system has a different process. In this case, pre-CRNA processing occurs by a mechanism in which trans-activating crRNA (tracrRNA) hybridizes with crRNA repeat regions. The hybridized crRNA-tracrRNAs are cleaved with RNase III, and after a second event in which the 5' end of each spacer is removed, mature crRNAs are produced that remain associated with both tracrRNA and Cas9. The mature complex is then located on a dsDNA target sequence ('protospacer' sequence) that is complementary to the spacer sequence in the complex and cuts both strands. Recognition and cleavage by this complex in a type II system not only requires the presence of a complementary sequence between the spacer sequence of the crRNA-tracrRNA complex and the 'protospacer' target sequence, but also requires a protospacer adjacent motif (PAM) sequence located at the 3' end of the protospacer sequences.

Сущность изобретенияThe essence of the invention

В одном из аспектов изобретения предоставляется способ скрининга популяции бактериальных клеток в отношении жизненно важных генов, не жизненно важных генов и/или инородных геномных островов, включающий введение в указанную популяцию бактериальных клеток конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор- 1 042506 спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме бактериальных клеток указанной популяции, таким образом создавая популяцию трансформированных бактериальных клеток;In one aspect of the invention, a method is provided for screening a bacterial cell population for vital genes, non-essential genes, and/or foreign genomic islands, comprising introducing into said bacterial cell population a heterologous nucleic acid construct comprising a CRISPR array containing (in 5'- 3' direction) a repeat-spacer sequence or at least one repeat-spacer sequence, wherein the spacer of said repeat-spacer-repeat sequence or of said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary target regions in the bacterial cell genome of said population, thereby creating a population of transformed bacterial cells;

определение наличия или отсутствия делеции в популяции трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток, причем наличие делеции в популяции трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток означает, что область-мишень содержится в нежизненно важном гене и/или инородном геномном острове, а отсутствие делеции в популяции трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток означает, что область-мишень содержится в жизненно важном гене.determining the presence or absence of a deletion in a population of transformed bacterial, archaeal, algal or yeast cells, wherein the presence of a deletion in a population of transformed bacterial, archaeal, algal or yeast cells means that the target region is contained in a non-vital gene and/or a foreign genomic island, and the absence of a deletion in a population of transformed bacterial, archaeal, algal, or yeast cells indicates that the target region is contained in a vital gene.

Массив CRISPR, используемый в этом изобретении, может быть массивом CRISPR типа I, типа II, типа III, типа IV или типа V.The CRISPR array used in this invention may be a Type I, Type II, Type III, Type IV, or Type V CRISPR array.

Во втором аспекте изобретения предоставляется способ скрининга популяции бактериальных, архейных, водорослевых или дрожжевых клеток в отношении жизненно важных генов, нежизненно важных генов и/или инородных геномных островов, включающий введение в популяцию бактериальных, архейных, водорослевых или дрожжевых клеток (a) конструкции гетерологичной нуклеиновой кислоты, содержащей транс-кодируемую CRISPR (tracr) нуклеиновую кислоту, (b) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме (хромосомном и/или плазмидном) бактериальных, архейных, водорослевых или дрожжевых клеток указанной популяции, и (c) Cas9 полипептида или конструкции гетерологичной нуклеиновой кислоты, содержащей полинуклеотид, кодирующий Cas9 полипептид, таким образом создавая популяцию трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток; и определение наличия или отсутствия делеции в популяции трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток, причем наличие делеции в популяции бактериальных, архейных, водорослевых или дрожжевых клеток означает, что область-мишень содержится в нежизненно важном гене и/или инородном геномном острове, а отсутствие делеции в популяции бактериальных, архейных, водорослевых или дрожжевых клеток означает, что область-мишень содержится в жизненно важном гене.In a second aspect of the invention, a method is provided for screening a population of bacterial, archaeal, algal, or yeast cells for vital genes, non-essential genes, and/or foreign genomic islands, comprising introducing into the population of bacterial, archaeal, algal, or yeast cells (a) a heterologous nucleic acid construct acid containing a trans-encoded CRISPR (tracr) nucleic acid, (b) a heterologous nucleic acid construct containing a CRISPR array containing (in the 5'-3' direction) a repeat-spacer-repeat sequence or at least one repeat-spacer sequence wherein the spacer of said repeat-spacer-repeat sequence or of said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome (chromosomal and/or plasmid) of the bacterial, archaeal, algal or yeast cells of said populations, and (c ) a Cas9 polypeptide or a heterologous nucleic acid construct containing a polynucleotide encoding a Cas9 polypeptide, thereby creating a population of transformed bacterial, archaeal, algal or yeast cells; and determining the presence or absence of a deletion in a population of transformed bacterial, archaeal, algal, or yeast cells, wherein the presence of a deletion in a population of bacterial, archaeal, algal, or yeast cells means that the target region is contained in a non-essential gene and/or a foreign genomic island, and the absence of a deletion in a population of bacterial, archaeal, algal, or yeast cells means that the target region is contained in a vital gene.

В третьем аспекте изобретения предоставляется способ уничтожения одной или более бактериальных клеток в популяции бактериальных клеток, включающий введение в указанную популяцию бактериальных клеток конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR (сгРНК, сгДНК), содержащий (в 5' к 3' направлении) последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повторспейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме бактериальных клеток указанной популяции, таким образом уничтожая в популяции бактериальных клеток одну или более бактериальных клеток, которые содержат область-мишень. Массив CRISPR, используемый в этом изобретении, может быть массивом CRISPR типа I, типа II, типа III, типа IV или типа V.In a third aspect of the invention, a method is provided for killing one or more bacterial cells in a population of bacterial cells, comprising introducing into said population of bacterial cells a heterologous nucleic acid construct containing a CRISPR (sgRNA, ssDNA) array containing (in the 5' to 3' direction) a repeat sequence a spacer-repeat or at least one repeat-spacer sequence, wherein the spacer of said repeat-spacer-repeat sequence or of said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome of the bacterial cells of said population, thereby destroying one or more bacterial cells in the population of bacterial cells that contain the target region. The CRISPR array used in this invention may be a Type I, Type II, Type III, Type IV, or Type V CRISPR array.

В четвертом аспекте изобретения предоставляется способ уничтожения одной или более клеток в популяции бактериальных, ахейных, водорослевых или дрожжевых клеток, включающий введение в популяцию бактериальных, ахейных, водорослевых или дрожжевых клеток (а) конструкции гетерологичной нуклеиновой кислоты, содержащей транс-кодируемую CRISPR (tracr) нуклеиновую кислоту, (b) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме (хромосомном и/или плазмидном) бактериальных, ахейных, водорослевых или дрожжевых клеток указанной популяции, и (с) Cas9 полипептида и/или конструкции гетерологичной нуклеиновой кислоты, содержащей полинуклеотид, кодирующий Cas9 полипептид, таким образом уничтожая одну или более клеток, которые содержат область-мишень в своем геноме, в популяции бактериальных, ахейных, водорослевых или дрожжевых клеток.In a fourth aspect of the invention, there is provided a method for killing one or more cells in a population of bacterial, achaean, algal, or yeast cells, comprising introducing into the population of bacterial, achaean, algal, or yeast cells (a) a heterologous nucleic acid construct comprising a trans-encoded CRISPR (tracr) nucleic acid, (b) a heterologous nucleic acid construct comprising a CRISPR array containing (in the 5'-3' direction) a repeat-spacer-repeat sequence or at least one repeat-spacer sequence in which the spacer of said repeat-spacer sequence is a repeat or said at least one repeat-spacer sequence contains a nucleotide sequence that is essentially complementary to a target region in the genome (chromosomal and/or plasmid) of bacterial, achaean, algal or yeast cells of the indicated population, and (c) a Cas9 polypeptide and/ or heterologous nucleic acid constructs lots containing a polynucleotide encoding a Cas9 polypeptide, thereby destroying one or more cells that contain the target region in their genome in a population of bacterial, achaean, algal or yeast cells.

В пятом аспекте изобретения предоставляется способ идентификации фенотипа, связанного с бактериальным геном, включающий введение в популяцию бактериальных клеток конструкции гетерологичной нуклеиновой кислоты,In a fifth aspect of the invention, there is provided a method for identifying a phenotype associated with a bacterial gene, comprising introducing into a population of bacterial cells a heterologous nucleic acid construct,

- 2 042506 содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор-спейсерповтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной по меньшей мере одной последовательности повтор-спейсер и последовательности повтор-спейсер-повтор содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме бактериальных клеток указанной популяции, причем эта область-мишень содержит по меньшей мере часть открытой рамки считывания, кодирующей полипептид, или функциональную нуклеиновую кислоту, таким образом уничтожая клетки, содержащие эту область-мишень, и создавая популяцию трансформированных бактериальных клеток, не содержащих область-мишень; и анализ фенотипа популяции.- 2 042506 containing a CRISPR array containing (in the 5'-3' direction) a repeat-spacer-repeat sequence or at least one repeat-spacer sequence, in which the spacer of the specified at least one repeat-spacer sequence and repeat-spacer-repeat sequences contains a nucleotide sequence that is essentially complementary to a target region in the genome of the bacterial cells of the specified population, and this target region contains at least part of the open reading frame encoding the polypeptide, or functional nucleic acid, thereby destroying cells containing this target region , and creating a population of transformed bacterial cells that do not contain the target region; and analysis of the phenotype of the population.

Массив CRISPR, используемый в этом изобретении, может быть массивом CRISPR типа I, типа II, типа III, типа IV или типа V.The CRISPR array used in this invention may be a Type I, Type II, Type III, Type IV, or Type V CRISPR array.

В шестом аспекте изобретения предоставляется способ идентификации фенотипа, связанного с бактериальным, ахейным, водорослевым или дрожжевым геном, включающий введение в популяцию бактериальных, ахейных, водорослевых или дрожжевых клеток (а) конструкции гетерологичной нуклеиновой кислоты, содержащей транс-кодируемую CRISPR (tracr) нуклеиновую кислоту, (b) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме (хромосомном и/или плазмидном) бактериальных, ахейных, водорослевых или дрожжевых клеток указанной популяции, и (с) Cas9 полипептида или конструкции гетерологичной нуклеиновой кислоты, содержащей полинуклеотид, кодирующий Cas9 полипептид, таким образом уничтожая бактериальные, ахейные, водорослевые или дрожжевые клетки, содержащие область-мишень, и создавая популяцию трансформированных бактериальных, ахейных, водорослевых или дрожжевых клеток, не содержащих область-мишень; и анализ фенотипа популяции трансформированных бактериальных, ахейных, водорослевых или дрожжевых клеток, и/или (i) выращивание отдельных бактериальных, ахейных, водорослевых или дрожжевых колоний из популяции трансформированных бактериальных, ахейных, водорослевых или дрожжевых клеток, и (ii) анализ фенотипа отдельных колоний.In a sixth aspect of the invention, there is provided a method for identifying a phenotype associated with a bacterial, achaean, algal, or yeast gene, comprising introducing into a population of bacterial, achaean, algal, or yeast cells (a) a heterologous nucleic acid construct comprising a trans-encoded CRISPR (tracr) nucleic acid , (b) a heterologous nucleic acid construct comprising a CRISPR array containing (in the 5'-3' direction) a repeat-spacer-repeat sequence, or at least one repeat-spacer sequence, wherein the spacer of said repeat-spacer-repeat sequence or of said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome (chromosomal and/or plasmid) of bacterial, achaean, algal or yeast cells of said population, and (c) a Cas9 polypeptide or heterologous nucleic acid construct acid containing a polynucleotide encoding a Cas9 polypeptide, thereby killing bacterial, achaean, algal, or yeast cells containing the target region and creating a population of transformed bacterial, achaean, algal, or yeast cells lacking the target region; and analysis of the phenotype of a population of transformed bacterial, achaean, algal or yeast cells, and/or (i) growing individual bacterial, achaean, algal or yeast colonies from a population of transformed bacterial, achaean, algal or yeast cells, and (ii) analysis of the phenotype of individual colonies .

В седьмом аспекте изобретения предоставляется способ отбора одной или более бактериальных клеток, имеющих уменьшенный размер генома, из популяции бактериальных клеток, включающий введение в популяцию бактериальных клеток конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме одной или более клеток бактерий в указанной популяции, причем клетки, содержащие областьмишень, уничтожаются, таким образом осуществляя отбор одной или более бактериальных клеток, не содержащих эту область-мишень и имеющих уменьшенный размер генома, из популяции бактериальных клеток. Массив CRISPR, используемый в этом изобретении, может быть массивом CRISPR типа I, типа II, типа III, типа IV или типа V.In a seventh aspect of the invention, a method is provided for selecting one or more bacterial cells having a reduced genome size from a population of bacterial cells, comprising introducing into the population of bacterial cells a heterologous nucleic acid construct comprising a CRISPR array containing (in the 5'-3' direction) a repeat sequence a spacer-repeat or at least one repeat-spacer sequence, wherein the spacer of said repeat-spacer-repeat sequence or of said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome of one or more bacterial cells in said population, wherein cells containing the target region are killed, thereby selecting one or more bacterial cells lacking the target region and having a reduced genome size from the population of bacterial cells. The CRISPR array used in this invention may be a Type I, Type II, Type III, Type IV, or Type V CRISPR array.

В восьмом аспекте изобретения предоставляется способ отбора одной или более бактериальных клеток, имеющих уменьшенный размер генома, из популяции бактериальных клеток, включающий введение в популяцию бактериальных клеток (a) (i) одной или более конструкции гетерологичной нуклеиновой кислоты, содержащей нуклеотидную последовательность, имеющую по меньшей мере 80% идентичности по меньшей мере 300 последовательным нуклеотидам, присутствующим в геноме указанных бактериальных клеток, или (ii) двух или более конструкций гетерологичной нуклеиновой кислоты, содержащих по меньшей мере один транспозон, таким образом создавая популяцию трансгенных клеток бактерий, содержащих неприродный сайт для гомологичной рекомбинации между одной или более конструкциями гетерологичной нуклеиновой кислоты, интегрированными в геном, и по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме, или между первым и вторым транспозонами, интегрированными в геном; и (b) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме одной или более бактериальных клеток в указанной популяции, причем эта область-мишень расположена между одной или более конструкциями гетерологичной нуклеиновой кислоты, введенными в геном, и по меньшей мереIn an eighth aspect of the invention, there is provided a method for selecting one or more bacterial cells having a reduced genome size from a population of bacterial cells, comprising introducing into the population of bacterial cells (a) (i) one or more heterologous nucleic acid constructs comprising a nucleotide sequence having at least at least 80% identity to at least 300 consecutive nucleotides present in the genome of said bacterial cells, or (ii) two or more heterologous nucleic acid constructs containing at least one transposon, thereby creating a population of transgenic bacterial cells containing a non-natural site for a homologous recombination between one or more heterologous nucleic acid constructs integrated into the genome and at least 300 consecutive nucleotides present in the genome, or between the first and second transposons integrated into the genome; and (b) a heterologous nucleic acid construct comprising a CRISPR array comprising (in the 5'-3' direction) a repeat-spacer-repeat sequence, or at least one repeat-spacer sequence, wherein the spacer of said repeat-spacer-repeat sequence or said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome of one or more bacterial cells in said population, this target region being located between one or more heterologous nucleic acid constructs introduced into the genome, and at least

- 3 042506- 3 042506

300 последовательными нуклеотидами, присутствующими в геноме, и/или между первым транспозоном и вторым транспозоном, и клетки, содержащие область-мишень уничтожаются, таким образом осуществляя отбор одной или более бактериальных клеток, не содержащих область-мишень и имеющих уменьшенный размер генома, из популяции трансгенных бактериальных клеток.300 consecutive nucleotides present in the genome and/or between the first transposon and the second transposon, and cells containing the target region are eliminated, thus selecting one or more bacterial cells lacking the target region and having a reduced genome size from the population transgenic bacterial cells.

Массив CRISPR, используемый в этом изобретении, может быть массивом CRISPR типа I, типа II, типа III, типа IV или типа V.The CRISPR array used in this invention may be a Type I, Type II, Type III, Type IV, or Type V CRISPR array.

В девятом аспекте изобретения предоставляется способ отбора одной или более бактериальных, архейных, водорослевых или дрожжевых клеток, имеющих уменьшенный размер генома, из популяции бактериальных, архейных, водорослевых или дрожжевых клеток, включающий введение в популяцию бактериальных, архейных, водорослевых или дрожжевых клеток (а) конструкции гетерологичной нуклеиновой кислоты, содержащей транс-кодируемую CRISPR (tracr) нуклеиновую кислоту, (b) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повторспейсер, в которой спейсер указанной по меньшей мере одной последовательности и по меньшей мере последовательности повтор-спейсер-повтор содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме (хромосомном и/или плазмидном) бактериальных, архейных, водорослевых или дрожжевых клеток указанной популяции, и (с) Cas9 полипептида, причем клетки, содержащие эту область-мишень уничтожаются, таким образом осуществляя отбор одной или более бактериальных, архейных, водорослевых или дрожжевых клеток, не содержащих область-мишень и имеющих уменьшенный размер генома, из популяции бактериальных, архейных, водорослевых или дрожжевых клеток.In a ninth aspect of the invention, a method is provided for selecting one or more bacterial, archaeal, algal, or yeast cells having a reduced genome size from a population of bacterial, archaeal, algal, or yeast cells, comprising introducing into the population of bacterial, archaeal, algal, or yeast cells (a) a heterologous nucleic acid construct comprising a trans-encoded CRISPR (tracr) nucleic acid, (b) a heterologous nucleic acid construct comprising a CRISPR array containing a repeat-spacer-repeat sequence or at least one repeat-spacer sequence, wherein the spacer is at least one sequence and at least a repeat-spacer-repeat sequence contains a nucleotide sequence that is essentially complementary to a target region in the genome (chromosomal and/or plasmid) of bacterial, archaeal, algal or yeast cells of the indicated population, and (c) a Cas9 polypeptide yes, and the cells containing this target region are destroyed, thus selecting one or more bacterial, archaeal, algal or yeast cells that do not contain the target region and have a reduced genome size from a population of bacterial, archaeal, algal or yeast cells.

В десятом аспекте изобретения предоставляется способ отбора одной или более бактериальных, архейных, водорослевых или дрожжевых клеток, имеющих уменьшенный размер генома, из популяции бактериальных, архейных, водорослевых или дрожжевых клеток, включающий введение в популяцию бактериальных, архейных, водорослевых или дрожжевых клеток (a) (i) одной или более конструкции гетерологичной нуклеиновой кислоты, содержащей нуклеотидную последовательность, имеющую по меньшей мере 80% идентичности по меньшей мере 300 последовательным нуклеотидам, присутствующим в геноме указанных бактериальных, архейных, водорослевых или дрожжевых клеток, или (ii) двух или более конструкций гетерологичной нуклеиновой кислоты, содержащих по меньшей мере один транспозон, таким образом создавая популяцию трансгенных бактериальных, архейных, водорослевых или дрожжевых клеток, содержащих неприродный сайт для гомологичной рекомбинации между одной или более конструкциями гетерологичной нуклеиновой кислоты, интегрированными в геном, и по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме, или между первым и вторым транспозонами, интегрированными в геном; и (b) (i) конструкции гетерологичной нуклеиновой кислоты, содержащей транс-кодируемую CRISPR (tracr) нуклеиновую кислоту, (ii) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повторспейсер, в которой спейсер указанной по меньшей мере одной последовательности повтор-спейсер и по меньшей мере одной последовательности повтор-спейсер-повтор содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме (хромосомном и/или плазмидном) одной или более бактериальных, архейных, водорослевых или дрожжевых клеток указанной популяции, и (iii) Cas9 полипептида и/или конструкции гетерологичной нуклеиновой кислоты, содержащей полинуклеотид, кодирующий Cas9 полипептид, причем эта область-мишень расположена между одной или более конструкциями гетерологичной нуклеиновой кислоты, введенными в геном, и по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме, и/или между первым транспозоном и вторым транспозоном, и клетки, содержащие область-мишень уничтожаются, таким образом осуществляя отбор одной или более бактериальных, архейных, водорослевых или дрожжевых клеток, не содержащих область-мишень и имеющих уменьшенный размер генома, из популяции трансгенных бактериальных, архейных, водорослевых или дрожжевых клеток.In a tenth aspect of the invention, a method is provided for selecting one or more bacterial, archaeal, algal, or yeast cells having a reduced genome size from a population of bacterial, archaeal, algal, or yeast cells, comprising introducing into the population of bacterial, archaeal, algal, or yeast cells (a) (i) one or more heterologous nucleic acid constructs containing a nucleotide sequence having at least 80% identity to at least 300 consecutive nucleotides present in the genome of said bacterial, archaeal, algal, or yeast cells, or (ii) two or more constructs heterologous nucleic acid containing at least one transposon, thereby creating a population of transgenic bacterial, archaeal, algal, or yeast cells containing a non-natural site for homologous recombination between one or more heterologous nucleic acid constructs integrated genome-integrated and at least 300 consecutive nucleotides present in the genome or between the first and second transposons integrated into the genome; and (b) (i) a heterologous nucleic acid construct comprising a trans-encoded CRISPR (tracr) nucleic acid, (ii) a heterologous nucleic acid construct comprising a CRISPR array containing a repeat-spacer-repeat sequence or at least one repeat-spacer sequence, wherein the spacer of said at least one repeat-spacer sequence and at least one repeat-spacer-repeat sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome (chromosomal and/or plasmid) of one or more bacterial, archaeal, algal or yeast cells of said population, and (iii) a Cas9 polypeptide and/or a heterologous nucleic acid construct comprising a polynucleotide encoding a Cas9 polypeptide, wherein the target region is located between one or more heterologous nucleic acid constructs introduced into the genome and at least at least 300 consecutive nucleotides dams present in the genome and/or between the first transposon and the second transposon, and cells containing the target region are destroyed, thus selecting one or more bacterial, archaeal, algal or yeast cells that do not contain the target region and have a reduced size genome, from a population of transgenic bacterial, archaeal, algal or yeast cells.

В одиннадцатом аспекте изобретения предоставляется способ идентификации в популяции бактерий по меньшей мере одного изолята, имеющего делецию в своем геноме, включающий введение в популяцию бактериальных клеток конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор-спейсерповтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме одной или более бактериальных клеток указанной популяции, причем клетки, содержащие область-мишень уничтожаются, таким образом создавая популяцию трансформированныхIn the eleventh aspect of the invention, a method is provided for identifying at least one isolate in a population of bacteria having a deletion in its genome, comprising introducing into the population of bacterial cells a heterologous nucleic acid construct containing a CRISPR array containing (in the 5'-3' direction) a repeat sequence a spacer repeat or at least one repeat-spacer sequence, wherein the spacer of said repeat-spacer-repeat sequence or of said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome of one or more bacterial cells of said populations, and the cells containing the target region are destroyed, thus creating a population of transformed

- 4 042506 бактериальных клеток, не содержащих область-мишень; и выращивание отдельных бактериальных колоний из популяции трансформированных бактериальных клеток, таким образом осуществляя идентификацию по меньшей мере одного изолята из популяции трансформированных бактерий имеющих делецию в своем геноме.- 4 042506 bacterial cells that do not contain the target area; and growing individual bacterial colonies from the population of transformed bacterial cells, thereby identifying at least one isolate from the population of transformed bacteria having a deletion in its genome.

Массив CRISPR, используемый в этом изобретении, может быть массивом CRISPR типа I, типа II, типа III, типа IV или типа V.The CRISPR array used in this invention may be a Type I, Type II, Type III, Type IV, or Type V CRISPR array.

В двенадцатом аспекте изобретения предоставляется способ идентификации в популяции бактерий по меньшей мере одного изолята, имеющего делецию в своем геноме, включающий введение в популяцию бактериальных клеток (a) (i) одной или более конструкции гетерологичной нуклеиновой кислоты, содержащей нуклеотидную последовательность, имеющую по меньшей мере 80% идентичности по меньшей мере 300 последовательным нуклеотидам, присутствующим в геноме указанных бактериальных клеток, или (ii) двух или более конструкций гетерологичной нуклеиновой кислоты, содержащих по меньшей мере один транспозон, таким образом создавая популяцию трансгенных бактериальных клеток, содержащих неприродный сайт для гомологичной рекомбинации между одной или более конструкциями гетерологичной нуклеиновой кислоты, интегрированными в геном, и по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме, или между первым и вторым транспозонами, интегрированными в геном; и (b) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме одной или более бактериальных клеток в указанной популяции, причем эта область-мишень расположена между одной или более конструкциями гетерологичной нуклеиновой кислоты, введенными в геном, и по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме, и/или между первым транспозоном и вторым транспозоном, и клетки, содержащие область-мишень уничтожаются, таким образом создавая популяцию трансформированных бактериальных клеток, не содержащих область-мишень; и выращивание отдельных бактериальных колоний из популяции трансформированных бактериальных клеток, таким образом осуществляя идентификацию по меньшей мере одного изолята из популяции бактерий, имеющих делецию в своем геноме.In a twelfth aspect of the invention, a method is provided for identifying in a bacterial population at least one isolate having a deletion in its genome, comprising introducing into the bacterial cell population (a) (i) one or more heterologous nucleic acid constructs containing a nucleotide sequence having at least 80% identity to at least 300 consecutive nucleotides present in the genome of said bacterial cells, or (ii) two or more heterologous nucleic acid constructs containing at least one transposon, thereby creating a population of transgenic bacterial cells containing a non-natural site for homologous recombination between one or more heterologous nucleic acid constructs integrated into the genome and at least 300 consecutive nucleotides present in the genome, or between the first and second transposons integrated into the genome; and (b) a heterologous nucleic acid construct comprising a CRISPR array comprising (in the 5'-3' direction) a repeat-spacer-repeat sequence, or at least one repeat-spacer sequence, wherein the spacer of said repeat-spacer-repeat sequence or said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome of one or more bacterial cells in said population, this target region being located between one or more heterologous nucleic acid constructs introduced into the genome, and at least 300 consecutive nucleotides present in the genome and/or between the first transposon and the second transposon, and cells containing the target region are destroyed, thereby creating a population of transformed bacterial cells not containing the target region; and growing individual bacterial colonies from the population of transformed bacterial cells, thereby identifying at least one isolate from the population of bacteria having a deletion in its genome.

Массив CRISPR, используемый в этом изобретении, может быть массивом CRISPR типа I, типа II, типа III, типа IV или типа V.The CRISPR array used in this invention may be a Type I, Type II, Type III, Type IV, or Type V CRISPR array.

В тринадцатом аспекте изобретения предоставляется способ идентификации в популяции бактериальных, архейных, водорослевых или дрожжевых клеток по меньшей мере одного изолята, имеющего делецию в своем геноме, включающий введение в популяцию бактериальных, архейных, водорослевых или дрожжевых клеток (а) конструкции гетерологичной нуклеиновой кислоты, содержащей транс-кодируемую CRISPR (tracr) нуклеиновую кислоту, (b) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме (хромосомном и/или плазмидном) бактериальных, архейных, водорослевых или дрожжевых клеток указанной популяции, и (с) Cas9 полипептида или конструкции гетерологичной нуклеиновой кислоты, содержащей полинуклеотид, кодирующий Cas9 полипептид, причем клетки, содержащие область-мишень, уничтожаются, таким образом создавая популяцию трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток, не содержащих область-мишень; и выращивание отдельных бактериальных, архейных, водорослевых или дрожжевых колоний из популяции трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток, таким образом осуществляя идентификацию по меньшей мере одного изолята из популяции трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток, имеющих делецию в своем геноме.In the thirteenth aspect of the invention, a method is provided for identifying in a population of bacterial, archaeal, algal or yeast cells at least one isolate having a deletion in its genome, comprising introducing into the population of bacterial, archaeal, algal or yeast cells (a) a heterologous nucleic acid construct containing a trans-encoded CRISPR (tracr) nucleic acid, (b) a heterologous nucleic acid construct comprising a CRISPR array containing (in the 5'-3' direction) a repeat-spacer-repeat sequence or at least one repeat-spacer sequence, in which the spacer of said repeat-spacer-repeat sequence or of said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome (chromosomal and/or plasmid) of bacterial, archaeal, algal or yeast cells of said population, and (c) Cas9 polypeptide or a heterologous nucleic acid construct comprising a polynucleotide encoding a Cas9 polypeptide, wherein cells containing the target region are killed, thereby creating a population of transformed bacterial, archaeal, algal, or yeast cells lacking the target region; and growing single bacterial, archaeal, algal, or yeast colonies from the population of transformed bacterial, archaeal, algal, or yeast cells, thereby identifying at least one isolate from the population of transformed bacterial, archaeal, algal, or yeast cells having a deletion in its genome.

В четырнадцатом аспекте изобретения предоставляется способ определения в популяции бактериальных, архейных, водорослевых или дрожжевых клеток по меньшей мере одного изолята, имеющего делецию в своем геноме, включающий введение в популяцию бактериальных, архейных, водорослевых или дрожжевых клеток (a) (i) одной или более конструкции гетерологичной нуклеиновой кислоты, содержащей нуклеотидную последовательность, имеющую по меньшей мере 80% идентичности по меньшей мере 300 последовательным нуклеотидам, присутствующим в геноме указанных бактериальных, архейных, водорослевых или дрожжевых клеток, или (ii) двух или более конструкций гетерологичной нуклеиновой кислоты, содержащих по меньшейIn a fourteenth aspect of the invention, a method is provided for determining in a population of bacterial, archaeal, algal or yeast cells at least one isolate having a deletion in its genome, comprising introducing into the population of bacterial, archaeal, algal or yeast cells (a) (i) one or more a heterologous nucleic acid construct comprising a nucleotide sequence having at least 80% identity to at least 300 consecutive nucleotides present in the genome of said bacterial, archaeal, algal or yeast cells, or (ii) two or more heterologous nucleic acid constructs containing lesser

- 5 042506 мере один транспозон, таким образом создавая популяцию трансгенных бактериальных, архейных, водорослевых или дрожжевых клеток, содержащих неприродный сайт для гомологичной рекомбинации между одной или более конструкциями гетерологичной нуклеиновой кислоты, интегрированными в геном, и по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме, или между первым и вторым транспозонами, интегрированными в геном; и (b) (i) конструкции гетерологичной нуклеиновой кислоты, содержащей транс-кодируемую CRISPR (tracr) нуклеиновую кислоту, (ii) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в направлении от 5'- к 3'-конца) последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повтор-спейсерповтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме (хромосомном и/или плазмидном) одной или более бактериальных, архейных, водорослевых или дрожжевых клеток указанной популяции, и (iii) Cas9 полипептида и/или конструкции гетерологичной нуклеиновой кислоты, содержащей полинуклеотид, кодирующий Cas9 полипептид, причем эта область-мишень расположена между одной или более конструкциями гетерологичной нуклеиновой кислоты, введенными в геном, и по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме, и/или между первым транспозоном и вторым транспозоном, и клетки, содержащие область-мишень уничтожаются, таким образом создавая популяцию трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток, не содержащих область-мишень; и выращивание отдельных бактериальных, архейных, водорослевых или дрожжевых колоний из популяции трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток, таким образом осуществляя идентификацию по меньшей мере одного изолята из популяции, имеющей делецию в своем геноме.- 5 042506 at least one transposon, thus creating a population of transgenic bacterial, archaeal, algal or yeast cells containing a non-natural site for homologous recombination between one or more heterologous nucleic acid constructs integrated into the genome and at least 300 consecutive nucleotides present in genome, or between the first and second transposons integrated into the genome; and (b) (i) a heterologous nucleic acid construct comprising a trans-encoded CRISPR (tracr) nucleic acid, (ii) a heterologous nucleic acid construct comprising a CRISPR array containing (5' to 3' direction) the sequence repeat-spacer-repeat or at least one repeat-spacer sequence, wherein the spacer of said repeat-spacer-repeat sequence or of said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome (chromosomal and/or or plasmid) of one or more bacterial, archaeal, algal or yeast cells of the indicated population, and (iii) a Cas9 polypeptide and/or a heterologous nucleic acid construct containing a polynucleotide encoding a Cas9 polypeptide, this target region being located between one or more constructs of the heterologous nucleic acids introduced into the genome, and at least 300 consecutive nucleotides present in the genome and/or between the first transposon and the second transposon, and cells containing the target region are destroyed, thus creating a population of transformed bacterial, archaeal, algal or yeast cells that do not contain the target region; and growing individual bacterial, archaeal, algal, or yeast colonies from the population of transformed bacterial, archaeal, algal, or yeast cells, thereby identifying at least one isolate from the population having the deletion in its genome.

Настоящее изобретение также относится к экспрессионным кассетам, клеткам и наборам, содержащим конструкции нуклеиновой кислоты, массивы нуклеиновых кислот, молекулы нуклеиновых кислот и/или нуклеотидные последовательности по изобретению.The present invention also relates to expression cassettes, cells and kits containing nucleic acid constructs, nucleic acid arrays, nucleic acid molecules and/or nucleotide sequences of the invention.

Эти и другие аспекты изобретения изложены ниже в описании изобретения более подробно.These and other aspects of the invention are set forth in more detail below in the description of the invention.

Краткое описание фигурBrief description of the figures

На фиг. 1 показана последовательность массивов SthCRISPR1 и SthCRISPR3 для таргетирования (нацеливания) каждого композитного транспозона.In FIG. 1 shows the sequence of SthCRISPR1 and SthCRISPR3 arrays for targeting (targeting) each composite transposon.

На фиг. 2 показана схематическая диаграмма способа сплайсинга с перекрывающимся удлинением (SOE) для конструкции таргетирования плазмид.In FIG. 2 shows a schematic diagram of the overlapping extension (SOE) splicing method for a plasmid targeting construct.

На фиг. 3 показана карта жизненно важных генов, инсерционных последовательностей и геномных островов. (А) Местоположение и распределение предполагаемых ОРС (ORF) жизненно важных генов [жизненно важных ОРС] (верхний ряд), инсерционных последовательностей (2-й ряд) и предполагаемых геномных островов (3-й ряд). Потенциальные мишени для опосредованных CRISPR-Cas (4-й ряд) делеций определяли путем картирования мобильных элементов различных семейств в геноме Streptococcus thermophilus LMD-9. Генетическая структура предполагаемых геномных островов и соответствующих им комбинаций протоспейсер/PAM. (В) Геномный остров 1, кодирующий систему для транспорта олигопептидов. (С) Геномный остров 2, содержащий протеиназу PrtS клеточной оболочки. (D) Геномный остров 3, кодирующий белок АТФазной помпы ионов меди. (Е) Геномный остров, кодирующий выбранные ОРС, включающие Lac оперон.In FIG. 3 shows a map of vital genes, insertion sequences and genomic islands. (A) Location and distribution of putative ORFs (ORFs) of vital genes [vital ORFs] (top row), insertion sequences (2nd row) and putative genomic islands (3rd row). Potential targets for CRISPR-Cas (4th row) mediated deletions were identified by mapping transposable elements of different families in the genome of Streptococcus thermophilus LMD-9. Genetic structure of putative genomic islands and their corresponding protospacer/PAM combinations. (B) Genomic island 1 encoding a system for the transport of oligopeptides. (C) Genomic island 2 containing the cell wall proteinase PrtS. (D) Genomic island 3 encoding the copper ion ATPase pump protein. (E) Genomic island encoding selected ORFs including the Lac operon.

На фиг. 4 представлена дендрограмма кодирующих последовательностей транспозонов, распределенных в геноме S. thermophilus LMD-9. Выравнивание производилось при помощи компьютерной программы Geneious®. Окончательные обозначения присваивали, используя www-is.biotoul.fr. Буквы соответствуют выравниванию последовательностей, приведенному на фиг. 5 для каждого семейства.In FIG. 4 shows a dendrogram of the coding sequences of transposons distributed in the genome of S. thermophilus LMD-9. Alignment was performed using the Geneious® computer program. The final designations were assigned using www-is.biotoul.fr. The letters correspond to the sequence alignment shown in FIG. 5 for each family.

На фиг. 5A-5D показано выравнивание последовательностей транспозов (при помощи компьютерной программы Geneious®) для каждого крупного семейства IS, найденного в геноме S. thermophilus LMD-9. Разные семейства имеют разную степень сохранения длины и идентичности нуклеотида. (А) Транспозоны Sth6 были в высокой степени полиморфными и очевидно вырожденными вследствие внутренних делеций в некоторых копиях. IS1167 (В) и IS1191 (С), напротив, имели несколько копий, но сохраняли высокую степень соответствия по длине и идентичности. S1193 (D) имели высокоточные копии, но при этом демонстрировали самое высокое различие внутри семейства по длине.In FIG. 5A-5D show transpose sequence alignments (using the Geneious® software program) for each major IS family found in the S. thermophilus LMD-9 genome. Different families have different degrees of conservation of length and nucleotide identity. (A) Sth6 transposons were highly polymorphic and apparently degenerate due to internal deletions in some copies. IS1167 (B) and IS1191 (C), on the contrary, had several copies, but retained a high degree of match in length and identity. S1193(D) had high-fidelity replicas, but showed the highest intra-family variation in length.

На фиг. 6А-6С показана структурная основа нацеливания системы на ДНК при помощи CRISPRCas9 и явная цитотоксичность этого процесса. Спейсерные последовательности у SthCRISPR1 (А) и SthCRISPR3 (В) для таргетирования lacZ. Cas9 опознает ДНК и обратимо связывается с последовательностями PAM, при этом происходит стабилизация Cas9 на мишени за счет образования дуплекса tracrРНК::crРНК. Активация Cas9 вызывает одновременное расщепления каждой нити по доменам RuvC и HNH, указанные черными стрелками. Трансформанты, выделенные после электропорации контроль- 6 042506 ных и самонацеленных плазмид (С). Средние размеры клонов ±SD, скринированных в независимых экспериментах по трансформации (n=4), для каждой из тестовых плазмид.In FIG. 6A-6C show the structural basis of CRISPRCas9 DNA targeting system and the apparent cytotoxicity of this process. Spacer sequences in SthCRISPR1 (A) and SthCRISPR3 (B) for lacZ targeting. Cas9 recognizes DNA and reversibly binds to PAM sequences, and Cas9 is stabilized on the target due to the formation of the tracrRNA::crRNA duplex. Activation of Cas9 causes simultaneous cleavage of each strand into RuvC and HNH domains, indicated by black arrows. Transformants isolated after electroporation of control and self-targeted plasmids (C). Average clone sizes ±SD screened in independent transformation experiments (n=4) for each of the test plasmids.

На фиг. 7 показаны секвенирование генома и фенотипический анализ Lac-клонов. Данные, полученные для последовательностей, выявили отсутствие хромосомного сегмента, кодирующего lacZ, у двух мутантов, полученных независимо путем нацеливания последовательностей lacZ, кодирующих (А) 5'-конец и (B) катион-связывающий фрагмент, при помощи CRISPR3 системы. Размер делеций находился в пределах от 101865 до 102146 пар оснований, что составляет примерно 5,5% генома S. thermophilus. (C) Рост штаммов с крупными делециями по сравнению с диким типом в полусинтетической среде Элликера, представлен в виде среднего значения ±SD OD 600 нм для трех независимых биологических повторов. (D) Способность штаммов S. thermophilus к сквашиванию обезжиренного молока.In FIG. 7 shows genome sequencing and phenotypic analysis of Lac clones. Sequence data revealed the absence of a chromosomal segment encoding lacZ in two mutants generated independently by targeting lacZ sequences encoding the (A) 5' end and (B) cation-binding fragment using the CRISPR3 system. The size of the deletions ranged from 101865 to 102146 base pairs, which is approximately 5.5% of the S. thermophilus genome. (C) Growth of large deletion strains compared to wild type in Elliker's semi-synthetic medium, presented as mean ± SD OD 600 nm for three independent biological repeats. (D) The ability of S. thermophilus strains to ferment skimmed milk.

На фиг. 8 показаны события рекомбинации между инсерционными последовательностями (IS). (А) Изображение геля с результатами электрофореза ампликонов с крупными делециями, полученных ПЦР анализом gДHK, выделенной из трансформантов. Скрининг проводили, используя праймеры, фланкирующие IS1193 элементы, расположенные выше и ниже предполагаемого сайта делеций. Линии, отмеченные знаком Δ, амплифицировали из gДНК Lac-клонов, полученных после таргетирования lacZ, опосредованного CRISPR-Cas системой, при этом WT происходит от дикого типа. (В) Последовательности предсказанных сайтов рекомбинации определяли путем картирования событий однонуклеотидного полиморфизма, соответствующих либо вышерасположенным (серые), либо нижерасположенным (черные) IS элементам. Три сайта были предсказаны на основе последовательностей, сохранившихся в обоих IS элементах (светло-серые). Изображенные сайты представляют собой генотипы из независимых клонов и являются типичными для феномена Лакса, наблюдаемого в девяти различных сайтах рекомбинации. Следы химерных IS-элементов были обнаружены аналогичным образом в каждом локусе геномного острова на границе делеции. (С) Схематическое изображение IS-элементов, которые согласно прогнозу будут подвергнуты рекомбинации во время хромосомной делеции острова, кодирующего lacZ. (D) Ампликоны, полученные из праймеров, фланкирующих геномные острова 1, 2 и 3, для подтверждения делеции. (Е) Ампликоны, полученные из внутренних праймеров, для подтверждения отсутствия последовательностей дикого типа в каждой культуре с делециями, индуцированными CRISPR. Линии, отмеченные знаком Δ, амплифицировали из gДНК клонов, полученных после опосредованного CRISPR-Cas системой нацеливания, при этом WT происходит от дикого типа.In FIG. 8 shows recombination events between insertion sequences (IS). (A) Electrophoresis gel image of large deletion amplicons obtained by PCR analysis of gDNA isolated from transformants. Screening was performed using primers flanking the IS1193 elements above and below the putative deletion site. Lines marked with Δ were amplified from gDNA Lac clones obtained after targeting lacZ mediated by the CRISPR-Cas system, with WT derived from the wild type. (B) Predicted recombination site sequences were determined by mapping single nucleotide polymorphism events corresponding to either upstream (gray) or downstream (black) IS elements. Three sites were predicted based on sequences conserved in both IS elements (light grey). The sites depicted are genotypes from independent clones and are representative of the Lax phenomenon observed at nine different recombination sites. Traces of chimeric IS elements were found similarly at each genomic island locus at the deletion boundary. (C) Schematic representation of IS elements predicted to undergo recombination during a chromosome deletion of the island encoding lacZ. (D) Amplicons derived from primers flanking genomic islands 1, 2, and 3 to confirm the deletion. (E) Amplicons derived from internal primers to confirm the absence of wild-type sequences in each culture with CRISPR-induced deletions. Lines marked with Δ were amplified from gDNA clones obtained after a CRISPR-Cas mediated targeting system, with WT derived from the wild type.

На фиг. 9 показаны мишени летальности, а также использование определенных генетических локусов для оценки летальности, опосредованной CRISPR-Cas системой типа II, путем таргетирования генома Streptococcus thermophilus LMD-9. Были протестированы обе ортогональные системы типа II (CRISPR1 и CRISPR3); мишени CRISPR1 показаны темно-серым цветом, а мишени CRISPR3 - светлосерым цветом. Специфические генетические признаки выбирали для тестирования (i) межгенных областей (INT), (ii) мобильных генетических элементов (ISSth7, oppC-GEI1, prtS-GEI2, copA-GEI3, cI, lacZGEI4, epsU), (iii) жизненно важных генов (dltA, ltaS), (iv) полюсов реплихоры (OriC, xerS) и прямых или обратных нитей ДНК (внешних мишеней по отношению к внутренним мишеням).In FIG. 9 shows lethality targets, as well as the use of specific genetic loci to assess lethality mediated by the type II CRISPR-Cas system by targeting the genome of Streptococcus thermophilus LMD-9. Both type II orthogonal systems (CRISPR1 and CRISPR3) were tested; CRISPR1 targets are shown in dark gray and CRISPR3 targets in light gray. Specific genetic traits were selected for testing (i) intergenic regions (INT), (ii) transposable genetic elements (ISSth7, oppC-GEI1, prtS-GEI2, copA-GEI3, cI, lacZGEI4, epsU), (iii) vital genes ( dltA, ltaS), (iv) replichore poles (OriC, xerS) and forward or reverse DNA strands (external targets relative to internal targets).

На фиг. 10 показана летальность, опосредованная CRISPR, путем нацеливания на области, показанные на фиг. 9. Логарифмическое уменьшение КОЕ (колониеобразующих единиц) рассчитывали в отношении трансформации контроля несамонацеленной плазмиды; pORI28. Летальность находилась в пределах уменьшения 2-3 log для всех тестируемых мишеней независимо от местоположения в хромосоме кодирующей последовательности или важности. ISSth7 - элемент инсерционной последовательности, ltaS синтаза липотейхоевых кислот; prtS - геномный остров 2; INT - межгенная область; dltA - D-аланин лигаза; rheB - локус с отсутствующим сайтом chi; oppC - геномный остров 1; comS - плотный локус сайта chi; xerS - конец репликации; сорА - геномный остров 3; cI - профаговый остаток; OriC - начало репликации; Cas9 - Cas9 кодирующая последовательность системы CRISPR3; epsU - кассета экзополисахаридов.In FIG. 10 shows CRISPR-mediated lethality by targeting the regions shown in FIG. 9. The logarithmic reduction in CFU (colony forming units) was calculated in relation to the transformation of the control non-self-targeted plasmid; pORI28. Lethality was within the 2-3 log reduction for all tested targets regardless of chromosomal location of the coding sequence or importance. ISSth7 - insertion sequence element, ltaS lipoteichoic acid synthase; prtS, genomic island 2; INT - intergenic region; dltA - D-alanine ligase; rheB - locus with missing chi site; oppC, genomic island 1; comS, dense locus of the chi site; xerS - end of replication; copA - genomic island 3; cI - prophage residue; OriC - start of replication; Cas9 - Cas9 coding sequence of the CRISPR3 system; epsU - exopolysaccharide cassette.

На фиг. 11 показаны профили транскрипции штаммов с опосредованными CRISPR делециями геномных островов.In FIG. 11 shows the transcription profiles of strains with CRISPR-mediated genomic island deletions.

На фиг. 12 показано log2 покрытие прочтениями при секвенировании трансформированной РНК штаммов с делециями геномных островов, GEI1, GEI2, GEI3 и GEI4.In FIG. 12 shows log 2 read coverage when sequencing transformed RNA of strains with genome island deletions, GEI1, GEI2, GEI3 and GEI4.

На фиг. 13 показаны XY графики значений экспрессии штаммов с делециями геномных островов (оси X) в сравнении со значениями экспрессии дикого типа (оси Y). Для каждого из штаммов с делециями геномных островов (GEI1-GEI4) экспрессия генов, кодируемых на каждом из островов-мишеней (черные), была минимальной. Гены, кодируемые в GEI1, показаны на верхней левой панели, гены, кодируемые в GEI2, показаны на верхней правой панели, гены, кодируемые в GEI3, показаны на нижней левой панели, а гены, кодируемые в GEI4, показаны на нижней правой панели.In FIG. 13 shows XY plots of expression values of strains with genomic island deletions (X-axes) compared to wild-type expression values (Y-axes). For each of the strains with deletions of the genomic islands (GEI1-GEI4), expression of the genes encoded on each of the target islands (black) was minimal. GEI1 encoded genes are shown in the upper left panel, GEI2 encoded genes are shown in the upper right panel, GEI3 encoded genes are shown in the lower left panel, and GEI4 encoded genes are shown in the lower right panel.

На фиг. 14А, 14В показано введение экзогенного фага, плазмиды или фагемида, кодирующего массив CRISPR (система типа II) для co-opt эндогенных систем для запрограммированной гибели клеток в Streptococcus thermophiles.In FIG. 14A, 14B show the introduction of an exogenous phage, plasmid or phagemid encoding a CRISPR array (type II system) for co-opt endogenous systems for programmed cell death in Streptococcus thermophiles.

Фиг. 15. Гиды типа II Lactobacillus casei. Верхняя структура - предсказанный гид. Левая нижняя фигура представляет собой правильный двойной гид crРНК:tracrРНК, что подтверждается секвенированиемFig. 15. Guides type II Lactobacillus casei. The top frame is the predicted guide. The lower left figure represents the correct crRNA:tracrRNA double guide, as confirmed by sequencing.

- 7 042506- 7 042506

РНК. Правая нижняя фигура является примером предсказанного искусственного однонитевого гида.RNA. The lower right figure is an example of a predicted artificial single strand guide.

На фиг. 16 представлены приведенные в качестве примера гиды типа II Lactobacillus casei. Верхняя структура - предсказанный гид. Левая нижняя фигура представляет собой правильный двойной гид crРНК:tracrРНК, что подтверждается секвенированием РНК. Правая нижняя фигура является примером предсказанного искусственного однонитевого гида.In FIG. 16 shows exemplary type II Lactobacillus casei guides. The top frame is the predicted guide. The lower left figure represents the correct crRNA:tracrRNA double guide, as confirmed by RNA sequencing. The lower right figure is an example of a predicted artificial single strand guide.

На фиг. 17 представлены приведенные в качестве примера гиды типа II Lactobacillus pentosus. Верхняя структура предсказанный гид. Левая нижняя фигура представляет собой правильный двойной гид crРНК:tracrРНК, что подтверждается секвенированием РНК. Правая нижняя фигура является примером предсказанного искусственного однонитевого гида.In FIG. 17 shows exemplary type II Lactobacillus pentosus guides. The top structure is a predicted guide. The lower left figure represents the correct crRNA:tracrRNA double guide, as confirmed by RNA sequencing. The lower right figure is an example of a predicted artificial single strand guide.

На фиг. 18 представлены приведенные в качестве примера гиды типа II Lactobacillus jensenii. Левая панель представляет собой правильный двойной гид crРНК:tracrРНК, что подтверждается секвенированием РНК. Правая панель представляет собой пример предсказанного искусственного однонитевого гида.In FIG. 18 shows exemplary type II Lactobacillus jensenii guides. The left panel is the correct crRNA:tracrRNA double guide, as confirmed by RNA sequencing. The right panel is an example of a predicted artificial single strand guide.

На фиг. 19 показаны результаты трансформации плазмид, содержащих протоспейсер, который соответствует сгРНК с самой высокой степенью транскрипции в нативном массиве CRISPSR типа II L. gasseri. В L. gasseri были трансформированы четыре разные плазмиды (слева направо): пустой вектор pTRK563, конструкция с правильным протоспейсером, но неверным PAM, с правильным PAM, но с протоспейсером, который не находится в массиве, и с правильными протоспейсером и PAM, которая продемонстрировала самую высокую степень направленности интерференции и гибели клеток. Приведенные значения представляют собой среднее значение ±SEM для трех независимых реплик.In FIG. 19 shows the results of transformation of plasmids containing a protospacer that corresponds to the highest transcribed sgRNA in a native L. gasseri type II CRISPSR array. Four different plasmids were transformed into L. gasseri (from left to right): an empty pTRK563 vector, a construct with a correct protospacer but incorrect PAM, a correct PAM but a protospacer that is not in the array, and a correct protospacer and PAM which demonstrated the highest degree of directionality of interference and cell death. Values shown are the mean ±SEM of three independent replicas.

На фиг. 20 показаны результаты трансформации плазмид, содержащих протоспейсер, который соответствует сгРНК с самой высокой степенью транскрипции в нативном массиве CRISPSR типа II L. pentosus. В L. pentosus были трансформированы четыре разные плазмиды (слева направо): конструкция с правильным протоспейсером, но неверным PAM (Lpe4 ctGttt), с правильным PAM, но с протоспейсером, который не находится в массиве (Lpe8 noSPCR), пустой вектор pTRK563 (pTRK563) и плазмида с правильным протоспейсером и правильным PAM (Lpe1 gttaat). Приведенные значения представляют собой среднее значение ±SEM для трех независимых реплик.In FIG. 20 shows the results of transformation of plasmids containing a protospacer that corresponds to the highest transcribed sgRNA in a native L. pentosus type II CRISPSR array. Four different plasmids were transformed into L. pentosus (from left to right): a construct with the correct protospacer but the wrong PAM (Lpe4 ctGttt), with the correct PAM but with a protospacer that is not in the array (Lpe8 noSPCR), an empty pTRK563 vector (pTRK563 ) and a plasmid with the correct protospacer and correct PAM (Lpe1 gttaat). Values shown are the mean ±SEM of three independent replicas.

На фиг. 21 представлен приведенный в качестве примера гид CRISPR-Cas типа I Lactobacillus casei. Приведенная последовательность представляет собой нативную лидерную последовательность типа I и повтор, который находится в NCK 125 Lactobacillus casei. Этот искусственный массив содержит спейсер, который таргетирует ген 16s рДНК в геноме хозяина.In FIG. 21 is an exemplary CRISPR-Cas type I Lactobacillus casei guide. The sequence shown is the native type I leader and repeat found in Lactobacillus casei NCK 125. This artificial array contains a spacer that targets the 16s rDNA gene in the host genome.

На фиг. 22 показана трансформация плазмид, содержащих протоспейсер, который соответствует сгРНК с самой высокой степенью транскрипции в нативном массиве CRISPSR типа II L. jensenii. В L. jensenii были трансформированы четыре разные плазмиды (слева направо): пустой вектор pTRK563, конструкция с правильным протоспейсером, но неверным PAM, с правильным PAM, но с протоспейсером, который не находится в массиве, и с правильными протоспейсером и PAM, которая продемонстрировала самую высокую степень направленности интерференции и гибели клеток.In FIG. 22 shows the transformation of plasmids containing a protospacer that corresponds to the highest transcribed sgRNA in a native L. jensenii type II CRISPSR array. Four different plasmids were transformed into L. jensenii (from left to right): an empty pTRK563 vector, a construct with a correct protospacer but incorrect PAM, a correct PAM but a protospacer that is not in the array, and a correct protospacer and PAM which demonstrated the highest degree of interference targeting and cell death.

На фиг. 23 показано направленное самоуничтожение использованием нативной системы типа I в Lactobacillus casei NCK 125. Были сконструированы две мишени в гене 16s рДНК. PAM 5'-YAA-3' была предсказана при помощи нативных спейсерных последовательностей в организме. Искусственный массив, содержащий нативную лидерную последовательность типа I, повторы и выбранные спейсеры, клонировали в pTRK870. Введенные конструкции включали пустой вектор (pTRK563) и два разных искусственных массива: один из которых содержал один спейсер, таргетирующий +цепь в гене 16s (1-2 alt), а другой массив содержал исходный спейсер, таргетирующий +цепь, а также дополнительный спейсер, таргетирующий -цепь в гене 16s (1, 2-3). Приведенные значения представляют собой среднее значение ±SEM для трех независимых реплик.In FIG. 23 shows targeted self-destruction using a native type I system in Lactobacillus casei NCK 125. Two targets were constructed in the 16s rDNA gene. PAM 5'-YAA-3' was predicted using native spacer sequences in the body. An artificial array containing the native type I leader sequence, repeats and selected spacers was cloned into pTRK870. The constructs introduced included an empty vector (pTRK563) and two different artificial arrays: one containing one spacer targeting the +strand in the 16s gene (1-2 alt), and the other array containing the original spacer targeting the +strand, as well as an additional spacer, targeting -chain in the 16s gene (1, 2-3). Values shown are the mean ±SEM of three independent replicas.

Подробное описание изобретенияDetailed description of the invention

Настоящее изобретение описано ниже со ссылкой на прилагаемые чертежи и примеры, в которых показаны варианты осуществления изобретения. Это описание не предназначено в качестве подробного описания всех разных способов реализации изобретения или всех функций, которые могут быть добавлены к настоящему изобретению. Например, признаки, проиллюстрированные в отношении одного варианта осуществления, могут быть включены в другие варианты осуществления, а функции, проиллюстрированные в отношении конкретного варианта осуществления, могут быть удалены из этого варианта осуществления. Таким образом, изобретение предусматривает, что в некоторых вариантах его осуществления любой признак или комбинация признаков, изложенных в настоящем описании, могут быть исключены или опущены. Кроме того, многочисленные варианты и дополнения к предложенным в настоящем описании различным вариантам осуществления будут очевидными для специалистов в данной области исходя из приведенного раскрытия, которые не выходят за рамки настоящего изобретения. Следовательно, приведенное ниже описание предназначено для иллюстрации некоторых конкретных вариантов осуществления изобретения, а не для исчерпывающего определения всех перестановок, комбинаций и их вариантов.The present invention is described below with reference to the accompanying drawings and examples showing embodiments of the invention. This description is not intended as a detailed description of all the different ways of implementing the invention or all the functions that can be added to the present invention. For example, features illustrated in relation to one embodiment may be included in other embodiments, and functions illustrated in relation to a particular embodiment may be removed from that embodiment. Thus, the invention contemplates that, in some embodiments, any feature or combination of features set forth herein may be omitted or omitted. Moreover, numerous variations and additions to the various embodiments provided herein will be apparent to those skilled in the art from the foregoing disclosure, and do not depart from the scope of the present invention. Therefore, the following description is intended to illustrate certain specific embodiments of the invention, and not to exhaustively define all permutations, combinations, and variations thereof.

- 8 042506- 8 042506

Если не определено иное, то все технические и научные термины, используемые в настоящем описании, имеют те же самые значения, как они обычно понимаются специалистом в соответствующей области техники, к которой относится данное изобретение. Терминология, используемая в описании настоящего изобретения, предназначена только для описания конкретных вариантов осуществления и не предназначена для ограничения изобретения.Unless otherwise defined, all technical and scientific terms used in the present description have the same meanings as they are usually understood by a person skilled in the relevant field of technology to which this invention pertains. The terminology used in the description of the present invention is only intended to describe specific embodiments and is not intended to limit the invention.

Все публикации, заявки на патенты, патенты и другие ссылочные документы, приведенные в настоящем описании, включены в качестве ссылки во всей своей полноте в отношении информации, относящейся к предложению и/или параграфу, в котором приведена эта ссылка.All publications, patent applications, patents and other referenced documents cited in this specification are incorporated by reference in their entirety with respect to information relating to the sentence and/or paragraph in which the reference is made.

Если контекстом не определено иное, специально предполагается, что различные признаки изобретения, приведенные в настоящем описании, могут использоваться в любой комбинации. Более того, настоящее изобретение также предусматривает, что в некоторых вариантах осуществления изобретения любой признак или комбинация признаков, изложенных в настоящем описании, могут быть исключены или опущены. С целью иллюстрации, если в описании указано, что композиция содержит компоненты А, В и С, то специально предполагается, что любой компонент из А, В или С или их комбинация могут быть опущены и исключены по отдельности или в любой комбинации.Unless the context dictates otherwise, it is specifically contemplated that the various features of the invention described herein may be used in any combination. Moreover, the present invention also provides that in some embodiments of the invention, any feature or combination of features set forth in the present description may be excluded or omitted. For the purpose of illustration, if the description indicates that the composition contains components A, B and C, then it is specifically contemplated that any component of A, B or C or a combination thereof may be omitted and excluded individually or in any combination.

Как используется в описании изобретения и прилагаемой формуле изобретения, формы единственного числа также включают формы множественного числа, если контекстом в явном виде не определено иное.As used in the specification and the appended claims, the singular also includes the plural unless the context clearly dictates otherwise.

Также, как используется в настоящем описании, и/или относится к любым и всем возможным сочетаниям одного или нескольких связанных перечисленных элементов, а также к отсутствию их комбинаций при интерпретации в альтернативе (или).Also, as used herein and/or refers to any and all possible combinations of one or more related listed elements, as well as the absence of their combinations when interpreted in the alternative (or).

Используемый в настоящем описании термин примерно, если он относится к измеряемой величине, такой как доза или период времени и т.п., относится к отклонениям ±20, ±10, ±5, ±1, ±0,5% или даже ±0,1% от указанного количества.The term used in the present description approximately, if it refers to a measurable quantity such as a dose or a period of time, etc., refers to deviations of ±20, ±10, ±5, ±1, ±0.5%, or even ±0 .1% of the indicated amount.

Как используется в настоящем описании, фразы, такие как между X и Y и между примерно X и Y, следует интерпретировать как включающие X и Y. Как используется в настоящем описании, фразы, такие как между примерно X и Y, означают между примерно X и примерно Y, а фразы, такие как от примерно X до Y, означают от примерно X до примерно Y.As used herein, phrases such as between about X and Y and between about X and Y should be interpreted to include X and Y. As used herein, phrases such as between about X and Y mean between about X and about Y, and phrases like about X to Y mean about X to about Y.

Термин содержать, содержит и содержащий, как используется в настоящем описании, определяет наличие указанных признаков, целых чисел, этапов, операций, элементов и/или компонентов, но не исключает наличия или добавления одной или нескольких других функций, целых чисел, этапов, операций, элементов, компонентов и/или их групп.The term contain, contains and containing, as used in the present description, defines the presence of the specified features, integers, steps, operations, elements and/or components, but does not exclude the presence or addition of one or more other functions, integers, steps, operations, elements, components and/or their groups.

Как используется в настоящем описании, переходная фраза состоящий в основном из означает, что объем пункта формулы изобретения следует интерпретировать как охватывающий указанные материалы или этапы, перечисленные в этом пункте формулы изобретения, а также те, которые не оказывают существенного влияния на основную и новую характеристику(и) заявленного изобретения. Таким образом, термин состоящий в основном из при использовании в пункте формулы настоящего изобретения не следует интерпретировать как эквивалентный термину содержащий.As used herein, the transitional phrase consisting essentially of means that the scope of the claim is to be interpreted as covering the specified materials or steps listed in that claim, as well as those that do not significantly affect the essential and new feature( i) the claimed invention. Thus, the term consisting essentially of when used in a claim of the present invention should not be interpreted as equivalent to the term containing.

Cas9 нуклеаза относится к большой группе эндонуклеаз, которые катализируют расщепление двухцепочечной ДНК в CRISPR-Cas системе. Эти полипептиды хорошо известны в уровне техники, и многие их структуры (последовательности) охарактеризованы (см., например, WO 2013/176772; WO 2013/188638). Домены для каталитического расщепления двухцепочечной ДНК представляют собой домен RuvC и домен HNH. Домен RuvC отвечает за разрыв (-)нити, а домен HNH отвечает за разрыв (+)нити (см., например, Gasiunas et al., PNAS, 109 (36):E2579-E2586 (4 сентября, 2012 г.)).Cas9 nuclease belongs to a large group of endonucleases that catalyze the cleavage of double-stranded DNA in the CRISPR-Cas system. These polypeptides are well known in the art and many of their structures (sequences) have been characterized (see, for example, WO 2013/176772; WO 2013/188638). The domains for catalytic cleavage of double-stranded DNA are the RuvC domain and the HNH domain. The RuvC domain is responsible for breaking the (-) strand, and the HNH domain is responsible for breaking the (+) strand (see, for example, Gasiunas et al., PNAS, 109(36):E2579-E2586 (September 4, 2012)) .

Используемый в настоящем описании термин химерный относится к молекуле нуклеиновой кислоты или полипептиду, в котором по меньшей мере два компонента получены из разных источников (например, разных организмов, разных кодирующих областей).As used herein, the term chimeric refers to a nucleic acid molecule or polypeptide in which at least two components are derived from different sources (eg, different organisms, different coding regions).

Комплемент, как используется в настоящем описании, может означать 100% комплементарности или идентичности референсной нуклеотидной последовательности, или может означать менее 100% комплементарности (например, примерно 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% и т.п. комплементарности).Complement, as used herein, may mean 100% complementarity or identity of a reference nucleotide sequence, or may mean less than 100% complementarity (e.g., about 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99%, etc. complementarity).

Термины комплементарный или комплементарность, используемые в настоящем описании, относятся к естественному связыванию полинуклеотидов в пермиссивных солевых и температурных условиях путем спаривания оснований. Например, последовательность A-G-T связывается с комплементарной последовательностью Т-С-А. Комплементарность между двумя однонитевыми молекулами может быть частичной, при которой связываются только некоторые из нуклеотидов, или может быть полной, когда существует полная комплементарность между одноцепочечными молекулами. Степень комплементарности между нитями нуклеиновых кислот оказывает значительное влияние на эффективность и прочность гибридизации между нитями нуклеиновых кислот.The terms complementary or complementarity as used herein refer to the natural binding of polynucleotides under permissive salt and temperature conditions by base pairing. For example, the sequence A-G-T binds to the complementary sequence T-C-A. Complementarity between two single-stranded molecules may be partial, in which only some of the nucleotides bind, or may be complete, in which there is complete complementarity between single-stranded molecules. The degree of complementarity between nucleic acid strands has a significant impact on the efficiency and strength of hybridization between nucleic acid strands.

Используемый в настоящем описании термин контакт, контактирование, контактируемый и его грамматические варианты относится к помещению компонентов требуемой реакции в условия, подходящие для проведения этой требуемой реакции (например, интеграции, трансформации, скрининга,As used herein, the term contact, contacting, contacted, and its grammatical variations refers to placing the components of a desired reaction under conditions suitable for carrying out that desired reaction (e.g., integration, transformation, screening,

- 9 042506 отбора, уничтожения, идентификации, амплификации и т.п.). Способы и условия для проведения таких реакций хорошо известны в данной области (см., например, Gasiunas et al. (2012), Proc. Natl. Acad. Sci.,- 9 042506 selection, destruction, identification, amplification, etc.). Methods and conditions for carrying out such reactions are well known in the art (see, for example, Gasiunas et al. (2012), Proc. Natl. Acad. Sci.,

109:E2579-E2586; M.R. Green and J. Sambrook (2012), Molecular Cloning: A Laboratory Manual., 4th ed.,109:E2579-E2586; M.R. Green and J. Sambrook (2012), Molecular Cloning: A Laboratory Manual., 4th ed.,

Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY).Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY).

Делеция, как используется в настоящем описании, может содержать потерю или делецию генетического материала, включая без ограничения делецию части хромосомы или плазмиды, делецию гена или части гена из хромосомы или плазмиды. В некоторых вариантах осуществления делеция может содержать один ген или более одного гена. В некоторых вариантах осуществления делеция может также содержать потерю не кодирующих белок областей, которые могут кодировать небольшие некодирующие РНК. В некоторых вариантах осуществления делеция может содержать потерю всей плазмиды или всего мобильного генетического элемента. В некоторых вариантах осуществления изобретения потеря мобильного генетического элемента может быть определена как, например, отсутствие способности к репликации или персистированию.A deletion, as used herein, may include loss or deletion of genetic material, including, without limitation, deletion of a portion of a chromosome or plasmid, deletion of a gene or portion of a gene from a chromosome or plasmid. In some embodiments, the implementation of the deletion may contain one gene or more than one gene. In some embodiments, the implementation of the deletion may also contain the loss of non-coding regions of the protein, which can encode small non-coding RNA. In some embodiments, the implementation of the deletion may include the loss of the entire plasmid or the entire transposable genetic element. In some embodiments, the loss of a transposable genetic element can be defined as, for example, the lack of the ability to replicate or persist.

В некоторых вариантах осуществления фазмида по изобретению может содержать массив CRISPR из CRISPR-Cas системы типа I, CRISPR-Cas системы типа II, CRISPR-Cas системы типа III, CRISPR-Cas системы типа IV и/или CRISPR-Cas системы типа V (см., Makarova et al., Nature Reviews Biotechnology, 13:722736 (2015)).In some embodiments, a phasmid of the invention may comprise a CRISPR array of CRISPR-Cas system type I, CRISPR-Cas system type II, CRISPR-Cas system type III, CRISPR-Cas system type IV, and/or CRISPR-Cas system type V (see ., Makarova et al., Nature Reviews Biotechnology, 13:722736 (2015)).

Таким образом, в некоторых вариантах осуществления, дополнительно к сгРНК типа I, фазмида по изобретению может содержать полипептиды типа I и/или полипептиды Cascade типа I (т.е. CRISPR-Cas систему типа I).Thus, in some embodiments, in addition to the type I sgRNA, the phasmid of the invention may contain type I polypeptides and/or type I Cascade polypeptides (ie, type I CRISPR-Cas system).

Используемый в настоящем описании термин полипептид типа I относится к любому из полипептида Cas3, полипептида Cas3', полипептида Cas3, их рекомбинантных вариантов, и любому одному или более полипептидам из комплекса противовирусных полипептидов (Cascade), ассоциированного с короткими палиндромными повторами типа I (CRISPR). Таким образом, термин полипептид типа I относится к полипептидам, которые составляют CRISPR-Cas систему типа I-A, CRISPR-Cas систему типа I-B, CRISPR-Cas систему типа I-C, CRISPR-Cas систему типа I-D, CRISPR-Cas систему типа I-Е, CRISPR-Cas систему типа I-F и/или CRISPR-Cas систему типа I-U. Каждая CRISPR-Cas система типа I содержит по меньшей мере один полипептид Cas3. Полипептиды Cas3 обычно содержат как домен геликазы, так и домен HD. Однако в некоторых CRISPR-Cas системах типа I геликаза и домен HD находятся в отдельных полипептидах, Cas3' и Cas3. В частности, Cas3' кодирует домен геликазы, тогда как Cas3 кодирует домен HD. Следовательно, поскольку для функционирования Cas3 необходимы обе области, подтипы типа I либо кодируют Cas3 (I-C, I-D, I-Е, I-F, I-U), либо Cas3' и Cas3 (I-A, I-B).As used herein, the term type I polypeptide refers to any of a Cas3 polypeptide, a Cas3' polypeptide, a Cas3 polypeptide, recombinant variants thereof, and any one or more of the antiviral polypeptide complex (Cascade) associated with type I short palindromic repeats (CRISPR) . Thus, the term type I polypeptide refers to polypeptides that make up the CRISPR-Cas system type I-A, CRISPR-Cas system type I-B, CRISPR-Cas system type I-C, CRISPR-Cas system type I-D, CRISPR-Cas system type I-E, CRISPR-Cas system type I-F and/or CRISPR-Cas system type I-U. Each type I CRISPR-Cas system contains at least one Cas3 polypeptide. Cas3 polypeptides typically contain both a helicase domain and an HD domain. However, in some type I CRISPR-Cas systems, the helicase and the HD domain reside in separate polypeptides, Cas3' and Cas3. In particular, Cas3' encodes a helicase domain while Cas3 encodes an HD domain. Therefore, since both regions are required for Cas3 to function, type I subtypes either encode Cas3 (I-C, I-D, I-E, I-F, I-U) or Cas3' and Cas3 (I-A, I-B).

Используемый в настоящем описании термин полипептиды Cascade типа I относится к комплексу полипептидов, участвующих в процессинге pre-crРНК и последующем связывании с ДНК-мишенью в CRISPR-Cas системах типа I. Эти полипептиды включают без ограничения полипептиды Cascade подтипов I-A, I-B, I-C, I-D, I-Е и I-F типа I. Неограничивающие примеры полипептидов Cascade типа I-A включают Cas7 (Csa2), Cas8al (Csx13), Cas8a2 (Csx9), Cas5, Csa5, Cas6a, Cas3' и/или Cas3. Неограничивающие примеры полипептидов Cascade типа I-B включают Cas6b, Cas8b (Csh1), Cas7 (Csh2) и/или Cas5. Неограничивающие примеры полипептидов Cascade типа I-C каскада включают Cas5d, Cas8c (Csd1) и/или Cas7 (Csd2). Неограничивающие примеры полипептидов Cascade типа I-D каскада включают Cas10d (Csc3), Csc2, Csc1 и/или Cas6d. Неограничивающие примеры полипептидов Cascade типа I-Е включают Cse1 (CasA), Cse2 (CasB), Cas7 (CasC), Cas5 (CasD) и/или Cas6e (CasE). Неограничивающие примеры полипептидов Cascade типа I-F включают Cys1, Cys2, Cas7 (Cys3) и/или Cas6f (Csy4). Неограничивающие примеры полипептидов Cascade типа I-U включают Cas8c, Cas7, Cas5, Cas6 и/или Cas4.As used herein, the term Cascade type I polypeptides refers to a complex of polypeptides involved in pre-crRNA processing and subsequent binding to a target DNA in Type I CRISPR-Cas systems. These polypeptides include, without limitation, Cascade polypeptides of subtypes I-A, I-B, I-C, I-D , I-E and I-F type I. Non-limiting examples of Cascade type I-A polypeptides include Cas7 (Csa2), Cas8al (Csx13), Cas8a2 (Csx9), Cas5, Csa5, Cas6a, Cas3' and/or Cas3. Non-limiting examples of Cascade type I-B polypeptides include Cas6b, Cas8b (Csh1), Cas7 (Csh2), and/or Cas5. Non-limiting examples of Cascade type I-C cascade polypeptides include Cas5d, Cas8c (Csd1) and/or Cas7 (Csd2). Non-limiting examples of Cascade type I-D cascade polypeptides include Cas10d (Csc3), Csc2, Csc1 and/or Cas6d. Non-limiting examples of Cascade type I-E polypeptides include Cse1 (CasA), Cse2 (CasB), Cas7 (CasC), Cas5 (CasD), and/or Cas6e (CasE). Non-limiting examples of Cascade type I-F polypeptides include Cys1, Cys2, Cas7 (Cys3) and/or Cas6f (Csy4). Non-limiting examples of Cascade type I-U polypeptides include Cas8c, Cas7, Cas5, Cas6 and/or Cas4.

В некоторых вариантах осуществления фазмида по изобретению может содержать CRISPR-Cas систему типа II дополнительно к сгРНК типа II. CRISPR-Cas системы типа II содержат три подтипа: тип II-А, тип II-В и тип II-C, каждый из которых содержит мультидоменный белок Cas9 дополнительно к адаптивным полипептидам Cas1, Cas2 и необязательно Csn2 и/или Cas4. Большинство локусов типа II также кодируют йлсгРНК. Организмы, содержащие типичные CRISPR-Cas системы типа II, включают штаммы Legionella pneumophila Paris, Streptococcus thermophilus CNRZ1066 и Neisseria lactamica 020-06.In some embodiments, the phasmid of the invention may contain a type II CRISPR-Cas system in addition to type II sgRNA. Type II CRISPR-Cas systems contain three subtypes: type II-A, type II-B and type II-C, each of which contains the Cas9 multidomain protein in addition to the adaptive Cas1, Cas2 and optionally Csn2 and/or Cas4 polypeptides. Most type II loci also encode for esgRNA. Organisms containing typical type II CRISPR-Cas systems include strains of Legionella pneumophila Paris, Streptococcus thermophilus CNRZ1066 and Neisseria lactamica 020-06.

В дополнительных вариантах осуществления фазмида по изобретению может содержать CRISPR-Cas систему типа III дополнительно к сгРНК типа III. Подобно CRISPR-Cas системам типа I, в системах типа III процессинг и интерференция осуществляются с участием мультибелковых эффекторных комплексов CRISPR РНК (сгРНК) (Makarova et al., Nature Reviews Biotechnology, 13:722736 (2015)) - CASCADE в типе I и Csm или Cmr в типе III. Таким образом, в некоторых вариантах осуществления CRISPR-Cas система типа III может содержать комплекс Csm (например, Csm типа III-A) и/или комплекс Cmr (например, Cmr типа III-B) и необязательно полипептид Cas6. В типичных вариантах осуществления комплекс Csm может содержать полипептиды Cas10 (или Csm1), Csm2, Csm3, Csm4, Csm5 и Csm6, а комплекс Cmr может содержать полипептиды Cmr1, Cas10 (или Cmr2), Cmr3, Cmr4, Cmr5 и Cmr6. В дополнение к комплексу Csm или комплексу Cmr CRISPR-Cas, система типа III может также содержать полипептид Cas7. Охарактеризованы четыре подтипа CRISPR-Cas системы типа III: III-A, III-B, III-C, III-D. В некоторых вариантах осуществления CRISPR-Cas система типа III-А содержит полипептидыIn further embodiments, the phasmid of the invention may comprise a type III CRISPR-Cas system in addition to type III sgRNA. Like CRISPR-Cas systems of type I, in systems of type III, processing and interference are carried out with the participation of multiprotein effector complexes CRISPR RNA (sgRNA) (Makarova et al., Nature Reviews Biotechnology, 13:722736 (2015)) - CASCADE in type I and Csm or Cmr in type III. Thus, in some embodiments, a type III CRISPR-Cas system may comprise a Csm complex (eg, type III-A Csm) and/or a Cmr complex (eg, type III-B Cmr) and optionally a Cas6 polypeptide. In exemplary embodiments, the Csm complex may comprise the Cas10 (or Csm1), Csm2, Csm3, Csm4, Csm5, and Csm6 polypeptides, and the Cmr complex may comprise the Cmr1, Cas10 (or Cmr2), Cmr3, Cmr4, Cmr5, and Cmr6 polypeptides. In addition to the Csm complex or the CRISPR-Cas Cmr complex, the type III system may also contain a Cas7 polypeptide. Four subtypes of the type III CRISPR-Cas system have been characterized: III-A, III-B, III-C, III-D. In some embodiments, the Type III-A CRISPR-Cas system contains polypeptides

- 10 042506- 10 042506

Cas6, Cas10, Csm2, Cas7 (Csm3), Cas5 (Csm4), Cas7 (Csm5) и Csm6. В некоторых вариантах осуществления CRISPR-Cas система типа III-B содержит полипептиды Cas7 (Cmr1), Cas10, Cas5 (Cmr3), Cas7 (Cmr4), Cmr5, Cas6 и Cas7 (Cmr6). В некоторых вариантах осуществления CRISPR-Cas система типа III-C содержит полипептиды Cas7 (Cmr1), Cas7 (Cmr6), Cas10, Cas7 (Cmr4), Cmr5 и Cas5 (Cmr3). В некоторых вариантах осуществления CRISPR-Cas система типа III-D содержит полипептиды Cas10, Cas7 (Csm3), Cas5 (CsxlO), Csm2, Cas7 (Csm3) и all1473.Cas6, Cas10, Csm2, Cas7 (Csm3), Cas5 (Csm4), Cas7 (Csm5), and Csm6. In some embodiments, the Type III-B CRISPR-Cas system comprises the Cas7 (Cmr1), Cas10, Cas5 (Cmr3), Cas7 (Cmr4), Cmr5, Cas6, and Cas7 (Cmr6) polypeptides. In some embodiments, the Type III-C CRISPR-Cas system comprises the Cas7 (Cmr1), Cas7 (Cmr6), Cas10, Cas7 (Cmr4), Cmr5, and Cas5 (Cmr3) polypeptides. In some embodiments, the Type III-D CRISPR-Cas system comprises the Cas10, Cas7 (Csm3), Cas5 (CsxlO), Csm2, Cas7 (Csm3), and all1473 polypeptides.

В некоторых вариантах осуществления фазмида по изобретению может содержать CRISPR-Cas систему типа IV дополнительно к сгРНК типа IV. CRISPR-Cas системы типа IV могут содержать полипептид Csf4 (dinG) и/или полипептид Csf1, Cas7 (Csf2) и/или Cas5 (csf3). (Makarova et al., Nature Reviews Microbiology, 13:722-736 (2015)).In some embodiments, the phasmid of the invention may comprise a type IV CRISPR-Cas system in addition to type IV sgRNA. Type IV CRISPR-Cas systems may contain a Csf4 (dinG) polypeptide and/or a Csf1, Cas7 (Csf2) and/or Cas5 (csf3) polypeptide. (Makarova et al., Nature Reviews Microbiology, 13:722-736 (2015)).

В некоторых вариантах осуществления фазмида по изобретению может дополнительно содержать CRISPR-Cas систему типа V дополнительно к сгРНК типа V. CRISPR-Cas системы типа V могут содержать полипептид Cpf1 и/или полипептид Cas1, Cas2 и/или Cas4. (Makarova et al., Nature Reviews Microbiology, 13:722-736 (2015)).In some embodiments, the phasmid of the invention may further comprise a type V CRISPR-Cas system in addition to type V sgRNA. The type V CRISPR-Cas systems may comprise a Cpf1 polypeptide and/or a Cas1, Cas2 and/or Cas4 polypeptide. (Makarova et al., Nature Reviews Microbiology, 13:722-736 (2015)).

Под фрагментом или частью нуклеотидной последовательности по изобретению следует понимать нуклеотидную последовательность уменьшенной длины (например, уменьшенной на 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или более нуклеотидов) относительно референсной последовательности нуклеиновой кислоты или нуклеотидной последовательности, содержащую, по существу состоящую и/или состоящую из нуклеотидной последовательности смежных нуклеотидов, идентичных или по существу идентичных (например, идентичных на 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99%) референсной последовательности нуклеиновой кислоты или нуклеотидной последовательности. Такой фрагмент или часть нуклеиновой кислоты в соответствии с изобретением может быть в случае необходимости включенной в более крупный полинуклеотид, частью которого указанный фрагмент или часть является. Таким образом, гибридизующийся с (или гибридизуется с, и другие грамматические варианты этого выражения), например, по меньшей мере частью ДНК-мишенью (например, областью-мишенью в геноме) относится к гибридизации с нуклеотидной последовательностью, которая идентична или по существу идентична по длине смежным нуклеотидам ДНК-мишени. В некоторых вариантах повтор последовательности спейсер-повтор или последовательности повтор-спейсер-повтор может содержать фрагмент повторяющейся последовательности локуса CRISPR дикого типа или повторяющейся последовательности синтетического массива CRISPR, причем фрагмент повтора сохраняет функцию повтора в массиве CRISPR - гибридизации с нуклеиновой кислотой tracr.A fragment or part of a nucleotide sequence according to the invention should be understood as a nucleotide sequence of reduced length (for example, reduced by 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 , 17, 18, 19, 20 or more nucleotides) relative to a reference nucleic acid sequence or a nucleotide sequence containing, essentially consisting of and/or consisting of a nucleotide sequence of adjacent nucleotides that are identical or substantially identical (e.g., 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99%) of the reference nucleic acid or nucleotide sequence. Such a fragment or portion of a nucleic acid according to the invention may optionally be included in a larger polynucleotide of which said fragment or portion is a part. Thus, hybridizing with (or hybridizing with, and other grammatical variations of this expression), for example, at least part of the target DNA (for example, a target region in the genome) refers to hybridization with a nucleotide sequence that is identical or substantially identical in length of adjacent nucleotides of the target DNA. In some embodiments, a repeat of a spacer-repeat sequence or a repeat-spacer-repeat sequence may comprise a wild-type CRISPR locus repeat sequence fragment or a synthetic CRISPR array repeat sequence fragment, wherein the repeat fragment retains the function of the repeat in the CRISPR array - hybridization to the tracr nucleic acid.

В некоторых вариантах осуществления изобретение может содержать функциональный фрагмент нуклеазы Cas9, Cas3, Cas3', Cas3 или Cpf1. Функциональный фрагмент Cas9 сохраняет одну или более видов активности нативной нуклеазы Cas9, включая без ограничения активность нуклеазы HNH, активность нуклеазы RuvC, активности распознавания и связывания ДНК, РНК и/или PAM. Функциональный фрагмент нуклеазы Cas9 может быть кодирован фрагментом полинуклеотида Cas9. Функциональный фрагмент Cas3, Cas3' или Cas3 сохраняет одну или более активностей нативной нуклеазы Cas9, включая без ограничения активность никазы, активность экзонуклеазы, связывание ДНК и/или связывание РНК. Функциональный фрагмент нуклеазы Cas3, Cas3' или Cas3 может быть кодирован фрагментом полинуклеотида Cas3, Cas3' или Cas3 соответственно.In some embodiments, the implementation of the invention may contain a functional fragment of the nuclease Cas9, Cas3, Cas3', Cas3 or Cpf1. A functional Cas9 fragment retains one or more native Cas9 nuclease activities, including, but not limited to, HNH nuclease activity, RuvC nuclease activity, DNA, RNA, and/or PAM recognition and binding activities. A functional Cas9 nuclease fragment may be encoded by a Cas9 polynucleotide fragment. A functional fragment of Cas3, Cas3', or Cas3 retains one or more of the activities of the native Cas9 nuclease, including, without limitation, nickase activity, exonuclease activity, DNA binding, and/or RNA binding. A functional Cas3, Cas3' or Cas3 nuclease fragment may be encoded by a Cas3, Cas3' or Cas3 polynucleotide fragment, respectively.

Используемый в настоящем описании термин ген относится к молекуле нуклеиновой кислоты, которая может быть использована для продуцирования мРНК, антисмысловой РНК, РНК1 (miРНК, siРНК, shРНК), анти-микроРНК, антисмысловой олигодезоксирибонуклеотид (АМО) и т.п. Гены могут или не могут использоваться для продуцирования функционального белка или продукта гена. Гены могут включать как кодирующие, так и некодирующие области (например, интроны, регуляторные элементы, промоторы, энхансеры, терминальные последовательности и/или 5' и 3' нетранслируемые области). Ген может быть выделен, что подразумевает нуклеиновую кислоту, которая по существу или практически не содержит компонентов, которые обычно связаны с этой нуклеиновой кислотой в ее естественном состоянии. Такие компоненты включают другой клеточный материал, культуральную среду из рекомбинантного продуцирования и/или различные химические вещества, используемые для химического синтеза нуклеиновой кислоты.As used herein, the term gene refers to a nucleic acid molecule that can be used to produce mRNA, antisense RNA, RNA1 (miRNA, siRNA, shRNA), anti-miRNA, antisense oligodeoxyribonucleotide (AMO), and the like. Genes may or may not be used to produce a functional protein or gene product. Genes may include both coding and non-coding regions (eg, introns, regulatory elements, promoters, enhancers, terminal sequences, and/or 5' and 3' untranslated regions). A gene may be isolated, which means a nucleic acid that contains substantially or substantially no components that are normally associated with that nucleic acid in its natural state. Such components include other cellular material, culture medium from recombinant production, and/or various chemicals used in the chemical synthesis of the nucleic acid.

Используемый в настоящем описании термин геном включает хромосомный/ядерный геном организма, а также любой митохондриальный и/или плазмидный геном.As used herein, the term genome includes the chromosomal/nuclear genome of an organism, as well as any mitochondrial and/or plasmid genome.

Используемый в настоящем описании термин шпилечная последовательность представляет собой нуклеотидную последовательность, содержащую шпильки (например, которая образует одну или более шпилечных структур). Шпилька (например, петля-на-стебле, конъюгация в себе) относится к молекуле нуклеиновой кислоты, имеющей вторичную структуру, которая включает область комплементарных нуклеотидов, образующих двойную нить, которая далее с обеих сторон фланкирована одноцепочечными областями. Такие структуры хорошо известны в данной области техники. Как известно в данной области техники, двухнитевая область может содержать некоторые несоответствия в спаривании оснований или может быть абсолютно комплементарной. В некоторых вариантах осуществления настоящегоAs used herein, the term hairpin sequence is a nucleotide sequence containing hairpins (eg, which forms one or more hairpin structures). A hairpin (eg, stem-loop, in-self conjugation) refers to a nucleic acid molecule having a secondary structure that includes a region of complementary nucleotides forming a double strand, which is further flanked on both sides by single-stranded regions. Such structures are well known in the art. As is known in the art, a double-stranded region may contain some mismatch in base pairing or may be perfectly complementary. In some embodiments of the present

- 11 042506 раскрытия шпилечная последовательность конструкции нуклеиновой кислоты может быть расположена на 3'-конце tracr нуклеиновой кислоты.The hairpin sequence of the nucleic acid construct may be located at the 3' end of the tracr nucleic acid.

Гетерологичная или рекомбинантная нуклеотидная последовательность представляет собой нуклеотидную последовательность, не связанную естественным образом с клеткой-хозяином, в которую она вводится, включая не встречающиеся в природе многочисленные копии естественной нуклеотидной последовательности.A heterologous or recombinant nucleotide sequence is a nucleotide sequence not naturally associated with the host cell into which it is introduced, including unnaturally numerous copies of the natural nucleotide sequence.

Различные нуклеиновые кислоты или белки, имеющие гомологию, в настоящем описании именуются гомологами. Термин гомолог включает гомологичные последовательности из одного и того же и других видов и ортологичные последовательности из одного и того же и других видов. Гомология относится к уровню сходства между двумя или более последовательностями нуклеиновой кислоты и/или аминокислоты, выраженному в процентах от позиционной идентичности (т.е. сходства или идентичности последовательностей). Гомология также относится к понятию сходных функциональных свойств между различными нуклеиновыми кислотами или белками. Таким образом, композиции и способы по изобретению дополнительно включают гомологи нуклеотидных последовательностей и полипептидных последовательностей по изобретению. Ортологичный, как используется в настоящем описании, относится к гомологичным нуклеотидным последовательностям и/или аминокислотным последовательностям у разных видов, которые возникли из общего гена-предка во время видообразования. Гомолог нуклеотидной последовательности по настоящему изобретению обладает значимой идентичностью последовательности (например, по меньшей мере примерно 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 и/или 100%) с указанной нуклеотидной последовательностью по изобретению. Так, например, гомолог полинуклеотида или полипептида типа I, типа II, типа III, типа IV или типа V может быть примерно на 70% или более гомологичным любому известному или позже идентифицированному полинуклеотиду или полипептиду типа I, типа II, типа III, типа IV или типа V.Various nucleic acids or proteins having homology are referred to herein as homologues. The term homologue includes homologous sequences from the same and other species and orthologous sequences from the same and other species. Homology refers to the level of similarity between two or more nucleic acid and/or amino acid sequences, expressed as a percentage of positional identity (ie sequence similarity or identity). Homology also refers to the concept of similar functional properties between different nucleic acids or proteins. Thus, the compositions and methods of the invention further include homologues of the nucleotide sequences and polypeptide sequences of the invention. Orthologous, as used herein, refers to homologous nucleotide sequences and/or amino acid sequences across species that arose from a common ancestor gene during speciation. A nucleotide sequence homologue of the present invention has significant sequence identity (e.g., at least about 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86 , 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 and/or 100%) with the specified nucleotide sequence according to the invention. For example, a homologue of a type I, type II, type III, type IV, or type V polynucleotide or polypeptide may be about 70% or more homologous to any known or later identified type I, type II, type III, type IV polynucleotide or polypeptide. or type V.

Как используются в настоящем описании, гибридизация, гибридизуется, гибридизующийся и их грамматические варианты относятся к связыванию двух полностью комплементарных нуклеотидных последовательностей или по существу комплементарных последовательностей, в которых могут присутствовать некоторые несогласованные пары оснований. Условия гибридизации хорошо известны в данной области и изменяются в зависимости от длины нуклеотидных последовательностей и степени комплементарности между нуклеотидными последовательностями. В некоторых вариантах осуществления условия гибридизации могут быть очень жесткими или они могут быть средней жесткости или низкой жесткости в зависимости от степени комплементарности и длины гибридизуемых последовательностей. Условия, которые относятся к условиям низкой, средней и высокой жесткости гибридизации нуклеотидных последовательностей хорошо известны в данной области (см., например, Gasiunas et al. (2012), Proc. Natl. Acad. Sci., 109:E2579-E2586; M.R. Green and J. Sambrook (2012), Molecular Cloning: A Laboratory Manual., 4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY).As used herein, hybridization, hybridize, hybridize, and grammatical variants thereof refer to the linking of two fully complementary nucleotide sequences, or substantially complementary sequences, in which some mismatched base pairs may be present. Hybridization conditions are well known in the art and vary depending on the length of the nucleotide sequences and the degree of complementarity between the nucleotide sequences. In some embodiments, hybridization conditions may be very stringent, or they may be of medium stringency or low stringency, depending on the degree of complementarity and the length of the sequences to be hybridized. Conditions that refer to conditions of low, medium, and high stringency of hybridization of nucleotide sequences are well known in the art (see, e.g., Gasiunas et al. (2012), Proc. Natl. Acad. Sci., 109:E2579-E2586; M.R. Green and J. Sambrook (2012), Molecular Cloning: A Laboratory Manual., 4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY).

Используемые в настоящем описании термины увеличивать, увеличивающийся, увеличенный, усиливать, усиливающийся, усиленный и улучшение (и их грамматические варианты) описывают повышение по меньшей мере на примерно 25, 50, 75, 100, 150, 200, 300, 400, 500% или более по сравнению с контролем.As used herein, increase, increase, increase, enhance, increase, enhance, and improve (and their grammatical variants) describe an increase of at least about 25%, 50%, 75%, 100%, 150%, 200%, 300%, 400%, 500%, or more than control.

Нативная или дикого типа нуклеиновая кислота, нуклеотидная последовательность, полипептидная или аминокислотная последовательность относятся к встречающейся в природе или эндогенной нуклеиновой кислоте, нуклеотидной последовательности, полипептидной или аминокислотной последовательности. Так, например, мРНК дикого типа представляет собой мРНК, которая в естественных условиях встречается в организме или является эндогенной. Гомологичная последовательность нуклеиновой кислоты представляет собой нуклеотидную последовательность, естественным образом связанную с клеткой-хозяином, в которую она введена.A native or wild-type nucleic acid, nucleotide sequence, polypeptide or amino acid sequence refers to a naturally occurring or endogenous nucleic acid, nucleotide sequence, polypeptide or amino acid sequence. For example, wild-type mRNA is mRNA that occurs naturally in the body or is endogenous. A homologous nucleic acid sequence is a nucleotide sequence naturally associated with the host cell into which it is introduced.

Также используемые в настоящем описании термины нуклеиновая кислота, молекула нуклеиновой кислоты, конструкция нуклеиновой кислоты, нуклеотидная последовательность и полинуклеотид относятся к РНК или ДНК, которая является линейной или разветвленной, одно- или двухцепочечной или гибридной. Этот термин также включает РНК/ДНК гибриды. Когда dsРНК продуцируется синтетически, менее общие основания, такие как инозин, 5-метилцитозин, 6-метиладенин, гипоксантин и другие, также могут быть использованы для антисмысловой dsРНК и спаривания рибозимов. Например, было показано, что полинуклеотиды, содержащие С-5-пропиновые аналоги уридина и цитидина, связываются с РНК с высоким сродством и являются мощными антисмысловыми ингибиторами экспрессии генов. Другие модификации, такие как модификация фосфодиэфирного скелета, или 2'-гидрокси в группе сахара рибозы РНК также возможны. Конструкции нуклеиновых кислот по настоящему изобретению могут быть ДНК или РНК, но предпочтительно представляют собой ДНК. Таким образом, хотя конструкции нуклеиновых кислот по настоящему изобретению могут быть описаны и использованы в форме ДНК, в зависимости от предполагаемого использования они также могут быть описаны и использованы в форме РНК.Also used herein, the terms nucleic acid, nucleic acid molecule, nucleic acid construct, nucleotide sequence, and polynucleotide refer to RNA or DNA that is linear or branched, single or double stranded, or hybrid. This term also includes RNA/DNA hybrids. When dsRNA is produced synthetically, less common bases such as inosine, 5-methylcytosine, 6-methyladenine, hypoxanthine, and others can also be used for antisense dsRNA and ribozyme pairing. For example, polynucleotides containing C-5-propyne analogs of uridine and cytidine have been shown to bind to RNA with high affinity and are potent antisense inhibitors of gene expression. Other modifications, such as modification of the phosphodiester backbone, or the 2'-hydroxy in the RNA ribose sugar group, are also possible. The nucleic acid constructs of the present invention may be DNA or RNA, but are preferably DNA. Thus, while the nucleic acid constructs of the present invention may be described and used in the form of DNA, depending on the intended use, they may also be described and used in the form of RNA.

Используемый здесь термин нуклеотидная последовательность относится к гетерополимеру нуклеотидов или последовательности этих нуклеотидов в направлении от 5'- к 3'-концу молекулы нуклеино- 12 042506 вой кислоты и включает молекулы ДНК или РНК, включая кДНК, фрагмент или часть ДНК, геномную ДНК, синтетическую (например, химически синтезированную) ДНК, плазмидную ДНК, мРНК и антисмысловую РНК, любая из которых может быть одноцепочечной или двухцепочечной. Термины нуклеотидная последовательность, нуклеиновая кислота, молекула нуклеиновой кислоты, олигонуклеотид и полинуклеотид также используются в настоящем описании взаимозаменяемо для обозначения гетерополимера нуклеотидов. Если не указано иное, молекулы нуклеиновой кислоты и/или нуклеотидные последовательности, представленные в настоящем описании, приведены в 5'-3' направлении слева направо и представлены в виде стандартного кода для представления нуклеотидов в виде символов, как указано в правилах США для последовательностей, 37 CFR 1.821-1.825 и стандарте ST.25 Всемирной организации интеллектуальной собственности (ВОИС).As used herein, the term nucleotide sequence refers to a heteropolymer of nucleotides or a sequence of these nucleotides in the direction from the 5' to the 3' end of a nucleic acid molecule and includes DNA or RNA molecules, including cDNA, fragment or portion of DNA, genomic DNA, synthetic (eg, chemically synthesized) DNA, plasmid DNA, mRNA, and antisense RNA, any of which may be single-stranded or double-stranded. The terms nucleotide sequence, nucleic acid, nucleic acid molecule, oligonucleotide, and polynucleotide are also used interchangeably herein to refer to a heteropolymer of nucleotides. Unless otherwise indicated, the nucleic acid molecules and/or nucleotide sequences provided herein are given in the 5'-3' direction from left to right and are presented as a standard code for representing nucleotides as symbols as specified in the US Sequence Rules. 37 CFR 1.821-1.825 and ST.25 of the World Intellectual Property Organization (WIPO).

Используемый в настоящем описании термин процентная идентичность последовательности или процентная идентичность относится к проценту идентичных нуклеотидов в линейной полинуклеотидной последовательности референсной (запрашиваемой) полинуклеотидной молекулы (или ее комплементарной цепи) по сравнению с тестовой (испытуемой) полинуклеотидной молекулой (или ее комплементарной цепью), когда две последовательности выровнены оптимальным образом. В некоторых вариантах осуществления процентная идентичность может относиться к проценту идентичных аминокислот в аминокислотной последовательности.As used herein, the term percent sequence identity or percent identity refers to the percentage of identical nucleotides in the linear polynucleotide sequence of a reference (query) polynucleotide molecule (or its complementary strand) compared to a test (test) polynucleotide molecule (or its complementary strand) when two sequences are aligned optimally. In some embodiments, percent identity may refer to the percentage of identical amino acids in an amino acid sequence.

Протоспейсерная последовательность относится к двухцепочечной ДНК-мишени и, в частности, к части ДНК-мишени (например, к области-мишени в геноме), которая полностью или по существу комплементарна (и гибридизуется) со спейсерной последовательностью повтор-спейсер CRISPR последовательностей повтор-спейсер, CRISPR последовательностей повтор-спейсер-повтор и/или массива CRISPR.A protospacer sequence refers to a double-stranded target DNA, and more specifically, a portion of a target DNA (e.g., a target region in the genome) that is wholly or substantially complementary to (and hybridizes with) a repeat-spacer spacer sequence of CRISPR repeat-spacer sequences , CRISPR repeat-spacer-repeat sequences and/or CRISPR array.

Используемые в настоящем описании термины уменьшить, уменьшенный, уменьшающий, уменьшение, убывать, подавлять и снижать (и их грамматические варианты) описывают, например, уменьшение на по меньшей мере примерно 5, 10, 15, 20, 25, 35, 50, 75, 80, 85, 90, 95, 97, 98, 99 или 100% по сравнению с контролем. В конкретных вариантах осуществления уменьшение может приводить к отсутствию или по существу отсутствию (т.е. незначительному количеству, например, менее чем примерно 10% или даже 5%) обнаруживаемой активности или количества измеряемого компонента (например, популяции клеток или размера генома). Так, например, уменьшенный размер генома может означать уменьшение размера генома на по меньшей мере примерно 5, 10, 15, 20, 25, 35, 50, 75, 80, 85, 90, 95, 97, 98, 99 или 100% по сравнению с контролем.As used herein, the terms reduce, diminish, reduce, decrease, decrease, suppress, and reduce (and their grammatical variants) describe, for example, a decrease of at least about 5, 10, 15, 20, 25, 35, 50, 75, 80, 85, 90, 95, 97, 98, 99 or 100% compared to control. In specific embodiments, the reduction may result in no or substantially no (i.e., negligible amount, e.g., less than about 10% or even 5%) of detectable activity or amount of measurable component (e.g., cell population or genome size). Thus, for example, a reduced genome size may mean a reduction in genome size of at least about 5%, 10%, 15%, 20%, 25%, 35%, 50%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, or 100%. compared with control.

Используемый в настоящем описании контроль может представлять собой, например, популяцию бактериальных, архейных, водорослевых или дрожжевых клеток, которые не были трансформированы конструкцией гетерологичной нуклеиновой кислоты по настоящему изобретению. В некоторых вариантах осуществления контроль может представлять собой популяцию дикого типа бактериальных, архейных, водорослевых или дрожжевых клеток или она может быть популяцией бактериальных, архейных или дрожжевых клеток, трансформированных гетерологичной конструкцией, содержащей массив CRISPR, который содержит последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер содержит нуклеотидную последовательность, которая не является комплементарной области-мишени в геноме бактериальных, архейных или дрожжевых клеток указанной популяции (т.е. несамонацеленный/скремблированный спейсер). В дополнительных аспектах контроль может представлять собой, например, популяцию дикого типа бактериальных, архейных, водорослевых или дрожжевых клеток или популяцию бактериальных, архейных, водорослевых или дрожжевых клеток, трансформированных гетерологичной конструкцией, содержащей массив CRISPR, который содержит последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме бактериальных, архейных, водорослевых или дрожжевых клеток указанной популяции, которая не расположена в непосредственной близости от мотива, примыкающего к протоспейсеру (PAM).As used herein, a control may be, for example, a population of bacterial, archaeal, algal, or yeast cells that have not been transformed with the heterologous nucleic acid construct of the present invention. In some embodiments, the control may be a wild-type population of bacterial, archaeal, algal, or yeast cells, or it may be a population of bacterial, archaeal, or yeast cells transformed with a heterologous construct containing a CRISPR array that contains a repeat-spacer-repeat sequence or at least at least one repeat-spacer sequence, wherein the spacer contains a nucleotide sequence that is not a complementary target region in the genome of the bacterial, archaeal, or yeast cells of said population (i.e., a non-self-targeted/scrambled spacer). In additional aspects, the control may be, for example, a population of wild-type bacterial, archaeal, algal, or yeast cells, or a population of bacterial, archaeal, algal, or yeast cells transformed with a heterologous construct containing a CRISPR array that contains a repeat-spacer-repeat sequence, or at least one repeat-spacer sequence, wherein the spacer contains a nucleotide sequence that is substantially complementary to a target region in the genome of said population of bacterial, archaeal, algal, or yeast cells that is not located in close proximity to the protospacer adjacent motif (PAM) .

Используемая в настоящем описании повторяющаяся последовательность относится, например, к любой повторяющейся последовательности локуса CRISPR дикого типа или повторяющейся последовательности синтетического массива CRISPR, которая отделена спейсерной последовательностью (например, последовательность повтор-спейсер или последовательность повтор-спейсер-повтор по изобретению). Повторяющаяся последовательность, используемая в настоящем изобретении, может быть любой известной или позже идентифицированной повторяющейся последовательностью локуса CRISPR. Соответственно, в некоторых вариантах осуществления последовательность повтор-спейсер или повторспейсер-повтор содержит повтор, который по существу идентичен (например, идентичен на по меньшей мере примерно 70% (например, идентичен на по меньшей мере примерно 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% и более)) повтору из массива CRISPR типа II дикого типа. В некоторых вариантах осуществления повторяющаяся последовательность на 100% идентична повтору из массива CRISPR типа I дикого типа, массива CRISPR типа II дикого типа, массива CRISPR типа III дикого типа, массива CRISPR типа IV дикого типа или массива CRISPR типа V дикого типа. В дополнительных вариантах осуществления повторяющаяся последовательность, исполь- 13 042506 зуемая в настоящем изобретении, может содержать нуклеотидную последовательность, включающую частичный повтор, который представляет собой фрагмент или часть последовательных нуклеотидов повторяющейся последовательности локуса CRISPR или синтетического массива CRISPR любой из сгРНК типа I, сгРНК типа II, сгРНК типа III, сгРНК типа IV или сгРНК типа V.As used herein, a repeat sequence refers to, for example, any wild-type CRISPR locus repeat sequence or a synthetic CRISPR array repeat sequence that is separated by a spacer sequence (e.g., repeat-spacer sequence or repeat-spacer-repeat sequence of the invention). The repeat sequence used in the present invention may be any known or later identified repeat sequence of the CRISPR locus. Accordingly, in some embodiments, the repeat-spacer or repeat-spacer-repeat sequence comprises a repeat that is substantially identical (e.g., at least about 70% identical (e.g., at least about 70, 71, 72, 73, 74 identical). , 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 % or more)) repeat from wild-type type II CRISPR array. In some embodiments, the repeat sequence is 100% identical to a repeat from a wild-type CRISPR type I array, a wild-type CRISPR type II array, a wild-type CRISPR type III array, a wild-type CRISPR type IV array, or a wild-type CRISPR type V array. In additional embodiments, the repeat sequence used in the present invention may comprise a nucleotide sequence comprising a partial repeat, which is a fragment or portion of consecutive nucleotides of the repeat sequence of the CRISPR locus or synthetic CRISPR array of any of type I sgRNA, type II sgRNA , type III ssRNA, type IV ssRNA, or type V ssRNA.

Используемый в настоящем описании термин массив CRISPR CRISPR-Cas системы типа I, типа II, типа III, типа IV или типа V относится к конструкции нуклеиновой кислоты, которая содержит в 5'-3' направлении последовательность повтор-спейсер-повтор или содержит в 5'-3' направлении по меньшей мере одну последовательность повтор-спейсер (например, примерно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 или 25 последовательностей повтор-спейсер и любой диапазон или количество в этом диапазоне). Когда в массиве CRISPR содержится более одного повтора-спейсера, спейсер предыдущей (5'-3') последовательности повтор-спейсер может быть связан с повтором последующего повтора-спейсера (например, спейсер первой последовательности повтор-спейсер связан с повтором второй последовательности повтор-спейсер). В некоторых вариантах осуществления массив CRISPR может содержать два повтора (или два частичных повтора), разделенных спейсером (например, последовательность повтор-спейсер-повтор).As used herein, the term CRISPR array CRISPR-Cas system type I, type II, type III, type IV, or type V refers to a nucleic acid construct that contains a repeat-spacer-repeat sequence in the 5'-3' direction or contains a 5 '-3' direction of at least one repeat-spacer sequence (e.g., about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 , 18, 19, 20, 21, 22, 23, 24, or 25 repeat-spacer sequences and any range or number within that range). When a CRISPR array contains more than one repeat-spacer, the spacer of the previous (5'-3') sequence repeat-spacer may be associated with the repeat of the subsequent repeat-spacer (e.g., the spacer of the first repeat-spacer sequence is associated with the repeat of the second repeat-spacer sequence ). In some embodiments, the CRISPR array may contain two repeats (or two partial repeats) separated by a spacer (eg, a repeat-spacer-repeat sequence).

Используемый в настоящем описании термин идентичность последовательности относится к степени, до которой две оптимально выровненные полинуклеотидные или пептидные последовательности являются инвариантными во всем окне выравнивания компонентов, например нуклеотидов или аминокислот. Идентичность можно легко рассчитать известными способами, включая без ограничения способы, которые описаны в Вычислительная молекулярная биология [Computational Molecular Biology] (Lesk, A.M., ed.), Oxford University Press, New York (1988); Биокомпьютинг: проекты в области информатики и генома [Biocomputing: Informatics and Genome Projects] (Smith, D.W., ed.), Academic Press, New York (1993); Компьютерный анализ данных последовательности, часть I [Computer Analysis of Sequence Data, Part I] (Griffin, A.M., Griffin, H.G., eds.) Humana Press, New Jersey (1994); Анализ последовательности в молекулярной биологии Sequence [Analysis in Molecular Biology] (von Heinje, G., ed.) Academic Press (1987); и Введение в анализ последовательностей [Sequence Analysis Primer] (Gribskov, M., Devereux, J., eds.), Stockton Press, New York (1991).As used herein, the term sequence identity refers to the degree to which two optimally aligned polynucleotide or peptide sequences are invariant across the window of component alignment, eg, nucleotides or amino acids. Identity can be easily calculated by known methods, including, without limitation, those described in Computational Molecular Biology [Computational Molecular Biology] (Lesk, A.M., ed.), Oxford University Press, New York (1988); Biocomputing: Informatics and Genome Projects (Smith, D.W., ed.), Academic Press, New York (1993); Computer Analysis of Sequence Data, Part I (Griffin, A.M., Griffin, H.G., eds.) Humana Press, New Jersey (1994); Sequence Analysis in Molecular Biology Sequence [Analysis in Molecular Biology] (von Heinje, G., ed.) Academic Press (1987); and Introduction to Sequence Analysis Primer (Gribskov, M., Devereux, J., eds.), Stockton Press, New York (1991).

Спейсерная последовательность, как используется в настоящем описании, представляет собой нуклеотидную последовательность, которая комплементарна ДНК-мишени (т.е. области-мишени в геноме или протоспейсперная последовательность), которая прилегает к последовательности мотива, примыкающего к протоспейсеру (PAM). Спейсерная последовательность может быть полностью комплементарной или по существу комплементарной (например, на по меньшей мере примерно 70% комплементарной (например, на примерно 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% и более)) ДНК-мишени. В типичных вариантах осуществления спейсерная последовательность имеет 100% комплементарность ДНК-мишени. В дополнительных вариантах осуществления комплементарность 3'-области спейсерной последовательности с ДНК-мишенью составляет 100%, но менее 100% с 5'-областью спейсера, и поэтому общая комплементарность спейсерной последовательности с ДНК-мишенью менее 100%. Так, например, первые 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 и т.п. нуклеотиды в 3'-области 20-нуклеотидной спейсерной последовательности (затравочной последовательности) могут быть комплементарными с ДНК-мишенью на 100%, в то время как оставшиеся нуклеотиды в 5'-области спейсерной последовательности являются по существу комплементарными (например, на по меньшей мере, примерно 70% комплементарными) ДНК-мишени. В некоторых вариантах осуществления первые 7-12 нуклеотидов спейсерной последовательности могут быть комплементарными с ДНК-мишенью на 100%, тогда как остальные нуклеотиды в 5'-области спейсерной последовательности являются по существу комплементарными (например, на по меньшей мере, примерно на 70% комплементарными) ДНК-мишени. В других вариантах осуществления первые 7-10 нуклеотидов спейсерной последовательности могут быть на 100% комплементарными с ДНК-мишенью, тогда как остальные нуклеотиды в 5'-области спейсерной последовательности являются по существу комплементарными (например, на по меньшей мере, примерно 70% комплементарными) ДНК-мишени. В типичных вариантах осуществления первые 7 нуклеотидов (внутри затравочной) спейсерной последовательности могут быть комплементарными с ДНК-мишенью на 100%, тогда как остальные нуклеотиды в 5'-области спейсерной последовательности являются по существу комплементарными (например, на по меньшей мере, примерно 70% комплементарными) ДНК-мишени.A spacer sequence, as used herein, is a nucleotide sequence that is complementary to a target DNA (ie, a target region in the genome or a protospacer sequence) that is adjacent to a protospacer adjacent motif (PAM) sequence. The spacer sequence may be fully complementary or substantially complementary (e.g., at least about 70% complementary (e.g., about 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% or more)) DNA targets. In typical embodiments, the spacer sequence has 100% complementarity to the target DNA. In additional embodiments, the complementarity of the 3' region of the spacer sequence with the target DNA is 100%, but less than 100% with the 5' region of the spacer, and therefore the total complementarity of the spacer sequence with the target DNA is less than 100%. So, for example, the first 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, etc. nucleotides in the 3' region of a 20 nucleotide spacer sequence (seed sequence) may be 100% complementary to the target DNA, while the remaining nucleotides in the 5' region of the spacer sequence are substantially complementary (e.g., at least , approximately 70% complementary) target DNA. In some embodiments, the first 7-12 nucleotides of the spacer sequence may be 100% complementary to the target DNA, while the remaining nucleotides in the 5' region of the spacer sequence are substantially complementary (e.g., at least about 70% complementary). ) target DNA. In other embodiments, the first 7-10 nucleotides of the spacer sequence may be 100% complementary to the target DNA, while the remaining nucleotides in the 5' region of the spacer sequence are substantially complementary (e.g., at least about 70% complementary) target DNA. In typical embodiments, the first 7 nucleotides (within the seed) of the spacer sequence may be 100% complementary with the target DNA, while the remaining nucleotides in the 5' region of the spacer sequence are substantially complementary (e.g., at least about 70% complementary). complementary) target DNA.

Используемый в настоящем описании термин ДНК-мишень, область-мишень или областьмишень в геноме относится к области генома в организме, которая является полностью комплементарной или по существу комплементарной (например, на по меньшей мере 70% комплементарной (например, на 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82%, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% и более)) спейсерной последовательности в последовательности повтор-спейсер или повторспейсер-повтор. В некоторых вариантах осуществления область-мишень может составлять в длину от примерно 10 до примерно 40 последовательных нуклеотидов, непосредственно примыкающих к последовательности PAM (последовательности PAM, расположенной непосредственно после 3'-областимишени) в геноме организма (например, CRISPR-Cas системы типа I и CRISPR-Cas типа II). В некоторыхAs used herein, the term DNA target, target region, or target region in the genome refers to a region of the genome in an organism that is fully complementary or substantially complementary (e.g., at least 70% complementary (e.g., 70, 71, 72 , 73, 74, 75, 76, 77, 78, 79, 80, 81, 82%, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% or more)) of a spacer sequence in a repeat-spacer or repeat-spacer-repeat sequence. In some embodiments, the target region may be from about 10 to about 40 consecutive nucleotides in length immediately adjacent to a PAM sequence (the PAM sequence located immediately after the 3' target region) in the genome of an organism (e.g., CRISPR-Cas systems type I and CRISPR-Cas type II). In some

- 14 042506 вариантах осуществления, например, в системах типа I PAM находится на противоположной стороне от протоспейсера (5'-конце). Для систем типа III PAM не известен. Макарова и др. описывают номенклатуру для всех классов, типов и подтипов CRISPR систем (Nature Reviews Microbiology, 13:722-736 (2015)).- 14 042506 embodiments, for example, in type I systems, the PAM is on the opposite side of the protospacer (5' end). For Type III systems, PAM is not known. Makarova et al. describe the nomenclature for all classes, types and subtypes of CRISPR systems (Nature Reviews Microbiology, 13:722-736 (2015)).

Структуры гидов и PAM описаны у R. Barrangou (Genome Biol., 16:247 (2015)).Guide and PAM structures are described in R. Barrangou (Genome Biol., 16:247 (2015)).

В некоторых вариантах осуществления область-мишень, используемая в настоящем изобретении, находится в пределах жизненно важного гена гена или нежизненно важного гена.In some embodiments, the target region used in the present invention is within a vital gene or a non-essential gene.

В типичных вариантах осуществления область-мишень может быть выбрана случайным образом или может быть выбрана специфически. В некоторых вариантах осуществления случайно выбранная область-мишень может быть выбрана из любых по меньшей мере 10 последовательных нуклеотидов (например, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 и т.п., и любого диапазона или значения в этом диапазоне), расположенных в непосредственной близости от PAM последовательности в геноме бактерий, архей, водорослей или дрожжей. В некоторых вариантах осуществления область-мишень может составлять от примерно 10 до примерно 20 последовательных нуклеотидов, от примерно 10 до примерно 30 последовательных нуклеотидов и/или от примерно 10 до примерно 40 последовательных нуклеотидов и т.п. или в любом диапазоне или при любом значении в этом диапазоне, расположенных в непосредственной близости от последовательности мотива, примыкающего к протоспейсеру (PAM), в геноме бактерий, архей, водорослей или дрожжей. В некоторых вариантах осуществления конкретный выбор области-мишени может включать выбор двух или более областей-мишеней, которые расположены друг от друга через от примерно каждых 100 нуклеотидов до примерно каждых 1000 нуклеотидов, от примерно каждых 100 нуклеотидов до примерно каждых 2000, от примерно каждых 100 нуклеотидов до примерно каждых 3000, от примерно каждых 100 нуклеотидов до примерно каждых 4000 и/или от примерно каждых 100 нуклеотидов до примерно каждых 5000 нуклеотидов и т.п. в геноме одной или нескольких бактерий, архей, водорослей или дрожжевых клеток. В конкретных вариантах осуществления конкретный выбор области-мишени содержит конкретный выбор области-мишени из гена, открытой рамки считывания, предполагаемой открытой рамки считывания или межгенной области, содержащей по меньшей мере от примерно 10 до примерно 40 последовательных нуклеотидов, непосредственно примыкающих к PAM последовательности в геноме бактерий, архей, водорослей или дрожжей.In exemplary embodiments, the target region may be randomly selected or may be specifically selected. In some embodiments, a randomly selected target region can be selected from any of at least 10 consecutive nucleotides (e.g., 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23 , 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48 , 49, 50, etc., and any range or value within this range) located in close proximity to a PAM sequence in the genome of bacteria, archaea, algae, or yeast. In some embodiments, the target region may be from about 10 to about 20 contiguous nucleotides, from about 10 to about 30 contiguous nucleotides, and/or from about 10 to about 40 contiguous nucleotides, and the like. or in any range or at any value within this range, located in close proximity to the protospacer adjacent motif (PAM) sequence in the genome of bacteria, archaea, algae or yeast. In some embodiments, a particular selection of a target region may include selecting two or more target regions that are spaced apart from each other by about every 100 nucleotides to about every 1000 nucleotides, from about every 100 nucleotides to about every 2000, from about every 100 nucleotides to about every 3000, from about every 100 nucleotides to about every 4000 and/or from about every 100 nucleotides to about every 5000 nucleotides, and the like. in the genome of one or more bacteria, archaea, algae, or yeast cells. In specific embodiments, the specific selection of a target region comprises a specific selection of a target region from a gene, an open reading frame, a putative open reading frame, or an intergenic region containing at least about 10 to about 40 contiguous nucleotides immediately adjacent to a PAM sequence in the genome. bacteria, archaea, algae or yeast.

Транс-активирующая CRISPR (tracr) нуклеиновая кислота или tracr нуклеиновая кислота, как используется в настоящем описании, относится к любой tracr РНК (или кодирующей ее ДНК). Tracr нуклеиновая кислота содержит в 5'-3' направлении нижний стебель, верхний стебель, выпетливание, центральную шпильку и концевые шпильки (см. Briner et al. (2014), Molecular Cell., 56(2):333-339). Трансактивирующая CRISPR (tracr) нуклеиновая кислота функционирует при гибридизации с повторяющейся частью зрелых или незрелых сгРНК, рекрутирует белок Cas9 к участку-мишени и может способствовать каталитической активности Cas9 путем индукции структурной перегруппировки. Функциональный состав молекул tracrРНК приведен выше. Последовательности tracrРНК специфичны для CRISPR-Cas системы и могут меняться. В настоящем изобретении можно использовать любую известную или позже идентифицированную нуклеиновую кислоту.A trans-activating CRISPR (tracr) nucleic acid or tracr nucleic acid as used herein refers to any tracr RNA (or DNA encoding it). The Tracr nucleic acid contains in the 5'-3' direction a lower stem, an upper stem, a bulge, a central hairpin, and terminal hairpins (see Briner et al. (2014), Molecular Cell., 56(2):333-339). A CRISPR transactivating (tracr) nucleic acid functions by hybridizing to a repetitive portion of mature or immature ssRNAs, recruits the Cas9 protein to the target site, and can promote Cas9 catalytic activity by inducing a structural rearrangement. The functional composition of tracrRNA molecules is given above. The tracrRNA sequences are specific to the CRISPR-Cas system and may vary. Any known or later identified nucleic acid can be used in the present invention.

Используемый в настоящем описании термин по существу идентичный или существенная идентичность в контексте двух молекул нуклеиновых кислот, нуклеотидных последовательностей или белковых последовательностей относится к двум или более последовательностям или подпоследовательностям, которые имеют по меньшей мере примерно 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 и/или 100% идентичности нуклеотидов или аминокислотных остатков при сравнении и выравнивании для максимального соответствия, измеренной при помощи одного из приведенных ниже алгоритмов сравнения последовательностей или путем визуального осмотра. В некоторых вариантах осуществления изобретения существенная идентичность имеется в области последовательностей, которая составляет по меньшей мере от примерно 50 остатков до примерно 150 остатков в длину. Таким образом, в некоторых вариантах осуществления изобретения существенная идентичность имеется в области последовательностей, которая составляет по меньшей мере от 3 до 15 (например, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 остатков в длину и т.п. или любое значение или любой диапазон этих значений), от по меньшей мере примерно 5 до примерно 30, от по меньшей мере примерно 10 до примерно 30, от по меньшей мере примерно 16 до примерно 30, от по меньшей мере 18 до примерно 25, по меньшей мере примерно 18, по меньшей мере примерно 22, по меньшей мере примерно 25, по меньшей мере примерно 30, по меньшей мере примерно 40, по меньшей мере примерно 50, примерно 60, примерно 70, примерно 80, примерно 90, примерно 100, примерно 110, примерно 120, примерно 130, примерно 140, примерно 150 или более остатков в длину и в любом указанном диапазоне. В типичных вариантах осуществления последовательности могут быть по существу идентичными в пределах по меньшей мере примерно 22 нуклеотидов. В некоторых конкретных вариантах осуществления последовательности являются по существу идентичными в пределах по меньшей мере примерно 150 остатков. В некоторых вариантах осуществления последовательности по изобретению могут быть идентичными на от примерно 70% до примерно 100% в пределах по меньшей мере от примерно 16 нуклеотидов до примерно 25 нуклеотидов. В некоторых вариантах осуществления последовательности по изобретению мо- 15 042506 гут быть идентичными на от примерно 75% до примерно 100% в пределах по меньшей мере от примерно 16 нуклеотидов до примерно 25 нуклеотидов. В некоторых вариантах осуществления последовательности по изобретению могут быть идентичными на от примерно 80% до примерно 100% в пределах по меньшей мере от примерно 16 нуклеотидов до примерно 25 нуклеотидов. В некоторых вариантах осуществления последовательности по изобретению могут быть идентичными на от примерно 80% до примерно 100% в пределах по меньшей мере от примерно 7 нуклеотидов до примерно 25 нуклеотидов. В некоторых вариантах осуществления последовательности по изобретению могут быть идентичными на примерно 70% в пределах по меньшей мере примерно 16 нуклеотидов. В других вариантах осуществления последовательности могут быть идентичными на примерно 85% в пределах примерно 22 нуклеотидов. В других вариантах осуществления последовательности могут быть идентичными на примерно 100% в пределах примерно 16 нуклеотидов. В другом варианте осуществления последовательности являются по существу идентичными по всей длине кодирующей области. Кроме того, в иллюстративных вариантах осуществления по существу идентичные нуклеотидные или полипептидные последовательности выполняют по существу одну и ту же функцию (например, функцию или активность сгРНК, tracr нуклеиновой кислоты, повторяющейся последовательности, нуклеазы Cas9 (никазы, распознавания и связывания ДНК, РНК и/или PAM), Cas3, Cas3', Cas3 или любого другого полинуклеотида или полипептида CRISPR-Cas).As used herein, the term substantially identical or substantial identity, in the context of two nucleic acid molecules, nucleotide sequences, or protein sequences, refers to two or more sequences or subsequences that are at least about 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 and/or 100% nucleotide or amino acid residue identity when compared and aligned for maximum match, as measured by one of the following sequence comparison algorithms or by visual inspection. In some embodiments of the invention, significant identity exists in a region of sequences that is at least about 50 residues to about 150 residues in length. Thus, in some embodiments of the invention, significant identity exists in a sequence range that is at least 3 to 15 (e.g., 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 , 15 residues in length, etc., or any value or any range of these values), from at least about 5 to about 30, from at least about 10 to about 30, from at least about 16 to about 30, at least about 18 to about 25, at least about 18, at least about 22, at least about 25, at least about 30, at least about 40, at least about 50, about 60, about 70 , about 80, about 90, about 100, about 110, about 120, about 130, about 140, about 150 or more residues in length and in any specified range. In typical embodiments, the sequences may be substantially identical within at least about 22 nucleotides. In some specific embodiments, the sequences are substantially identical within at least about 150 residues. In some embodiments, the sequences of the invention may be from about 70% to about 100% identical within at least about 16 nucleotides to about 25 nucleotides. In some embodiments, the sequences of the invention may be from about 75% to about 100% identical within the range of at least about 16 nucleotides to about 25 nucleotides. In some embodiments, the sequences of the invention may be from about 80% to about 100% identical within at least about 16 nucleotides to about 25 nucleotides. In some embodiments, the sequences of the invention may be from about 80% to about 100% identical within the range of at least about 7 nucleotides to about 25 nucleotides. In some embodiments, the sequences of the invention may be about 70% identical within at least about 16 nucleotides. In other embodiments, the sequences may be about 85% identical within about 22 nucleotides. In other embodiments, the sequences may be about 100% identical within about 16 nucleotides. In another embodiment, the sequences are substantially identical throughout the length of the coding region. In addition, in exemplary embodiments, substantially identical nucleotide or polypeptide sequences perform essentially the same function (e.g., function or activity of ssRNA, tracr nucleic acid, repeat sequence, Cas9 nuclease (nickase, recognition and binding of DNA, RNA, and/ or PAM), Cas3, Cas3', Cas3 or any other CRISPR-Cas polynucleotide or polypeptide).

При сравнении последовательностей, как правило, одна последовательность действует как референсная последовательность, с которой сравнивают тестовые последовательности. Когда используется алгоритм сравнения последовательностей, тестовые и референсные последовательности вводят в компьютер, при необходимости обозначают координаты подпоследовательности и задают параметры программы для алгоритма сравнения последовательностей. Затем, используя этот алгоритм сравнения последовательностей, вычисляют процентную идентичность тестовой последовательности(последовательностей) относительно референсной последовательности исходя из заданных параметров программы.When comparing sequences, typically one sequence acts as a reference sequence against which test sequences are compared. When a sequence comparison algorithm is used, test and reference sequences are entered into a computer, subsequence coordinates are designated if necessary, and program parameters for the sequence comparison algorithm are set. Then, using this sequence comparison algorithm, the percent identity of the test sequence(s) relative to the reference sequence is calculated based on the given program parameters.

Оптимальное выравнивание последовательностей, окно сравнения для выравнивания хорошо известны специалистам в данной области и может быть выполнено при помощи таких инструментов, как алгоритм локальной гомологии Смита и Уотермана, алгоритм выравнивания областей гомологии Нидлмана и Вунша, метода поиска подобий Пирсона и Липмана, а также необязательно при помощи реализации этих алгоритмов в виде компьютерных программ, таких как GAP, BESTFIT, FASTA и TFASTA, которые доступны как часть пакета GCG® Wisconsin Package® (Accelrys Inc., San Diego, CA). Доля идентичности для выровненных сегментов тестовой последовательности и референсной последовательности представляет собой количество идентичных компонентов, которые являются общими для двух выровненных последовательностей, деленное на общее количество компонентов в сегменте референсной последовательности, т.е. всей референсной последовательности или меньше определенной части референсной последовательности. Процентная идентификация последовательности представлена в виде доли идентичности, умноженной на 100. Сравнение одной или более полинуклеотидных последовательностей можно выполнять с полноразмерной полинуклеотидной последовательностью или ее частью или более длинной полинуклеотидной последовательностью. Для целей настоящего изобретения процентная идентичность также может быть определена при помощи программы BLASTX версии 2.0 для транслируемых нуклеотидных последовательностей и BLASTN версии 2.0 для полинуклеотидных последовательностей.Optimal sequence alignment, the comparison window for alignment is well known to those skilled in the art and can be performed using tools such as the Smith and Waterman local homology algorithm, the Needleman and Wunsch homology region alignment algorithm, the Pearson and Lipman similarity search method, and optionally help implement these algorithms in computer programs such as GAP, BESTFIT, FASTA, and TFASTA, which are available as part of the GCG® Wisconsin Package® (Accelrys Inc., San Diego, CA). The proportion of identity for aligned segments of a test sequence and a reference sequence is the number of identical components that are common to two aligned sequences divided by the total number of components in the segment of the reference sequence, i.e. the entire reference sequence or less than a certain part of the reference sequence. Percent sequence identification is expressed as fraction of identity multiplied by 100. Comparison of one or more polynucleotide sequences can be performed against the full length polynucleotide sequence or a portion thereof, or a longer polynucleotide sequence. For the purposes of the present invention, percent identity can also be determined using BLASTX version 2.0 for translated nucleotide sequences and BLASTN version 2.0 for polynucleotide sequences.

Программное обеспечение для выполнения BLAST-анализов находится в открытом доступе в Национальном центре биотехнологической информации. Этот алгоритм включает сначала идентификацию пар последовательностей, имеющих высокий показатель (HSP), путем идентификации коротких слов длиной W в запрашиваемой последовательности, которые либо совпадают либо удовлетворяют некоторому положительному пороговому значению T при выравнивании со словом той же длины в последовательности базы данных. Т называется порогом показателя сходства слов (Altschul et al., 1990). Эти начальные совпадения исходных слов действуют в качестве затравок для начала поиска более длинных HSP, содержащих их. Затем совпадения слов расширяют в обоих направлениях вдоль каждой последовательности до той степени, до которой можно увеличить совокупный показатель выравнивания. Совокупный показатель рассчитывают, используя для нуклеотидных последовательностей, параметры M (оценка вознаграждения для пары совпадающих остатков, всегда >0) и N (оценка штрафа за несовпадающие остатки, всегда <0). Для аминокислотных последовательностей для вычисления совокупного показателя используется оценочная матрица. Расширение совпадений слов в каждом направлении прекращается, когда совокупный показатель выравнивания уменьшается на величину X от своего максимально достигнутого значения, совокупный показатель сводится к нулю или падает ниже из-за накопления одного или более выравниваний остатков с отрицательной оценкой, или при достижения конца любой последовательности. Параметры алгоритма BLAST W, T и X определяют чувствительность и скорость выравнивания. В программе BLASTN (для нуклеотидных последовательностей) по умолчанию используется длина слова (W) 11, ожидание (E) 10, отсечение 100, M=5, N=4, а также сравнение обеих нитей. Для аминокислотных последовательностей в программе BLASTP по умолчанию используется длина слова (W) 3, ма- 16 042506 тематическое ожидание (E) 10 и оценочная матрица BLOSUM62 (см. Henikoff & Henikoff, Proc. Natl.Software for performing BLAST analyzes is publicly available at the National Center for Biotechnology Information. This algorithm involves first identifying high score sequence pairs (HSPs) by identifying short words of length W in the requested sequence that either match or satisfy some positive threshold T when aligned with a word of the same length in the database sequence. T is called the word similarity score threshold (Altschul et al., 1990). These initial matches of the original words act as seeds to start searching for longer HSPs containing them. The word hits are then expanded in both directions along each sequence to the extent that the overall alignment score can be increased. The cumulative score is calculated using, for nucleotide sequences, the parameters M (reward score for a pair of matching residues, always >0) and N (penalty score for mismatched residues, always <0). For amino acid sequences, a score matrix is used to calculate the cumulative score. The expansion of word hits in each direction stops when the cumulative alignment score decreases by X from its maximum achieved value, the cumulative score is reduced to zero or falls below due to the accumulation of one or more negative-scoring residual alignments, or when the end of any sequence is reached. The BLAST algorithm parameters W, T and X determine the sensitivity and speed of the alignment. The BLASTN program (for nucleotide sequences) defaults to word length (W) 11, expectation (E) 10, cutoff 100, M=5, N=4, and comparison of both strands. For amino acid sequences, the BLASTP program defaults to a word length (W) of 3, an expectation value (E) of 10, and a scoring matrix of BLOSUM62 (see Henikoff & Henikoff, Proc. Natl.

Acad. Sci., USA, 89:10915 (1989)).Acad. Sci., USA, 89:10915 (1989)).

Помимо вычисления процентной идентичности последовательностей, алгоритм BLAST также выполняет статистический анализ сходства между двумя последовательностями (см., например, Karlin & Altschul, Proc. Nat'l. Acad. Sci., USA, 90:5873-5787 (1993)). Одной из мер сходства, обеспечиваемой алгоритмом BLAST, является наименьшая сумма вероятностей (P(N)), которая указывает на вероятность, с которой совпадение двух нуклеотидных или аминокислотных последовательностей может происходить случайно. Например, тестовую последовательность нуклеиновой кислоты считают совпадающей с референсной последовательностью, если наименьшая сумма вероятностей при сравнении тестовой нуклеотидной последовательности с референсной нуклеотидной последовательностью составляет менее примерно от 0,1 до менее примерно 0,001. Таким образом, в некоторых вариантах осуществления изобретения наименьшая сумма вероятностей при сравнении тестовой нуклеотидной последовательности с референсной нуклеотидной последовательностью составляет менее примерно 0,001.In addition to calculating percent sequence identity, the BLAST algorithm also performs a statistical analysis of the similarity between two sequences (see, for example, Karlin & Altschul, Proc. Nat'l. Acad. Sci., USA, 90:5873-5787 (1993)). One measure of similarity provided by the BLAST algorithm is the smallest sum of probabilities (P(N)), which indicates the probability that two nucleotide or amino acid sequences can match by chance. For example, a test nucleic acid sequence is considered a match with a reference sequence if the smallest sum of probabilities when comparing the test nucleotide sequence with the reference nucleotide sequence is less than about 0.1 to less than about 0.001. Thus, in some embodiments of the invention, the smallest sum of probabilities when comparing a test nucleotide sequence with a reference nucleotide sequence is less than about 0.001.

Две нуклеотидные последовательности также можно считать по существу комплементарными, когда две последовательности гибридизуются друг с другом в жестких условиях. В некоторых типичных вариантах осуществления две нуклеотидные последовательности, которые по существу комплементарны, гибридизуются друг с другом в очень жестких условиях.Two nucleotide sequences can also be considered substantially complementary when the two sequences hybridize to each other under stringent conditions. In some exemplary embodiments, two nucleotide sequences that are substantially complementary hybridize to each other under very stringent conditions.

Жесткие условия гибридизации и жесткие условия промывки при гибридизации в контексте экспериментов по гибридизации нуклеиновой кислоты, такой как нозерн-гибридизация и саузернгибридизация, зависят от последовательности и различаются по различным параметрам окружающей среды. Подробное руководство по гибридизации нуклеиновых кислот можно найти у Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes, part I, chapter 2, Overview of principles of hybridization and the strategy of nucleic acid probe assays, Elsevier, New York (1993). Как правило, очень жесткие условия гибридизации и промывки выбирают таким образом, чтобы температура была на примерно 5°С ниже, чем температура плавления (Tm) для конкретной последовательности при определенной ионной силе и pH.Stringent hybridization conditions and stringent hybridization wash conditions in the context of nucleic acid hybridization experiments such as Northern hybridization and Southern hybridization are sequence dependent and differ in various environmental parameters. A detailed guide to nucleic acid hybridization can be found in Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes, part I, chapter 2, Overview of principles of hybridization and the strategy of nucleic acid probe assays, Elsevier, New York (1993 ). Typically, very stringent hybridization and washing conditions are chosen such that the temperature is about 5° C. lower than the melting point (T m ) for a particular sequence at a particular ionic strength and pH.

Tm представляет собой температуру (при определенной ионной силе и pH), при которой 50% последовательности-мишени гибридизуется с идеально подобранным зондом. Очень жесткие условия выбирают равными значению Tm для конкретного зонда. Пример жестких условий гибридизации для гибридизации комплементарных нуклеотидных последовательностей, которые имеют более 100 комплементарных остатков на фильтре в саузерн- или нозерн-блот анализе, составляет 50% формамида с 1 мг гепарина при 42°С, причем гибридизацию проводят в течение ночи. Примером очень жестких условий промывки является 0,15 М NaCl при 72°С в течение примерно 15 мин. Примером жестких условий промывки является промывка 0.2x SSC при 65°С в течение 15 мин (см. Sambrook, infra, описание SSC буфера). Зачастую перед промывкой в очень жестких условиях выполняют промывку в условиях низкой жесткости для удаления фонового сигнала зонда. Пример промывки в условиях средней жесткости для дуплекса, например, из более 100 нуклеотидов, составляет 1xSSC при 45°С в течение 15 мин. Пример промывки в условиях низкой жесткости для дуплекса, например, из более 100 нуклеотидов, составляет 4-6xSSC при 40°С в течение 15 мин. Для коротких зондов (например, от примерно 10 до 50 нуклеотидов) жесткие условия обычно включают концентрации солей менее примерно 1,0 М Na-иона, обычно примерно 0,01-1,0 М концентрации Na-ионов (или других солей) при pH 7,0- 8,3, и температура обычно составляет по меньшей мере примерно 30°С. Жесткие условия также могут быть достигнуты путем добавления дестабилизирующих агентов, таких как формамид. В общем случае отношение сигнал/шум, превышающий в 2 (или более) раз отношение, наблюдаемое для несвязанного зонда в конкретном анализе гибридизации, указывает на обнаружение специфической гибридизации. Нуклеотидные последовательности, которые не гибридизуются друг с другом в жестких условиях, по существу идентичны, если белки, которые они кодируют, являются по существу идентичными. Это возможно, например, когда копия нуклеотидной последовательности создается при использовании максимального количества вырожденных кодонов, допускаемого генетическим кодом. Tm is the temperature (at a given ionic strength and pH) at which 50% of the target sequence hybridizes to a perfectly matched probe. Very stringent conditions are chosen equal to the value of T m for a particular probe. An example of stringent hybridization conditions for hybridization of complementary nucleotide sequences that have more than 100 complementary filter residues in Southern or Northern blot analysis is 50% formamide with 1 mg heparin at 42°C, with hybridization carried out overnight. An example of very stringent washing conditions is 0.15 M NaCl at 72° C. for about 15 minutes. An example of stringent washing conditions is washing with 0.2x SSC at 65° C. for 15 min (see Sambrook, infra, description of SSC buffer). Often, before washing under very severe conditions, a wash under conditions of low severity is performed to remove the background signal of the probe. An example of a medium stringency wash for a duplex of, for example, over 100 nucleotides is 1xSSC at 45°C for 15 minutes. An example of a low stringency wash for a duplex of eg over 100 nucleotides is 4-6xSSC at 40°C for 15 minutes. For short probes (eg, about 10 to 50 nucleotides), stringent conditions typically include salt concentrations of less than about 1.0 M Na ion, typically about 0.01 to 1.0 M Na ions (or other salts) at pH 7.0-8.3, and the temperature is usually at least about 30°C. Stringent conditions can also be achieved by adding destabilizing agents such as formamide. In general, a signal-to-noise ratio greater than 2 (or more) times that observed for an unbound probe in a particular hybridization assay indicates the detection of specific hybridization. Nucleotide sequences that do not hybridize to each other under stringent conditions are substantially identical if the proteins they encode are substantially identical. This is possible, for example, when a copy of the nucleotide sequence is created using the maximum number of degenerate codons allowed by the genetic code.

Ниже приведены примеры наборов условий гибридизации/промывки, которые могут быть использованы для клонирования гомологичных нуклеотидных последовательностей, которые по существу идентичны референсным нуклеотидным последовательностям по изобретению. В одном из вариантов осуществления референсная нуклеотидная последовательность гибридизуется с тестовой нуклеотидной последовательностью в 7% додецилсульфате натрия (SDS), 0,5 М NaPO4, 1 мМ ЭДТА при 50°С с промывкой в 2x SSC, 0,1% SDS при 50°С. В другом варианте референсная нуклеотидная последовательность гибридизуется с тестовой нуклеотидной последовательностью в 7% додецилсульфате натрия (SDS), 0,5 М NaPO4, 1 мМ ЭДТА при 50°С с промывкой в 1x SSC, 0,1% SDS при 50°С или в 7% додецилсульфате натрия (SDS), 0,5 М NaPO4, 1 мМ ЭДТА при 50°С с промывкой в 0. 5x SSC, 0,1% SDS при 50°С. В другом варианте осуществления референсная нуклеотидная последовательность гибридизуется с тестовой нуклеотидной последовательностью в 7% додецилсульфате натрия (SDS), 0,5 М NaPO4, 1 мМ ЭДТА при 50°С с промывкой в 0.1x SSC, 0.1% SDS при 50°С или в 7% додецилсульфате натрия (SDS),The following are examples of hybridization/wash condition sets that can be used to clone homologous nucleotide sequences that are substantially identical to the reference nucleotide sequences of the invention. In one embodiment, a reference nucleotide sequence is hybridized to a test nucleotide sequence in 7% sodium dodecyl sulfate (SDS), 0.5 M NaPO 4 , 1 mM EDTA at 50°C with a wash in 2x SSC, 0.1% SDS at 50° WITH. Alternatively, the reference nucleotide sequence is hybridized to a test nucleotide sequence in 7% sodium dodecyl sulfate (SDS), 0.5 M NaPO 4 , 1 mM EDTA at 50° C. with a wash in 1x SSC, 0.1% SDS at 50° C. or in 7% sodium dodecyl sulfate (SDS), 0.5 M NaPO 4 , 1 mM EDTA at 50°C with a wash in 0.5x SSC, 0.1% SDS at 50°C. In another embodiment, the reference nucleotide sequence is hybridized to a test nucleotide sequence in 7% sodium dodecyl sulfate (SDS), 0.5 M NaPO 4 , 1 mM EDTA at 50° C. with a wash in 0.1x SSC, 0.1% SDS at 50° C. or in 7% sodium dodecyl sulfate (SDS),

- 17 042506- 17 042506

0,5 М NaPO4, 1 мМ ЭДТА при 50°С с промывкой в 0.1х SSC, 0.1% SDS при 65°С.0.5 M NaPO 4 , 1 mM EDTA at 50°C with washing in 0.1x SSC, 0.1% SDS at 65°C.

Любая нуклеотидная последовательность и/или гетерологичная конструкция нуклеиновой кислоты по настоящему изобретению может быть оптимизированы по кодонам для экспрессии в любых представляющих интерес видах. Оптимизация по кодонам хорошо известна в данной области и включает модификацию нуклеотидной последовательности для смещения в использовании кодонов при помощи таблиц использования кодонов для конкретных видов. Таблицы использования кодонов генерируются на основе анализа последовательностей генов с самой высокой степенью экспрессии для представляющих интерес видов. Если нуклеотидные последовательности должны экспрессироваться в ядре, таблицы использования кодонов генерируются на основе анализа последовательностей ядерных генов с самой высокой степенью экспрессии для представляющих интерес видов. Модификации нуклеотидных последовательностей определяют путем сравнения таблицы использования кодонов для конкретного вида с кодонами, присутствующими в нативных полинуклеотидных последовательностях. Как понятно из уровня техники, оптимизация кодонов нуклеотидной последовательности приводит к получению нуклеотидной последовательности, имеющей менее 100% идентичности (например, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% и т.п.) с нативной нуклеотидной последовательностью, но которая по-прежнему кодирует полипептид, имеющий ту же функцию, что и у полипептида, кодируемого исходной нативной нуклеотидной последовательностью. Таким образом, в типичных вариантах осуществления изобретения нуклеотидная последовательность и/или гетерологичная конструкция нуклеиновой кислоты по настоящему изобретению может быть оптимизирована по кодонам для экспрессии в конкретных представляющих интерес видах.Any nucleotide sequence and/or heterologous nucleic acid construct of the present invention can be codon optimized for expression in any species of interest. Codon optimization is well known in the art and involves modifying a nucleotide sequence to bias codon usage using species-specific codon usage tables. Codon usage tables are generated based on sequence analysis of the highest expressed genes for the species of interest. If nucleotide sequences are to be expressed in the nucleus, codon usage tables are generated based on analysis of the highest expressed nuclear gene sequences for the species of interest. Nucleotide sequence modifications are determined by comparing the species-specific codon usage table with codons present in native polynucleotide sequences. As is understood in the art, codon optimization of a nucleotide sequence results in a nucleotide sequence having less than 100% identity (e.g., 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99%, etc.) with a native nucleotide sequence, but which is still encodes a polypeptide having the same function as the polypeptide encoded by the original native nucleotide sequence. Thus, in exemplary embodiments of the invention, the nucleotide sequence and/or heterologous nucleic acid construct of the present invention can be codon-optimized for expression in particular species of interest.

В некоторых вариантах осуществления молекулы гетерологичных или рекомбинантных нуклеиновых кислот, нуклеотидные последовательности и/или полипептиды по изобретению являются выделенными. Выделенная молекула нуклеиновой кислоты, выделенная нуклеотидная последовательность или выделенный полипептид представляет собой молекулу нуклеиновой кислоты, нуклеотидную последовательность или полипептид, который в результате вмешательства человека существует отдельно от его родной среды и, следовательно, не является продуктом природы.In some embodiments, heterologous or recombinant nucleic acid molecules, nucleotide sequences and/or polypeptides of the invention are isolated. An isolated nucleic acid molecule, an isolated nucleotide sequence, or an isolated polypeptide is a nucleic acid molecule, nucleotide sequence, or polypeptide that, as a result of human intervention, exists separately from its native environment and, therefore, is not a product of nature.

Выделенная молекула нуклеиновой кислоты, нуклеотидная последовательность или полипептид могут существовать в очищенной форме, которая по меньшей мере частично отделена от по меньшей мере некоторых других компонентов встречающегося в природе организма или вируса, например клеточных или вирусных структурных компонентов или других полипептидов или нуклеиновых кислот, которые обычно связаны с этим полинуклеотидом. В типичных вариантах осуществления выделенная молекула нуклеиновой кислоты, чистота выделенной нуклеотидной последовательности и/или выделенного полипептида составляет по меньшей мере примерно 1, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 95% или более.An isolated nucleic acid molecule, nucleotide sequence, or polypeptide may exist in a purified form that is at least partially separated from at least some other components of a naturally occurring organism or virus, such as cellular or viral building blocks or other polypeptides or nucleic acids that are normally associated with this polynucleotide. In typical embodiments, the isolated nucleic acid molecule, the purity of the isolated nucleotide sequence and/or the isolated polypeptide is at least about 1, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 95% or greater.

В других вариантах осуществления выделенная молекула нуклеиновой кислоты, нуклеотидная последовательность или полипептид может существовать в неприродной среде, такой как, например, рекомбинантная клетка-хозяин. Так, например, в отношении нуклеотидных последовательностей термин выделенный означает, что нуклеотидная последовательность отделена от хромосомы и/или клетки, в которой она встречается в естественных условиях. Полинуклеотид также является выделенным, если он был отделен от хромосомы и/или клетки, в которой он встречается в естественных условиях и затем вставлен в генетический контекст, хромосому и/или клетку, в которой он не встречается в естественных условиях (например, другую клетку-хозяина, разные регуляторные последовательности и/или другое положение в геноме, отличающегося от положения в естественных условиях). Соответственно гетерологичные конструкции нуклеиновых кислот, нуклеотидные последовательности и кодированные ими полипептиды выделены при участии человека в том смысле, что они существуют отдельно от их нативной среды обитания и, следовательно, не являются продуктами природы, однако в некоторых вариантах осуществления они могут быть введены и существовать в рекомбинантной клетке-хозяине.In other embodiments, the isolated nucleic acid molecule, nucleotide sequence, or polypeptide may exist in a non-natural environment, such as, for example, a recombinant host cell. Thus, for example, in relation to nucleotide sequences, the term isolated means that the nucleotide sequence is separated from the chromosome and/or cell in which it occurs naturally. A polynucleotide is also isolated if it has been separated from the chromosome and/or cell in which it occurs naturally and then inserted into a genetic context, chromosome and/or cell in which it does not occur naturally (for example, another cell- host, different regulatory sequences, and/or different position in the genome from the natural position). Accordingly, heterologous nucleic acid constructs, nucleotide sequences, and the polypeptides they encode are human-derived in the sense that they exist apart from their native habitat and therefore are not products of nature, however, in some embodiments, they can be introduced and exist in recombinant host cell.

В некоторых вариантах осуществления гетерологичные или рекомбинантные конструкции нуклеиновых кислот по изобретению являются синтетическими. Синтетическая молекула нуклеиновой кислоты, синтетическая нуклеотидная последовательность или синтетический полипептид представляет собой молекулу нуклеиновой кислоты, нуклеотидную последовательность или полипептид, который не встречается в природе, но создается руками человека и, следовательно, не является продуктом природы.In some embodiments, the heterologous or recombinant nucleic acid constructs of the invention are synthetic. A synthetic nucleic acid molecule, synthetic nucleotide sequence, or synthetic polypeptide is a nucleic acid molecule, nucleotide sequence, or polypeptide that does not occur in nature but is man-made and therefore is not a product of nature.

В любом из раскрытых в настоящем описании вариантов осуществления нуклеотидные последовательности и/или конструкции гетерологичных нуклеиновых кислот по изобретению могут быть функционально связаны с различными промоторами и другими регуляторными элементами для экспрессии в различных клетках организмов. Таким образом, в типичных вариантах осуществления конструкция нуклеиновой кислоты по настоящему изобретению может дополнительно содержать один или более промоторов, функционально связанных с одной или более нуклеотидными последовательностями.In any of the embodiments disclosed herein, the nucleotide sequences and/or heterologous nucleic acid constructs of the invention may be operably linked to various promoters and other regulatory elements for expression in various cells of organisms. Thus, in exemplary embodiments, the nucleic acid construct of the present invention may further comprise one or more promoters operably linked to one or more nucleotide sequences.

Под функционально связанным или функционально ассоциированным, как используется в настоящем описании, подразумевается, что указанные элементы функционально связаны друг с другом, а также обычно связаны физически. Таким образом, термин функционально связанный или функционально ассоциированный, как используется в настоящем описании, относится к нуклеотидным последоBy operably linked or operably associated, as used herein, is meant that these elements are operably linked to one another, and also typically physically linked. Thus, the term operably linked or operably associated, as used herein, refers to nucleotide sequences

- 18 042506 вательностям в одной молекуле нуклеиновой кислоты, которые функционально связаны. Таким образом, первая нуклеотидная последовательность, которая функционально связана со второй нуклеотидной последовательностью, означает ситуацию, когда первая нуклеотидная последовательность помещена в функциональные отношения со второй нуклеотидной последовательностью. Например, промотор функционально связан с нуклеотидной последовательностью, если промотор воздействует на транскрипцию или экспрессию указанной нуклеотидной последовательности. Специалистам в данной области техники будет понятно, что регуляторные последовательности (например, промотор) не обязательно должны быть смежными с нуклеотидной последовательностью, с которой они функционально связаны, при условии, что эти регуляторные последовательности функционируют, чтобы управлять ее экспрессией. Так, например, между промотором и нуклеотидной последовательностью могут находиться промежуточные нетранслируемые, но транскрибируемые последовательности, и промотор при этом можно считать функционально связанным с нуклеотидной последовательностью.- 18 042506 values in one nucleic acid molecule that are functionally linked. Thus, a first nucleotide sequence that is operably linked to a second nucleotide sequence means the situation where the first nucleotide sequence is placed in a functional relationship with the second nucleotide sequence. For example, a promoter is operably linked to a nucleotide sequence if the promoter affects the transcription or expression of said nucleotide sequence. Those skilled in the art will appreciate that regulatory sequences (eg, a promoter) need not be contiguous with the nucleotide sequence to which they are operably linked, as long as those regulatory sequences function to direct its expression. For example, between the promoter and the nucleotide sequence there may be intermediate untranslated but transcribed sequences, and the promoter can be considered to be operably linked to the nucleotide sequence.

Промотор представляет собой нуклеотидную последовательность, которая контролирует или регулирует транскрипцию нуклеотидной последовательности (т.е. кодирующей последовательности), которая функционально связана с промотором. Кодирующая последовательность может кодировать полипептид и/или функциональную РНК. Как правило, промотор относится к нуклеотидной последовательности, которая содержит сайт связывания для РНК-полимеразы II и управляет инициацией транскрипции. Как правило, промоторы находятся на 5'-конце или выше относительно начала кодирующей области соответствующей кодирующей последовательности. Область промотора может содержать другие элементы, которые функционируют как регуляторы экспрессии генов. Они включают консенсусную последовательность ТАТА-бокс и часто консенсусную последовательность СААТ-бокс (Breathnach and Chambon, (1981), Annu. Rev. Biochem., 50: 349). В растениях СААТ-бокс может быть заменен AGGA-боксом (Messing et al. (1983), in Genetic Engineering of Plants, T. Kosuge, C. Meredith and A. Hollaender (eds.), Plenum Press, p. 211-227).A promoter is a nucleotide sequence that controls or regulates the transcription of a nucleotide sequence (ie, a coding sequence) that is operably linked to a promoter. The coding sequence may encode a polypeptide and/or a functional RNA. Typically, a promoter refers to a nucleotide sequence that contains a binding site for RNA polymerase II and controls the initiation of transcription. Generally, promoters are located 5' or upstream of the start of the coding region of the respective coding sequence. The promoter region may contain other elements that function as regulators of gene expression. These include the TATA-box consensus sequence and often the CAAT-box consensus sequence (Breathnach and Chambon, (1981) Annu. Rev. Biochem., 50:349). In plants, the CAAT box can be replaced by an AGGA box (Messing et al. (1983), in Genetic Engineering of Plants, T. Kosuge, C. Meredith and A. Hollaender (eds.), Plenum Press, p. 211-227 ).

Промоторы могут включать, например, конститутивные, индуцируемые, временно регулируемые, регулируемые в процессе развития, химически регулируемые, тканепредпочтительные и/или тканеспецифические промоторы, которые используются при создании конструкций гетерологичных нуклеиновых кислот, т.е. химерных генов или химерных полинуклеотидов. Эти различные типы промоторов известны в данной области техники.Promoters may include, for example, constitutive, inducible, transiently regulated, developmentally regulated, chemically regulated, tissue-preferred and/or tissue-specific promoters that are used in constructing heterologous nucleic acid constructs, i.e. chimeric genes; or chimeric polynucleotides. These various types of promoters are known in the art.

Выбор промотора будет зависеть от временных и пространственных требований к экспрессии, а также от клетки-хозяина, которую нужно трансформировать. Промоторы для многих разных организмов хорошо известны в данной области. Основываясь на обширных знаниях, представленных в данной области, для конкретного представляющего интерес организма-хозяина можно выбрать подходящий промотор. Так, например, большое количество сведении имеется о промоторах, расположенных выше в высокой степени конститутивно экспрессируемых генов в модельных организмах, и такие сведения являются легко доступными и при необходимости могут использоваться применительно к другим системам.The choice of promoter will depend on the temporal and spatial requirements for expression as well as the host cell to be transformed. Promoters for many different organisms are well known in the art. Based on the extensive knowledge in the art, an appropriate promoter can be selected for a particular host organism of interest. Thus, for example, a great deal of knowledge is available about promoters upstream of highly constitutively expressed genes in model organisms, and such knowledge is readily available and can be applied to other systems if desired.

В некоторых вариантах осуществления конструкция нуклеиновой кислоты по изобретению может представлять собой экспрессионную кассету или может быть включена в экспрессионную кассету. Используемый в настоящем описании термин экспрессионная кассета означает конструкцию гетерологичной нуклеиновой кислоты, содержащую представляющую интерес нуклеотидную последовательность (например, конструкции нуклеиновых кислот по изобретению (например, конструкцию синтетической tracr нуклеиновой кислоты, конструкцию синтетической нуклеиновой кислоты CRISPR, синтетический массив CRISPR, конструкцию химерной нуклеиновой кислоты, нуклеотидную последовательность, кодирующую представляющий интерес полипептид, полипептид типа I, полипептид типа II, полипептид типа III, полипептид типа IV и/или полипептид типа V)), где указанная нуклеотидная последовательность функционально связана с по меньшей мере, регуляторной последовательностью (например, промотором). Таким образом, некоторые аспекты изобретения обеспечивают экспрессионные кассеты, предназначенные для экспрессии последовательностей нуклеотидов по изобретению.In some embodiments, a nucleic acid construct of the invention may be an expression cassette or may be included in an expression cassette. As used herein, the term expression cassette means a heterologous nucleic acid construct comprising a nucleotide sequence of interest (e.g., nucleic acid constructs of the invention (e.g., synthetic tracr nucleic acid construct, CRISPR synthetic nucleic acid construct, CRISPR synthetic array, chimeric nucleic acid construct, a nucleotide sequence encoding a polypeptide of interest, a type I polypeptide, a type II polypeptide, a type III polypeptide, a type IV polypeptide, and/or a type V polypeptide)) wherein said nucleotide sequence is operably linked to at least a regulatory sequence (e.g., a promoter) . Thus, certain aspects of the invention provide expression cassettes for expressing the nucleotide sequences of the invention.

Экспрессионная кассета, содержащая представляющую интерес нуклеотидную последовательность, может быть химерной, что означает, что по меньшей мере один из ее компонентов является гетерологичным по отношению по меньшей мере к одному из других ее компонентов. Экспрессионная кассета также может быть такой, которая встречается в природе, но была получена в рекомбинантной форме, пригодной для гетерологичной экспрессии.The expression cassette containing the nucleotide sequence of interest may be chimeric, meaning that at least one of its components is heterologous with respect to at least one of its other components. The expression cassette can also be one that occurs naturally but has been made in a recombinant form suitable for heterologous expression.

Экспрессионная кассета также может необязательно включать область транскрипции и/или терминации трансляции (т.е. область терминации), которая является функциональной в выбранной клеткехозяине. Различные терминаторы транскрипции доступны для использования в экспрессионных кассетах и отвечают за терминацию транскрипции за пределами представляющей интерес гетерологичной нуклеотидной последовательности и правильное полиаденилирование мРНК. Область терминации может быть нативной для области инициации транскрипции, может быть нативной для представляющей интерес функционально связанной нуклеотидной последовательности, может быть нативной для клетки-хозяина или может быть получена из другого источника (т.е. чужеродной или гетерологичной по отношению к промотору, представляющей интерес нуклеотидной последовательности, хозяину или любой их комбиThe expression cassette may also optionally include a transcription and/or translation termination region (ie, a termination region) that is functional in the selected host cell. Various transcription terminators are available for use in expression cassettes and are responsible for terminating transcription beyond the heterologous nucleotide sequence of interest and correct mRNA polyadenylation. The termination region may be native to the transcriptional initiation region, may be native to the operably linked nucleotide sequence of interest, may be native to the host cell, or may be derived from another source (i.e., foreign or heterologous to the promoter of interest). nucleotide sequence, host, or any combination thereof

- 19 042506 нации).- 19 042506 nation).

Экспрессионная кассета также может включать нуклеотидную последовательность для селективного маркера, который может быть использован для отбора трансформированной клетки-хозяина. Используемый в настоящем описании термин селективный маркер означает нуклеотидную последовательность, которая при экспрессии придает экспрессирующий маркер клетке-хозяину конкретный фенотип и, таким образом, позволяет отличать такие трансформированные клетки от тех, которые не имеют маркера. Такая нуклеотидная последовательность может кодировать либо селективный, либо экранируемый маркер в зависимости от того, представляет ли маркер признак, который может быть выбран химическими средствами, например, при помощи селективного агента (например, антибиотика и т.п.), или этот маркер является просто признаком, который можно идентифицировать посредством наблюдения или тестирования, например, путем скрининга (например, флуоресценции). Конечно, многие примеры подходящих селективных маркеров известны в данной области и могут быть использованы в приведенных в настоящем описании экспрессионных кассетах.The expression cassette may also include a nucleotide sequence for a selectable marker that can be used to select a transformed host cell. As used herein, the term selective marker means a nucleotide sequence which, when expressed, confers a particular phenotype on the host cell expressing the marker and thus distinguishes such transformed cells from those that do not have the marker. Such a nucleotide sequence may encode either a selectable or a shieldable marker, depending on whether the marker represents a trait that can be selected by chemical means, such as with a selective agent (eg, an antibiotic, etc.), or whether the marker is simply a feature that can be identified through observation or testing, such as by screening (eg, fluorescence). Of course, many examples of suitable selectable markers are known in the art and can be used in the expression cassettes described herein.

В дополнение к экспрессионным кассетам молекулы нуклеиновой кислоты и нуклеотидные последовательности, раскрытые в настоящем описании, могут быть использованы в отношении векторов. Термин вектор относится к композиции для переноса, доставки или введения нуклеиновой кислоты (или нуклеиновых кислот) в клетку. Вектор содержит молекулу нуклеиновой кислоты, содержащую нуклеотидную последовательность (последовательности), которая должна быть передана, доставлена или введена. Векторы, предназначенные для использования при трансформации организмов-хозяев, хорошо известны в данной области. Неограничивающие примеры общих классов векторов включают без ограничения вирусный вектор, плазмидный вектор, фаговый вектор, фагемидный вектор, космидный вектор, фосмидный вектор, бактериофаг, искусственную хромосому или бинарный вектор Agrobacterium в виде двухнитевой или однонитевой линейной или кольцевой формы, которая может быть или может не быть самостоятельно трансмиссивной или мобилизуемой. Вектор, определенный в настоящем описании, может трансформировать прокариотического или эукариотического хозяина либо путем интеграции в клеточный геном, либо путем внехромосомного существования (например, в виде автономно реплицируемой плазмиды с точкой начала репликации). Дополнительно включаются челночные векторы, под которыми подразумевается носитель ДНК, способный естественным образом или благодаря созданной структуре к репликации в двух разных организмах-хозяевах, которые могут быть выбраны из актиномицетов и родственных видов, бактерий и эукариот (например, клеток высших растений, млекопитающих, дрожжей или грибов). В некоторых типичных вариантах осуществления нуклеиновая кислота в векторе находится под контролем и функционально связана с соответствующим промотором или другими регуляторными элементами для транскрипции в клетке-хозяине. Вектор может быть бифункциональным экспрессионным вектором, который функционирует в нескольких хозяевах. В случае геномной ДНК он может содержать свой собственный промотор или другие регуляторные элементы, а в случае кДНК он может находиться под контролем соответствующего промотора или других регуляторных элементов для экспрессии в клетке-хозяине. Соответственно молекулы нуклеиновой кислоты по настоящему изобретению и/или экспрессионные кассеты могут быть включены в векторы, как описано здесь и как известно в данной области.In addition to expression cassettes, the nucleic acid molecules and nucleotide sequences disclosed herein can be used in relation to vectors. The term vector refers to a composition for transferring, delivering, or introducing a nucleic acid (or nucleic acids) into a cell. The vector contains a nucleic acid molecule containing the nucleotide sequence(s) to be transferred, delivered or administered. Vectors for use in the transformation of host organisms are well known in the art. Non-limiting examples of general classes of vectors include, without limitation, a viral vector, a plasmid vector, a phage vector, a phagemid vector, a cosmid vector, a fosmid vector, a bacteriophage, an artificial chromosome, or an Agrobacterium binary vector in a double-stranded or single-stranded linear or circular form, which may or may not be self-transmissible or mobilizable. The vector defined herein can transform a prokaryotic or eukaryotic host, either by integration into the cellular genome or by extrachromosomal existence (eg, as an autonomously replicating plasmid with an origin of replication). Shuttle vectors are also included, by which is meant a DNA carrier capable of replicating naturally or by engineered structure in two different host organisms, which may be selected from actinomycetes and related species, bacteria and eukaryotes (e.g., cells of higher plants, mammals, yeasts). or mushrooms). In some exemplary embodiments, the implementation of the nucleic acid in the vector is controlled and operably linked to the appropriate promoter or other regulatory elements for transcription in the host cell. The vector may be a bifunctional expression vector that functions in multiple hosts. In the case of genomic DNA, it may contain its own promoter or other regulatory elements, and in the case of cDNA, it may be under the control of an appropriate promoter or other regulatory elements for expression in the host cell. Accordingly, the nucleic acid molecules of the present invention and/or expression cassettes can be incorporated into vectors as described herein and as known in the art.

Введение, вводить, введенный (и их грамматические варианты) в контексте представляющего интерес полинуклеотида означают презентацию представляющего интерес полинуклеотида в организмехозяине или клетке указанного организма (например, клетке-хозяине) таким образом, что полинуклеотид получает доступ к внутренней части клетки. При введении более одного полинуклеотида эти полинуклеотиды могут быть собраны в виде части одной полинуклеотидной конструкции или конструкции нуклеиновой кислоты, или в виде отдельных полинуклеотидных конструкций или конструкций нуклеиновых кислот и могут быть расположены на одних и тех же или разных экспрессионных конструкциях или векторах для трансформации. Соответственно эти полинуклеотиды могут быть введены в клетки одним событием трансформации, отдельными событиями трансформации/трансфекции или, например, они могут быть включены в организм с помощью обычных протоколов размножения. Таким образом, в некоторых аспектах одна или более конструкций нуклеиновых кислот по настоящему изобретению могут быть введены в организм-хозяин или клетку указанного организма-хозяина по отдельности или в комбинации. В контексте популяции клеток введение означает контактирование популяции с конструкциями гетерологичных нуклеиновых кислот по изобретению в условиях, когда конструкции гетерологичных нуклеиновых кислот по изобретению получают доступ к внутренней части одной или более клеток популяции, тем самым трансформируя эту одну или более клеток популяции.Introduction, introduce, introduced (and their grammatical variants) in the context of a polynucleotide of interest means the presentation of a polynucleotide of interest in a host organism or a cell of said organism (for example, a host cell) in such a way that the polynucleotide gains access to the interior of the cell. When more than one polynucleotide is introduced, the polynucleotides may be assembled as part of a single polynucleotide construct or nucleic acid construct, or as separate polynucleotide constructs or nucleic acid constructs, and may be located on the same or different expression constructs or transformation vectors. Accordingly, these polynucleotides can be introduced into cells by a single transformation event, by separate transformation/transfection events, or, for example, they can be incorporated into the body using conventional propagation protocols. Thus, in some aspects, one or more nucleic acid constructs of the present invention may be introduced into a host organism or a cell of said host organism, either alone or in combination. In the context of a cell population, administration means contacting the population with the heterologous nucleic acid constructs of the invention under conditions where the heterologous nucleic acid constructs of the invention gain access to the interior of one or more cells in the population, thereby transforming that one or more cells in the population.

Используемый в настоящем описании термин трансформация или трансфекция относится к введению в клетку гетерологичной нуклеиновой кислоты. Трансформация клетки может быть стабильной или временной. Таким образом, в некоторых вариантах осуществления клетку-хозяин или организмхозяин трансформируют конструкцией нуклеиновой кислоты по изобретению стабильно. В других вариантах осуществления клетку-хозяин или организм-хозяин трансформируют конструкцией нуклеиновой кислоты по изобретению временно. Таким образом, в типичных вариантах осуществления конструкция гетерологичной нуклеиновой кислоты по изобретению может вводиться в клетку стабильно и/или вре- 20 042506 менно.As used herein, the term transformation or transfection refers to the introduction of a heterologous nucleic acid into a cell. Cell transformation can be permanent or temporary. Thus, in some embodiments, the host cell or organism is transformed with the nucleic acid construct of the invention in a stable manner. In other embodiments, a host cell or organism is transiently transformed with a nucleic acid construct of the invention. Thus, in exemplary embodiments, the heterologous nucleic acid construct of the invention may be introduced into a cell stably and/or transiently.

Временная трансформация в контексте полинуклеотида означает, что полинуклеотид вводится в клетку и не интегрируется в геном клетки.Temporal transformation in the context of a polynucleotide means that the polynucleotide is introduced into a cell and does not integrate into the cell's genome.

Под стабильным введением или стабильно введенным в контексте полинуклеотида следует понимать, что введенный полинуклеотид стабильно включается в геном клетки и, таким образом, клетка стабильно трансформируется полинуклеотидом.By stable introduction or stably introduced in the context of a polynucleotide, it is to be understood that the introduced polynucleotide is stably incorporated into the genome of the cell and thus the cell is stably transformed by the polynucleotide.

Стабильная трансформация или стабильно трансформированный, как используется в настоящем описании, означает, что конструкция нуклеиновой кислоты вводится в клетку и интегрируется в геном клетки. Таким образом, интегрированная конструкция нуклеиновой кислоты способна быть унаследованной потомством, в частности потомством нескольких последовательных поколений. Геном, используемый в настоящем описании, включает ядерный, митохондриальный и плазмидный геном и, следовательно, может включать интеграцию конструкции нуклеиновой кислоты, например, в плазмиду или митохондриальный геном. Стабильная трансформация, используемая в настоящем описании, может также относиться к трансгену, который сохраняется внехромосомно, например, в виде минихромосомы или плазмиды.Stable transformation or stably transformed as used herein means that a nucleic acid construct is introduced into a cell and integrated into the cell's genome. Thus, an integrated nucleic acid construct is capable of being inherited by offspring, in particular the offspring of several successive generations. The genome used herein includes the nuclear, mitochondrial, and plasmid genome, and therefore may include the integration of a nucleic acid construct into, for example, a plasmid or mitochondrial genome. Stable transformation as used herein can also refer to a transgene that is maintained extrachromosomally, eg as a minichromosome or plasmid.

Временная трансформация может быть обнаружена, например, при помощи иммуноферментного анализа (ELISA) или Вестерн-блот анализа, который позволяет обнаруживать наличие пептида или полипептида, кодируемого одним или более трансгенами, введенными в организм. Стабильная трансформация клетки может быть обнаружена, например, методом Саузерн-блот-гибридизации геномной ДНК клетки с последовательностями нуклеиновых кислот, которые специфически гибридизуются с нуклеотидной последовательностью вводимого в организм трансгена (например, бактерии, археи, дрожжей, водоросли и т.п.). Стабильная трансформация клетки может быть обнаружена, например, при помощи анализа нозерн-блот гибридизации РНК клетки с последовательностями нуклеиновых кислот, которые специфически гибридизуются с нуклеотидной последовательностью трансгена, введенного в растение или другой организм. Стабильная трансформация клетки также может быть обнаружена, например, при помощи полимеразной цепной реакции (ПЦР) или других реакций амплификации, хорошо известных в данной области, с использованием специфических праймерных последовательностей, которые гибридизуются с последовательностью (последовательностями) - мишенью трансгена, что приводит к амплификация последовательности трансгена, которая может быть обнаружена стандартными методами. Трансформация также может быть обнаружена при помощи протоколов прямого секвенирования и/или гибридизации, хорошо известных в данной области.Temporal transformation can be detected, for example, using enzyme-linked immunosorbent assay (ELISA) or Western blot analysis, which detects the presence of a peptide or polypeptide encoded by one or more transgenes introduced into the body. Stable transformation of a cell can be detected, for example, by Southern blot hybridization of the cell's genomic DNA with nucleic acid sequences that specifically hybridize with the nucleotide sequence of the transgene introduced into the body (for example, bacteria, archaea, yeast, algae, etc.). Stable transformation of a cell can be detected, for example, by Northern blot analysis of the cell's RNA hybridization with nucleic acid sequences that specifically hybridize to the nucleotide sequence of the transgene introduced into a plant or other organism. Stable cell transformation can also be detected, for example, by polymerase chain reaction (PCR) or other amplification reactions well known in the art, using specific primer sequences that hybridize to the target sequence(s) of the transgene, resulting in amplification. transgene sequence that can be detected by standard methods. Transformation can also be detected using direct sequencing and/or hybridization protocols well known in the art.

Соответственно в некоторых вариантах осуществления нуклеотидные последовательности, конструкции, экспрессионные кассеты могут экспрессироваться временно и/или могут быть стабильно включены в геном организма-хозяина.Accordingly, in some embodiments, nucleotide sequences, constructs, expression cassettes may be transiently expressed and/or may be stably incorporated into the genome of the host organism.

Конструкцию гетерологичной нуклеиновой кислоты по изобретению можно вводить в клетку любым способом, известным специалистам в данной области. В некоторых вариантах осуществления изобретения трансформация клетки включает трансформацию ядра. В других вариантах осуществления конструкция (конструкции) гетерологичной нуклеиновой кислоты по изобретению может быть введена в клетку обычными методами размножения.The heterologous nucleic acid construct of the invention may be introduced into a cell by any method known to those skilled in the art. In some embodiments of the invention, the transformation of the cell includes the transformation of the nucleus. In other embodiments, the heterologous nucleic acid construct(s) of the invention may be introduced into a cell by conventional propagation methods.

Способы трансформации как эукариотических, так и прокариотических организмов хорошо известны и являются обычными в данной области и описаны в любом литературном источнике (см., например, Jiang et al., 2013, Nat. Biotechnol., 31:233-239; Ran et al., Nature Protocols, 8:2281-2308 (2013)).Methods for transforming both eukaryotic and prokaryotic organisms are well known and common in the art and are described in any literature (see, for example, Jiang et al., 2013, Nat. Biotechnol., 31:233-239; Ran et al. ., Nature Protocols, 8:2281-2308 (2013)).

Таким образом, нуклеотидная последовательность может быть введена в организм-хозяин или его клетку любым количеством способов, которые хорошо известны в данной области. Способы по изобретению не зависят от конкретного способа введения одной или более нуклеотидных последовательностей в организм за исключением, что они получают доступ к внутренней части по меньшей мере одной клетки организма. При введении более одной нуклеотидной последовательности они могут быть собраны в виде части одной конструкции нуклеиновой кислоты или в виде отдельных конструкций нуклеиновых кислот и могут быть расположены на одних и тех же или разных конструкциях нуклеиновых кислот. Соответственно нуклеотидные последовательности могут быть введены в представляющую интерес клетку в одном событии трансформации или в отдельных событиях трансформации или в случае необходимости нуклеотидная последовательность может быть включена в организм в рамках протокола размножения.Thus, a nucleotide sequence can be introduced into a host organism or its cell by any number of methods that are well known in the art. The methods of the invention are independent of the particular manner in which one or more nucleotide sequences are introduced into an organism, except that they gain access to the interior of at least one cell of the organism. When more than one nucleotide sequence is introduced, they may be assembled as part of a single nucleic acid construct or as separate nucleic acid constructs and may be located on the same or different nucleic acid constructs. Accordingly, the nucleotide sequences may be introduced into the cell of interest in a single transformation event or in separate transformation events, or if necessary, the nucleotide sequence may be incorporated into the organism as part of a propagation protocol.

Мобильные генетические элементы (MGE) доставляют бактериям постоянные проблемы, связанные с геномной стабильностью, способствуя эволюции через горизонтальный перенос генов. Термин MGE охватывает плазмиды, бактериофаги, транспонируемые элементы, геномные острова и многие другие специализированные генетические элементы (1). MGE охватывают гены, обеспечивающие хозяину высокую скорость распространения, адаптивные преимущества и геномную стабильность, что приводит к их практически универсальному присутствию в бактериальных геномах. Чтобы справиться с постоянной угрозой хищных бактериофагов и эгоистичных генетических элементов, бактерии развили как врожденную, так и адаптивную иммунную систему, ориентированную на экзогенные генетические элементы. Врожденный иммунитет включает модификацию клеточной стенки, системы рестрикции/модификации и абортивную фаговую инфекцию (2). Короткие палиндромные повторы, регулярно расположенные групTransposable genetic elements (MGEs) present persistent genomic stability problems to bacteria, promoting evolution through horizontal gene transfer. The term MGE covers plasmids, bacteriophages, transposable elements, genomic islands, and many other specialized genetic elements (1). MGEs encompass genes that provide the host with a high propagation rate, adaptive advantages, and genomic stability, leading to their almost universal presence in bacterial genomes. To cope with the constant threat of predatory bacteriophages and selfish genetic elements, bacteria have evolved both innate and adaptive immune systems that target exogenous genetic elements. Innate immunity includes cell wall modification, restriction/modification systems, and abortive phage infection (2). Short palindromic repeats regularly spaced in groups

- 21 042506 пами (CRISPR) и CRISPR-ассоциированные гены (Cas) являются адаптивной иммунной системой, направленной против инвазивных генетических элементов у бактерий (3). CRISPR-Cas-опосредованный иммунитет основан на разных молекулярных процессах, классифицированных как приобретение, экспрессия и интерференция (3). Приобретение осуществляется через молекулярный отбор образца (сэмплирование) чужеродных генетических элементов, из которых короткие последовательности, называемые спейсерами, интегрируются в массив CRISPR в определенной ориентации (4). Экспрессия массивов CRISPR является конститутивной и индуцируемой промоторными элементами в предшествующей лидерной последовательности (5-6). Интерференция возникает из соответствующего транскрипта, который подвергается избирательному процессингу в каждой повторяющейся последовательности, формируя РНК CRISPR (сгРНК), которые направляют белки Cas для распознавания последовательностей и расщепления ДНК-мишени, комплементарной спейсеру (7). Технология CRISPR-Cas применяется для типирования и обнаружения штаммов (8-10), использования естественного/созданного иммунитета против мобильных генетических элементов (11), программируемого редактирования генома в разных условиях (12), контроля транскрипции (13-14) и манипуляции микробными популяциями в определенных консорциумах (15).- 21 042506 pami (CRISPR) and CRISPR-associated genes (Cas) are adaptive immune systems directed against invasive genetic elements in bacteria (3). CRISPR-Cas-mediated immunity is based on different molecular processes classified as acquisition, expression and interference (3). The acquisition is carried out through molecular sampling (sampling) of foreign genetic elements, from which short sequences, called spacers, are integrated into the CRISPR array in a specific orientation (4). Expression of CRISPR arrays is constitutive and induced by promoter elements in the preceding leader sequence (5-6). The interference arises from the corresponding transcript, which is selectively processed at each repetitive sequence to form CRISPR RNAs (sgRNAs) that direct Cas proteins to recognize sequences and cleave the target DNA complementary to the spacer (7). CRISPR-Cas technology is applied for strain typing and detection (8-10), exploitation of natural/engineered immunity against mobile genetic elements (11), programmable genome editing under different conditions (12), transcription control (13-14) and manipulation of microbial populations in certain consortiums (15).

В данной области техники известны различные CRISPR системы. Например, см. Макарова и др., где описана номенклатура всех классов, типов и подтипов CRISPR систем (Nature Reviews Microbiology, 13:722-736 (2015)); см. также R. Barrangou (Genome Biol., 16:247 (2015)).Various CRISPR systems are known in the art. For example, see Makarova et al. for a nomenclature of all classes, types, and subtypes of CRISPR systems (Nature Reviews Microbiology, 13:722-736 (2015)); see also R. Barrangou (Genome Biol., 16:247 (2015)).

Хотя признаки последовательности, соответствующие массивам CRISPR, были описаны ранее в нескольких организмах (16-17), Streptococcus thermophilus был первым микробом, в котором прояснились роли специфических генов cas и компонентов массива CRISPR (4). S. thermophilus является непатогенной термофильной грамположительной бактерией, используемой в качестве стартовой культуры, которая катаболизирует лактозу в молочную кислоту при синтрофном производстве йогурта и различных сыров (18). S. thermophilus кодирует до четырех CRISPR-Cas систем, две из них (SthCRISPR1 и SthCRISPR3) классифицированы как системы типа II-А, которые активны от природы как в случае приобретения, так и интерференции (4, 19). Соответственно геномный анализ S. thermophilus и его бактериофагов установил вероятный механизм систем CRISPR-Cas для защиты фага/ДНК. Изучение систем CRISPR-Cas в S. thermophilus позволило провести биоинформатический анализ происхождения спейсера (4, 20), открыть последовательности мотива, прилежащего к протоспейсеру (PAM) (19, 21), понять динамику фаг-хозяин (22-23), продемонстрировать активности эндонуклеазы Cas9 (7, 24-25) и (недавно) определить структурные мотивы tracrРНК, регулирующие функцию и ортогональность систем типа II (26). Геномный анализ S. thermophilus выявил эволюционную адаптацию к молоку через потерю углеводного катаболизма и генов вирулентности, обнаруженных у патогенных стрептококках (18). S. thermophilus также приобрел существенное количество родственных для этой ниши генов, таких как гены, кодирующие в том числе белки холодового шока, белки устойчивости к меди, протеиназы, бактериоцины и белки катаболизма лактозы (18). Встраиваемые последовательности (IS) широко распространены в геномах S. thermophilus и обеспечивают генетическую гетерогенность штаммов, облегчая распространение островов, связанных с генами адаптации к молочным продуктам (18). Сопутствующее присутствие MGE и функциональных CRISPR-Cas систем в S. thermophilus предполагает, что гомеостаз генома определяется по меньшей мере частично, взаимодействием этих динамических сил. Таким образом, S. thermophilus представляет собой идеального хозяина для исследования генетических результатов нацеливания геномных островов на CRISPR-Cas.Although sequence features corresponding to CRISPR arrays have been described previously in several organisms (16-17), Streptococcus thermophilus was the first microbe to elucidate the roles of specific cas genes and CRISPR array components (4). S. thermophilus is a non-pathogenic thermophilic Gram-positive bacterium used as a starter culture that catabolizes lactose to lactic acid in the syntrophic production of yogurt and various cheeses (18). S. thermophilus encodes up to four CRISPR-Cas systems, two of which (SthCRISPR1 and SthCRISPR3) are classified as type II-A systems that are naturally active in both acquisition and interference (4, 19). Accordingly, genomic analysis of S. thermophilus and its bacteriophages established the likely mechanism of CRISPR-Cas systems for phage/DNA protection. The study of CRISPR-Cas systems in S. thermophilus made it possible to carry out a bioinformatic analysis of the origin of the spacer (4, 20), to discover sequences of the motif adjacent to the protospacer (PAM) (19, 21), to understand the phage-host dynamics (22-23), to demonstrate the activities endonuclease Cas9 (7, 24-25) and (recently) to determine the tracrRNA structural motifs that regulate the function and orthogonality of type II systems (26). Genomic analysis of S. thermophilus revealed an evolutionary adaptation to milk through the loss of carbohydrate catabolism and virulence genes found in pathogenic streptococci (18). S. thermophilus has also acquired a significant number of genes related to this niche, such as genes encoding, among others, cold shock proteins, copper resistance proteins, proteinases, bacteriocins, and lactose catabolism proteins (18). Insertion sequences (IS) are widely distributed in the genomes of S. thermophilus and provide genetic heterogeneity of strains, facilitating the spread of islands associated with dairy adaptation genes (18). The concomitant presence of MGE and functional CRISPR-Cas systems in S. thermophilus suggests that genome homeostasis is determined, at least in part, by the interplay of these dynamic forces. Thus, S. thermophilus represents an ideal host to investigate the genetic outcomes of targeting genomic islands to CRISPR-Cas.

CRISPR-Cas системы недавно стали предметом интенсивных исследований в области применения для редактирования генома (12), но эволюционные роли большинства эндогенных микробных систем остаются неизвестными (27). Еще меньше известно об эволюционных последствиях размещения активных CRISPR-Cas систем, помимо их роли в предотвращении захвата чужеродных ДНК (7), событий приобретения спейсеров (4) и мутации, вызываемой хромосомным самонацеливанием (28-32). Таким образом, авторы изобретения стремились определить результаты таргетинга интегрированных MGE с эндогенными CRISPR-Cas системами типа II. В S. thermophilus LMD-9 были идентифицированы четыре острова с длиной от 8 до 102 т.п.о. и общим количеством примерно 132 т.п.о., или 7% генома. Для таргетинга геномных островов плазмиду, используемую для экспрессии сконструированных массивов CRISPR с самонацеленными спейсерами, трансформированы в S. thermophilus LMD-9. В совокупности полученные результаты разъясняют результаты фундаментальных генетических исследований событий самонацеливания и показывают, что CRISPR-Cas системы могут направлять эволюцию генома на уровне популяции бактерий.CRISPR-Cas systems have recently been the subject of intensive research for applications in genome editing (12), but the evolutionary roles of most endogenous microbial systems remain unknown (27). Even less is known about the evolutionary implications of the deployment of active CRISPR-Cas systems beyond their role in preventing foreign DNA uptake (7), spacer acquisition events (4) and chromosomal self-targeting mutation (28-32). Thus, the inventors sought to determine the results of targeting integrated MGEs with endogenous type II CRISPR-Cas systems. In S. thermophilus LMD-9, four islands have been identified ranging in length from 8 to 102 kb. and a total of approximately 132 kb, or 7% of the genome. To target the genomic islands, the plasmid used to express the engineered CRISPR arrays with self-targeted spacers was transformed into S. thermophilus LMD-9. Taken together, these results elucidate the results of fundamental genetic studies of self-targeting events and show that CRISPR-Cas systems can guide genome evolution at the bacterial population level.

Используя эти открытия, авторы настоящего изобретения разработали новые способы скрининга популяций бактериальных, архейных, водорослевых или дрожжевых клеток для жизненно важных генов, нежизненно важных генов и/или инородных геномных островов; для уничтожения одной или более клеток в популяции бактериальных, архейных, водорослевых или дрожжевых клеток; для идентификации фенотипа бактериального, архейного, водорослевого или дрожжевого гена; для выбора одной или более бактериальных, архейных, водорослевых или дрожжевых клеток, имеющих уменьшенный размер генома из популяции бактериальных, архейных или дрожжевых клеток; и/или для идентификации в популяцииUsing these findings, the authors of the present invention have developed new methods of screening populations of bacterial, archaeal, algal or yeast cells for vital genes, non-essential genes and/or foreign genomic islands; to kill one or more cells in a population of bacterial, archaeal, algal, or yeast cells; to identify the phenotype of a bacterial, archaeal, algal or yeast gene; to select one or more bacterial, archaeal, algal or yeast cells having a reduced genome size from a population of bacterial, archaeal or yeast cells; and/or for identification in a population

- 22 042506 бактериальных, архейных, водорослевых или дрожжевых клеток по меньшей мере одного изолята, имеющего мутацию (например, делецию) в своем геноме.- 22 042506 bacterial, archaeal, algal or yeast cells of at least one isolate having a mutation (eg deletion) in its genome.

Таким образом, в одном из аспектов авторы настоящего изобретения разработали методы идентификации генетических вариантов в популяции, которые изменили генетическое содержание, что позволило им избежать таргетирования. В данном случае последовательность-мишень была модифицирована, и был проведен поиск выживших организмов, имеющих эту модификацию. В некоторых аспектах модификация (т.е. мутация) представляет собой делецию. Кроме того, если последовательность-мишень была модифицирована, то генотип дикого типа не является существенным.Thus, in one aspect, the present inventors have developed methods for identifying genetic variants in a population that have altered the genetic content, allowing them to avoid targeting. In this case, the target sequence was modified and a search was made for surviving organisms having this modification. In some aspects, the modification (ie, mutation) is a deletion. In addition, if the target sequence has been modified, then the wild-type genotype is not significant.

Следовательно, в одном из аспектов изобретения предоставляется способ скрининга популяции бактериальных клеток в отношении жизненно важных генов, нежизненно важных генов и/или инородных геномных островов, включающий введение в указанную популяцию бактериальных клеток конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повторспейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме клеток бактерий указанной популяции, таким образом создавая популяцию трансформированных бактериальных клеток; и определение наличия или отсутствия делеции в популяции трансформированных бактериальных клеток, причем наличие делеции в популяции трансформированных бактериальных клеток указывает на то, что эта область-мишень содержится в нежизненно важном гене и/или инородном геномном острове, а отсутствие делеции в популяции бактериальных клеток означает, что эта область-мишень содержится в жизненно важном гене.Therefore, in one aspect of the invention, a method is provided for screening a bacterial cell population for vital genes, non-essential genes, and/or foreign genomic islands, comprising introducing into said bacterial cell population a heterologous nucleic acid construct comprising a CRISPR array containing (in 5' -3' direction) a repeat-spacer-repeat sequence or at least one repeat-spacer sequence, wherein the spacer of said repeat-spacer-repeat sequence or of said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary to the target region in the bacterial cell genome of said population, thereby creating a population of transformed bacterial cells; and determining the presence or absence of a deletion in the population of transformed bacterial cells, wherein the presence of a deletion in the population of transformed bacterial cells indicates that the target region is contained in a non-vital gene and/or foreign genomic island, and the absence of a deletion in the population of bacterial cells means, that this target region is contained in a vital gene.

Массив CRISPR, используемый в этом изобретении, может быть массивом CRISPR типа I, типа II, типа III, типа IV или типа V.The CRISPR array used in this invention may be a Type I, Type II, Type III, Type IV, or Type V CRISPR array.

В дополнительных аспектах изобретения предоставляется способ скрининга популяции бактериальных, архейных, водорослевых и дрожжевых клеток в отношении жизненно важных генов, нежизненно важных генов и/или инородных геномных островов, включающий введение в популяцию бактериальных, архейных, водорослевых и дрожжевых клеток (a) конструкции гетерологичной нуклеиновой кислоты, содержащей транс-активирующую CRISPR (tracr) нуклеиновую кислоту, (b) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме бактериальных, архейных, водорослевых и дрожжевых клеток указанной популяции, и (c) Cas9 полипептида или конструкции гетерологичной нуклеиновой кислоты, содержащей полинуклеотид, кодирующий Cas9 полипептид, таким образом создавая популяцию трансформированных бактериальных, архейных, водорослевых и дрожжевых клеток; и определение наличия или отсутствия делеции в популяции трансформированных бактериальных, архейных, водорослевых и дрожжевых клеток, причем наличие делеции в популяции бактериальных, архейных, водорослевых и дрожжевых клеток означает, что эта область-мишень содержится в нежизненно важном гене и/или инородном геномном острове, а отсутствие делеции в популяции бактериальных, архейных, водорослевых и дрожжевых клеток означает, что эта область-мишень содержится в жизненно важном гене.In additional aspects of the invention, a method is provided for screening a population of bacterial, archaeal, algal, and yeast cells for vital genes, non-essential genes, and/or foreign genomic islands, comprising introducing into the population of bacterial, archaeal, algal, and yeast cells (a) a heterologous nucleic acid construct acid containing a trans-activating CRISPR (tracr) nucleic acid, (b) a heterologous nucleic acid construct containing a CRISPR array containing (in the 5'-3' direction) a repeat-spacer-repeat sequence or at least one repeat-spacer sequence wherein the spacer contains a nucleotide sequence that is substantially complementary to a target region in the genome of said population of bacterial, archaeal, algal, and yeast cells, and (c) a Cas9 polypeptide or heterologous nucleic acid construct containing a polynucleotide encoding a Cas9 polypeptide, thereby creatinga population of transformed bacterial, archaeal, algal and yeast cells; and determining the presence or absence of a deletion in the population of transformed bacterial, archaeal, algal and yeast cells, wherein the presence of a deletion in the population of bacterial, archaeal, algal and yeast cells means that this target region is contained in a non-vital gene and/or a foreign genomic island, and the absence of a deletion in a population of bacterial, archaeal, algal, and yeast cells means that this target region is contained in a vital gene.

В других аспектах предоставляется способ уничтожения одной или более бактериальных клеток в популяции бактериальных клеток, включающий введение в популяцию бактериальных клеток конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повторспейсер, в которой спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме бактериальных клеток указанной популяции, таким образом уничтожая в популяции одну или более бактериальных клеток, которые содержат область-мишень. Массив CRISPR, используемый в этом изобретении, может быть массивом CRISPR типа I, типа II, типа III, типа IV или типа V.In other aspects, a method is provided for killing one or more bacterial cells in a bacterial cell population, comprising introducing into the bacterial cell population a heterologous nucleic acid construct comprising a CRISPR array containing (in the 5'-3' direction) a repeat-spacer-repeat sequence or at least at least one repeat-spacer sequence, wherein the spacer of said repeat-spacer-repeat sequence or said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary to a target region in the bacterial cell genome of said population, thereby eliminating one or more bacterial cells that contain the target area. The CRISPR array used in this invention may be a Type I, Type II, Type III, Type IV, or Type V CRISPR array.

В дополнительном аспекте предоставляется способ уничтожения одной или более клеток в популяции бактериальных, архейных, водорослевых или дрожжевых клеток, включающий введение в популяцию бактериальных, архейных, водорослевых или дрожжевых клеток (a) конструкции гетерологичной нуклеиновой кислоты, содержащей транс-активирующую CRISPR (tracr) нуклеиновую кислоту, (b) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор-спейсер-повтор или по меньшей мере одну последова-In a further aspect, a method is provided for killing one or more cells in a population of bacterial, archaeal, algal, or yeast cells, comprising introducing into the population of bacterial, archaeal, algal, or yeast cells (a) a heterologous nucleic acid construct comprising a trans-activating CRISPR (tracr) nucleic acid acid, (b) a heterologous nucleic acid construct comprising a CRISPR array containing (in the 5'-3' direction) a repeat-spacer-repeat sequence or at least one

- 23 042506 тельность повтор-спейсер, в которой спейсер указанной по меньшей мере одной последовательности повтор-спейсер и последовательности повтор-спейсер-повтор содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме бактериальных, архейных, водорослевых или дрожжевых клеток указанной популяции, и (c) Cas9 полипептида или конструкции гетерологичной нуклеиновой кислоты, содержащей полинуклеотид, кодирующий Cas9 полипептид, таким образом уничтожая в популяции бактериальных, архейных, водорослевых или дрожжевых клеток.- 23 042506 a repeat-spacer identity, wherein the spacer of said at least one repeat-spacer sequence and repeat-spacer-repeat sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome of the bacterial, archaeal, algal, or yeast cells of said population and (c) a Cas9 polypeptide or a heterologous nucleic acid construct comprising a polynucleotide encoding a Cas9 polypeptide, thereby eradicating a population of bacterial, archaeal, algal, or yeast cells.

Трансформация CRISPR РНК для нацеливания на бактериальный геном может быть использована для выборочного уничтожения бактериальных клеток на основе специфичности последовательностей для удаления генетически отличающихся субпопуляций, тем самым обогащая популяции бактерий, не содержащих последовательность-мишень. Такое отличие может возникать на основе гетерогенного распределения ортогональных CRISPR-Cas систем в генетически сходных популяциях. Таким образом, в некоторых вариантах осуществления массив CRISPR, который вводится в популяцию клеток, может оказаться совместимым (т.е. функциональным) с CRISPR-Cas системой в одной или более бактериальных клетках, подлежащих уничтожению, и несовместимым (т.е. нефункциональным) с CRISPR Cas системой по меньшей мере в одной или более бактериальных клетках в популяции. Например, Escherichia coli и Klebsiella pneumoniae могут иметь CRISPR-Cas системы типа I-Е или типа I-F; Clostridium difficile кодирует системы типа I-B, а различные штаммы S. thermophilus имеют как системы типа II-A, так и типа I-Е, или только системы типа II-A. В зависимости от конкретной CRISPR РНК, трансформированной в смесь бактерий, она может специфически нацеливаться на такое подмножество популяции на основе ее функциональной совместимости с родственной ей системой. Это можно применить к различным видам, содержащим эндогенные CRISPR-Cas системы, таким как без ограничения следующие.Transformation of CRISPR RNA to target the bacterial genome can be used to selectively kill bacterial cells based on sequence specificity to remove genetically distinct subpopulations, thereby enriching bacterial populations lacking the target sequence. This difference may arise from the heterogeneous distribution of orthogonal CRISPR-Cas systems in genetically similar populations. Thus, in some embodiments, a CRISPR array that is introduced into a population of cells may be compatible (i.e., functional) with the CRISPR-Cas system in one or more bacterial cells to be killed, and incompatible (i.e., non-functional) with the CRISPR Cas system in at least one or more bacterial cells in the population. For example, Escherichia coli and Klebsiella pneumoniae may have type I-E or type I-F CRISPR-Cas systems; Clostridium difficile encodes type I-B systems, and various strains of S. thermophilus have both type II-A and type I-E systems, or only type II-A systems. Depending on the particular CRISPR RNA transformed into a mixture of bacteria, it may specifically target such a subset of the population based on its interoperability with its cognate system. This can be applied to various species containing endogenous CRISPR-Cas systems, such as, but not limited to, the following.

Pseudomonas spp. (например: Р. aeruginosa), Escherichia spp.Pseudomonas spp. (for example: P. aeruginosa), Escherichia spp.

(например: Е. coli), Enterobacter spp. (например: E. cloacae), Staphylococcus spp. (например: S. aureus), Enterococcus spp.(for example: E. coli), Enterobacter spp. (for example: E. cloacae), Staphylococcus spp. (for example: S. aureus), Enterococcus spp.

(например: E. faecalis, E. faecium), Streptomyces spp.(eg: E. faecalis, E. faecium), Streptomyces spp.

(например: S. somaliensis), Streptococcus spp. (например: S.(for example: S. somaliensis), Streptococcus spp. (for example: S.

pyogenes), Vibrio spp. (например: V. cholerae), Yersinia spp.pyogenes), Vibrio spp. (for example: V. cholerae), Yersinia spp.

(например: Y. pestis), Francisella spp. (например:F.(for example: Y. pestis), Francisella spp. (for example: F.

tularensis, F. novicida), Bacillus spp. (например: В. anthracis,tularensis, F. novicida), Bacillus spp. (for example: V. anthracis,

В. cereus), Lactobacillus spp. (например: L. casei, L. reuteri, L. acidophilus, L. rhamnosis), Burkholderia spp. (например: В. mallei, В. pseudomallei), Klebsiella spp. (например:К.B. cereus), Lactobacillus spp. (eg: L. casei, L. reuteri, L. acidophilus, L. rhamnosis), Burkholderia spp. (for example: B. mallei, B. pseudomallei), Klebsiella spp. (eg: K.

pneumoniae), Shigella spp. (например: S. dysenteriae,S.pneumoniae), Shigella spp. (for example: S. dysenteriae, S.

sonnei), Salmonella spp. (например: S. enterica), Borrelia spp.sonnei), Salmonella spp. (for example: S. enterica), Borrelia spp.

(например: В. burgdorfieri), Neisseria spp. (например:N.(for example: B. burgdorfieri), Neisseria spp. (for example: N.

meningitidis), Fusobacterium spp. (например: F. nucleatum), Helicobacter spp. (например: H. pylori), Chlamydia spp. (например: C. trachomatis), Bacteroides spp. (например: В.meningitidis), Fusobacterium spp. (for example: F. nucleatum), Helicobacter spp. (for example: H. pylori), Chlamydia spp. (eg: C. trachomatis), Bacteroides spp. (for example, in.

fragilis), Bartonella spp. (например: В. quintana), Bordetella spp. (например: В. pertussis), Brucella spp. (например: В. abortus), Campylobacter spp. (например: C. jejuni), Clostridium spp. (например: C. difficile), Bifidobacterium spp. (например:fragilis), Bartonella spp. (for example: B. quintana), Bordetella spp. (for example: B. pertussis), Brucella spp. (for example: B. abortus), Campylobacter spp. (for example: C. jejuni), Clostridium spp. (eg: C. difficile), Bifidobacterium spp. (For example:

В. infantis), Haemophilus spp. (например: H. influenzae), Listeria spp. (например: L. monocytogenes), Legionella spp. (например: L. pneumophila), Mycobacterium spp. (например: M. tuberculosis), Mycoplasma spp. (например: M. pneumoniae), Rickettsia spp. (например: R. rickettsii), Acinetobacter spp.B. infantis), Haemophilus spp. (for example: H. influenzae), Listeria spp. (for example: L. monocytogenes), Legionella spp. (eg: L. pneumophila), Mycobacterium spp. (for example: M. tuberculosis), Mycoplasma spp. (for example: M. pneumoniae), Rickettsia spp. (eg: R. rickettsii), Acinetobacter spp.

(например: A. calcoaceticus, A. baumanii), Rumincoccus spp.(for example: A. calcoaceticus, A. baumanii), Rumincoccus spp.

(например: R. albus), Propionibacterium spp. (например: P.(for example: R. albus), Propionibacterium spp. (for example: P.

freudenreichii), Corynebacterium spp. (например: C.freudenreichii), Corynebacterium spp. (for example: C.

- 24 042506 diphtheriae), Propionibacterium spp. (например: P. acnes) Brevibacterium spp. (например: В. iodinum), Micrococcus spp (например: M. luteus) и/или Prevotella spp. (например: P histicola).- 24 042506 diphtheriae), Propionibacterium spp. (eg: P. acnes) Brevibacterium spp. (eg: B. iodinum), Micrococcus spp (eg: M. luteus) and/or Prevotella spp. (for example: P histicola).

Нацеливание CRISPR может привести к удалению специфических подмножеств бактерий на основе различающегося генетического содержания в смешанных популяциях. Подтверждение этого заявления представлено в примерах 4, 5, где Lac- бактерии отбирают до полного исчезновения в популяции Lac+. Генетическое различие между Lac+ и Lac- штаммами представлено в примерах 8 и 10, где секвенирование выживших клонов выявило до 5,5% различий в генетическом содержании по сравнению с референсным штаммом S. thermophilus дикого типа. Таким образом, спейсеры для нацеливания на CRISPR можно настраивать на разную степень родства между бактериями путем нацеливания на консервативные или дивергентные генетические последовательности. Таким образом, в некоторых вариантах осуществления бактериальные клетки в популяции могут содержать одну и одну и ту же CRISPR-Cas систему, и введенный массив CRISPR, таким образом, может функционировать в популяции бактерий как единое целое, но генетическое содержание других штаммов или видов, которые составляют эту популяцию бактерий, отличается в достаточной степени, для того чтобы область-мишень для введенного массива CRISPR была обнаружена только в одном или более предназначены для уничтожения видах бактерий в популяции. Это может быть применено к различным видам, содержащим эндогенные CRISPR-Cas системы, такие как без ограничения Pseudomonas spp. (например, следующие).Targeting CRISPR can result in the removal of specific subsets of bacteria based on differing genetic content in mixed populations. Confirmation of this statement is presented in examples 4, 5, where Lac-bacteria are selected to complete extinction in the Lac + population. The genetic difference between Lac + and Lac- strains is shown in Examples 8 and 10, where sequencing of the surviving clones revealed up to 5.5% difference in genetic content compared to the wild-type reference S. thermophilus strain. Thus, CRISPR targeting spacers can be tuned to varying degrees of relatedness between bacteria by targeting conserved or divergent genetic sequences. Thus, in some embodiments, the bacterial cells in a population may contain the same CRISPR-Cas system, and the introduced CRISPR array may thus function as a unit in the bacterial population, but the genetic content of other strains or species that make up this bacterial population is sufficiently different that the target region for the injected CRISPR array is found in only one or more of the bacterial species targeted to kill in the population. This can be applied to various species containing endogenous CRISPR-Cas systems, such as, but not limited to, Pseudomonas spp. (for example, the following).

Р. aeruginosa), Escherichia spp. (например: Е. coli), Enterobacter spp. (например: E. cloacae), Staphylococcus spp. (например: S. aureus), Enterococcus spp. (например: E. faecalis, E. faecium), Streptomyces spp. (например: S. somaliensis), Streptococcus spp. (например: S. pyogenes), Vibrio spp. (например: V. cholerae), Yersinia spp. (например: Y. pestis), Francisella spp. (например: F. tularensis, F. novicida), Bacillus spp. (например: В. anthracis, В. cereus), Lactobacillus spp. (например: L. casei, L. reuteri, L. acidophilus, L. rhamnosis), Burkholderia spp. (например: В. mallei, В. pseudomallei), Klebsiella spp. (например: К. pneumoniae), Shigella spp. (например: S. dysenteriae, S. sonnei), Salmonella spp. (например: S. enterica), Borrelia spp. (например: В. burgdorfieri), Neisseria spp. (например: N. meningitidis), Fusobacterium spp. (например: F. nucleatum), Helicobacter spp. (например: H. pylori), Chlamydia spp. (например: C. trachomatis), Bacteroides spp. (например: В. fragilis), Bartonella spp. (например: В. quintana), Bordetella spp. (например: В. pertussis), Brucella spp. (например: В. abortus), Campylobacter spp. (например: C. jejuni), Clostridium spp. (например: C. difficile), Bifidobacterium spp. (например: В. infantis), Haemophilus spp. (например: H. influenzae), Listeria spp. (например: L. monocytogenes), Legionella spp. (например: L. pneumophila), Mycobacterium spp. (например: M. tuberculosis), Mycoplasma spp. (например: M. pneumoniae), Rickettsia spp. (например: R. rickettsii), Acinetobacter spp. (например: A. calcoaceticus, A. baumanii), Rumincoccus spp. (например: R. albus), Propionibacterium spp. (например: P. freudenreichii), Corynebacterium spp. (например: C. diphtheriae),R. aeruginosa), Escherichia spp. (for example: E. coli), Enterobacter spp. (eg: E. cloacae), Staphylococcus spp. (for example: S. aureus), Enterococcus spp. (eg: E. faecalis, E. faecium), Streptomyces spp. (for example: S. somaliensis), Streptococcus spp. (eg: S. pyogenes), Vibrio spp. (for example: V. cholerae), Yersinia spp. (for example: Y. pestis), Francisella spp. (for example: F. tularensis, F. novicida), Bacillus spp. (for example: B. anthracis, B. cereus), Lactobacillus spp. (eg: L. casei, L. reuteri, L. acidophilus, L. rhamnosis), Burkholderia spp. (for example: B. mallei, B. pseudomallei), Klebsiella spp. (for example: K. pneumoniae), Shigella spp. (for example: S. dysenteriae, S. sonnei), Salmonella spp. (for example: S. enterica), Borrelia spp. (for example: B. burgdorfieri), Neisseria spp. (eg: N. meningitidis), Fusobacterium spp. (for example: F. nucleatum), Helicobacter spp. (for example: H. pylori), Chlamydia spp. (eg: C. trachomatis), Bacteroides spp. (for example: B. fragilis), Bartonella spp. (for example: B. quintana), Bordetella spp. (for example: B. pertussis), Brucella spp. (for example: B. abortus), Campylobacter spp. (eg: C. jejuni), Clostridium spp. (eg: C. difficile), Bifidobacterium spp. (for example: B. infantis), Haemophilus spp. (for example: H. influenzae), Listeria spp. (for example: L. monocytogenes), Legionella spp. (eg: L. pneumophila), Mycobacterium spp. (for example: M. tuberculosis), Mycoplasma spp. (for example: M. pneumoniae), Rickettsia spp. (eg: R. rickettsii), Acinetobacter spp. (for example: A. calcoaceticus, A. baumanii), Rumincoccus spp. (for example: R. albus), Propionibacterium spp. (for example: P. freudenreichii), Corynebacterium spp. (for example: C. diphtheriae),

Propionibacterium spp. (например: P. acnes), Brevibacterium spp. (например: В. iodinum), Micrococcus spp. (например: M. luteus) и/или Prevotella spp. (например: P. histicola).Propionibacterium spp. (eg: P. acnes), Brevibacterium spp. (for example: B. iodinum), Micrococcus spp. (eg: M. luteus) and/or Prevotella spp. (for example: P. histicola).

Степень уничтожения в популяции способом по настоящему изобретению может зависеть от вос приимчивости конкретной популяции к трансформации дополнительно к тому, где находится областьмишень в нежизненно важном гене, жизненно важном гене или инородном острове. Степень уничтожеThe degree of eradication in a population by the method of the present invention may depend on the susceptibility of a particular population to transformation in addition to where the target region is in a non-essential gene, a vital gene, or a foreign island. degree of destruction

- 25 042506 ния в популяции бактериальных, архейных или дрожжевых клеток может варьировать, например, в зависимости от организма, рода и вида. Соответственно используемый в настоящем описании термин уничтожение означает удаление 2 log или более клеток в популяции (1% выживаемости или менее). Уничтожение на уровне менее 1 log будет небольшим сокращением численности популяции; в то время как уничтожение на уровне 2-3 log приведет к значительному сокращению численности популяции; а уничтожение на уровне более 3 log указывает на то, что популяция является по существу уничтоженной.- 25 042506 ion in a population of bacterial, archaeal or yeast cells may vary, for example, depending on the organism, genus and species. Accordingly, as used herein, the term eradication means the removal of 2 log or more cells in a population (1% survival or less). Annihilation below 1 log would be a small population reduction; while a 2-3 log kill would result in a significant population reduction; and kills greater than 3 log indicate that the population is essentially wiped out.

В другом аспекте предоставляется способ идентификации фенотипа, ассоциированного с бактериальным геном, включающий введение в популяцию бактериальных клеток конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор-спейсерповтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной по меньшей мере одной последовательности повтор-спейсер и последовательности повтор-спейсер-повтор содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме бактериальных клеток указанной популяции, причем эта область-мишень содержит по меньшей мере часть открытой рамки считывания, кодирующей полипептид, или функциональную нуклеиновую кислоту, таким образом уничтожая клетки, содержащие эту область-мишень, и создавая популяцию трансформированных бактериальных клеток, не содержащих эту область-мишень (т.е. выжившие клетки не содержат область-мишень); и (i) анализ фенотипа популяции клеток; или (ii) выращивание отдельных бактериальных колоний из популяции трансформированных бактериальных клеток и анализ фенотипа отдельных колоний.In another aspect, a method for identifying a phenotype associated with a bacterial gene is provided, comprising introducing into a population of bacterial cells a heterologous nucleic acid construct comprising a CRISPR array containing (in the 5'-3' direction) a repeat-spacer repeat sequence or at least one repeat sequence. a spacer, wherein the spacer of said at least one repeat-spacer sequence and the repeat-spacer-repeat sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome of said population of bacterial cells, wherein this target region contains at least a portion of the open a reading frame encoding a polypeptide or functional nucleic acid, thereby destroying cells containing this target region and creating a population of transformed bacterial cells that do not contain this target region (i.e., surviving cells do not contain the target region); and (i) analysis of the phenotype of the cell population; or (ii) growing individual bacterial colonies from the population of transformed bacterial cells and analyzing the phenotype of the individual colonies.

Массив CRISPR, используемый в этом изобретении, может быть массивом CRISPR типа I, типа II, типа III, типа IV или типа V.The CRISPR array used in this invention may be a Type I, Type II, Type III, Type IV, or Type V CRISPR array.

В другом аспекте предоставляется способ идентификации фенотипа бактериального, архейного, водорослевого или дрожжевого гена, включающий введение в популяцию бактериальных, архейных, водорослевых или дрожжевых клеток (a) конструкции гетерологичной нуклеиновой кислоты, содержащей транс-активирующую CRISPR (tracr) нуклеиновую кислоту, (b) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме бактериальных, архейных, водорослевых или дрожжевых клеток указанной популяции, и (c) Cas9 полипептида или конструкции гетерологичной нуклеиновой кислоты, содержащей полинуклеотид, кодирующий Cas9 полипептид, таким образом уничтожая бактериальные, архейные, водорослевые или дрожжевые клетки, содержащие область-мишень, и создавая популяцию трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток, не содержащих областьмишень; и (i) анализ фенотипа популяции клеток; или (ii) выращивание отдельных бактериальных, архейных, водорослевых или дрожжевых колоний из популяции трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток; и анализ фенотипа отдельных колоний.In another aspect, a method is provided for identifying the phenotype of a bacterial, archaeal, algal, or yeast gene, comprising introducing into a population of bacterial, archaeal, algal, or yeast cells (a) a heterologous nucleic acid construct comprising a trans-activating CRISPR (tracr) nucleic acid, (b) a heterologous nucleic acid construct comprising a CRISPR array containing (in the 5'-3' direction) a repeat-spacer-repeat sequence, or at least one repeat-spacer sequence, wherein the spacer contains a nucleotide sequence that is substantially complementary to the target region in the genome of the bacterial, archaeal, algal, or yeast cells of said population, and (c) a Cas9 polypeptide or heterologous nucleic acid construct containing a polynucleotide encoding a Cas9 polypeptide, thereby destroying the bacterial, archaeal, algal, or yeast cells containing the target region and creating ass lyation of transformed bacterial, archaeal, algal or yeast cells that do not contain the target region; and (i) analysis of the phenotype of the cell population; or (ii) growing single bacterial, archaeal, algal or yeast colonies from a population of transformed bacterial, archaeal, algal or yeast cells; and analysis of the phenotype of individual colonies.

В некоторых вариантах осуществления анализ включает ПЦР, оптическое картирование генома, секвенирование генома, рестрикционное картирование и/или рестрикционный анализ для идентификации и характеристики мутации, а также анализ комплементарности и/или фенотипические анализы для анализа фенотипа.In some embodiments, the analysis includes PCR, optical genome mapping, genome sequencing, restriction mapping and/or restriction analysis to identify and characterize a mutation, and complementarity and/or phenotypic assays to analyze the phenotype.

В некоторых вариантах осуществления изобретения определение степени уничтожения или сокращения популяции может включать любой способ определения численности популяции, включая (без ограничения) (1) посев клеток и подсчет колоний, (2) определение оптической плотности, (3) подсчет под микроскопом, (4) определение наиболее вероятной численности, и/или (5) восстановление метиленового синего.In some embodiments of the invention, determining the degree of destruction or reduction of the population may include any method of determining the size of the population, including (without limitation) (1) seeding cells and counting colonies, (2) determining optical density, (3) counting under a microscope, (4) determination of the most likely abundance, and/or (5) recovery of methylene blue.

В некоторых вариантах осуществления для определения профиля композиции смешанных популяций может быть использовано секвенирование 16S рДНК. Это можно сделать, например, путем очистки ДНК от образца в целом, и проведения либо секвенирования всего генома методом дробовика при помощи высокоэффективных технологий, либо, например, путем ПЦР-амплификации 16S гена и секвенирования продуктов таким же образом. Затем путем компьютерных вычислений эти последовательности можно отнести к определенным бактериальным таксонам. В других вариантах осуществления для количественного определения бактерий также можно использовать количественные методы ПЦР. Такие методы хорошо известны в данной области. Например, праймеры для амплификации для количественнойIn some embodiments, 16S rDNA sequencing may be used to determine the composition profile of mixed populations. This can be done, for example, by purifying the DNA from the sample as a whole, and performing either shotgun sequencing of the whole genome using high-performance technologies, or, for example, by PCR amplification of the 16S gene and sequencing the products in the same way. These sequences can then be assigned to specific bacterial taxa by computer calculations. In other embodiments, quantitative PCR methods can also be used to quantify bacteria. Such methods are well known in the art. For example, amplification primers for quantitative

- 26 042506- 26 042506

ПЦР могут быть сконструированы, в частности, из вида, рода или группы организмов, которые имеют эту последовательность. Таким образом, для количественного определения указанного организма или группы организмов можно использовать пороговое значение (ct). В дополнительных вариантах осуществления любая бактериальная активность (фенотип), специфичная для целевой популяции, также может быть использована в качестве показателя для определения истощения популяции.PCR can be constructed, in particular, from a species, genus or group of organisms that have this sequence. Thus, a threshold value (ct) can be used to quantify a specified organism or group of organisms. In additional embodiments, any bacterial activity (phenotype) specific to the target population can also be used as an indicator to determine population depletion.

В других вариантах осуществления предоставляется способ отбора одной или более бактериальных клеток, имеющих уменьшенный размер генома, из популяции бактериальных клеток, включающий введение в популяцию бактериальных клеток конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий (в 5'-3' направлении) последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме одной или более бактериальных клеток в указанной популяции, причем клетки, содержащие область-мишень, уничтожаются, таким образом осуществляя отбор одной или более бактериальных клеток, не содержащих эту область-мишень и имеющих уменьшенный размер генома, из популяции бактериальных клеток. Массив CRISPR, используемый в этом изобретении, может быть массивом CRISPR типа I, типа II, типа III, типа IV или типа V.In other embodiments, a method is provided for selecting one or more bacterial cells having a reduced genome size from a population of bacterial cells, comprising introducing into the population of bacterial cells a heterologous nucleic acid construct comprising a CRISPR array containing (in the 5'-3' direction) a repeat sequence a spacer-repeat or at least one repeat-spacer sequence, in which the spacer contains a nucleotide sequence that is substantially complementary to a target region in the genome of one or more bacterial cells in said population, wherein cells containing the target region are destroyed, thereby thus carrying out the selection of one or more bacterial cells that do not contain this target region and have a reduced genome size from a population of bacterial cells. The CRISPR array used in this invention may be a Type I, Type II, Type III, Type IV, or Type V CRISPR array.

В некоторых вариантах осуществления предоставляется способ отбора одной или более бактериальных клеток, имеющих уменьшенный размер генома, из популяции бактериальных клеток, включающий введение в популяцию бактериальных клеток (a) (i) одну или более конструкций гетерологичной нуклеиновой кислоты, содержащих нуклеотидную последовательность, имеющую по меньшей мере 80% идентичности по меньшей мере 300 последовательным нуклеотидам, присутствующим в геноме указанных бактериальных клеток, или (ii) двух или более конструкций гетерологичной нуклеиновой кислоты, содержащих по меньшей мере один транспозон, таким образом создавая популяцию трансгенных бактериальных клеток, содержащих неприродный сайт для гомологичной рекомбинации между одной или более конструкциями гетерологичной нуклеиновой кислоты, интегрированными в геном, и по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме, или между первым и вторым транспозонами, интегрированными в геном; и (b) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR (сгРНК, сгДНК), содержащий (в 5'-3' направлении) последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повторспейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме одной или более бактериальных клеток в указанной популяции, причем эта область-мишень расположена между одной или более конструкциями гетерологичной нуклеиновой кислоты, введенными в геном, и по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме, и/или между первым транспозоном и вторым транспозоном, при этом клетки, содержащие область-мишень уничтожаются, а клетки не содержащие область-мишень выживают, таким образом осуществляя отбор одной или более бактериальных клеток не содержащих эту область-мишень и имеющих уменьшенный размер генома, из популяции трансгенных бактериальных клеток.In some embodiments, a method is provided for selecting one or more bacterial cells having a reduced genome size from a population of bacterial cells, comprising introducing into the population of bacterial cells (a) (i) one or more heterologous nucleic acid constructs comprising a nucleotide sequence having at least at least 80% identity to at least 300 consecutive nucleotides present in the genome of said bacterial cells, or (ii) two or more heterologous nucleic acid constructs containing at least one transposon, thereby creating a population of transgenic bacterial cells containing a non-natural site for a homologous recombination between one or more heterologous nucleic acid constructs integrated into the genome and at least 300 consecutive nucleotides present in the genome, or between the first and second transposons integrated into the genome; and (b) a heterologous nucleic acid construct comprising a CRISPR (ssRNA, ssDNA) array containing (in the 5'-3' direction) a repeat-spacer-repeat sequence, or at least one repeat-spacer sequence, wherein the spacer of said repeat-spacer sequence is - a repeat or of said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome of one or more bacterial cells in said population, this target region being located between one or more heterologous nucleic acid constructs introduced into the genome, and at least 300 consecutive nucleotides present in the genome and/or between the first transposon and the second transposon, whereby cells containing the target region are killed and cells not containing the target region survive, thus selecting one or more bacterial cells not containing this target area and having a reduced genome size, from a population of transgenic bacterial cells.

Массив CRISPR, используемый в этом изобретении, может быть массивом CRISPR типа I, типа II, типа III, типа IV или типа V.The CRISPR array used in this invention may be a Type I, Type II, Type III, Type IV, or Type V CRISPR array.

В области техники хорошо известно, что транспозоны могут быть созданы при помощи, например, ПЦР амплификации или синтеза созданной ДНК и могут быть введены любым способом трансформации.It is well known in the art that transposons can be generated by, for example, PCR amplification or generated DNA synthesis, and can be introduced by any transformation method.

В некоторых вариантах осуществления изобретения предоставляется способ отбора одной или более бактериальных, архейных, водорослевых или дрожжевых клеток, имеющих уменьшенный размер генома, из популяции бактериальных, архейных, водорослевых или дрожжевых клеток, включающий введение в популяцию бактериальных, архейных, водорослевых или дрожжевых клеток (а) конструкции гетерологичной нуклеиновой кислоты, содержащей транс-активирующую CRISPR (tracr) нуклеиновую кислоту, (b) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR (сгРНК, сгДНК), содержащий последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер по меньшей мере одной последовательности повторспейсер и по меньшей мере одной последовательности повтор-спейсер-повтор содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме бактериальных, архейных, водорослевых или дрожжевых клеток указанной популяции, и (с) Cas9 полипептида или конструкции гетерологичной нуклеиновой кислоты, содержащей полинуклеотид, кодирующий Cas9 полипептид, причем клетки, содержащие область-мишень уничтожаются, таким образом осуществляя отбор одной или более бактериальных, архейных, водорослевых или дрожжевых клеток, не содержащих область-мишень и имеющих уменьшенный размер генома, из популяции бактериальных, архейных, водорослевых или дрожжевых клеток.In some embodiments, a method is provided for selecting one or more bacterial, archaeal, algal, or yeast cells having a reduced genome size from a population of bacterial, archaeal, algal, or yeast cells, comprising introducing into the population of bacterial, archaeal, algal, or yeast cells (a ) a heterologous nucleic acid construct comprising a trans-activating CRISPR (tracr) nucleic acid, (b) a heterologous nucleic acid construct comprising a CRISPR (sgRNA, sgDNA) array containing a repeat-spacer-repeat sequence or at least one repeat-spacer sequence wherein the spacer of at least one repeat-spacer and at least one repeat-spacer-repeat sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome of said population of bacterial, archaeal, algal, or yeast cells, and (c) Cas9 polypeptide or heterologous nucleic acid construct containing a polynucleotide encoding a Cas9 polypeptide, wherein cells containing the target region are killed, thereby selecting one or more bacterial, archaeal, algal, or yeast cells that do not contain the target region and have a reduced genome size , from a population of bacterial, archaeal, algal, or yeast cells.

В других вариантах осуществления предоставляется способ отбора одной или более бактериальных, архейных, водорослевых или дрожжевых клеток, имеющих уменьшенный размер генома, из популяцииIn other embodiments, a method is provided for selecting one or more bacterial, archaeal, algal, or yeast cells having a reduced genome size from a population

- 27 042506 бактериальных, архейных, водорослевых или дрожжевых клеток, включающий введение в популяцию бактериальных, архейных, водорослевых или дрожжевых клеток (a) (i) одной или более конструкции гетерологичной нуклеиновой кислоты, содержащей нуклеотидную последовательность, имеющую по меньшей мере 80% идентичности по меньшей мере 300 последовательным нуклеотидам, присутствующим в геноме указанных клеток бактерий, или (ii) двух или более конструкций гетерологичной нуклеиновой кислоты, содержащих по меньшей мере один транспозон, таким образом создавая популяцию трансгенных бактериальных, архейных, водорослевых или дрожжевых клеток, содержащих неприродный сайт для гомологичной рекомбинации между одной или более конструкциями гетерологичной нуклеиновой кислоты, интегрированными в геном, и по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме, или между первым и вторым транспозонами, интегрированными в геном; и (b) (i) конструкции гетерологичной нуклеиновой кислоты, содержащей транс-активирующую CRISPR (tracr) нуклеиновую кислоту, (ii) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR (сгРНК, сгДНК), содержащий последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной по меньшей мере одной последовательности повтор-спейсер и по меньшей мере одной последовательности повтор-спейсер-повтор содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме одной или более бактериальных, архейных, водорослевых или дрожжевых клеток в указанной популяции, и (iii) Cas9 полипептида и/или конструкции гетерологичной нуклеиновой кислоты, содержащей полинуклеотид, кодирующий Cas9 полипептид, причем область-мишень расположена между одной или более конструкциями гетерологичной нуклеиновой кислоты, введенными в геном, и по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме, и/или между первым транспозоном и вторым транспозоном, причем клетки, содержащие область-мишень уничтожаются, а клетки, не содержащие область-мишень выживают, таким образом осуществляя отбор одной или более бактериальных, архейных, водорослевых или дрожжевых клеток, не содержащих область-мишень и имеющих уменьшенный размер генома, из популяции трансгенных бактериальных, архейных, водорослевых или дрожжевых клеток.- 27 042506 bacterial, archaeal, algal or yeast cells, which includes introducing into the population of bacterial, archaeal, algal or yeast cells (a) (i) one or more heterologous nucleic acid constructs containing a nucleotide sequence having at least 80% identity in at least 300 consecutive nucleotides present in the genome of said bacterial cells, or (ii) two or more heterologous nucleic acid constructs containing at least one transposon, thereby creating a population of transgenic bacterial, archaeal, algal or yeast cells containing a non-natural site for homologous recombination between one or more heterologous nucleic acid constructs integrated into the genome and at least 300 consecutive nucleotides present in the genome, or between the first and second transposons integrated into the genome; and (b) (i) a heterologous nucleic acid construct comprising a trans-activating CRISPR (tracr) nucleic acid, (ii) a heterologous nucleic acid construct comprising a CRISPR (sgRNA, ssDNA) array containing a repeat-spacer-repeat sequence or at least at least one repeat-spacer sequence, wherein the spacer of said at least one repeat-spacer sequence and at least one repeat-spacer-repeat sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome of one or more bacterial, archaeal, algal or yeast cells in said population, and (iii) a Cas9 polypeptide and/or a heterologous nucleic acid construct comprising a polynucleotide encoding a Cas9 polypeptide, wherein the target region is located between one or more heterologous nucleic acid constructs introduced into the genome and at least at least 300 consecutive nucleotides, present within the genome and/or between the first transposon and the second transposon, wherein cells containing the target region are destroyed and cells not containing the target region survive, thus selecting one or more bacterial, archaeal, algal or yeast cells without containing the target region and having a reduced genome size, from a population of transgenic bacterial, archaeal, algal or yeast cells.

В некоторых аспектах уменьшенный размер генома может быть уменьшен по сравнению с контролем. В некоторых аспектах контроль может представлять собой популяцию дикого типа бактериальных, архейных, водорослевых или дрожжевых клеток или популяцию бактериальных, архейных, водорослевых или дрожжевых клеток, трансформированных гетерологичной конструкцией, содержащей массив CRISPR (например, CRISPR типа I, типа II, типа III, типа IV или типа V), содержащий последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая не является комплементарной области-мишени в геноме бактериальных, архейных, водорослевых или дрожжевых клеток указанной популяции (т.е. несамонацеленный/скремблированный спейсер). В другом аспекте контроль может представлять собой популяцию бактериальных, архейных, водорослевых или дрожжевых клеток, трансформированных конструкцией гетерологичной нуклеиновой кислоты, содержащей массив CRISPR, содержащий последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повтор-спейсерповтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме бактериальных, архейных, водорослевых или дрожжевых клеток указанной популяции, но не содержит мотив, примыкающий к протоспейсеру (PAM).In some aspects, the reduced genome size can be reduced compared to the control. In some aspects, the control may be a wild-type population of bacterial, archaeal, algal, or yeast cells, or a population of bacterial, archaeal, algal, or yeast cells transformed with a heterologous construct containing a CRISPR array (e.g., CRISPR type I, type II, type III, type IV or type V) containing a repeat-spacer-repeat sequence or at least one repeat-spacer sequence, wherein the spacer of said repeat-spacer-repeat sequence or of said at least one repeat-spacer sequence contains a nucleotide sequence that is not a complementary target region in the genome of the bacterial, archaeal, algal or yeast cells of the specified population (i.e. non-self-targeted/scrambled spacer). In another aspect, the control may be a population of bacterial, archaeal, algal, or yeast cells transformed with a heterologous nucleic acid construct comprising a CRISPR array containing a repeat-spacer-repeat sequence or at least one repeat-spacer sequence in which the spacer of said sequence is a repeat -spacer repeat or said at least one repeat-spacer sequence contains a nucleotide sequence that is essentially complementary to the target region in the genome of bacterial, archaeal, algal or yeast cells of the specified population, but does not contain a motif adjacent to the protospacer (PAM).

В некоторых вариантах осуществления предоставляется способ идентификации в популяции бактерий по меньшей мере одного изолята, содержащего делецию в своем геноме (например, хромосомную и/или плазмидную делецию), включающий введение в указанную популяцию бактериальных клеток конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR (сгРНК, сгДНК), содержащий (в 5'-3' направлении) последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме одной или более бактериальных клеток указанной популяции, и клетки, содержащие область-мишень, уничтожаются, таким образом создавая популяцию трансформированных бактериальных клеток, не содержащих область-мишень; и выращивание отдельных бактериальных колоний из популяции трансформированных бактериальных клеток, таким образом осуществляя идентификацию по меньшей мере одного изолята из популяции трансформированных бактерий, имеющих делецию в своем геноме.In some embodiments, a method is provided for identifying at least one isolate in a population of bacteria that contains a deletion in its genome (e.g., a chromosomal and/or plasmid deletion), comprising introducing into said population of bacterial cells a heterologous nucleic acid construct containing a CRISPR array (sgRNA, sgDNA) containing (in the 5'-3' direction) a repeat-spacer-repeat sequence or at least one repeat-spacer sequence, wherein the spacer of said repeat-spacer-repeat sequence or of said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome of one or more bacterial cells of said population, and cells containing the target region are destroyed, thereby creating a population of transformed bacterial cells not containing the target region; and growing individual bacterial colonies from the population of transformed bacterial cells, thereby identifying at least one isolate from the population of transformed bacteria having a deletion in its genome.

Массив CRISPR, используемый в этом изобретении, может быть массивом CRISPR типа I, типа II, типа III, типа IV или типа V.The CRISPR array used in this invention may be a Type I, Type II, Type III, Type IV, or Type V CRISPR array.

- 28 042506- 28 042506

В других вариантах осуществления изобретения предоставляется способ идентификации в популяции бактерий по меньшей мере одного изолята, содержащего делецию в своем геноме, включающий введение в популяцию бактериальных клеток (a) (i) одной или более конструкции гетерологичной нуклеиновой кислоты, содержащей нуклеотидную последовательность, имеющую по меньшей мере 80% идентичности по меньшей мере 300 последовательным нуклеотидам, присутствующим в геноме указанных бактериальных клеток, или (ii) двух или более конструкций гетерологичной нуклеиновой кислоты, содержащих по меньшей мере один транспозон, таким образом создавая популяцию трансгенных бактериальных клеток, содержащих неприродный сайт для гомологичной рекомбинации между одной или более конструкциями гетерологичной нуклеиновой кислоты, интегрированными в геном, и по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме, или между первым и вторым транспозонами, интегрированными в геном; и (b) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR (сгРНК, сгДНК), содержащий последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме одной или более бактериальных клеток в указанной популяции, причем эта область-мишень расположена между одной или более конструкциями гетерологичной нуклеиновой кислоты, введенными в геном, и по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме, и/или между первым транспозоном и вторым транспозоном, и клетки, содержащие область-мишень уничтожаются [а клетки, не содержащие область-мишень, выживают], таким образом создавая популяцию трансформированных бактериальных клеток, не содержащих область-мишень; и выращивание отдельных бактериальных колоний из популяции трансформированных бактериальных клеток, таким образом осуществляя идентификацию по меньшей мере одного изолята из популяции бактерий, имеющих делецию в своем геноме.In other embodiments, the invention provides a method for identifying in a population of bacteria at least one isolate containing a deletion in its genome, comprising introducing into the population of bacterial cells (a) (i) one or more heterologous nucleic acid constructs containing a nucleotide sequence having at least at least 80% identity to at least 300 consecutive nucleotides present in the genome of said bacterial cells, or (ii) two or more heterologous nucleic acid constructs containing at least one transposon, thereby creating a population of transgenic bacterial cells containing a non-natural site for a homologous recombination between one or more heterologous nucleic acid constructs integrated into the genome and at least 300 consecutive nucleotides present in the genome, or between the first and second transposons integrated into the genome; and (b) a heterologous nucleic acid construct comprising a CRISPR (sgRNA, ssDNA) array containing a repeat-spacer-repeat sequence or at least one repeat-spacer sequence, wherein the spacer contains a nucleotide sequence that is substantially complementary to a target region in genome of one or more bacterial cells in a specified population, the target region being located between one or more heterologous nucleic acid constructs introduced into the genome and at least 300 contiguous nucleotides present in the genome and/or between a first transposon and a second transposon , and cells containing the target region are destroyed [and cells not containing the target region survive], thus creating a population of transformed bacterial cells not containing the target region; and growing individual bacterial colonies from the population of transformed bacterial cells, thereby identifying at least one isolate from the population of bacteria having a deletion in its genome.

Массив CRISPR, используемый в этом изобретении, может быть массивом CRISPR типа I, типа II, типа III, типа IV или типа V.The CRISPR array used in this invention may be a Type I, Type II, Type III, Type IV, or Type V CRISPR array.

В других вариантах осуществления изобретения предоставляется способ идентификации в популяции бактерий, архей, водорослей или дрожжей по меньшей мере одного изолята, имеющего делецию в своем геноме, включающий введение в популяцию бактериальных, архейных, водорослевых или дрожжевых клеток (а) конструкции гетерологичной нуклеиновой кислоты, содержащей транс-активирующую CRISPR (tracr) нуклеиновую кислоту, (b) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR (сгРНК, сгДНК), содержащий последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме (например, хромосомном, митохондриальном и/или плазмидном геноме) бактериальных, архейных, водорослевых или дрожжевых клеток указанной популяции, и (с) Cas9 полипептида, причем клетки, содержащие область-мишень уничтожаются, таким образом создавая популяцию трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток, не содержащих область-мишень; и выращивание отдельных бактериальных, архейных, водорослевых или дрожжевых колоний из популяции трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток, таким образом осуществляя идентификацию по меньшей мере одного изолята из популяции трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток, имеющих делецию в своем геноме.In other embodiments, the invention provides a method for identifying in a population of bacteria, archaea, algae or yeast at least one isolate having a deletion in its genome, comprising introducing into the population of bacterial, archaeal, algal or yeast cells (a) a heterologous nucleic acid construct containing a trans-activating CRISPR (tracr) nucleic acid, (b) a heterologous nucleic acid construct comprising a CRISPR array (ssRNA, ssDNA) containing a repeat-spacer-repeat sequence or at least one repeat-spacer sequence, in which the spacer of said sequence is a repeat - spacer-repeat or said at least one repeat-spacer sequence contains a nucleotide sequence that is essentially complementary to the target region in the genome (for example, chromosomal, mitochondrial and/or plasmid genome) of bacterial, archaeal, algal or yeast cells of the specified population, And (c) a Cas9 polypeptide, wherein cells containing the target region are killed, thereby creating a population of transformed bacterial, archaeal, algal, or yeast cells lacking the target region; and growing single bacterial, archaeal, algal, or yeast colonies from the population of transformed bacterial, archaeal, algal, or yeast cells, thereby identifying at least one isolate from the population of transformed bacterial, archaeal, algal, or yeast cells having a deletion in its genome.

В других вариантах осуществления изобретения предоставляется способ идентификации в популяции бактерий, архей, водорослей или дрожжей по меньшей мере одного изолята, имеющего делецию в своем геноме, включающий введение в популяцию бактериальных, архейных, водорослевых и дрожжевых клеток (a) (i) одной или более конструкции гетерологичной нуклеиновой кислоты, содержащей нуклеотидную последовательность, имеющую по меньшей мере 80% идентичности с по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме указанных бактериальных, архейных, водорослевых и дрожжевых клеток, или (ii) двух или более конструкций гетерологичной нуклеиновой кислоты, содержащих по меньшей мере один транспозон, таким образом создавая популяцию трансгенных бактериальных, архейных, водорослевых и дрожжевых клеток, содержащих неприродный сайт для гомологичной рекомбинации между одной или более конструкциями гетерологичной нуклеиновой кислоты, интегрированными в геном, и по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме, или между первым и вторым транспозонами, интегрированными в геном; и (b) (i) конструкции гетерологичной нуклеиновой кислоты, содержащей транс-активирующуюIn other embodiments, the invention provides a method for identifying in a population of bacteria, archaea, algae or yeast at least one isolate having a deletion in its genome, comprising introducing into the population of bacterial, archaeal, algal and yeast cells (a) (i) one or more a heterologous nucleic acid construct comprising a nucleotide sequence having at least 80% identity with at least 300 consecutive nucleotides present in the genome of said bacterial, archaeal, algal, and yeast cells, or (ii) two or more heterologous nucleic acid constructs containing at least one transposon, thereby creating a population of transgenic bacterial, archaeal, algal, and yeast cells containing a non-natural site for homologous recombination between one or more heterologous nucleic acid constructs integrated into the genome, and at least 300 sequences single nucleotides present in the genome or between the first and second transposons integrated into the genome; and (b) (i) a heterologous nucleic acid construct containing a trans-activating

- 29 042506- 29 042506

CRISPR (tracr) нуклеиновую кислоту, (ii) конструкции гетерологичной нуклеиновой кислоты, содержащей массив CRISPR (сгРНК, сгДНК), содержащий последовательность повтор-спейсер-повтор или по меньшей мере одну последовательность повтор-спейсер, в которой спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в геноме одной или более бактериальных, архейных, водорослевых или дрожжевых клеток в указанной популяции, и (iii) Cas9 полипептида и/или конструкции гетерологичной нуклеиновой кислоты, содержащей полинуклеотид, кодирующий Cas9 полипептид, причем область-мишень расположена между одной или более конструкциями гетерологичной нуклеиновой кислоты, введенными в геном, и по меньшей мере 300 последовательными нуклеотидами, присутствующими в геноме, и/или между первым транспозоном и вторым транспозоном, причем клетки, содержащие область-мишень уничтожаются, а клетки, не содержащие область-мишень выживают, таким образом создавая популяцию трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток, не содержащих область-мишень; и выращивание отдельных бактериальных, архейных, водорослевых или дрожжевых колоний из популяции трансформированных бактериальных, архейных, водорослевых или дрожжевых клеток, таким образом осуществляя идентификацию по меньшей мере одного изолята из популяции, имеющей делецию в своем геноме.CRISPR (tracr) nucleic acid, (ii) a heterologous nucleic acid construct comprising a CRISPR (sgRNA, ssDNA) array containing a repeat-spacer-repeat sequence or at least one repeat-spacer sequence, in which the spacer contains a nucleotide sequence that is substantially complementary to a target region in the genome of one or more bacterial, archaeal, algal or yeast cells in said population, and (iii) a Cas9 polypeptide and/or a heterologous nucleic acid construct comprising a polynucleotide encoding a Cas9 polypeptide, wherein the target region is located between one or more heterologous nucleic acid constructs introduced into the genome and at least 300 consecutive nucleotides present in the genome and/or between the first transposon and the second transposon, cells containing the target region are destroyed and cells not containing the target region survive, thus creating a population of transforms shaped bacterial, archaeal, algal or yeast cells that do not contain the target region; and growing individual bacterial, archaeal, algal, or yeast colonies from the population of transformed bacterial, archaeal, algal, or yeast cells, thereby identifying at least one isolate from the population having the deletion in its genome.

В некоторых вариантах осуществления приспособляемость/скорость роста может быть увеличена за счет уменьшения размера генома или путем удаления выбранных генов (кодирующих полипептиды или функциональные нуклеиновые кислоты (например, регуляторы транскрипции)), которые требуют большого количества энергии для транскрипции и трансляции. Таким образом, в некоторых вариантах осуществления предлагается способ увеличения приспособляемости или скорости роста популяции бактериальных, археальных, водорослевых или дрожжевых клеток, включающий выбор уменьшенного размера генома (например, выбор по отсутствию части генома) и/или делеции в геномах бактериальных, архейных, водорослевых или дрожжевых клеток популяций, как раскрыто в настоящем описании. В некоторых вариантах осуществления делеция может содержать один ген или более одного гена. Следовательно, в результате уменьшения размера генома или удаления конкретного гена или генов клетки популяции больше не будут тратить энергию на транскрипцию/трансляцию части отсутствующего генома или удаленного гена или генов; тем самым уменьшается потребность в энергии и улучшается приспособляемость по сравнению с контрольной популяцией, все еще содержащей указанную часть генома и/или указанный ген или гены.In some embodiments, fitness/growth rate can be increased by reducing the size of the genome, or by removing selected genes (coding for polypeptides or functional nucleic acids (e.g., transcriptional regulators)) that require a lot of energy for transcription and translation. Thus, in some embodiments, a method is provided for increasing the fitness or growth rate of a population of bacterial, archaeal, algal, or yeast cells, comprising selecting a reduced genome size (e.g., selecting for the absence of a portion of the genome) and/or deletions in the genomes of the bacterial, archaeal, algal, or yeast cell populations, as disclosed in the present description. In some embodiments, the implementation of the deletion may contain one gene or more than one gene. Therefore, by reducing the size of the genome or deleting a particular gene or genes, the cells of the population will no longer expend energy on transcription/translation of a portion of the missing genome or the deleted gene or genes; thereby reducing energy requirements and improving fitness compared to a control population still containing said part of the genome and/or said gene or genes.

В других вариантах осуществления предлагается способ увеличения количества продукта, полученного из популяции бактериальных, архейных, водорослевых или дрожжевых клеток, включая увеличение приспособляемости или скорости роста клетки путем отбора в отношении делеции в геномах бактериальных, архейных, водорослевых или дрожжевых клеток, как раскрыто в настоящем описании. В некоторых вариантах осуществления продукты могут включать без ограничения антибиотики, вторичные метаболиты, витамины, белки, ферменты, кислоты и фармацевтические препараты.In other embodiments, a method is provided for increasing the amount of a product derived from a population of bacterial, archaeal, algal, or yeast cells, including increasing the fitness or growth rate of a cell by selecting for a deletion in the bacterial, archaeal, algal, or yeast cell genomes, as disclosed herein. . In some embodiments, products may include, without limitation, antibiotics, secondary metabolites, vitamins, proteins, enzymes, acids, and pharmaceuticals.

В некоторых вариантах осуществления массив CRISPR (сгРНК, сгДНК), используемый в этом изобретении, может представлять собой массив любой из CRISPR-Cas системы типа I, CRISPR-Cas системы типа II, CRISPR-Cas системы типа III, CRISPR-Cas системы типа IV или CRISPR-Cas системы типа V.In some embodiments, the array of CRISPR (sgRNA, ssDNA) used in this invention may be an array of any of CRISPR-Cas system type I, CRISPR-Cas system type II, CRISPR-Cas system type III, CRISPR-Cas system type IV or CRISPR-Cas Type V systems.

Что касается предшествующих вариантов осуществления, то конструкция гетерологичной нуклеиновой кислоты, содержащая tracr нуклеиновую кислоту, и конструкция гетерологичной нуклеиновой кислоты, содержащая массив CRISPR, может быть включена и введена в одну и ту же конструкцию (например, экспрессионную кассету или вектор) или в разные конструкции. В конкретных вариантах осуществления конструкция гетерологичной нуклеиновой кислоты, содержащая tracr нуклеиновую кислоту, и конструкция гетерологичной нуклеиновой кислоты, содержащая массив CRISPR, могут быть включены в одну конструкцию (например, экспрессионную кассету и/или вектор), которая может необязательно дополнительно содержать полинуклеотид, кодирующий полипептид Cas9. В некоторых вариантах осуществления конструкция гетерологичной нуклеиновой кислоты, содержащая tracr нуклеиновую кислоту, и конструкция гетерологичной нуклеиновой кислоты, содержащая массив CRISPR, могут быть функционально связаны с одним промотором и/или отдельными промоторами.With respect to the foregoing embodiments, a heterologous nucleic acid construct comprising a tracr nucleic acid and a heterologous nucleic acid construct comprising a CRISPR array may be included and introduced into the same construct (e.g., an expression cassette or vector) or into different constructs. . In specific embodiments, a heterologous nucleic acid construct comprising a tracr nucleic acid and a heterologous nucleic acid construct comprising a CRISPR array may be included in a single construct (e.g., expression cassette and/or vector), which may optionally further comprise a polynucleotide encoding a polypeptide. Cas9. In some embodiments, a heterologous nucleic acid construct comprising a tracr nucleic acid and a heterologous nucleic acid construct comprising a CRISPR array may be operably linked to the same promoter and/or separate promoters.

В некоторых вариантах осуществления конструкция гетерологичной нуклеиновой кислоты, содержащая транс-активирующую CRISPR (tracr) нуклеиновую кислоту, и конструкция гетерологичной нуклеиновой кислоты, содержащая массив CRISPR (сгРНК, сгДНК), могут быть включены в гид CRISPR (gРНК, gДНК). В некоторых вариантах осуществления гид CRISPR может быть функционально связан с промотором.In some embodiments, a heterologous nucleic acid construct comprising a trans-activating CRISPR (tracr) nucleic acid and a heterologous nucleic acid construct comprising a CRISPR array (sgRNA, ssDNA) may be included in a CRISPR guide (gRNA, gDNA). In some embodiments, a CRISPR guide may be operably linked to a promoter.

В некоторых вариантах осуществления полипептид Cas9, используемый в этом изобретении, имеет по меньшей мере 70% идентичности (например, примерно 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% и т.п.) с аминокислотной последовательностью нуклеазы Cas9. Примерами нуклеаз Cas9, применимыми в этом изобретении, могут быть любые нуклеазы Cas9, в отношении которых известно, что они катализируют расщепление ДНК в CRISPR-Cas системе. В данной области известно, что такие нуклеазы Cas9 содержат мотив HNH и мотив RuvCIn some embodiments, the Cas9 polypeptide used in this invention has at least 70% identity (e.g., about 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83 , 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99%, etc.) with the amino acid sequence of Cas9 nuclease. Examples of Cas9 nucleases useful in this invention are any Cas9 nucleases known to catalyze DNA cleavage in the CRISPR-Cas system. Such Cas9 nucleases are known in the art to contain an HNH motif and a RuvC motif.

- 30 042506 (см., например, WO 0201/176772, WO 2013/188638). В некоторых вариантах осуществления настоящего изобретения может быть использован функциональный фрагмент нуклеазы Cas9.- 30 042506 (see, for example, WO 0201/176772, WO 2013/188638). In some embodiments of the present invention, a functional fragment of the Cas9 nuclease can be used.

CRISPR-Cas системы и группировки нуклеаз Cas9 хорошо известны в данной области и включают, например, Streptococcus thermophilus CRISPR1 (Sth CR1) группу нуклеаз Cas9, Streptococcus thermophilus CRISPR3 (Sth CR3) группу нуклеаз Cas9, Lactobacillus buchneri CD034 (Lb) группу нуклеаз Cas9 и Lactobacillus rhamnosus GG (Lrh) группу нуклеаз Cas9. Дополнительные нуклеазы Cas9 включают без ограничения Lactobacillus curvatus CRL 705. Кроме того, нуклеазы Cas9, используемые в этом изобретении, включают без ограничения Cas9 из Lactobacillus animalis KCTC 3501 и Lactobacillus farciminis, WP 010018949.1.CRISPR-Cas systems and Cas9 nuclease groups are well known in the art and include, for example, Streptococcus thermophilus CRISPR1 (Sth CR1) Cas9 nuclease group, Streptococcus thermophilus CRISPR3 (Sth CR3) Cas9 nuclease group, Lactobacillus buchneri CD034 (Lb) Cas9 nuclease group, and Lactobacillus rhamnosus GG (Lrh) Cas9 nuclease group. Additional Cas9 nucleases include, without limitation, Lactobacillus curvatus CRL 705. In addition, Cas9 nucleases used in this invention include, without limitation, Cas9 from Lactobacillus animalis KCTC 3501 and Lactobacillus farciminis, WP 010018949.1.

Помимо этого, в конкретных вариантах осуществления нуклеаза Cas9 может кодироваться нуклеотидной последовательностью, которая является оптимизированной по кодонам в отношении организма, содержащего ДНК-мишень. В других вариантах осуществления нуклеаза Cas9 может содержать по меньшей мере одну последовательность ядерной локализации.In addition, in specific embodiments, the Cas9 nuclease may be encoded by a nucleotide sequence that is codon-optimized for the organism containing the target DNA. In other embodiments, the Cas9 nuclease may comprise at least one nuclear localization sequence.

В некоторых вариантах осуществления полипептид типа I, используемый в настоящем изобретении, имеет по меньшей мере 70% идентичности (например, примерно 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% и т.п.) с аминокислотной последовательностью Cas3, Cas3' нуклеазы, Cas3 нуклеазы, их рекомбинантными вариантами. В некоторых вариантах осуществления каскадный полипептид типа I, используемый в настоящем изобретении, имеет по меньшей мере 70% идентичности (например, примерно 70, 71, 72, 73, 74, 75, 76, 77, 78 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% и т.п.) с аминокислотной последовательностью Cas7 (Csa2), Cas8a1 (Csx13), Cas8a2 (Csx9), Cas5, Csa5, Cas6a, Cas6b, Cas8b (Csh1), Cas7 (Csh2), Cas5, Cas5d, Cas8c (Csd1l), Cas7 (Csd2), Cas10d (Csc3), Csc2, Csc1, Cas6d, Cse1 (CasA), Cse2 (CasB), Cas7 (CasC), Cas5 (CasD), Cas6e (CasE), Cys1, Cys2, Cas7 (Cys3), Cas6f (Csy4), Cas6 и/или Cas4.In some embodiments, the type I polypeptide used in the present invention has at least 70% identity (e.g., about 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99%, etc.) with the amino acid sequence of Cas3, Cas3' nuclease, Cas3 nucleases, their recombinant variants. In some embodiments, the type I cascade polypeptide used in the present invention has at least 70% identity (e.g., about 70, 71, 72, 73, 74, 75, 76, 77, 78 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99%, etc.) with the amino acid sequence Cas7 (Csa2), Cas8a1 ( Csx13), Cas8a2 (Csx9), Cas5, Csa5, Cas6a, Cas6b, Cas8b (Csh1), Cas7 (Csh2), Cas5, Cas5d, Cas8c (Csd1l), Cas7 (Csd2), Cas10d (Csc3), Csc2, Csc1, Cas6d , Cse1 (CasA), Cse2 (CasB), Cas7 (CasC), Cas5 (CasD), Cas6e (CasE), Cys1, Cys2, Cas7 (Cys3), Cas6f (Csy4), Cas6 and/or Cas4.

CRISPR-Cas системы типа I хорошо известны в данной области техники и включают, например, Archaeoglobus fulgidus, содержащий приводимую в качестве примера CRISPR-Cas систему типа I-A, Clostridium kluyveri DSM 555, содержащий приводимую в качестве примера CRISPR-Cas систему типа I-B, Bacillus halodurans C-125, содержащий приводимую в качестве примера CRISPR-Cas систему типа I-C, Cyanothece sp. PCC 802, содержащий приводимую в качестве примера CRISPR-Cas систему типа I-D, Escherichia coli K-12, содержащий приводимую в качестве примера CRISPR-Cas систему типа I-Е, Geobacter sulfurreducens, содержащий приводимую в качестве примера CRISPR-Cas систему типа I-U, и Yersinia pseudotuberculosis YPIII, содержащий приводимую в качестве примера CRISPR-Cas систему типа I-F.Type I CRISPR-Cas systems are well known in the art and include, for example, Archaeoglobus fulgidus containing the exemplary Type I-A CRISPR-Cas system, Clostridium kluyveri DSM 555 containing the exemplary Type I-B CRISPR-Cas system, Bacillus halodurans C-125 containing the exemplary CRISPR-Cas type I-C system, Cyanothece sp. PCC 802 containing exemplary CRISPR-Cas system type I-D, Escherichia coli K-12 containing exemplary CRISPR-Cas system type I-E, Geobacter sulfurreducens containing exemplary CRISPR-Cas system type I-U, and Yersinia pseudotuberculosis YPIII containing the exemplary CRISPR-Cas type I-F system.

В некоторых вариантах осуществления полипептид типа II, пригодный для данного изобретения, имеет по меньшей мере 70% идентичности (например, примерно 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% и т.п.) с аминокислотной последовательностью Cas9. CRISPR-Cas системы типа II хорошо известные в данной области техники и включают, например, штаммы Legionella pneumophila Paris, Streptococcus thermophilus CNRZ1066 и Neisseria lactamica 020-06.In some embodiments, a type II polypeptide useful in this invention has at least 70% identity (e.g., about 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99%, etc.) with the amino acid sequence Cas9. Type II CRISPR-Cas systems are well known in the art and include, for example, strains of Legionella pneumophila Paris, Streptococcus thermophilus CNRZ1066 and Neisseria lactamica 020-06.

В некоторых вариантах осуществления полипептид типа III, используемый в этом изобретении, имеет по меньшей мере 70% идентичности (например, примерно 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% и т.п.) с аминокислотной последовательностью Cas6, Cas10 (или Csm1), Csm2, Csm3, Csm4, Csm5, и Csm6, Cmr1, Cas10 (или Cmr2), Cmr3, Cmr4, Cmr5, и Cmr6, Cas7, Cas10, Cas7 (Csm3), Cas5 (Csm4), Cas7 (Csm5), Csm6, Cas7 (Cmr1), Cas5 (Cmr3), Cas7 (Cmr4), Cas7 (Cmr6), Cas7 (Cmr6), Cmr5, Cas5 (Cmr3), Cas5 (Csx10), Csm2, Cas7 (Csm3) и all1473. CRISPR-Cas системы типа III хорошо известны в данной области и включают, например, Staphylococcus epidermidis RP62A, содержащий приводимую в качестве примера CRISPR-Cas систему типа III-A, Pyrococcus furiosus DSM 3638, содержащий приводимую в качестве примера CRISPR-Cas систему типа III-B, штамм Metanothermobacter thermautotrophicus Delta H, содержащий приводимую в качестве примера CRISPR-Cas систему типа III-C, и Roseiflexis sp. Rs-1, содержащий приводимую в качестве примера CRISPR-Cas систему типа III-D.In some embodiments, the type III polypeptide used in this invention has at least 70% identity (e.g., about 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99%, etc.) with the amino acid sequence Cas6, Cas10 (or Csm1) , Csm2, Csm3, Csm4, Csm5, and Csm6, Cmr1, Cas10 (or Cmr2), Cmr3, Cmr4, Cmr5, and Cmr6, Cas7, Cas10, Cas7 (Csm3), Cas5 (Csm4), Cas7 (Csm5), Csm6, Cas7 (Cmr1), Cas5 (Cmr3), Cas7 (Cmr4), Cas7 (Cmr6), Cas7 (Cmr6), Cmr5, Cas5 (Cmr3), Cas5 (Csx10), Csm2, Cas7 (Csm3) and all1473. Type III CRISPR-Cas systems are well known in the art and include, for example, Staphylococcus epidermidis RP62A containing the exemplary Type III-A CRISPR-Cas system, Pyrococcus furiosus DSM 3638 containing the exemplary Type III CRISPR-Cas system -B, a strain of Methanothermobacter thermautotrophicus Delta H containing the exemplary type III-C CRISPR-Cas system, and Roseiflexis sp. Rs-1 containing the exemplary CRISPR-Cas type III-D system.

В некоторых вариантах осуществления полипептид типа IV, используемый в настоящем изобретении, имеет по меньшей мере 70% идентичности (например, примерно 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% и т.п.) с аминокислотной последовательностью Csf4 (dinG), Csf1, Cas7 (Csf2) и/или Cas5 (csf3). CRISPR-Cas системы типа IV хорошо известны в данной области, например, Acidithiobacillus ferrooxidans ATCC 23270 содержит приводимую в качестве примера CRISPR-Cas систему типа IV.In some embodiments, the type IV polypeptide used in the present invention has at least 70% identity (e.g., about 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99%, etc.) with the amino acid sequence Csf4 (dinG), Csf1, Cas7 (Csf2) and/or Cas5 (csf3). Type IV CRISPR-Cas systems are well known in the art, for example, Acidithiobacillus ferrooxidans ATCC 23270 contains the exemplary Type IV CRISPR-Cas system.

В некоторых вариантах осуществления полипептид типа V, пригодный для данного изобретения, имеет по меньшей мере 70% идентичности (например, примерно 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% и т.п.) с аминокислотной последовательностью Cpf1, Cas1, Cas2 или Cas4. CRISPR-Cas системы типа V хорошо известны в данной области и включают, например, Francisella cf. novicida Fx1, содержащий приводимую в качестве примера CRISPR-Cas систему типа V.In some embodiments, a type V polypeptide useful in this invention has at least 70% identity (e.g., about 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99%, etc.) with the amino acid sequence Cpf1, Cas1, Cas2 or Cas4 . Type V CRISPR-Cas systems are well known in the art and include, for example, Francisella cf. novicida Fx1 containing the exemplary CRISPR-Cas type V system.

В настоящем описании также представлены экспрессионные кассеты и векторы, содержащие кон- 31 042506 струкции нуклеиновых кислот, массивы нуклеиновых кислот, молекулы нуклеиновых кислот и/или нуклеотидные последовательности по настоящему изобретению, которые могут быть использованы со способами, раскрытыми в настоящем описании.Also provided herein are expression cassettes and vectors containing the nucleic acid constructs, nucleic acid arrays, nucleic acid molecules and/or nucleotide sequences of the present invention that can be used with the methods disclosed herein.

В других аспектах конструкции нуклеиновых кислот, массивы нуклеиновых кислот, молекулы нуклеиновых кислот и/или нуклеотидные последовательности по настоящему изобретению могут быть введены в клетку организма-хозяина. Можно использовать любую клетку/организм-хозяин, в отношении которого это изобретение применимо. Примеры организмов-хозяев включают бактерии, археи, водорослей и грибы (например, дрожжи).In other aspects of the nucleic acid construct, the nucleic acid arrays, nucleic acid molecules and/or nucleotide sequences of the present invention may be introduced into a host cell. Any host cell/organism to which this invention is applicable can be used. Examples of host organisms include bacteria, archaea, algae and fungi (eg yeast).

Далее изобретение описано со ссылкой на приведенные ниже примеры. Следует иметь в виду, что эти примеры не предназначены для ограничения объема формулы изобретения, а скорее предназначены для иллюстрации некоторых вариантов осуществления. Любые вариации в приведенных в качестве примера способах, которые возникают у специалиста в данной области, входят в объем настоящего изобретения.The invention is further described with reference to the following examples. It should be understood that these examples are not intended to limit the scope of the claims, but rather are intended to illustrate certain embodiments. Any variations in the exemplary methods that occur to a person skilled in the art are within the scope of the present invention.

ПримерыExamples

Пример 1. Бактериальные штаммы.Example 1. Bacterial strains.

Все бактериальные штаммы перечислены в табл. 1.All bacterial strains are listed in Table. 1.

Бактериальные культуры были криоконсервированы в подходящей среде для выращивания с 25% глицерином (об./об.) и хранились при -80°С. S. thermophilus размножали в среде Элликера (Elliker) (Difco), дополненной 1% говяжьим экстрактом (мac./об.) и 1,9% (мас./об.) β-глицерофосфата (Sigma), в статических аэробных условиях при 37°С или на твердой среде с 1,5% (мас./об.) агаром (Difco), инкубировали в анаэробных условиях при 37°С в течение 48 ч. В случае необходимости для отбора плазмиды в S. thermophilus использовали концентрации 2 мкг/мл эритромицина (Em) и 5 мкг/мл хлорамфеникола (Cm) (Sigma). Е.соН EC1000 размножали в аэробных условиях в бульоне Luria-Bertani (Difco) при 37°С или на твердой среде с сердечно-мозговым экстрактом (BHI) (Difco), дополненной 1,5% агаром. При необходимости отбор Е.coli с использование антибиотика выполняли при помощи 40 мкг/мл канамицина (Kn) и 150 мкг/мл Em для рекомбинантной Е.coli. Оценку скрининга производных S. thermophilus в отношении активности β-галактозидазы выполняли на качественном уровне путем дополнения синтетической среды Элликер 1% лактозой, 1,5% агаром и 0,04% бромокрезолом в качестве индикатора pH.Bacterial cultures were cryopreserved in a suitable growth medium with 25% glycerol (v/v) and stored at -80°C. S. thermophilus was propagated in Elliker's medium (Difco) supplemented with 1% beef extract (w/v) and 1.9% (w/v) β-glycerophosphate (Sigma) under static aerobic conditions at 37°C or on solid medium with 1.5% (w/v) agar (Difco), incubated under anaerobic conditions at 37°C for 48 hours. If necessary, concentrations of 2 µg/ml erythromycin (Em) and 5 µg/ml chloramphenicol (Cm) (Sigma). E. coH EC1000 was propagated aerobically in Luria-Bertani broth (Difco) at 37° C. or on brain heart extract (BHI) solid medium (Difco) supplemented with 1.5% agar. If necessary, the selection of E. coli using an antibiotic was performed using 40 μg/ml kanamycin (K n ) and 150 μg/ml Em for recombinant E. coli. Screening of S. thermophilus derivatives for β-galactosidase activity was qualitatively performed by supplementing Elliker Synthetic Medium with 1% lactose, 1.5% agar and 0.04% bromocresol as pH indicator.

Пример 2. Выделение и клонирование ДНК.Example 2 Isolation and cloning of DNA.

Все наборы, ферменты и реагенты использовались в соответствии с инструкциями производителей. Очистку и клонирование ДНК выполняли, как описано ранее (41). Вкратце, для очистки геномной ДНК из S. thermophilus использовали набор ZR Fungal/Bacterial MiniPrep kit (Zymo). Плазмидную ДНК выделяли из Е.coli при помощи набора Qiagen Spin miniprep kit (Qiagen). Высококачественную ПЦР-амплификацию ДНК выполняли с использованием ДНК-полимеразы PFU HS II (Stratagene). Обычные методы ПЦР проводили с использованием полимеразы Choice-Tag Blue (Denville). Праймеры для ПЦР амплификации приобретали у компании Integrated DNA Technologies (Coralville, IA). Экстракцию ДНК из агарозных гелей проводили при помощи набора Zymoclean DNA gel recovery kit (Zymo). Рестрикционные эндонуклеазы приобретали у компании Roche Molecular Biochemicals. Для лигирования использовали лигазу Т4 для быстрой сшивки (New England Biolabs). Секвенирование выполняли в Davis Sequencing Inc. (Davis, CA). Криоконсервированные, обработанные хлоридом рубидия компетентные клетки Е.coli получали как описано ранее (41). Создавали плазмиды с массивами нацеливания на lacZ, каждая из которых содержала в следующем порядке:All kits, enzymes and reagents were used in accordance with the manufacturer's instructions. DNA purification and cloning was performed as previously described (41). Briefly, the ZR Fungal/Bacterial MiniPrep kit (Zymo) was used to purify genomic DNA from S. thermophilus. Plasmid DNA was isolated from E. coli using the Qiagen Spin miniprep kit (Qiagen). High-quality PCR amplification of DNA was performed using PFU HS II DNA polymerase (Stratagene). Conventional PCR methods were performed using Choice-Tag Blue polymerase (Denville). Primers for PCR amplification were purchased from Integrated DNA Technologies (Coralville, IA). Extraction of DNA from agarose gels was performed using the Zymoclean DNA gel recovery kit (Zymo). Restriction endonucleases were purchased from Roche Molecular Biochemicals. For ligation, T4 fast crosslinking ligase (New England Biolabs) was used. Sequencing was performed at Davis Sequencing Inc. (Davis, Calif.). Cryopreserved, rubidium chloride-treated competent E. coli cells were prepared as previously described (41). Plasmids were created with lacZ targeting arrays, each containing, in the following order:

(1) нативную лидерную последовательность, специфичную для SthCRISPR1 или SthCRISPR3;(1) a native leader sequence specific for SthCRISPR1 or SthCRISPR3;

(2) нативные повторы, специфичные для CRISPR1 или CRISPR3;(2) native repeats specific for CRISPR1 or CRISPR3;

(3) спейсерную последовательность, специфичную для 5'-конца lacZ (4) другой нативный повтор (фиг. 1). Для создания каждой плазмиды перечисленные выше признаки последовательности упорядочивали в виде удлиненных олигомеров (табл. 2), объединяли при помощи сплайсинга методом удлинения перекрывающихся ПЦР-продуктов (42) и клонировали в pORI28 (фиг. 2).(3) a spacer sequence specific for the 5' end of lacZ; (4) another native repeat (FIG. 1). To create each plasmid, the sequence features listed above were sequenced as extended oligomers (Table 2), spliced together by extension of overlapping PCR products (42) and cloned into pORI28 (FIG. 2).

Пример 3. Отбор и разработка CRISPR спейсеров.Example 3. Selection and development of CRISPR spacers.

Программируемая специфичность хромосомного расщепления зависит от выбора требуемой последовательности спейсера, уникальной для аллеля-мишени. Специфичность дополнительно осложняется требуемым PAM, короткой консервативной последовательностью, которая должна находиться в последовательности-мишени в непосредственной близости от протоспейсера (21, 43). Таким образом, строгими критериями для отбора и создания спейсеров были местоположение консенсусных последовательностей PAM и случайная идентичность последовательности с инородными геномными локусами. Первым ограничением для предполагаемых протоспейсеров было местоположение всех предполагаемых последовательностей PAM в смысловой и антисмысловой нитях lacZ. В гене длиной 3081 нуклеотидов было найдено 22 сайта PAM для CRISPR1 (AGAAW) и 39 сайтов PAM для CRISPR3 (GGNG), которые оказались идентичными своим консенсусным последовательностям, полученным биоинформационным методом (21). После идентификации потенциальных спейсеров был проведен BLAST анализ полного протоспейсера, затравки и последовательности PAM относительно генома S. thermophilus LMD-9 для предот- 32 042506 вращения дополнительного таргетинга неспецифических локусов. Спейсеры для CRISPR1 и CRISPR3 имели разные последовательности и не соответствовали сайтам PAM, но были разработаны для нацеливания на 5'-конец lacZ, в результате чего предсказанные участки расщепления оказались друг от друга на расстоянии 6 нуклеотидов. Следовательно, лидерные последовательности, повторы и спейсеры на каждой плазмиде представляли собой ортогональные признаки, уникальные для CRISPR1 или CRISPR3, соответственно. Для оценки мутаций, зависимых от локусов-мишенеи, создавали дополнительную плазмиду CRISPR3 со спейсером в остатке, связывающем катион металла, который имеет важное значение для активности β-галактозидазы. Плазмиду с массивом CRISPR1, содержащую несамонацеленный спейсер, использовали в качестве контроля для количественной оценки летальности в результате самонацеливания.The programmed specificity of the chromosomal cleavage depends on the choice of the desired spacer sequence, unique to the target allele. Specificity is further complicated by the required PAM, a short conserved sequence that must be in the target sequence in close proximity to the protospacer (21, 43). Thus, the location of PAM consensus sequences and random sequence identity with foreign genomic loci were strict criteria for the selection and design of spacers. The first constraint on putative protospacers was the location of all putative PAM sequences in the sense and antisense strands of lacZ. In the 3081 nucleotide long gene, 22 PAM sites for CRISPR1 (AGAAW) and 39 PAM sites for CRISPR3 (GGNG) were found, which turned out to be identical to their bioinformatics consensus sequences (21). After potential spacers were identified, BLAST analysis of the complete protospacer, primer, and PAM sequence against the S. thermophilus LMD-9 genome was performed to prevent additional targeting of non-specific loci. The spacers for CRISPR1 and CRISPR3 had different sequences and did not correspond to PAM sites, but were designed to target the lacZ 5' end, resulting in the predicted cleavage sites being 6 nt apart. Therefore, the leader sequences, repeats and spacers on each plasmid were orthogonal features unique to CRISPR1 or CRISPR3, respectively. To evaluate mutations dependent on target loci, an additional CRISPR3 plasmid was created with a spacer in the residue binding a metal cation, which is important for the activity of β-galactosidase. A CRISPR1 array plasmid containing a non-self-targeting spacer was used as a control to quantify self-targeting lethality.

Пример 4. Трансформация.Example 4. Transformation.

Плазмиды электропорировали в компетентный S. thermophilus, содержащий чувствительную к температуре хелперную плазмиду pTRK669, в соответствии с методами, описанными ранее (44). Вкратце, ночную культуру S. thermophilus инокулировали с концентрацией 1% (об./об.) в 50 мл среды Элликер, дополненной 1% говяжьим экстрактом, 1,9% β-глицерофосфатом и Cm для отбора. Когда культура достигла значения OD600 нм, равного 0,3, добавляли пенициллин G до получения конечной концентрации 10 мкг/мл для повышения эффективности электропорации (45). Клетки собирали центрифугированием и промывали 3 раза в 10 мл буфера для холодной электропорации (1 М сахарозы и 3,5 мМ MgCl2). Клетки концентрировали в 100 раз в буфере для электропорации, и 40 мкл суспензии аликвотировали в 0,1 мм кюветы для электропорации. Каждую суспензию объединяли с 700 нг плазмиды. Условия электропорации были следующими: 2500 В, емкость - 25 мкФ и сопротивление - 200 Ом. Временные константы регистрировали; интервал варьирования которых составил от 4,4 до 4,6 мс. Суспензии сразу объединяли с 950 мкл предназначенной для извлечения средой и инкубировали в течение 8 ч при 37°С. Клеточные суспензии высевали на селективную среду, а кюветы для электропорации промывали средой для гарантированного извлечения клеток.Plasmids were electroporated into competent S. thermophilus containing the temperature sensitive helper plasmid pTRK669 according to the methods described previously (44). Briefly, an overnight culture of S. thermophilus was inoculated at 1% (v/v) in 50 ml Elliker medium supplemented with 1% beef extract, 1.9% β-glycerophosphate and C m for selection. When the culture reached an OD 600 nm value of 0.3, penicillin G was added to a final concentration of 10 μg/mL to improve electroporation efficiency (45). Cells were harvested by centrifugation and washed 3 times in 10 ml cold electroporation buffer (1 M sucrose and 3.5 mM MgCl 2 ). Cells were concentrated 100-fold in electroporation buffer and 40 μl of the suspension was aliquoted into 0.1 mm electroporation cuvettes. Each suspension was combined with 700 ng of plasmid. The electroporation conditions were as follows: 2500 V, capacitance - 25 μF and resistance - 200 ohms. Time constants were recorded; the variation interval of which was from 4.4 to 4.6 ms. Suspensions were immediately combined with 950 μl intended for extraction medium and incubated for 8 hours at 37°C. Cell suspensions were plated on selective medium, and electroporation cuvettes were washed with medium to ensure cell recovery.

Пример 5. Подтверждение фенотипа β-галактозидазы.Example 5 Confirmation of the phenotype of β-galactosidase.

Трансформанты, полученные как из CRISPR1, так и CRISPR3, сначала подвергали скринингу на фенотип, дефицитный по β-галактозидазе, путем посева колоний штрихом на полусинтетической среде Элликер, дополненной 1% лактозой в качестве источника твердых углеводов. Потерю активности β-галактозидазы подтверждали выполнением анализов Миллера (о-нитрофенил-вЮ-галактозид (ONPG)) (46). Вкратце, культуры размножали до достижения поздней логарифмической фазы (OD600 нм=1,2) в 5 мл среды и собирали центрифугированием (4000xg в течение 10 мин). Клетки промывали и ресуспендировали в 0,5 мл забуференного фосфатом физиологическом растворе (GibcoInvitrogen). Каждую суспензию объединяли со 100 мкл стеклянных микросфер толщиной 0,1 мм (Biospec), а затем подвергали пяти 60 с циклам гомогенизации в Mini-Beadbeater (Biospec). Затем образцы центрифугировали (15000xg в течение 5 мин) для удаления клеточных остатков и интактных клеток. Клеточные лизаты (10 мкл аликвот) объединяли с 600 мкл раствора субстрата (60 мМ Na2HPO4, 40 мМ NaH2PO4, 1 мг/мл ONPG, 2,7 мкл/мл β-меркаптоэтанола) и инкубировали в течение 5 мин при комнатной температуре, после чего добавляли 700 мкл стоп-раствора (1 М NaCO3). Поглощение регистрировали при 420 нм, а активность β-галактозидазы указывали в единицах Миллера, рассчитанных, как описано ранее (46).Transformants derived from both CRISPR1 and CRISPR3 were first screened for the β-galactosidase deficient phenotype by streaking colonies on semi-synthetic Elliker medium supplemented with 1% lactose as a solid carbohydrate source. Loss of β-galactosidase activity was confirmed by performing Miller's assays (o-nitrophenyl-vI-galactoside (ONPG)) (46). Briefly, cultures were expanded to late logarithmic phase (OD 600 nm=1.2) in 5 ml medium and harvested by centrifugation (4000xg for 10 min). Cells were washed and resuspended in 0.5 ml phosphate buffered saline (GibcoInvitrogen). Each suspension was combined with 100 μl of 0.1 mm thick glass microspheres (Biospec) and then subjected to five 60 s homogenization cycles in a Mini-Beadbeater (Biospec). Then the samples were centrifuged (15000xg for 5 min) to remove cellular debris and intact cells. Cell lysates (10 µl aliquots) were combined with 600 µl substrate solution (60 mM Na 2 HPO 4 , 40 mM NaH 2 PO 4 , 1 mg/ml ONPG, 2.7 µl/ml β-mercaptoethanol) and incubated for 5 min at room temperature, after which was added 700 μl of stop solution (1 M NaCO 3 ). Absorbance was recorded at 420 nm and β-galactosidase activity was reported in Miller units calculated as described previously (46).

Пример 6. Оценка роста и активности.Example 6 Growth and activity assessment.

Культуры предварительно обрабатывали для оценки роста путем субкультивирования в течение 12 поколений в полусинтетической среде Элликера, дефицитной по лактозе. Свежую среду инокулировали ночной культурой с концентрацией 1% (об./об.) и инкубировали при 37°С статически. OD600 регистрировали каждый час до тех пор, пока культуры не достигли стационарной фазы. Сквашивание молока оценивали путем инокуляции ночной культуры в обезжиренное молоко до уровня 108 КОЕ/мл и инкубирования при 42°С. Затем следили за значением pH при помощи pH-метра Mettler Toledo Seven Easy и зонда Accumet. Обезжиренное молоко приобретали на молочном заводе NCSU Dairy plant и пастеризовали в течение 30 мин при 80°С.Cultures were pretreated for growth evaluation by subculturing for 12 generations in lactose-deficient semi-synthetic Elliker's medium. Fresh medium was inoculated with a 1% (v/v) overnight culture and incubated at 37° C. statically. OD 600 was recorded every hour until the cultures reached stationary phase. Milk fermentation was assessed by inoculating an overnight culture into skim milk to a level of 10 8 cfu/ml and incubating at 42°C. The pH was then monitored using a Mettler Toledo Seven Easy pH meter and an Accumet probe. Skimmed milk was purchased from the NCSU Dairy plant and pasteurized for 30 minutes at 80°C.

Пример 7. Идентификация инородных геномных областей.Example 7 Identification of foreign genomic regions.

In silico прогноз инородных мобильных локусов для нацеливания на CRISPR-Cas выполняли на основеIn silico prediction of foreign mobile loci to target CRISPR-Cas was performed based on

i) местоположения, ориентации и нуклеотидной идентичности IS элементов, и ii) местоположения жизненно важных ОРС.i) the location, orientation and nucleotide identity of the IS elements, and ii) the location of the vital ORFs.

В Bacillus subtilis количество идентифицированных жизненно важных ОРС составило 271, которое было определено по летальности нокаутов генов в геноме дикого типа (33).In Bacillus subtilis, the number of identified vital ORFs was 271, which was determined by the lethality of gene knockouts in the wild-type genome (33).

Геном S. thermophilus исследовали на наличие гомологов по каждому жизненно важному гену в В. subtilis при помощи инструмента для поиска в программе BLASTp с матрицей оценки, используемой по умолчанию для аминокислотных последовательностей. В S. thermophilus идентифицировали гомологи для примерно 239 жизненно важных ОРС, все из которых кодировались хромосомой (табл. 4). Белки,The S. thermophilus genome was examined for homologues for each vital gene in B. subtilis using the BLASTp search tool with default scoring matrix for amino acid sequences. In S. thermophilus, homologues were identified for about 239 vital ORFs, all of which were encoded by the chromosome (Table 4). Squirrels,

- 33 042506 участвующие в консервативных клеточных процессах, включая ДНК репликацию/гомеостаз, механизмы трансляции и основные метаболические пути, были легко идентифицированы. Не были найдены гомологи, соответствующие биосинтезу цитохрома/дыханию, в соответствии с метаболическим профилем ферментативных бактерий. Каждую предполагаемую жизненно важную ОРС отображали на референсном геноме при помощи программного обеспечения SnapGene, что облегчало визуализацию их местоположения и распределения в S. thermophilus LMD-9 (фиг. 3А).- 33 042506 involved in conserved cellular processes, including DNA replication/homeostasis, translation mechanisms and major metabolic pathways, were easily identified. No homologues were found corresponding to cytochrome biosynthesis/respiration, consistent with the metabolic profile of the fermentative bacteria. Each putative vital ORF was displayed on the reference genome using the SnapGene software, which facilitated the visualization of their location and distribution in S. thermophilus LMD-9 (FIG. 3A).

IS-элементы в геноме S. thermophilus группировали путем выравнивания кодирующих транспозоны последовательностей при помощи программного обеспечения Geneious® (фиг. 4). Обозначения семейств определяли в соответствии с анализом BLAST в объеме базы данных IS-элементов (www-is.biotoul.fr//). Для предсказания эффективности опосредованной рекомбинацией эксцизии хромосомных сегментов относительное расположение родственных IS-элементов отображали на геном S. thermophilus (фиг. 3А). Семейства IS1193 и Sth6 IS-элементов чаще всего встречались в геноме, и обычно их можно найти в Streptococcus pneumoniae и Streptococcus mutans (34). Несмотря на преобладание элементов IS1193 было показано, что многие из этих локусов представляли собой небольшие фрагменты, демонстрирующие некоторую степень полиморфизма и вырождения, при этом также имелось несколько копий с высоким уровнем идентичности последовательности (фиг. 5А). Напротив, семейство Sth6 показало значимую степень полиморфизма и высокую вырожденность, причем некоторые копии содержали значительные внутренние делеции (фиг. 5В). Элементы IS1167 и IS1191 были менее частыми, но показали почти идеальную точность воспроизведения копий, идентифицированных в геноме (фиг. 5С и 5D). Исходя из степени сохранности длины и последовательности элементов IS1167 и IS1191 у S. thermophilus и их относительной близости к генам адаптации молока была выдвинута гипотеза, что эти консервативные/воспроизводимые с высокой точностью транспозоны были приобретены геномом недавно.The IS elements in the S. thermophilus genome were grouped by aligning the transposon coding sequences using the Geneious® software (FIG. 4). Family designations were determined according to BLAST analysis in the scope of the IS element database (www-is.biotoul.fr//). To predict the efficiency of recombination-mediated excision of chromosomal segments, the relative positions of related IS elements were mapped onto the S. thermophilus genome (FIG. 3A). The IS1193 and Sth6 families of IS elements are the most common in the genome and are commonly found in Streptococcus pneumoniae and Streptococcus mutans (34). Despite the predominance of IS1193 elements, it was shown that many of these loci were small fragments, showing some degree of polymorphism and degeneracy, and there were also several copies with a high level of sequence identity (Fig. 5A). In contrast, the Sth6 family showed a significant degree of polymorphism and high degeneracy, with some copies containing significant internal deletions (FIG. 5B). Elements IS1167 and IS1191 were less frequent but showed near-perfect copy fidelity identified in the genome (FIGS. 5C and 5D). Based on the degree of conservation of the length and sequence of elements IS1167 and IS1191 in S. thermophilus and their relative proximity to milk adaptation genes, it was hypothesized that these conserved/highly accurate transposons were recently acquired by the genome.

Объединив местоположение предсказанных жизненно важных ОРС и IS-элементов, идентифицировали инородные острова, фланкированные IS-элементами, воспроизводимыми с высокой точностью (фиг. 3А; табл. 3). Первый остров содержал оперон, уникальный для S. thermophilus LMD-9, кодирующий предполагаемую АТФ-зависимую транспортную систему олигонуклеотидов с неизвестной специфичностью (фиг. 3В) (35). Второй остров содержал протеиназу клеточной стенки PrtS, которая обеспечивает фенотип быстрого сквашивания у S. thermophilus (фиг. 3С) (36).Combining the locations of the predicted vital ORFs and IS elements, foreign islands flanked by highly reproducible IS elements were identified (FIG. 3A; Table 3). The first island contained an operon unique to S. thermophilus LMD-9 encoding a putative ATP-dependent oligonucleotide transport system with unknown specificity (Fig. 3B) (35). The second island contained the cell wall proteinase PrtS, which mediates the fast fermentation phenotype in S. thermophilus (Fig. 3C) (36).

Примечательно, что хотя prtS не является широко распространенным в геномах S. thermophilus, было продемонстрировано, что геномные острова, кодирующие prtS, передаются между штаммами посредством естественной компетентности (36). Третий остров содержал предполагаемый белок АТФ-зависимой помпы ионов меди и присутствовал в каждом секвенированном штамме S. Thermophiles (фиг. 3D). Четвертый остров был самым крупным по длине, равной 102 т.п.о., и по содержанию генов с 102 предсказанными ОРС, включая lac оперон (фиг. 3Е). Этот остров был обнаружен во всех штаммах S. thermophilus, при этом каждый штамм отличался специфичным содержанием генов и длиной. Чтобы определить результат нацеливания обеих эндогенных систем типа II на крупный геномный остров, для последовательности, кодирующей lacZ, создавали массивы повтор-спейсер (фиг. 3Е) и клонировали в pORI28 (фиг. 2). Четвертый остров выбирали в качестве мишени для CRISPR-Cas из-за его размера, широкой распространенности в штаммах S. thermophilus и возможности осуществления скрининга на наличие lacZ-мутаций по отрицательному фенотипу β-галактозидазы.Notably, although prtS is not widely distributed in S. thermophilus genomes, genomic islands encoding prtS have been shown to be transferred between strains through natural competence (36). The third island contained the putative ATP-dependent copper ion pump protein and was present in every sequenced S. thermophiles strain (Fig. 3D). The fourth island was the largest in length, equal to 102 kb, and in gene content with 102 predicted ORFs, including the lac operon (Fig. 3E). This island was found in all strains of S. thermophilus, with each strain differing in specific gene content and length. To determine the outcome of targeting both endogenous type II systems to the large genomic island, repeat-spacer arrays were generated for the lacZ coding sequence (FIG. 3E) and cloned into pORI28 (FIG. 2). The fourth island was chosen as a target for CRISPR-Cas because of its size, its high prevalence in S. thermophilus strains, and the possibility of screening for the presence of lacZ mutations in the negative phenotype of β-galactosidase.

Пример 8. CRISPR-Cas нацеливание lacZ выбирает события с крупными делециями.Example 8 CRISPR-Cas targeting lacZ selects events with large deletions.

В системах типа II Cas9 распознает ДНК и обратимо связывается с последовательностями PAM, при этом происходит активация Cas9 на мишени через образование дуплекса tracrРНК::crРНК (37), что в конечном итоге приводит к расщеплению dsДНК (фиг. 6А и 6В) (25). Фиг. 14А и 14В представляют собой схематическую диаграмму общего принципа совместного взаимодействия эндогенных CRISPR систем для направленного уничтожения. В частности, на фиг. 14А и 14В показан принцип совместной работы эндогенных систем типа II в Streptococcus thermophilus для направленного уничтожения. Таким образом, в S. thermophilus запрограммированная гибель клеток достигалась за счет использования системы CRISPR-Sth1 (А) или CRISPR-Sth3 (В) типа II путем разработки направленной на геном последовательности спейсера, фланкированной нативными повторами, экспрессия которых управлялась нативным или синтетическим промотором. Процессинг транскрибированного массива повтор-спейсер осуществлялся при помощи кодированной хозяином РНКазы III и Cas9 с получением зрелых сгРНК, которые рекрутируют Cas9 в геном, чтобы вызвать двухцепочечное расщепление ДНК, приводящее к гибели клеток.In type II systems, Cas9 recognizes DNA and reversibly binds to PAM sequences, which activates Cas9 on the target via the formation of a tracrRNA::crRNA duplex (37), which ultimately results in dsDNA cleavage (Figs. 6A and 6B) (25) . Fig. 14A and 14B are a schematic diagram of the general principle of the cooperative interaction of endogenous CRISPR systems for targeted killing. In particular, in FIG. 14A and 14B show how the type II endogenous systems in Streptococcus thermophilus work together for targeted killing. Thus, in S. thermophilus, programmed cell death was achieved by using the CRISPR-Sth1 (A) or CRISPR-Sth3 (B) type II system by designing a genome-targeted spacer sequence flanked by native repeats whose expression was driven by a native or synthetic promoter. The transcribed repeat-spacer array was processed with host-encoded RNase III and Cas9 to produce mature ssRNAs that recruit Cas9 into the genome to induce double-stranded DNA cleavage leading to cell death.

Трансформация плазмидами, вызывающими хромосомное самонацеливание посредством CRISPR-Cas систем, оказалась цитотоксичной, согласно результатам измерения уменьшения количества выживших трансформантов по сравнению с несамонацеленными плазмидами (15, 29). Таргетирование гена lacZ в S. thermophilus привело к 2,5 log уменьшению количества извлеченных трансформантов (фиг. 6С), таким образом достигая предельного значения эффективности трансформации. Двухнитевые разрывы ДНК (DSB) являются существенной угрозой для выживания организмов. Для соответствующих путей репарации часто требуются резекция концов для восстановления ДНК с тупыми концами. Эндонуклеолиз, индуцированный Cas9, еще более усугубляет давление на мутации, вызванные DSB, так какTransformation with plasmids inducing chromosomal self-targeting via CRISPR-Cas systems has been found to be cytotoxic as measured by the reduction in the number of surviving transformants compared to non-self-targeting plasmids (15, 29). Targeting the lacZ gene in S. thermophilus resulted in a 2.5 log reduction in the number of recovered transformants (FIG. 6C), thus reaching the limit of transformation efficiency. DNA double-strand breaks (DSBs) are a significant threat to the survival of organisms. Relevant repair pathways often require end resection to repair blunt-ended DNA. Cas9-induced endonucleolysis further exacerbates the pressure on DSB-induced mutations, as

- 34 042506 для восстановления локуса-мишени в диком типе нельзя избежать последующего CRISPR нацеливания.- 34 042506 to restore the target locus in the wild type, subsequent CRISPR targeting cannot be avoided.

Определение происхождения спейсеров в молочнокислых бактериях показало, что 22% спейсеров обладают комплементарностью к самим себе и что соответствующие геномные локусы были изменены, что, вероятно, способствовало выживанию встречающихся в природе событий самонацеливания (28).Determination of the origin of spacers in lactic acid bacteria showed that 22% of spacers have complementarity to themselves and that the corresponding genomic loci were altered, which likely contributed to the survival of naturally occurring self-targeting events (28).

Чтобы определить, мутировал ли локус-мишень в ответ на вызванное Cas9 расщепление, трансформанты были подвергнуты скринингу сначала в отношении потери активности β-галактозидазы. Клоны, дефицитные по этой активности, были генотипированы в локусе lacZ. Ни в одном из секвенированных клонов не наблюдалось ни мутаций из-за классического или альтернативного концевого соединения, ни спонтанных однонуклеотидных полиморфизмов. Отсутствие однонуклеотидных полиморфизмов может быть связано с низкой эффективностью трансформации, усугубленной низкой частотой точечных мутаций, а отсутствие гомологов Ku и LigaseIV коррелирует с отсутствием негомологичного концевого соединения (38). ПЦР-скрининг показал, что lacZ дикого типа не присутствовал, но ПЦР ампликоны не соответствовали нативному локусу lacZ; вероятнее всего произошла амплификация последовательности, фланкированной IS-элементами, в другом геномном локусе. Чтобы исследовать генотип, ответственный за потерю активности β-галактозидазы, было выполнено одномолекулярное секвенирование в реальном времени в двух клонах: один из которых был получен в результате CRISPR3 нацеливания 5'-конца lacZ и другой был получен в результате CRISPR3 нацеливания последовательности, кодирующей ионсвязывающий карман, необходимый для катализа β-галактозидазы (фиг. 7А и 7В). Эта стратегия секвенирования использовалась из-за большой длины считывания, чтобы обойти трудности, связанные с надежностью отображения прочтений в правильном локусе, из-за большого количества IS-элементов в геноме (35). Прочтения отображали на референсной геномной последовательности при помощи программного обеспечения Geneious, и было выявлено отсутствие крупного сегмента (примерно 102 т.п.о.), кодирующего открытую рамку считывания lacZ (фиг. 7А и 7В). Оба секвенированных штамма подтвердили воспроизводимость границ крупной делеции и показали, что делеция происходит независимо от спейсерной последовательности lacZ или CRISPR-Cas системы, используемой для нацеливания. Однако данные секвенирования не давали достоверного отображения точных границ делеции.To determine if the target locus had mutated in response to Cas9-induced cleavage, transformants were screened first for loss of β-galactosidase activity. Clones deficient in this activity were genotyped at the lacZ locus. None of the clones sequenced showed any mutations due to the classical or alternative end connection, nor spontaneous single nucleotide polymorphisms. The absence of single nucleotide polymorphisms may be associated with low transformation efficiency exacerbated by low point mutation rates, and the absence of Ku and LigaseIV homologues correlates with the absence of a nonhomologous terminal junction (38). PCR screening showed that wild-type lacZ was not present, but PCR amplicons did not match the native lacZ locus; most likely, amplification of the sequence flanked by IS elements occurred at a different genomic locus. To investigate the genotype responsible for the loss of β-galactosidase activity, single-molecule real-time sequencing was performed in two clones: one of which was obtained by CRISPR3 targeting of the lacZ 5' end and the other was obtained by CRISPR3 targeting of the sequence encoding the ion-binding pocket. required for catalysis of β-galactosidase (FIGS. 7A and 7B). This sequencing strategy was used due to the long read length to circumvent the difficulty of reliably displaying reads at the correct locus due to the large number of IS elements in the genome (35). The reads were mapped onto the reference genomic sequence using Geneious software and the absence of a large segment (approximately 102 kb) encoding the lacZ open reading frame was found (FIGS. 7A and 7B). Both sequenced strains confirmed the reproducibility of large deletion boundaries and showed that the deletion occurs independently of the lacZ spacer sequence or the CRISPR-Cas system used for targeting. However, the sequencing data did not provide a reliable representation of the exact boundaries of the deletion.

Удаленные сегменты размером 102 т.п.о. составляют примерно 5,5% от 1,86 м.п.о. генома S. thermophilus. Область содержала 102 предполагаемых ОРС (STER_1278-1379), кодирующие АВС-транспортеры, двухкомпонентные регуляторные системы, гены синтеза бактериоцина, связанные с фагом белки, гены катаболизма лактозы и несколько скрытых генов без аннотированной функции (35). Влияние делеции на фенотип роста оценивали в бульонной культуре путем измерения OD600 нм в зависимости от времени (фиг. 7С). Клоны с делециями, по-видимому, имели более длинную лаг-фазу, более низкое конечное значение OD (р<0,01) и показали значительно более длительное время генерации во время логарифмической фазы со средним значением 103 мин, по сравнению с 62 мин для дикого типа (р<0,001). Хотя производные с делециями имели меньший по размеру геном для репликации (на 5,5%) в расчете на одно поколение и не тратили ресурсы на транскрипцию или трансляцию исключенных ОРС, никакого явного улучшения в их приспособляемости относительно дикого типа не наблюдалось. Активность β-галактозидазы является отличительной особенностью для промышленного применения молочнокислых бактерий и имеет важное значение для сохранения пищевых систем путем сквашивания. Таким образом, способность lacZ-дефицитных штаммов S. thermophilus к сквашиванию молока оценивали путем отслеживания значений pH (фиг. 7D). Как и ожидалось, штамм с делециями не был способен к сквашиванию молока в ходе эксперимента, что резко контрастировало с фенотипом быстрого сквашивания, наблюдаемым у дикого типа.The removed segments are 102 kb in size. make up about 5.5% of 1.86 m. p. genome of S. thermophilus. The region contained 102 putative ORFs (STER_1278-1379) encoding ABC transporters, two-component regulatory systems, bacteriocin synthesis genes, phage-associated proteins, lactose catabolism genes, and several hidden genes with no annotated function (35). The effect of the deletion on growth phenotype was assessed in broth culture by measuring OD 600 nm as a function of time (FIG. 7C). The deletion clones appeared to have a longer lag phase, lower terminal OD value (p<0.01) and showed significantly longer generation times during the logarithmic phase with a mean of 103 min, compared to 62 min for wild type (p<0.001). Although the deletion derivatives had a smaller genome to replicate (by 5.5%) per generation and did not waste resources on transcription or translation of the excluded ORFs, no clear improvement in their fitness relative to the wild type was observed. The activity of β-galactosidase is a hallmark for the industrial application of lactic acid bacteria and is essential for the preservation of food systems by fermentation. Thus, the ability of lacZ-deficient strains of S. thermophilus to ferment milk was assessed by monitoring the pH values (Fig. 7D). As expected, the deletion strain was not capable of fermenting milk during the course of the experiment, in stark contrast to the rapid fermentation phenotype seen in the wild type.

Пример 9. Геномные делеции происходят путем рекомбинации между гомологичными IS-элементами.Example 9 Genomic deletions occur by recombination between homologous IS elements.

Для изучения механизма делеции были определены нуклеотидные последовательности, фланкирующие сегмент. Единственными гомологичными последовательностями, наблюдаемыми на стыках, были две усеченные инсерционные последовательности IS1193 с 91% идентичностью нуклеотидной последовательности по всей длине, равной 727 п.о. Таким образом, для амплификации геномной ДНК выживших клонов, содержащих делецию, была разработана пара праймеров, фланкирующих два ISэлемента. Каждый из штаммов с делецией имел хорошо различимую полосу предсказанного размера (примерноTo study the deletion mechanism, the nucleotide sequences flanking the segment were determined. The only homologous sequences observed at the junctions were two truncated IS1193 insertion sequences with 91% nucleotide sequence identity over the entire length of 727 bp. Thus, to amplify the genomic DNA of surviving clones containing the deletion, a pair of primers flanking two IS elements was developed. Each of the deletion strains had a well-defined band of predicted size (approximately

1,2 т.п.н.), что является подтверждением события крупной геномной делеции (фиг. 8А). Интересно, что слабый ампликон, соответствующий хромосомной делеции, наблюдался у дикого типа, что указывает на то, что эта область может естественным образом исключаться из генома с низкой скоростью в популяциях дикого типа. Секвенирование ампликона стыка выполняли для 20 клонов, генерируемых хромосомным самонацеливанием при участии CRISPR3. Генотипирование локуса выявило наличие одного химерного IS-элемента в каждом клоне, и, помимо того, у каждого клона была обнаружена транзиция вышерасположенного элемента в расположенную ниже последовательность внутри химеры (фиг. 8В). Наблюдаемый размер делеции варьировал от 101,865 до 102,146 п.о. Точный размер локуса транзиции не был постоянным, но оказался не случайным внутри клонов, что подразумевало потенциальное смещение механизма делеции. S. thermophilus имеет типичный рекомбинационный аппарат, кодируемый как RecA1.2 kb), which is a confirmation of a large genomic deletion event (Fig. 8A). Interestingly, a weak amplicon corresponding to a chromosomal deletion was observed in the wild type, indicating that this region may naturally be excluded from the genome at a low rate in wild type populations. The junction amplicon sequencing was performed for 20 clones generated by chromosomal self-targeting with the participation of CRISPR3. Locus genotyping revealed the presence of one chimeric IS element in each clone, and in addition, each clone showed a transition of the upstream element to the downstream sequence within the chimera (FIG. 8B). The observed deletion size ranged from 101.865 to 102.146 bp. The exact size of the transition locus was not constant, but was not random within clones, implying potential bias in the deletion mechanism. S. thermophilus has a typical recombination apparatus, coded as RecA

- 35 042506 (STER_0077), гомологами AddAB, функционирующими в виде двойных АТФ-зависимых ДНК-экзонуклеаз (STER_1681 и STER_1682), и геликазой (STER_1742) семейства RecD. Высокая нуклеотидная идентичность между фланкирующими IS-элементами и способность S. thermophilus к осуществлению сайтспецифической рекомбинации (4) подтверждают эффективность RecA-опосредованной рекомбинации, участвующей в эксцизии геномного сегмента (фиг. 8С).- 35 042506 (STER_0077), AddAB homologues functioning as double ATP-dependent DNA exonucleases (STER_1681 and STER_1682), and helicase (STER_1742) of the RecD family. The high nucleotide identity between flanking IS elements and the ability of S. thermophilus to perform site-specific recombination (4) confirm the efficacy of RecA-mediated recombination involved in genomic segment excision (Fig. 8C).

Затем оценивали возможность использования CRISPR-Cas нацеливания для выделения делеций для каждого локуса с одинаковой генетической структурой. С этой целью создавали три CRISPR3 массива повтор-спейсер, один из которых таргетировал транспортер олигонуклеотидов в первом локусе, prtS во втором локусе и ген АТФ-зависимой помпы ионов меди в третьем локусе, и клонировали в pORI28 (фиг. 5). Для скрининга на наличие делеции создавали праймеры, фланкирующие IS-элементы в каждом локусе, для амплификации каждого стыка делеции (фиг. 8D). Отсутствие локусов дикого типа также подтверждали в каждом случае путем разработки внутренних праймеров для каждого геномного острова (фиг. 8Е). После трансформаций при помощи направленных плазмид выделяли делеции в каждом локусе и подтверждали их отсутствие у дикого типа. Секвенирование ампликонов стыка делеции подтвердило наличие одного оставшегося следа химерного IS-элемента, что указывает на общий механизм делеции в каждом локусе. Интересно, что праймеры, фланкирующие IS-элементы, также были амплифицированы из gДНК дикого типа, что дополнительно указывает на то, что гетерогенность популяции возникает естественным образом в каждом локусе из-за спонтанных геномных делеций. Эти результаты предполагают, что расщепление Cas9 специфичных в последовательностей происходит избирательно в вариантах, не содержащих комбинации протоспейсера с PAM, необходимые для таргетирования. Таким образом, спонтанные геномные делеции могут быть выделены при помощи CRISPR-Cas нацеливания как эффективного механизма отбора микробных вариантов, потерявших такие геномные острова.The possibility of using CRISPR-Cas targeting to isolate deletions for each locus with the same genetic structure was then evaluated. For this purpose, three CRISPR3 repeat-spacer arrays were created, one of which targeted the oligonucleotide transporter at the first locus, prtS at the second locus, and the ATP-dependent copper ion pump gene at the third locus, and cloned into pORI28 (Fig. 5). To screen for the presence of a deletion, primers flanking the IS elements at each locus were designed to amplify each deletion junction (FIG. 8D). The absence of wild-type loci was also confirmed in each case by designing internal primers for each genomic island (FIG. 8E). After transformations, deletions at each locus were isolated using targeted plasmids and their absence in the wild type was confirmed. Amplicon sequencing of the deletion junction confirmed the presence of one remaining trace of the chimeric IS element, indicating a common deletion mechanism at each locus. Interestingly, the primers flanking the IS elements were also amplified from wild-type gDNA, further indicating that population heterogeneity occurs naturally at each locus due to spontaneous genomic deletions. These results suggest that cleavage of Cas9-specific sequences occurs selectively in variants that do not contain the protospacer-PAM combinations required for targeting. Thus, spontaneous genomic deletions can be isolated using CRISPR-Cas targeting as an efficient selection mechanism for microbial variants that have lost such genomic islands.

Пример 10. Скрининг популяций.Example 10 Screening of populations.

В этом исследовании нативные системы типа IIA, содержащиеся в S. thermophilus, использовали для определения спонтанных делеций крупных геномных островов. Посредством независимого таргетирования четырех островов в S. thermophilus создавали стабильных мутантов, у которых в общей сложности отсутствовало 7% генома. Характеристика стыков делеций предполагала, что IS-зависимый механизм рекомбинации вносит вклад в гетерогенность популяции и обеспечивает выявление событий делеции размером от 8 до 102 т.п.о. Точное картирование химерных IS-элементов указывает на то, что события естественной рекомбинации, вероятно, ответственны за большие хромосомные делеции в S. thermophilus и потенциально могут быть использованы для направленного редактирования генома.In this study, type IIA native systems contained in S. thermophilus were used to detect spontaneous deletions of large genomic islands. Through independent targeting of the four islands in S. thermophilus, stable mutants were generated that were missing a total of 7% of the genome. Deletion junction characterization suggested that an IS-dependent recombination mechanism contributes to population heterogeneity and provides detection of deletion events ranging in size from 8 to 102 kb. Accurate mapping of chimeric IS elements indicates that natural recombination events are likely responsible for large chromosomal deletions in S. thermophilus and could potentially be used for targeted genome editing.

Наши результаты показывают, что клоны дикого типа были удалены из популяции, в то время как мутанты без признаков направленной CRISPR-Cas выжили. Таким образом, адаптивные острова были идентифицированы и подтверждены, что показывает, что точное нацеливание посредством эндогенного Cas9 может быть использовано для выделения в смешанных популяциях вариантов с крупными делециями.Our results show that wild-type clones were removed from the population, while mutants without signs of directed CRISPR-Cas survived. Thus, adaptive islands have been identified and validated, demonstrating that precise targeting by endogenous Cas9 can be used to isolate large deletion variants in mixed populations.

Эволюция генома бактерий происходит через горизонтальный перенос генов, внутреннюю мутацию и реорганизацию генома. Секвенирование генома и сравнительный анализ штаммов S. thermophilus выявили значительное разрушение генома, но также показали, что адаптация к обогащенным питательным средам происходила через специфическое для ниши приобретение генов (18, 35). Наличие MGE, включающих интегрированные и конъюгированные элементы, профаги и IS-элементы, в геномах S. thermophilus свидетельствует об их быстрой эволюции в молочной среде (38-39). Мобильные генетические признаки облегчают приобретение генов и, наоборот, инактивацию или потерю нежизненно важных последовательностей. Следовательно, MGE придают геномную пластичность как средство повышения приспособляемости или изменения экологического образа жизни. Полученные результаты четко указывают на то, что CRISPR-Cas таргетирование этих элементов может влиять на хромосомные перегруппировки и гомеостаз. Это контрастирует с экспериментами по нацеливанию на существенные признаки, которые привели к выбору вариантов с инактивированным аппаратом CRISPR-Cas (Jiang 2013). Мутация жизненно важных ОРС не является эффективным подходом, для того чтобы избежать CRISPR-Cas нацеливания, и, таким образом, остаются только клоны с инактивированными CRISPR-Cas системами. По замыслу нацеливание на генетические элементы, которые согласно прогнозам являются гипервариабельными и инородными, продемонстрировало, что жизнеспособными оказались варианты с измененными локусами, сохранившими активные CRISPR-Cas системы во время событий самонацеливания.The evolution of the bacterial genome occurs through horizontal gene transfer, internal mutation, and reorganization of the genome. Genome sequencing and comparative analysis of S. thermophilus strains revealed significant genome disruption, but also showed that adaptation to enriched nutrient media occurred through niche-specific gene acquisition (18, 35). The presence of MGEs, including integrated and conjugated elements, prophages, and IS elements, in the genomes of S. thermophilus indicates their rapid evolution in the dairy environment (38-39). Mobile genetic traits facilitate the acquisition of genes and, conversely, the inactivation or loss of non-essential sequences. Therefore, MGEs are conferred genomic plasticity as a means of increasing fitness or changing ecological lifestyles. These results clearly indicate that CRISPR-Cas targeting of these elements can influence chromosomal rearrangements and homeostasis. This contrasts with experiments targeting essential features, which led to the selection of variants with inactivated CRISPR-Cas apparatus (Jiang 2013). Mutation of vital ORFs is not an effective approach to avoid CRISPR-Cas targeting, and thus only clones with inactivated CRISPR-Cas systems remain. By design, targeting genetic elements predicted to be hypervariable and foreign demonstrated that variants with altered loci that retained active CRISPR-Cas systems during self-targeting events were viable.

Несмотря на почти повсеместное распространение IS-элементов в бактериальных геномах они остаются загадочной генетической сущностью в основном из-за их функционального многообразия и пластичности (34). Полученные результаты позволяют спрогнозировать рекомбинацию между родственными IS-элементами путем анализа их местоположения, ориентации и сохранения последовательности (фиг. 4 и 5). CRISPR-Cas нацеливание можно далее использовать для эмпирической проверки гетерогенности популяции в каждом прогнозируемом локусе и одновременно для увеличения извлечения мутантов с низкой степенью встречаемости. Высокая степень встречаемости MGE в молочнокислых бактериях и особенно у S. thermophilus соответствует их роли в видообразовании этих гиперадаптированных бактерий через эволюцию генома (39-40). Более того, извлечение мутантов с геномными делециями путемDespite the almost ubiquitous distribution of IS elements in bacterial genomes, they remain a mysterious genetic entity, mainly due to their functional diversity and plasticity (34). The results obtained make it possible to predict recombination between related IS elements by analyzing their location, orientation, and sequence retention (FIGS. 4 and 5). CRISPR-Cas targeting can then be used to empirically test population heterogeneity at each predicted locus and simultaneously increase the recovery of low-frequency mutants. The high occurrence of MGE in lactic acid bacteria and especially in S. thermophilus is consistent with their role in the speciation of these hyperadapted bacteria through genome evolution (39-40). Moreover, the extraction of mutants with genomic deletions by

- 36 042506- 36 042506

CRISPR-Cas нацеливания может позволить получить фенотипическую характеристику генов с неизвестной функцией. Мутанты, демонстрирующие делецию острова размером 102 т.п.о., кодирующего lac-оперон, значительно увеличили время генерации по сравнению с диким типом и достигли более низкого конечного значения OD. При наличии в них 102 предсказанных ОРС вероятно, что возможны дополнительные фенотипы и многие гены не имеют аннотированных функций. Учитывая промышленную значимость генов, специфических для ниши, таких как prtS, этот метод позволяет выполнить непосредственную оценку того, каким образом кодируемые островом гены способствуют адаптации к росту в молоке. Более того, она происходит в геномном и экологическом контексте, естественном для этих горизонтально приобретенных признаков, поскольку они, вероятно, были приобретены в виде отдельных островов. Эти результаты обеспечивают новые возможности для применения самонацеленных систем CRISPR-Cas9 в бактериях для изучения транспозиции, механизмов восстановления ДНК и пластичности генома.CRISPR-Cas targeting can allow phenotypic characterization of genes with unknown function. Mutants showing a deletion of the 102 kb island encoding the lac operon significantly increased the generation time compared to the wild type and achieved a lower final OD value. With 102 predicted ORFs in them, it is likely that additional phenotypes are possible and many genes do not have annotated functions. Given the industrial importance of niche-specific genes such as prtS, this method allows for a direct assessment of how island-encoded genes promote adaptation to growth in milk. Moreover, it occurs in a genomic and ecological context that is natural for these horizontally acquired traits, since they were probably acquired as separate islands. These results provide new opportunities for the application of self-targeted CRISPR-Cas9 systems in bacteria to study transposition, DNA repair mechanisms, and genome plasticity.

CRISPR-Cas системы обычно ограничивают генетическое разнообразие за счет интерференции с генетическими элементами, но приобретенные MGE могут также обеспечивать адаптивные преимущества бактериям-хозяевам. Таким образом, преимущество сохранения интегрированных в геном MGE, несмотря на CRISPR-Cas таргетирование, является важным фактором гомеостаза генома. В совокупности полученные результаты показывают, что in silico предсказание GEI можно связать с CRISPR-Cas нацеливанием с целью выделения клонов, демонстрирующих крупные геномные делеции. Следы химерной инсерционной последовательности в каждом стыке делеции указывают на общий механизм удаления всех четырех островов. Высокая степень встречаемости самонацеленных спейсеров, демонстрирующих идентичность с геномными локусами, в сочетании с экспериментальными демонстрациями геномных изменений, позволяет предположить, что CRISPR-Cas самонацеливание может в значительной степени способствовать эволюции генома бактерий (28, 30). В совокупности изучение крупных делеций, индуцированных CRISPR-Cas, подтверждает, что этот подход является быстрым и эффективным средством оценки важности и функциональности генных кластеров, лишенных аннотации, и определения минимальных бактериальных геномов на основе хромосомных делеций, происходящих посредством мобильных элементов.CRISPR-Cas systems typically limit genetic diversity through interference with genetic elements, but acquired MGEs may also provide adaptive benefits to host bacteria. Thus, the advantage of maintaining genome-integrated MGE despite CRISPR-Cas targeting is an important factor in genome homeostasis. Taken together, these results indicate that in silico GEI prediction can be linked to CRISPR-Cas targeting to isolate clones showing large genomic deletions. Traces of a chimeric insertion sequence at each deletion junction point to a common deletion mechanism for all four islands. The high occurrence of self-targeted spacers showing identity with genomic loci, combined with experimental demonstrations of genomic alterations, suggests that CRISPR-Cas self-targeting may contribute significantly to the evolution of the bacterial genome (28, 30). Taken together, the study of large deletions induced by CRISPR-Cas confirms that this approach is a fast and efficient means of evaluating the importance and functionality of annotated gene clusters and determining minimal bacterial genomes based on chromosome deletions occurring through transposable elements.

На фиг. 9 показаны определенные генетические локусы для оценки летальности, основанной на CRISPR-Cas системе типа II, посредством таргетирования генома Streptococcus thermophilus LMD-9. Способы выполнения этой оценки известны в уровне техники, см., Selle and Barrangou PNAS. 112 (26):8076-8081 (2015).In FIG. 9 shows certain genetic loci for lethality assessment based on the type II CRISPR-Cas system by targeting the genome of Streptococcus thermophilus LMD-9. Methods for performing this assessment are known in the art, see Selle and Barrangou PNAS. 112 (26): 8076-8081 (2015).

Были протестированы обе ортогональные системы типа II (CRISPR1 и CRISPR3); мишени CRISPR1 показаны темно-серым цветом, а мишени CRISPR3 - светло-серым цветом. Конкретные генетические признаки были выбраны для тестирования (i) межгенных областей (INT), (ii) мобильных генетических элементов (IS, GEI1-GEI3, PRO, lacZ, EPS), (iii) жизненно важных генов (dltA, LTA), (iv) полюсов реплихоры (ORI, TER) и прямых или обратных нитей ДНК (внешних мишеней по отношению к внутренним мишеням).Both type II orthogonal systems (CRISPR1 and CRISPR3) were tested; CRISPR1 targets are shown in dark gray and CRISPR3 targets in light gray. Specific genetic traits were chosen to test for (i) intergenic regions (INT), (ii) transposable genetic elements (IS, GEI1-GEI3, PRO, lacZ, EPS), (iii) vital genes (dltA, LTA), (iv ) replichora poles (ORI, TER) and forward or reverse DNA strands (external targets in relation to internal targets).

На фиг. 10 показана летальность на основе CRISPR, достигаемая посредством таргетирования областей, показанных на фиг. 9. Логарифмическое уменьшение в единицах КОЕ рассчитывали в отношении трансформации контроля - несамонацеленной плазмиды; pORI28; Летальность находилась в пределах уменьшения 2-3 log для всех тестируемых мишеней независимо от местоположения в хромосоме, кодирующей последовательности или важности для выживания.In FIG. 10 shows CRISPR-based lethality achieved by targeting the regions shown in FIG. 9. The logarithmic reduction in units of CFU was calculated in relation to the transformation of the control - non-self-targeted plasmid; pORI28; Lethality was within the 2-3 log reduction for all tested targets regardless of chromosomal location, coding sequence, or survival importance.

На фиг. 11 показаны профили транскрипции штаммов с CRISPR-опосредованными делециями геномных островов. Выделение и генотипирование клеток, выживших при CRISPR нацеливании геномных островов 1-4, привело к идентификации стабильных независимых мутантов, не содержащих геномный остров, таргетированный в каждом эксперименте. Затем клетки размножали и их общую РНК выделяли и секвенировали. Используя этот подход, получали профили транскрипции путем отображения прочтений при секвенировании в референсном геноме. В каждом случае отсутствие данных по секвенированию для предсказанного локуса геномного острова далее предполагало потерю генетического объекта-мишени, при этом оказывая минимальное влияние на экспрессию генов ядра во всей остальной части генома.In FIG. 11 shows the transcription profiles of strains with CRISPR-mediated genomic island deletions. Isolation and genotyping of cells that survived CRISPR targeting of genomic islands 1-4 led to the identification of stable independent mutants not containing the genomic island targeted in each experiment. The cells were then expanded and their total RNA was isolated and sequenced. Using this approach, transcription profiles were obtained by mapping reads when sequencing into the reference genome. In each case, the lack of sequencing data for the predicted genomic island locus further suggested loss of the target genetic entity, while having minimal impact on core gene expression throughout the rest of the genome.

Кроме того, данные секвенирования РНК подтверждают границы делеций при помощи картирования покрытий прочтений и сравнения значений транскрипции, а также подтверждают распознавание фенотипа при помощи сравнительной транскриптомики, полученной с использованием одного и того же набора данных. В частности, данные высокопроизводительного РНК-секвенирования подтверждают отсутствие транскрипционной активности, присутствующей в ожидаемых областях делеций, как показано на фиг. 12. На фиг. 12 показано Log2 покрытие прочтений при секвенировании трансформированных РНК штаммов с делециями геномных островов и для каждого штамма с геномным островом (GEI1-GEI4); отсутствие данных секвенирования для предсказанных локусов с геномными островами также подтвердило потерю генетического объекта-мишени с минимальным воздействием на экспрессию генов ядра во всей остальной части генома.In addition, RNA sequencing data confirms deletion boundaries by mapping read coverages and comparing transcription values, and confirms phenotype recognition by comparative transcriptomics generated using the same data set. In particular, high throughput RNA sequencing data confirms the absence of transcriptional activity present in the expected regions of the deletions, as shown in FIG. 12. In FIG. 12 shows Log 2 read coverage for sequencing transformed RNA strains with genomic island deletions and for each strain with genomic island (GEI1-GEI4); the lack of sequencing data for the predicted loci with genomic islands also confirmed the loss of the target genetic entity with minimal impact on core gene expression throughout the rest of the genome.

- 37 042506- 37 042506

Фиг. 13 дополнительно подтверждает отсутствие транскрипционной активности удаленных генов. Для каждого из штаммов с делециями геномных островов (GEI1-GEI4) экспрессия генов, кодируемых на каждом из островов-мишеней (черные), была минимальной. Гены, кодируемые в GEI1, показаны на верхней левой панели, гены, кодируемые в GEI2, показаны на верхней правой панели, гены, кодируемые в GEI3, показаны на нижней левой панели, а гены, кодируемые в GEI4, показаны на нижней правой панели. В общем случае делеции геномных островов 1 и 2 имели минимальное влияние на транскрипцию других генов (серый), тогда как делеция геномных островов 3 и 4, по-видимому, влияла на транскрипцию других генов, не кодируемых в островах.Fig. 13 further confirms the absence of transcriptional activity of the deleted genes. For each of the strains with deletions of the genomic islands (GEI1-GEI4), expression of the genes encoded on each of the target islands (black) was minimal. GEI1 encoded genes are shown in the upper left panel, GEI2 encoded genes are shown in the upper right panel, GEI3 encoded genes are shown in the lower left panel, and GEI4 encoded genes are shown in the lower right panel. In general, deletions of genomic islands 1 and 2 had minimal effect on the transcription of other genes (grey), while deletion of genomic islands 3 and 4 appeared to affect the transcription of other genes not encoded in the islands.

Кроме того, данные секвенирования РНК использовались для сравнения уровней транскрипции генов, не кодируемых на удаленном острове (GEI4), т.е. других генов, все еще присутствующих в хромосоме, и идентификации фенотипов, связанных с геномными делециями. Гены, которые дифференциально транскрибируются в штамме с делецией, указывают на то, что на клеточные процессы влияют гены, которые были потеряны, или что существует компенсация потери активности этих генов. Таким образом, можно сделать выводы о путях, к которым относятся эти гены или геномные области. В табл. 5 приведен список дифференциально экспрессируемых генов, идентифицированных в штамме GEI4 с делецией. Многие из генов, которые согласно наблюдениям являются дифференцированно экспрессируемыми, связаны с биосинтетической способностью Streptococcus thermophilus, включая биосинтез ароматических аминокислот и пуринов.In addition, RNA sequencing data was used to compare transcription levels of genes not encoded on the remote island (GEI4), i.e. other genes still present on the chromosome and identification of phenotypes associated with genomic deletions. Genes that are differentially transcribed in the deletion strain indicate that cellular processes are affected by genes that have been lost, or that there is compensation for the loss of activity of these genes. Thus, conclusions can be drawn about the pathways to which these genes or genomic regions belong. In table. 5 is a list of differentially expressed genes identified in the GEI4 deletion strain. Many of the genes observed to be differentially expressed are related to the biosynthetic capacity of Streptococcus thermophilus, including the biosynthesis of aromatic amino acids and purines.

Пример 11. Направленное уничтожение Lactobaclllus easei при помощи CRISPR-Cas системы типа II.Example 11 Targeted Killing of Lactobacllus easei with CRISPR-Cas Type II System.

Приведенные в качестве примера гиды CRISPR-Cas типа II для L. casei представлены на фиг. 15. На верхней панели представлен предсказанный гид, в то время как на нижней левой панели показана приведенная в качестве примера двойная структура гида, а на нижней правой панели показана приведенная в качестве примера однонитевая структура гида.Exemplary type II CRISPR-Cas guides for L. casei are shown in FIG. 15. The top panel shows the predicted guide, while the bottom left panel shows an exemplary dual guide structure and the bottom right panel shows an exemplary single strand guide structure.

Пример 12. Направленное уничтожение Lactobaclllus gasserl при помощи CRISPR-Cas системы типа II.Example 12 Targeted Killing of Lactobacllus gasserl with CRISPR-Cas Type II System.

Приведенные в качестве примера гиды типа II для направленного уничтожения L. gasseri представлены на фиг. 16. На верхней панели представлен предсказанный гид, а нижней левой панели приведен правильный двойной гид crРНК:tracrРНК (подтвержденный секвенированием РНК), на нижней правой панели показан приведенный в качестве примера предсказанный однонитевой выступающий гид.Exemplary type II guides for targeted killing of L. gasseri are shown in FIG. 16. The top panel shows the predicted guide and the bottom left panel shows the correct crRNA:tracrRNA double guide (confirmed by RNA sequencing), the bottom right panel shows an exemplary predicted single strand overhang guide.

Плазмиды трансформировали в L. gasseri, каждая плазмида имела разные конструкции: пустой вектор pTRK563, конструкцию с правильным протоспейсером, но неверным PAM, с правильным PAM, но с протоспейсером, который не находится в массиве, и с правильными протоспейсером и PAM. Результаты показаны в фиг 19. Плазмида, имеющая правильный протоспейсер и правильный PAM, показала существенно более высокую степень направленности интерференции и гибели клеток.The plasmids were transformed into L. gasseri, each plasmid having a different construct: an empty pTRK563 vector, a construct with the correct protospacer but the wrong PAM, a correct PAM but a protospacer that is not in the array, and a correct protospacer and PAM. The results are shown in FIG. 19. The plasmid having the correct protospacer and the correct PAM showed a significantly higher degree of interference targeting and cell death.

Пример 13. Направленное уничтожение Lactobacillus pentosus при помощи CRISPR-Cas системы типа II.Example 13 Targeted killing of Lactobacillus pentosus using the Type II CRISPR-Cas system.

Приведенные в качестве примера гиды типа II для направленного уничтожения L. pentosus представлены на фиг. 17. На верхней панели показан предсказанный гид. На левой нижней панели представлен правильный двойной гид crРНК:tracrРНК (подтвержденный секвенированием РНК), а на нижней правой панели показан приведенный в качестве примера предсказанный искусственный однонитевой выступающий гид.Exemplary type II guides for targeted killing of L. pentosus are shown in FIG. 17. The top panel shows the predicted guide. The lower left panel shows the correct crRNA:tracrRNA double guide (confirmed by RNA sequencing) and the lower right panel shows an exemplary predicted artificial single-stranded overhanging guide.

Плазмиды трансформировали в L. pentosus, причем каждая плазмида имела разные конструкции: конструкцию с правильным протоспейсером, но неверным PAM, конструкцию с правильным PAM, но с протоспейсером, который не находится в массиве, пустой вектор pTRK563, и с правильным протоспейсером и правильным PAM. Результаты показаны в фиг. 20. Плазмида, имеющая правильный протоспейсер и правильный PAM (Lpe1 gttaat), показала существенно более высокую степень направленности интерференции и гибели клеток.The plasmids were transformed into L. pentosus, with each plasmid having a different construct: a construct with the correct protospacer but the wrong PAM, a construct with the correct PAM but a protospacer that is not in the array, an empty pTRK563 vector, and a construct with the correct protospacer and the correct PAM. The results are shown in FIG. 20. The plasmid with the correct protospacer and the correct PAM (Lpe1 gttaat) showed a significantly higher degree of interference targeting and cell death.

Пример 14. Направленное уничтожение Lactobacillus jensenii при помощи CRISPR-Cas системы типа II.Example 14 Targeted killing of Lactobacillus jensenii using the Type II CRISPR-Cas system.

На фиг. 18 представлены в качестве примера гиды CRISPR-Cas типа II. На панели слева показан правильный двойной гид crРНК:tracrРНК, подтвержденный секвенированием РНК, на панели справа представлен в качестве примера предсказанный искусственный однонитевой гид.In FIG. 18 are exemplary CRISPR-Cas type II guides. The left panel shows the correct crRNA:tracrRNA double guide confirmed by RNA sequencing, the right panel shows an example predicted artificial single strand guide.

Плазмиды были трансформированы в L. jensenii, каждая из плазмид имела разные конструкции: конструкцию, содержащую пустой вектор pTRK563, конструкцию с правильным протоспейсером, но неверным PAM, конструкцию с правильным PAM, но с протоспейсером, который не находится в массиве, и конструкцию, имеющую правильный протоспейсер и правильный PAM. Результаты показаны в фиг. 22. Плазмида, имеющая правильный протоспейсер и правильный PAM, показала существенно более высокую степень направленности интерференции и гибели клеток.The plasmids were transformed into L. jensenii, each of the plasmids had different constructs: a construct containing an empty pTRK563 vector, a construct with the correct protospacer but the wrong PAM, a construct with the correct PAM but with a protospacer that is not in the array, and a construct having correct protospacer and correct PAM. The results are shown in FIG. 22. The plasmid having the correct protospacer and the correct PAM showed a significantly higher degree of interference targeting and cell death.

Пример 15. Направленное уничтожение Lactobacillus casei NCK 125 при помощи CRISPR-Cas системы типа I.Example 15 Targeted killing of Lactobacillus casei NCK 125 using the Type I CRISPR-Cas system.

На фиг. 21 представлен в качестве примера гид CRISPR-Cas типа I для L. casei, который содержит нативную лидерную последовательность типа I и повтор, найденный в L. casei NCK 125. PAM 5'-YAA-3' была предсказана с использованием нативных спейсерных последовательностей в организме. Этот ис- 38 042506 кусственный массив содержит спейсер, который таргетирует ген 16s рДНК в геноме хозяина. Результаты представлены на фиг. 22, где показано значимое уменьшение между пустым вектором и двумя разными искусственными массивами: один из которых содержит единичный спейсер, таргетирующий +цепь в гене 16s (1-2 alt), а другой содержит исходный спейсер, таргетирующий +цепь, и также содержит дополнительный спейсер, таргетирующий -цепь в гене 16s (1, 2, 3).In FIG. 21 is an exemplary type I CRISPR-Cas guide for L. casei that contains a native type I leader and a repeat found in L. casei NCK 125. PAM 5'-YAA-3' was predicted using native spacer sequences in body. This artificial array contains a spacer that targets the 16s rDNA gene in the host genome. The results are shown in FIG. 22, which shows a significant decrease between the empty vector and two different artificial arrays: one containing a single spacer targeting the +strand in the 16s gene (1-2 alt) and the other containing the original spacer targeting the +strand and also containing an additional spacer , targeting -chain in the 16s gene (1, 2, 3).

CRISPR-Cas системы, как раскрыто в настоящем описании, могут быть использованы, например, для (i) направленного сокращения патогенов в случае медицинского вмешательства (например, патогенов, включая без ограничения грибы, нематоды, простейшие (например, малярию) цестоды, кокцидии (микроспоридии), трематоды, пентастомиды, акантоцефалы, членистоногие и т.п.);CRISPR-Cas systems as disclosed herein can be used, for example, to (i) target pathogen reduction in the event of a medical intervention (e.g., pathogens including, but not limited to, fungi, nematodes, protozoan (e.g., malaria) cestode, coccidia ( microsporidia), trematodes, pentastomids, acanthocephals, arthropods, etc.);

(ii) для защиты потребляемых веществ (пищевые системы, животные, культуры);(ii) to protect consumables (food systems, animals, crops);

(iii) для контроля и/или удаления нежелательных организмов из промышленных ферментативных процессов (сырья, технологического оборудования, стартовых культур); и (iv) для контроля экологических микробных консорциумов для воздействия на экосистемы и/или химические циклы, а также для рекультивации.(iii) to control and/or remove unwanted organisms from industrial enzymatic processes (raw materials, process equipment, starter cultures); and (iv) to control ecological microbial consortia for impacts on ecosystems and/or chemical cycles, and for remediation.

Таблица 1Table 1

Бактериальные штаммы и плазмидыBacterial strains and plasmids

Обозначение штамма Strain designation Описание Description Источник Source Е. coli ЕС1000 E. coli EC1000 Хозяин для pORI плазмид, хромосомных repA+ (pWVOl), KmR Хозяин для pTRK935Host for pORI plasmids, chromosomal repA + (pWVOl), Km R Host for pTRK935 47 47 S. thermophilus LMD-9 S thermophilus LMD-9 с pTRK669 S. thermophilus LMD-9 S thermophilus LMD-9 with pTRK669 Дикий тип Дикий тип, RepA+ и CmR приобретенные посредством pTRK669Wild type Wild type, RepA + and Cm R acquired with pTRK669 40 в этом исследовании 40 in that research Плазмиды Plasmids pORI28 pORI28 Широкоисполь зуемый нерепликативный вектор, EmR A widely used non-replicative vector, Em R 47 47 pTRK669 pTRK669 Ts-хелперная плазмида repA+, CmR Ts-helper plasmid repA + , Cm R 44 44 pCRISPRl::lacZ pCRISPRl::lacZ pORI28::CRISPRl-nnflep-RSR-IacE N-терминальный спейсер pORI28::CRISPRl-nnflep-RSR-IacE N-terminal spacer This study This study pCRISPR3::lacZ pCRISPR3::lacZ pORI28::CRISPRl-nnflep-RSR-IacE активный сайт спейсер pORI28::CRISPRl-nnflep-RSR-IacE active site spacer This study This study pCRISPR3::ABC pCRISPR3::ABC pORI28::CRISPRl-nnflep-RSR-ABC спейсер pORI28::CRISPRl-nnflep-RSR-ABC spacer This study This study pCRISPR3::Cu pCRISPR3::Cu pORI28::CRISPRl-nnflep-RSR-Cu помпа спейсер pORI28::CRISPRl-nnflep-RSR-Cu spacer pump This study This study pCRISPR3::prts pCRISPR3::prts pORI28::CRISPRl-nnflep-RSR-prts спейсер pORI28::CRISPRl-nnflep-RSR-prts spacer This study This study pCRISPR3: -.lacZ pCRISPRl::неса mo-нацеленная pCRISPR3: -.lacZ pCRISPRl::nes mo-targeted pORI28::CRISPR3-nnflep-RSR-IacX N-терминальный спейсер pORI28::CRISPRl-nnflep-RSRнесамонацеленный спейсер pORI28::CRISPR3-nnflep-RSR-IacX N-terminal spacer pORI28::CRISPRl-nnflep-RSR non-self-targeted spacer This study This study This study This study

- 39 042506- 39 042506

Таблица 2table 2

ПраймерыPrimers

Название праймера Primer name Последовательность Subsequence Функция Function Cl_N-term_F Cl_N-term_F CAAGAACAGTTATTGATTTTATAATCACTATGTGGGTATGAAAATCTCAAAAATCATTTG AGGTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACATTAAGAGATTGTCTTAACTT CAAGAACAGTTATTTGATTTTATAATCACTATGTGGGTATGAAAATCTCAAAAATCATTTG AGGTTTTTGTACTCTCAAGATTTAAGTAACTGTACAACATTAAGAGATTGTCTTAACTT Матрица для SOE-ПЦР Matrix for SOE-PCR C3_N-term C3_N-term AGCGGATAACAATTTCACGTTTTGGAACCATTCGAAACAACACAGCTCTAAAACTCAGAA AATTCTTCAAGAGATTCAAAATACTGTTTTGGAACCATTCGAAACAACACAGCTCTAAAA CCTCGTAGGATATCTTTTCTAC AGCGGATAACAATTTCACGTTTTGGAACCATTCGAAACAACACAGCTCTAAAACTCAGAA AATTCTTCAAGAGATTCAAAATACTGTTTTGGAACCATTCGAAACAACACAGCTCTAAAA CCTCGTAGGATATCTTTTCTAC Матрица для SOE-ПЦР Matrix for SOE-PCR Cl_N-term_R Cl_N-term_R AGCGGATAACAATTTCACGTTGTACAGTTACTTAAATCTTGAGAGTACAAAAACAGGGGA GATGAAGTTAAGACAATCTCTTAATGT AGCGGATAACAATTTCACGTTGTACAGTTACTTAAATCTTGAGAGTACAAAAACAGGGGA GATGAAGTTAAGACAATCTCTTAATGT Матрица для SOE-ПЦР Matrix for SOE-PCR C3_A-site C3_A-site AGCGGATAACAATTTCACGTTTTGGAACCATTCGAAACAACACAGCTCTAAAACGAAGTC TTGGTCTTCCAACCAGCTTGCTGTAGTTTTGGAACCATTCGAAACAACACAGCTCTAAAA CCTCGTAGGATATCTTTTCTAC AGCGGATAACAATTTCACGTTTTGGAACCATTCGAAACAACACAGCTCTAAAACGAAGTC TTGGTCTTCCAACCAGCTTGCTGTAGTTTTGGAACCATTCGAAACAACACAGCTCTAAAA CCTCGTAGGATATCTTTTCTAC Матрица для SOE-ПЦР Matrix for SOE-PCR C3_ABC C3_ABC AGCGGATAACAATTTCACGTTTTGGAACCATTCGAAACAACACAGCTCTAAAACGATAACAC GAGATAAAACATCCAGCCCACCGTTTTGGAACCATTCGAAACAACACAGCTCTAAAACctcg taggatatcttttctac AGCGGATAACAATTTCACGTTTTGGAACCATTCGAAACAACACAGCTCTAAAACGATAACAC GAGATAAAACATCCAGCCCACCGTTTTGGAACCATTCGAAACAACACAGCTCTAAAACctcg taggatatcttttctac C3_prtS C3_prtS AGCGGATAACAATTTCACGTTTTGGAACCATTCGAAACAACACAGCTCTAAAACGTTGTAGC TTTGAGGTCTGAGAATACACGCGTTTTGGAACCATTCGAAACAACACAGCTCTAAAACctcg taggatatcttttctac AGCGGATAACAATTTCACGTTTTGGAACCATTCGAAACAACACAGCTCTAAAACGTTGTAGC TTTGAGGTCTGAGAATACACGCGTTTTGGAACCATTCGAAACAACACAGCTCTAAAACctcg taggatatcttttctac C3_Cu C3_Cu AGCGGATAACAATTTCACGTTTTGGAACCATTCGAAACAACACAGCTCTAAAACGATTGC TCAATCAATCGTTTCAGCTGCTAAGTTTTGGAACCATTCGAAACAACACAGCTCTAAAAC ctcgtaggatatcttttctac AGCGGATAACAATTTCACGTTTTGGAACCATTCGAAACAACACAGCTCTAAAACGATTGC TCAATCAATCGTTTCAGCTGCTAAGTTTTGGAACCATTCGAAACAACACAGCTCTAAAAC ctcgtaggatatcttttctac C3LF C3LF AGCAGGGATCCTGGTAATAAGTATAGATAGTCTTG AGCAGGGATCCTGGTAATAAGTATAGATAGTCTTG Амплификация Sth3 Лидер из дДНК Amplification of Sth3 Leader from dDNA C3LR C3LR CTCGTAGGATATCTTTTCTAC CTCGTAGGATATCTTTTCTAC Амплификация Sth3 Лидер из дДНК Amplification of Sth3 Leader from dDNA C1F C1F AGCAGGGATCCCAAGAACAGTTATTGATTTTATAATC AGCAGGGATCCCAAGAACAGTTATTTGATTTTATAATC CRISPR1 SOE-ПЦР Прямой CRISPR1 SOE-PCR Direct C3F C3F AGCAGGGATCCTGGTAATAAGTATAGATAGTCTTG AGCAGGGATCCTGGTAATAAGTATAGATAGTCTTG CRISPR3 SOE-ПЦР Прямой CRISPR3 SOE-PCR Direct C1C3R C1C3R TGCTGGAGCTCGTGAAATTGTTATCCGCT TGCTGGAGCTCGTGAAATTGTTATCCGCT CRISPR1 и CRISPR3 SOE-ПЦР Обратный CRISPR1 and CRISPR3 SOE-PCR Reverse 1193F 1193F TTGAACACTAGGAACCTCATA TTGAACACTAGGAACCTCATA Амплификация стыка делеции Deletion junction amplification 1193R 1193R CGTAAGGTTTTGATGACTCAAG CGTAAGGTTTTGATGACTCAAG Амплификация стыка делеции Deletion junction amplification pORI28F pORI28F TTGGTTGATAATGAACTGTGCTG TTGGTTGATAATGAACTGTGCTG Секвенирование MCS из pORI28 MCS sequencing from pORI28 pORI28R pORI28R TTGTTGTTTTTATGATTACAAAGTGA TTGTTGTTTTTATGATTACAAAAGTGA Секвенирование MCS из pORI28 MCS sequencing from pORI28

Таблица 3Table 3

Предполагаемые инородные геномные острова и островкиPutative foreign genomic islands and islets

Геномн ый остров Genomic th island Область ОРС Region ORS Длина, T . π . о . Length, T. π . O . Геномное содержание, % Genomic content, % Известные гены Known genes IS- семейство IS- family 1 1 STER_139- STER_139- 7,81 7.81 37,1 37.1 Транспортеры Transporters IS6 IS6 STER_148 STER_148 олигопептидов oligopeptides 2 2 STER_840- STER_840- 10,29 10.29 39, 9 39, 9 Протеиназа PrtS Proteinase PrtS ISSthl6/ ISSthl6/ STER_848 STER_848 IS1167 IS1167 3 3 STER_881- STER_881- 8,71 8.71 39, 3 39, 3 Помпа ионов меди Copper ion pump IS1191 IS1191 STER_888 STER_888 4 4 STER_1277- STER_1277- 101,76 101.76 37,2 37.2 Катаболизм Catabolism IS1193 IS1193 STER_1380 STER_1380 лактозы, lactose, регуляция 2- regulation 2- компонента, component, синтез synthesis бактериоцина, АВС bacteriocin, ABC транспортеры conveyors

- 40 042506- 40 042506

Таблица 4Table 4

Гомологи до примерно 239 жизненно важных ОРС, идентифицированных в S. thermophilusHomologues to about 239 vital ORFs identified in S. thermophilus

Геном _част ь Genome _part STER STER начало Start конец end направ ление direction покр ытие coating еЗначение eValue аа id aa id Bacillus subtilis аннотация Bacillus subtilis annotation CSTER CSTER 1 1 101 101 1465 1465 + + белок DnaA инициатор хромосомной репликации DnaA protein initiator of chromosomal replication 98% 98% 4.00Е124 4.00E124 44% 44% белок DnaA инициатор хромосомной репликации DnaA protein initiator chromosomal replication CSTER CSTER 2 2 1620 1620 2756 2756 + + бета субъединица ДНК полимеразы III beta subunit of DNA polymerase III 99% 99% 1.00Е-88 1.00E-88 39% 39% dnan бета субъединица ДНК полимеразы III dnan beta subunit of DNA polymerase III CSTER CSTER 6 6 5818 5818 6387 6387 + + Пептидил-тРНК гидролаза Peptidyl-tRNA hydrolase 97% 97% 1.00Е-61 1.00E-61 51% 51% CSTER CSTER 9 9 10331 10331 10702 10702 + + Белок клеточного цикла Cell cycle protein 94% 94% 1.00Е-05 1.00Е-05 22% 22% белок DivIC клеточного деления cell division DivIC protein CSTER CSTER 12 12 12122 12122 13387 13387 + + тРНК ( Не) -лизидин синтаза, MesJ tRNA (He)-lyzidine synthase, MesJ 92% 92% 3.00Е-40 3.00E-40 32% 32% тРНК ( Не) -лизидин синтаза tils tRNA (He)-lysidine synthase tils CSTER CSTER 13 13 13469 13469 14011 14011 + + гипоксантин-гуанин фосфорибозилтрансфераза hypoxanthine-guanine phosphoribosyltransferase 99% 99% 2.00Е-82 2.00E-82 63% 63% гипоксантин-гуанин фосфорибозилтрансфераза hprt hypoxanthine-guanine phosphoribosyltransferase hprt CSTER CSTER 40 40 25595 25595 26425 26425 + + МгеС белок, определяющий форму клеток MgeC protein that determines the shape of cells 94% 94% 1.00Е-22 1.00Е-22 28% 28% МгеС белок, определяющий форму клеток MgeC protein that determines the shape of cells CSTER CSTER 43 43 28617 28617 29582 29582 + + рибозо-фосфат пирофосфокиназа ribose phosphate pyrophosphokinase 97% 97% 3.00Е145 3.00Е145 65% 65% Рибозо-фосфат пирофосфокиназа prs Ribose phosphate pyrophosphokinase prs CSTER CSTER 47 47 32842 32842 33846 33846 + + Предпол. глицерин-3- фосфат ацилтрансфераза Assumption glycerin-3- phosphate acyltransferase 94% 94% 9.00Е- 124 9.00E- 124 54% 54% Фосфат ацилтрансфераза PlsX Phosphate acyltransferase PlsX CSTER CSTER 48 48 33846 33846 34091 34091 + + ацил-переносящий белок acyl-carrying protein 76% 76% 1.00Е-08 1.00Е-08 40% 40% ацил-переносящий белок acyl-carrying protein CSTER CSTER 65 65 53036 53036 54727 54727 - - аргинил-тРНК синтетаза arginyl-tRNA synthetase 98% 98% 6.00Е-52 6.00Е-52 28% 28% CSTER CSTER 95 95 72798 72798 77192 77192 + + ДНК полимераза III Pole DNA polymerase III Pole 99% 99% 0.00Е+00 0.00Е+00 51% 51% ДНК полимераза III Ро1Стип DNA polymerase III Po1Stip CSTER CSTER 105 105 82956 82956 83723 83723 + + 30S рибосомный белок S2 30S ribosomal protein S2 96% 96% 1.00Е- 118 1.00E- 118 69% 69% CSTER CSTER 106 106 83841 83841 84881 84881 + + Фактор элонгации трансляции Ts elongation factor translations Ts 97% 97% 8.00Е-72 8.00E-72 44% 44% CSTER CSTER 117 117 97363 97363 98706 98706 + + цистеинил-тРНК синтетаза cysteinyl-tRNA synthetase 99% 99% 1.00Е- 178 1.00E- 178 54% 54% CSTER CSTER 127 127 104406 104406 104852 104852 + + 50S рибосомальный белок L13 50S ribosomal protein L13 99% 99% 9.00Е-57 9.00E-57 57% 57% CSTER CSTER 128 128 104880 104880 105272 105272 + + 30S рибосомальный белок S9 30S ribosomal protein S9 100% 100% 3.00Е-59 3.00E-59 68% 68% CSTER CSTER 193 193 159363 159363 160967 160967 + + СТР синтетаза STR synthetase 99% 99% 0.00Е+00 0.00Е+00 68% 68% СТР синтаза pyrg Pyrg synthase CSTER CSTER 199 199 166439 166439 166897 166897 - - консерв. гип. белок. canned hip. protein. 81% 81% 2.00Е-07 2.00E-07 28% 28% белок NrdI NrdI protein CSTER CSTER 208 208 176203 176203 176472 176472 + + 30S рибосомальный белок S15 30S ribosomal protein S15 100% 100% 6.00Е-38 6.00E-38 63% 63% CSTER CSTER 217 217 183028 183028 184185 184185 + + ундекапринил пирофосфат фосфатаза undecaprinyl pyrophosphate phosphatase 98% 98% 2.00Е-68 2.00E-68 38% 38% возможно ундекапринил пирофосфат фосфатаза Nацетилглюкозоменил 1фосфат трансфераза tagO possibly undecaprinyl pyrophosphate phosphatase Nacetylglucosomenil 1phosphate transferase tagO CSTER CSTER 218 218 184346 184346 185116 185116 + + АВС транспортер АТФаза ABC transporter ATPase 95% 95% 8.00Е- 130 8.00E- 130 71% 71% Растительный белок 296 suf С Vegetable protein 296 suf C CSTER CSTER 219 219 185153 185153 186415 186415 + + гип. белок hip. protein 97% 97% 4.00Е111 4.00Е111 42% 42% Белок сборки FeS кластеров SufD FeS assembly protein SufD clusters CSTER CSTER 220 220 186469 186469 187701 187701 + + предп. аминотрансфераза (класс V) predp. aminotransferase (class V) 98% 98% 0.00Е+00 0.00Е+00 60% 60% цистеин десульфураза SufS cysteine desulfurase SufS CSTER CSTER 221 221 187688 187688 188122 188122 + + Семейство белков NifU NifU protein family 95% 95% 3.00Е-48 3.00E-48 51% 51% цинк-зависимая сульфотрансфераза SufU zinc dependent sulfotransferase SufU CSTER CSTER 245 245 208199 208199 208993 208993 + + фосфотидат цитидилилтрансфераза phosphotidate cytidylyltransferase 98% 98% 3.00Е-67 3.00E-67 41% 41% фосфотидат цитидилилтрансфераза phosphotidate cytidylyltransferase CSTER CSTER 247 247 210343 210343 212205 212205 + + пролил-тРНК синтетаза prolyl-tRNA synthetase 98% 98% 0.00Е+00 0.00Е+00 50% 50% CSTER CSTER 252 252 215735 215735 216022 216022 + + Ко-шаперон GroES (HSP10) Co-chaperone GroES (HSP10) 97% 97% 1.00Е-18 1.00E-18 43% 43% CSTER CSTER 253 253 216071 216071 217690 217690 + + шаперон GroEL (семейство HSP60) GroEL chaperone (HSP60 family) 98% 98% 0.00Е+00 0.00Е+00 75% 75% CSTER CSTER 261 261 224055 224055 224204 224204 + + 50S рибосомальный белок L33 50S ribosomal protein L33 97% 97% 9.00Е-12 9.00Е-12 50% 50% CSTER CSTER 262 262 224216 224216 224392 224392 + + Субъединица SecE препротеин транслоказы Subunit of SecE translocase preprotein 81% 81% 1.40Е+00 1.40Е+00 21% 21% Субъединица SecE препротеин транслоказы Subunit of SecE translocase preprotein CSTER CSTER 268 268 227616 227616 230117 230117 + + лейцил-тРНК синтетаза leucyl-tRNA synthetase 99% 99% 0.00Е+00 0.00Е+00 70% 70% CSTER CSTER 273 273 232342 232342 233796 233796 + + никотинат фосфорибозилтрансфераза nicotinate phosphoribosyltransferase 97% 97% 0.00Е+00 0.00Е+00 63% 63% никотинат фосфорибозилтрансфераза nicotinate phosphoribosyltransferase CSTER CSTER 274 274 233808 233808 234629 234629 + + NAD синтетаза NAD synthetase 100% 100% 9.00Е- 109 9.00E- 109 59% 59% NH(3)-зависимая NAD(+) синтетаза nade NH(3) dependent NAD(+) nade synthetase CSTER CSTER 286 286 248252 248252 249580 249580 + + УДФ-Ы-ацетилмураматаланин лигаза UDP-N-acetylmuramatalanine ligase 99% 99% 3.00Е170 3.00Е170 55% 55% УДФ-Ы-ацетилмураматаланин лигаза murC UDP-N-acetylmuramatalanine ligase murC CSTER CSTER 302 302 260849 260849 261664 261664 + + Глутамат рацемаза Glutamate racemase 94% 94% 7.00Е-83 7.00E-83 48% 48% Глутамат рацемаза 1 гасЕ Glutamate racemase 1 gaC CSTER CSTER 307 307 264328 264328 265041 265041 + + Белок А сегрегации и конденсации Protein A segregation and condensation 93% 93% 5.00Е-37 5.00E-37 39% 39% Белок А сегрегации и конденсации Protein A segregation and condensation CSTER CSTER 308 308 265034 265034 265615 265615 + + Белок В сегрегации и конденсации Protein In segregation and condensation 94% 94% 9.00Е-36 9.00E-36 40% 40% Белок В сегрегации и конденсации Protein In segregation and condensation CSTER CSTER 313 313 269788 269788 270297 270297 + + рРНК метилтрансфераза rRNA methyltransferase 96% 96% 3.00Е-58 3.00E-58 51% 51% рРНК метилтрансфераза rRNA methyltransferase CSTER CSTER 349 349 303983 303983 305959 305959 + + транскетолаза transketolase 98% 98% 0.00Е+00 0.00Е+00 58% 58% транскетолаза tkt transketolase tkt CSTER CSTER 357 357 312857 312857 314032 314032 + + Белок DnaB инициации репликации хромосомы/прикрепления к мембране DnaB protein initiating chromosome replication/attachment to membrane 63% 63% 3.00Е-02 3.00Е-02 18% 18% Белок инициации репликации хромосомы и прикрепления к мембране Protein initiating chromosome replication and attachment to the membrane CSTER CSTER 358 358 314036 314036 314938 314938 + + рибосомальный белок Dnal ribosomal protein Dnal 99% 99% 7.00Е-58 7.00E-58 35% 35% рибосомальный белок Dnal ribosomal protein Dnal

- 41 042506- 41 042506

CSTER CSTER 359 359 315044 315044 316354 316354 + + ГТФ-связывающий белок EngA GTP binding protein EngA 100% 100% 0.00Е+00 0.00Е+00 67% 67% ГТФаза Der GTPase Der CSTER CSTER 368 368 321054 321054 322394 322394 - - серил-тРНК синтетаза seryl-tRNA synthetase 100% 100% 0.00Е+00 0.00Е+00 63% 63% CSTER CSTER 376 376 329673 329673 330116 330116 + + консервативный гип. белок conservative hip. protein 89% 89% 6.00Е-33 6.00E-33 43% 43% Белок биосинтеза тРНК треонилкарбамоиладенозин a TsaE tRNA biosynthesis protein threonylcarbamoyladenosine a TsaE CSTER CSTER 380 380 332545 332545 333732 333732 + + Фактор элонгации транскрипции elongation factor transcriptions 90% 90% 2.00Е113 2.00E113 46% 46% Белок терминации транскрипции/антитермина ции NusA Transcription termination/anti-termination protein NusA CSTER CSTER 383 383 334363 334363 337194 337194 + + Фактор инициации транскрипции IF-2 initiation factor transcription of IF-2 99% 99% 0.00Е+00 0.00Е+00 55% 55% CSTER CSTER 387 387 339864 339864 341309 341309 УДФ-Nацетилмуромоилаланил-Dглутамат--2,6диаминопимелат лигаза UDP-Nacetylmuromoylalanyl-Dglutamate--2,6diaminopimelate ligase 92% 92% 3.00Е-52 3.00Е-52 29% 29% УДФ-Nацетилмуромоилаланил-Dглутамат--2,6диаминопимелат лигаза murE UDP-Nacetylmuromoylalanyl-Dglutamate--2,6diaminopimelate ligase murE CSTER CSTER 419 419 364962 364962 365894 365894 + + предп. марганецзависимая неорганическая пирофосфатаза predp. manganese-dependent inorganic pyrophosphatase 99% 99% 3.00Е125 3.00E125 58% 58% марганец-зависимая неорганическая пирофосфатаза ррас manganese-dependent inorganic pyrophosphatase ppac CSTER CSTER 430 430 375355 375355 375579 375579 + + Ацил-переносящий белок Acyl-carrying protein 93% 93% 5.00Е-14 5.00E-14 49% 49% Ацил-переносящий белок Acyl-carrying protein CSTER CSTER 432 432 376667 376667 377593 377593 + + Ацил-переносящий белок S-малонилтрансфераза Acyl-carrying protein S-malonyltransferase 95% 95% 3.00Е-86 3.00E-86 47% 47% малонил СоА-ацил переносящий белок трансфераза malonyl CoA-acyl transfer protein transferase CSTER CSTER 433 433 377606 377606 378340 378340 + + 3-кетоацил-(ацилпереносящий- бел ок) редуктаза 3-ketoacyl-(acyl-carrying protein ok) reductase 99% 99% 6.00Е-79 6.00E-79 47% 47% 3-оксоацил-[ацилпереносящий- бел ок] редуктаза FabG 3-oxoacyl-[acyl-carrying protein ok] reductase FabG CSTER CSTER 434 434 378401 378401 379633 379633 + + 3-оксоацил-(ацилпереносящий- бел ок) синтаза II 3-oxoacyl-(acyl-carrying protein ok) synthase II 99% 99% 1.00Е- 133 1.00E- 133 48% 48% 3-оксоацил-[ацилпереносящий- бел ок] синтаза 2 3-oxoacyl-[acyl-carrying protein ok] synthase 2 CSTER CSTER 435 435 379637 379637 380125 380125 + + Субъединица биотин карбоксил-переносящего белка ацетил-СоА карбоксилазы Biotin subunit carboxyl-carrying protein acetyl-CoA carboxylase 98% 98% 9.00Е-26 9.00Е-26 37% 37% биотин карбоксилпереносящий белок ацетил-СоА карбоксилазы biotin carboxyl transfer protein acetyl-CoA carboxylase CSTER CSTER 437 437 380667 380667 382037 382037 + + Субъединица биотин карбоксилаза ацетил-СоА карбоксилазы Subunit of biotin carboxylase acetyl-CoA carboxylase 98% 98% 0.00Е+00 0.00Е+00 60% 60% Биотин карбоксилазы 1 Biotin carboxylase 1 CSTER CSTER 438 438 382043 382043 382909 382909 + + Бета субъединица ацетилСоА карбоксилазы Beta subunit of acetylCoA carboxylase 94% 94% 8.00Е-98 8.00E-98 51% 51% Бета субъединица карбоксил трансферазы ацетил-коэнзим А карбоксилазы Beta subunit of carboxyl transferase acetyl-coenzyme A carboxylase CSTER CSTER 439 439 382906 382906 383676 383676 + + альфа субъединица ацетил-СоА карбоксилазы alpha subunit acetyl-CoA carboxylase 76% 76% 2.00Е-81 2.00E-81 53% 53% Альфа субъединица карбоксил трансферазы ацетил коэнзим А карбоксилазы Alpha subunit of carboxyl transferase acetyl coenzyme A carboxylase CSTER CSTER 442 442 385819 385819 387417 387417 + + Консервативный гип. белок Conservative hip. protein 98% 98% 0.00Е+00 0.00Е+00 58% 58% рибонуклеаза Y ymda ribonuclease Y ymda CSTER CSTER 455 455 402156 402156 402470 402470 + + 50S рибосомальный белок L21 50S ribosomal protein L21 99% 99% 2.00Е-44 2.00Е-44 66% 66% CSTER CSTER 456 456 402507 402507 402797 402797 + + 50S рибосомальный белок L27 50S ribosomal protein L27 95% 95% 5.00Е-47 5.00E-47 79% 79% CSTER CSTER 460 460 405038 405038 405805 405805 + + дигидродипиколинат редуктаза dihydrodipicolinate reductase 98% 98% 7.00Е-95 7.00E-95 53% 53% 4-гидрокси- тетрагидродипиколинат редуктаза dapb 4-hydroxy- tetrahydrodipicolinate reductase dapb CSTER CSTER 461 461 405802 405802 407010 407010 + + тРНК ССА-пирофосфорилаза tRNA CCA pyrophosphorylase 98% 98% 6.00Е-86 6.00E-86 40% 40% CCA-добавляющий фермент CCA-Adding Enzyme CSTER CSTER 475 475 422256 422256 422813 422813 + + Фактор рециклинга рибосомы recycling factor ribosomes 100% 100% 2.00Е-68 2.00E-68 56% 56% CSTER CSTER 485 485 430547 430547 432550 432550 + + метионил-тРНК синтетаза methionyl-tRNA synthetase 98% 98% 0.00Е+00 0.00Е+00 58% 58% CSTER CSTER 492 492 438748 438748 439890 439890 + + Предшественник белка созревания протеазы protein precursor protease maturation 91% 91% 6.00Е-11 6.00E-11 26% 26% Белок фолдазы PrsA PrsA foldase protein CSTER CSTER 493 493 440232 440232 442850 442850 + + аланил-тРНК синтетаза alanyl-tRNA synthetase 99% 99% 0.00Е+00 0.00Е+00 52% 52% CSTER CSTER 513 513 460453 460453 463104 463104 + + валил-тРНК синтетаза valyl-tRNA synthetase 99% 99% 0.00Е+00 0.00Е+00 63% 63% CSTER CSTER 523 523 469888 469888 471168 471168 + + белок FtsW клеточного деления cell division FtsW protein 93% 93% 4.00Е-59 4.00E-59 34% 34% предполагаемая липид II флиппаза FtsW putative lipid II flippase FtsW CSTER CSTER 524 524 471406 471406 472602 472602 + + Фактор элонгации Ты Elongation factor You 99% 99% 0.00Е+00 0.00Е+00 76% 76% CSTER CSTER 525 525 472851 472851 473609 473609 + + триосефосфат изомераза triosephosphate isomerase 97% 97% 8.00Е- 109 8.00E- 109 62% 62% триосефосфат изомераза tpia triosephosphate isomerase tpia CSTER CSTER 526 526 473848 473848 474477 474477 + + Тимидилат киназа thymidylate kinase 96% 96% 4.00Е-73 4.00E-73 55% 55% Тимидилат киназа tmk Thymidylate kinase tmk CSTER CSTER 527 527 474486 474486 475361 475361 + + Дельта субъединица ДНК полимеразы III Delta subunit of DNA polymerase III 96% 96% 8.00Е-41 8.00E-41 33% 33% Дельта субъединица ДНК полимеразы III Delta subunit of DNA polymerase III CSTER CSTER 539 539 484827 484827 485744 485744 + + Альфа субъединица глицил-тРНК синтетазы Alpha subunit glycyl-tRNA synthetase 97% 97% 4.00Е169 4.00E169 74% 74% CSTER CSTER 540 540 486028 486028 488064 488064 + + Бета субъединица глицилтРНК синтетазы Beta subunit of glycyltRNA synthetase 97% 97% 0.00Е+00 0.00Е+00 45% 45% CSTER CSTER 567 567 512413 512413 512916 512916 + + 50S рибосомальный белокИО 50S ribosomal proteinIO 100% 100% 7.00Е-61 7.00E-61 57% 57% CSTER CSTER 568 568 512991 512991 513359 513359 + + 50S рибосомальный белок L7/L12 50S ribosomal protein L7/L12 100% 100% 4.00Е-38 4.00E-38 67% 67% CSTER CSTER 603 603 548926 548926 550308 550308 + + N-ацетилглюкозамин-!фосфат уридилтрансфераза N-acetylglucosamine-!phosphate uridyltransferase 97% 97% 3.00Е164 3.00Е164 52% 52% Бифункциональный белок GlmU Bifunctional protein GlmU CSTER CSTER 623 623 566278 566278 566781 566781 + + дигидрофолат редуктаза dihydrofolate reductase 94% 94% 8.00Е-34 8.00E-34 38% 38% дигидрофолат редуктаза dfra dihydrofolate reductase dfra

- 42 042506- 42 042506

CSTER CSTER 626 626 568210 568210 568809 568809 + + ГТФаза EngB GTPase EngB 96% 96% 7.00Е-92 7.00E-92 63% 63% возможный ГТФ- связывающий белок EngB possible GTP- binding protein EngB CSTER CSTER 632 632 573613 573613 574254 574254 - - пред. глицерин-3-фосфат ацилтрансфераза PlsY prev. glycerol-3-phosphate acyltransferase PlsY 90% 90% 3.00Е-40 3.00E-40 46% 46% глицерин-3-фосфат ацилтрансфераза plsy glycerol-3-phosphate acyltransferase plsy CSTER CSTER 633 633 574392 574392 576341 576341 + + Субъединица В ДНК топоизомеразы IV Subunit B of DNA topoisomerase IV 97% 97% 0.00Е+00 0.00Е+00 71% 71% Субъединица В ДНК топоизомеразы 4 Subunit B of DNA topoisomerases 4 CSTER CSTER 634 634 576969 576969 579434 579434 + + Субъединица А ДНК топоизомеразы IV Subunit A of DNA topoisomerase IV 95% 95% 0.00Е+00 0.00Е+00 54% 54% Субъединица А ДНК топоизомеразы 4 Subunit A of DNA topoisomerases 4 CSTER CSTER 660 660 598871 598871 599725 599725 + + метилентетрагидрофолат дегидрогеназа/ метилентетрагидрофолат циклогидролаза methylenetetrahydrofolate dehydrogenase/ methylenetetrahydrofolate cyclohydrolase 99% 99% 2.00Е109 2.00Е109 56% 56% Бифункциональный белок FolD Bifunctional protein Fold CSTER CSTER 668 668 605570 605570 606469 606469 + + ГТФаза Era GTPase Era 98% 98% 5.00Е143 5.00Е143 64% 64% ГТФаза Era GTPase Era CSTER CSTER 670 670 607313 607313 607927 607927 + + дефосфо-СоА каназа dephospho-CoA canase 95% 95% 2.00Е-50 2.00Е-50 45% 45% дефосфо-СоА киназа соае dephospho-CoA kinase soae 672 672 609192 609192 609338 609338 50S ribosomal prot. L33 50S ribosomal prot. L33 97% 97% 1.00Е-16 1.00E-16 52% 52% CSTER CSTER 684 684 620012 620012 621316 621316 + + енолаза enolase 100% 100% 0.00Е+00 0.00Е+00 70% 70% енолаза епо enolase epo CSTER CSTER 731 731 664470 664470 665690 665690 предп. ЦИТОЗИН-С5 специф. ДНК метилаза predp. CYTOSIN-C5 spec. DNA methylase 60% 60% 5.00Е-16 5.00E-16 31% 31% Возможная субъединица YdiO метилазы BsuMI модификации Possible subunit of YdiO methylase BsuMI modification CSTER CSTER 733 733 666939 666939 668429 668429 - - лизил-тРНК синтетаза (класс II) lysyl-tRNA synthetase (class II) 97% 97% 0.00Е+00 0.00Е+00 64% 64% CSTER CSTER 761 761 694548 694548 695582 695582 + + Дельта субъединица ДНК полимеразы III Delta subunit of DNA polymerase III 84% 84% 2.00Е-37 2.00E-37 33% 33% Неохарактеризованный белок YqeN Uncharacterized YqeN protein CSTER CSTER 773 773 704704 704704 706056 706056 + + УДФ-N- ацетилмурамоилаланин--Вглутамат лигаза UDF-N- acetylmuramoylalanine--Bglutamate ligase 98% 98% 8.00Е- 147 8.00E- 147 49% 49% УДФ-N- ацетилмурамоилаланин--Вглутамат лигаза murD UDF-N- acetylmuramoylalanine--Bglutamate ligase murD CSTER CSTER 774 774 706060 706060 707130 707130 + + N-ацетилглкозаминил трансфераза N-acetylglucosaminyl transferase 95% 95% 3.00Е-30 3.00E-30 27% 27% УД Φ-Ν-ацетилглюкозаминN-аце тилмур амил(пентапептид) фосфорилундекапренол N- ацетилглюкозамин трансфераза murG UD Φ-N-acetylglucosamineN-acetylmur amyl(pentapeptide) phosphorylundecaprenol N- acetylglucosamine transferase murG CSTER CSTER 775 775 707140 707140 708264 708264 + + Белок клеточного деления FtsQ Cell division protein FtsQ 79% 79% 4.00Е-15 4.00E-15 26% 26% Белок клеточного деления DivIB Cell division protein DivIB CSTER CSTER 776 776 708388 708388 709764 709764 + + Белок клеточного деления FtsA Cell division protein FtsA 84% 84% 4.00Е103 4.00E103 44% 44% Белок клеточного деления FtsA Cell division protein FtsA CSTER CSTER 777 777 709793 709793 711115 711115 + + Белок клеточного деления FtsZ Cell division protein FtsZ 92% 92% 2.00Е- 123 2.00E- 123 53% 53% Белок клеточного деления FtsZ Cell division protein FtsZ CSTER CSTER 783 783 714803 714803 717592 717592 + + изолейцил-тРНК синтетаза isoleucyl-tRNA synthetase 99% 99% 0.00Е+00 0.00Е+00 58% 58% CSTER CSTER 787 787 720193 720193 720459 720459 - - 50S рибосомный белок L31 50S ribosomal protein L31 100% 100% 1.00Е-22 1.00Е-22 50% 50% CSTER CSTER 793 793 725315 725315 726394 726394 + + Фактор высвобождения пептидной цепи 1 release factor peptide chain 1 99% 99% 6.00Е- 158 6.00E- 158 59% 59% CSTER CSTER 796 796 727911 727911 729161 729161 + + Серин гидроксиметилтрансфераза Serine hydroxymethyltransferase 97% 97% 2.00Е171 2.00Е171 60% 60% Серин гидроксиметилтрансфераза glya Serine hydroxymethyltransferase glya CSTER CSTER 833 833 760678 760678 762396 762396 - - предп. фосфоглюкомутаза predp. phosphoglucomutase 98% 98% 0.00Е+00 0.00Е+00 47% 47% фосфоглюкомутаза pgm phosphoglucomutase pgm CSTER CSTER 850 850 783500 783500 783736 783736 - - 30S рибосомный белок S20 30S ribosomal protein S20 94% 94% 1.00Е-13 1.00E-13 46% 46% CSTER CSTER 864 864 797961 797961 799307 799307 + + аспарагинил-тРНК синтетаза asparaginyl-tRNA synthetase 99% 99% 4.00Е180 4.00E180 56% 56% CSTER CSTER 903 903 833853 833853 835661 835661 + + D-фруктозо-6-фосфат амидотрансфераза D-fructose-6-phosphate amidotransferase 100% 100% 0.00Е+00 0.00Е+00 59% 59% глутамин--фруктозо-6фосфат аминотрансфераза [изомеризация] glmS glutamine--fructose-6phosphate aminotransferase [isomerization] glmS CSTER CSTER 915 915 845349 845349 846911 846911 + + Белок частицы распознавания сигнала protein particles signal recognition 95% 95% 2.00Е178 2.00Е178 57% 57% Белок частицы распознавания сигнала protein particles signal recognition CSTER CSTER 919 919 848991 848991 849845 849845 + + Рибосомального биогенезиса ГТФаза Ribosomal biogenesis GTPase 98% 98% 8.00Е- 101 8.00E- 101 50% 50% Рибосомального биогенезиса ГТФаза rbga Ribosomal biogenesis GTPase rbga CSTER CSTER 923 923 852605 852605 854749 854749 + + ДНК топоизомераза I DNA topoisomerase I 98% 98% 0.00Е+00 0.00Е+00 64% 64% ДНК топоизомераза 1 DNA topoisomerase 1 CSTER CSTER 994 994 915311 915311 917623 917623 + + АТФ-зависимая ДНК геликаза РсгА ATP-dependent DNA helicase PsrA 99% 99% 0.00Е+00 0.00Е+00 54% 54% АТФ-зависимая ДНК геликаза РсгА ATP-dependent DNA helicase PsrA CSTER CSTER 1034 1034 959843 959843 961231 961231 Субъединица Е2 дегидрогеназы разветвленных альфа кето-кислот Subunit E2 branched dehydrogenase alpha keto acids 99% 99% 5.00Е-69 5.00E-69 34% 34% Сукцидилтрансферазный компонент остатка дигидролипоиллизина 2- оксоглутарат дегидрогеназного комплекса odhb Succidyltransferase residue component dihydrolipoyllisin 2- oxoglutarate dehydrogenase complex odhb CSTER CSTER 1036 1036 962412 962412 963383 963383 ацетоин дегидрогеназный комплекс, Е1 компонент, альфа субъединица acetoin dehydrogenase complex, E1 component, alpha subunit 81% 81% 3.00Е-33 3.00E-33 28% 28% Альфа субъединица компонетна Е1 пируват дегидрогеназы pdha Alpha subunit of component E1 of pyruvate dehydrogenase pdha CSTER CSTER 1087 1087 1007529 1007529 1007888 1007888 - - 50S рибосомальный белок L2 0 50S ribosomal protein L2 0 85% 85% 2.00Е-56 2.00Е-56 80% 80% CSTER CSTER 1088 1088 1007945 1007945 1008145 1008145 - - 50S рибосомальный белок L35 50S ribosomal protein L35 100% 100% 1.00Е-23 1.00E-23 62% 62% CSTER CSTER 1089 1089 1008184 1008184 1008714 1008714 Фактор инициации транскрипции 3 (IF-3) initiation factor transcription 3 (IF-3) 98% 98% 2.00Е-63 2.00E-63 60% 60% CSTER CSTER 1102 1102 1017867 1017867 1018880 1018880 Фактор высвобождения пептидной цепи 2 release factor peptide chain 2 91% 91% 2.00Е137 2.00E137 57% 57% CSTER CSTER 1115 1115 1029796 1029796 1031136 1031136 Сенсорная гистидин киназа Sensory histidine kinase 97% 97% 4.00Е117 4.00Е117 71% 71% Регуляторный белок транскрипции YycF Regulatory protein YycF transcription CSTER CSTER 1116 1116 1031129 1031129 1031836 1031836 - - Двухкомпонентный регулятор ответа Two Component Response Regulator 68% 68% 2.00Е120 2.00Е120 47% 47% Сенсоная гистидин киназа YycG Sensory histidine kinase YycG

-43 042506-43 042506

CSTER CSTER 1123 1123 1036555 1036555 1037826 1037826 УДΦ-Ν-ацетилглюкозамин 1- карбоксивинилтрансфераза UDΦ-N-acetylglucosamine 1- carboxyvinyltransferase 96% 96% 2.00Е172 2.00E172 59% 59% УДΦ-Ν-ацетилглюкозамин 1- карбоксивинилтрансфераза 1 muraa UDΦ-N-acetylglucosamine 1- carboxyvinyltransferase 1 muraa CSTER CSTER 1135 1135 1049456 1049456 1050649 1050649 - - S-аденозилметионин синтетаза S-adenosylmethionine synthetase 97% 97% 0.00Е+00 0.00Е+00 67% 67% S-аденозилметионин синтетаза metk S-adenosylmethionine synthetase metk CSTER CSTER 1136 1136 1050929 1050929 1051867 1051867 + + биотин-(ацетил-СоА карбоксилаза) лигаза biotin-(acetyl-CoA carboxylase) ligase 92% 92% 4.00Е-44 4.00E-44 33% 33% бифункционаьный лигаза/репресср BirA bifunctional BirA ligase/repressor CSTER CSTER 1138 1138 1052266 1052266 1053918 1053918 - - ДНК полимераза III, гамма/тау субъединица DNA polymerase III, gamma/tau subunit 93% 93% 3.00Е137 3.00E137 44% 44% Гамма субъединица ДНК полимеразы III/тау Dnax Gamma subunit of DNA polymerase III/tau Dnax CSTER CSTER 1144 1144 1056546 1056546 1056893 1056893 - - 50S рибосомальный белок L19 50S ribosomal protein L19 100% 100% 2.00Е-61 2.00E-61 77% 77% CSTER CSTER 1164 1164 1073225 1073225 1074244 1074244 6-фосфофруктокиназа 6-phosphofructokinase 93% 93% 4.00Е124 4.00E124 61% 61% АТФ-зависимая 6- фосфофруктокиназа pfka ATP-dependent 6- phosphofructokinase pfka CSTER CSTER 1165 1165 1074337 1074337 1077447 1077447 - - ДНК полимераза III, альфа субъединица DnaE DNA polymerase III, alpha subunit of DnaE 96% 96% 0.00Е+00 0.00Е+00 35% 35% Альфа субъединица ДНК полимеразы III dnae Alpha subunit of DNA polymerase III dnae CSTER CSTER 1166 1166 1077600 1077600 1078385 1078385 Фактор трансляции пирувата (SUA5) Translation factor pyruvate (SUA5) 42% 42% 3.00Е-04 3.00Е-04 24% 24% ywlC неизвестный консервативный белок с пируват РНК-связывающим мотивом TW ywlC unknown conserved protein with pyruvate RNA-binding motif TW CSTER CSTER 1175 1175 1085950 1085950 1086225 1086225 - - гистоноподобный ДНК- связывающий белок histone-like DNA binding protein 95% 95% 4.00Е-40 4.00E-40 72% 72% ДНК-связывающий белок HU 1 DNA-binding protein HU 1 CSTER CSTER 1182 1182 1091629 1091629 1092501 1092501 геранилгеранил пирофосфат синтаза geranylgeranyl pyrophosphate synthase 89% 89% 5.00Е-58 5.00E-58 44% 44% фарнезил дифосфат синтаза ispa yqid farnesyl diphosphate synthase ispa yqid CSTER CSTER 1188 1188 1095764 1095764 1096462 1096462 Белок репликации ДНК DnaD DNA replication protein DnaD 85% 85% 1.00Е-07 1.00Е-07 22% 22% Белок репликации ДНК DnaD DNA replication protein DnaD CSTER CSTER 1193 1193 1101272 1101272 1102201 1102201 рибонуклеаза Z ribonuclease Z 99% 99% 2.00Е105 2.00Е105 50% 50% Ribonuclease Z rnz Ribonuclease Z rnz CSTER CSTER 1197 1197 1105450 1105450 1106877 1106877 Белок клеточного деления cell division protein 88% 88% 2.00Е-57 2.00E-57 38% 38% Rod форму-определяющий белок RodA Rod form-determining protein RodA CSTER CSTER 1230 1230 1131390 1131390 1132742 1132742 - - Фосфоглюкозамин мутаза Phosphoglucosamine mutase 100% 100% 0.00Е+00 0.00Е+00 63% 63% Фосфоглюкозамин мутаза ybbt glnM Phosphoglucosamine mutase ybbt glnM CSTER CSTER 1248 1248 1154457 1154457 1156616 1156616 + + рибонуклеотид-дифосфат редуктаза, альфа субъединица ribonucleotide diphosphate reductase, alpha subunit 98% 98% 0.00Е+00 0.00Е+00 47% 47% рибонуклеотид-дифосфат редуктаза, альфа субъединица nrde ribonucleotide diphosphate reductase, alpha subunit nrde CSTER CSTER 1249 1249 1156775 1156775 1157737 1157737 + + рибонуклеотид-дифосфат редуктаза, бета субъединица ribonucleotide diphosphate reductase, beta subunit 97% 97% 8.00Е-98 8.00E-98 49% 49% рибонуклеотид-дифосфат редуктаза, бета субъединица nrdf ribonucleotide diphosphate reductase, beta nrdf subunit CSTER CSTER 1256 1256 1161831 1161831 1164284 1164284 - - ДНК гираза, А субъединица DNA gyrase, A subunit 98% 98% 0.00Е+00 0.00Е+00 62% 62% ДНК гираза, А субъединица DNA gyrase, A subunit CSTER CSTER 1267 1267 1174041 1174041 1176449 1176449 фенилаланил-тРНК синтетаза, бета субъединица phenylalanyl-tRNA synthetase, beta subunit 99% 99% 0.00Е+00 0.00Е+00 47% 47% CSTER CSTER 1270 1270 1177285 1177285 1178328 1178328 фенилаланил-тРНК синтетаза, альфа субъединица phenylalanyl-tRNA synthetase, alpha subunit 98% 98% 3.00Е161 3.00E161 62% 62% CSTER CSTER 1271 1271 1178950 1178950 1182483 1182483 АТФава хросомосной сегрегации, SMC белок ATPava chromosomal segregation, SMC protein 99% 99% 0.00Е+00 0.00Е+00 37% 37% Разделяющий хромосомы белок Smc separating chromosomes Smc protein CSTER CSTER 1272 1272 1182486 1182486 1183175 1183175 - - рибонуклаза III ribonuclease III 89% 89% 4.00Е-68 4.00E-68 47% 47% рибонуклеаза 3 ribonuclease 3 CSTER CSTER 1273 1273 1183332 1183332 1184267 1184267 дигидродипиколинат синтаза dihydrodipicolinate synthase 93% 93% 5.00Е-88 5.00E-88 47% 47% 4-гидрокситетрагидропиколинат синтаза dapA 4-hydroxytetrahydropicolinate synthase dapA CSTER CSTER 1274 1274 1184605 1184605 1185681 1185681 - - аспартат-семиальдегид дегидрогеназа aspartate semialdehyde dehydrogenase 99% 99% 1.00Е- 143 1.00E- 143 58% 58% аспартат-семиальдегид дегидрогеназа asd aspartate semialdehyde dehydrogenase asd CSTER CSTER 1382 1382 1293065 1293065 1294063 1294063 тиредоксин редуктаза thyredoxin reductase 97% 97% 7.00Е113 7.00E113 50% 50% ферредоксин--НАДФ редуктаза 2 yumc ferredoxin--NADP reductase 2 yumc CSTER CSTER 1383 1383 1294065 1294065 1294784 1294784 тРНК (гуанин-N(1)-)- метилтрансфераза tRNA (guanine-N(1)-)- methyltransferase 100% 100% 6.00Е-87 6.00E-87 56% 56% тРНК (гуанин-N(1)-)- метилтрансфераза tRNA (guanine-N(1)-)- methyltransferase CSTER CSTER 1395 1395 1303326 1303326 1304261 1304261 - - метионил-тРНК формилтрансфераза methionyl-tRNA formyltransferase 96% 96% 5.00Е-98 5.00E-98 49% 49% CSTER CSTER 1396 1396 1304279 1304279 1306675 1306675 Белок сборки праймосомного комплекса PriA Primosomal complex assembly protein PriA 99% 99% 0.00Е+00 0.00Е+00 48% 48% Праймосомный белок N PriA Primosomal protein N PriA CSTER CSTER 1398 1398 1307153 1307153 1307782 1307782 - - Гуанилат киназа Guanylate kinase 98% 98% 5.00Е-87 5.00E-87 59% 59% Гуанилат киназа gmk Guanylate kinase gmk CSTER CSTER 1399 1399 1308015 1308015 1309406 1309406 Белок клеточного деления FtsY Cell division protein FtsY 97% 97% 8.00Е- 121 8.00E- 121 55% 55% Рецептор частиц, распознающих сигнал FtsY particle receptor, recognizing the FtsY signal CSTER CSTER 1422 1422 1330503 1330503 1331339 1331339 Неорганический полифосфат /АТФ-НАД киназа Inorganic polyphosphate /ATP-NAD kinase 100% 100% 5.00Е-78 5.00E-78 44% 44% НАД киназа 1 ppnk OVER kinase 1 ppnk CSTER CSTER 1425 1425 1333019 1333019 1333990 1333990 + + рибозо-фосфат пирофосфокиназа ribose phosphate pyrophosphokinase 100% 100% 4.00Е113 4.00Е113 54% 54% рибозо-фосфат пирофосфокиназа prs ribose phosphate pyrophosphokinase prs CSTER CSTER 1426 1426 1333994 1333994 1335106 1335106 + + предп. цистеин десульфураза predp. cysteine desulfurase 98% 98% 2.00Е115 2.00Е115 47% 47% предп. цистеин десульфураза IscS predp. cysteine desulfurase IscS CSTER CSTER 1448 1448 1355769 1355769 1356878 1356878 - - Сигма фактор РНК полимеразы RpoD Sigma factor RNA RpoD polymerases 93% 93% 6.00Е- 167 6.00E- 167 70% 70% Сигма фактор РНК полимеразы SigA Sigma factor RNA SigA polymerases CSTER CSTER 1449 1449 1356882 1356882 1358693 1358693 - - ДНК примаза Primase DNA 68% 68% 9.00Е-86 9.00E-86 37% 37% ДНК примаза DnaG DnaG primase DNA CSTER CSTER 1451 1451 1359076 1359076 1359252 1359252 30S рибосомальный белок S21 30S ribosomal protein S21 98% 98% 3.00Е-29 3.00E-29 89% 89% CSTER CSTER 1464 1464 1371306 1371306 1372619 1372619 - - ГТФаза ObgE GTPase ObgE 100% 100% 0.00Е+00 0.00Е+00 67% 67% ГТФаза ObgE GTPase ObgE CSTER CSTER 1480 1480 1387053 1387053 1389005 1389005 - - субъединица В ДНК гиразы subunit B of gyrase DNA 100% 100% 0.00Е+00 0.00Е+00 68% 68% субъединица В ДНК гиразы subunit B of gyrase DNA

- 44 042506- 44 042506

CSTER CSTER 1497 1497 1401241 1401241 1402143 1402143 УДФ-N- ацетиленолпирувоилглюкоз амин редуктаза UDF-N- acetylenolpyruvoylglucose amine reductase 98% 98% 1.00Е-66 1.00E-66 40% 40% УДФ-N- ацетиленолпирувоилглюкоз амин редуктаза murB UDF-N- acetylenolpyruvoylglucose amine reductase murB CSTER CSTER 1506 1506 1409996 1409996 1410268 1410268 - - 30S рибосомальный белок S16 30S ribosomal protein S16 100% 100% 5.00Е-42 5.00E-42 67% 67% CSTER CSTER 1512 1512 1415065 1415065 1416078 1416078 - - предп. липид киназа predp. lipid kinase 95% 95% 1.00Е-96 1.00E-96 51% 51% Диаглицерин киназа dagK Diaglycerol kinase dagK CSTER CSTER 1513 1513 1416088 1416088 1418034 1418034 - - НАД-зависимая ДНК лигаза NAD-dependent DNA ligase 97% 97% 0.00Е+00 0.00Е+00 55% 55% ДНК лигаза LigA DNA ligase LigA CSTER CSTER 1516 1516 1419659 1419659 1420519 1420519 - - methionine aminopeptidase methionine aminopeptidase 99% 99% 6.00Е-56 6.00E-56 37% 37% CSTER CSTER 1519 1519 1422447 1422447 1423709 1423709 УДΦ-Ν-ацетилглюкозамин 1- карбоксивинилтрансфераза UDΦ-N-acetylglucosamine 1- carboxyvinyltransferase 96% 96% 6.00Е- 125 6.00E- 125 46% 46% УДΦ-Ν-ацетилглюкозамин 1- карбоксивинилтрансфераза 1 muraa UDΦ-N-acetylglucosamine 1- carboxyvinyltransferase 1 muraa CSTER CSTER 1522 1522 1426828 1426828 1427583 1427583 1-ацил-sn-глицерин-3фосфат ацилтрансфераза 1-acyl-sn-glycerol-3phosphate acyltransferase 92% 92% 1.00Е-29 1.00E-29 32% 32% 1—ацил—sη—глицерин—3— фосфат ацилтрансфераза plsC 1-acyl-sη-glycerol-3-phosphate acyltransferase plsC CSTER CSTER 1534 1534 1439747 1439747 1441120 1441120 УДФ-Ы-ацетилмурамоилтрипептид-В-аланил-Dаланил лигаза UDP-N-acetylmuramoyltripeptide-B-alanyl-Dalanyl ligase 98% 98% 2.00Е-98 2.00E-98 38% 38% УДФ-Ы-ацетилмурамоилтрипептид-В-аланил-Dаланил лигаза murF UDP-N-acetylmuramoyltripeptide-B-alanyl-Dalanyl murF ligase CSTER CSTER 1544 1544 1447537 1447537 1448583 1448583 D-аланил-аланил синтетаза А D-alanyl-alanyl synthetase A 98% 98% 2.00Е-95 2.00E-95 42% 42% D-аланил--D-аланил лигаза ddl D-alanyl--D-alanyl ligase ddl CSTER CSTER 1583 1583 1483475 1483475 1484107 1484107 Никотиновой кислоты мононуклеотид аденилилтрансфераза Nicotinic acid mononucleotide adenylyltransferase 98% 98% 2.00Е-62 2.00E-62 44% 44% никотинат—нуклеотид аденилилтрансфераза nadd nicotinate-nucleotide adenylyltransferase nadd CSTER CSTER 1584 1584 1484211 1484211 1484528 1484528 предп. РНК-связывающий белок predp. RNA binding protein 95% 95% 1.00Е-24 1.00E-24 50% 50% возможный РНК- связывающий белок Yqel possible RNA- binding protein Yqel CSTER CSTER 1585 1585 1484767 1484767 1485885 1485885 ГТФ-связывающий белок YqeH GTP binding protein YqeH 100% 100% 6.00Е- 163 6.00E- 163 59% 59% Неохарактеризованный белок YqeH Uncharacterized protein YqeH CSTER CSTER 1590 1590 1488021 1488021 1489463 1489463 аспартил/глутамил-тРНК амидотрансфераза, субъединица В aspartyl/glutamyl-tRNA amidotransferase, subunit B 99% 99% 0.00Е+00 0.00Е+00 63% 63% CSTER CSTER 1591 1591 1489463 1489463 1490929 1490929 аспартил/глутамил-тРНК амидотрансфераза, субъединица А aspartyl/glutamyl-tRNA amidotransferase, subunit A 99% 99% 0.00Е+00 0.00Е+00 59% 59% CSTER CSTER 1592 1592 1490929 1490929 1491231 1491231 аспартил/глутамил-тРНК амидотрансфераза, субъединица С aspartyl/glutamyl-tRNA amidotransferase, subunit C 97% 97% 1.00Е-18 1.00E-18 41% 41% CSTER CSTER 1615 1615 1511378 1511378 1512298 1512298 - - Тиоредоксин редуктаза Thioredoxin reductase 95% 95% 3.00Е126 3.00Е126 58% 58% Тиоредоксин редуктаза trxb Thioredoxin reductase trxb CSTER CSTER 1665 1665 1554189 1554189 1555211 1555211 фосфо-Ы-ацетилмурамоилпентапептид-трансфераза phospho-N-acetylmuramoyl pentapeptide transferase 92% 92% 1.00Е-66 1.00E-66 41% 41% фосфо-Ы-ацетилмурамоилпентапептид-трансфераза mray phospho-N-acetylmuramoyl pentapeptide transferase mray CSTER CSTER 1666 1666 1555213 1555213 1557480 1557480 предп. пенициллин- связывающий белок 2Х predp. penicillin- binding protein 2X 90% 90% 9.00Е-88 9.00E-88 32% 32% пенициллин-связывающий белок 2В penicillin-binding protein 2B CSTER CSTER 1667 1667 1557484 1557484 1557804 1557804 Белок клеточного деления FtsL Cell division protein FtsL CSTER CSTER 1701 1701 1591284 1591284 1592387 1592387 - - Аланин рацемаза Alanine racemase 93% 93% 1.00Е-98 1.00E-98 43% 43% Аланин рацемаза 1 air Alanine racemase 1 air CSTER CSTER 1702 1702 1592408 1592408 1592767 1592767 предп. 4'- фосфопантетейнил трансфераза predp. 4'- phosphopantetheynyl transferase 97% 97% 6.00Е-29 6.00E-29 41% 41% голо-[ацил-переносящийбелок] синтаза holo-[acyl-carrying protein] synthase CSTER CSTER 1705 1705 1594955 1594955 1597504 1597504 - - Субъединица препротин транслоказы SecA Preprotin subunit SecA translocases 100% 100% 0.00Е+00 0.00Е+00 55% 55% Субъединица препротин транслоказы SecA Preprotin subunit SecA translocases CSTER CSTER 1726 1726 1616337 1616337 1616576 1616576 - - 30S рибосомальный белок S18 30S ribosomal protein S18 100% 100% 5.00Е-32 5.00E-32 65% 65% CSTER CSTER 1727 1727 1616618 1616618 1617136 1617136 Белок, связывающий однонитевую ДНК A protein that binds single-stranded DNA 93% 93% 1.00Е-41 1.00Е-41 56% 56% Белок В, связывающий однонитевую ДНК Protein B, which binds single-stranded DNA CSTER CSTER 1728 1728 1617148 1617148 1617438 1617438 - - 30S рибосомальный белок S6 30S ribosomal protein S6 96% 96% 4.00Е-40 4.00E-40 61% 61% CSTER CSTER 1745 1745 1633808 1633808 1634821 1634821 предп. О— сиалогликопротеин эндопептидаза predp. ABOUT- sialoglycoprotein endopeptidase 97% 97% 6.00Е- 130 6.00E- 130 55% 55% тРНК Ыб-аденозин треонилкарбамоилтрансфер аза tsad tRNA Nb-adenosine threonylcarbamoyltransfer aza tsad CSTER CSTER 1747 1747 1635236 1635236 1635922 1635922 предп. гликопротеин эндопептидаза predp. glycoprotein endopeptidase 100% 100% 6.00Е-44 6.00E-44 38% 38% белок TsaB биосинтеза тРНК треонилкарбамоиладенозин protein TsaB of tRNA biosynthesis threonylcarbamoyladenosine CSTER CSTER 1749 1749 1636421 1636421 1638103 1638103 + + мРНК деградации рибонуклеазы J1/J2 mRNA degradation ribonuclease J1/J2 99% 99% 0.00Е+00 0.00Е+00 62% 62% рибонуклеаза Л yqkc ribonuclease L yqkc CSTER CSTER 1755 1755 1642501 1642501 1643700 1643700 - - Фосфоглицерат киназа Phosphoglycerate kinase 100% 100% 2.00Е124 2.00E124 50% 50% Фосфоглицерат киназа pgk Phosphoglycerate kinase pgk CSTER CSTER 1762 1762 1648240 1648240 1650321 1650321 - - Фактор элонгации транскрипции G elongation factor transcription G 100% 100% 0.00Е+00 0.00Е+00 77% 77% CSTER CSTER 1763 1763 1650542 1650542 1651012 1651012 - - 30S рибосомальный белок S7 30S ribosomal protein S7 100% 100% 1.00Е-86 1.00E-86 75% 75% CSTER CSTER 1764 1764 1651031 1651031 1651444 1651444 - - 30S рибосомальный белок S12 30S ribosomal protein S12 98% 98% 3.00Е-80 3.00E-80 86% 86% CSTER CSTER 1770 1770 1656078 1656078 1656950 1656950 рибосома-ассоциированная ГТФаза ribosome-associated GTPase 99% 99% 5.00Е105 5.00E105 51% 51% предполагаемая ГТФаза рибосомного биогенеза RsgA putative GTPase of ribosomal biogenesis RsgA CSTER CSTER 1776 1776 1660099 1660099 1660413 1660413 - - предп. тиоредоксин predp. thioredoxin 92% 92% 1.00Е-37 1.00E-37 61% 61% тиоредоксин trxa thioredoxin trxa CSTER CSTER 1787 1787 1670058 1670058 1670192 1670192 - - 50S рибосомальный белок L34 50S ribosomal protein L34 100% 100% 1.00Е-15 1.00E-15 70% 70%

-45042506-45042506

CSTER CSTER 1790 1790 1673060 1673060 1673395 1673395 - - рибонуклеаза P ribonuclease P 95% 95% 1.00Е-31 1.00Е-31 47% 47% Белковый компонент рибонуклеаза Р Protein component ribonuclease P CSTER CSTER 1793 1793 1677296 1677296 1678750 1678750 - - глутамил-тРНК синтетаза glutamyl-tRNA synthetase 100% 100% 0.00Е+00 0.00Е+00 55% 55% CSTER CSTER 1797 1797 1681106 1681106 1681795 1681795 - - 50S рибосомальный белок LI 50S ribosomal protein LI 98% 98% 4.00Е-99 4.00E-99 65% 65% 50S рибосомальный белок L1 50S ribosomal protein L1 CSTER CSTER 1809 1809 1690036 1690036 1691058 1691058 + + глицерин-3-фосфат дегидрогеназа glycerol-3-phosphate dehydrogenase 94% 94% 4.00Е122 4.00E122 53% 53% глицерин-3-фосфат дегидрогеназа [NAD(P)+] gspA glycerol-3-phosphate dehydrogenase [NAD(P)+] gspA CSTER CSTER 1813 1813 1693298 1693298 1694431 1694431 метал-зависимая амдаза/аминоацилаза/ карбоксипептидаза metal-dependent amdase/aminoacylase/carboxypeptidase 95% 95% 6.00Е- 120 6.00E- 120 47% 47% N-ацетилдиаминопимелат диацетилаза ykur N-acetyldiaminopimelate diacetylase ykur CSTER CSTER 1814 1814 1694510 1694510 1695208 1695208 предп. 2,3,4,5- тетрагидропиридин-2карбоксилат N- сукцинилтрансфераза predp. 2,3,4,5- tetrahydropyridine-2carboxylate N- succinyltransferase 98% 98% 4.00Е-86 4.00E-86 60% 60% 2,3,4,5- тетрагидропиридин-2,6дикарбоксилат N- ацетилтрансфераза dapH 2,3,4,5- tetrahydropyridine-2,6dicarboxylate N- acetyltransferase dapH CSTER CSTER 1821 1821 1699209 1699209 1699601 1699601 - - Белок, связывающий сигнальную нить A protein that binds signal thread 93% 93% 1.00Е-25 1.00E-25 40% 40% Белок В, связывающий сигнальную нить ДНК Protein B, which binds DNA signaling strand CSTER CSTER 1844 1844 1713286 1713286 1716924 1716924 ДНК-зависимая РНК полимераза, бета субъединица DNA-dependent RNA polymerase, beta subunit 97% 97% 0.00Е+00 0.00Е+00 68% 68% ДНК-направленная РНК полимераза, бета субъединица DNA-directed RNA polymerase, beta subunit CSTER CSTER 1845 1845 1717025 1717025 1720606 1720606 ДНК-зависимая РНК полимераза, бета субъединица DNA-dependent RNA polymerase, beta subunit 98% 98% 0.00Е+00 0.00Е+00 71% 71% ДНК-направленная РНК полимераза, бета субъединица DNA-directed RNA polymerase, beta subunit CSTER CSTER 1847 1847 1723493 1723493 1724749 1724749 + + тирозил-тРНК синтетаза tyrosyl-tRNA synthetase 99% 99% 0.00Е+00 0.00Е+00 58% 58% CSTER CSTER 1876 1876 1751169 1751169 1752050 1752050 - - фруктозо-бифосфат альдолаза fructose bisphosphate aldolase 100% 100% 4.00Е-83 4.00E-83 45% 45% возможная фруктозо- бифосфат альдолаза fbaa possible fructose- aldolase biphosphate fbaa CSTER CSTER 1880 1880 1755102 1755102 1755488 1755488 - - 50S рибосомальный белок L17 50S ribosomal protein L17 100% 100% 2.00Е-62 2.00E-62 73% 73% CSTER CSTER 1881 1881 1755506 1755506 1756444 1756444 ДНК-зависимая РНК полимераза, альфа субъединица DNA-dependent RNA polymerase, alpha subunit 99% 99% 7.00Е139 7.00E139 62% 62% ДНК-направленная РНК полимераза, альфа субъединица DNA-directed RNA polymerase, alpha subunit CSTER CSTER 1882 1882 1756493 1756493 1756876 1756876 - - 30S рибосомальный белок S11 30S ribosomal protein S11 93% 93% 7.00Е-69 7.00E-69 87% 87% CSTER CSTER 1883 1883 1756904 1756904 1757269 1757269 30S рибосомальный белок S13 30S ribosomal protein S13 100% 100% 2.00Е-58 2.00E-58 73% 73% CSTER CSTER 1884 1884 1757290 1757290 1757403 1757403 50S рибосомальный белок L36 50S ribosomal protein L36 100% 100% 4.00Е-16 4.00E-16 84% 84% CSTER CSTER 1885 1885 1757429 1757429 1757647 1757647 - - Фактор инициации трансляции 1 (IF-1) initiation factor broadcast 1 (IF-1) 100% 100% 1.00Е-38 1.00E-38 7 8% 7 8% CSTER CSTER 1886 1886 1757765 1757765 1758421 1758421 - - Аденилат киназа Adenylate kinase 99% 99% 3.00Е-89 3.00E-89 59% 59% Аденилат киназа adk Adenylate kinase adk CSTER CSTER 1887 1887 1758553 1758553 1759848 1759848 предп. субъединица транслоказы, SecY predp. subunit translocases, SecY 99% 99% 4.00Е140 4.00Е140 49% 49% субъединица транслоказы SecY translocase subunit SecY CSTER CSTER 1888 1888 1759865 1759865 1760305 1760305 - - 50S рибосомальный белок L15 50S ribosomal protein L15 100% 100% 1.00Е-70 1.00E-70 72% 72% CSTER CSTER 1889 1889 1760433 1760433 1760615 1760615 50S рибосомальный белок L30 50S ribosomal protein L30 98% 98% 3.00Е-20 3.00E-20 62% 62% CSTER CSTER 1890 1890 1760630 1760630 1761124 1761124 - - 30S рибосомальный белок S5 30S ribosomal protein S5 93% 93% 8.00Е-70 8.00E-70 76% 76% CSTER CSTER 1891 1891 1761143 1761143 1761499 1761499 50S рибосомальный белок L18 50S ribosomal protein L18 100% 100% 4.00Е-55 4.00Е-55 73% 73% CSTER CSTER 1892 1892 1761589 1761589 1762125 1762125 50S рибосомальный белок L6 50S ribosomal protein L6 100% 100% 3.00Е-69 3.00E-69 60% 60% 50S рибосомальный белок L6 50S ribosomal protein L6 CSTER CSTER 1893 1893 1762252 1762252 1762650 1762650 - - 30S рибосомальный белок S8 30S ribosomal protein S8 100% 100% 1.00Е-73 1.00E-73 77% 77% CSTER CSTER 1894 1894 1762773 1762773 1762958 1762958 30S рибосомальный белок S14 30S ribosomal protein S14 100% 100% 1.00Е-31 1.00Е-31 77% 77% CSTER CSTER 1895 1895 1762976 1762976 1763518 1763518 - - 50S рибосомальный белок L5 50S ribosomal protein L5 99% 99% 3.00Е100 3.00Е100 77% 77% CSTER CSTER 1896 1896 1763545 1763545 1763850 1763850 50S рибосомальный белок L24 50S ribosomal protein L24 99% 99% 7.00Е-38 7.00E-38 64% 64% CSTER CSTER 1897 1897 1763931 1763931 1764299 1764299 - - 50S рибосомальный белок L14 50S ribosomal protein L14 100% 100% 5.00Е-74 5.00E-74 87% 87% CSTER CSTER 1898 1898 1764324 1764324 1764584 1764584 30S рибосомальный белок S17 30S ribosomal protein S17 97% 97% 4.00Е-46 4.00E-46 84% 84% CSTER CSTER 1899 1899 1764612 1764612 1764818 1764818 50S рибосомальный белок L2 9 50S ribosomal protein L2 9 78% 78% 1.00Е-14 1.00E-14 58% 58% CSTER CSTER 1900 1900 1764828 1764828 1765241 1765241 50S рибосомальный белок L16 50S ribosomal protein L16 93% 93% 1.00Е-76 1.00E-76 83% 83% CSTER CSTER 1901 1901 1765245 1765245 1765898 1765898 30S рибосомальный белок S3 30S ribosomal protein S3 100% 100% 1.00Е- 119 1.00E- 119 75% 75% CSTER CSTER 1902 1902 1765911 1765911 1766255 1766255 50S рибосомальный белок L22 50S ribosomal protein L22 96% 96% 7.00Е-49 7.00E-49 64% 64% CSTER CSTER 1903 1903 1766271 1766271 1766549 1766549 - - 30S рибосомальный белок S19 30S ribosomal protein S19 100% 100% 2.00Е-54 2.00Е-54 83% 83% CSTER CSTER 1904 1904 1766643 1766643 1767476 1767476 - - 50S рибосомальный белок L2 50S ribosomal protein L2 100% 100% 5.00Е159 5.00Е159 76% 76% 50S рибосомальный белок L2 50S ribosomal protein L2 CSTER CSTER 1905 1905 1767494 1767494 1767790 1767790 - - 50S рибосомальный белок L23 50S ribosomal protein L23 94% 94% 2.00Е-31 2.00E-31 60% 60% CSTER CSTER 1906 1906 1767790 1767790 1768413 1768413 - - 50S рибосомальный белок L4 50S ribosomal protein L4 100% 100% 9.00Е-92 9.00E-92 60% 60% 50S рибосомальный белок L4 50S ribosomal protein L4

-46042506-46042506

CSTER CSTER 1907 1907 1768438 1768438 1769064 1769064 - - 50S рибосомальный белок L3 50S ribosomal protein L3 99% 99% 4.00Е- 115 4.00E- 115 75% 75% 50S рибосомальный белок L3 50S ribosomal protein L3 CSTER CSTER 1908 1908 1769181 1769181 1769489 1769489 - - 30S рибосомальный белок S10 30S ribosomal protein S10 100% 100% 1.00Е-58 1.00E-58 78% 78% CSTER CSTER 1936 1936 1795296 1795296 1795484 1795484 + + 50S рибосомальный белок L2 8 50S ribosomal protein L2 8 100% 100% 7.00Е-26 7.00E-26 69% 69% CSTER CSTER 1948 1948 1805428 1805428 1807179 1807179 - - аспартил-тРНК синтетаза aspartyl-tRNA synthetase 98% 98% 0.00Е+00 0.00Е+00 57% 57% CSTER CSTER 1950 1950 1807719 1807719 1808999 1808999 гистидил-тРНК синтетаза histidyl-tRNA synthetase 99% 99% 1.00Е- 140 1.00E- 140 49% 49% CSTER CSTER 1953 1953 1810651 1810651 1810833 1810833 + + 50S рибосомальный белок L32 50S ribosomal protein L32 91% 91% 1.00Е-10 1.00E-10 48% 48% CSTER CSTER 1954 1954 1810849 1810849 1810998 1810998 + + 50S рибосомальный белок L33 50S ribosomal protein L33 100% 100% 1.00Е-14 1.00E-14 55% 55% CSTER CSTER 1973 1973 1823718 1823718 1824329 1824329 30S рибосомальный белок S4 30S ribosomal protein S4 100% 100% 1.00Е-95 1.00E-95 69% 69% CSTER CSTER 1975 1975 1824852 1824852 1826213 1826213 - - Репликативной ДНК геликаза Replicative DNA helicase 95% 95% 8.00Е- 176 8.00E- 176 56% 56% Репликативной ДНК геликаза DnaC Replicative DNA helicase DnaC CSTER CSTER 1976 1976 1826257 1826257 1826715 1826715 - - 50S рибосомальный белок L9 50S ribosomal protein L9 100% 100% 2.00Е-39 2.00E-39 55% 55% CSTER CSTER 1979 1979 1830931 1830931 1832052 1832052 тРНК (5-метиламинометил2-тиоуридилат)метилтрансфераза tRNA (5-methylaminomethyl2-thiouridylate) methyltransferase 98% 98% 9.00Е- 177 9.00E- 177 70% 70% тРНК-специфическая 2- тиоуридилаза MnmA tRNA-specific 2- thiouridylase MnmA CSTER CSTER 1986 1986 1838183 1838183 1838725 1838725 фосфатидилгицирофосфат синтаза phosphatidylhycyrophosphate synthase 93% 93% 2.00Е-45 2.00E-45 52% 52% CDP-диацилглицеро-глицерин-3-фосфат 3- фосфатидилтрансфераза pgsA CDP-diacylglycero-glycerol-3-phosphate 3- phosphatidyltransferase pgsA CSTER CSTER 1992 1992 1843910 1843910 1845391 1845391 инозин-5'-монофосфат дегидрогеназа inosine 5'-monophosphate dehydrogenase 99% 99% 0.00Е+00 0.00Е+00 68% 68% инозин-5'-монофосфат дегидрогеназа guab inosine 5'-monophosphate dehydrogenase guab CSTER CSTER 1993 1993 1845568 1845568 1846590 1846590 - - триптофанил-тРНК синтетаза II tryptophanyl-tRNA synthetase II 98% 98% 8.00Е-42 8.00E-42 35% 35%

Таблица 5Table 5

Список дифференциально экспрессируемых генов, идентифицированных в штамме GEI4, содержащем делецииList of differentially expressed genes identified in the GEI4 strain containing deletions

Оперон Operon Предполагаемый путь/функция Intended Path/Function Регулятоаэффектор Regulator-effector Ген Gene log 2 изменение log 2 change р-энач&ние p-value STER_O39O-STER-Q393 STER_O39O-STER-Q393 Метаболизм цистеина Cysteine metabolism Cmbr/H о гл r/Mtar Cmbr/H o ch r/Mtar STER_Q39O STER_Q39O -1.1 -1.1 2.7E-23 2.7E-23 STER_O391 STER_O391 -1.3 -1.3 2.2E-22 2.2E-22 STER_O392 STER_O392 -1.4 -1.4 1.2E-32 1.2E-32 STER 0393 STER 0393 -1.2 -1.2 2.8E-15 2.8E-15 STER_1016-STER_1017 STER_1016-STER_1017 Метаболизм мальтодекстрина Metabolism of maltodextrin STER_1016 STER_1016 -1.0 -1.0 0 0 STER 1017 STER 1017 -0.8 -0.8 7.50E-38 7.50E-38 STER_1 54B-STER_1555 STER_1 54B-STER_1555 Биоси нтез ароматических аминокислот Biosynthesis of aromatic amino acids T-box RNA (Тгр) T-box RNA (Tgr) STER_1548 STER__1549 STER_1548 STER__1549 -1.3 -1.0 -1.3 -1.0 2.3E-37 1.5Ε-2Θ 2.3E-37 1.5Ε-2Θ STER_1550 STER_1550 -1.3 -1.3 7.9Е-38 7.9E-38 STER_1551 STER_1551 -1.3 -1.3 1.2Е-35 1.2E-35 STER_1552 STER_1552 -1.3 -1.3 О ABOUT STER_1553 STER_1553 -1.4 -1.4 О ABOUT STER_1 554 STER_1 554 -1.3 -1.3 О ABOUT STER 15ББ STER 15BB -1.© -1.© 7.8Е-73 7.8E-73 STER_1 960-STER_19©3 STER_1 960-STER_19©3 Мембранные белки Membrane proteins STER_1 960 STER_1 960 -0.9 -0.9 0 0 STER_1961 STER_1961 -1.0 -1.0 0 0 STER_1962 STER_1962 -1.0 -1.0 8.3E-317 8.3E-317 STER 1963 STER 1963 -1.1 -1.1 3.2Е-965 3.2E-965 STER_0049-STER_0054 STER_0049-STER_0054 Биосинтез пуринов Biosynthesis of purines PurR PurR STER_0<M9 STER_0<M9 1.2 1.2 5.5Е-34 5.5E-34 STER_0O5O STER_0O5O 1.1 1.1 1.4Е-29 1.4E-29 STER_QO61 STER_QO61 1.1 1.1 0 0 STER_0O52 STER_0O52 1.1 1.1 0 0 STER_OO53 STER_OO53 1.1 1.1 0 0 STER 0054 STER 0054 1.1 1.1 Θ.6Ε-40 Θ.6Ε-40 STER_0699-STER_0701 STER_0699-STER_0701 Метаболизм этаноламина Metabolism of ethanolamine STER_06©9 STER_06©9 1.6 1.6 0 0 STER„0700 STER„0700 2.1 2.1 9.5Е-2ОО 9.5E-200 STER 0701 STER 0701 2.2 2.2 7.ΘΕ-329 7.ΘΕ-329 STER_1020-STER_1024 STER_1020-STER_1024 Твин аргинин трансл оказа Twin arginine transl render TatA TatA STER_1020 STER_1020 1.3 1.3 б.ЗЕ-14 b.ZE-14 STER_1O21 STER_1O21 1.3 1.3 8.ВЕ-12 8.BE-12 STER_1022 STER_1022 Ί .-4 Ί .-4 3.ЗЕ-12 3.ZE-12 STER_1023 STER_1023 1.0 1.0 9.βΕ-β 9.βΕ-β STER_1O24 STER_1O24 0.9 0.9 0.0022 0.0022 STER_1 02&-STER_1028 STER_1 02&-STER_1028 Гомеостаз железа iron homeostasis PerR PerR STER_1025 STER_1025 1.1 1.1 1.9Е-09 1.9E-09 STER_102© STER_102© 0.9 0.9 2.6Е-6 2.6E-6 STER_1027 STER_1027 1.2 1.2 ЗЕ-12 ZE-12 STER 1028 STER 1028 1.2 1.2 1.5Е-17 1.5E-17 ST E R_1405- STE R_1409 ST E R_1405- STE R_1409 Транспорте участием АВС белков Transport involving ABC proteins Cody Cody STER_14O5 STER_14O6 STER_14O5 STER_14O6 1.6 1.6 1.6 1.6 9.5Е-9О 0 9.5E-9O 0 STER_14O7 STER_14O7 1.6 1.6 3 _бв 3 7E _ bv STER_14O8 STER_14O8 1.5 1.5 0 0 STER„14O9 STER„14O9 1.4 1.4 4.2Е-54 4.2E-54 STER_1821-STER_1823 STER_1821-STER_1823 С стресс With stress STER_1821 STER_1821 2.0 2.0 О ABOUT STER_1822 STER_1822 2.2 2.2 5.4Е-98 5.4E-98 STER 1823 STER 1823 2.0 2.0 0 0

-47042506-47042506

ЛитератураLiterature

1. Darmon Е, Leach DE. (2014) Bacterial Genome Instability. Microbiol. Mol. Biol. Rev. 78, 1-39.1. Darmon E, Leach DE. (2014) Bacterial Genome Instability. microbiol. Mol. Biol. Rev. 78:1-39.

2. Labrie SJ, Samson JE, and Moineau S. (2010) Bacteriophage resistance mechanisms. Nat. Rev. Microbiol. 8, 317-327 .2. Labrie SJ, Samson JE, and Moineau S. (2010) Bacteriophage resistance mechanisms. Nat. Rev. microbiol. 8, 317-327.

3. Barrangou R, Marraffini LA (2014) CRISPR-Cas systems: prokaryotes upgrade to adaptive immunity. Mol Cell 54(2):234244 .3. Barrangou R, Marraffini LA (2014) CRISPR-Cas systems: prokaryotes upgrade to adaptive immunity. Mol Cell 54(2):234244.

4. Barrangou R, et al. (2007) CRISPR provides acquired resistance against viruses in prokaryotes. Science 315(5819):1709-1712.4 Barrangou R, et al. (2007) CRISPR provides acquired resistance against viruses in prokaryotes. Science 315(5819):1709-1712.

5. Brouns SJJ, et al. (2008) Small CRISPR RNAs guide antiviral defense in prokaryotes. Science 321(5891):960-964.5. Brouns SJJ, et al. (2008) Small CRISPR RNAs guide antiviral defense in prokaryotes. Science 321(5891):960-964.

6. Young JC et al. (2012) Phage-induced expression of CRISPR-associated proteins is revealed by shotgun proteomics in Streptococcus thermophilus. PLoS ONE 7(5):e38077.6 Young JC et al. (2012) Phage-induced expression of CRISPR-associated proteins is revealed by shotgun proteomics in Streptococcus thermophilus. PLoS ONE 7(5):e38077.

7. Garneau JE, et al. (2010) The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA. Nature 468 (7320) :67-71.7. Garneau JE, et al. (2010) The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA. Nature 468(7320):67-71.

8. Groenen PM, Bunschoten AE, Van Soolingen D, Van Embden JD (1993) Nature of DNA polymorphism in the direct repeat cluster of Mycobacterium tuberculosis; application for strain differentiation by a novel typing method. Mol Microbiol 10 (5) :1057-1065.8. Groenen PM, Bunschoten AE, Van Soolingen D, Van Embden JD (1993) Nature of DNA polymorphism in the direct repeat cluster of Mycobacterium tuberculosis; application for strain differentiation by a novel typing method. Mol Microbiol 10(5):1057-1065.

9. Yin S, et al. (2013) The evolutionary divergence of Shiga toxin-producing Escherichia coli is reflected in clustered regularly interspaced short palindromic repeat (CRISPR) spacer composition. Appl Environ Microbiol 79(18):5710-5720.9. Yin S, et al. (2013) The evolutionary divergence of Shiga toxin-producing Escherichia coli is reflected in clustered regularly interspaced short palindromic repeat (CRISPR) spacer composition. Appl Environ Microbiol 79(18):5710-5720.

10. Liu F, et al. (2011) Novel virulence gene and clustered regularly interspaced short palindromic repeat (CRISPR) multilocus sequence typing scheme for subtyping of the major serovars of Salmonella enterica subsp. enterica. Appl Environ Microbiol 77(6):1946-1956.10 Liu F, et al. (2011) Novel virulence gene and clustered regularly interspaced short palindromic repeat (CRISPR) multilocus sequence typing scheme for subtyping of the major serovars of Salmonella enterica subsp. enterica. Appl Environ Microbiol 77(6):1946-1956.

- 48 042506- 48 042506

11. Barrangou R, Horvath P (2012) CRISPR: new horizons in phage resistance and strain identification. Annu Rev Food Sci Technol 3, 143-162.11. Barrangou R, Horvath P (2012) CRISPR: new horizons in phage resistance and strain identification. Annu Rev Food Sci Technol 3, 143-162.

12. Sander JD, and Joung JK. (2014) CRISPR-Cas systems for editing, regulating and targeting genomes. Nat. Biotechnol. 32, 347-355.12. Sander JD, and Joung JK. (2014) CRISPR-Cas systems for editing, regulating and targeting genomes. Nat. Biotechnol. 32, 347-355.

13. Bikard D, et al. (2013) Programmable repression and activation of bacterial gene expression using an engineered CRISPR-Cas system. Nucleic Acids Res 41(15):7429-743713 Bicard D, et al. (2013) Programmable repression and activation of bacterial gene expression using an engineered CRISPR-Cas system. Nucleic Acids Res 41(15):7429-7437

14. Qi LS, et al. (2013) Repurposing CRISPR as an RNAGuided Platform for Sequence-Specific Control of Gene Expression. Cell 152(5):1173-1183.14. Qi LS, et al. (2013) Repurposing CRISPR as an RNAGuided Platform for Sequence-Specific Control of Gene Expression. Cell 152(5):1173-1183.

15. Gomaa AA, et al. (2014) Programmable Removal of Bacterial Strains by Use of Genome-Targeting CRISPR-Cas Systems. mBio 5(1):e00928-13.15. Gomaa AA, et al. (2014) Programmable Removal of Bacterial Strains by Use of Genome-Targeting CRISPR-Cas Systems. mBio 5(1):e00928-13.

16. Ishino Y, Shinagawa H, Makino K, Amemura M, Nakata A (1987) Nucleotide sequence of the iap gene, responsible for alkaline phosphatase isozyme conversion in Escherichia coll, and identification of the gene product. J Bacteriol 169(12):54295433.16. Ishino Y, Shinagawa H, Makino K, Amemura M, Nakata A (1987) Nucleotide sequence of the iap gene, responsible for alkaline phosphatase isozyme conversion in Escherichia coll, and identification of the gene product. J Bacteriol 169(12):54295433.

17. Jansen R, Embden JDA van, Gaastra W, Schouls LM (2002) Identification of genes that are associated with DNA repeats in prokaryotes. Mol Microbiol 43(6):1565-1575.17. Jansen R, Embden JDA van, Gaastra W, Schouls LM (2002) Identification of genes that are associated with DNA repeats in prokaryotes. Mol Microbiol 43(6):1565-1575.

18. Bolotin A, et al. (2004) Complete sequence and comparative genome analysis of the dairy bacterium Streptococcus thermophilus. Nat Biotechnol 22(12):1554-1558.18 Bolotin A, et al. (2004) Complete sequence and comparative genome analysis of the dairy bacterium Streptococcus thermophilus. Nat Biotechnol 22(12):1554-1558.

19. Horvath P, et al. (2008) Diversity, activity, and evolution of CRISPR loci in Streptococcus thermophilus. J Bacteriol 190(4):1401-1412.19 Horvath P, et al. (2008) Diversity, activity, and evolution of CRISPR loci in Streptococcus thermophilus. J Bacteriol 190(4):1401-1412.

20. Bolotin A, Quinguis B, Sorokin A, Ehrlich SD (2005) Clustered regularly interspaced short palindrome repeats (CRISPRs) have spacers of extrachromosomal origin. Microbiology 151 (Pt 8) :2551-2561.20. Bolotin A, Quinguis B, Sorokin A, Ehrlich SD (2005) Clustered regularly interspaced short palindrome repeats (CRISPRs) have spacers of extrachromosomal origin. Microbiology 151(Pt 8):2551-2561.

21. Deveau H, et al. (2008) Phage response to CRISPRencoded resistance in Streptococcus thermophilus. J Bacteriol 190(4):1390-1400.21 Deveau H, et al. (2008) Phage response to CRISPRencoded resistance in Streptococcus thermophilus. J Bacteriol 190(4):1390-1400.

- 49 042506- 49 042506

22. Paez-Espino D, et al. (2013) Strong bias in the bacterial CRISPR elements that confer immunity to phage. Nat Commun 4, 1430.22 Paez-Espino D, et al. (2013) Strong bias in the bacterial CRISPR elements that confer immunity to phage. Nat Commun 4, 1430.

23. Sun CL, et al. (2013) Phage mutations in response to CRISPR diversification in a bacterial population. Environ Microbiol 15(2):463-470.23. Sun CL, et al. (2013) Phage mutations in response to CRISPR diversification in a bacterial population. Environ Microbiol 15(2):463-470.

24. Sapranauskas R, et al. (2011) The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coll. Nucleic Acids Res 39(21):9275-9282.24 Sapranauskas R, et al. (2011) The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coll. Nucleic Acids Res 39(21):9275-9282.

25. Gasiunas G, Barrangou R, Horvath P, Siksnys V (2012) Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proc Natl Acad Sci USA 109(39):E2579-2586.25. Gasiunas G, Barrangou R, Horvath P, Siksnys V (2012) Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proc Natl Acad Sci USA 109(39):E2579-2586.

26. Briner AE, et al. (2014) Guide RNA Functional Modules Direct Cas9 Activity and Orthogonality. Molecular Cell. 56(2):333-33926 Briner AE, et al. (2014) Guide RNA Functional Modules Direct Cas9 Activity and Orthogonality. Molecular cell. 56(2):333-339

27. Bondy-Denomy J, Davidson AR. (2014) To acquire or resist: the complex biological effects of CRISPR-Cas systems. Trends Microbiol. 22, 218-225.27. Bondy-Denomy J, Davidson AR. (2014) To acquire or resist: the complex biological effects of CRISPR-Cas systems. Trends Microbiol. 22, 218-225.

28. Horvath P, et al. (2009) Comparative analysis of CRISPR loci in lactic acid bacteria genomes. Int J Food Microbiol 131 (1) :62-70.28 Horvath P, et al. (2009) Comparative analysis of CRISPR loci in lactic acid bacteria genomes. Int J Food Microbiol 131(1):62-70.

29. Jiang W, Bikard D, Cox D, Zhang F, Marraffini LA. (2013a) RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nat Biotechnol 31(3):233-239.29. Jiang W, Bikard D, Cox D, Zhang F, Marraffini LA. (2013a) RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nat Biotechnol 31(3):233-239.

30. Vercoe RB, et al. (2013) Cytotoxic chromosomal targeting by CRISPR/Cas systems can reshape bacterial genomes and expel or remodel pathogenicity islands. PLoS Genet 9(4):el003454.30. Vercoe RB, et al. (2013) Cytotoxic chromosomal targeting by CRISPR/Cas systems can reshape bacterial genomes and expel or remodel pathogenicity islands. PLoS Genet 9(4):el003454.

31. Oh JH, van Pijkeren JP. (2014) CRISPR-Cas9-assisted recombineering in Lactobacillus reuteri. Nucleic Acids Res 10.1093/nar/gku62331 Oh JH, van Pijkeren JP. (2014) CRISPR-Cas9-assisted recombineering in Lactobacillus reuteri. Nucleic Acids Res 10.1093/nar/gku623

32. Selle K, Barrangou R. (2015) Harnessing CRISPR-Cas systems for bacterial genome editing. Trends Microbiol. In press32. Selle K, Barrangou R. (2015) Harnessing CRISPR-Cas systems for bacterial genome editing. Trends Microbiol. In press

33. Kobayashi K, et al. (2003) Essential Bacillus subtilis genes. Proc. Natl. Acad. Sci. U.S.A. 100, 4678-4683.33. Kobayashi K, et al. (2003) Essential Bacillus subtilis genes. Proc. Natl. Acad. sci. U.S.A. 100, 4678-4683.

- 50 042506- 50 042506

34. Mahillon J, Chandler M. (1998) Insertion sequences. Microbiol Mol Biol Rev 62(3):725-774.34. Mahillon J, Chandler M. (1998) Insertion sequences. Microbiol Mol Biol Rev 62(3):725-774.

35. Goh YJ, Goin C, O'Flaherty S, Altermann E, Hutkins R (2011) Specialized adaptation of a lactic acid bacterium to the milk environment; the comparative genomics of Streptococcus thermophilus LMD-9. Microbial Cell Factories 10 (Suppl 1):S2235. Goh YJ, Goin C, O'Flaherty S, Altermann E, Hutkins R (2011) Specialized adaptation of a lactic acid bacterium to the milk environment; the comparative genomics of Streptococcus thermophilus LMD-9. Microbial Cell Factories 10 (Suppl 1):S22

36. Dandoy D, et al. (2011) The fast milk acidifying phenotype of Streptococcus thermophilus can be acquired by natural transformation of the genomic island encoding the cellenvelope proteinase PrtS. Microb. Cell Fact. 10 Suppl 1, S21.36 Dandoy D, et al. (2011) The fast milk acidifying phenotype of Streptococcus thermophilus can be acquired by natural transformation of the genomic island encoding the cellenvelope proteinase PrtS. Microb. cell fact. 10 Suppl 1, S21.

37. Deltcheva E, et al. (2011) CRISPR RNA maturation by trans-activating small RNA and host factor RNase III. Nature 471, 602-607.37 Deltcheva E, et al. (2011) CRISPR RNA maturation by trans-activating small RNA and host factor RNase III. Nature 471, 602-607.

38. Aravind L, Koonin EV (2001) Prokaryotic homologs of the eukaryotic DNA-end-binding protein Ku, novel domains in the Ku protein and prediction of a prokaryotic double-strand break repair system. Genome Res 11(8):1365-1374.38. Aravind L, Koonin EV (2001) Prokaryotic homologs of the eukaryotic DNA-end-binding protein Ku, novel domains in the Ku protein and prediction of a prokaryotic double-strand break repair system. Genome Res 11(8):1365-1374.

39. Koonin EV, Makarova KS (2007) Evolutionary genomics of lactic acid bacteria. J Bacteriol 189(4):1199-120839. Koonin EV, Makarova KS (2007) Evolutionary genomics of lactic acid bacteria. J Bacteriol 189(4):1199-1208

40. Makarova KS, et al. (2006) Comparative genomics of the lactic acid bacteria. Proc Natl Acad Sci USA 103(42):1561115616.40 Makarova KS, et al. (2006) Comparative genomics of the lactic acid bacteria. Proc Natl Acad Sci USA 103(42):1561115616.

41. Goh YJ, et al. (2009) Development and application of a upp-based counterselective gene replacement system for the study of the S-layer protein SlpX of Lactobacillus acidophilus NCFM. Appl Environ Microbiol 75(10):3093-3105.41 Goh YJ, et al. (2009) Development and application of a upp-based counterselective gene replacement system for the study of the S-layer protein SlpX of Lactobacillus acidophilus NCFM. Appl Environ Microbiol 75(10):3093-3105.

42. Horton RM, Hunt HD, Ho SN, Pullen JK, Pease LR (1989) Engineering hybrid genes without the use of restriction enzymes: gene splicing by overlap extension. Gene 77(1):61-68.42. Horton RM, Hunt HD, Ho SN, Pullen JK, Pease LR (1989) Engineering hybrid genes without the use of restriction enzymes: gene splicing by overlap extension. Gene 77(1):61-68.

43. Mojica FJM, Diez-Villasenor C, Garcia-Martinez J, Almendros C (2009) Short motif sequences determine the targets of the prokaryotic CRISPR defence system. Microbiology 155(Pt 3) :733-740.43. Mojica FJM, Diez-Villasenor C, Garcia-Martinez J, Almendros C (2009) Short motif sequences determine the targets of the prokaryotic CRISPR defense system. Microbiology 155(Pt 3):733-740.

44. Russell WM, Klaenhammer TR (2001) Efficient System for Directed Integration into the Lactobacillus acidophilus and Lactobacillus gasseri Chromosomes via Homologous Recombination. Appl Environ Microbiol 67(9):4361-4364.44. Russell WM, Klaenhammer TR (2001) Efficient System for Directed Integration into the Lactobacillus acidophilus and Lactobacillus gasseri Chromosomes via Homologous Recombination. Appl Environ Microbiol 67(9):4361-4364.

45. Wei M-Q, et al. (1995) An improved method for the transformation of Lactobacillus strains using electroporation. Journal of Microbiological Methods 21(1):97-109.45 Wei M-Q, et al. (1995) An improved method for the transformation of Lactobacillus strains using electroporation. Journal of Microbiological Methods 21(1):97-109.

46. Zhang X, Bremer H (1995) Control of the Escherichia coli rrnB pl promoter strength by ppGpp. Journal of Biological Chemistry 270(19) :11181-11189.46. Zhang X, Bremer H (1995) Control of the Escherichia coli rrnB pl promoter strength by ppGpp. Journal of Biological Chemistry 270(19):11181-11189.

47. Law J, et al. (1995) A system to generate chromosomal mutations in Lactococcus lactis which allows fast analysis of targeted genes. J Bacteriol 177(24):7011-7018.47 Law J, et al. (1995) A system to generate chromosomal mutations in Lactococcus lactis which allows fast analysis of targeted genes. J Bacteriol 177(24):7011-7018.

Приведенное выше описание иллюстрирует настоящее изобретение и не должно быть истолковано как ограничивающее его каким-либо образом. Изобретение определяется приведенной ниже формулой изобретения, которая охватывает все ее эквиваленты.The above description illustrates the present invention and should not be construed as limiting it in any way. The invention is defined by the following claims, which cover all equivalents thereof.

--

Claims (18)

ФОРМУЛА ИЗОБРЕТЕНИЯCLAIM 1. Способ уничтожения одной или более бактериальных клеток в популяции бактериальных клеток, включающий введение в популяцию бактериальных клеток конструкции гетерологичной нуклеиновой кислоты, содержащей (a) CRISPR-Cas систему, где CRISPR-Cas система представляет собой CRISPR-Cas систему типа I, где CRISPR-Cas система типа I содержит (i) конструкцию гетерологичной нуклеиновой кислоты, кодирующей по меньшей мере один каскадный полипептид типа I, и (ii) полипептид Cas3, Cas3' и Cas3'' или конструкцию гетерологичной нуклеиновой кислоты, кодирующей полипептид Cas3, Cas3' и Cas3''; и (b) массив CRISPR типа I, содержащий (в 5'-3' направлении) последовательность повтор-спейсерповтор или по меньшей мере одну последовательность повтор-спейсер, где спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повторспейсер содержит нуклеотидную последовательность, которая по существу комплементарна областимишени в геноме одной или более бактериальных клеток в указанной популяции, тем самым уничтожая одну или более бактериальных клеток, которые содержат область-мишень в популяции бактериальных клеток.1. A method for killing one or more bacterial cells in a population of bacterial cells, comprising introducing into the population of bacterial cells a heterologous nucleic acid construct comprising (a) a CRISPR-Cas system, where the CRISPR-Cas system is a type I CRISPR-Cas system, where CRISPR -Cas type I system comprises (i) a heterologous nucleic acid construct encoding at least one type I cascade polypeptide, and (ii) a Cas3, Cas3' and Cas3'' polypeptide or a heterologous nucleic acid construct encoding a Cas3, Cas3' polypeptide and Cas3''; and (b) a type I CRISPR array containing (in the 5'-3' direction) a repeat-spacer-repeat sequence or at least one repeat-spacer sequence, where the spacer of said repeat-spacer-repeat sequence or of said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome of one or more bacterial cells in said population, thereby killing one or more bacterial cells that contain the target region in the bacterial cell population. 2. Способ по п.1, в котором область-мишень находится в жизненно важном гене или нежизненно важном гене.2. The method of claim 1, wherein the target region is in a vital gene or a non-essential gene. 3. Способ по п.1 или 2, в котором последовательность повтор-спейсер-повтор или по меньшей мере одна последовательность повтор-спейсер содержит повтор, который идентичен повтору из массива CRISPR типа I дикого типа.3. The method of claim 1 or 2, wherein the repeat-spacer-repeat sequence, or at least one repeat-spacer sequence, contains a repeat that is identical to a repeat from a wild type I CRISPR array. 4. Способ по любому из пп.1-3, в котором область-мишень выбрана из любых по меньшей мере 10 последовательных нуклеотидов, расположенных рядом с последовательностью PAM в одной или нескольких бактериальных клетках.4. The method according to any one of claims 1 to 3, wherein the target region is selected from any of at least 10 consecutive nucleotides adjacent to the PAM sequence in one or more bacterial cells. 5. Способ по любому из предшествующих пунктов, в котором гид CRISPR функционально связан с промотором.5. The method of any one of the preceding claims, wherein the CRISPR guide is operably linked to a promoter. 6. Способ по любому из предшествующих пунктов, в котором по меньшей мере одна бактериальная клетка в популяции не содержит область-мишень и, следовательно, по меньшей мере одна бактериальная клетка не уничтожается при введении CRISPR-Cas системы.6. The method according to any one of the preceding claims, wherein at least one bacterial cell in the population does not contain the target region and, therefore, at least one bacterial cell is not killed when the CRISPR-Cas system is administered. 7. Способ по любому из предшествующих пунктов, в котором спейсер указанной последовательности повтор-спейсер-повтор или последовательности повтор-спейсер содержит нуклеотидную последовательность, которая на 100% комплементарна области-мишени.7. A method according to any one of the preceding claims, wherein the spacer of said repeat-spacer-repeat sequence or repeat-spacer sequence contains a nucleotide sequence that is 100% complementary to the target region. 8. Способ по любому из предшествующих пунктов, в котором область-мишень выбрана из гена, открытой рамки считывания, или предполагаемой открытой рамки считывания, или межгенной области.8. The method of any one of the preceding claims, wherein the target region is selected from a gene, open reading frame, or putative open reading frame, or intergenic region. 9. Фармацевтическая композиция для уничтожения одной или более бактериальных клеток в популяции бактериальных клеток, где фармацевтическая композиция содержит конструкцию гетерологичной нуклеиновой кислоты, содержащую (a) CRISPR-Cas систему, где CRISPR-Cas система представляет собой CRISPR-Cas систему типа I, где CRISPR-Cas система типа I содержит (i) конструкцию гетерологичной нуклеиновой кислоты, кодирующей по меньшей мере один каскадный полипептид типа I, и (ii) полипептид Cas3, Cas3' и Cas3'' или конструкцию гетерологичной нуклеиновой кислоты, кодирующей полипептид Cas3, Cas3' и Cas3''; и (b) массив CRISPR типа I, содержащий (в 5'-3' направлении) последовательность повтор-спейсерповтор или по меньшей мере одну последовательность повтор-спейсер, где спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повторспейсер содержит нуклеотидную последовательность, которая по существу комплементарна областимишени в геноме бактериальных клеток указанной популяции, где область-мишень представляет собой генетическую последовательность одной или более бактериальных клеток, где массив CRISPR представляет собой массив CRISPR типа I, где фармацевтическую композицию вводят в популяцию бактериальных клеток и, таким образом, одна или несколько бактериальных клеток, которые содержат область-мишень в популяции бактериальных клеток, уничтожается.9. A pharmaceutical composition for killing one or more bacterial cells in a population of bacterial cells, wherein the pharmaceutical composition comprises a heterologous nucleic acid construct comprising (a) a CRISPR-Cas system, where the CRISPR-Cas system is a Type I CRISPR-Cas system, where CRISPR -Cas type I system comprises (i) a heterologous nucleic acid construct encoding at least one type I cascade polypeptide, and (ii) a Cas3, Cas3' and Cas3'' polypeptide or a heterologous nucleic acid construct encoding a Cas3, Cas3' polypeptide and Cas3''; and (b) a type I CRISPR array containing (in the 5'-3' direction) a repeat-spacer-repeat sequence or at least one repeat-spacer sequence, where the spacer of said repeat-spacer-repeat sequence or of said at least one repeat-spacer sequence contains a nucleotide sequence that is essentially complementary to a target region in the genome of the bacterial cells of the specified population, where the target region is the genetic sequence of one or more bacterial cells, where the CRISPR array is a type I CRISPR array, where the pharmaceutical composition is introduced into the population of bacterial cells and, thus, one or more bacterial cells that contain the target region in the bacterial cell population is destroyed. 10. Фармацевтическая композиция по п.9, в которой последовательность повтор-спейсер-повтор или по меньшей мере одна последовательность повтор-спейсер содержит повтор, который является идентичным повтору из массива CRISPR типа I дикого типа.10. The pharmaceutical composition of claim 9, wherein the repeat-spacer-repeat sequence, or at least one repeat-spacer sequence, contains a repeat that is identical to a repeat from a wild type I CRISPR array. 11. Фармацевтическая композиция по п.9 или 10, в которой массив CRISPR представляет собой массив CRISPR типа I, a последовательность повтор-спейсер-повтор или по меньшей мере одна последо-11. A pharmaceutical composition according to claim 9 or 10, wherein the CRISPR array is a type I CRISPR array and the repeat-spacer-repeat sequence or at least one sequence - 52 042506 вательность повтор-спейсер содержит повтор, который идентичен повтору из массива CRISPR типа I дикого типа, и CRISPR-Cas система включает (i) конструкцию гетерологичной нуклеиновой кислоты, кодирующей по меньшей мере один каскадный полипептид типа I, и (ii) полипептид Cas3 или Cas3' и Cas3'' или конструкцию гетерологичной нуклеиновой кислоты, кодирующей Cas3 или Cas3' и Cas3'' полипептид.- 52 042506 The repeat-spacer value contains a repeat that is identical to a repeat from a wild-type CRISPR type I array, and the CRISPR-Cas system comprises (i) a heterologous nucleic acid construct encoding at least one type I cascade polypeptide, and (ii) a polypeptide Cas3 or Cas3' and Cas3'' or a heterologous nucleic acid construct encoding a Cas3 or Cas3' and Cas3'' polypeptide. 12. Способ отбора из популяции бактериальных клеток по меньшей мере одного изолята, который не содержит в своем геноме области-мишени, которая присутствует в геноме одной или нескольких бактериальных клеток в популяции, включающий введение в популяцию бактериальных клеток конструкции гетерологичной нуклеиновой кислоты, содержащей (a) CRISPR-Cas систему, где CRISPR-Cas система представляет собой CRISPR-Cas систему типа I, где CRISPR-Cas система типа I содержит (i) конструкцию гетерологичной нуклеиновой кислоты, кодирующей по меньшей мере один каскадный полипептид типа I, и (ii) полипептид Cas3, Cas3' и Cas3'' или конструкцию гетерологичной нуклеиновой кислоты, кодирующей полипептид Cas3, Cas3' и Cas3''; и (b) массив CRISPR типа I, содержащий (в 5'-3' направлении) последовательность повтор-спейсерповтор или по меньшей мере одну последовательность повтор-спейсер, где спейсер указанной последовательности повтор-спейсер-повтор или указанной по меньшей мере одной последовательности повторспейсер содержит нуклеотидную последовательность, которая по существу комплементарна областимишени в геноме одной или более бактериальных клеток в указанной популяции, тем самым отбирая из популяции бактериальных клеток по меньшей мере одного изолята без области-мишени в его геноме, где массив CRISPR представляет собой массив CRISPR типа I.12. A method for selecting at least one isolate from a population of bacterial cells that does not contain in its genome a target region that is present in the genome of one or more bacterial cells in the population, comprising introducing into the population of bacterial cells a heterologous nucleic acid construct containing (a ) a CRISPR-Cas system, wherein the CRISPR-Cas system is a type I CRISPR-Cas system, wherein the type I CRISPR-Cas system comprises (i) a heterologous nucleic acid construct encoding at least one type I cascade polypeptide, and (ii) a Cas3, Cas3' and Cas3'' polypeptide or a heterologous nucleic acid construct encoding a Cas3, Cas3' and Cas3'' polypeptide; and (b) a type I CRISPR array containing (in the 5'-3' direction) a repeat-spacer-repeat sequence or at least one repeat-spacer sequence, where the spacer of said repeat-spacer-repeat sequence or of said at least one repeat-spacer sequence contains a nucleotide sequence that is substantially complementary to a target region in the genome of one or more bacterial cells in said population, thereby selecting at least one isolate from the bacterial cell population without a target region in its genome, where the CRISPR array is a type I CRISPR array. 13. Способ по п.12, дополнительно включающий выращивание отдельных бактериальных колоний по меньшей мере одного изолята без области-мишени в его геноме.13. The method according to claim 12, further comprising growing individual bacterial colonies of at least one isolate without a target region in its genome. 14. Способ по п.12 или 13, в котором последовательность повтор-спейсер-повтор или по меньшей мере одна последовательность повтор-спейсер содержит повтор, который идентичен повтору из массива CRISPR типа I дикого типа.14. The method of claim 12 or 13, wherein the repeat-spacer-repeat sequence, or at least one repeat-spacer sequence, contains a repeat that is identical to a wild-type type I CRISPR array repeat. 15. Способ по любому из пп.12-14, в котором массив CRISPR представляет собой массив CRISPR типа I, а последовательность повтор-спейсер-повтор или по меньшей мере одна последовательность повтор-спейсер содержит повтор, который идентичен повтору из массива CRISPR типа I дикого типа, и CRISPR-Cas система содержит (i) конструкцию гетерологичной нуклеиновой кислоты, кодирующей по меньшей мере один каскадный полипептид типа I, и (ii) полипептид Cas3, Cas3' и Cas3'' или конструкцию гетерологичной нуклеиновой кислоты, кодирующей полипептид Cas3, Cas3' и Cas3''.15. The method according to any one of claims 12-14, wherein the CRISPR array is a type I CRISPR array and the repeat-spacer-repeat sequence or at least one repeat-spacer sequence contains a repeat that is identical to a repeat from the type I CRISPR array wild-type, and the CRISPR-Cas system comprises (i) a heterologous nucleic acid construct encoding at least one type I cascade polypeptide, and (ii) a Cas3, Cas3' and Cas3'' polypeptide or a heterologous nucleic acid construct encoding a Cas3 polypeptide, Cas3' and Cas3''. 16. Применение конструкции гетерологичной нуклеиновой кислоты, содержащей CRISPR-Cas систему в направленном сокращении патогенов в случае медицинского вмешательства у пациента, причем медицинское вмешательство включает уничтожение специфического подмножества бактерий в смешанной популяции бактериальных клеток на основе различающегося генетического содержания в подмножестве бактерий посредством введения в смешанную популяцию бактериальных клеток конструкции гетерологичной нуклеиновой кислоты, содержащей (a) CRISPR-Cas систему, где CRISPR-Cas система представляет собой CRISPR-Cas систему типа I, где CRISPR-Cas система типа I содержит (i) конструкцию гетерологичной нуклеиновой кислоты, кодирующей по меньшей мере один каскадный полипептид типа I, и (ii) полипептид Cas3, Cas3' и Cas3'' или конструкцию гетерологичной нуклеиновой кислоты, кодирующей полипептид Cas3, Cas3' и Cas3''; и (b) массив CRISPR типа I, содержащий (в 5'-3' направлении) последовательность повтор-спейсерповтор или по меньшей мере одну последовательность повтор-спейсер, где спейсер указанной последовательности повтор-спейсер-повтор или по меньшей мере одной последовательности повтор-спейсер содержит нуклеотидную последовательность, которая по существу комплементарна области-мишени в генетической последовательности специфического подмножества бактерий, причем область-мишень имеет по меньшей мере 10 последовательных нуклеотидов, примыкающих к протоспейсеру мотива (PAM), распознаваемых CRISPR-Cas системой, тем самым уничтожая специфическое подмножество бактерий, которая включает область-мишень.16. The use of a heterologous nucleic acid construct comprising a CRISPR-Cas system in the targeted reduction of pathogens in the event of a medical intervention in a patient, the medical intervention comprising killing a specific subset of bacteria in a mixed population of bacterial cells based on differing genetic content in a subset of bacteria by introducing into a mixed population bacterial cell constructs of a heterologous nucleic acid comprising (a) a CRISPR-Cas system, wherein the CRISPR-Cas system is a type I CRISPR-Cas system, wherein the type I CRISPR-Cas system comprises (i) a heterologous nucleic acid construct encoding at least one type I cascade polypeptide, and (ii) a Cas3, Cas3' and Cas3'' polypeptide or a heterologous nucleic acid construct encoding a Cas3, Cas3' and Cas3'' polypeptide; and (b) a type I CRISPR array containing (in the 5'-3' direction) a repeat-spacer-repeat sequence or at least one repeat-spacer sequence, where the spacer of said repeat-spacer-repeat sequence or at least one repeat-spacer sequence is the spacer contains a nucleotide sequence that is substantially complementary to a target region in the genetic sequence of a specific subset of bacteria, wherein the target region has at least 10 consecutive nucleotides adjacent to a motif protospacer (PAM) recognized by the CRISPR-Cas system, thereby eliminating the specific subset bacteria that includes the target area. 17. Применение по п.16, где по меньшей мере одна или несколько бактериальных клеток в популяции не содержат области-мишени и, следовательно, по меньшей мере одна бактериальная клетка не погибает при введении CRISPR-Cas системы.17. Use according to claim 16, wherein at least one or more bacterial cells in the population do not contain the target region and, therefore, at least one bacterial cell does not die when the CRISPR-Cas system is administered. 18. Применение по п.16 или 17, где спейсер указанной последовательности повтор-спейсер-повтор или последовательности повтор-спейсер содержит нуклеотидную последовательность, которая на 100% комплементарна области-мишени.18. Use according to claim 16 or 17, wherein the spacer of said repeat-spacer-repeat sequence or repeat-spacer sequence contains a nucleotide sequence that is 100% complementary to the target region. --
EA201792663 2015-05-29 2016-05-27 METHODS FOR SCREENING BACTERIA, ARCHAEA, ALGAE AND YEAST USING CRISPR NUCLEIC ACIDS EA042506B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US62/168,355 2015-05-29
US62/296,853 2016-02-18

Publications (1)

Publication Number Publication Date
EA042506B1 true EA042506B1 (en) 2023-02-21

Family

ID=

Similar Documents

Publication Publication Date Title
US20220228154A1 (en) Methods for Screening Bacteria, Archaea, Algae, and Yeast Using CRISPR Nucleic Acids
Glass Gene function: E. coli and its heritable elements
Ramos-González et al. Cloning, sequencing, and phenotypic characterization of the rpoS gene from Pseudomonas putida KT2440
Slade et al. Oxidative stress resistance in Deinococcus radiodurans
Cordova et al. Identification of the origin of replication of the Mycoplasma pulmonis chromosome and its use in oriC replicative plasmids
Hopwood et al. Genetics of bacterial diversity
Szuplewska et al. Mobility and generation of mosaic non-autonomous transposons by Tn 3-derived inverted-repeat miniature elements (TIMEs)
Steyert et al. Development of a novel genetic system to create markerless deletion mutants of Bdellovibrio bacteriovorus
Guerrero-Castro et al. Dissecting the acid stress response of Rhizobium tropici CIAT 899
Liebl et al. Plasmid-borne macrolide resistance in Micrococcus luteus
Sota et al. Region-specific insertion of transposons in combination with selection for high plasmid transferability and stability accounts for the structural similarity of IncP-1 plasmids
Dorrazehi et al. Building scarless gene libraries in the chromosome of bacteria
Klein et al. Bacterial group II introns and their association with mobile genetic elements
EA042506B1 (en) METHODS FOR SCREENING BACTERIA, ARCHAEA, ALGAE AND YEAST USING CRISPR NUCLEIC ACIDS
Azizoglu et al. Mutant construction and integration vector-mediated gene complementation in Listeria monocytogenes
Hakim et al. CRISPR–Cas system: a new paradigm for bacterial stress response through genome rearrangement
Parsons et al. Mutant Construction and Integration Vector-Mediated Genetic Complementation in Listeria monocytogenes
van der Meulen RNA regulation in Lactococcus lactis
Siddaramappa Histophilus somni genomics and genetics
Loconto et al. Identification of the Ω4406 regulatory region, a developmental promoter of Myxococcus xanthus, and a DNA segment responsible for chromosomal position-dependent inhibition of gene expression
Gibbons et al. Single Crossover to Inactivate Target Gene in Cyanobacteria
O'Beirne Life without an S-layer: the conditional genome of C. difficile
Chaudhari Microbial Genetics
Roggo et al. Genetic, genomic, and system analyses for pure cultures and communities: protocol–ultra-high-throughput transposon scanning of bacterial genomes
Bhoolia Investigating the prevalence, evolution and phenotypic characteristics associated with Geobacillus and Parageobacillus plasmids