RU2701662C9 - Crispr-cas system components, methods and compositions for sequence manipulation - Google Patents

Crispr-cas system components, methods and compositions for sequence manipulation Download PDF

Info

Publication number
RU2701662C9
RU2701662C9 RU2015128102A RU2015128102A RU2701662C9 RU 2701662 C9 RU2701662 C9 RU 2701662C9 RU 2015128102 A RU2015128102 A RU 2015128102A RU 2015128102 A RU2015128102 A RU 2015128102A RU 2701662 C9 RU2701662 C9 RU 2701662C9
Authority
RU
Russia
Prior art keywords
sequence
cas9
crispr
target
cells
Prior art date
Application number
RU2015128102A
Other languages
Russian (ru)
Other versions
RU2701662C2 (en
RU2015128102A (en
RU2015128102A3 (en
Inventor
Фэн ЧЖАН
Девид Оливье БИКАРД
Лэ ЦУН
Девид Бенджамин Туриц КОКС
Патрик ХСЮ
Вэньянь ЦЗЯН
Шауйлян ЛИНЬ
Лучано МАРРАФФИНИ
Рэндол Джеффри ПЛАТТ
Фэй ЖАНЬ
Невилл Эспи САНДЖАНА
Original Assignee
Те Брод Инститьют, Инк.
Массачусетс Инститьют Оф Текнолоджи
Президент Энд Феллоуз Оф Харвард Коллидж
Те Рокфеллер Юниверсити
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Те Брод Инститьют, Инк., Массачусетс Инститьют Оф Текнолоджи, Президент Энд Феллоуз Оф Харвард Коллидж, Те Рокфеллер Юниверсити filed Critical Те Брод Инститьют, Инк.
Priority claimed from PCT/US2013/074611 external-priority patent/WO2014093595A1/en
Publication of RU2015128102A publication Critical patent/RU2015128102A/en
Publication of RU2015128102A3 publication Critical patent/RU2015128102A3/ru
Application granted granted Critical
Publication of RU2701662C2 publication Critical patent/RU2701662C2/en
Publication of RU2701662C9 publication Critical patent/RU2701662C9/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Veterinary Medicine (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

FIELD: biotechnology.
SUBSTANCE: present invention refers to biotechnology. Disclosed are compositions and systems containing vectors comprising polynucleotide sequences coding components of CRISPR-Cas type II complex, as well as a kit containing one of such compositions or systems.
EFFECT: present invention enables the change of genomic loci of the eukaryotic cell by using Cas9 nuclease fused with one or more nuclear localization sequences (NLS).
25 cl, 74 dwg, 16 ex

Description

Родственные заявки и включение при помощи ссылкиRelated applications and inclusion by reference

Данная заявка заявляет приоритет предварительных заявок на патент США 61/736527, 61/748427, 61/768959, 61/791409 и 61/835931 с. общей ссылкой BI-2011/008/WSGR, номер в реестре 44063-701.101, BI-2011/008/WSGR, номер в реестре 44063-701.102, общей ссылкой BI-2011/008/VP, номер в реестре 44790.01.2003, BI-2011/008/VP, номер в реестре 44790.02.2003, и BI-2011/008/VP, номер в реестре 44790.03.2003, соответственно, все из которых озаглавлены "СИСТЕМЫ, СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ" (SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION), поданных 12 декабря 2012 г., 2 января 2013 г., 25 февраля 2013 г., 15 марта 2013 г. и 17 июня 2013 г., соответственно.This application claims the priority of provisional patent applications US 61/736527, 61/748427, 61/768959, 61/791409 and 61/835931 C. general reference BI-2011/008 / WSGR, registry number 44063-701.101, BI-2011/008 / WSGR, registry number 44063-701.102, general reference BI-2011/008 / VP, registry number 44790.01.2003, BI -2011 / 008 / VP, registry number 44790.02.2003, and BI-2011/008 / VP, registry number 44790.03.2003, respectively, all of which are entitled "SYSTEMS, METHODS AND COMPOSITIONS FOR MANIPULATION WITH SEQUENCES" (SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION) filed December 12, 2012, January 2, 2013, February 25, 2013, March 15, 2013, and June 17, 2013, respectively.

Делается ссылка на предварительные заявки на патент США 61/758468; 61/769046; 61/802174; 61/806375; 61/814263; 61/819803 и 61/828130, каждая из которых озаглавлена "КОНСТРУИРОВАНИЕ И ОПТИМИЗАЦИЯ СИСТЕМ, СПОСОБОВ И КОМПОЗИЦИЙ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ" (ENGINEERING AND OPTIMIZATION OF SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION), поданные 30 января 2013 г.; 25 февраля 2013 г.; 15 марта 2013 г.; 28 марта 2013 г.; 20 апреля 2013 г.; 6 мая 2013 г. и 28 мая 2013 г., соответственно. Также делается ссылка на предварительные заявки на патенты США 61/835936, 61/836127, 61/836101, 61/836080, 61/836123 и 61/835973, каждая из которых подана 17 июня 2013 г. Также делается ссылка на предварительную заявку на патент США 61/842322 и заявку на патент США 14/054414, каждая с общей ссылкой BI-2011/008A, озаглавленные "СИСТЕМЫ CRISPR-CAS И СПОСОБЫ ДЛЯ ИЗМЕНЕНИЯ ЭКСПРЕССИИ ПРОДУКТОВ ГЕНА" (CRISPR-CAS SYSTEMS AND METHODS FOR ALTERING EXPRESSION OF GENE PRODUCTS), поданные 2 июля 2013 г. и 15 октября 2013 г., соответственно.Reference is made to provisional patent applications US 61/758468; 61/769046; 61/802174; 61/806375; 61/814263; 61/819803 and 61/828130, each of which is entitled "DESIGN AND OPTIMIZATION OF SYSTEMS, METHODS AND COMPOSITIONS FOR MANIPULATING WITH SEQUENCES" (ENGINEERING AND OPTIMIZATION OF SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE, January 30, 2013; February 25, 2013; March 15, 2013; March 28, 2013; April 20, 2013; May 6, 2013 and May 28, 2013, respectively. Reference is also made to provisional patent applications US 61/835936, 61/836127, 61/836101, 61/836080, 61/836123 and 61/835973, each of which was filed June 17, 2013. Reference is also made to the provisional patent application. US 61/842322 and US patent application 14/054414, each with a common reference BI-2011 / 008A, entitled "CRISPR-CAS SYSTEMS AND METHODS FOR CHANGING GENE PRODUCTS EXPRESSION" (CRISPR-CAS SYSTEMS AND METHODS FOR ALTERING EXPRESSION OF GENE PRODUCTS ), filed July 2, 2013 and October 15, 2013, respectively.

Вышеупомянутые заявки и все документы, упомянутые в них или во время их делопроизводства ("упомянутые в заявке документы"), и все документы, упомянутые или на которые ссылаются в упомянутых в заявке документах, и все документы, упомянутые или на которые ссылаются в данном документе ("документы, упомянутые в данном документе"), и все документы, упомянутые или на которые ссылаются в документах, упомянутых в данном документе, наравне с любыми инструкциями производителя, описаниями, характеристиками продуктов и описаниями продуктов для любых продуктов, упомянутых в данном документе или в любом документе, включенном при помощи ссылки в данный документ, таким образом, включены в данный документ при помощи ссылки и могут быть использованы при осуществлении на практике настоящего изобретения. Более конкретно, все документы, на которые ссылаются, включены при помощи ссылки в такой же мере, как если бы конкретно и отдельно было указано, что каждый отдельный документ включен при помощи ссылки.The aforementioned applications and all documents mentioned in them or during their paperwork (“documents referred to in an application”), and all documents mentioned or referred to in documents mentioned in an application, and all documents mentioned or referred to in this document ("documents referred to in this document"), and all documents referred to or referenced in the documents referred to in this document, along with any manufacturer's instructions, descriptions, product specifications and product descriptions for any application ucts mentioned herein or in any document incorporated by reference herein, are hereby incorporated herein by reference and can be used in the practice of the present invention. More specifically, all referenced documents are incorporated by reference to the same extent as if it were specifically and separately indicated that each individual document is incorporated by reference.

Область техникиTechnical field

Настоящее изобретение в целом относится к системам, способам и композициям, применяемым для контроля экспрессии генов, включающего целенаправленное воздействие на последовательность, такое как внесение изменений в геном или редактирование гена, при котором можно использовать векторные системы, близкие к коротким палиндромным повторам, регулярно расположенным группами (CRISPR), и их компонентам.The present invention generally relates to systems, methods and compositions used to control gene expression, including targeted effects on the sequence, such as making changes to the genome or editing the gene, in which you can use vector systems that are close to short palindromic repeats, regularly arranged in groups (CRISPR), and their components.

Утверждение касательно финансируемого из федерального бюджета исследованияApproval of Federally Funded Study

Настоящее изобретение было разработано при правительственной поддержке согласно NIH Pioneer Award DP1MH100706, выданному национальными институтами здравоохранения. Правительство обладает определенными правами на настоящее изобретение.The present invention was developed with government support according to the NIH Pioneer Award DP1MH100706 issued by national health institutes. The government has certain rights to the present invention.

Предпосылки изобретенияBACKGROUND OF THE INVENTION

Недавние достижения в технологиях секвенирования генома и способах анализа значительно ускорили возможность каталогизирования и картирования генетических факторов, ассоциированных с широким спектром биологических функций и заболеваний. Точные технологии целенаправленного воздействия на геном необходимы для обеспечения систематичного обратного конструирования казуальных генетических изменений путем обеспечения возможности селективного внесения изменений в отдельные генетические элементы, а также для продвижения применений в области синтетической биологии, биотехнологии и медицины. Несмотря на то, что технологии редактирования генома, такие как конструктор доменов "цинковые пальцы", подобные транскрипционным активаторам эффекторы (TALE) или хоминг мегануклеазы, доступны для осуществления внесений изменений в целевой геном, все еще существует необходимость в новых технологиях конструирования генома, которые являются доступными, простыми в осуществлении, масштабируемыми и поддающимися целенаправленному воздействию на несколько положений в эукариотическом геноме.Recent advances in genome sequencing technologies and analysis methods have greatly accelerated the ability to catalog and map genetic factors associated with a wide range of biological functions and diseases. Accurate targeted genome targeting technologies are needed to ensure systematic reverse engineering of casual genetic changes by enabling selective changes to individual genetic elements, as well as promoting applications in synthetic biology, biotechnology and medicine. Although genome editing technologies such as zinc finger domain constructor, transcriptional activator-like effectors (TALEs), or homing meganucleases are available for making changes to the target genome, there is still a need for new genome constructing technologies that are affordable, easy to implement, scalable and targeted for targeting several positions in the eukaryotic genome.

Краткое описание изобретенияSUMMARY OF THE INVENTION

Существует острая необходимость в альтернативных и функциональных системах и технологиях для целенаправленного воздействия на последовательности с широким спектром применений. Настоящее изобретение удовлетворяет этой необходимости и предусматривает связанные с этим преимущества. CRISPR/Cas или система CRISPR-Cas (оба выражения используют взаимозаменяемо по всей данной заявке) не предусматривает получение индивидуализированных белков для целенаправленного воздействия на конкретные последовательности, но скорее один фермент Cas может быть запрограммирован короткой молекулой РНК для узнавания специфичной ДНК-мишени, другими словами, фермент Cas может связываться со специфичной ДНК-мишенью при помощи указанной короткой молекулы РНК. Добавление системы CRISPR-Cas к спектру технологий секвенирования генома и способам анализа может значительно упростить методику и ускорить возможность каталогизирования и картирования генетических факторов, ассоциированных с широким спектром биологических функций и заболеваний. Для того, чтобы эффективно использовать систему CRISPR-Cas для редактирования генома без вредного действия, важно понимать аспекты конструирования и оптимизации этих средств для конструирования генома, которые являются аспектами заявленного изобретения.There is an urgent need for alternative and functional systems and technologies for targeted sequencing with a wide range of applications. The present invention satisfies this need and provides related benefits. CRISPR / Cas or the CRISPR-Cas system (both expressions are used interchangeably throughout this application) does not provide for the production of individualized proteins to target specific sequences, but rather one Cas enzyme can be programmed with a short RNA molecule to recognize a specific target DNA, in other words The Cas enzyme can bind to a specific target DNA using the indicated short RNA molecule. Adding a CRISPR-Cas system to the spectrum of genome sequencing technologies and analysis methods can greatly simplify the technique and speed up the ability to catalog and map genetic factors associated with a wide range of biological functions and diseases. In order to effectively use the CRISPR-Cas system for editing the genome without harmful effects, it is important to understand the design and optimization aspects of these tools for constructing the genome, which are aspects of the claimed invention.

В одном аспекте настоящее изобретение предусматривает векторную систему, содержащую один или несколько векторов. В некоторых вариантах осуществления система содержит (a) первый регуляторный элемент, функционально связанный с парной tracr-последовательностью и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше парной tracr-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью; и (b) второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации; где компоненты (а) и (b) находятся в одном и том же или в различных векторах системы. В некоторых вариантах осуществления компонент (а) дополнительно содержит tracr-последовательность ниже парной tracr-последовательности под контролем первого регуляторного элемента. В некоторых вариантах осуществления компонент (а) дополнительно содержит две или более направляющие последовательности, функционально связанные с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления система содержит tracr-последовательность под контролем третьего регуляторного элемента, такого как промотор полимеразы III. В некоторых вариантах осуществления tracr-последовательность характеризуется по меньшей мере 50%, 60%, 70%, 80%, 90%, 95% или 99% комплементарности последовательности по длине парной tracr-последовательности при оптимальном выравнивании. Определение оптимального выравнивания находится в компетенции специалиста в данной области. Например, существуют публично и коммерчески доступные алгоритмы и программы выравнивания, такие как, без ограничения, ClustalW, Smith-Waterman в matlab, Bowtie, Geneious, Biopython и SeqMan. В некоторых вариантах осуществления комплекс CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного комплекса CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. Не желая быть связанными теорией, полагают, что последовательность ядерной локализации не является необходимой для активности комплекса CRISPR у эукариот, но что включение таких последовательностей повышает активность системы, особенно в отношении нацеливания на молекулы нуклеиновых кислот в ядре. В некоторых вариантах осуществления фермент CRISPR является ферментом системы CRISPR II типа. В некоторых вариантах осуществления фермент CRISPR является ферментом Cas9. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 S. pneumoniae, S. pyogenes или S. thermophilus и может включать мутированный Cas9, полученный из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности. В некоторых вариантах осуществления у фермента CRISPR отсутствует активность для расщепления нитей ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления направляющая последовательность составляет по меньшей мере 15, 16, 17, 18, 19, 20, 25 нуклеотидов, или от 10 до 30, или от 15 до 25, или от 15 до 20 нуклеотидов в длину. В целом и по всему данному описанию выражение "вектор" относится к молекуле нуклеиновой кислоты, способной переносить другую нуклеиновую кислоту, с которой она была связана. Векторы включают, без ограничения, молекулы нуклеиновых кислот, которые являются одноцепочечными, двухцепочечными или частично двухцепочечными; молекулы нуклеиновых кислот, которые содержат один или несколько свободных концов, не содержат свободных концов (к примеру, кольцевые); молекулы нуклеиновых кислот, которые содержат ДНК, РНК или и ту, и другую; и другие разновидности полинуклеотидов, известных в уровне техники. Одним типом вектора является "плазмида", которая означает кольцевую петлю двухцепочечной ДНК, в которую можно встраивать дополнительные сегменты ДНК, как, например, при помощи стандартных технологий молекулярного клонирования. Другим типом вектора является вирусный вектор, где полученные из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (к примеру, ретровирусы, ретровирусы с дефективной системой репликации, аденовирусы, аденовирусы с дефективной системой репликации и аденоассоциированные вирусы). Вирусные векторы также включают полинуклеотиды, переносимые вирусами для трансфекции клетки-хозяина. Определенные векторы способны к саморегулируемой репликации в клетке-хозяине, в которую они введены (к примеру, бактериальные векторы с бактериальной точкой начала репликации и эписомные векторы млекопитающих). Другие векторы (к примеру, неэписомные векторы млекопитающих) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются наряду с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы в данном документе называют "векторами экспрессии". Общепринятые пригодные в технологиях рекомбинантной ДНК векторы экспрессии часто находятся в форме плазмид.In one aspect, the present invention provides a vector system comprising one or more vectors. In some embodiments, the system comprises (a) a first regulatory element operably linked to a paired tracr sequence and one or more embedding sites to embed one or more guide sequences above the paired tracr sequence, where upon expression the guide sequence controls the sequence-specific binding of the complex CRISPR with the target sequence in a eukaryotic cell, where the CRISPR complex contains the CRISPR enzyme, forming a complex with (1) on ravlyaetsya sequence which hybridizes to the target sequence, and (2) tracr-pair sequence that hybridizes to tracr-sequence; and (b) a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising a nuclear localization sequence; where components (a) and (b) are in the same or in different vectors of the system. In some embodiments, component (a) further comprises a tracr sequence below the paired tracr sequence under the control of the first regulatory element. In some embodiments, component (a) further comprises two or more guide sequences operably linked to a first regulatory element, where upon expression each of two or more guide sequences controls sequence specific binding of the CRISPR complex to its target sequence in a eukaryotic cell. In some embodiments, the system comprises a tracr sequence under the control of a third regulatory element, such as a polymerase III promoter. In some embodiments, the implementation of the tracr sequence is characterized by at least 50%, 60%, 70%, 80%, 90%, 95%, or 99% of the complementarity of the sequence along the length of the paired tracr sequence with optimal alignment. Determining the optimal alignment is the responsibility of a person skilled in the art. For example, there are publicly and commercially available alignment algorithms and programs, such as, without limitation, ClustalW, Smith-Waterman in matlab, Bowtie, Geneious, Biopython, and SeqMan. In some embodiments, the CRISPR complex contains one or more nuclear localization sequences that are effective enough to control the accumulation of the CRISPR complex in a detectable amount in the nucleus of the eukaryotic cell. Not wishing to be bound by theory, it is believed that a nuclear localization sequence is not necessary for the activity of the CRISPR complex in eukaryotes, but that the inclusion of such sequences increases the activity of the system, especially with respect to targeting nucleic acid molecules in the nucleus. In some embodiments, the CRISPR enzyme is an enzyme of the type II CRISPR system. In some embodiments, the CRISPR enzyme is a Cas9 enzyme. In some embodiments, the Cas9 enzyme is Cas9 S. pneumoniae, S. pyogenes, or S. thermophilus, and may include mutated Cas9 derived from these organisms. The enzyme may be a Cas9 homolog or ortholog. In some embodiments, the CRISPR enzyme is codon-optimized for expression in a eukaryotic cell. In some embodiments, the CRISPR enzyme controls the cleavage of one or two strands at a specific point in the target sequence. In some embodiments, the CRISPR enzyme lacks DNA strand cleavage activity. In some embodiments, the first regulatory element is a polymerase III promoter. In some embodiments, the second regulatory element is a polymerase II promoter. In some embodiments, the implementation of the guide sequence is at least 15, 16, 17, 18, 19, 20, 25 nucleotides, or from 10 to 30, or from 15 to 25, or from 15 to 20 nucleotides in length. In general and throughout this specification, the expression "vector" refers to a nucleic acid molecule capable of transferring another nucleic acid to which it has been linked. Vectors include, without limitation, nucleic acid molecules that are single-stranded, double-stranded or partially double-stranded; nucleic acid molecules that contain one or more free ends do not contain free ends (for example, ring); nucleic acid molecules that contain DNA, RNA, or both; and other varieties of polynucleotides known in the art. One type of vector is a “plasmid", which means a double stranded DNA loop in which additional DNA segments can be inserted, such as using standard molecular cloning techniques. Another type of vector is a viral vector, where DNA or RNA sequences obtained from a virus are present in a vector for packaging into a virus (for example, retroviruses, retroviruses with a defective replication system, adenoviruses, adenoviruses with a defective replication system and adeno-associated viruses). Viral vectors also include polynucleotides carried by viruses to transfect the host cell. Certain vectors are capable of self-regulating replication in the host cell into which they are introduced (for example, bacterial vectors with a bacterial origin of replication and episomal mammalian vectors). Other vectors (for example, non-episomal mammalian vectors) are integrated into the genome of the host cell after being introduced into the host cell and are thus replicated along with the host genome. Moreover, certain vectors are able to control the expression of genes with which they are functionally linked. Such vectors are referred to herein as “expression vectors”. Conventional expression vector vectors suitable for recombinant DNA technologies are often in the form of plasmids.

Рекомбинантные векторы экспрессии могут содержать нуклеиновую кислоту согласно настоящему изобретению в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается использовать для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии выражение "функционально связанный" предназначено означать, что представляющая интерес нуклеотидная последовательность связана с регуляторным(и) элементом(ами) таким образом, при котором обеспечивается возможность экспрессии нуклеотидной последовательности (к примеру, в in vitro системе транскрипции/трансляции или в клетке-хозяине, когда вектор вводят в клетку-хозяина).Recombinant expression vectors may contain the nucleic acid according to the present invention in a form suitable for expression of the nucleic acid in the host cell, which means that the recombinant expression vectors include one or more regulatory elements that can be selected taking into account the host cells to be used for expression that are operably linked to the nucleic acid sequence that is expected to be expressed. In the context of a recombinant expression vector, the expression “operably linked” is intended to mean that the nucleotide sequence of interest is linked to the regulatory element (s) in such a way as to allow expression of the nucleotide sequence (for example, in an in vitro transcription / translation system or in the host cell when the vector is introduced into the host cell).

Выражение "регуляторный элемент" предназначено включать промоторы, энхансеры, внутренние сайты связывания рибосомы (IRES) и другие контролирующие экспрессию элементы (к примеру, сигналы терминации транскрипции, такие как сигналы полиаденилирования и поли-U-последовательности). Такие регуляторные элементы описаны, например, в Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Регуляторные элементы включают такие, которые управляют конститутивной экспрессией нуклеотидной последовательности во многих типах клеток-хозяев, и такие, которые управляют экспрессией нуклеотидной последовательности только в определенных клетках-хозяевах (к примеру, тканеспецифичные регуляторные последовательности). Тканеспецифичный промотор может управлять экспрессией преимущественно в представляющей интерес целевой ткани, такой как мышца, нейрон, кость, кожа, кровь, конкретных органах (к примеру, печени, поджелудочной железе) или определенных типах клеток (к примеру, лимфоцитах). Регуляторные элементы также могут управлять экспрессией зависимым от времени образом, как, например, зависимым от клеточного цикла или зависимым от стадии развития образом, который может быть или может не быть также тканеспецифичным или специфичным к типу клеток. В некоторых вариантах осуществления вектор содержит один или несколько промоторов pol III (к примеру, 1, 2, 3, 4, 5 или более промоторов pol III), один или несколько промоторов pol II (к примеру, 1, 2, 3, 4, 5 или более промоторов pol II), один или несколько промоторов pol I (к примеру, 1, 2, 3, 4, 5 или более промоторов pol I) или их комбинации. Примеры промоторов pol III включают, без ограничения, промоторы U6 и H1. Примеры промоторов pol II включают, без ограничения, ретровирусный промотор LTR вируса саркомы Рауса (RSV) (необязательно с энхансером RSV), промотор цитомегаловируса (CMV) (необязательно с энхансером CMV) [см., например, Boshart et al, Cell, 41: 521-530 (1985)], промотор SV40, промотор дигидрофолатредуктазы, промотор β-актина, промотор глицерофосфаткиназы (PGK) и промотор EF1α. Также выражением "регуляторный элемент" охвачены энхансерные элементы, такие как WPRE; энхансеры CMV; сегмент R-U5' в LTR HTLV-I (Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988); энхансер SV40; и интронная последовательность между экзонами 2 и 3 β-глобина кролика (Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981). Специалистам в данной области будет понятно, что структура вектора экспрессии может зависеть от таких факторов, как выбор клетки хозяина, подлежащей трансформации, желательный уровень экспрессии и т.п. Вектор можно вводить в клетки-хозяева с получением, таким образом, транскриптов, белков или пептидов, в том числе слитых белков или пептидов, кодируемых нуклеиновыми кислотами, которые описаны в данном документе (к примеру, транскриптов коротких палиндромных повторов, регулярно расположенных группами (CRISPR), белков, ферментов, их мутантных форм, их слитых белков и т.п.).The expression "regulatory element" is intended to include promoters, enhancers, internal ribosome binding sites (IRES), and other expression control elements (e.g., transcription termination signals, such as polyadenylation signals and poly-U sequences). Such regulatory elements are described, for example, in Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Regulatory elements include those that control the constitutive expression of the nucleotide sequence in many types of host cells, and those that control the expression of the nucleotide sequence only in certain host cells (for example, tissue-specific regulatory sequences). A tissue-specific promoter can drive expression primarily in the target tissue of interest, such as muscle, neuron, bone, skin, blood, specific organs (e.g., liver, pancreas), or certain types of cells (e.g., lymphocytes). Regulatory elements can also control expression in a time-dependent manner, such as, for example, a cell cycle-dependent or stage-dependent manner, which may or may not also be tissue specific or cell type specific. In some embodiments, the implementation of the vector contains one or more pol III promoters (for example, 1, 2, 3, 4, 5 or more pol III promoters), one or more pol II promoters (for example, 1, 2, 3, 4, 5 or more pol II promoters), one or more pol I promoters (for example, 1, 2, 3, 4, 5 or more pol I promoters), or combinations thereof. Examples of pol III promoters include, but are not limited to, U6 and H1 promoters. Examples of pol II promoters include, but are not limited to, the Rouse sarcoma virus (RSV) retroviral LTR promoter (optional with an RSV enhancer), the cytomegalovirus promoter (CMV) (optional with a CMV enhancer) [see, for example, Boshart et al, Cell, 41: 521-530 (1985)], SV40 promoter, dihydrofolate reductase promoter, β-actin promoter, glycerophosphate kinase (PGK) promoter, and EF1α promoter. Also, the expression "regulatory element" encompasses enhancer elements such as WPRE; CMV enhancers; R-U5 'segment in LTR HTLV-I (Mol. Cell. Biol., Vol. 8 (1), p. 466-472, 1988); enhancer SV40; and the intron sequence between exons 2 and 3 of rabbit β-globin (Proc. Natl. Acad. Sci. USA., Vol. 78 (3), p. 1527-31, 1981). Those skilled in the art will understand that the structure of the expression vector may depend on factors such as the choice of host cell to be transformed, the desired level of expression, and the like. The vector can be introduced into host cells, thereby obtaining transcripts, proteins or peptides, including fusion proteins or peptides encoded by nucleic acids, as described herein (for example, transcripts of short palindromic repeats arranged regularly in groups (CRISPR ), proteins, enzymes, their mutant forms, their fusion proteins, etc.).

Преимущественные векторы включают лентивирусы и аденоассоциированные вирусы, и типы таких векторов также могут быть выбраны для целенаправленного воздействия на определенные типы клеток.Preferred vectors include lentiviruses and adeno-associated viruses, and types of such vectors can also be selected to target specific types of cells.

В одном аспекте настоящее изобретение предусматривает вектор, содержащий регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей фермент CRISPR, содержащий одну или несколько последовательностей ядерной локализации. В некоторых вариантах осуществления указанный регуляторный элемент управляет транскрипцией фермента CRISPR в эукариотической клетке, так что указанный фермент CRISPR накапливается в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления фермент CRISPR является ферментом системы CRISPR II типа. В некоторых вариантах осуществления фермент CRISPR является ферментом Cas9. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 S. pneumoniae, S. pyogenes или S. thermophilus и может включать мутированный Cas9, полученный из этих организмов. В некоторых вариантах осуществления фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности. В некоторых вариантах осуществления у фермента CRISPR отсутствует активность для расщепления нитей ДНК.In one aspect, the present invention provides a vector comprising a regulatory element operably linked to an enzyme coding sequence encoding a CRISPR enzyme containing one or more nuclear localization sequences. In some embodiments, said regulatory element controls the transcription of the CRISPR enzyme in a eukaryotic cell, such that the CRISPR enzyme accumulates in a detectable amount in the nucleus of the eukaryotic cell. In some embodiments, the regulatory element is a polymerase II promoter. In some embodiments, the CRISPR enzyme is an enzyme of the type II CRISPR system. In some embodiments, the CRISPR enzyme is a Cas9 enzyme. In some embodiments, the Cas9 enzyme is Cas9 S. pneumoniae, S. pyogenes, or S. thermophilus, and may include mutated Cas9 derived from these organisms. In some embodiments, the CRISPR enzyme is codon-optimized for expression in a eukaryotic cell. In some embodiments, the CRISPR enzyme controls the cleavage of one or two strands at a specific point in the target sequence. In some embodiments, the CRISPR enzyme lacks DNA strand cleavage activity.

В одном аспекте настоящее изобретение предусматривает фермент CRISPR, содержащий одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент CRISPR является ферментом системы CRISPR II типа. В некоторых вариантах осуществления фермент CRISPR является ферментом Cas9. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 S. pneumoniae, S. pyogenes или S. thermophilus и может включать мутированный Cas9, полученный из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления у фермента CRISPR отсутствует способность расщеплять одну или несколько нитей целевой последовательности, с которой он связывается.In one aspect, the present invention provides a CRISPR enzyme comprising one or more nuclear localization sequences effective enough to control the accumulation of said CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell. In some embodiments, the CRISPR enzyme is an enzyme of the type II CRISPR system. In some embodiments, the CRISPR enzyme is a Cas9 enzyme. In some embodiments, the Cas9 enzyme is Cas9 S. pneumoniae, S. pyogenes, or S. thermophilus, and may include mutated Cas9 derived from these organisms. The enzyme may be a Cas9 homolog or ortholog. In some embodiments, the CRISPR enzyme lacks the ability to cleave one or more strands of the target sequence to which it binds.

В одном аспекте настоящее изобретение предусматривает эукариотическую клетку-хозяина, содержащую (а) первый регуляторный элемент, функционально связанный с парной tracr-последовательностью и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше парной tracr-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью; и/или (b) второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации. В некоторых вариантах осуществления клетка-хозяин содержит компоненты (а) и (b). В некоторых вариантах осуществления компонент (а), компонент (b) или компоненты (а) и (b) стабильно интегрируются в геном эукариотической клетки-хозяина. В некоторых вариантах осуществления компонент (а) дополнительно содержит tracr-последовательность ниже парной tracr-последовательности под контролем первого регуляторного элемента. В некоторых вариантах осуществления компонент (а) дополнительно содержит две или более направляющие последовательности, функционально связанные с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления эукариотическая клетка-хозяин дополнительно содержит третий регуляторный элемент, такой как промотор полимеразы III, функционально связанный с указанной tracr-последовательностью. В некоторых вариантах осуществления tracr-последовательность характеризуется по меньшей мере 50%, 60%, 70%, 80%, 90%, 95% или 99% комплементарности последовательности по длине парной tracr-последовательности при оптимальном выравнивании. В некоторых вариантах осуществления фермент CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент CRISPR является ферментом системы CRISPR II типа. В некоторых вариантах осуществления фермент CRISPR является ферментом Cas9. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 S. pneumoniae, S. pyogenes или S. thermophilus и может включать мутированный Cas9, полученный из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности. В некоторых вариантах осуществления у фермента CRISPR отсутствует активность для расщепления нитей ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления направляющая последовательность составляет по меньшей мере 15, 16, 17, 18, 19, 20, 25 нуклеотидов, или от 10 до 30, или от 15 до 25, или от 15 до 20 нуклеотидов в длину. В одном аспекте настоящее изобретение предусматривает отличный от человека эукариотический организм, предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина согласно любому из описанных вариантов осуществления. В других аспектах настоящее изобретение предусматривает эукариотический организм, предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина согласно любому из описанных вариантов осуществления. Организм в некоторых вариантах осуществления данных аспектов может быть животным, например, млекопитающим. Также организмом может быть членистоногое, как, например, насекомое. Организмом также может быть растение. Кроме того, организмом может быть гриб.In one aspect, the present invention provides a eukaryotic host cell comprising (a) a first regulatory element operably linked to a paired tracr sequence and one or more insertion sites for embedding one or more guide sequences above the paired tracr sequence, where, upon expression, the guide sequence controls the sequence-specific binding of the CRISPR complex to the target sequence in a eukaryotic cell, where the CRISPR complex is holds the CRISPR enzyme, complexing with (1) a guide sequence that hybridizes to the target sequence, and (2) a paired tracr sequence that hybridizes to the tracr sequence; and / or (b) a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising a nuclear localization sequence. In some embodiments, the host cell contains components (a) and (b). In some embodiments, component (a), component (b), or components (a) and (b) are stably integrated into the genome of a eukaryotic host cell. In some embodiments, component (a) further comprises a tracr sequence below the paired tracr sequence under the control of the first regulatory element. In some embodiments, component (a) further comprises two or more guide sequences operably linked to a first regulatory element, where upon expression each of two or more guide sequences controls sequence specific binding of the CRISPR complex to its target sequence in a eukaryotic cell. In some embodiments, the eukaryotic host cell further comprises a third regulatory element, such as a polymerase III promoter, operably linked to said tracr sequence. In some embodiments, the implementation of the tracr sequence is characterized by at least 50%, 60%, 70%, 80%, 90%, 95%, or 99% of the complementarity of the sequence along the length of the paired tracr sequence with optimal alignment. In some embodiments, the CRISPR enzyme contains one or more nuclear localization sequences that are effective enough to control the accumulation of said CRISPR enzyme in a detectable amount in the nucleus of the eukaryotic cell. In some embodiments, the CRISPR enzyme is an enzyme of the type II CRISPR system. In some embodiments, the CRISPR enzyme is a Cas9 enzyme. In some embodiments, the Cas9 enzyme is Cas9 S. pneumoniae, S. pyogenes, or S. thermophilus, and may include mutated Cas9 derived from these organisms. The enzyme may be a Cas9 homolog or ortholog. In some embodiments, the CRISPR enzyme is codon-optimized for expression in a eukaryotic cell. In some embodiments, the CRISPR enzyme controls the cleavage of one or two strands at a specific point in the target sequence. In some embodiments, the CRISPR enzyme lacks DNA strand cleavage activity. In some embodiments, the first regulatory element is a polymerase III promoter. In some embodiments, the second regulatory element is a polymerase II promoter. In some embodiments, the implementation of the guide sequence is at least 15, 16, 17, 18, 19, 20, 25 nucleotides, or from 10 to 30, or from 15 to 25, or from 15 to 20 nucleotides in length. In one aspect, the present invention provides a non-human eukaryotic organism, preferably a multicellular eukaryotic organism, comprising a eukaryotic host cell according to any of the described embodiments. In other aspects, the present invention provides a eukaryotic organism, preferably a multicellular eukaryotic organism, comprising a eukaryotic host cell according to any of the described embodiments. The organism in some embodiments of these aspects may be an animal, for example, a mammal. Also, the body can be an arthropod, such as an insect. The organism may also be a plant. In addition, the body may be a mushroom.

В одном аспекте настоящее изобретение предусматривает набор, содержащий один или несколько компонентов, описанных в данном документе. В некоторых вариантах осуществления набор содержит векторную систему и инструкции по применению набора. В некоторых вариантах осуществления векторная система содержит (а) первый регуляторный элемент, функционально связанный с парной tracr-последовательностью и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше парной tracr-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью; и/или (b) второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации. В некоторых вариантах осуществления набор содержит компоненты (а) и (b), находящиеся в одном и том же или в различных векторах системы. В некоторых вариантах осуществления компонент (а) дополнительно содержит tracr-последовательность ниже парной tracr-последовательности под контролем первого регуляторного элемента. В некоторых вариантах осуществления компонент (а) дополнительно содержит две или более направляющие последовательности, функционально связанные с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления система дополнительно содержит третий регуляторный элемент, такой как промотор полимеразы III, функционально связанный с указанной tracr-последовательностью. В некоторых вариантах осуществления tracr-последовательность характеризуется по меньшей мере 50%, 60%, 70%, 80%, 90%, 95% или 99% комплементарности последовательности по длине парной tracr-последовательности при оптимальном выравнивании. В некоторых вариантах осуществления фермент CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент CRISPR является ферментом системы CRISPR II типа. В некоторых вариантах осуществления фермент CRISPR является ферментом Cas9. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 S. pneumoniae, S. pyogenes или S. thermophilus и может включать мутированный Cas9, полученный из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности. В некоторых вариантах осуществления у фермента CRISPR отсутствует активность для расщепления нитей ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления направляющая последовательность составляет по меньшей мере 15, 16, 17, 18, 19, 20, 25 нуклеотидов, или от 10 до 30, или от 15 до 25, или от 15 до 20 нуклеотидов в длину.In one aspect, the present invention provides a kit comprising one or more of the components described herein. In some embodiments, the kit comprises a vector system and instructions for using the kit. In some embodiments, the vector system comprises (a) a first regulatory element operably linked to a paired tracr sequence and one or more embedding sites to embed one or more guide sequences above the paired tracr sequence, where when expressed, the guide sequence controls the sequence-specific binding a CRISPR complex with a target sequence in a eukaryotic cell, where the CRISPR complex contains a CRISPR enzyme that forms a comp CEN (1) a guide sequence which hybridizes to the target sequence, and (2) tracr-pair sequence that hybridizes to tracr-sequence; and / or (b) a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising a nuclear localization sequence. In some embodiments, the implementation of the kit contains components (a) and (b) located in the same or in different vectors of the system. In some embodiments, component (a) further comprises a tracr sequence below the paired tracr sequence under the control of the first regulatory element. In some embodiments, component (a) further comprises two or more guide sequences operably linked to a first regulatory element, where upon expression each of two or more guide sequences controls sequence specific binding of the CRISPR complex to its target sequence in a eukaryotic cell. In some embodiments, the system further comprises a third regulatory element, such as a polymerase III promoter, operably linked to said tracr sequence. In some embodiments, the implementation of the tracr sequence is characterized by at least 50%, 60%, 70%, 80%, 90%, 95%, or 99% of the complementarity of the sequence along the length of the paired tracr sequence with optimal alignment. In some embodiments, the CRISPR enzyme contains one or more nuclear localization sequences that are effective enough to control the accumulation of said CRISPR enzyme in a detectable amount in the nucleus of the eukaryotic cell. In some embodiments, the CRISPR enzyme is an enzyme of the type II CRISPR system. In some embodiments, the CRISPR enzyme is a Cas9 enzyme. In some embodiments, the Cas9 enzyme is Cas9 S. pneumoniae, S. pyogenes, or S. thermophilus, and may include mutated Cas9 derived from these organisms. The enzyme may be a Cas9 homolog or ortholog. In some embodiments, the CRISPR enzyme is codon-optimized for expression in a eukaryotic cell. In some embodiments, the CRISPR enzyme controls the cleavage of one or two strands at a specific point in the target sequence. In some embodiments, the CRISPR enzyme lacks DNA strand cleavage activity. In some embodiments, the first regulatory element is a polymerase III promoter. In some embodiments, the second regulatory element is a polymerase II promoter. In some embodiments, the implementation of the guide sequence is at least 15, 16, 17, 18, 19, 20, 25 nucleotides, or from 10 to 30, or from 15 to 25, or from 15 to 20 nucleotides in length.

В одном аспекте настоящее изобретение предусматривает способ модификации целевого полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида с модификацией, таким образом, целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. В некоторых вариантах осуществления указанное расщепление включает расщепление одной или двух нитей в определенной точке целевой последовательности указанным ферментом CRISPR. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида при помощи гомологичной рекомбинации с экзогенным матричным полинуклеотидом, где указанная репарация приводит к мутации, включающей вставку, делецию или замену одного или нескольких нуклеотидов указанного целевого полинуклеотида. В некоторых вариантах осуществления указанная мутация приводит к одной или нескольким аминокислотным заменам в белке, экспрессируемом с гена, содержащего целевую последовательность. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанную эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности. В некоторых вариантах осуществления указанные векторы доставляют в эукариотическую клетку в субъекте. В некоторых вариантах осуществления указанная модификация имеет место в указанной эукариотической клетке в клеточной культуре. В некоторых вариантах осуществления способ дополнительно включает выделение указанной эукариотической клетки из субъекта перед указанной модификацией. В некоторых вариантах осуществления способ дополнительно включает возвращение указанной эукариотической клетки и/или клеток, полученных из субъекта, указанному субъекту.In one aspect, the present invention provides a method for modifying a target polynucleotide in a eukaryotic cell. In some embodiments, the method includes providing binding of the CRISPR complex to a target polynucleotide to cleave said target polynucleotide, thereby modifying the target polynucleotide, wherein the CRISPR complex contains a CRISPR enzyme that is complexed with a guide sequence that hybridizes to the target sequence in the specified target polynucleotide, where the specified guide sequence is associated with a paired tracr sequence, which, in turn, iziruetsya with tracr-sequence. In some embodiments, said cleavage comprises cleaving one or two strands at a specific point in the target sequence with said CRISPR enzyme. In some embodiments, said cleavage results in reduced transcription of the target gene. In some embodiments, the method further comprises repairing said cleaved target polynucleotide by homologous recombination with an exogenous template polynucleotide, wherein said repair leads to a mutation comprising the insertion, deletion or replacement of one or more nucleotides of said target polynucleotide. In some embodiments, said mutation results in one or more amino acid substitutions in a protein expressed from a gene containing the target sequence. In some embodiments, the method further comprises delivering one or more vectors to said eukaryotic cell, wherein one or more vectors control the expression of one or more of: a CRISPR enzyme, a guide sequence linked to a paired tracr sequence, and a tracr sequence. In some embodiments, the vectors are delivered to a eukaryotic cell in a subject. In some embodiments, said modification takes place in said eukaryotic cell in cell culture. In some embodiments, the method further comprises isolating said eukaryotic cell from a subject prior to said modification. In some embodiments, the method further comprises returning said eukaryotic cell and / or cells derived from a subject to said subject.

В одном аспекте настоящее изобретение предусматривает способ модификации экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с полинуклеотидом так, что указанное связывание приводит к повышенной или пониженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанные эукариотические клетки, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности.In one aspect, the present invention provides a method for modifying expression of a polynucleotide in a eukaryotic cell. In some embodiments, the method comprises providing binding of the CRISPR complex to a polynucleotide such that said binding results in increased or decreased expression of said polynucleotide; where the CRISPR complex contains the CRISPR enzyme, which forms a complex with a guide sequence that hybridizes with the target sequence in the specified target polynucleotide, where the specified guide sequence is associated with a paired tracr sequence, which, in turn, hybridizes with the tracr sequence. In some embodiments, the method further comprises delivering one or more vectors to said eukaryotic cells, wherein one or more vectors control the expression of one or more of: a CRISPR enzyme, a guide sequence linked to a paired tracr sequence, and a tracr sequence.

В одном аспекте настоящее изобретение предусматривает способ получения модельной эукариотической клетки, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (а) введение одного или нескольких векторов в эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности; и (b) обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в указанном гене, ответственном за развитие заболевания, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью в целевом полинуклеотиде, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью, таким образом, получая модельную эукариотическую клетку, содержащую мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления указанное расщепление включает расщепление одной или двух нитей в определенной точке целевой последовательности, указанным ферментом CRISPR. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида при помощи гомологичной рекомбинации с экзогенным матричным полинуклеотидом, где указанная репарация приводит к мутации, включающей вставку, делецию или замену одного или нескольких нуклеотидов указанного целевого полинуклеотида. В некоторых вариантах осуществления указанная мутация приводит к одной или нескольким аминокислотным заменам при экспрессии белка с гена, содержащего целевую последовательность.In one aspect, the present invention provides a method for producing a model eukaryotic cell containing a mutated gene responsible for the development of a disease. In some embodiments, the gene responsible for the development of the disease is any gene associated with an increased risk of the presence or development of the disease. In some embodiments, the method comprises (a) introducing one or more vectors into a eukaryotic cell, wherein one or more vectors control the expression of one or more of: a CRISPR enzyme, a guide sequence linked to a paired tracr sequence, and a tracr sequence; and (b) providing binding of the CRISPR complex to the target polynucleotide to effect cleavage of the target polynucleotide in the specified gene responsible for the development of the disease, where the CRISPR complex contains the CRISPR enzyme, complexing with (1) a guide sequence that hybridizes with the target sequence in the target polynucleotide, and (2) a paired tracr sequence that hybridizes to the tracr sequence, thereby obtaining a model eukaryotic cell containing the mutated gene, the response for the development of venous disease. In some embodiments, the implementation of the cleavage includes the cleavage of one or two strands at a certain point in the target sequence indicated by the CRISPR enzyme. In some embodiments, said cleavage results in reduced transcription of the target gene. In some embodiments, the method further comprises repairing said cleaved target polynucleotide by homologous recombination with an exogenous template polynucleotide, wherein said repair leads to a mutation comprising the insertion, deletion or replacement of one or more nucleotides of said target polynucleotide. In some embodiments, said mutation results in one or more amino acid substitutions when expressing a protein from a gene containing a target sequence.

В одном аспекте настоящее изобретение предусматривает способ получения биологически активного средства, которое модулирует процесс передачи сигнала в клетке, ассоциированный с геном, ответственным за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (а) приведение тестового соединения в контакт с модельной клеткой по любому одному из описанных вариантов осуществления и (b) обнаружение изменения при считывании, которое свидетельствует об уменьшении или усилении процесса передачи сигнала в клетке, ассоциированного с указанной мутацией в указанном гене, ответственном за развитие заболевания, с получением, таким образом, указанного биологически активного средства, которое модулирует указанный процесс передачи сигнала в клетке, ассоциированный с указанным геном, ответственным за развитие заболевания.In one aspect, the present invention provides a method for producing a biologically active agent that modulates a cell signaling process associated with a gene responsible for the development of a disease. In some embodiments, the gene responsible for the development of the disease is any gene associated with an increased risk of the presence or development of the disease. In some embodiments, the method comprises (a) bringing the test compound into contact with a model cell according to any one of the described embodiments, and (b) detecting a reading change that indicates a decrease or increase in the signaling process in the cell associated with the mutation in the specified gene responsible for the development of the disease, thereby obtaining the specified biologically active agent that modulates the specified process of signal transmission in the cell, asso iirovanny with this gene, responsible for the development of the disease.

В одном аспекте настоящее изобретение предусматривает рекомбинантный полинуклеотид, содержащий направляющую последовательность выше парной tracr-последовательности, где направляющая последовательность при экспрессии управляет специфичным к последовательности связыванием комплекса CRISPR с соответствующей целевой последовательностью, присутствующей в эукариотической клетке. В некоторых вариантах осуществления целевая последовательность является вирусной последовательностью, присутствующей в эукариотической клетке. В некоторых вариантах осуществления целевая последовательность является протоонкогеном или онкогеном.In one aspect, the present invention provides a recombinant polynucleotide containing a guide sequence above a paired tracr sequence, where the guide sequence upon expression controls sequence specific binding of the CRISPR complex to the corresponding target sequence present in the eukaryotic cell. In some embodiments, the target sequence is a viral sequence present in a eukaryotic cell. In some embodiments, the target sequence is a proto-oncogen or oncogene.

В одном аспекте настоящее изобретение предусматривает способ отбора одной или нескольких прокариотических клеток путем введения одной или нескольких мутаций в ген в одной или нескольких прокариотических клетках, при этом способ включает введение одного или нескольких векторов в прокариотическую(ие) клетку(и), где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, tracr-последовательности и матрицы редактирования; где матрица редактирования содержит одну или несколько мутаций, которые прекращают расщепление фермента CRISPR; обеспечение гомологичной рекомбинации матрицы редактирования с целевым полинуклеотидом в отбираемой(ых) клетке(ах); обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в указанном гене, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью в целевом полинуклеотиде, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью, где связывание комплекса CRISPR с целевым полинуклеотидом индуцирует гибель клеток, с обеспечением тем самым отбора одной или нескольких прокариотических клеток, в которые были введены одна или несколько мутаций. В предпочтительном варианте осуществления фермент CRISPR представляет собой Cas9. В другом аспекте настоящего изобретения отбираемая клетка может быть эукариотической клеткой. Аспекты настоящего изобретения обеспечивают возможность отбора конкретных клеток без необходимости наличия маркера отбора или двухстадийного способа, который может включать систему негативного отбора.In one aspect, the present invention provides a method for selecting one or more prokaryotic cells by introducing one or more mutations into a gene in one or more prokaryotic cells, the method comprising introducing one or more vectors into prokaryotic cell (s), (s) where one or several vectors control the expression of one or more of: the CRISPR enzyme, a guide sequence associated with a paired tracr sequence, a tracr sequence, and an editing matrix; where the editing matrix contains one or more mutations that stop the cleavage of the CRISPR enzyme; ensuring homologous recombination of the editing matrix with the target polynucleotide in the selected cell (s); providing binding of the CRISPR complex to the target polynucleotide to carry out the cleavage of the target polynucleotide in the specified gene, where the CRISPR complex contains the CRISPR enzyme, which forms a complex with (1) a guide sequence that hybridizes with the target sequence in the target polynucleotide, and (2) a paired tracr sequence, which hybridizes with the tracr sequence, where the binding of the CRISPR complex to the target polynucleotide induces cell death, thereby ensuring the selection of one or more okaryotic cells into which one or more mutations have been introduced. In a preferred embodiment, the CRISPR enzyme is Cas9. In another aspect of the present invention, the selected cell may be a eukaryotic cell. Aspects of the present invention provide the ability to select specific cells without the need for a selection marker or a two-step method, which may include a negative selection system.

Соответственно, целью настоящего изобретения не является охват в пределах настоящего изобретения любого ранее известного продукта, способа получения продукта или способа применения продукта, так что заявители оставляют за собой право и настоящим раскрывают отказ от прав на любой ранее известный продукт, процесс или способ. Следует дополнительно отметить, что настоящее изобретение не предназначено охватывать в пределах объема настоящего изобретения любой продукт, способ получения продукта или способ применения продукта, который не соответствует письменному описанию и требованиям достаточного раскрытия сути изобретения USPTO (первый пункт § 112 статьи 35 USC) или EPO (статья 83 EPC), так что заявители оставляют за собой право и настоящим раскрывают отказ от прав на любой ранее описанный продукт, способ получения продукта или способ применения продукта.Accordingly, it is not an object of the present invention to encompass within the scope of the present invention any previously known product, a method for producing a product, or a method for using the product, so that applicants reserve the right and hereby disclose a waiver of any previously known product, process or method. It should be further noted that the present invention is not intended to cover, within the scope of the present invention, any product, method of producing a product, or method of using a product that does not meet the written description and the requirements of sufficient disclosure of the USPTO invention (first paragraph of § 112 of Article 35 of the USC) or EPO ( Article 83 of the EPC), so that the applicants reserve the right and hereby disclose the waiver of rights to any previously described product, method of obtaining the product or method of using the product.

Следует отметить, что в данном раскрытии и особенно в формуле изобретения и/или параграфах такие выражения, как "содержит", "содержащийся", "содержащий" и т.п., могут иметь значение, приписываемое им в патентном законодательстве США, например, они могут означать "включает", "включенный", "включающий" и т.п., и что такие выражения, как "состоящий, по сути, из" и "состоит, по сути, из" имеют значение, приписываемое им в патентном законодательстве США, например, они допускают не указанные прямо элементы, но исключают элементы, которые имеются в известном уровне техники или которые влияют на основные или новые характеристики настоящего изобретения. Эти и другие варианты осуществления раскрыты или являются очевидными, исходя из следующего подробного описания, и охвачены им.It should be noted that in this disclosure and especially in the claims and / or paragraphs, expressions such as “contains”, “contained”, “comprising”, etc., may have the meaning ascribed to them in US patent law, for example, they can mean “includes,” “included,” “including,” and the like, and that expressions such as “consisting essentially of” and “consists essentially of” have the meanings ascribed to them in the patent US law, for example, they allow elements not explicitly stated, but exclude elements that are known smoother art or that affect the basic and novel characteristics of the present invention. These and other embodiments are disclosed or are apparent from and encompassed by the following detailed description.

Краткое описание графических материаловBrief description of graphic materials

Новые признаки настоящего изобретения изложены с характерными особенностями в прилагаемой формуле изобретения. Лучшее понимание признаков и преимуществ настоящего изобретения будет доступно благодаря ссылке на следующее подробное описание, в котором изложены показательные варианты осуществления, в которых используют принципы настоящего изобретения, и на сопутствующие графические материалы.New features of the present invention set forth with characteristic features in the attached claims. A better understanding of the features and advantages of the present invention will be available through reference to the following detailed description, which sets forth representative embodiments in which the principles of the present invention are used, and to the accompanying drawings.

На фигуре 1 показана схематическая модель системы CRISPR. Нуклеаза Cas9 из Streptococcus pyogenes (желтый) нацелена на геномную ДНК при помощи синтетической направляющей РНК (sgRNA), состоящей из 20-нуклеотидной направляющей последовательности (голубой) и каркаса (красный). Направляющая последовательность образует пары оснований с ДНК-мишенью (голубой) непосредственно выше необходимого мотива, смежного с протоспейсером (PAM; пурпурный) 5'-NGG, и Cas9 опосредует двухцепочечный разрыв (DSB) на ~3 п.о. выше РАМ (красный треугольник).Figure 1 shows a schematic model of a CRISPR system. Cas9 nuclease from Streptococcus pyogenes (yellow) targets genomic DNA using a synthetic RNA guide (sgRNA) consisting of a 20-nucleotide guide sequence (blue) and scaffold (red). The guide sequence forms base pairs with the target DNA (cyan) immediately above the desired motif adjacent to the proto-spacer (PAM; magenta) 5'-NGG, and Cas9 mediates double-stranded cleavage (DSB) by ~ 3 bp. above RAM (red triangle).

На фигурах 2A-F изображена показательная система CRISPR, возможный механизм действия, иллюстративная адаптация для экспрессии в эукариотических клетках и результаты тестов, оценивающих ядерную локализацию и активность CRISPR.Figures 2A-F depict a representative CRISPR system, a possible mechanism of action, illustrative adaptation for expression in eukaryotic cells, and test results evaluating nuclear localization and CRISPR activity.

На фигуре 3 изображена показательная кассета экспрессии для экспрессии элементов системы CRISPR в эукариотических клетках, предсказанные структуры иллюстративных направляющих последовательностей и активность системы CRISPR, которая измерена в эукариотических и прокариотических клетках.3 shows an exemplary expression cassette for the expression of CRISPR system elements in eukaryotic cells, predicted structures of illustrative guide sequences and CRISPR system activity as measured in eukaryotic and prokaryotic cells.

На фигурах 4A-D показаны результаты оценивания специфичности SpCas9 в отношении иллюстративной мишени.In figures 4A-D shows the results of the assessment of the specificity of SpCas9 in relation to an illustrative target.

На фигурах 5A-G изображена показательная векторная система и результаты ее применения при управлении гомологичной рекомбинацией в эукариотических клетках.Figures 5A-G depict an exemplary vector system and the results of its use in controlling homologous recombination in eukaryotic cells.

На фигуре 6 представлена таблица последовательностей протоспейсеров и обобщены результаты касательно эффективности модификаций для протоспейсеров-мишеней, разработанных на основе иллюстративных систем CRISPR S. pyogenes и S. thermophilics с соответствующими PAM к локусам в геномах человека и мыши. Клетки трансфицировали Cas9 и либо pre-crRNA/tracrRNA, либо химерной РНК и анализировали через 72 часа после трансфекции. Процент вставок/делеций рассчитывали на основе результатов анализа с помощью Surveyor с указанными линиями клеток (N=3 для всех протоспейсеров-мишеней, ошибки представляют собой стандартные ошибки среднего, N.D. означает "не обнаружено при помощи анализа с помощью Surveyor", и N.T. означает "не тестировали в данном исследовании").Figure 6 presents a table of protospacer sequences and summarizes the results regarding the effectiveness of modifications for target protospacer developed based on illustrative CRISPR systems of S. pyogenes and S. thermophilics with corresponding PAM to loci in the human and mouse genomes. Cells were transfected with Cas9 and either pre-crRNA / tracrRNA or chimeric RNA and analyzed 72 hours after transfection. The percentage of insertions / deletions was calculated based on the results of the analysis using Surveyor with the indicated cell lines (N = 3 for all target protospacer, the errors are standard errors of the mean, ND means "not detected by analysis using the Surveyor", and NT means " not tested in this study ").

На фигурах 7А-С показано сравнение различных транскриптов tracrRNA для опосредованного Cas9 целенаправленного воздействия на ген.Figures 7A-C show a comparison of various tracrRNA transcripts for Cas9-mediated targeted gene targeting.

На фигуре 8 показано схематическое изображение анализа с помощью нуклеазы Surveyor для обнаружения индуцированных двухцепочечным разрывом микровставок и микроделеций.Figure 8 shows a schematic representation of a Surveyor nuclease assay for detecting double-stranded break microinserts and microdeletions.

На фигурах 9А-В изображены показательные бицистронные векторы экспрессии для экспрессии элементов системы CRISPR в эукариотических клетках.Figures 9A-B show representative bicistronic expression vectors for expression of CRISPR system elements in eukaryotic cells.

На фигуре 10 показан анализ интерференции при трансформации бактериальной плазмидой, кассеты экспрессии и плазмиды, используемые в нем, и показатели эффективности трансформации клеток, используемых в нем.The figure 10 shows the analysis of interference during transformation with a bacterial plasmid, expression cassettes and plasmids used in it, and indicators of the efficiency of transformation of cells used in it.

На фигурах 11А-С показаны гистогораммы расстояний между смежными PAM (NGG) локуса 1 S. pyogenes SF370 (фигура 10А) и PAM (NNAGAAW) локуса 2 LMD9 S. thermophilus (фигура 10 В) в геноме человека и расстояние для каждого РАМ в хромосомах (Chr) (фигура 10C).Figures 11A-C show histograms of the distances between adjacent PAM (NGG) of locus 1 of S. pyogenes SF370 (Figure 10A) and PAM (NNAGAAW) of locus 2 of LMD9 S. thermophilus (Figure 10B) in the human genome and the distance for each RAM in the chromosomes (Chr) (Figure 10C).

На фигурах 12А-С изображена показательная система CRISPR, иллюстративная адаптация для экспрессии в эукариотических клетках и результаты тестов, оценивающих активность CRISPR.Figures 12A-C depict a representative CRISPR system, illustrative adaptation for expression in eukaryotic cells, and test results evaluating CRISPR activity.

На фигурах 13А-С показаны иллюстративные манипуляции с системой CRISPR для целенаправленного воздействия на локусы генома в клетках млекопитающего.Figures 13A-C illustrate illustrative manipulations with the CRISPR system to target genome loci in mammalian cells.

На фигурах 14А-В показаны результаты анализа нозерн блоттинга процессинга crRNA в клетках млекопитающего.Figures 14A-B show the results of a Northern blot analysis of crRNA processing in mammalian cells.

На фигуре 15 изображен показательный отбор протоспейсеров в локусах PVALB человека и Th мыши.The figure 15 shows an illustrative selection of protospacer in the PVALB loci of the human and Th mouse.

На фигуре 16 показан иллюстративный протоспейсер и соответствующие представляющие собой мишени последовательности PAM системы CRISPR S. thermophilus в локусе EMX1 человека.Figure 16 shows an illustrative protospacer and corresponding target PAM sequences of the S. thermophilus CRISPR system at the human EMX1 locus.

На фигуре 17 представлена таблица последовательностей для праймеров и зондов, используемых для Surveyor, RFLP, геномного секвенирования и анализов нозерн блоттинга.17 shows a sequence table for primers and probes used for Surveyor, RFLP, genomic sequencing, and Northern blot analyzes.

На фигурах 18А-С показана иллюстративная манипуляция с системой CRISPR с химерными РНК и результаты анализов с помощью SURVEYOR в отношении активности системы в эукариотических клетках.Figures 18A-C show illustrative manipulation of the CRISPR system with chimeric RNAs and the results of analyzes using SURVEYOR regarding the activity of the system in eukaryotic cells.

На фигурах 19А-В представлено графическое изображение результатов анализов с помощью SURVEYOR в отношении активности системы CRISPR в эукариотических клетках.Figures 19A-B are graphical representations of SURVEYOR assay results for CRISPR system activity in eukaryotic cells.

На фигуре 20 представлено показательное отображение некоторых целевых сайтов Cas9 S. pyogenes в геноме человека, полученное с использованием геномного браузера UCSC.The figure 20 presents a representative display of some Cas9 target sites of S. pyogenes in the human genome, obtained using the genomic browser UCSC.

На фигуре 21 показаны предсказанные вторичные структуры для показательных химерных РНК, содержащих направляющую последовательность, парную tracr-последовательность и tracr-последовательность.Figure 21 shows the predicted secondary structures for representative chimeric RNAs containing a guide sequence, a paired tracr sequence and a tracr sequence.

На фигуре 22 показаны иллюстративные бицистронные векторы экспрессии для экспрессии элементов системы CRISPR в эукариотических клетках.22 illustrates exemplary bicistronic expression vectors for expression of CRISPR system elements in eukaryotic cells.

На фигуре 23 показано, что активность нуклеазы Cas9 по отношению к эндогенным мишеням можно использовать для редактирования генома, (а) Концепция редактирования генома при помощи системы CRISPR. Конструкция CRISPR целенаправленного воздействия управляла расщеплением хромосомного локуса и была котрансформирована матрицей редактирования, которая рекомбинировала с мишенью для предотвращения расщепления. Устойчивые к канамицину трансформанты, которые выдерживали воздействие CRISPR, содержали модификации, введенные с помощью матрицы редактирования, tracr, трансактивирующую РНК CRISPR; aphA-3, ген устойчивости к кантамицину. (b) Трансформация ДНК crR6M в клетках R68232.5 без матрицы редактирования, srtA R6 дикого типа или матрицами редактирования R6370.1. Рекомбинация srtA либо R6, либо R6370.1 предотвращала расщепление с помощью Cas9. Эффективность трансформации подсчитывали как колониеобразующие единицы (cfu) на мкг ДНК crR6M; показаны средние значения со среднеквадратическими отклонениями от по меньшей мере трех независимых экспериментов. ПЦР анализ выполняли на 8 клонах при каждой трансформации. "Un." означает нередактированный локус srtA штамма R68232.5; "Ed." показывает матрицу редактирования. Мишени R68232.5 и R6370.1 различаются по рестрикции EaeI.Figure 23 shows that the activity of Cas9 nuclease with respect to endogenous targets can be used to edit the genome, (a) The concept of editing the genome using the CRISPR system. The targeted CRISPR construct controlled the cleavage of the chromosomal locus and was co-transformed with an editing matrix that recombined with the target to prevent cleavage. Kanamycin-resistant transformants that withstood the effects of CRISPR contained modifications introduced using an editing matrix, tracr, transactivating CRISPR RNA; aphA-3, cantamycin resistance gene. (b) Transformation of crR6M DNA in R6 8232.5 cells without an editing matrix, srtA R6 wild-type, or R6370.1 editing matrices. Recombination of srtA with either R6 or R6 370.1 prevented cleavage with Cas9. Transformation efficiency was calculated as colony forming units (cfu) per μg of crR6M DNA; mean values are shown with standard deviations from at least three independent experiments. PCR analysis was performed on 8 clones at each transformation. "Un." mean unedited srtA locus of strain R6 8232.5 ; "Ed." shows the editing matrix. Targets R6 8232.5 and R6 370.1 differ in EaeI restriction.

На фигуре 24 показан анализ PAM и затравочных последовательностей, которые исключают расщепление Cas9. (a) ПЦР-продуктами с рандомизированными последовательностями РАМ или рандомизированными затравочными последовательностями трансформировали клетки crR6. Эти клетки экспрессировали Cas9, загруженную crRNA, которая была нацелена на хромосомный участок клеток R68232.5 (выделен розовым), отсутствующий в геноме R6. Более, чем 2×105 устойчивых к хлорамфениколу трансформантов, несущих неактивные PAM или затравочные последовательности, объединяли для амплификации и глубокого секвенирования целевого участка. (b) Относительная доля количества считываемых фрагментов после трансформации случайными конструкциями PAM клеток crR6 (по сравнению с количеством считываемых фрагментов в трансформантах R6). Показана относительная распространенность каждой 3-нуклеотидной последовательности PAM. Крайне недостаточно представленные последовательности (NGG) показаны красным; частично недостаточно представленные оранжевым (NAG), (с) Относительная доля количества считываемых фрагментов после трансформации конструкциями случайных затравочных последовательностей клеток crR6 (по сравнению с количеством считываемых фрагментов в трансформантах R6). Показана относительная распространенность каждого нуклеотида по каждому положению первых 20 нуклеотидов последовательности протоспейсера. Высокая распространенность указывает на отсутствие расщепления Cas9, т.е. CRISPR-инактивирующую мутацию. Серая линия показывает уровень последовательности WT. Пунктирная линия представляет уровень, выше которого мутация значительно нарушает расщепление (см. раздел "анализ данных глубокого секвенирования" в примере 5)24 shows an analysis of PAM and seed sequences that preclude Cas9 cleavage. (a) PCR products with randomized RAM sequences or randomized seed sequences transformed crR6 cells. These cells expressed Cas9 loaded with crRNA, which was targeted to the chromosome region of R6 8232.5 cells (highlighted in pink), missing from the R6 genome. More than 2 × 105 chloramphenicol-resistant transformants carrying inactive PAM or seed sequences were combined for amplification and deep sequencing of the target site. (b) Relative fraction of the number of read fragments after transformation with random PAM constructs of crR6 cells (compared to the number of read fragments in R6 transformants). The relative prevalence of each 3-nucleotide sequence of PAM is shown. Extremely underrepresented sequences (NGGs) are shown in red; partially underrepresented in orange (NAG), (c) Relative fraction of the number of read fragments after transformation of random seed sequences of crR6 cells with constructs (compared to the number of read fragments in R6 transformants). The relative prevalence of each nucleotide at each position of the first 20 nucleotides of the protospacer sequence is shown. High prevalence indicates the absence of Cas9 cleavage, i.e. CRISPR inactivating mutation. The gray line shows the level of the WT sequence. The dashed line represents the level above which the mutation significantly disrupts cleavage (see "deep sequencing data analysis" section in Example 5)

На фигуре 25 показано введение одиночной и множественных мутаций с применением системы CRISPR в S. pneumoniae, (а) Нуклеотидные и аминокислотные последовательности bgaA дикого типа и редактированного bgaA (зеленые нуклеотиды; подчеркнутые аминокислотные остатки). Показаны протоспейсер, PAM и сайты рестрикции. (b) Эффективность трансформации клеток, трансформированных конструкциями для целенаправленного воздействия, в присутствии матрицы редактирования или контроля, (с) ПЦР анализ 8 трансформантов каждого эксперимента редактирования с последующим расщеплением BtgZI (R→А) и TseI (NE→АА). Делеция bgaA была выявлена как ПЦР-продукт меньшего размера, (d) Анализ Миллера для измерения активности β-галактозидазы штаммов WT и редактированных, (е) Для одностадийной, двойной делеции конструкция для целенаправленного воздействия содержала два спейсера (в этом случае совпадающие srtA и bgaA), и ее котрансформировали двумя различными матрицами редактирования, (f) ПЦР анализ 8 трансформантов для выявления делеций в локусах srtA и bgaA. 6/8 трансформантов содержали делеции обоих генов.Figure 25 shows the introduction of single and multiple mutations using the CRISPR system in S. pneumoniae, (a) Nucleotide and amino acid sequences of wild-type bgaA and edited bgaA (green nucleotides; underlined amino acid residues). The protospacer, PAM, and restriction sites are shown. (b) Transformation efficiency of cells transformed with constructs for targeted exposure in the presence of an editing or control matrix, (c) PCR analysis of 8 transformants of each editing experiment, followed by cleavage of BtgZI (R → A) and TseI (NE → AA). The bgaA deletion was identified as a smaller PCR product, (d) Miller analysis to measure β-galactosidase activity of WT strains and edited, (f) For a one-step, double deletion, the design for targeted exposure contained two spacers (in this case, matching srtA and bgaA ), and it was co-transformed with two different editing matrices, (f) PCR analysis of 8 transformants to detect deletions at the srtA and bgaA loci. 6/8 transformants contained deletions of both genes.

На фигуре 26 представлены механизмы, лежащие в основе редактирования с применением системы CRISPR. (а) Стоп-кодон вводили в ген устойчивости к эритромицину ermAM для создания штамма JEN53. Последовательность дикого типа можно восстанавливать путем целенаправленного воздействия на стоп-кодон конструкцией CRISPR::ermAM(stop) и с использованием последовательности ermAM дикого типа в качестве матрицы редактирования. (b) Последовательности ermAM мутантные и дикого типа, (с) Фракция эритромицин-устойчивых (ermR) КОЕ, вычисленная по общим или устойчивым к канамицину (kanR) КОЕ. (d) Фракция общего количества клеток, получивших и конструкцию CRISPR, и матрицу редактирования. Котрансформация конструкцией CRISPR для целенаправленного воздействия обеспечивала больше трансформантов (t-тест, p=0,011). Во всех случаях значения показывают среднее ± среднеквадратическое отклонение для трех независимых экспериментов.The figure 26 presents the mechanisms underlying the editing using the CRISPR system. (a) A stop codon was introduced into the ermAM erythromycin resistance gene to create the JEN53 strain. The wild-type sequence can be restored by targeting the stop codon with the CRISPR :: ermAM (stop) construct and using the wild-type ermAM sequence as the editing matrix. (b) The ermAM sequences are mutant and wild-type, (c) The erythromycin-resistant (erm R ) CFU fraction calculated from total or kanamycin-resistant (kan R ) CFU. (d) A fraction of the total number of cells that received both the CRISPR construct and the editing matrix. Cotransformation with the CRISPR construct for targeted exposure provided more transformants (t-test, p = 0.011). In all cases, the values show the mean ± standard deviation for three independent experiments.

На фигуре 27 проиллюстрировано редактирование генома системой CRISPR в Е. coli. (а) Плазмидой устойчивости к канамицину, несущей массив CRISPR (pCRISPR), целенаправленно воздействующий на ген с целью редактирования, можно трансформировать сконструированный штамм НМЕ63, содержащий плазмиду устойчивости к хлорамфениколу, несущую cas9 и tracr (pCas9), совместно с олигонуклеотидом, определяющим мутацию. (b) Мутацию К42Т, обеспечивающую устойчивость к стрептомицину, вводили в ген rpsL. (с) Фракцию устойчивых к стрептомицину (strepR) КОЕ подсчитывали по общим или устойчивым к канамицину (kanR) КОЕ. (d) Фракция всех клеток, получивших и плазмиду pCRISPR, и редактированный олигонуклеотид. Котрансформация плазмидой pCRISPR для целенаправленного воздействия обеспечивала больше трансформантов (t-тест, p=0,004). Во всех случаях значения показывают среднее ± среднеквадратическое отклонение для трех независимых экспериментов.Figure 27 illustrates the editing of the genome by the CRISPR system in E. coli. (a) A kanamycin resistance plasmid carrying the CRISPR array (pCRISPR), targeting the gene for editing, can transform the engineered strain HME63 containing the chloramphenicol resistance plasmid carrying cas9 and tracr (pCas9), together with the mutation-determining oligonucleotide. (b) A K42T mutation providing streptomycin resistance was introduced into the rpsL gene. (c) Streptomycin-resistant (strep R ) CFU fraction was calculated by total or kanamycin-resistant (kan R ) CFU. (d) The fraction of all cells that received both the plasmid pCRISPR and the edited oligonucleotide. Cotransformation with pCRISPR plasmid for targeted exposure provided more transformants (t-test, p = 0.004). In all cases, the values show the mean ± standard deviation for three independent experiments.

На фигуре 28 показано, что трансформация геномной ДНК crR6 приводит к редактированию локуса целенаправленного воздействия, (а) Элемент IS1167 R6 S. pneumoniae замещали локусом CRISPR01 SF370 S. pyogenes для создания штамма crR6. Этот локус кодирует для нуклеазы Cas9 массив CRISPR с шестью спейсерами, tracrRNA, необходимую для биогенеза crRNA, и белки Cas1, Cas2 и Csn2, которые не являются необходимыми для целенаправленного воздействия. Штамм crR6M содержит минимальную функциональную систему CRISPR без cas1, cas2 и csn2. Ген aphA-3 кодирует устойчивость к кантамицину. Протоспейсеры стрептококковых бактериофагов φ8232.5 и φ370.1 гибридизировали с геном устойчивости к хлорамфениколу (cat) и интегрировали в ген srtA штамма R6 для создания штаммов R68232.5 и R6370.1. (b) Левая панель: трансформация геномной ДНК crR6 и crR6M в R68232.5 и R6370.1. В качестве контроля компетенции клеток также трансформировали геном устойчивости к стрептомицину. Правая панель: ПЦР анализ 8 трансформантов R68232.5 с геномной ДНК crR6. Для ПЦР использовали праймеры, обеспечивающие амплифицикацию локуса srtA. В 7/8 генотипированных колоний локус srtA R68232.5 был замещен локусом WT из геномной ДНК crR6.Figure 28 shows that the transformation of the genomic DNA of crR6 leads to the editing of the locus of targeted exposure, (a) Element IS1167 R6 S. pneumoniae was replaced by the locus CRISPR01 SF370 S. pyogenes to create a strain of crR6. This locus encodes a six-spacer CRISPR array for Cas9 nuclease, tracrRNA, necessary for crRNA biogenesis, and Cas1, Cas2, and Csn2 proteins, which are not necessary for targeted exposure. Strain crR6M contains a minimal functional CRISPR system without cas1, cas2 and csn2. The aphA-3 gene encodes resistance to cantamycin. The protospacers of streptococcal bacteriophages φ8232.5 and φ370.1 hybridized with the chloramphenicol resistance gene (cat) and integrated into the srtA gene of strain R6 to create strains R68232.5 and R6370.1. (b) Left panel: transformation of the genomic DNA of crR6 and crR6M into R6 8232.5 and R 6370.1 . As a control, cell competencies were also transformed with the streptomycin resistance gene. Right panel: PCR analysis of 8 transformants of R6 8232.5 with genomic DNA crR6. For PCR, primers were used to amplify the srtA locus. In 7/8 genotyped colonies, the srtA locus R68232.5 was replaced by a WT locus from crR6 genomic DNA.

На фигуре 29 представлены хроматограммы последовательностей ДНК редактированных клеток, полученных в этом исследовании. Во всех случаях выявляли последовательности дикого типа и мутантные последовательности протоспейсера и PAM (или их обратную комплементарную нить). В случае необходимости обеспечивается аминокислотная последовательность, кодируемая протоспейсером. Для каждого эксперимента редактирования секвенировали все штаммы, для которых ПЦР и рестрикционный анализы подтвердили введение желаемой модификации. Показана репрезентативная хроматограмма. (а) Хроматограмма введения мутации PAM в мишень R68232.5 (фигура 23d). (b) Хроматограммы введения мутаций R>A и NE>AA в ген β-галактозидазы (bgaA) (фигура 25c). (c) Хроматограмма введения делеции 6664 п.о. в ORF bgaA (фигуры 25c и 25f). Пунктирная линия указывает границы делеции. (d) Хроматограмма введения делеции 729 п.о. в ORF srtA (фигура 25f). Пунктирная линия указывает границы делеции. (е) Хроматограммы образования преждевременного стоп-кодона в ermAM (фигура 33). (f) Редактирование rpsL в Е. coli (фигура 27).The figure 29 presents the chromatograms of the DNA sequences of the edited cells obtained in this study. In all cases, wild-type sequences and mutant protospacer and PAM sequences (or their reverse complementary strand) were detected. If necessary, an amino acid sequence encoded by the protospacer is provided. For each editing experiment, all strains were sequenced for which PCR and restriction analysis confirmed the introduction of the desired modification. A representative chromatogram is shown. (a) Chromatogram of the introduction of the PAM mutation in the target R6 8232.5 (figure 23d). (b) Chromatograms of the introduction of mutations R> A and NE> AA into the β-galactosidase gene (bgaA) (Figure 25c). (c) Chromatogram of the introduction of a 6664 bp deletion in ORF bgaA (figures 25c and 25f). The dashed line indicates the boundaries of the deletion. (d) Chromatogram of the introduction of a 729 bp deletion in ORF srtA (Figure 25f). The dashed line indicates the boundaries of the deletion. (e) Chromatograms of the formation of a premature stop codon in ermAM (Figure 33). (f) Editing rpsL in E. coli (Figure 27).

На фигуре 30 проиллюстрирована устойчивость CRISPR к случайным мишеням S. pneumoniae, содержащим различные PAM. (а) Положение 10 случайных мишеней в геноме R6 S. pneumoniae. Выбранные мишени содержат различные PAM и находятся на обеих нитях. (b) Спейсеры, соответствующие мишеням, клонировали в минимальный массив CRISPR плазмиды pLZ12 и трансформировали ими штамм crR6Rc, который обеспечивает процессинг и механизм целенаправленного воздействия в трансформантах, (с) Эффективность трансформации различными плазмидами штаммов R6 и crR6Rc. Не было выделено колоний по трансформации pDB99-108 (Т1-Т10) в crR6Rc. Пунктирной линией представлен предел обнаружения анализа.Figure 30 illustrates CRISPR resistance to random S. pneumoniae targets containing various PAMs. (a) Position of 10 random targets in the R6 genome of S. pneumoniae. Selected targets contain different PAMs and are located on both strands. (b) Spacers corresponding to the targets were cloned into the minimal CRISPR array of plasmid pLZ12 and transformed with them the crR6Rc strain, which provides processing and targeted mechanism in transformants, (c) Transformation efficiency of various plasmids of the R6 and crR6Rc strains. No colonies were identified for the transformation of pDB99-108 (T1-T10) into crR6Rc. The dashed line represents the detection limit of the analysis.

На фигуре 31 представлена общая схема целенаправленного редактирования генома. Для обеспечения целенаправленного редактирования генома crR6M дополнительно подвергали конструированию так, чтобы он содержал tracrRNA, Cas9 и только один повтор массива CRISPR, за которым находится маркер устойчивости к кантамицину (aphA-3), создавая штамм crR6Rk. ДНК этого штамма использовали в качестве матрицы для ПЦР с праймерами, сконструированными для введения нового спейсера (зеленый блок, обозначенный N). ПЦР с левыми и правыми праймерами объединяли с применением метода Гибсона для создания конструкции для целенаправленного воздействия. Конструкциями и для целенаправленного воздействия, и для редактирования затем трансформировали штамм crR6Rc, который является штаммом, эквивалентным crR6Rk, но содержит маркер устойчивости к кантамицину, замещенный маркером устойчивости к хлорамфениколу (cat). Приблизительно 90% устойчивых к канамицину трансформантов содержали желаемую мутацию.The figure 31 presents the General scheme of targeted editing of the genome. To ensure targeted editing of the genome, crR6M was additionally designed to contain tracrRNA, Cas9 and only one repeat of the CRISPR array, followed by a cantamycin resistance marker (aphA-3), creating a crR6Rk strain. The DNA of this strain was used as a template for PCR with primers designed to introduce a new spacer (green block, designated N). PCRs with left and right primers were combined using the Gibson method to create a construct for targeted exposure. The constructs for both targeted exposure and editing then transformed the crR6Rc strain, which is the crR6Rk equivalent strain but contains a cantamycin resistance marker replaced by a chloramphenicol resistance marker (cat). About 90% of kanamycin-resistant transformants contained the desired mutation.

На фигуре 32 проиллюстрировано распределение расстояний между PAM. NGG и CCN, которые считаются допустимыми PAM. Данные представлены по геному R6 S. pneumoniae, а также по случайным последовательностям такой же длины и с таким же содержанием GC (39,7%). Пунктирная линия представляет среднее расстояние (12) между PAM в геноме R6.Figure 32 illustrates the distribution of distances between PAMs. NGG and CCN, which are considered valid PAM. Data are presented for the S. pneumoniae genome R6, as well as for random sequences of the same length and with the same GC content (39.7%). The dashed line represents the average distance (12) between the PAM in the R6 genome.

На фигуре 33 проиллюстрировано опосредованное CRISPR редактирование локуса ermAM с использованием геномной ДНК в качестве конструкции для целенаправленного воздействия. Для использования геномной ДНК в качестве конструкции для целенаправленного воздействия необходимо избегать аутоиммунной активности на CRISPR, и, таким образом, должен быть использован спейсер, соответствующий последовательности, не присутствующей в хромосоме (в этом случае ген устойчивости к эритромицину ermAM). (а) Нуклеотидная и аминокислотная последовательности гена ermAM дикого типа и мутированного (красные буквы). Приведены протоспейсер и последовательности PAM. (b) Схематическое изображение опосредованного CRISPR редактирования локуса ermAM с применением геномной ДНК. Конструкцию, несущую ermAM-целенаправленно воздействующий спейсер (голубой блок), получали с помощью ПЦР и сборки по методу Гибсона, трансформировали ею штамм crR6Rc, создавая штамм JEN37. Геномную ДНК JEN37 использовали в качестве конструкции для целенаправленного воздействия и ею вместе с матрицей редактирования котрансформировали JEN38, штамм, в котором ген srtA замещен копией ermAM дикого типа. Устойчивые к канамицину трансформанты содержат редактированный генотип (JEN43). (с) Количество устойчивых к канамицину клеток получали после котрансформации матрицами целенаправленного воздействия и редактирования или контрольными. В присутствии контрольной матрицы получали 5,4×103 КОЕ/мл и 4,3×105 КОЕ/мл при использовании матрицы редактирования. Это различие указывает на приблизительно 99% эффективность редактирования [(4,3×105-5,4×103)/4,3×105]. (d) Для проверки на наличие редактированных клеток семь устойчивых к канамицину клонов и JEN38 высевали штрихом на чашки с агаровой средой с эритромицином (erm+) или без (erm-) эритромицина. Только положительный контроль отображал устойчивость к эритромицину. Мутированный генотип ermAM одного из этих трансформантов также подтверждали путем секвенирования ДНК (фигура 29е).Figure 33 illustrates CRISPR-mediated editing of the ermAM locus using genomic DNA as a construct for targeted exposure. To use genomic DNA as a construct for targeted exposure, autoimmune activity on CRISPR must be avoided, and thus a spacer corresponding to a sequence not present on the chromosome (in this case, ermAM erythromycin resistance gene) should be used. (a) Nucleotide and amino acid sequences of the wild-type and mutated ermAM gene (red letters). The protospacer and PAM sequences are shown. (b) Schematic representation of CRISPR-mediated editing of the ermAM locus using genomic DNA. A construct carrying an ermAM-targeted spacer (blue block) was obtained by PCR and assembly using the Gibson method, and the crR6Rc strain was transformed by it, creating the JEN37 strain. The JEN37 genomic DNA was used as a construct for targeted exposure, and together with the editing matrix, it co-transformed JEN38, a strain in which the srtA gene is replaced by a wild-type ermAM copy. Kanamycin-resistant transformants contain the edited genotype (JEN43). (c) The number of kanamycin-resistant cells was obtained after cotransformation with targeted exposure and editing matrices or control matrices. In the presence of a control matrix, 5.4 × 10 3 CFU / ml and 4.3 × 10 5 CFU / ml were obtained using the editing matrix. This difference indicates an approximately 99% editing efficiency [(4.3 × 10 5 −5.4 × 10 3 ) / 4.3 × 10 5 ]. (d) To check for edited cells, seven kanamycin-resistant clones and JEN38 were streaked onto plates with agar medium with erythromycin (erm +) or without (erm-) erythromycin. Only a positive control displayed erythromycin resistance. The mutated ermAM genotype of one of these transformants was also confirmed by DNA sequencing (Figure 29e).

На фигуре 34 проиллюстрировано последовательное введение мутаций путем опосредованного CRISPR редактирования генома, (а) Схематическое изображение последовательного введения мутаций путем опосредованного CRISPR редактирования генома. Прежде всего, R6 конструировали для создания crR6Rk. crR6Rk котрансформировали конструкцией для целенаправленного воздействия srtA, гибридизированной с cat для отбора по хлорамфениколу редактированных клеток, совместно с конструкцией для редактирования с делецией ΔsrtA внутри рамки считывания. Штамм ΔsrtA crR6 получали путем отбора по хлорамфениколу. Затем штамм ΔsrtA котрансформировали конструкцией для целенаправленного воздействия bgaA, гибридизированной с aphA-3 для отбора по канамицину редактированных клеток, и конструкцией для редактирования, содержащей делецию ΔbgaA внутри рамки считывания. И наконец, сконструированный локус CRISPR можно удалять из хромосомы путем сначала котрансформации ДНК R6, содержащей локус IS1167 дикого типа, и плазмидой, несущей протоспейсер bgaA (pDB97), а также отбором по спектиномицину. (b) ПЦР анализ 8 устойчивых к хлорамфениколу (Cam) трансформантов для выявления делеции в локусе srtA. (с) Активность β-галактозидазы, которую измеряли с помощью анализа Миллера. У S. pneumoniae этот фермент прикреплен к клеточной стенке сортазой А. Делеция гена srtA проявляется в высвобождении β-галактозидазы в супернатант. Мутанты ΔbgaA не проявляют активности, (d) ПЦР анализ 8 устойчивых к спектиномицину (Spec) трансформантов для выявления замещения локуса CRISPR IS1167 дикого типа.Figure 34 illustrates sequential introduction of mutations by CRISPR-mediated genome editing, (a) Schematic illustration of sequential introduction of mutations by CRISPR-mediated genome editing. First of all, R6 was designed to create crR6Rk. crR6Rk was co-transformed with a construct for targeted exposure to srtA hybridized with cat to select edited cells for chloramphenicol, together with an editing construct with ΔsrtA deletion within the reading frame. The strain ΔsrtA crR6 was obtained by selection by chloramphenicol. The ΔsrtA strain was then co-transformed with a construct for targeted exposure to bgaA hybridized with aphA-3 for selection of edited cells by kanamycin, and an editing construct containing a ΔbgaA deletion within the reading frame. Finally, the constructed CRISPR locus can be removed from the chromosome by first cotransforming R6 DNA containing the wild-type IS1167 locus and a plasmid carrying the bgaA protospacer (pDB97), as well as by spectinomycin selection. (b) PCR analysis of 8 chloramphenicol resistant (Cam) transformants to detect deletion at the srtA locus. (c) β-galactosidase activity, as measured by Miller’s assay. In S. pneumoniae, this enzyme is attached to the cell wall by sortase A. Deletion of the srtA gene is manifested in the release of β-galactosidase into the supernatant. The ΔbgaA mutants are not active, (d) PCR analysis of 8 spectinomycin-resistant (Spec) transformants to detect wild-type CRISPR IS1167 locus substitution.

На фигуре 35 показан фон частоты мутации CRISPR у S. pneumoniae. (а) Трансформация JEN53 конструкциями для целенаправленного воздействия CRISPR::∅ или CRISPR::erm(stop) с матрицей редактирования ermAM или без нее. Различие в kanR КОЕ между CRISPR::∅ и CRISPR::erm(stop) указывает на то, что расщепление Cas9 уничтожает нередактированные клетки. Мутантов, избегающих интерференции CRISPR при отсутствии матрицы редактирования, наблюдали с частотой 3×10-3. (b) ПЦР анализ локуса CRISPR клеток, избежавших воздействия, указывает на то, что 7/8 содержат делецию спейсера. (с) Клетка, избежавшая воздействия, №2 несет точковую мутацию в cas9.Figure 35 shows the background of the CRISPR mutation frequency in S. pneumoniae. (a) Transformation of JEN53 constructs for targeted impact of CRISPR :: ∅ or CRISPR :: erm (stop) with or without an ermAM editing matrix. The difference in kan R CFU between CRISPR :: ∅ and CRISPR :: erm (stop) indicates that Cas9 cleavage destroys unedited cells. Mutants avoiding CRISPR interference in the absence of an editing matrix were observed at a frequency of 3 × 10 −3 . (b) PCR analysis of the CRISPR locus of escaping cells indicates that 7/8 contain a spacer deletion. (c) The cell that escaped exposure No. 2 carries a point mutation in cas9.

На фигуре 36 показано, что важные элементы локуса 1 CRISPR S. pyogenes воспроизводили в Е. coli с применением pCas9. Плазмида содержала tracrRNA, Cas9, а также лидерную последовательность, управляющую массивом crRNA. Плазмиды pCRISPR содержали только лидерную последовательность и массив. Спейсеры могут быть вставлены в массив crRNA между сайтами BsaI с применением отожженных олигонуклеотидов. Структура олигонуклеотида показана внизу. pCas9 несет устойчивость к хлорамфениколу (CmR) и основана на остове низкокопийной плазмиды pACYC184. pCRISPR основана на большом количестве копий плазмиды pZE21. Требовалось две плазмиды, поскольку плазмида pCRISPR, содержащая спейсер, целенаправленно воздействующий на хромосому Е. coli, не может быть сконструирована с применением этого организма как хозяина для клонирования, если Cas9 также присутствует (это приведет к гибели хозяина).Figure 36 shows that important elements of locus 1 of CRISPR S. pyogenes were reproduced in E. coli using pCas9. The plasmid contained tracrRNA, Cas9, as well as a leader sequence driving the crRNA array. The pCRISPR plasmids contained only the leader sequence and array. Spacers can be inserted into the crRNA array between BsaI sites using annealed oligonucleotides. The structure of the oligonucleotide is shown below. pCas9 is resistant to chloramphenicol (CmR) and is based on the backbone of the low copy plasmid pACYC184. pCRISPR is based on a large number of copies of the plasmid pZE21. Two plasmids were required because the pCRISPR plasmid containing the spacer targeted on the E. coli chromosome cannot be constructed using this organism as a host for cloning if Cas9 is also present (this will result in death of the host).

На фигуре 37 показано редактирование в MG1655 E. coli под управлением CRISPR. Олигонуклеотидом (W542), несущим точковую мутацию, что и обеспечивает устойчивость к стрептомицину, и ликвидирует иммунную активность CRISPR, совместно с плазмидой, целенаправленно воздействующей на rpsL (pCRISPR::rpsL), или контрольной плазмидой (pCRISPR::∅) котрансформировали штамм дикого типа MG1655 E. coli, содержащий pCas9. Трансформантов отбирали на среде, содержащей либо стрептомицин, либо канамицин. Пунктирной линией указан предел детекции анализа трансформации.The figure 37 shows the editing in MG1655 E. coli running CRISPR. An oligonucleotide (W542) carrying a point mutation, which provides resistance to streptomycin, and eliminates the immune activity of CRISPR, together with a plasmid that specifically targets rpsL (pCRISPR :: rpsL), or a control plasmid (pCRISPR :: ∅) wild-type strain was co-transformed MG1655 E. coli containing pCas9. Transformants were selected on a medium containing either streptomycin or kanamycin. The dashed line indicates the detection limit of the transformation analysis.

На фигуре 38 показан фон частоты мутации CRISPR в HME63 Е. coli. (а) Трансформация компетентных клеток НМЕ63 плазмидами pCRISPR::∅ или pCRISPR::rpsL. Мутантов, избежавших интерференции CRISPR, наблюдали с частотой 2,6×10-4. (b) Амплификация массива CRISPR клеток, избежавших воздействия, показала, что у 8/8 спейсер был удален.Figure 38 shows the background frequency of the CRISPR mutation in E. coli HME63. (a) Transformation of competent HME63 cells with plasmids pCRISPR :: ∅ or pCRISPR :: rpsL. Mutants that escaped CRISPR interference were observed with a frequency of 2.6 × 10 -4 . (b) Amplification of the CRISPR array of cells that escaped exposure showed that the spacer was removed in 8/8.

На фигуре 39A-D показано круговое изображение филогенетического анализа, выявляющего пять семейств Cas9, включая три группы больших Cas9 (~1400 аминокислот) и две малых Cas9 (~1100 аминокислот).Figure 39A-D shows a circular image of a phylogenetic analysis revealing five Cas9 families, including three groups of large Cas9 (~ 1400 amino acids) and two small Cas9 (~ 1100 amino acids).

На фигуре 40A-F показано линейное отображение филогенетического анализа, выявляющего пять семейств Cas9, включая три группы больших Cas9 (~1400 аминокислот) и две малых Cas9 (~1100 аминокислот).40A-F shows a linear display of a phylogenetic analysis revealing five Cas9 families, including three large Cas9 groups (~ 1400 amino acids) and two small Cas9 (~ 1100 amino acids) groups.

На фигуре 41А-М показаны последовательности, где точки мутаций расположены в гене SpCas9.Figure 41A-M shows sequences where mutation points are located in the SpCas9 gene.

На фигуре 42 показано схематическое изображение конструкции, в которой домен активации транскрипции (VP64) слит с Cas9 с двумя мутациями в каталитических доменах (D10 и Н840).Figure 42 shows a schematic representation of a construct in which a transcription activation domain (VP64) is fused to Cas9 with two mutations in the catalytic domains (D10 and H840).

На фигуре 43A-D показано редактирование генома посредством гомологичной рекомбинации, (а) Схематическое изображение никазы SpCas9 с мутацией D10A в каталитическом домене RuvC I. (b) Схематическое представление гомологичной рекомбинации (HR) в локусе EMX1 человека при использовании смысловых или антисмысловых однонитевых олигонуклеотидов в качестве матриц для репарации. Красная стрелка вверху указывает на сайт расщепления для sgRNA; праймеры для ПЦР для генотипирования (таблицы J и K) обозначены стрелками в правой панели, (с) Последовательность участка, модифицированного с помощью HR. d, Анализ вставок/делеций в целевом локусе 1 EMX1 (n=3), опосредованных SpCas9 дикого типа (wt) и никазой SpCas9 (D10A), с помощью SURVEYOR. Стрелки указывают положения фрагментов ожидаемого размера.Figure 43A-D shows genome editing through homologous recombination, (a) Schematic representation of SpCas9 nickase with D10A mutation in the catalytic domain of RuvC I. (b) Schematic representation of homologous recombination (HR) at the human EMX1 locus using sense or antisense single-stranded oligonucleotides as matrices for repair. The red arrow at the top indicates the cleavage site for sgRNA; PCR primers for genotyping (tables J and K) are indicated by arrows in the right panel, (c) The sequence of the site modified by HR. d, Analysis of insertions / deletions at target locus 1 of EMX1 (n = 3) mediated by wild-type SpCas9 (wt) and SpCas9 nickase (D10A) using SURVEYOR. The arrows indicate the position of the fragments of the expected size.

На фигуре 44А-В показаны одиночные векторные структуры для SpCas9.44A-B show single vector structures for SpCas9.

На фигуре 45 показан количественный анализ расщепления конструкций NLS-Csn1, Csn1, Csn1-NLS, NLS-Csn1-NLS, NLS-Csn1-GFP-NLS и UnTFN.Figure 45 shows a quantitative analysis of the cleavage of the constructs NLS-Csn1, Csn1, Csn1-NLS, NLS-Csn1-NLS, NLS-Csn1-GFP-NLS and UnTFN.

На фигуре 46 показан индекс частоты NLS-Cas9, Cas9, Cas9-NLS и NLS-Cas9-NLS.The figure 46 shows the frequency index NLS-Cas9, Cas9, Cas9-NLS and NLS-Cas9-NLS.

На фигуре 47 представлен анализ в геле, демонстрирующий, что SpCas9 с мутациями никазы (в отдельности) не индуцирует двухцепочечные разрывы.Figure 47 presents a gel analysis demonstrating that SpCas9 with nickase mutations (alone) does not induce double-stranded breaks.

На фигуре 48 показана структура олигонуклеотидной ДНК, используемой в качестве матрицы гомологичной рекомбинации (HR) в этом эксперименте, и сравнение эффективности HR, индуцированной различными комбинациями белка Cas9 и матрицы HR.Figure 48 shows the structure of the oligonucleotide DNA used as the homologous recombination (HR) matrix in this experiment, and a comparison of HR efficiency induced by various combinations of Cas9 protein and HR matrix.

На фигуре 49А показана карта вектора для целенаправленного воздействия с зависимой от условий экспрессией Cas9, Rosa26.49A shows a vector map for targeted exposure with condition-dependent expression of Cas9, Rosa26.

На фигуре 49B показана карта вектора для целенаправленного воздействия с конститутивной экспрессией Cas9, Rosa26.49B shows a vector map for targeted exposure with constitutive expression of Cas9, Rosa26.

На фигуре 50А-Н показаны последовательности для каждого элемента, присутствующего на картах векторов фигур 49А-В.Figure 50A-H shows the sequences for each element present on the vector maps of figures 49A-B.

На фигуре 51 показано схематическое изображение важных элементов в конструкциях для конститутивной и зависимой от условий экспрессии Cas9.Figure 51 shows a schematic representation of important elements in the constructs for constitutive and condition-dependent expression of Cas9.

На фигуре 52 показано подтверждение функции конструкций для конститутивной и зависимой от условий экспрессии Cas9.The figure 52 shows the confirmation of the function of the constructs for constitutive and dependent on the conditions of expression of Cas9.

На фигуре 53 показано подтверждение нуклеазной активности Cas9 с помощью Surveyor.Figure 53 shows confirmation of the nuclease activity of Cas9 using a Surveyor.

На фигуре 54 показан количественный анализ нуклеазной активности Cas9. На фигуре 55 показана структура конструкции и стратегия гомологичной рекомбинации (HR).The figure 54 shows a quantitative analysis of the nuclease activity of Cas9. Figure 55 shows the structure of the structure and the strategy of homologous recombination (HR).

На фигуре 56 показаны результаты ПЦР генотипирования генома конструкций для констутивной (правая) и зависимой от условий (левая) экспрессии при двух разных длительностях воздействия (верхний ряд в течение 3 мин. и нижний ряд в течение 1 мин.).Figure 56 shows the results of PCR genotyping of the genome of constructs for constant (right) and condition-dependent (left) expression at two different exposure times (upper row for 3 minutes and lower row for 1 minute).

На фигуре 57 показана активация Cas9 в mESC.Figure 57 shows Cas9 activation in mESC.

На фигуре 58 показано схематическое изображение стратегии, использованной для опосредования нокаута гена через NHEJ с применением никазного варианта Cas9 совместно с двумя направляющими РНК.Figure 58 shows a schematic representation of the strategy used to mediate gene knockout via NHEJ using the nickel variant of Cas9 in conjunction with two RNA guides.

На фигуре 59 показано, как репарация двухцепочечного разрыва (DSB) ДНК способствует редактированию генов. В пути склонного к ошибкам негомологичного соединения концов (NHEJ) концы DSB подвергаются обработке посредством эндогенных механизмов репарации ДНК и соединяются вместе, что может приводить к случайным мутациям по типу вставки или делеции (вставки/делеции) в месте соединения. Мутации по типу вставки/делеции, имеющие место в кодирующем участке гена, могут обуславливать сдвиг рамки считывания и появление преждевременного стоп-кодона, что приводит к нокауту гена. Альтернативно, матрицу для репарации в форме плазмиды или однонитевых олигодезоксинуклеотидов (ssODN) можно предоставлять для эффективного использования пути репарации с участием гомологичной рекомбинации (HDR), что обеспечивает высокое качество и точное редактирование.Figure 59 shows how DNA double-strand breakage (DSB) repair facilitates gene editing. In a path of error-prone non-homologous end-junction (NHEJ), the ends of the DSB are processed by endogenous DNA repair mechanisms and joined together, which can lead to random mutations like insertion or deletion (insertion / deletion) at the junction. Insertion / deletion mutations that occur in the coding region of a gene can cause a reading frame shift and the appearance of a premature stop codon, which leads to gene knockout. Alternatively, a repair matrix in the form of a plasmid or single-stranded oligodeoxynucleotides (ssODN) can be provided to efficiently use a homologous recombination (HDR) repair pathway, which provides high quality and accurate editing.

На фигуре 60 показаны временная шкала и общее описание экспериментов. Стадии разработки, создания, подтверждения реагента и размножения клеточной линии. Индивидуальные sgRNA (светло-голубые метки) для каждой мишени, а также праймеры для генотипирования конструировали in silico посредством онлайн-инструмента конструирования (доступен на веб-сайте genome-engineering.org/tools). Векторы экспрессии sgRNA затем клонировали в плазмиду, содержащую Cas9 (PX330), и проверяли посредством секвенирования ДНК. Готовыми плазмидами (pCRISPR) и необязательными матрицами для репарации для облегчения гомологично направленной репарации затем трансфицировали клетки и анализировали на возможность опосредовать целенаправленное расщепление. И наконец, можно осуществлять клональное размножение трансфицированных клеток для получения изогенных клеточных линий с определенными мутациями.Figure 60 shows a timeline and a general description of the experiments. The stages of development, creation, confirmation of the reagent and the propagation of the cell line. Individual sgRNAs (light blue labels) for each target, as well as genotyping primers, were constructed in silico using an online construction tool (available at genome-engineering.org/tools). SgRNA expression vectors were then cloned into a plasmid containing Cas9 (PX330) and verified by DNA sequencing. Prepared plasmids (pCRISPR) and optional repair matrices to facilitate homologous targeted repair were then transfected with cells and analyzed for the ability to mediate targeted cleavage. And finally, it is possible to carry out clonal propagation of transfected cells to obtain isogenic cell lines with certain mutations.

На фигуре 61А-С показан выбор мишени и приготовление реагентов, (а) Для Cas9 S. pyogenes, за мишенями из 20 п.о. (выделены голубым) должна находиться 5'-NGG, которая может встречаться в любой нити геномной ДНК. Рекомендовано использование онлайн-инструмента, описанного в этом протоколе для помощи в выборе мишени (www.genome-engineering.org/tools). (b) Схематическое изображение котрансфекции экспрессионной плазмиды Cas9 (РХ165) и амплифицированной с помощью ПЦР управляемой U6 кассетой экспрессии sgRNA. С применением промотора U6, содержащего матрицу ПЦР и фиксированный прямой праймер (U6 Fwd), sgRNA-кодирующие ДНК могут присоединяться к обратному праймеру U6 (U6 Rev) и синтезироваться в виде удлиненного олигонуклеотида ДНК (Ultramer oligos от IDT). Следует отметить, что направляющая последовательность (голубые N) в U6 Rev является обратно-комплементарной фланкирующей целевой последовательностью 5'-NGG. (с) Схематическое изображение scarless-клонирования направляющей последовательности олигонуклеотидов в плазмиду, содержащую Cas9 и каркас sgRNA (PX330). Направляющие олигонуклеотиды (голубые N) содержат липкие концы для лигирования в пару сайтов BbsI в PS330 с ориентацией на верхнюю и нижнюю нить, совпадающие с данными мишенями генома (т.е. верхний олигонуклеотид находится на 20 п.о. перед последовательностью 5'-NGG в геномной ДНК). Расщепление PX330 BbsI обеспечивает замещение сайтов рестрикции типа IIs (голубой контур) с прямой вставкой отожженных олигонуклеотидов. Стоит отметить, что дополнительный G размещали перед первым основанием направляющей последовательности. Заявители обнаружили, что дополнительный G перед направляющей последовательностью не влияет отрицательно на эффективность целенаправленного воздействия. В случаях, когда выбранная 20-нт направляющая последовательность не начинается с гуанина, дополнительный гуанин обеспечит эффективное транскрибирование sgRNA с помощью промотора U6, для которого предпочтительным является гуанин в первом основании транскрипта.Figure 61A-C shows the selection of the target and preparation of the reagents, (a) For Cas9 S. pyogenes, for targets of 20 bp (highlighted in blue) should be 5'-NGG, which can be found in any strand of genomic DNA. It is recommended that you use the online tool described in this protocol to help you select a target (www.genome-engineering.org/tools). (b) Schematic representation of the co-transfection of the expression plasmid Cas9 (PX165) and PCR-amplified U6 expression cassette sgRNA. Using an U6 promoter containing a PCR matrix and a fixed forward primer (U6 Fwd), sgRNA-coding DNAs can be attached to the reverse primer U6 (U6 Rev) and synthesized as an extended DNA oligonucleotide (Ultramer oligos from IDT). It should be noted that the guide sequence (blue N) in U6 Rev is the back-complementary flanking target sequence of 5'-NGG. (c) Schematic representation of the scarless cloning of the oligonucleotide guide sequence into a plasmid containing Cas9 and sgRNA framework (PX330). Guide oligonucleotides (blue N) contain sticky ends for ligation into a pair of BbsI sites in PS330 with orientation to the upper and lower strands matching the given genome targets (i.e., the upper oligonucleotide is 20 bp in front of the 5'-NGG sequence in genomic DNA). The cleavage of PX330 BbsI allows for the substitution of type IIs restriction sites (blue outline) with direct insertion of annealed oligonucleotides. It is worth noting that an additional G was placed in front of the first base of the guide sequence. Applicants have found that the additional G in front of the guide sequence does not adversely affect the effectiveness of targeted exposure. In cases where the selected 20-nt guide sequence does not start with guanine, additional guanine will efficiently transcribe sgRNA using the U6 promoter, for which guanine is preferred in the first base of the transcript.

На фигуре 62A-D показаны ожидаемые результаты мультиплексного NHEJ. (а) Схематическое изображение анализа с помощью SURVEYOR, использованного для определения процентной доли вставок/делеций. В первую очередь, геномную ДНК из гетерогенной популяции клеток с целенаправленно воздействующей Cas9 амплифицировали с помощью ПЦР. Затем ампликоны медленно повторно отжигали для создания гетеродуплексов. Повторно отожженные гетеродуплексы расщепляли с помощью нуклеазы SURVEYOR, в то время как гомодуплексы оставались интактными. Эффективность опосредованного Cas9 расщепления (% вставок/делеций) рассчитывали на основании фракции расщепленной ДНК, которую определяли с помощью интегральной интенсивности полос в геле. (b) Две sgRNA (оранжевая и голубая метки) конструировали для целенаправленного воздействия на локусы GRIN2B и DYRK1A человека. Анализ в геле с помощью SURVEYOR показывал модификации в обоих локусах в трансфицированных клетках. Цветные стрелки указывали на ожидаемые размеры фрагментов для каждого локуса. (с) Пару sgRNA (светло-голубая и зеленая метки) конструировали для вырезания экзона (темно-голубой) в локусе EMX1 человека. Целевые последовательности и PAM (красный) показаны соответствующими цветами, и сайты расщепления отмечены с помощью красного треугольника. Прогнозируемое место соединения показано ниже. Отдельные клоны выделяли из клеточных популяций, трансфицированных sgRNA, 3, 4 или и тот, и другой также анализировали с помощью ПЦР (OUT Fwd, OUT Rev), отображая делецию ~270 п.о. Показаны типичные клоны без модификации (12/23), с моноаллельными (10/23) и биаллельными (1/23) модификациями. IN Fwd и IN Rev праймеры использовали для отображения событий инверсии (фиг. 6d). (d) Количественный анализ клональных линий с делецией в экзоне EMX1. Две пары sgRNA (sgRNA 3.1, 3.2, фланкирующих слева; sgRNA 4.1, 4.2, фланкирующих справа) использовали для опосредования делеций различных размеров возле экзона EMX1. Трансфицированные клетки клонально выделяли и размножали для анализа генотипирования по событиям делеций и инверсий. Из 105 клонов, для которых проводили скрининг, 51 (49%) и 11 (10%) несли гетерозиготные и гомозиготные делеций, соответственно. Даны приблизительные размеры делеций, поскольку места соединения могут различаться.62A-D show the expected multiplex NHEJ results. (a) Schematic representation of the analysis using SURVEYOR used to determine the percentage of insertions / deletions. First of all, genomic DNA from a heterogeneous population of cells with targeted Cas9 was amplified by PCR. The amplicons were then slowly annealed to create heteroduplexes. Re-annealed heteroduplexes were digested with SURVEYOR nuclease, while homoduplexes remained intact. The efficiency of Cas9-mediated cleavage (% insert / deletion) was calculated based on the fraction of cleaved DNA, which was determined using the integrated intensity of the bands in the gel. (b) Two sgRNAs (orange and blue labels) were designed to target human GRIN2B and DYRK1A loci. SURVEYOR gel analysis showed modifications at both loci in transfected cells. Colored arrows indicated the expected fragment sizes for each locus. (c) A pair of sgRNA (light blue and green tags) was designed to excon exon (dark blue) at the human EMX1 locus. Target sequences and PAM (red) are shown in corresponding colors, and cleavage sites are marked with a red triangle. The predicted junction is shown below. Individual clones were isolated from cell populations transfected with sgRNA, 3, 4, or both were also analyzed by PCR (OUT Fwd, OUT Rev), displaying a deletion of ~ 270 bp Typical clones without modification (12/23), with mono-allelic (10/23) and biallelic (1/23) modifications are shown. IN Fwd and IN Rev primers were used to display inversion events (Fig. 6d). (d) Quantification of clonal lines with deletion in exon EMX1. Two sgRNA pairs (sgRNA 3.1, 3.2 flanking on the left; sgRNA 4.1, 4.2 flanking on the right) were used to mediate deletions of various sizes near exon EMX1. Transfected cells were cloned and propagated for genotyping analysis by deletion and inversion events. Of the 105 clones that were screened, 51 (49%) and 11 (10%) carried heterozygous and homozygous deletions, respectively. The approximate sizes of the deletions are given, since the junction may vary.

На фигуре 63А-С показано применение ssODN и вектора для целенаправленного воздействия для опосредования HR и с Cas9 дикого типа, и с мутантной никазой Cas9 в клетках HEK293FT и HUES9 с эффективностями в диапазоне от 1,0 до 27%.63A-C illustrate the use of ssODN and targeted exposure vector to mediate HR with both wild-type Cas9 and Cas9 mutant nickase in HEK293FT and HUES9 cells with efficiencies ranging from 1.0 to 27%.

На фигуре 64 показано схематическое изображение способа на основе ПЦР для быстрого и эффективного целенаправленного воздействия CRISPR в клетках млекопитающих. Плазмиду, содержащую промотор U6 РНК-полимеразы III человека, амплифицировали с использованием ПЦР, применяя U6-специфичный прямой праймер и обратный праймер, несущий обратную комплементарную нить части промотора U6, каркас sgRNA(+85) с направляющей последовательностью и 7 Т-нуклеотидов для терминации транскрипции. Полученный ПЦР-продукт очищали и доставляли совместно с плазмидой, несущей Cas9, управляемый промотором CBh.The figure 64 shows a schematic representation of a PCR-based method for fast and effective targeted exposure to CRISPR in mammalian cells. A plasmid containing the human U6 RNA polymerase III promoter was amplified using PCR using a U6 specific forward primer and a reverse primer carrying the reverse complementary strand of the U6 promoter, sgRNA scaffold (+85) with a guide sequence and 7 T nucleotides for termination transcription. The resulting PCR product was purified and delivered together with a plasmid carrying Cas9 driven by the CBh promoter.

На фигуре 65 показаны результаты использования набора для обнаружения мутаций SURVEYOR от Transgenomics для каждой направляющей РНК и соответствующие контроли. Положительный результат анализа с помощью SURVEYOR представляет собой одну большую полосу, соответствующую геномной ПЦР, и две полосы поменьше, которые являются продуктами нуклеазы SURVEYOR, производящей двухцепочечный разрыв в сайте мутации. Каждую направляющую РНК оценивали в клеточной линии мыши, Neuro-N2a, с помощью липосомальной неустойчивой котрансфекции hSpCas9. Через 72 часа после трансфекции геномную ДНК очищали с применением QuickExtract DNA от Epicentre. ПЦР выполняли для амплификации локуса, представляющего интерес.Figure 65 shows the results of using the Transgenomics SURVEYOR mutation detection kit for each RNA guide and the corresponding controls. A positive analysis result using SURVEYOR represents one large band corresponding to genomic PCR and two smaller bands, which are products of SURVEYOR nuclease, which produces a double-stranded break at the mutation site. Each RNA guide was evaluated in a mouse cell line, Neuro-N2a, using liposomal unstable cotransfection of hSpCas9. 72 hours after transfection, genomic DNA was purified using Epicentre QuickExtract DNA. PCR was performed to amplify the locus of interest.

На фигуре 66 показаны результаты анализа с помощью Surveyor для 38 живых детенышей (дорожки 1-38), 1 мертвого детеныша (дорожка 39) и 1 детеныша дикого типа для сравнения (дорожка 40). Детенышам 1-19 инъецировали gRNA Chd8.2, а детенышам 20-38 инъецировали gRNA Chd8.3. Из 38 живых детенышей 13 были положительными по мутации. У одного мертвого детеныша также была мутация. В образце дикого типа не было обнаружено мутации. ПЦР секвенирование генома соответствовало данным анализа с помощью SURVEYOR.Figure 66 shows the results of a Surveyor analysis for 38 live calves (lanes 1-38), 1 dead calf (lane 39), and 1 wild-type calf for comparison (lane 40). Cubs 1-19 were injected with gdNA Chd8.2, and pups 20-38 were injected with gRNA Chd8.3. Of the 38 live pups, 13 were positive for mutation. One dead calf also had a mutation. No mutation was detected in the wild-type sample. PCR genome sequencing was consistent with analysis using SURVEYOR.

На фигуре 67 показана структура различных конструкций Cas9-NLS. Все Cas9 представляли собой кодон-оптимизированный для человека вариант Sp Cas9. Последовательности NLS связаны с геном cas9 либо на N-конце, либо на С-конце. Все варианты Cas9 с различными структурами NLS клонировали в вектор, содержащий остов, так что он управлялся промотором EF1a. В этом же векторе находилась химерная РНК, целенаправленно воздействующая на локус EMX1 человека, управляемый промотором U6, формирующим вместе с ней двухкомпонентную систему.Figure 67 shows the structure of various Cas9-NLS designs. All Cas9s were a human codon-optimized version of Sp Cas9. NLS sequences are linked to the cas9 gene at either the N-terminus or the C-terminus. All Cas9 variants with different NLS structures were cloned into a vector containing the backbone, so that it was driven by the EF1a promoter. In the same vector, there was a chimeric RNA that deliberately acts on the human EMX1 locus, driven by the U6 promoter, which forms a two-component system with it.

На фигуре 68 показана эффективность расщепления генома, индуцированная вариантами Cas9, несущими различные структуры NLS. Процентная доля указывает часть геномной ДНК EMX1 человека, которая подвергалась расщеплению каждой конструкцией. Все эксперименты получены из 3 биологических повторностей. n=3, ошибка означает стандартную ошибку среднего.Figure 68 shows the genome cleavage efficiency induced by Cas9 variants carrying various NLS structures. The percentage indicates the portion of the human genomic EMX1 DNA that was digested by each construct. All experiments were obtained from 3 biological replicates. n = 3, error means standard error of the mean.

На фигуре 69А показана структура CRISPR-TF (фактора транскрипции), обладающего функцией активации транскрипции. Химерная РНК экспрессируется с помощью промотора U6, а кодон-оптимизированный для человека вариант двойного мутанта белка Cas9 (hSpCas9m), функционально связанного с трехкомпонентной NLS и функциональным доменом VP64, экспрессируется с помощью промотора EF1a. Двойные мутации, D10A и Н840А, делают белок Cas9 неспособным вносить какое-либо расщепление, но поддерживают его способность связываться с целевой ДНК при направлении химерной РНК.69A shows the structure of CRISPR-TF (transcription factor) having a transcription activation function. Chimeric RNA is expressed using the U6 promoter, and the codon-optimized variant of the Cas9 double mutant protein (hSpCas9m), functionally linked to the three-component NLS and VP64 functional domain, is expressed using the EF1a promoter. The double mutations, D10A and H840A, make the Cas9 protein incapable of introducing any cleavage, but support its ability to bind to the target DNA in the direction of chimeric RNA.

На фигуре 69B показана активация транскрипции гена SOX2 человека системой CRISPR-TF (химерная РНК и слитый белок Cas9-NLS-VP64). Клетки 293FT трансфицировали плазмидами, несущей два компонента: (1) управляемые U6 различные химерные РНК, целенаправленно воздействующие на последовательности из 20 п.о. в локусе генома человека SOX2 или рядом с ним, и (2) управляемый EF1 hSpCas9m (двойной мутант) - слитый белок NLS-VP64. Через 96 часа после трансфекции клетки 293FT собирали и измеряли уровень активации посредством индукции экспрессии мРНК с применением анализа qRT-PCR. Все уровни экспрессии нормированы по сравнению с контрольной группой (серьга столбец), представляющей результаты клеток, трансфицированных плазмидой с остовом CRISPR-TF без химерной РНК. Зонды qRT-PCR использовали для выявления мРНК SOX2 при анализе экспрессии генов Taqman Human (Life Technologies). Представлены данные всех экспериментов 3 биологических повторностей, n=3, планки погрешностей показывают стандартную ошибку среднего.69B shows the activation of transcription of the human SOX2 gene by the CRISPR-TF system (chimeric RNA and Cas9-NLS-VP64 fusion protein). 293FT cells were transfected with plasmids carrying two components: (1) U6-driven different chimeric RNAs that specifically target 20 bp sequences. at or near the locus of the human genome SOX2, and (2) driven by EF1 hSpCas9m (double mutant), an NLS-VP64 fusion protein. 96 hours after transfection, 293FT cells were harvested and the level of activation was measured by induction of mRNA expression using qRT-PCR analysis. All expression levels are normalized compared to the control group (earring column), which represents the results of cells transfected with a CRISPR-TF plasmid without a chimeric RNA. QRT-PCR probes were used to detect SOX2 mRNA in the analysis of Taqman Human gene expression (Life Technologies). The data of all experiments of 3 biological replicates, n = 3, are presented; error bars show the standard error of the mean.

На фигуре 70 изображена оптимизация строения NLS для SpCas9.Figure 70 shows the optimization of the NLS structure for SpCas9.

На фигуре 71 показана диаграмма "квантиль-квантиль" для последовательностей NGGNN.71 shows a quantile-quantile diagram for NGGNN sequences.

На фигуре 72 показана гистограмма плотности данных с подобранным нормальным распределением (черная линия) и квантилем 0,99 (пунктирная линия).Figure 72 shows a histogram of data density with a matched normal distribution (black line) and a quantile of 0.99 (dashed line).

На фигуре 73А-С показана РНК-направляемая репрессия экспрессии bgaA с помощью dgRNA::cas9**. a. Белок Cas9 связывается с tracrRNA и с предшественником РНК CRISPR,. который подвергается процессингу РНКазой III с образованием crRNA. crRNA управляет связыванием Cas9 с промотором bgaA и репрессирует транскрипцию. b. Представлены мишени, использованные для направления Cas9** к промотору bgaA. Предполагаемые кодоны -35, -10, а также стартовый ко дон bgaA представлены жирным шрифтом, c. Бета-галактозидазная активность как мера в анализе Миллера при отсутствии целенаправленного воздействия и для четырех различных мишеней.Figure 73A-C shows RNA-directed repression of bgaA expression using dgRNA :: cas9 **. a. The Cas9 protein binds to tracrRNA and the CRISPR RNA precursor. which is processed by RNase III to form crRNA. crRNA controls the binding of Cas9 to the bgaA promoter and represses transcription. b. The targets used to direct Cas9 ** to the bgaA promoter are presented. Estimated codons -35, -10, as well as the starting bgaA don donor, are shown in bold, c. Beta-galactosidase activity as a measure in Miller’s analysis in the absence of targeted exposure and for four different targets.

На фигуре 74А-Е показана характеристика опосредованной Cas9** репрессии, а. Ген gfpmut2 и его промотор, включающий сигналы -35 и -10, представлены совместно с положением различных целевых сайтов, использованных в данном исследовании. b. Относительная флюоресценция при целенаправленном воздействии на кодирующую нить, с. Относительная флюоресценция при целенаправленном воздействии на некодирующую нить. d. Нозерн-блоттинг с зондами В477 и В478 РНК, экстрагированной из Т5, Т10, В10 или контрольного штамма без мишени, e. Эффект увеличения количества мутаций на 5'-конце crRNA B1, Т5 и В10.Figure 74A-E shows a characteristic of Cas9 ** mediated repression, a. The gfpmut2 gene and its promoter, including the -35 and -10 signals, are presented together with the position of the various target sites used in this study. b. Relative fluorescence with a targeted effect on the coding thread, p. Relative fluorescence with a targeted effect on a non-coding thread. d. Northern blot with probes B477 and B478 of RNA extracted from T5, T10, B10 or control strain without target, e. The effect of increasing the number of mutations at the 5'-end of crRNA B1, T5 and B10.

Фигуры приведены в данном документе только в целях иллюстрации, и они не обязательно должны быть изображены в масштабе.The figures in this document are for illustrative purposes only and do not need to be drawn to scale.

Подробное описание изобретенияDETAILED DESCRIPTION OF THE INVENTION

Выражения "полинуклеотид", "нуклеотид", "нуклеотидная последовательность", "нуклеиновая кислота" и "олигонуклеотид" используют взаимозаменяемо. Они обозначают полимерную форму нуклеотидов любой длины, как дезоксирибонуклеотидов, так и рибонуклеотидов или их аналогов. Полинуклеотиды могут обладать любой пространственной структурой и могут выполнять любую функцию, известную или неизвестную. Неограничивающими примерами полинуклеотидов являются следующие: кодирующие или некодирующе участки гена или фрагмента гена, локусы (локус), определенные в результате анализа сцепления, экзоны, интроны, информационная РНК (иРНК), транспортная РНК, рибосомная РНК, короткая интерферирующая РНК (siRNA), короткая шпилечная РНК (shRNA), микроРНК (miRNA), рибозимы, кДНК, рекомбинантные полинуклеотиды, разветвленные полинуклеотиды, плазмиды, векторы, выделенные ДНК любой последовательности, выделенные РНК любой последовательности, зонды для нуклеиновых кислот и праймеры. Полинуклеотид может содержать один или несколько модифицированных нуклеотидов, как, например, метилированные нуклеотиды и аналоги нуклеотидов. При наличии, модификации в нуклеотидную структуру могут быть внесены до или после сборки полимера. Последовательность нуклеотидов может прерываться отличными от нуклеотидов компонентами. Полинуклеотид можно дополнительно модифицировать после полимеризации, как, например, путем конъюгации с компонентом для мечения.The expressions "polynucleotide", "nucleotide", "nucleotide sequence", "nucleic acid" and "oligonucleotide" are used interchangeably. They denote the polymeric form of nucleotides of any length, both deoxyribonucleotides and ribonucleotides or their analogues. Polynucleotides can have any spatial structure and can perform any function, known or unknown. Non-limiting examples of polynucleotides are: coding or non-coding regions of a gene or gene fragment, loci (locus) determined by linkage analysis, exons, introns, messenger RNA (mRNA), transport RNA, ribosomal RNA, short interfering RNA (siRNA), short hairpin RNA (shRNA), miRNA (miRNA), ribozymes, cDNA, recombinant polynucleotides, branched polynucleotides, plasmids, vectors, isolated DNA of any sequence, isolated RNA of any sequence, nucleic probes islot and primers. A polynucleotide may contain one or more modified nucleotides, such as, for example, methylated nucleotides and nucleotide analogs. If present, modifications to the nucleotide structure may be made before or after polymer assembly. The nucleotide sequence may be interrupted by components other than nucleotides. The polynucleotide can be further modified after polymerization, such as, for example, by conjugation with a labeling component.

В аспектах настоящего изобретения выражения "химерная РНК", "химерная направляющая РНК", "направляющая РНК", "одиночная направляющая РНК" и "синтетическая направляющая РНК" используют взаимозаменяемо, и они обозначают полинуклеотидную последовательность, содержащую направляющую последовательность, tracr-последовательность и парную tracr-последовательность. Выражение "направляющая последовательность" обозначает последовательность из приблизительно 20 п.о. в пределах направляющей РНК, которая определяет целевой сайт, и ее можно использовать взаимозаменяемо с выражениями "гид" или "спейсер". Выражение "парная tracr-последовательность" также можно использовать взаимозаменяемо с выражением "прямой(ые) повтор(ы)".In aspects of the present invention, the expressions “chimeric RNA”, “chimeric RNA guide”, “RNA guide”, “single RNA guide” and “synthetic RNA guide” are used interchangeably and denote a polynucleotide sequence containing a guide sequence, a tracr sequence and a pair tracr sequence. The expression "guide sequence" means a sequence of approximately 20 bp within the RNA guide that defines the target site, and it can be used interchangeably with the terms “guide” or “spacer”. The expression “paired tracr sequence” can also be used interchangeably with the expression “direct repeat (s)”.

Используемое в данном документе выражение "дикий тип" является выражением из данной области, понятным специалисту в данной области, и означает типичную форму организма, штамма, гена или характеристики, которые встречаются в природе в отличие от мутантных или вариантных форм.Used in this document, the expression "wild type" is an expression from this field, understandable to a person skilled in the art, and means a typical form of an organism, strain, gene or characteristics that are found in nature in contrast to mutant or variant forms.

Используемое в данном документе выражение "вариант" следует понимать как означающее проявление качеств, которые характеризуются паттерном, который отличается от такового, встречающегося в природе.Used in this document, the expression "option" should be understood as meaning a manifestation of qualities that are characterized by a pattern that differs from that found in nature.

Выражение "не встречающийся в природе" или "сконструированный" используют взаимозаменяемо, и оно указывает на вмешательство человека. Выражения, в тех случаях, когда они касаются молекул нуклеиновых кислот или полипептидов, означают, что молекула нуклеиновой кислоты или полипептид по меньшей мере практически не содержат по меньшей мере один отличный компонент, с которым они естественным образом связаны в природе и встречаются в природе.The expression "not found in nature" or "constructed" is used interchangeably, and it indicates human intervention. Expressions, when they relate to nucleic acid molecules or polypeptides, mean that the nucleic acid molecule or polypeptide at least practically does not contain at least one distinct component with which they are naturally associated in nature and found in nature.

"Комплементарность" означает способность нуклеиновой кислоты образовывать водородную(ые) связь(и) с другой последовательностью нуклеиновой кислоты при помощи либо традиционного спаривания оснований по Уотсону-Крику, либо других нетрадиционных типов. Процент комплементарности показывает процентную долю остатков в молекуле нуклеиновой кислоты, которые могут образовывать водородные связи (к примеру, образование пар по Уотсону-Крику) со второй последовательностью нуклеиновой кислоты (к примеру, при этом 5, 6, 7, 8, 9, 10 из 10 будут на 50%, 60%, 70%, 80%, 90% и 100% комплементарны). "Точная комплементарность" означает, что все граничащие остатки последовательности нуклеиновой кислоты будут связаны водородными связями с тем же количеством граничащих остатков во второй последовательности нуклеиновой кислоты. Выражение "практически комплементарный", используемое в данном документе, означает степень комплементарности, которая составляет по меньшей мере 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% или 100% в пределах участка из 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 или более нуклеотидов, или относится к двум нуклеиновым кислотам, которые гибиридизируются при жестких условиях.“Complementarity” means the ability of a nucleic acid to form hydrogen (s) linkage (s) with another nucleic acid sequence using either the traditional Watson-Crick base pairing or other non-traditional types. The percent complementarity shows the percentage of residues in the nucleic acid molecule that can form hydrogen bonds (for example, the formation of Watson-Crick pairs) with the second nucleic acid sequence (for example, 5, 6, 7, 8, 9, 10 of 10 will be 50%, 60%, 70%, 80%, 90% and 100% complementary). “Exact complementarity” means that all adjacent residues of the nucleic acid sequence will be hydrogen bonded to the same number of adjacent residues in the second nucleic acid sequence. The expression “substantially complementary” as used herein means a degree of complementarity that is at least 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% or 100% within the area of 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40 , 45, 50 or more nucleotides, or refers to two nucleic acids that hybridize under stringent conditions.

Используемые в данном документе "жесткие условия" в отношении гибридизации означают условия, при которых нуклеиновая кислота с комплементарностью к целевой последовательности преимущественно гибридизируется с целевой последовательностью и практически не гибридизируется с нецелевыми последовательностями. Жесткие условия, как правило, являются зависимыми от последовательности и изменяются в зависимости от ряда факторов. В общем, чем длиннее последовательность, тем выше температура, при которой последовательность специфично гибридизируется с целевой последовательностью. Неограничивающие примеры жестких условий описаны подробно в Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, N.Y.As used herein, “stringent conditions” with respect to hybridization mean conditions under which a nucleic acid that is complementary to the target sequence preferentially hybridizes to the target sequence and practically does not hybridize to non-target sequences. Severe conditions, as a rule, are sequence dependent and vary depending on a number of factors. In general, the longer the sequence, the higher the temperature at which the sequence specifically hybridizes to the target sequence. Non-limiting examples of stringent conditions are described in detail in Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, N.Y.

"Гибридизация" означает реакцию, при которой один или несколько полинуклеотидов реагируют с образованием комплекса, который стабилизируется посредством образования водородных связей между основаниями нуклеотидных остатков. Образование водородных связей может происходить по принципу образования пар по Уотсону-Крику, Хугстиновского связывания или любым другим специфичным к последовательности образом. Комплекс может содержать две нити, образующие дуплексную структуру, три или более нитей, образующих многонитевой комплекс, одиночную самогибридизирующуюся нить или любую их комбинацию. Реакция гибридизации может представлять собой стадию в более обширном способе, такую как начальная стадия ПЦР или расщепление полинуклеотида при помощи фермента. Последовательность, способную гибридизироваться с данной последовательностью, называют "комплементарной последовательностью" данной последовательности."Hybridization" means a reaction in which one or more polynucleotides react to form a complex that is stabilized by the formation of hydrogen bonds between the bases of the nucleotide residues. The formation of hydrogen bonds can occur according to the principle of pairing according to Watson-Crick, the Hugstein binding, or in any other sequence-specific manner. The complex may contain two strands forming a duplex structure, three or more strands forming a multi-strand complex, a single self-hybridizing strand, or any combination thereof. The hybridization reaction may be a step in a broader method, such as an initial PCR step or cleavage of a polynucleotide by an enzyme. A sequence capable of hybridizing with a given sequence is called a "complementary sequence" of this sequence.

Используемое в данном документе выражение "экспрессия" означает процесс, при котором полинуклеотид транскрибируется с ДНК-матрицы (как, например, в иРНК или другой РНК-транскрипт), и/или способ, при помощи которого транскрибированная иРНК далее транслируется в пептиды, полипептиды или белки. Транскрипты и закодированные полипептиды можно в совокупности называть "продуктом гена". Если полинуклеотид получен из геномной ДНК, то экспрессия может включать сплайсинг иРНК в эукариотической клетке.As used herein, the expression “expression” means a process in which a polynucleotide is transcribed from a DNA template (such as an mRNA or other RNA transcript), and / or a method by which a transcribed mRNA is further translated into peptides, polypeptides or squirrels. Transcripts and encoded polypeptides can collectively be called a "gene product." If the polynucleotide is derived from genomic DNA, expression may include splicing mRNA in a eukaryotic cell.

Выражения "полипептид", "пептид" и "белок" используют взаимозаменяемо в данном документе для обозначения полимеров из аминокислот любой длины. Полимер может быть линейным или разветвленным, он может содержать модифицированные аминокислоты, и его структура может прерываться отличными от аминокислот компонентами. Выражения также охватывают полимер из аминокислот, который был модифицирован; например, образованием дисульфидных связей, гликозилированием, липидизацией, ацетилированием, фосфорилированием или любой другой манипуляцией, такой как соединение с компонентом для мечения. Используемое в данном документе выражение "аминокислота" включает природные и/или неприродные или синтетические аминокислоты, в том числе глицин и как D-, так и L-оптические изомеры, и аналоги аминокислот, и пептидомиметики.The expressions "polypeptide", "peptide" and "protein" are used interchangeably herein to refer to polymers of amino acids of any length. The polymer may be linear or branched, it may contain modified amino acids, and its structure may be interrupted by components other than amino acids. Expressions also encompass a polymer of amino acids that has been modified; for example, the formation of disulfide bonds, glycosylation, lipidization, acetylation, phosphorylation or any other manipulation, such as the connection with the component for labeling. As used herein, the expression “amino acid” includes natural and / or unnatural or synthetic amino acids, including glycine and both D- and L-optical isomers, amino acid analogs, and peptidomimetics.

Выражения "субъект", "индивидуум" и "пациент" используют взаимозаменяемо в данном документе для обозначения позвоночного, предпочтительно млекопитающего, более предпочтительно человека. Млекопитающие включают, без ограничения, мышей, обезьян, людей, сельскохозяйственных животных, животных для спорта и домашних животных. Также охватываются ткани, клетки и их потомство биологического организма, полученные in vivo или культивированные in vitro.The terms “subject,” “individual,” and “patient” are used interchangeably herein to refer to a vertebrate, preferably a mammal, more preferably a human. Mammals include, without limitation, mice, monkeys, humans, farm animals, animals for sport, and domestic animals. Also covered are tissues, cells and their offspring of a biological organism obtained in vivo or cultured in vitro.

Выражения "терапевтическое средство", "оказывающее терапевтический эффект средство" или "средство для лечения" используют взаимозаменяемо, и они означают молекулу или соединение, которые оказывают некоторое благоприятное воздействие при введении субъекту. Благоприятное воздействие включает осуществление диагностических определений; облегчение заболевания, симптома, нарушения или патологического состояния; ослабление или предупреждение начала проявления заболевания, симптома, нарушения или состояния; а также общее противодействие заболеванию, симптому, нарушению или патологическому состоянию.The terms “therapeutic agent”, “therapeutic agent” or “treatment agent” are used interchangeably, and they mean a molecule or compound that has some beneficial effect when administered to a subject. Beneficial effects include the implementation of diagnostic determinations; relief of a disease, symptom, disorder or pathological condition; weakening or preventing the onset of a disease, symptom, disorder or condition; as well as general resistance to disease, symptom, disorder or pathological condition.

Используемые в данном документе выражения "лечение", или "осуществление лечения", или "временное ослабление", или "облегчение" используют взаимозаменяемо. Эти выражения означают подход для получения благоприятных или желательных результатов, в том числе, без ограничения, терапевтического эффекта и/или профилактического эффекта. Под терапевтическим эффектом понимают любые терапевтически значимые улучшение или действие в отношении одного или нескольких заболеваний, состояний или симптомов при лечении. Для профилактического эффекта композиции можно вводить субъекту с риском развития конкретного заболевания, состояния или симптома или субъекту, который сообщает об одном или нескольких физиологических симптомах заболевания, даже если заболевание, состояние или симптом могли еще не проявиться.As used herein, the terms “treatment,” or “treatment” or “temporary relaxation” or “relief” are used interchangeably. These expressions mean an approach for obtaining favorable or desirable results, including, without limitation, therapeutic effect and / or prophylactic effect. The therapeutic effect is understood to mean any therapeutically significant improvement or effect in relation to one or more diseases, conditions or symptoms in the treatment. For the prophylactic effect, the compositions can be administered to a subject at risk of developing a particular disease, condition or symptom, or to a subject who reports one or more physiological symptoms of the disease, even if the disease, condition or symptom may not yet have manifested.

Выражение "эффективное количество" или "терапевтически эффективное количество" означает количество средства, которого достаточно для обеспечения благоприятных или желательных результатов. Терапевтически эффективное количество может изменяться в зависимости от одного или нескольких из: субъекта и болезненного состояния, которые подлежат лечению, веса и возраста субъекта, тяжести болезненного состояния, способа введения и подобного, что специалист в данной области легко может определить. Выражение также применимо к дозе, с помощью которой можно получить изображение для определения любым одним из способов визуализации, описанных в данном документе. Конкретная доза может изменяться в зависимости от одного или нескольких из: конкретного выбранного средства, режима дозирования, которому следуют, того, вводят ли его в комбинации с другими средствами, выбора времени введения, визуализируемой ткани и физической системы доставки, в которой оно заключено.The expression “effective amount” or “therapeutically effective amount” means an amount of an agent that is sufficient to provide favorable or desired results. A therapeutically effective amount may vary depending on one or more of: the subject and the disease state to be treated, the weight and age of the subject, the severity of the disease state, route of administration and the like, which one skilled in the art can easily determine. The expression also applies to the dose by which an image can be obtained for determination by any one of the visualization methods described herein. The specific dose may vary depending on one or more of: the particular agent chosen, the dosage regimen to be followed, whether it is administered in combination with other agents, the timing of administration, the visualized tissue, and the physical delivery system it is enclosed in.

Практическое применение настоящего изобретения предусматривает, если не указано иное, традиционные методики иммунологии, биохимии, химии, молекулярной биологии, микробиологии, клеточной биологии, геномики и технологию рекомбинантной ДНК, которые находятся в пределах квалификации специалиста в данной области. См. Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (1987)); серия METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL и ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987)).The practical application of the present invention provides, unless otherwise indicated, traditional methods of immunology, biochemistry, chemistry, molecular biology, microbiology, cell biology, genomics and recombinant DNA technology, which are within the skill of a person skilled in this field. See Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. Eds., (1987)); METHODS IN ENZYMOLOGY series (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL, and ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987)).

Некоторые аспекты настоящего изобретения касаются векторных систем, содержащих один или несколько векторов, или векторов как таковых. Векторы могут быть разработаны для экспрессии транскриптов CRISPR (к примеру, транскриптов нуклеиновых кислот, белков или ферментов) в прокариотических или эукариотических клетках. Например, транскрипты CRISPR могут экспрессироваться в бактериальных клетках, как, например, Escherichia coli, клетках насекомых (с использованием бакуловирусных векторов экспрессии), клетках дрожжей или клетках млекопитающих. Подходящие клетки-хозяева дополнительно рассматриваются в Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). В качестве альтернативы рекомбинантный вектор экспрессии может транскрибироваться и транслироваться in vitro, например, при помощи регуляторных последовательностей промотора T7 и полимеразы T7.Some aspects of the present invention relate to vector systems containing one or more vectors, or vectors as such. Vectors can be designed to express CRISPR transcripts (e.g., transcripts of nucleic acids, proteins or enzymes) in prokaryotic or eukaryotic cells. For example, CRISPR transcripts can be expressed in bacterial cells, such as, for example, Escherichia coli, insect cells (using baculovirus expression vectors), yeast cells, or mammalian cells. Suitable host cells are further discussed in Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Alternatively, the recombinant expression vector may be transcribed and translated in vitro, for example, using the regulatory sequences of the T7 promoter and T7 polymerase.

Векторы можно вводить и размножать в прокариоте. В некоторых вариантах осуществления прокариота используют для амплификации копий вектора, который предполагается вводить в эукариотическую клетку, или в качестве промежуточного вектора при получении вектора, который предполагается вводить в эукариотическую клетку (к примеру, путем амплификации плазмиды как части системы упаковки вирусного вектора). В некоторых вариантах осуществления прокариота используют для амплификации копий вектора и экспрессии одной или нескольких нуклеиновых кислот, как, например, для обеспечения источника одного или нескольких белков для доставки в клетку-хозяина или организм-хозяин. Экспрессию белков в прокариотах наиболее часто осуществляют в Escherichia coli с векторами, содержащими конститутивные или индуцибельные промоторы, управляющие экспрессией либо слитых белков, либо отличных от слитых белков. Слитые векторы добавляют некоторое количество аминокислот к белку, закодированному в них, как, например, к амино-концу рекомбинантного белка. Такие слитые векторы могут служить для одной или нескольких целей, как например: (i) для повышения экспрессии рекомбинантного белка; (ii) для повышения растворимости рекомбинантного белка и (iii) для содействия очистке рекомбинантного белка путем функционирования в качестве лиганда при аффинной очистке. Часто в слитые векторы экспрессии сайт протеолитического расщепления вводят в место соединения фрагмента слияния и рекомбинантного белка для облегчения отделения рекомбинантного белка от фрагмента слияния после очистки слитого белка. Такие ферменты и их когнатные распознающие последовательности включают фактор Xa, тромбин и энтерокиназу. Иллюстративные слитые векторы экспрессии включают pGEX (Pharmacia Biotech Inc; Smith and Johnson, 1988. Gene 67: 31-40), pMAL (New England Biolabs, Беверли, Массачусетс) и pRIT5 (Pharmacia, Пискатауэй, Нью-Джерси), в которых глутатион-8-трансфераза (GST), мальтоза-связьшающий белок E или белок A, соответственно, слиты с целевым рекомбинантным белком.Vectors can be introduced and propagated in prokaryote. In some embodiments, a prokaryote is used to amplify copies of a vector that is intended to be introduced into a eukaryotic cell, or as an intermediate vector for the preparation of a vector that is intended to be introduced into a eukaryotic cell (for example, by amplifying a plasmid as part of a viral vector packaging system). In some embodiments, a prokaryote is used to amplify copies of a vector and express one or more nucleic acids, such as, for example, to provide a source of one or more proteins for delivery to a host cell or host organism. The expression of proteins in prokaryotes is most often carried out in Escherichia coli with vectors containing constitutive or inducible promoters that control the expression of either fusion proteins or other than fusion proteins. Fusion vectors add a certain amount of amino acids to the protein encoded therein, such as, for example, to the amino terminus of a recombinant protein. Such fusion vectors may serve one or more purposes, such as: (i) to enhance expression of a recombinant protein; (ii) to increase the solubility of the recombinant protein; and (iii) to facilitate the purification of the recombinant protein by functioning as a ligand in affinity purification. Often, the proteolytic cleavage site is introduced into the fusion expression vectors at the junction of the fusion fragment and the recombinant protein to facilitate separation of the recombinant protein from the fusion fragment after purification of the fusion protein. Such enzymes and their cognate recognition sequences include factor Xa, thrombin and enterokinase. Illustrative fusion expression vectors include pGEX (Pharmacia Biotech Inc; Smith and Johnson, 1988. Gene 67: 31-40), pMAL (New England Biolabs, Beverly, Mass.) And pRIT5 (Pharmacia, Piscataway, NJ) in which glutathione -8-transferase (GST), maltose-binding protein E or protein A, respectively, are fused to the target recombinant protein.

Примеры подходящих индуцибельных не являющихся слитыми векторов экспрессии Е. coli включают pTrc (Amrann et al., (1988) Gene 69: 301-315) и pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89).Examples of suitable inducible non-fusion expression vectors of E. coli include pTrc (Amrann et al., (1988) Gene 69: 301-315) and pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89).

В некоторых вариантах осуществления вектор является дрожжевым вектором экспрессии. Примеры векторов для экспрессии в дрожжах Saccharomyces cerivisae включают pYepSecl (Baldari, et al., 1987. EMBO J. 6: 229-234), pMFa (Kuijan and Herskowitz, 1982. Cell 30: 933-943), pJRY88 (Schultz et al., 1987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, Сан-Диего, Калифорния) и picZ (InVitrogen Corp, Сан-Диего, Калифорния).In some embodiments, the vector is a yeast expression vector. Examples of vectors for expression in yeast Saccharomyces cerivisae include pYepSecl (Baldari, et al., 1987. EMBO J. 6: 229-234), pMFa (Kuijan and Herskowitz, 1982. Cell 30: 933-943), pJRY88 (Schultz et al. ., 1987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, San Diego, California) and picZ (InVitrogen Corp, San Diego, California).

В некоторых вариантах осуществления вектор управляет экспрессией белка в клетках насекомых с помощью бакуловирусных векторов экспрессии. Бакуловирусные векторы, доступные для экспрессии белков в культивируемых клетках насекомых (к примеру, клетках SF9), включают группу pAc (Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165) и группу pVL (Lucklow and Summers, 1989. Virology 170: 31-39).In some embodiments, the vector controls the expression of the protein in insect cells using baculovirus expression vectors. Baculovirus vectors available for protein expression in cultured insect cells (e.g., SF9 cells) include the pAc group (Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165) and the pVL group (Lucklow and Summers 1989. Virology 170: 31-39).

В некоторых вариантах осуществления вектор способен управлять экспрессией одной или нескольких последовательностей в клетках млекопитающих при помощи вектора экспрессии млекопитающих. Примеры векторов экспрессии млекопитающих включают pCDM8 (Seed, 1987. Nature 329: 840) и pMT2PC (Kaufman, et al., 1987. EMBO J. 6: 187-195). При использовании клеток млекопитающих функции контроля вектора экспрессии, как правило, обеспечиваются одним или несколькими регуляторными элементами. Например, широко используемые промоторы получают из вируса полиомы, аденовируса 2, цитомегаловируса, вируса обезьян 40 и других, раскрыты в данном документе и известны в уровне техники. Что качается других подходящих систем экспрессии как для прокариотических, так и для эукариотических клеток, см., к примеру, главы 16 и 17 в Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989.In some embodiments, a vector is capable of controlling the expression of one or more sequences in mammalian cells using a mammalian expression vector. Examples of mammalian expression vectors include pCDM8 (Seed, 1987. Nature 329: 840) and pMT2PC (Kaufman, et al., 1987. EMBO J. 6: 187-195). When using mammalian cells, expression vector control functions are typically provided by one or more regulatory elements. For example, widely used promoters are derived from polyoma virus, adenovirus 2, cytomegalovirus, monkey virus 40, and others, are disclosed herein and are known in the art. For other suitable expression systems for both prokaryotic and eukaryotic cells, see, for example, chapters 16 and 17 in Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989.

В некоторых вариантах осуществления рекомбинантные векторы экспрессии млекопитающих способны управлять экспрессией нуклеиновой кислоты преимущественно в определенном типе клеток (к примеру, тканеспецифичные регуляторные элементы используют для экспрессии нуклеиновой кислоты). Тканеспецифичные регуляторные элементы известны в уровне техники. Неограничивающие примеры подходящих тканеспецифичных промоторов включают промотор гена альбумина (печень-специфичный; Pinkert, et al., 1987. Genes Dev. 1: 268-277), специфичные к лимфоидной ткани промоторы (Calame and Eaton, 1988. Adv. Immunol. 43: 235-275), в частности, промоторы рецепторов Т-клеток (Winoto and Baltimore, 1989. EMBO J. 8: 729-733) и иммуноглобулины (Baneiji, et al., 1983. Cell 33: 729-740; Queen and Baltimore, 1983. Cell 33: 741-748), нейрон-специфичные промоторы (к примеру, промотор гена нейрофиламента; Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477), специфичные к клеткам поджелудочной железы промоторы (Edlund, et al., 1985. Science 230: 912-916) и специфичные к клеткам молочной железы промоторы (к примеру, промотор молочной сыворотки; патент США №4873316 и публикация европейской заявки №264166). Регулируемые стадией развития промоторы также охвачены, к примеру, промоторы генов hox мыши (Kessel and Gruss, 1990. Science 249: 374-379) и промотор гена α-фетопротеина (Campes and Tilghman, 1989. Genes Dev. 3: 537-546).In some embodiments, recombinant mammalian expression vectors are capable of driving expression of nucleic acid predominantly in a particular type of cell (for example, tissue-specific regulatory elements are used for expression of nucleic acid). Tissue-specific regulatory elements are known in the art. Non-limiting examples of suitable tissue-specific promoters include the albumin gene promoter (liver-specific; Pinkert, et al., 1987. Genes Dev. 1: 268-277), lymphoid-specific tissue promoters (Calame and Eaton, 1988. Adv. Immunol. 43: 235-275), in particular, promoters of T-cell receptors (Winoto and Baltimore, 1989. EMBO J. 8: 729-733) and immunoglobulins (Baneiji, et al., 1983. Cell 33: 729-740; Queen and Baltimore , 1983. Cell 33: 741-748), neuron-specific promoters (e.g., neurofilament gene promoter; Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477), specific for pancreatic cells promoters (Edlund, et al., 1985. Science 230: 912-916) and cn breast cell specific promoters (for example, a whey promoter; US patent No. 4873316 and publication of European application No. 264166). Stage-regulated promoters are also encompassed, for example, mouse hox gene promoters (Kessel and Gruss, 1990. Science 249: 374-379) and α-fetoprotein gene promoter (Campes and Tilghman, 1989. Genes Dev. 3: 537-546) .

В некоторых вариантах осуществления регуляторный элемент является функционально связанным с одним или несколькими элементами системы CRISPR с тем, чтобы управлять экспрессией одного или нескольких элементов системы CRISPR. В целом, CRISPR (короткие палиндромные повторы, регулярно расположенные группами), также известные как SPIDR (прерываемые спейсерами прямые повторы), составляют семейство локусов ДНК, которые, как правило, специфичны для определенного вида бактерий. Локус CRISPR включает определенный класс чередующихся коротких повторов последовательностей (SSR), которые были обнаружены у Е. coli (Ishino et al., J. Bacteriol., 169: 5429-5433 [1987]; and Nakata et al., J. Bacteriol., 171: 3553-3556 [1989]), и ассоциированные гены. Подобные чередующиеся SSR были идентифицированы у Haloferax mediterranei, Streptococcus pyogenes, Anabaena и Mycobacterium tuberculosis (см., Groenen et al., Mol. Microbiol, 10: 1057-1065 [1993]; Hoe et al., Emerg. Infect. Dis., 5: 254-263 [1999]; Masepohl et al., Biochim. Biophys. Acta 1307: 26-30 [1996]; и Mojica et al., Mol. Microbiol., 17: 85-93 [1995]). Локусы CRISPR, как правило, отличаются от других SSR по структуре повторов, которые были названы короткими повторами с регулярными интервалами (SRSR) (Janssen et al., OMICS J. Integ. Biol., 6: 23-33 [2002]; и Mojica et al., Mol. Microbiol., 36: 244-246 [2000]). В целом, повторы являются короткими элементами, которые встречаются группами, которые регулярно разделены уникальными вставочными последовательностями с практически постоянной длинной (Mojica et al., [2000], выше). Несмотря на то, что последовательности повторов высоко консервативны между штаммами, некоторое количество чередующихся повторов и последовательностей спейсерных участков, как правило, отличаются от штамма к штамму (van Embden et al., J. Bacteriol., 182: 2393-2401 [2000]). Локусы CRISPR были идентифицированы у более чем 40 видов прокариот (см., к примеру, Jansen et al., Mol. Microbiol., 43: 1565-1575 [2002]; и Mojica et al., [2005]), в том числе, без ограничения, Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus, Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella, Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pasteurella, Photobacterium, Salmonella, Xanthomonas, Yersinia, Treponema и Thermotoga.In some embodiments, the regulatory element is operably linked to one or more elements of the CRISPR system so as to control the expression of one or more elements of the CRISPR system. In general, CRISPR (short palindromic repeats regularly arranged in groups), also known as SPIDRs (direct repeats interrupted by spacers), make up a family of DNA loci that are typically specific for a particular bacterial species. The CRISPR locus includes a certain class of alternating short sequence repeats (SSRs) that were found in E. coli (Ishino et al., J. Bacteriol., 169: 5429-5433 [1987]; and Nakata et al., J. Bacteriol. 171: 3553-3556 [1989]), and associated genes. Similar alternating SSRs have been identified in Haloferax mediterranei, Streptococcus pyogenes, Anabaena, and Mycobacterium tuberculosis (see Groenen et al., Mol. Microbiol 10: 1057-1065 [1993]; Hoe et al., Emerg. Infect. Dis., Dis., 5: 254-263 [1999]; Masepohl et al., Biochim. Biophys. Acta 1307: 26-30 [1996]; and Mojica et al., Mol. Microbiol., 17: 85-93 [1995]). CRISPR loci typically differ from other SSRs in repeat structure, which were called short intervals at regular intervals (SRSR) (Janssen et al., OMICS J. Integ. Biol., 6: 23-33 [2002]; and Mojica et al., Mol. Microbiol., 36: 244-246 [2000]). In general, repeats are short elements that occur in groups that are regularly separated by unique insertion sequences with an almost constant length (Mojica et al., [2000], supra). Although repeat sequences are highly conserved between strains, a number of alternating repeats and spacer sequences are generally different from strain to strain (van Embden et al., J. Bacteriol., 182: 2393-2401 [2000]) . CRISPR loci have been identified in more than 40 species of prokaryotes (see, for example, Jansen et al., Mol. Microbiol., 43: 1565-1575 [2002]; and Mojica et al., [2005]), including , but are not limited to, Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus, Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Bloom, Mycobacterium, Streptomyces Chromium, Thermifeus, Aquifexomius, Aquifex Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella, Acinetobacter, Erwinia, Escherichia, Legionella, Methureomomocomella Chollocella

В целом, "система CRISPR" означает в совокупности транскрипты и другие элементы, участвующие в экспрессии CRISPR-ассоциированных ("Cas") генов или управлении их активностью, в том числе последовательности, кодирующие ген Cas, tracr (транс-активируемую CRISPR) последовательность (к примеру, tracrRNA или активную частичную tracrRNA), парную tracr-последовательность (охватывающую "прямой повтор" и tracrRNA-процессированный неполный прямой повтор в контексте эндогенной системы CRISPR), направляющую последовательность (также называемую "спейсером" в контексте эндогенной системы CRISPR) или другие последовательности и транскрипты с локуса CRISPR. В некоторых вариантах осуществления один или несколько элементов системы CRISPR получены из системы CRISPR I типа, II типа или III типа. В некоторых вариантах осуществления один или несколько элементов системы CRISPR получены из определенного организма, содержащего эндогенную систему CRISPR, как, например, Streptococcus pyogenes. В целом, система CRISPR характеризуется элементами, которые способствуют образованию комплекса CRISPR на сайте целевой последовательности (также называемой протоспейсером в контексте эндогенной системы CRISPR). В контексте образования комплекса CRISPR "целевая последовательность" означает последовательность, по отношению к которой направляющая последовательность разработана так, чтобы обладать комплементарностью, где гибридизация между целевой последовательностью и направляющей последовательностью способствует образованию комплекса CRISPR. Полная комплементарность не обязательна при условии, что имеет место достаточная комплементарность для осуществления гибридизации и способствования образованию комплекса CRISPR. Целевая последовательность может содержать любой полинуклеотид, как, например, ДНК- или РНК-полинуклеотиды. В некоторых вариантах осуществления целевая последовательность расположена в ядре или цитоплазме клетки. В некоторых вариантах осуществления целевая последовательность может находиться в органелле эукариотической клетки, например, митохондрии или хлоропласте. Последовательность или матрицу, которую можно применять для рекомбинации в целевом локусе, содержащем целевые последовательности, называют "матрицей редактирования", или "полинуклеотидом для редактирования", или "последовательностью для редактирования". В аспекте настоящего изобретения экзогенный матричный полинуклеотид можно называть матрицей редактирования. В одном аспекте настоящего изобретения рекомбинация является гомологичной рекомбинацией.In general, “CRISPR system” means collectively transcripts and other elements involved in the expression of CRISPR-associated (“Cas”) genes or the control of their activity, including sequences encoding the Cas gene, tracr (trans-activated CRISPR) sequence ( for example, tracrRNA or active partial tracrRNA), a paired tracr sequence (encompassing a “direct repeat” and a tracrRNA-processed partial direct repeat in the context of the endogenous CRISPR system), a directing sequence (also called a “spacer” in the context of the endogenous system s CRISPR) or other sequence and transcripts with locus CRISPR. In some embodiments, one or more elements of a CRISPR system are derived from a Type I, Type II, or Type III CRISPR system. In some embodiments, one or more elements of the CRISPR system are derived from a particular organism containing an endogenous CRISPR system, such as, for example, Streptococcus pyogenes. In general, the CRISPR system is characterized by elements that contribute to the formation of the CRISPR complex at the site of the target sequence (also called the protospacer in the context of the endogenous CRISPR system). In the context of the formation of a CRISPR complex, “target sequence” means a sequence with respect to which the guide sequence is designed to be complementary, where hybridization between the target sequence and the guide sequence promotes the formation of the CRISPR complex. Full complementarity is not necessary provided that there is sufficient complementarity for hybridization and the formation of the CRISPR complex. The target sequence may contain any polynucleotide, such as, for example, DNA or RNA polynucleotides. In some embodiments, the target sequence is located in the nucleus or cytoplasm of the cell. In some embodiments, the implementation of the target sequence may be in the organelle of a eukaryotic cell, for example, mitochondria or chloroplast. A sequence or matrix that can be used for recombination at a target locus containing the target sequences is called an “editing matrix” or “editing polynucleotide” or “editing sequence”. In an aspect of the present invention, an exogenous matrix polynucleotide may be referred to as an editing matrix. In one aspect of the present invention, recombination is homologous recombination.

Как правило, в контексте эндогенной системы CRISPR образование комплекса CRISPR (содержащего направляющую последовательность, гибридизирующуюся с целевой последовательностью и образующую комплекс с одним или несколькими белками Cas) приводит к расщеплению одной или обеих нитей в или около (к примеру, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований от) целевой последовательности. Не желая быть связанными теорией, полагают, что tracr-последовательность, которая может содержать или состоять из всей или части tracr-последовательности дикого типа (к примеру, приблизительно или более чем приблизительно 20, 26, 32, 45, 48, 54, 63, 67, 85 или более нуклеотидов tracr-последовательности дикого типа), может также образовывать часть комплекса CRISPR, как, например, путем гибридизации вдоль по меньшей мере части tracr-последовательности со всей или частью парной tracr-последовательности, которая функционально связана с направляющей последовательностью. В некоторых вариантах осуществления tracr-последовательность обладает достаточной комплементарностью с парной tracr-последовательностью для гибридизации и участия в образовании комплекса CRISPR. Как и в случае с целевой последовательностью, полагают, что полная комплементарность не является необходимой при условии, что она является достаточной для выполнения функции. В некоторых вариантах осуществления tracr-последовательность характеризуется по меньшей мере 50%, 60%, 70%, 80%, 90%, 95% или 99% комплементарности последовательности по длине парной tracr-последовательности при оптимальном выравнивании. В некоторых вариантах осуществления один или несколько векторов, управляющих экспрессией одного или нескольких элементов системы CRISPR, вводят в клетку-хозяина, так что экспрессия элементов системы CRISPR управляет образованием комплекса CRISPR на одном или нескольких целевых сайтах. Например, каждое из фермента Cas, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности может быть функционально связано с отдельными регуляторными элементами в отдельных векторах. В качестве альтернативы, два или более элементов, экспрессируемых с одних и тех же или различных регуляторных элементов, можно объединять в одном векторе, с одним или несколькими дополнительными векторами, обеспечивая любые компоненты системы CRISPR, не включенные в первый вектор. Элементы системы CRISPR, которые объединены в один вектор, могут быть расположены в любой удобной ориентации, как, например, один элемент, расположенный 5' ("выше") относительно или 3' ("ниже") относительно второго элемента. Кодирующая последовательность одного элемента может быть расположена на той же или противоположной нити кодирующей последовательности второго элемента и направлена в том же или противоположном направлении. В некоторых вариантах осуществления один промотор управляет экспрессией транскрипта, кодирующего фермент CRISPR, и одной или нескольких из направляющей последовательности, парной tracr-последовательности (необязательно функционально связанной с направляющей последовательностью) и tracr-последовательности, встроенных в одну или несколько интронных последовательностей (к примеру, каждая в разном интроне, две или более по меньшей мере в одном интроне или все в одном интроне). В некоторых вариантах осуществления фермент CRISPR, направляющая последовательность, парная tracr-последовательность и tracr-последовательность функционально связаны с одним и тем же промотором и экспрессируются с него.Typically, in the context of the endogenous CRISPR system, the formation of a CRISPR complex (containing a guide sequence that hybridizes with the target sequence and forms a complex with one or more Cas proteins) results in cleavage of one or both strands in or around (for example, within 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 or more base pairs from) the target sequence. Not wishing to be bound by theory, it is believed that the tracr sequence, which may contain or consist of all or part of the wild-type tracr sequence (for example, approximately or more than approximately 20, 26, 32, 45, 48, 54, 63, 67, 85 or more nucleotides of a wild-type tracr sequence) can also form part of a CRISPR complex, such as by hybridizing along at least part of a tracr sequence with all or part of a paired tracr sequence that is operably linked to a guide sequence. In some embodiments, the tracr sequence is sufficiently complementary to the paired tracr sequence for hybridization and participation in the formation of the CRISPR complex. As with the target sequence, it is believed that full complementarity is not necessary provided that it is sufficient to perform the function. In some embodiments, the implementation of the tracr sequence is characterized by at least 50%, 60%, 70%, 80%, 90%, 95%, or 99% of the complementarity of the sequence along the length of the paired tracr sequence with optimal alignment. In some embodiments, one or more vectors that control the expression of one or more elements of the CRISPR system are introduced into the host cell, so that the expression of elements of the CRISPR system controls the formation of the CRISPR complex at one or more target sites. For example, each of the Cas enzyme, the guide sequence associated with the paired tracr sequence, and the tracr sequence can be functionally linked to separate regulatory elements in separate vectors. Alternatively, two or more elements expressed from the same or different regulatory elements can be combined in one vector with one or more additional vectors, providing any components of the CRISPR system that are not included in the first vector. Elements of the CRISPR system, which are combined into one vector, can be located in any convenient orientation, such as, for example, one element located 5 '("above") relative to or 3' ("below") relative to the second element. The coding sequence of one element may be located on the same or opposite strand of the coding sequence of the second element and directed in the same or opposite direction. In some embodiments, a single promoter controls expression of a transcript encoding a CRISPR enzyme and one or more of a guide sequence, a paired tracr sequence (optionally operably linked to a guide sequence), and a tracr sequence inserted in one or more intron sequences (e.g. each in a different intron, two or more in at least one intron, or all in one intron). In some embodiments, the CRISPR enzyme, the directing sequence, the paired tracr sequence, and the tracr sequence are operably linked to and expressed from the same promoter.

В некоторых вариантах осуществления вектор содержит один или несколько сайтов встраивания, как, например, последовательность узнавания рестрикционной эндонуклеазой (также называемая "сайтом клонирования"). В некоторых вариантах осуществления один или несколько сайтов встраивания (к примеру, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более сайтов встраивания) расположены выше и/или ниже одного или нескольких элементов последовательности одного или нескольких векторов. В некоторых вариантах осуществления вектор содержит сайт встраивания выше парной tracr-последовательности и необязательно ниже регуляторного элемента, функционально связанного с парной tracr-последовательностью, так что после встраивания направляющей последовательности в сайт встраивания и при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления вектор содержит два или более сайта встраивания, при этом каждый сайт встраивания расположен между двумя парными tracr-последовательностями с тем, чтобы обеспечить возможность встраивания направляющей последовательности в каждый сайт. В таком расположении две или более направляющие последовательности могут содержать две или более копий одной направляющей последовательности, две или более различных направляющих последовательностей или их комбинации. В тех случаях, когда применяют несколько различных направляющих последовательностей, может быть использована одна экспрессирующая конструкция для целенаправленного воздействия активности CRISPR на несколько различных соответствующих целевых последовательностей в клетке. Например, один вектор может содержать приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 или более направляющих последовательностей. В некоторых вариантах осуществления приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более таких содержащих направляющие последовательности векторов могут быть предусмотрены и необязательно доставлены в клетку.In some embodiments, the vector contains one or more embedding sites, such as, for example, a restriction endonuclease recognition sequence (also called a "cloning site"). In some embodiments, one or more embedding sites (e.g., about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more embedding sites) are located above and / or below one or several elements of the sequence of one or more vectors. In some embodiments, the vector comprises an embedment site above the paired tracr sequence and optionally below a regulatory element operably linked to the paired tracr sequence, so that after embedding the guide sequence into the embedment site and upon expression, the guide sequence controls the sequence-specific binding of the CRISPR complex to the target sequence in a eukaryotic cell. In some embodiments, the vector contains two or more embedding sites, with each embedding site located between two paired tracr sequences so as to enable embedding of the guide sequence into each site. In such an arrangement, two or more guide sequences may comprise two or more copies of one guide sequence, two or more different guide sequences, or combinations thereof. In cases where several different guide sequences are used, a single expression construct can be used to specifically target CRISPR activity on several different corresponding target sequences in the cell. For example, one vector may contain about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, or more guide sequences. In some embodiments, about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, or more of these guiding sequence vectors can be provided and optionally delivered to the cell.

В некоторых вариантах осуществления вектор содержит регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей фермент CRISPR, как, например, белок Cas. Неограничивающие примеры белков Cas включают Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (также известный как Csn1 и Csx12), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, их гомологи или их модифицированные варианты. Эти ферменты известны; например, аминокислотную последовательность белка Cas9 S. pyogenes можно найти в базе данных SwissProt под номером доступа Q99ZW2. В некоторых вариантах осуществления немодифицированный фермент CRISPR обладает активностью для расщепления ДНК, как, например, Cas9. В некоторых вариантах осуществления фермент CRISPR представляет собой Cas9, и им может быть Cas9 из S. pyogenes или S. pneumoniae, В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или обеих нитей в определенной точке целевой последовательности, как, например, в пределах целевой последовательности и/или в пределах комплементарной последовательности целевой последовательности. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или обеих нитей в пределах приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 или более пар оснований от первого или последнего нуклеотида целевой последовательности. В некоторых вариантах осуществления вектор кодирует фермент CRISPR, который является мутированным по отношению к соответствующему ферменту дикого типа, так что у мутированного фермента CRISPR отсутствует способность расщеплять одну или обе нити целевого полинуклеотида, содержащего целевую последовательность. Например, замена аспартата на аланин (D10A) в каталитическом домене RuvC I Cas9 из S. pyogenes трансформирует Cas9 из нуклеазы, которая расщепляет обе нити, в никазу (расщепляет одну нить). Другие примеры мутаций, которые превращают Cas9 в никазу, включают, без ограничения, Н840А, N854A и N863A. В некоторых вариантах осуществления никазу Cas9 можно использовать в комбинации с направляющей(ими) последовательностью(ями), к примеру, двумя направляющими последовательностями, которые целенаправленно воздействуют, соответственно, на смысловую и антисмысловую нити ДНК-мишени. Эта комбинация позволяет надрезать обе нити и использовать их для индукции NHEJ. Авторы данной заявки показали (данные не показаны) эффективность двух мишеней для никаз (т.е. sgRNA, целенаправленно воздействующие на одну и ту же точку, но на различные нити ДНК) при индуцировании мутагенного NHEJ. Одиночная никаза (Cas9-D10A с одной sgRNA) не способна индуцировать NHEJ и создавать вставки/делеции, но авторы данной заявки показали, что двойная никаза (Cas9-D10A и две sgRNA, целенаправленно воздействующие на различные нити в одной и той же точке) способна делать это в эмбриональных стволовых клетках человека (hESC). Эффективность составляет приблизительно 50% таковой нуклеазы (т.е. нормального Cas9 без мутации D10) в hESC.In some embodiments, the vector comprises a regulatory element operably linked to an enzyme coding sequence for a CRISPR enzyme, such as, for example, a Cas protein. Non-limiting examples of Cas proteins include Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (also known as Csn1 and Csx12), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5 , Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csf1, Csf1 , Csf4, their homologues or their modified variants. These enzymes are known; for example, the amino acid sequence of Cas9 protein S. pyogenes can be found in the SwissProt database under accession number Q99ZW2. In some embodiments, the unmodified CRISPR enzyme has DNA cleavage activity, such as, for example, Cas9. In some embodiments, the CRISPR enzyme is Cas9, and it can be Cas9 from S. pyogenes or S. pneumoniae. In some embodiments, the CRISPR enzyme controls cleavage of one or both strands at a specific point in the target sequence, such as, for example, within the target sequence and / or within the complementary sequence of the target sequence. In some embodiments, the CRISPR enzyme controls cleavage of one or both strands within about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500, or more base pairs from the first or last nucleotide of the target sequence. In some embodiments, the vector encodes a CRISPR enzyme that is mutated with respect to the corresponding wild-type enzyme, so that the mutated CRISPR enzyme lacks the ability to cleave one or both strands of the target polynucleotide containing the target sequence. For example, replacing aspartate with alanine (D10A) in the catalytic domain of RuvC I Cas9 from S. pyogenes transforms Cas9 from a nuclease that cleaves both strands to nikase (cleaves one strand). Other examples of mutations that convert Cas9 to nickase include, but are not limited to, H840A, N854A, and N863A. In some embodiments, Cas9 nicase can be used in combination with the guide sequence (s), for example, two guide sequences that deliberately act on the sense and antisense strands of the target DNA, respectively. This combination allows both threads to be incised and used to induce NHEJ. The authors of this application showed (data not shown) the effectiveness of two targets for nickases (i.e., sgRNAs that specifically target the same point, but on different DNA strands) when inducing mutagenic NHEJ. A single nicase (Cas9-D10A with one sgRNA) is not able to induce NHEJ and create insertions / deletions, but the authors of this application showed that double nikase (Cas9-D10A and two sgRNAs, purposefully acting on different strands at the same point) is capable of do this in human embryonic stem cells (hESC). Efficiency is approximately 50% of that nuclease (i.e., normal Cas9 without D10 mutation) in hESC.

В качестве дополнительного примера два или более каталитических доменов Cas9 (RuvC I, RuvC II и RuvC III) можно подвергать мутациям с получением мутированного Cas9, у которого практически отсутствует вся активность для расщепления ДНК. В некоторых вариантах осуществления мутацию D10A объединяют с одной или несколькими из мутаций Н840А, N854A или N863A с получением фермента Cas9, у которого практически отсутствует вся активность для расщепления ДНК. В некоторых вариантах осуществления фермент CRISPR рассматривают как такой, у которого практически отсутствует вся активность для расщепления ДНК, в случаях, когда активность для расщепления ДНК мутированного фермента составляет менее приблизительно 25%, 10%, 5%, 1%, 0,1%, 0,01% или меньше по отношению к его не мутированной форме. Могут быть целесообразными другие мутации; в тех случаях, когда Cas9 или другой фермент CRISPR получен из вида, отличного от S. pyogenes, могут быть произведены мутации в соответствующих аминокислотах для достижения подобных эффектов.As an additional example, two or more Cas9 catalytic domains (RuvC I, RuvC II, and RuvC III) can be mutated to produce mutated Cas9, which has virtually no DNA splitting activity. In some embodiments, the D10A mutation is combined with one or more of the H840A, N854A, or N863A mutations to produce the Cas9 enzyme, which has virtually no DNA splitting activity. In some embodiments, the implementation of the CRISPR enzyme is considered as one in which there is practically no all activity for DNA cleavage, in cases where the activity for DNA cleavage of the mutated enzyme is less than about 25%, 10%, 5%, 1%, 0.1%, 0.01% or less with respect to its non-mutated form. Other mutations may be appropriate; in cases where Cas9 or another CRISPR enzyme is derived from a species other than S. pyogenes, mutations in the corresponding amino acids can be made to achieve similar effects.

В некоторых вариантах осуществления кодирующая фермент последовательность, кодирующая фермент CRISPR, является кодон-оптимизированной для экспрессии в определенных клетках, как, например, эукариотических клетках. Эукариотические клетки могут быть клетками определенного организма или полученными из него, как, например, млекопитающего, в том числе, без ограничения, человека, мыши, крысы, кролика, собаки или отличного от человека примата. В целом, оптимизация кодонов означает способ модификации последовательности нуклеиновой кислоты для повышения экспрессии в представляющих интерес клетках-хозяевах путем замещения по меньшей мере одного кодона (к примеру, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более кодонов) нативной последовательности кодонами, которые чаще или наиболее часто используют в генах этой клетки-хозяина, в то же время сохраняя нативную аминокислотную последовательность. Разные виды проявляют определенное "предпочтение" в отношении конкретных кодонов определенной аминокислоты. "Предпочтение" кодонов (различия в частоте использования кодонов между организмами) часто соотносят с эффективностью трансляции информационной РНК (иРНК), которая, в свою очередь, как полагают, зависит, среди прочего, от свойств кодонов, которые транслируются, и доступности конкретных молекул транспортной РНК (тРНК). Преобладание выбранных тРНК в клетке, как правило, является отражением кодонов, используемых наиболее часто при синтезе пептидов. Соответственно, гены могут быть приспособлены для оптимальной экспрессии генов в данном организме с использованием оптимизации кодонов. Таблицы частоты использования кодонов общедоступны, например, в "Базе данных частот использования кодонов" ("Codon Usage Database"), и эти таблицы можно адаптировать различными способами. См. Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28: 292 (2000). Также доступны компьютерные алгоритмы для оптимизации кодонов определенной последовательности для экспрессии в определенной клетке-хозяине, как, например, также доступный Gene Forge (Aptagen; Джакобус, Пенсильвания). В некоторых вариантах осуществления один или несколько кодонов (к примеру, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более или все кодоны) в последовательности, кодирующей фермент CRISPR, соответствуют наиболее часто используемому кодону для определенной аминокислоты.In some embodiments, an enzyme coding sequence for a CRISPR enzyme is codon-optimized for expression in certain cells, such as eukaryotic cells. Eukaryotic cells can be cells of a particular organism or obtained from it, such as, for example, a mammal, including, without limitation, a human, mouse, rat, rabbit, dog or non-human primate. In general, codon optimization means a method of modifying a nucleic acid sequence to increase expression in host cells of interest by replacing at least one codon (e.g., approximately or more than approximately 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 or more codons) of the native sequence with codons that are used most often or most often in the genes of this host cell, while preserving the native amino acid sequence. Different species exhibit a certain "preference" for specific codons of a particular amino acid. The “preference” of codons (differences in the frequency of use of codons between organisms) is often correlated with the translation efficiency of messenger RNA (mRNA), which, in turn, is believed to depend, inter alia, on the properties of the codons that are translated and the availability of specific transport molecules RNA (tRNA). The predominance of selected tRNA in the cell, as a rule, is a reflection of the codons used most often in the synthesis of peptides. Accordingly, genes can be adapted for optimal gene expression in a given organism using codon optimization. Codon usage tables are publicly available, for example, in the Codon Usage Database, and these tables can be adapted in various ways. See Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28: 292 (2000). Computer algorithms are also available for optimizing codons of a specific sequence for expression in a specific host cell, such as, for example, Gene Forge (Aptagen; Jacobus, PA) also available. In some embodiments, one or more codons (e.g., 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 or more or all codons) in the sequence encoding the CRISPR enzyme correspond to the most commonly used codon for a certain amino acid.

В некоторых вариантах осуществления вектор кодирует фермент CRISPR, содержащий одну или несколько последовательностей ядерной локализации (NLS), как, например, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS. В некоторых вариантах осуществления фермент CRISPR содержит приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS на амино-конце или рядом с ним, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS на карбокси-конце или рядом с ним или комбинацию этого (к примеру, одну или несколько NLS на амино-конце и одну или несколько NLS на карбокси-конце). В тех случаях, когда присутствуют несколько NLS, каждая может быть выбрана независимо от других, так что одна NLS может присутствовать в нескольких копиях и/или в комбинации с одной или несколькими другими NLS, присутствующими в одной или нескольких копиях. В предпочтительном варианте осуществления настоящего изобретения фермент CRISPR содержит самое большее 6 NLS. В некоторых вариантах осуществления считают, что NLS находится рядом с N- или С-концом в тех случаях, когда самая близкая аминокислота NLS находится в пределах приблизительно 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 или более аминокислот вдоль полипетидной цепи от N- или С-конца. Обычно, NLS состоит из одной или нескольких коротких последовательностей положительно заряженных молекул лизина или аргинина, расположенных на поверхности белка, но известны другие типы NLS. Неограничивающие примеры NLS включают NLS-последовательности, полученные из: NLS из большого T-антигена вируса SV40 с аминокислотной последовательностью PKKKRKV; NLS из нуклеоплазмина (к примеру, двойной NLS из нуклеоплазмина с последовательностью KRPAATKKAGQAKKKK); NLS из c-myc с аминокислотной последовательностью PAAKRVKLD или RQRRNELKRSP; NLS из hRNPA1 M9 с последовательностью NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY; последовательность RMMZFKNKGKDTAELRRRRVEVSVELRKAKXDEQILKRRNV домена IBB из импортина-альфа; последовательности VSRKRPRP и PPKKARED из Т-белка миомы; последовательность POPKKKPL из р53 человека; последовательность SALIKKKKKMAP из c-abl IV мыши; последовательности DRLRR и PKQKKRK из NS1 вируса гриппа; последовательность RKLKKKIKKL из дельта-антигена вируса гепатита; последовательность REKKKFLKRR из белка Mx1 мыши; последовательность KRKGDEVDGVDEVAKKKSKK из поли(АДФ-рибоза)-полимеразы человека и последовательность RKCLQAGMNLEARKTKK из рецепторов стероидных гормонов для глюкокортикоидов (человека).In some embodiments, the vector encodes a CRISPR enzyme containing one or more nuclear localization sequences (NLS), such as, for example, about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, or more NLS In some embodiments, the CRISPR enzyme contains about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more NLS at or near the amino end, about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more NLS at or near the carboxy end, or a combination of this (for example, one or more NLS at the amino end and one or more NLS at the carboxy -end). In cases where multiple NLSs are present, each can be selected independently of the others, so that one NLS can be present in several copies and / or in combination with one or more other NLS present in one or more copies. In a preferred embodiment of the present invention, the CRISPR enzyme contains at most 6 NLS. In some embodiments, NLS is believed to be adjacent to the N- or C-terminus when the closest amino acid NLS is in the range of about 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 or more amino acids along the polypetid chain from the N- or C-terminus. Typically, NLS consists of one or more short sequences of positively charged lysine or arginine molecules located on the surface of a protein, but other types of NLS are known. Non-limiting examples of NLS include NLS sequences derived from: NLS from the SV40 virus large T antigen with the PKKKRKV amino acid sequence; NLS from nucleoplasmin (for example, double NLS from nucleoplasmin with the sequence KRPAATKKAGQAKKKK); NLS from c-myc with the amino acid sequence PAAKRVKLD or RQRRNELKRSP; NLS from hRNPA1 M9 with the sequence NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY; the sequence RMMZFKNKGKDTAELRRRRRVEVSVELRKAKXDEQILKRRNV of the IBB domain from importin-alpha; sequences of VSRKRPRP and PPKKARED from fibroid T-protein; POPKKKPL sequence from human p53; the SALIKKKKKMAP sequence from mouse c-abl IV; DRLRR and PKQKKRK sequences from NS1 influenza virus; the sequence of RKLKKKIKKL from the hepatitis virus delta antigen; the REKKKFLKRR sequence from mouse Mx1 protein; the KRKGDEVDGVDEVAKKKSKK sequence from human poly (ADP-ribose) polymerase; and the RKCLQAGMNLEARKTKK sequence from steroid hormone receptors for glucocorticoids (human).

В целом, одна или несколько NLS являются достаточно эффективными, чтобы управлять накоплением фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В целом, степень проявления активности ядерной локализации может быть результатом следующего: количества NLS в ферменте CRISPR, конкретных(ой) используемых(ой) NLS или комбинации этих факторов. Обнаружение накопления в ядре можно выполнять при помощи любой подходящей методики. Например, детектируемый маркер может быть слит с ферментом CRISPR, так что расположение в клетке может быть визуализировано, как, например, в комбинации со средствами для обнаружения расположения ядра (к примеру, окрашивающим средством, специфичным к ядру, таким как DAPI). Примеры детектируемых маркеров включают флуоресцентные белки (такие как зеленые флуоресцентные белки или GFP; RFP; CFP) и эпитопные метки (HA-метку, flag-метку, SNAP-метку). Ядра клеток также можно выделять из клеток, содержимое которых можно затем анализировать при помощи любого подходящего способа для обнаружения белка, как, например, иммуногистохимии, вестерн-блоттинга или анализа на активность фермента. Накопление в ядре также можно определить опосредованно, как, например, при помощи анализа действия образования комплекса CRISPR (к примеру, анализа на расщепление ДНК или мутацию в целевой последовательности или анализа на измененную при помощи образования комплекса CRISPR и/или активности фермента CRISPR активность экспрессии генов) по сравнению с контролем, который не подвергали воздействию фермента или комплекса CRISPR или подвергали воздействию фермента CRISPR, у которого отсутствуют одна или несколько NLS.In general, one or more NLSs are effective enough to control the accumulation of the CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell. In general, the degree of manifestation of nuclear localization activity may be the result of the following: the amount of NLS in the CRISPR enzyme, the specific (used) used NLS, or a combination of these factors. Detection of accumulation in the core can be performed using any suitable technique. For example, a detectable marker can be fused to the CRISPR enzyme, so that the location in the cell can be visualized, such as in combination with means for detecting the location of the nucleus (for example, a stain-specific agent, such as DAPI). Examples of detectable markers include fluorescent proteins (such as green fluorescent proteins or GFP; RFP; CFP) and epitope tags (HA tag, flag tag, SNAP tag). Cell nuclei can also be isolated from cells, the contents of which can then be analyzed using any suitable method for detecting a protein, such as immunohistochemistry, western blotting, or analysis of enzyme activity. Accumulation in the nucleus can also be determined indirectly, such as, for example, by analyzing the effect of the formation of the CRISPR complex (for example, by analyzing the DNA cleavage or mutation in the target sequence or by analyzing the gene expression activity modified by the formation of the CRISPR complex and / or CRISPR enzyme activity) ) compared to a control that was not exposed to an enzyme or CRISPR complex or was exposed to a CRISPR enzyme that lacks one or more NLS.

В целом, направляющая последовательность представляет собой любую полинуклеотидную последовательностью, обладающую достаточнойIn general, the guide sequence is any polynucleotide sequence having sufficient

комплементарностью с целевой полинуклеотидной последовательностью для гибридизации с целевой последовательностью и управления специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью. В некоторых вариантах осуществления степень комплементарности между направляющей последовательностью и ее соответствующей целевой последовательностью при оптимальном выравнивании с использованием подходящего алгоритма выравнивания составляет приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% или более. Оптимальное выравнивание можно определять при помощи любого подходящего алгоритма для выравниваемых последовательностей, неограничивающие примеры которого включают алгоритм Смита-Ватермана, алгоритм Нидлмана-Вунша, алгоритмы, основанные на преобразовании Барроуза-Уилера (к примеру, Burrows Wheeler Aligner), Clustal W, Clustal X, BLAT, Novoalign (Novocraft Technologies), ELAND (Illumina, Сан-Диего, Калифорния), SOAP (доступный на soap.genomics.org.cn) и Maq (доступный на maq.sourceforge.net). В некоторых вариантах осуществления направляющая последовательность составляет приблизительно или более чем приблизительно 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 или более нуклеотидов в длину. В некоторых вариантах осуществления направляющая последовательность составляет менее чем приблизительно 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 или менее нуклеотидов в длину. Способность направляющей последовательности управлять специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью можно оценить при помощи любого подходящего анализа. Например, компоненты системы CRISPR, достаточные для образования комплекса CRISPR, в том числе направляющая последовательность, которую необходимо исследовать, могут быть доставлены в клетку-хозяина с соответствующей целевой последовательностью, как, например, при помощи трансфекции векторами, кодирующими компоненты последовательности CRISPR, с последующей оценкой предпочтительного расщепления в пределах целевой последовательности, как, например, при помощи анализа с помощью Surveyor, который описан в данном документе. Подобным образом, расщепление целевой полинуклеотидной последовательности может быть установлено в пробирке путем обеспечения целевой последовательности, компонентов комплекса CRISPR, в том числе направляющей последовательности, которую необходимо исследовать, и контрольной направляющей последовательности, отличной от тестовой направляющей последовательности, и сравнения воздействий тестовой и контрольной направляющей последовательности на связывание или скорость расщепления целевой последовательности. Другие анализы возможны и будут очевидны специалисту в данной области.complementarity with the target polynucleotide sequence for hybridization with the target sequence and control sequence specific binding of the CRISPR complex to the target sequence. In some embodiments, the degree of complementarity between the guide sequence and its corresponding target sequence when optimally aligned using a suitable alignment algorithm is approximately or more than approximately 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97 5%, 99% or more. Optimal alignment can be determined using any suitable algorithm for aligned sequences, non-limiting examples of which include the Smith-Waterman algorithm, the Needleman-Wunsch algorithm, algorithms based on the Burroughs-Wheeler transform (e.g. Burrows Wheeler Aligner), Clustal W, Clustal X, BLAT, Novoalign (Novocraft Technologies), ELAND (Illumina, San Diego, CA), SOAP (available at soap.genomics.org.cn) and Maq (available at maq.sourceforge.net). In some embodiments, the guide sequence is about or more than about 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 or more nucleotides in length. In some embodiments, the guide sequence is less than about 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 or less nucleotides in length. The ability of the guide sequence to control sequence specific binding of the CRISPR complex to the target sequence can be assessed using any suitable assay. For example, components of the CRISPR system sufficient for the formation of the CRISPR complex, including the guiding sequence to be investigated, can be delivered to the host cell with the corresponding target sequence, such as, for example, by transfection with vectors encoding the components of the CRISPR sequence, followed by evaluating a preferred cleavage within the target sequence, such as, for example, using the Surveyor analysis described herein. Similarly, cleavage of the target polynucleotide sequence can be established in vitro by providing the target sequence, components of the CRISPR complex, including the guide sequence to be examined, and a control guide sequence other than the test guide sequence, and comparing the effects of the test and control guide sequence binding or cleavage rate of the target sequence. Other analyzes are possible and will be apparent to a person skilled in the art.

Направляющая последовательность может быть выбрана для целенаправленного воздействия на любую целевую последовательность. В некоторых вариантах осуществления целевая последовательность является последовательностью в пределах генома клетки. Иллюстративные целевые последовательности включают те, которые являются уникальными в целевом геноме. Например, для Cas9 S. pyogenes уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 в виде MMMMMMMMNNNNNNNNNNNNXGG, где NNNNNNNNNNNNXGG (N представляет собой A, G, T или C; и X может быть любым) характеризуется единичным появлением в геноме. Уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 S. pyogenes в виде MMMMMMMMMNNNNNNNNNNNXGG, где NNNNNNNNNNNXGG (N представляет собой A, G, Т или C; и X может быть любым) характеризуется единичным появлением в геноме. Для Cas9 CRISPR1 S. thermophilus уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 в виде MMMMMMMMNNNNNNNNNNNNXXAGAAW, где NNNNNNNNNNNNXXAGAAW (N представляет собой A, G, T или C; X может быть любым; и W представляет собой A или T) характеризуется единичным появлением в геноме. Уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 CRISPR1 S. thermophilus в виде MMMMMMMMMNNNNNNNNNNNXXAGAAW, где NNNNNNNNNNNXXAGAAW (N представляет собой A, G, T или C; X может быть любым; и W представляет собой A или T) характеризуется единичным появлением в геноме. Для Cas9 S. pyogenes уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 в виде MMMMMMMMNNNNNNNNNNNNXGGXG, где NNNNNNNKNNNNXGGXG (N представляет собой A, G, Т или C; и X может быть любым) характеризуется единичным появлением в геноме. Уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 S. pyogenes в виде MMMMMMMMMNNNNNNNNNNNXGGXG, где NNNNNNNNNNNXGGXG (N представляет собой A, G, Т или C; и X может быть любым) характеризуется единичным появлением в геноме. В каждой из этих последовательностей "М" может представлять собой A, G, Т или C и не должен учитываться при идентификации последовательности как уникальной.A guide sequence can be selected to target any target sequence. In some embodiments, the target sequence is a sequence within the cell genome. Illustrative target sequences include those that are unique in the target genome. For example, for Cas9 S. pyogenes, a unique target sequence in the genome may include a target site for Cas9 in the form MMMMMMMMMNNNNNNNNNNNNXGG, where NNNNNNNNNNNNXGG (N represents A, G, T or C; and X can be any) is characterized by a single occurrence in the genome. A unique target sequence in the genome can include the target site for S. pyogenes Cas9 in the form of MMMMMMMMMNNNNNNNNNNNNXGG, where NNNNNNNNNNNXGG (N is A, G, T or C; and X can be any) is characterized by a single occurrence in the genome. For Cas9 CRISPR1 S. thermophilus, the unique target sequence in the genome may include the target site for Cas9 in the form MMMMMMMMNNNNNNNNNNNNXXAGAAW, where NNNNNNNNNNNNXXAGAAW (N represents A, G, T or C; X can be any A; X can be any A; X can be any A or X) appearance in the genome. The unique target sequence in the genome may include the target site for Cas9 CRISPR1 S. thermophilus as MMMMMMMMMMNNNNNNNNNNNXXAGAAW, where NNNNNNNNNNNNXXAGAAW (N represents A, G, T or C; X can be any; and W represents a single occurrence of A or T) genome. For Cas9 S. pyogenes, a unique target sequence in the genome can include a target site for Cas9 in the form MMMMMMMMMNNNNNNNNNNNNXGGXG, where NNNNNNNKNNNNXGGXG (N is A, G, T or C; and X can be any) is characterized by a single occurrence in the genome. The unique target sequence in the genome may include the target site for S. pyogenes Cas9 in the form MMMMMMMMMNNNNNNNNNNNNXGGXG, where NNNNNNNNNNNXGGXG (N is A, G, T or C; and X can be any) is characterized by a single occurrence in the genome. In each of these sequences, “M” may be A, G, T or C and should not be taken into account when identifying a sequence as unique.

В некоторых вариантах осуществления направляющая последовательность выбрана для снижения доли вторичной структуры в направляющей последовательности. Вторичную структуру можно определить при помощи любого подходящего алгоритма сворачивания полинуклеотида. Некоторые программы основаны на вычислении минимальной свободной энергии Гиббса. Примером одного такого алгоритма является mFold, который описан Zuker и Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Другим примером алгоритма сворачивания является доступный в режиме онлайн веб-сервер RNAfold, разработанный в Институте теоретической химии при Венском университете, использующий алгоритм прогнозирования структуры на основе центроидного метода (см., к примеру, A.R. Graber et al., 2008, Cell 106(1): 23-24; and PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62). Дополнительные алгоритмы можно найти в заявке на патент США с серийным номером ТВА (номер дела у патентного поверенного 44790.11.2022; общая ссылка BI-2013/004А); включенной в данный документ при помощи ссылки.In some embodiments, a guide sequence is selected to reduce the proportion of the secondary structure in the guide sequence. The secondary structure can be determined using any suitable polynucleotide folding algorithm. Some programs are based on calculating Gibbs minimum free energy. An example of one such algorithm is mFold, which is described by Zuker and Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Another example of the folding algorithm is the online RNAfold web server developed at the Institute of Theoretical Chemistry at the University of Vienna using the centroid method for predicting the structure (see, for example, AR Graber et al., 2008, Cell 106 (1 ): 23-24; and PA Carr and GM Church, 2009, Nature Biotechnology 27 (12): 1151-62). Additional algorithms can be found in the application for a US patent with a serial number of TBA (case number of the patent attorney 44790.11.2022; general reference BI-2013 / 004A); incorporated herein by reference.

В общем, парная tracr-последовательность включает любую последовательность, которая характеризуется достаточной комплементарностью с tracr-последовательностью для содействия одному или нескольким из: (1) вырезания направляющей последовательности, фланкированной парными tracr-последовательностями, в клетке, содержащей соответствующую tracr-последовательность; и (2) образования комплекса CRISPR на целевой последовательности, где комплекс CRISPR содержит парную tracr-последовательность, гибридизирующуюся с tracr-последовательностью. В общем, степень комплементарности указана на основании оптимального выравнивания парной tracr-последовательности и tracr-последовательности по длине более короткой из двух последовательностей. Оптимальное выравнивание можно определить при помощи любого подходящего алгоритма выравнивания и можно дополнительно высчитать для вторичных структур, как, например, самокомплементарность в пределах либо tracr-последовательности, либо парной tracr-последовательности. В некоторых вариантах осуществления степень комплементарности между tracr-последовательностью и парной tracr-последовательностью по длине более короткой из двух при оптимальном выравнивании составляет приблизительно или более чем приблизительно 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97,5%, 99% или более. Примерные иллюстрации оптимального выравнивания между tracr-последовательностью и парной tracr-последовательностью представлены на фигурах 12B и 13B. В некоторых вариантах осуществления tracr-последовательность составляет приблизительно или более чем приблизительно 5, 6, 7, 8, 9, 10,11, 12,13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 или более нуклеотидов в длину. В некоторых вариантах осуществления tracr-последовательность и парная tracr-последовательность содержатся в одном транскрипте, так что гибридизация между ними двумя дает транскрипт со вторичной структурой, такой как "шпилька". Предпочтительные петлеобразующие последовательности для использования в "шпилечных" структурах составляют четыре нуклеотида в длину и наиболее предпочтительно имеют последовательность GAAA. Однако, можно использовать более короткие или длинные последовательности петли, а также альтернативные последовательности. Последовательности предпочтительно включают нуклеотидный триплет (например, AAA) и дополнительный нуклеотид (например, C или G). Примеры петлеобразующих последовательностей включают CAAA и AAAG. В одном варианте осуществления настоящего изобретения траснкрипт или транскрибированная полинуклеотидная последовательность характеризуются по меньшей мере двумя или более "шпильками". В предпочтительных вариантах осуществления транскрипт характеризуется двумя, тремя, четырьмя или пятью "шпильками". В дополнительном варианте осуществления настоящего изобретения транскрипт характеризуется самое большее пятью "шпильками". В некоторых вариантах осуществления один транскрипт дополнительно включает последовательность терминации транскрипции; предпочтительно она является полиТ-последовательностью, например, из шести нуклеотидов T. Примерная иллюстрация такой "шпилечной" структуры представлена в нижней части фигуры 13B, где часть последовательности в 5' направлении по отношению к концевому "N" и выше петли соответствует парной tracr-последовательности, а часть последовательности в 3' направлении по отношению к петле соответствует tracr-последовательности. Дополнительными неограничивающими примерами отдельных полинуклеотидов, содержащих направляющую последовательность, парную tracr-последовательность и tracr-последовательность, являются следующие (перечисленные от 5' к 3'), где "N" представляет собой основание направляющей последовательности, первый блок букв нижнего регистра представляет собой парную tracr-последовательность, а второй блок букв нижнего регистра представляет собой tracr-последовательность, и конечная поли-Т-последовательность представляет собой терминатор транскрипции: (1)

Figure 00000001
In general, a paired tracr sequence includes any sequence that is sufficiently complementary to a tracr sequence to facilitate one or more of: (1) excision of a guide sequence flanked by paired tracr sequences in a cell containing the corresponding tracr sequence; and (2) the formation of the CRISPR complex on the target sequence, where the CRISPR complex contains a paired tracr sequence that hybridizes with the tracr sequence. In general, the degree of complementarity is indicated based on the optimal alignment of the paired tracr sequence and the tracr sequence along the length of the shorter of the two sequences. Optimal alignment can be determined using any suitable alignment algorithm and can be additionally calculated for secondary structures, such as, for example, self-complementarity within either a tracr sequence or a paired tracr sequence. In some embodiments, the degree of complementarity between the tracr sequence and the paired tracr sequence along the shorter of the two with optimal alignment is approximately or more than approximately 25%, 30%, 40%, 50%, 60%, 70%, 80% , 90%, 95%, 97.5%, 99% or more. Exemplary illustrations of optimal alignment between the tracr sequence and the paired tracr sequence are shown in FIGS. 12B and 13B. In some embodiments, the implementation of the tracr sequence is approximately or more than approximately 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40 50 or more nucleotides in length. In some embodiments, the tracr sequence and the paired tracr sequence are contained in a single transcript, so that hybridization between the two gives a transcript with a secondary structure, such as a hairpin. Preferred looping sequences for use in hairpin structures are four nucleotides in length and most preferably have a GAAA sequence. However, shorter or longer loop sequences can be used, as well as alternative sequences. The sequences preferably include a nucleotide triplet (e.g., AAA) and an additional nucleotide (e.g., C or G). Examples of loop forming sequences include CAAA and AAAG. In one embodiment of the present invention, the transcript or transcribed polynucleotide sequence is characterized by at least two or more hairpins. In preferred embodiments, the transcript is characterized by two, three, four, or five hairpins. In a further embodiment of the present invention, the transcript is characterized by at most five hairpins. In some embodiments, a single transcript further includes a transcription termination sequence; preferably, it is a polyT sequence, for example, of six nucleotides T. An exemplary illustration of such a “hairpin” structure is presented in the lower part of Figure 13B, where part of the sequence in the 5 ′ direction with respect to the terminal “N” and above the loop corresponds to the paired tracr sequence , and part of the sequence in the 3 'direction with respect to the loop corresponds to the tracr sequence. Additional non-limiting examples of individual polynucleotides containing a guide sequence, a paired tracr sequence and a tracr sequence are the following (listed from 5 ′ to 3 ′), where “N” is the base of the guide sequence, the first block of lowercase letters is a paired tracr -sequence, and the second block of lowercase letters is a tracr sequence, and the final poly-T sequence is a transcription terminator: (1)
Figure 00000001

Figure 00000002
(2)
Figure 00000003
Figure 00000002
(2)
Figure 00000003

Figure 00000004
(3)
Figure 00000005
Figure 00000004
(3)
Figure 00000005

Figure 00000006
(4)
Figure 00000007
Figure 00000006
(four)
Figure 00000007

Figure 00000008
(5)
Figure 00000009
Figure 00000008
(5)
Figure 00000009

Figure 00000010
и (6)
Figure 00000011
. В некоторых вариантах осуществления последовательности (1)-(3) используют в комбинации с Cas9 из CRISPR1 S. thermophilus. В некоторых вариантах осуществления последовательности (4)-(6) используют в комбинации с Cas9 из S. pyogenes. В некоторых вариантах осуществления tracr-последовательность является транскриптом, отдельным от транскрипта, содержащего парную tracr-последовательность (как, например, показанная в верхней части фигуры 13B).
Figure 00000010
and (6)
Figure 00000011
. In some embodiments, sequences (1) to (3) are used in combination with Cas9 from CRISPR1 S. thermophilus. In some embodiments, sequences (4) to (6) are used in combination with Cas9 from S. pyogenes. In some embodiments, the tracr sequence is a transcript separate from the transcript containing the paired tracr sequence (such as shown at the top of FIG. 13B).

В некоторых вариантах осуществления также предусмотрена матрица для рекомбинации. Матрица для рекомбинации может быть компонентом другого вектора, который описан в данном документе, может содержаться в отдельном векторе или предусматриваться в качестве отдельного полинуклеотида. В некоторых вариантах осуществления матрица для рекомбинации разработана так, чтобы служить в качестве матрицы при гомологичной рекомбинации, как, например, в пределах или рядом с целевой последовательностью, надрезанной или расщепленной ферментом CRISPR, в качестве части комплекса CRISPR. Матричный полинуклеотид может быть любой подходящей длины, как, например, приблизительно или более чем приблизительно 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1000 или более нуклеотидов в длину. В некоторых вариантах осуществления матричный полинуклеотид комплементарен части полинуклеотида, содержащего целевую последовательность. При оптимальном выравнивании матричный полинуклеотид может перекрываться с одним или несколькими нуклеотидами целевых последовательностей (к примеру, с приблизительно или более чем приблизительно 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 или более нуклеотидами). В некоторых вариантах осуществления при оптимальном выравнивании матричных последовательности и полинуклеотида, содержащего целевую последовательность, наиболее близкий нуклеотид матричного полинуклеотида находится в пределах приблизительно 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1000, 5000, 10000 или более нуклеотидов от целевой последовательности.In some embodiments, a recombination matrix is also provided. The matrix for recombination may be a component of another vector, which is described herein, may be contained in a separate vector or provided as a separate polynucleotide. In some embodiments, the recombination matrix is designed to serve as a matrix for homologous recombination, such as within or adjacent to a target sequence cut or cleaved with a CRISPR enzyme as part of a CRISPR complex. The matrix polynucleotide may be of any suitable length, such as, for example, approximately or more than approximately 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1000 or more nucleotides in length. In some embodiments, the template polynucleotide is complementary to a portion of the polynucleotide containing the target sequence. With optimal alignment, the template polynucleotide can overlap with one or more nucleotides of the target sequences (for example, with approximately or more than approximately 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 or more nucleotides). In some embodiments, with optimal alignment of the matrix sequence and the polynucleotide containing the target sequence, the closest nucleotide of the template polynucleotide is in the range of about 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500 , 1000, 5000, 10000 or more nucleotides from the target sequence.

В некоторых вариантах осуществления фермент CRISPR является частью слитого белка, содержащего один или несколько доменов гетерологичного белка (к примеру, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более доменов в дополнение к ферменту CRISPR). Слитый белок, содержащий фермент CRISPR, может содержать любую дополнительную последовательность белка и необязательно линкерную последовательность между любыми двумя доменами. Примеры белковых доменов, которые могут быть слиты с ферментом CRISPR, включают, без ограничения, эпитопные метки, последовательности генов-репортеров и белковые домены с одним или несколькими из следующих видов активности: метилазной активности, деметилазной активности, активности для активации транскрипции, активности для репрессии транскрипции, активности фактора освобождения при транскрипции, активности для модификации гистонов, активности для расщепления ДНК и активности для связывания нуклеиновой кислоты. Неограничивающие примеры эпитопных меток включают гистидиновые (His) метки, V5-метки, FLAG-метки, метки гемагглютинина вируса гриппа (YA), Myc-метки, VSV-G-метки и тиоредоксиновые (Trx) метки. Примеры генов-репортеров включают, без ограничения, глутатион-S-трансферазу (GST), пероксидазу хрена (HRP), хлорамфеникол-ацетилтрансферазу (CAT), бета-галактозидазу, бета-глюкуронидазу, люциферазу, зеленый флуоресцентный белок (GFP), HcRed, DsRed, голубой флуоресцентный белок (CFP), желтый флуоресцентный белок (YFP) и автофлуорисцирующие белки, в том числе синий флуоресцентный белок (BFP). Фермент CRISPR может быть слит с последовательностью гена, кодирующей белок или фрагмент белка, которые связываются с молекулой ДНК или связываются с другими клеточными молекулами, в том числе, без ограничения, связывающий мальтозу белок (MBP), S-метку, продукты слияния Lex A и ДНК-связывающего домена (DBD), продукты слияния GAL4 и ДНК-связывающего домена и продукты слияния белка BP16 вируса простого герпеса (HSV). Дополнительные домены, которые могут образовывать часть слитого белка, содержащего фермент CRISPR, описаны в US 20110059502, включенном в данный документ при помощи ссылки. В некоторых вариантах осуществления меченный фермент CRISPR используют для идентификации расположения целевой последовательности.In some embodiments, the CRISPR enzyme is part of a fusion protein containing one or more domains of a heterologous protein (for example, approximately or more than approximately 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, or more domains in addition to the CRISPR enzyme). A fusion protein containing a CRISPR enzyme may contain any additional protein sequence and optionally a linker sequence between any two domains. Examples of protein domains that can be fused to the CRISPR enzyme include, but are not limited to, epitope labels, reporter gene sequences, and protein domains with one or more of the following activities: methylase activity, demethylase activity, transcriptional activation activity, repression activity transcription, transcription release factor activity, histone modification activity, DNA cleavage activity, and nucleic acid binding activity. Non-limiting examples of epitope tags include histidine (His) tags, V5 tags, FLAG tags, influenza virus hemagglutinin (YA) tags, Myc tags, VSV-G tags, and thioredoxin (Trx) tags. Examples of reporter genes include, but are not limited to, glutathione S-transferase (GST), horseradish peroxidase (HRP), chloramphenicol acetyltransferase (CAT), beta-galactosidase, beta-glucuronidase, luciferase, green fluorescent protein (GFP), HcRed, DsRed, blue fluorescent protein (CFP), yellow fluorescent protein (YFP), and autofluorescent proteins, including blue fluorescent protein (BFP). The CRISPR enzyme can be fused to a gene sequence that encodes a protein or protein fragment that binds to a DNA molecule or binds to other cellular molecules, including, without limitation, maltose binding protein (MBP), S-tag, Lex A fusion products, and DNA binding domain (DBD), fusion products of GAL4 and DNA binding domain and fusion products of herpes simplex virus BP16 protein (HSV). Additional domains that can form part of a fusion protein containing the CRISPR enzyme are described in US 20110059502, incorporated herein by reference. In some embodiments, the labeled CRISPR enzyme is used to identify the location of the target sequence.

В некоторых аспектах настоящее изобретение предусматривает способы, включающие доставку одного или нескольких полинуклеотидов, как, например, или одного, или нескольких векторов, которые описаны в данном документе, одного или нескольких их транскриптов и/или одного белка или белков, транскрибируемых с них, в клетку-хозяина. В некоторых аспектах настоящее изобретение дополнительно предусматривает клетки, полученные при помощи таких способов, и организмы (такие как животные, растения или грибы), содержащие такие клетки или полученные из них. В некоторых вариантах осуществления фермент CRISPR в комбинации с (и необязательно образующий комплекс с) направляющей последовательностью доставляют в клетку. Традиционные способы переноса генов с использованием вирусов и без использования вирусов можно применять для введения нуклеиновых кислот в клетки млекопитающих или целевые ткани. Такие способы можно использовать для введения нуклеиновых кислот, кодирующих компоненты системы CRISPR, в клетки в культуре и в организме-хозяине. Системы доставки на основе отличных от вирусных векторов включают ДНК-плазмиды, РНК (к примеру, транскрипт вектора, описанного в данном документе), "оголенную" нуклеиновую кислоту и нуклеиновую кислоту, образующую комплекс со средством доставки, как, например, липосому. Системы доставки на основе вирусного вектора включают ДНК- и РНК-вирусы, которые имеют либо эписомальный, либо интегрированный геномы после доставки в клетку. В отношении обзора процедур генной терапии см. Anderson, Science 256: 808-813 (1992); Nabel & Feigner, TIBTECH 11: 211-217 (1993); Mitani & Caskey, TIBTECH 11: 162-166 (1993); Dillon, TIBTECH 11: 167-175 (1993); Miller, Nature 357: 455-460 (1992); Van Brunt, Biotechnology 6(10): 1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8: 35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1): 31-44 (1995); Haddada et al., в Current Topics in Microbiology and Immunology, Doerfler and

Figure 00000012
(eds) (1995); и Yu et al., Gene Therapy 1: 13-26 (1994).In some aspects, the present invention provides methods comprising delivering one or more polynucleotides, such as, for example, one or more vectors described herein, one or more of their transcripts and / or one protein or proteins transcribed from them, into host cell. In some aspects, the present invention further provides cells obtained by such methods and organisms (such as animals, plants or fungi) containing or derived from such cells. In some embodiments, the CRISPR enzyme, in combination with (and optionally complexing with) the guide sequence, is delivered to the cell. Conventional viral and non-viral gene transfer methods can be used to introduce nucleic acids into mammalian cells or target tissues. Such methods can be used to introduce nucleic acids encoding components of the CRISPR system into cells in a culture and in a host organism. Delivery systems based on non-viral vectors include DNA plasmids, RNA (for example, a transcript of the vector described herein), a “bare” nucleic acid and a nucleic acid that is complexed with a delivery vehicle, such as a liposome. Viral vector-based delivery systems include DNA and RNA viruses that have either episomal or integrated genomes after delivery to the cell. For a review of gene therapy procedures, see Anderson, Science 256: 808-813 (1992); Nabel & Feigner, TIBTECH 11: 211-217 (1993); Mitani & Caskey, TIBTECH 11: 162-166 (1993); Dillon, TIBTECH 11: 167-175 (1993); Miller, Nature 357: 455-460 (1992); Van Brunt, Biotechnology 6 (10): 1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8: 35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51 (1): 31-44 (1995); Haddada et al., In Current Topics in Microbiology and Immunology, Doerfler and
Figure 00000012
(eds) (1995); and Yu et al., Gene Therapy 1: 13-26 (1994).

Способы отличной от вирусной доставки нуклеиновых кислот включают липофекцию, нуклеофекцию, микроинъекцию, баллистическую трансфекцию, виросомы, липосомы, иммунолипосомы, поликатион или конъюгаты липид : нуклеиновая кислота, "оголенную" ДНК, искусственные вирионы и повышенное средством поглощение ДНК. Липофекция описана, например, в патентах США №№5049386, 4946787 и 4897355), и реагенты для липофекции продают в промышленных масштабах (к примеру, Transfectam™ и Lipofectin™). Катионные и нейтральные липиды, которые подходят для эффективной липофекции с узнаванием рецептора полинуклеотидов, включают таковые из Feigner, WO 91/17424; WO 91/16024. Доставка может осуществляться в клетки (к примеру, in vitro или ex vivo введение) или целевые ткани (к примеру, in vivo введение).Methods other than viral nucleic acid delivery include lipofection, nucleofection, microinjection, ballistic transfection, virosomes, liposomes, immunoliposomes, polycation or conjugates lipid: nucleic acid, naked DNA, artificial virions and enhanced DNA uptake. Lipofection is described, for example, in US Pat. Nos. 5,049,386, 4,946,787 and 4,897,355), and lipofection reagents are sold commercially (for example, Transfectam ™ and Lipofectin ™). Cationic and neutral lipids that are suitable for effective lipofection with recognition of the polynucleotide receptor include those from Feigner, WO 91/17424; WO 91/16024. Delivery can take place in cells (e.g., in vitro or ex vivo administration) or target tissues (e.g., in vivo administration).

Получение комплексов липид : нуклеиновая кислота, в том числе целенаправленно воздействующих липосом, как, например, иммунолипидных комплексов, хорошо известно специалистам в данной области (см., к примеру, Crystal, Science 270: 404-410 (1995); Blaese et al., Cancer Gene Ther. 2: 291-297 (1995); Behr et al., Bioconjugate Chem. 5: 382-389 (1994); Remy et al., Bioconjugate Chem. 5: 647-654 (1994); Gao et al., Gene Therapy 2: 710-722 (1995); Ahmad et al., Cancer Res. 52: 4817-4820 (1992); патенты США №№4186183, 4217344, 4235871, 4261975, 4485054, 4501728, 4774085, 4837028 и 4946787).The preparation of lipid: nucleic acid complexes, including targeted liposomes, such as immunolipid complexes, is well known to specialists in this field (see, for example, Crystal, Science 270: 404-410 (1995); Blaese et al. Cancer Gene Ther. 2: 291-297 (1995); Behr et al., Bioconjugate Chem. 5: 382-389 (1994); Remy et al. Bioconjugate Chem. 5: 647-654 (1994); Gao et al., Gene Therapy 2: 710-722 (1995); Ahmad et al., Cancer Res. 52: 4817-4820 (1992); U.S. Pat. and 4946787).

При применении систем на основе РНК- и ДНК-вирусов для доставки нуклеиновых кислот используют тщательно разработанные способы обеспечения целенаправленного воздействия вируса на конкретные клетки в организме и перемещения полезных последовательностей вируса в ядро. Вирусные векторы можно вводить непосредственно пациентам (in vivo) или их можно использовать для обработки клеток in vitro и модифицированные клетки можно необязательно вводить пациентам (ex vivo). Традиционные системы на основе вирусов могут включать ретровирусные, лентивирусные, аденовирусные векторы, векторы на основе аденоассоциированного вируса и вируса простого герпеса для переноса генов. Интеграция в геном хозяина возможна со способами переноса генов на основе ретровируса, лентивируса и аденоассоциированного вируса, что часто приводит к длительной экспрессии встроенного трансгена. Кроме того, высокие показатели эффективности трансдукции наблюдали у многих различных типов клеток и целевых тканей.When applying systems based on RNA and DNA viruses for the delivery of nucleic acids, carefully developed methods are used to ensure the targeted action of the virus on specific cells in the body and the transfer of useful virus sequences to the nucleus. Viral vectors can be administered directly to patients (in vivo) or they can be used to treat cells in vitro, and modified cells can optionally be administered to patients (ex vivo). Conventional virus-based systems may include retroviral, lentiviral, adenoviral vectors, vectors based on adeno-associated virus and herpes simplex virus for gene transfer. Integration into the host genome is possible with gene transfer methods based on retrovirus, lentivirus and adeno-associated virus, which often leads to long-term expression of the inserted transgene. In addition, high transduction efficiencies were observed in many different types of cells and target tissues.

Тропизм ретровирусов может быть изменен путем включения чужеродных белков оболочки, расширяя возможную целевую популяцию целевых клеток. Лентивирусные векторы являются ретровирусными векторами, которые способны трансфицировать или инфицировать неделящиеся клетки и, как правило, дают высокие вирусные титры. Выбор системы переноса генов на основе ретровирусов, таким образом, будет зависеть от целевой ткани. Ретровирусные векторы состоят из действующих в цис-положении длинных концевых повторов с упаковывающей способностью до 6-10 п.о. чужеродной последовательности. Минимальных действующих в цис-положении LTR достаточно для репликации и упаковки векторов, которые затем используют для интеграции терапевтического гена в целевую клетку с получением постоянной экспрессии трансгена. Широко применяемые ретровирусные векторы включают такие, основанные на вирусе лейкоза (MuLV), вирусе лейкоза гиббонов (GaLV), вирусе иммунодефицита обезьян (SIV), вирусе иммунодефицита человека (HIV) и их комбинациях (см., к примеру, Buchscher et al., J. Virol. 66: 2731-2739 (1992); Johann et al., J. Virol. 66: 1635-1640 (1992); Sommnerfelt et al., Virol. 176: 58-59 (1990); Wilson et al., J. Virol. 63: 2374-2378 (1989); Miller et al., J. Virol. 65: 2220-2224 (1991); PCT/US94/05700). В применениях, в которых транзиентная экспрессия является предпочтительной, можно применять системы на основе аденовирусов. Векторы на основе аденовирусов способны проявлять очень высокую эффективность трансдукции во многих типах клеток и не требуют деления клеток. С такими векторами были получены высокие титры и уровни экспрессии. Такой вектор можно получать в больших количествах в относительно простой системе. Векторы на основе аденоассоциированного вируса ("AAV") также можно использовать для трансдукции в клетки целевых нуклеиновых кислот, к примеру, при получении in vitro нуклеиновых кислот и пептидов и для процедур генной терапии in vivo и ex vivo (см., к примеру, West et al., Virology 160: 38-47 (1987); патент США №4797368; WO 93/24641; Kotin, Human Gene Therapy 5: 793-801 (1994); Muzyczka, J. Clin. Invest. 94: 1351 (1994). Создание рекомбинантных AAV-векторов описано в ряде публикаций, в том числе в патенте США №5173414; Tratschin et al., Mol. Cell. Biol. 5: 3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4: 2072-2081 (1984); Hermonat & Muzyczka, PNAS 81: 6466-6470 (1984); и Samulski et al., J. Virol. 63: 03822-3828 (1989).Tropism of retroviruses can be altered by incorporating foreign envelope proteins, expanding a possible target population of target cells. Lentiviral vectors are retroviral vectors that are able to transfect or infect non-dividing cells and, as a rule, give high viral titers. The choice of a retrovirus-based gene transfer system will thus depend on the target tissue. Retroviral vectors consist of long terminal repeats active in the cis position with a packing capacity of up to 6-10 bp alien sequence. The minimal cis-acting LTRs are sufficient for replication and packaging of vectors, which are then used to integrate the therapeutic gene into the target cell to obtain constant transgene expression. Widely used retroviral vectors include those based on leukemia virus (MuLV), gibbon leukemia virus (GaLV), monkey immunodeficiency virus (SIV), human immunodeficiency virus (HIV), and combinations thereof (see, for example, Buchscher et al., J. Virol. 66: 2731-2739 (1992); Johann et al., J. Virol. 66: 1635-1640 (1992); Sommnerfelt et al., Virol. 176: 58-59 (1990); Wilson et al ., J. Virol. 63: 2374-2378 (1989); Miller et al., J. Virol. 65: 2220-2224 (1991); PCT / US94 / 05700). In applications in which transient expression is preferred, adenovirus-based systems can be used. Adenovirus-based vectors are capable of exhibiting very high transduction efficiencies in many types of cells and do not require cell division. High titers and expression levels were obtained with such vectors. Such a vector can be obtained in large quantities in a relatively simple system. Adeno-associated virus ("AAV") vectors can also be used to transduce target nucleic acids into cells, for example, in the preparation of in vitro nucleic acids and peptides and for gene therapy procedures in vivo and ex vivo (see, for example, West et al., Virology 160: 38-47 (1987); U.S. Patent No. 4,793,768; WO 93/24641; Kotin, Human Gene Therapy 5: 793-801 (1994); Muzyczka, J. Clin. Invest. 94: 1351 ( 1994) The creation of recombinant AAV vectors is described in a number of publications, including US Pat. No. 5,173,414; Tratschin et al., Mol. Cell. Biol. 5: 3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4: 2072-2081 (1984); Hermonat & Muzyczka, PNAS 81: 6466-6470 (1984); and Samulski et al., J. Virol. 63: 038 22-3828 (1989).

Упаковывающие клетки, как правило, используют для получения вирусных частиц, которые способны инфицировать клетку-хозяина. Такие клетки включают клетки 293, которые упаковывают аденовирус, и клетки ψ2 или клетки PA317, которые упаковывают ретровирус. Вирусные векторы, используемые в генной терапии, как правило, создают путем получения линии клеток, которые упаковывают вектор на основе нуклеиновой кислоты в вирусную частицу. Векторы обычно содержат минимальные вирусные последовательности, необходимые для упаковки и последующей интеграции в хозяина, при этом другие вирусные последовательности замещены на кассету экспрессии для экспрессии полинуклеотида(ов). Отсутствующие вирусные функции, как правило, обеспечивают во вспомогательном объекте при помощи линии упаковывающих клеток. Например, AAV-векторы, применяемые в генной терапии, как правило, имеют только ITR-последовательности из генома AAV, которые необходимы для упаковки и интеграции в геном хозяина. Вирусная ДНК упакована в линии клеток, которая содержит вспомогательную плазмиду, кодирующую другие гены AAV, а именно rep и cap, но без ITR-последовательностей. Линия клеток также может быть инфицирована аденовирусом в качестве вируса-помощника. Вирус-помощник способствует репликации AAV-вектора и экспрессии генов AAV из вспомогательной плазмиды. Вспомогательная плазмида не упакована в значительном количестве в связи с отсутствием ITR-последовательностей. Инфицирование аденовирусом может быть снижено, к примеру, при помощи тепловой обработки, к которой аденовирус более чувствителен, чем AAV. Дополнительные способы доставки нуклеиновых кислот в клетки известны специалистам в данной области. См., например, US 20030087817, включенный в данный документ при помощи ссылки.Packaging cells are typically used to produce viral particles that are capable of infecting a host cell. Such cells include 293 cells that pack the adenovirus, and ψ2 cells or PA317 cells that pack the retrovirus. Viral vectors used in gene therapy are typically created by producing a cell line that packs a nucleic acid vector into a viral particle. The vectors usually contain the minimum viral sequences necessary for packaging and subsequent integration into the host, with other viral sequences replaced on the expression cassette for expression of polynucleotide (s). Missing viral functions, as a rule, are provided in an auxiliary object by means of a line of packaging cells. For example, AAV vectors used in gene therapy, as a rule, have only ITR sequences from the AAV genome, which are necessary for packaging and integration into the host genome. Viral DNA is packaged in a cell line that contains an auxiliary plasmid encoding other AAV genes, namely rep and cap, but without ITR sequences. The cell line can also be infected with adenovirus as a helper virus. The helper virus facilitates the replication of the AAV vector and the expression of AAV genes from an auxiliary plasmid. Auxiliary plasmid is not packaged in significant quantities due to the lack of ITR sequences. Adenovirus infection can be reduced, for example, by heat treatment, to which adenovirus is more sensitive than AAV. Additional methods for delivering nucleic acids to cells are known to those skilled in the art. See, for example, US20030087817, incorporated herein by reference.

В некоторых вариантах осуществления клетка-хозяин транзиентно или не транзиентно трасфицирована одним или несколькими векторами, описанными в данном документе. В некоторых вариантах осуществления клетка трансфицирована так, как это в естественных условиях происходит у субъекта. В некоторых вариантах осуществления клетка, которую трансфицируют, взята из субъекта. В некоторых вариантах осуществления клетка получена из клеток, взятых из субъекта, как, например, линии клеток. Широкий спектр линий клеток для культуры тканей известен в уровне техники. Примеры линий клеток включают, без ограничения, С8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, эпителиальные клетки почки обезьяны BS-C-1, эмбриональные фибробласты мыши BALB/ 3T3, 3T3 Swiss, 3T3-L1, фетальные фибробласты человека 132-d5; фибробласты мыши 10.1, 293-Т, 3T3, 721, 9L, А2780, A2780ADR, A2780cis, А172, А20, А253, А431, А-549, ALC, В16, В35, клетки BCP-1, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10Т1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, СНО-K1, СНО-K2, CHO-T, СНО Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, Н1299, Н69, НВ54, НВ55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, клетки JY, клетки K562, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, линии клеток OPCN/OPCT, Peer, PNT-1A/PNT2, RenCa, RIN-5F, RMA/RMAS, клетки Saos-2, Sf-9, SkBr3, T2, T-47D, T84, линия клеток THP1, U373, U87, U937, VCaP, клетки Vero, WM39, WT-49, X63, YAC-1, YAR и их трансгенные варианты. Линии клеток доступны из ряда источников, известных специалистам в данной области (см., к примеру, Американскую коллекцию типовых культур (ATCC) (Манассас, Вирджиния)). В некоторых вариантах осуществления клетку, трансфицированную одним или несколькими векторами, описанными в данном документе, используют для получения новой линии клеток, содержащей одну или несколько полученных из вектора последовательностей. В некоторых вариантах осуществления клетку, транзиентно трансфицированную компонентами системы CRISPR, которая описана в данном документе (как, например, путем транзиентной трансфекции одним или несколькими векторами или трансфекции РНК), и модифицированную при помощи активности комплекса CRISPR, используют для получения новой линии клеток, содержащей клетки, которые содержат модификацию, но у которых отсутствует любая другая экзогенная последовательность. В некоторых вариантах осуществления клетки, транзиентно или не транзиентно трансфицированные одним или несколькими векторами, описанными в данном документе, или линии клеток, полученные из таких клеток, использовали при оценивании одного или нескольких тестовых соединений.In some embodiments, the host cell is transiently or non-transiently transfected with one or more of the vectors described herein. In some embodiments, the cell is transfected as in vivo in a subject. In some embodiments, the cell to be transfected is taken from a subject. In some embodiments, a cell is derived from cells taken from a subject, such as a cell line. A wide range of cell lines for tissue culture are known in the art. Examples of cell lines include, without limitation, C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1 , COS-6, COS-M6A, monkey kidney epithelial cells BS-C-1, mouse embryonic fibroblasts BALB / 3T3, 3T3 Swiss, 3T3-L1, human fetal fibroblasts 132-d5; mouse fibroblasts 10.1, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, BCP-1, BEAS-2B, bEnd.3 cells , BHK-21, BR 293, BxPC3, C3H-10T1 / 2, C6 / 36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr - / -, COR-L23, COR-L23 / CPR, COR-L23 / 5010, COR-L23 / R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2 , EM3, EMT6 / AR1, EMT6 / AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, JY cells, K562 cells , Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II , MDCK II, MOR / 0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69 / CPR, NCI-H69 / LX10, NCI-H69 / LX20, NCI-H69 / LX4, NIH-3T3, NALM- 1, NW-145, cell lines OPCN / OPCT, Peer, PNT-1A / PNT2, RenCa, RIN-5F, RMA / RMAS, Saos-2, Sf-9, SkBr3, T2, T-47D, T84 cells, line cells THP1, U373, U87, U937, VCaP, cell Ki Vero, WM39, WT-49, X63, YAC-1, YAR and their transgenic variants. Cell lines are available from a number of sources known to those skilled in the art (see, for example, American Type Culture Collection (ATCC) (Manassas, Virginia)). In some embodiments, a cell transfected with one or more of the vectors described herein is used to produce a new cell line containing one or more sequences derived from a vector. In some embodiments, a cell transiently transfected with CRISPR system components as described herein (such as by transient transfection with one or more vectors or RNA transfection) and modified by CRISPR complex activity is used to produce a new cell line containing cells that contain a modification, but which lack any other exogenous sequence. In some embodiments, cells transiently or non-transiently transfected with one or more of the vectors described herein, or cell lines derived from such cells, were used to evaluate one or more test compounds.

В некоторых вариантах осуществления один или несколько векторов, описанных в данном документе, используют для получения отличного от человека трансгенного животного или трансгенного растения. В некоторых вариантах осуществления трансгенным животным является млекопитающее, как, например, мышь, крыса или кролик. В определенных вариантах осуществления организмом или субъектом является растение. В определенных вариантах осуществления организмом, или субъектом, или растением является водоросль. Способы получения трансгенных растений и животных известны в уровне техники и, как правило, начинаются со способа трансфекции клетки, такого как описанный в данном документе.In some embodiments, one or more of the vectors described herein is used to produce a non-human transgenic animal or transgenic plant. In some embodiments, the transgenic animal is a mammal, such as, for example, a mouse, rat, or rabbit. In certain embodiments, the organism or subject is a plant. In certain embodiments, the organism, or subject, or plant is an alga. Methods for producing transgenic plants and animals are known in the art and typically begin with a method for transfecting a cell, such as described herein.

В одном аспекте настоящее изобретение предусматривает способы модификации целевого полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида с модификацией, таким образом, целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью.In one aspect, the present invention provides methods for modifying a target polynucleotide in a eukaryotic cell. In some embodiments, the method includes providing binding of the CRISPR complex to a target polynucleotide to cleave said target polynucleotide, thereby modifying the target polynucleotide, wherein the CRISPR complex contains a CRISPR enzyme that is complexed with a guide sequence that hybridizes to the target sequence in the specified target polynucleotide, where the specified guide sequence is associated with a paired tracr sequence, which, in turn, iziruetsya with tracr-sequence.

В одном аспекте настоящее изобретение предусматривает способ модификации экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с полинуклеотидом так, что указанное связывание приводит к повышенной или пониженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью.In one aspect, the present invention provides a method for modifying expression of a polynucleotide in a eukaryotic cell. In some embodiments, the method comprises providing binding of the CRISPR complex to a polynucleotide such that said binding results in increased or decreased expression of said polynucleotide; where the CRISPR complex contains the CRISPR enzyme, which forms a complex with a guide sequence that hybridizes with the target sequence in the specified target polynucleotide, where the specified guide sequence is associated with a paired tracr sequence, which, in turn, hybridizes with the tracr sequence.

С учетом недавних достижений в области геномики сельскохозяйственных культур возможность применения системы CRISPR-Cas для осуществления эффективных и экономичных редактирования генов и манипуляции с ними обеспечит возможность быстрого отбора и сравнения одиночных и мультиплексных генетических манипуляций для трансформирования таких геномов в отношении повышенного производства и улучшенных признаков. В связи с этим делается ссылка на патенты США и публикации патентов США: патент США №6603061 - опосредованный агробактериями способ трансформации растений (Agrobacterium-Mediated Plant Transformation Method); патент США №7868149 - последовательности генома растений и их применение (Plant Genome Sequences and Uses Thereof) и US 2009/0100536 - трансгенные растения с улучшенными агротехническими признаками (Transgenic Plants with Enhanced Agronomic Traits), все содержания и раскрытия каждого из которых включены в данный документ при помощи ссылки в полном объеме. При осуществлении на практике настоящего изобретения содержание и раскрытие Morrell et al "Crop genomics:advances and applications" Nat Rev Genet. 2011 Dec 29; 13(2): 85-96 также включены в данный документ при помощи ссылки в полном объеме. В преимущественном варианте осуществления настоящего изобретения систему CRISPR/Cas9 используют для конструирования микроводорослей (пример 15). Соответственно, в данном документе ссылка на клетки животных также может быть применима, с учетом необходимых изменений, по отношению к клеткам растений, если явно не следует иное.Given recent advances in crop genomics, the possibility of using the CRISPR-Cas system for efficient and cost-effective gene editing and manipulation will provide the ability to quickly select and compare single and multiplex genetic manipulations to transform such genomes in relation to increased production and improved traits. In this regard, reference is made to US patents and publications of US patents: US patent No. 6603061 - Agrobacterium-mediated Plant Transformation Method (Agrobacterium-Mediated Plant Transformation Method); US patent No. 7868149 - sequences of the plant genome and their use (Plant Genome Sequences and Uses Thereof) and US 2009/0100536 - transgenic plants with improved agrotechnical characteristics (Transgenic Plants with Enhanced Agronomic Traits), all contents and disclosures of each of which are included in this document by reference in full. In practicing the present invention, the contents and disclosure of Morrell et al "Crop genomics: advances and applications" Nat Rev Genet. 2011 Dec 29; 13 (2): 85-96 are also incorporated herein by reference in full. In an advantageous embodiment of the present invention, the CRISPR / Cas9 system is used to construct microalgae (Example 15). Accordingly, in this document, reference to animal cells may also be applicable, subject to necessary changes, in relation to plant cells, unless explicitly stated otherwise.

В одном аспекте настоящее изобретение предусматривает способы модификации целевого полинуклеотида в эукариотической клетке, что может происходить in vivo, ex vivo или in vitro. В некоторых вариантах осуществления способ включает забор клетки или популяции клеток из человека, или отличного от человека животного, или растения (в том числе микроскопических водорослей) и модификацию клетки или клеток. Культивирование можно осуществлять на любой стадии ex vivo. Клетку или клетки можно даже повторно вводить отличному от человека животному или в растение (в том числе микроскопические водоросли).In one aspect, the present invention provides methods for modifying a target polynucleotide in a eukaryotic cell, which may occur in vivo, ex vivo or in vitro. In some embodiments, the method comprises collecting a cell or population of cells from a person, or an animal or plant other than a person (including microscopic algae), and modifying the cell or cells. Cultivation can be carried out at any ex vivo stage. A cell or cells can even be reintroduced to a non-human animal or plant (including microscopic algae).

У растений патогены часто являются специфичными по отношению к хозяину. Например, Fusarium oxysporum f. sp. lycopersici вызывает фузариозный вилт томата, но поражает только томат, a F. oxysporum f. dianthii и Puccinia graminis f. sp. tritici поражают только пшеницу. Растения обладают присущими и индуцированными защитными реакциями, обеспечивающими устойчивость к большинству патогенов. Мутации и события рекомбинации в поколениях растений приводят к генетической изменчивости, которая обуславливает восприимчивость, тем более, что патогены размножаются с большей частотой, чем растения. У растений может наблюдаться устойчивость видов-нехозяев, например, хозяин и патоген являются несовместимыми. Также может наблюдаться горизонтальная устойчивость, например, частичная устойчивость ко всем расам патогена, обычно контролируемая многими генами, и вертикальная устойчивость, например, полная устойчивость к некоторым расам патогена, но не к другим расам, обычно контролируемая несколькими генами. На уровне взаимодействия генов растения и патогены эволюционируют совместно, а генетические изменения одного уравновешивают изменения другого. Соответственно, используя естественную изменчивость, селекционеры комбинируют наиболее полезные гены для урожайности, качества, однородности, выносливости, устойчивости. Источники генов устойчивости включают нативные или чужеродные сорта, старинные сорта, родственные дикорастущие растения и индуцированные мутации, например, при обработке растительного материала мутагенными средствами. Применяя настоящее изобретение, селекционеры растений получают новый инструмент для индукции мутаций. Соответственно, специалист в данной области может проанализировать геном источников генов устойчивости, а в отношении сортов, имеющих желаемые характеристики или признаки, использовать настоящее изобретение для индукции появления генов устойчивости с большей точностью, чем в случае применявшихся ранее мутагенных средств, и, следовательно, для ускорения и улучшения программ селекции растений.In plants, pathogens are often specific for the host. For example, Fusarium oxysporum f. sp. lycopersici causes the Fusarium wilt of the tomato, but only the tomato, a F. oxysporum f. dianthii and Puccinia graminis f. sp. tritici only affects wheat. Plants possess inherent and induced protective responses that provide resistance to most pathogens. Mutations and recombination events in plant generations lead to genetic variability, which causes susceptibility, especially since pathogens multiply with greater frequency than plants. In plants, resistance of non-host species may be observed, for example, the host and pathogen are incompatible. There may also be horizontal resistance, for example, partial resistance to all races of a pathogen, usually controlled by many genes, and vertical resistance, for example, full resistance to some races of a pathogen, but not to other races, usually controlled by several genes. At the level of gene interaction, plants and pathogens evolve together, and genetic changes in one balance the changes in the other. Accordingly, using natural variability, breeders combine the most useful genes for productivity, quality, uniformity, endurance, stability. Sources of resistance genes include native or foreign varieties, vintage varieties, related wild plants, and induced mutations, for example, when processing plant material with mutagenic agents. Using the present invention, plant breeders receive a new tool for the induction of mutations. Accordingly, a person skilled in the art can analyze the genome of sources of resistance genes, and for varieties having the desired characteristics or characteristics, use the present invention to induce the appearance of resistance genes with greater accuracy than in the case of previously used mutagenic agents, and, therefore, to accelerate and improving plant breeding programs.

В одном аспекте настоящее изобретение предусматривает наборы, содержащие любой один или несколько из элементов, раскрытых в приведенных выше способах и композициях. В некоторых вариантах осуществления набор содержит векторную систему и инструкции по применению набора. В некоторых вариантах осуществления векторная система содержит (а) первый регуляторный элемент, функционально связанный с парной tracr-последовательностью и одним или несколькими сайтами встраивания для встраивания направляющей последовательности выше парной tracr-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью; и/или (b) второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации. Элементы могут быть предоставлены отдельно или в комбинациях и могут быть предоставлены в любом подходящем контейнере, как, например, пузырьке, флаконе или пробирке. В некоторых вариантах осуществления набор включает инструкции на одном или нескольких языках, например, на более чем одном языке.In one aspect, the present invention provides kits comprising any one or more of the elements disclosed in the above methods and compositions. In some embodiments, the kit comprises a vector system and instructions for using the kit. In some embodiments, the vector system comprises (a) a first regulatory element operably linked to a paired tracr sequence and one or more embedding sites for embedding a guide sequence above a paired tracr sequence, where upon expression the guide sequence controls the sequence-specific binding of the CRISPR complex to target sequence in a eukaryotic cell, where the CRISPR complex contains the CRISPR enzyme, forming a complex with (1) the guide The sequence which hybridizes with the target sequence, and (2) tracr-pair sequence that hybridizes to tracr-sequence; and / or (b) a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising a nuclear localization sequence. Elements may be provided separately or in combination and may be provided in any suitable container, such as, for example, a vial, vial or tube. In some embodiments, a kit includes instructions in one or more languages, for example, in more than one language.

В некоторых вариантах осуществления набор содержит один или несколько реагентов для применения в способе, в котором используется один или несколько элементов, описанных в данном документе. Реагенты могут быть предоставлены в любом подходящем контейнере. Например, набор может предусматривать один или несколько реакционных буферов или буферов для хранения. Реагенты могут быть предоставлены в форме, которая применима в конкретном анализе, или в форме, которая предусматривает добавление одного или нескольких других компонентов перед применением (к примеру, в форме концентрата или лиофилизированной форме). Буфер может быть любым буфером, в том числе без ограничения буфером с карбонатом натрия, буфером с бикарбонатом натрия, боратным буфером, Tris-буфером, буфером MOPS, буфером HEPES и их комбинациями. В некоторых вариантах осуществления буфер является щелочным. В некоторых вариантах осуществления буфер имеет значение pH от приблизительно 7 до приблизительно 10. В некоторых вариантах осуществления набор содержит один или несколько олигонуклеотидов, соответствующих направляющей последовательности, для встраивания в вектор для того, чтобы имела место функциональная связь направляющей последовательности и регуляторного элемента. В некоторых вариантах осуществления набор содержит матричный полинуклеотид для гомологичной рекомбинации.In some embodiments, the kit contains one or more reagents for use in a method that uses one or more of the elements described herein. Reagents may be provided in any suitable container. For example, a kit may include one or more reaction buffers or storage buffers. Reagents may be provided in a form that is applicable in a particular assay, or in a form that involves the addition of one or more other components before use (for example, in the form of a concentrate or lyophilized form). The buffer may be any buffer, including, but not limited to, sodium carbonate buffer, sodium bicarbonate buffer, borate buffer, Tris buffer, MOPS buffer, HEPES buffer, and combinations thereof. In some embodiments, the implementation of the buffer is alkaline. In some embodiments, the buffer has a pH of from about 7 to about 10. In some embodiments, the kit contains one or more oligonucleotides corresponding to the guide sequence for insertion into the vector so that the guide link and regulatory element are functional. In some embodiments, the kit comprises a template polynucleotide for homologous recombination.

В одном аспекте настоящее изобретение предусматривает способы применения одного или нескольких элементов системы CRISPR. Комплекс CRISPR по настоящему изобретению обеспечивает эффективное средство модификации целевого полинуклеотида. Комплекс CRISPR по настоящему изобретению характеризуется большим разнообразием полезных свойств, включая модификацию (например, делецию, вставку, транслокацию, инактивацию, активацию) целевого полинуклеотида во множестве типов клеток. Комплекс CRISPR по настоящему изобретению как таковой имеет широкий спектр применений, к примеру, в генной терапии, скрининге лекарственных средств, диагностике и прогнозировании заболеваний. Иллюстративный комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, которая гибридизируется с целевой последовательностью в целевом полинуклеотиде. Направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью.In one aspect, the present invention provides methods for using one or more elements of a CRISPR system. The CRISPR complex of the present invention provides an effective means of modifying the target polynucleotide. The CRISPR complex of the present invention is characterized by a wide variety of useful properties, including the modification (for example, deletion, insertion, translocation, inactivation, activation) of the target polynucleotide in many cell types. The CRISPR complex of the present invention as such has a wide range of applications, for example, in gene therapy, drug screening, diagnosis and prognosis of diseases. The exemplary CRISPR complex contains the CRISPR enzyme, which forms a complex with a guide sequence that hybridizes with the target sequence in the target polynucleotide. The directing sequence is linked to a paired tracr sequence, which in turn hybridizes to the tracr sequence.

Целевой полинуклеотид комплекса CRISPR может быть любым полинуклеотидом, эндогенным или экзогенным по отношению к эукариотической клетке. Например, целевой полинуклеотид может быть полинуклеотидом, находящимся в ядре эукариотической клетки. Целевой полинуклеотид может быть последовательностью, кодирующей продукт гена (к примеру, белок), или некодирующей последовательностью (к примеру, регуляторным полинуклеотидом или избыточной ДНК). Не желая быть связанными теорией, полагают, что целевая последовательность должна быть ассоциирована с PAM (мотивом, смежным с протоспейсером); то есть короткой последовательностью, узнаваемой комплексом CRISPR. Определенные требования в отношении последовательности и длины PAM различаются в зависимости от применяемого фермента CRISPR, но PAM, как правило, является последовательностью в 2-5 пары оснований, прилегающей к протоспейсеру (то есть целевой последовательности). Примеры последовательностей PAM приведены в разделе "Примеры" ниже, и специалист в данной области сможет выявить дополнительные последовательности PAM для применения с данным ферментом CRISPR.The target polynucleotide of the CRISPR complex may be any polynucleotide endogenous or exogenous to a eukaryotic cell. For example, the target polynucleotide may be a polynucleotide located in the nucleus of a eukaryotic cell. The target polynucleotide may be a sequence encoding a gene product (e.g., a protein), or a non-coding sequence (e.g., a regulatory polynucleotide or excess DNA). Not wishing to be bound by theory, it is believed that the target sequence should be associated with PAM (a motif adjacent to the protospacer); that is, the short sequence recognized by the CRISPR complex. Certain requirements regarding the sequence and length of PAM vary depending on the CRISPR enzyme used, but PAM is usually a 2-5 base pair sequence adjacent to the protospacer (i.e., the target sequence). Examples of PAM sequences are provided in the Examples section below, and one skilled in the art will be able to identify additional PAM sequences for use with this CRISPR enzyme.

Целевой полинуклеотид комплекса CRISPR может включать некоторое количество ассоциированных с заболеваниями генов и полинуклеотидов, а также ассоциированных с биохимическими путями проведения сигнала генов и полинуклеотидов, которые перечислены в предварительных заявках на патент США 61/736527 и 61/748427 с общей ссылкой BI-2011/008/WSGR, номер в реестре 44063-701.101, и BI-2011/008/WSGR, номер в реестре 44063-701.102, соответственно, обе озаглавленные "СИСТЕМЫ, СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИЯ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ" (SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION), поданные 12 декабря 2012 г. и 2 января 2013 г., соответственно, содержания всех из которых включены в данный документ при помощи ссылки в полном объеме.The CRISPR target polynucleotide may include a number of disease-associated genes and polynucleotides, as well as genes and polynucleotides associated with biochemical signaling pathways, which are listed in provisional patent applications US 61/736527 and 61/748427 with general reference BI-2011/008 / WSGR, registry number 44063-701.101, and BI-2011/008 / WSGR, registry number 44063-701.102, respectively, both are entitled "SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCES" filed December 12 January 12 and January 2, 2013, respectively, the contents of all of which are included in this document by reference in full.

Примеры целевых полинуклеотидов включают последовательность, ассоциированную с биохимическими путями проведения сигнала, к примеру, ассоциированные с биохимическими путями проведения сигнала геном или полинуклеотидом. Примеры целевых полинуклеотидов включают ассоциированные с заболеваниями гены или полинуклеотиды. "Ассоциированный с заболеванием" ген или полинуклеотид означает любой ген или полинуклеотид, который обеспечивает продукты транскрипции или трансляции на отклоняющемся от нормы уровне или в отклоняющейся от нормы форме в клетках, полученных из пораженных заболеванием тканей, по сравнению с тканями или клетками контроля без заболевания. Это может быть ген, который начинает экспрессироваться при ненормально высоком уровне; это может быть ген, который начинает экспрессироваться при ненормально низком уровне, где измененная экспрессия коррелирует с появлением и/или развитием заболевания. Ассоциированный с заболеванием ген также означает ген, несущий мутацию(и) или генетическое изменение, который непосредственно ответственен или находится в неравновесном сцеплении с геном(ами), который(е) ответственен(ны) за этиологию заболевания. Транскрибируемые или транслируемые продукты могут быть известными или неизвестными и могут быть на нормальном уровне или на отклоняющемся от нормального уровне.Examples of target polynucleotides include a sequence associated with biochemical signaling pathways, for example, associated with biochemical signaling pathways of a gene or polynucleotide. Examples of target polynucleotides include disease-associated genes or polynucleotides. “Disease-associated” gene or polynucleotide means any gene or polynucleotide that provides transcription or translation products at an abnormal or abnormal form in cells derived from diseased tissues compared to non-diseased tissues or control cells. This may be a gene that begins to be expressed at an abnormally high level; it may be a gene that begins to be expressed at an abnormally low level, where altered expression correlates with the onset and / or development of the disease. A disease-associated gene also means a gene that carries a mutation (s) or genetic change that is directly responsible or is in disequilibrium linkage with the gene (s) that (s) are responsible for the etiology of the disease. The products being translated or translated may be known or unknown and may be at a normal level or at a deviating level.

Примеры ассоциированных с заболеваниями генов и полинуклеотидов доступны от Института генетической медицины Маккьюсика-Натанса (McKusick-Nathans Institute of Genetic Medicine) при Университете Джонса Хопкинса (Johns Hopkins University) (Балтимор, Мэриленд) и Национального центра биотехнологической информации (National Center for Biotechnology Information) при Национальной библиотеке медицины (National Library of Medicine) (Бетесда, Мэриленд), доступных во всемирной сети Интернет.Examples of disease-associated genes and polynucleotides are available from the McKusick-Nathans Institute of Genetic Medicine at Johns Hopkins University (Baltimore, MD) and the National Center for Biotechnology Information at the National Library of Medicine (Bethesda, Maryland), available on the World Wide Web.

Примеры ассоциированных с заболеваниями генов и полинуклеотидов перечислены в таблицах A и B. Конкретная информация в отношении заболеваний доступна от Института генетической медицины Маккьюсика-Натанса (McKusick-Nathans Institute of Genetic Medicine) при Университете Джонса Хопкинса (Johns Hopkins University) (Балтимор, Мэриленд) и Национального центра биотехнологической информации (National Center for Biotechnology Information), Национальной библиотеки медицины (National Library of Medicine) (Бетесда, Мэриленд), доступных во всемирной сети Интернет. Примеры ассоциированных с биохимическими путями проведения сигнала генов и полинуклеотидов перечислены в таблице C.Examples of disease-associated genes and polynucleotides are listed in Tables A and B. Specific disease information is available from the McKusick-Nathans Institute of Genetic Medicine at Johns Hopkins University (Baltimore, Maryland) and the National Center for Biotechnology Information, the National Library of Medicine (Bethesda, MD), available on the Internet. Examples of gene and polynucleotide associated signals with biochemical pathways are listed in Table C.

Мутации в этих генах и путях могут приводить к продуцированию неправильных белков или белков в несоответствующих количествах, которые воздействуют на функцию. Дополнительные примеры генов, заболеваний и белков, таким образом, включены при помощи ссылки из предварительной заявки на патент США 61/736527, поданной 12 декабря 2012 г., и 61/748427, поданной 2 февраля 2013 г. Такие гены, белки и пути могут быть целевым полинуклеотидом комплекса CRISPR.Mutations in these genes and pathways can lead to the production of abnormal proteins or proteins in inappropriate amounts that affect function. Additional examples of genes, diseases, and proteins are thus incorporated by reference from provisional patent application US 61/736527, filed December 12, 2012, and 61/748427, filed February 2, 2013. Such genes, proteins, and pathways may be the target polynucleotide of the CRISPR complex.

Figure 00000013
Figure 00000013

Figure 00000014
Figure 00000014

Figure 00000015
Figure 00000015

Figure 00000016
Figure 00000016

Figure 00000017
Figure 00000017

Figure 00000018
Figure 00000018

Figure 00000019
Figure 00000019

Figure 00000020
Figure 00000020

Figure 00000021
Figure 00000021

Figure 00000022
Figure 00000022

Figure 00000023
Figure 00000023

Figure 00000024
Figure 00000024

Figure 00000025
Figure 00000025

Figure 00000026
Figure 00000026

Figure 00000027
Figure 00000027

Figure 00000028
Figure 00000028

Figure 00000029
Figure 00000029

Figure 00000030
Figure 00000030

Варианты осуществления настоящего изобретения также относятся к способам и композициям, связанным с нокаутированием генов, амплифицированием генов и репарацией конкретных мутаций, ассоциированных с нестабильностью ДНК-повторов и неврологическими нарушениями (Robert D. Wells, Tetsuo Ashizawa, Genetic Instabilities and Neurological Diseases, Second Edition, Academic Press, Oct 13, 2011 - Medical). Как было обнаружено, определенные аспекты последовательностей тандемных повторов ответственны за более двадцати заболеваний человека (New insights into repeat instability: role of

Figure 00000031
hybrids. Mclvor EI, Polak U, Napierala M. RNA Biol. 2010 Sep-Oct; 7(5): 551-8). Система CRISPR-Cas может быть приспособлена для корректировки таких дефектов геномной нестабильности.Embodiments of the present invention also relate to methods and compositions related to knocking out genes, amplifying genes, and repairing specific mutations associated with DNA repeat instability and neurological disorders (Robert D. Wells, Tetsuo Ashizawa, Genetic Instabilities and Neurological Diseases, Second Edition, Academic Press, Oct 13, 2011 - Medical). It has been found that certain aspects of tandem repeat sequences are responsible for more than twenty human diseases (New insights into repeat instability: role of
Figure 00000031
hybrids. Mclvor EI, Polak U, Napierala M. RNA Biol. 2010 Sep-Oct; 7 (5): 551-8). The CRISPR-Cas system can be adapted to correct for such defects in genomic instability.

Дополнительный аспект настоящего изобретения относится к использованию системы CRISPR-Cas для корректирования дефектов в генах EMP2A и EMP2B, которые, как было обнаружено, ассоциированы с болезнью Лафора. Болезнь Лафора представляет собой аутосомно-рецессивное состояние, которое характеризуется прогрессирующей миоклонус-эпилепсией, которая может начинаться в виде эпилептических приступов в подростковом возрасте. Некоторые случаи заболевания могут вызываться мутациями в генах, которые уже были выявлены. Заболевание вызывает приступы, мышечные спазмы, затрудненную ходьбу, слабоумие и, в конечном итоге, смерть. В настоящее время не существует терапии, которая показала эффективность против развития заболевания. На другие генетические расстройства, ассоциированные с эпилепсией, также можно целенаправленно воздействовать при помощи системы CRISPR-Cas, и лежащая в основе генетика дополнительно описана в Genetics of Epilepsy and Genetic Epilepsies, edited by Giuliano Avanzini, Jeffrey L. Noebels, Mariani Foundation Paediatric Neurology: 20; 2009).An additional aspect of the present invention relates to the use of a CRISPR-Cas system for correcting defects in the EMP2A and EMP2B genes that have been found to be associated with Laforet disease. Lafora disease is an autosomal recessive condition characterized by progressive myoclonus epilepsy, which can begin in the form of epileptic seizures in adolescence. Some cases of the disease can be caused by mutations in genes that have already been identified. The disease causes seizures, muscle cramps, difficulty walking, dementia and, ultimately, death. Currently, there is no therapy that has been shown to be effective against the development of the disease. Other genetic disorders associated with epilepsy can also be targeted with the CRISPR-Cas system, and the underlying genetics are further described in Genetics of Epilepsy and Genetic Epilepsies, edited by Giuliano Avanzini, Jeffrey L. Noebels, Mariani Foundation Paediatric Neurology: twenty; 2009).

В еще одном аспекте настоящего изобретения систему CRISPR-Cas можно использовать для корректировки офтальмологических дефектов, которые являются результатом нескольких генетических мутаций, дополнительно описанных в Genetic Diseases of the Eye, Second Edition, edited by Elias I. Traboulsi, Oxford University Press, 2012.In yet another aspect of the present invention, the CRISPR-Cas system can be used to correct ophthalmic defects that result from several genetic mutations that are further described in Genetic Diseases of the Eye, Second Edition, edited by Elias I. Traboulsi, Oxford University Press, 2012.

Некоторые дополнительные аспекты настоящего изобретения связаны с корректированием дефектов, ассоциированных с широким спектром генетических заболеваний, которые дополнительно описаны на веб-сайте Национальных институтов здравоохранения (National Institutes of Health) в тематическом подразделе "Наследственные заболевания" ("Genetic Disorders") (веб-сайт по адресу health.nih.gov/topic/GeneticDisorders). Наследственные заболевания головного мозга могут включать, без ограничения, адренолейкодистрофию, агенезию мозолистого тела, синдром Айкарди, синдром Альперса, болезнь Альцгеймера, синдром Барта, болезнь Баттена, CADASIL, мозжечковую дегенерацию, болезнь Фабри, синдром Герстмана-Штраусслера-Шейнкера, болезнь Гентингтона и другие связанные с триплетным повтором нарушения, болезнь Лея, синдром Леша-Найхана, болезнь Менкеса, типы митохондриальной миопатии и кольпоцефалию по критериям NINDS. Такие заболевания дополнительно описаны на веб-сайте Национальных институтов здравоохранения (National Institutes of Health) в тематическом подразделе "Наследственные заболевания головного мозга" ("Genetic Brain Disorders").Some additional aspects of the present invention relate to the correction of defects associated with a wide range of genetic diseases, which are further described on the website of the National Institutes of Health in the thematic subsection "Genetic Disorders" (website at health.nih.gov/topic/GeneticDisorders). Inherited brain diseases may include, without limitation, adrenoleukodystrophy, corpus callosum agenesis, Aicardi syndrome, Alpers syndrome, Alzheimer's disease, Bart syndrome, Butten disease, CADASIL, cerebellar degeneration, Fabry disease, Gerstman-Straussler-Shanker syndrome, and other Huntington's disease triplet repetition-related disorders, Leu disease, Lesch-Nyhan syndrome, Menkes disease, types of mitochondrial myopathy and colpocephaly according to the NINDS criteria. Such diseases are further described on the website of the National Institutes of Health under the subject heading “Genetic Brain Disorders”.

В некоторых вариантах осуществления состоянием может быть неоплазия. В некоторых вариантах осуществления, где состоянием является неоплазия, гены, на которые целенаправленной воздействуют, являются любыми из перечисленных в таблице A (в данном случае PTEN и так далее). В некоторых вариантах осуществления состоянием может быть возрастная дегенерация желтого пятна. В некоторых вариантах осуществления состоянием может быть шизофреническое нарушение. В некоторых вариантах осуществления состоянием может быть связанное с тринуклеотидным повтором нарушение. В некоторых вариантах осуществления состоянием может быть синдром ломкой X-хромосомы. В некоторых вариантах осуществления состоянием может быть связанное с секретазой нарушение. В некоторых вариантах осуществления состоянием может быть связанное с прионами нарушение. В некоторых вариантах осуществления состоянием может быть ALS. В некоторых вариантах осуществления состоянием может быть привыкание к наркотическим средствам. В некоторых вариантах осуществления состоянием может быть аутизм. В некоторых вариантах осуществления состоянием может быть болезнь Альцгеймера. В некоторых вариантах осуществления состоянием может быть воспаление. В некоторых вариантах осуществления состоянием может быть болезнь Паркинсона.In some embodiments, the condition may be neoplasia. In some embodiments, where the condition is neoplasia, the targeted genes are any of those listed in Table A (in this case, PTEN and so on). In some embodiments, the condition may be age-related macular degeneration. In some embodiments, the condition may be a schizophrenic disorder. In some embodiments, the condition may be a trinucleotide repeat disorder. In some embodiments, the condition may be a fragile X chromosome syndrome. In some embodiments, the condition may be a secretory-related disorder. In some embodiments, the condition may be a prion-related disorder. In some embodiments, the condition may be ALS. In some embodiments, the condition may be addictive to drugs. In some embodiments, the condition may be autism. In some embodiments, the condition may be Alzheimer's disease. In some embodiments, the condition may be inflammation. In some embodiments, the condition may be Parkinson's disease.

Примеры белков, ассоциированных с болезнью Паркинсона, включают, без ограничения, α-синуклеин, DJ-1, LRRK2, PINK1, паркин, UCHL1, синфилин-1 hNURRI.Examples of proteins associated with Parkinson's disease include, but are not limited to, α-synuclein, DJ-1, LRRK2, PINK1, parkin, UCHL1, synfilin-1 hNURRI.

Примеры связанных с привыканием белков могут включать, например, ABAT.Examples of addictive proteins may include, for example, ABAT.

Примеры связанных с воспалением белков могут включать, например, моноцитарный хемоаттрактантный белок-1 (monocyte chemoattractant protein-1) (MCP1), закодированный геном Ccr2, C-C рецептор хемокина 5 типа (C-C chemokine receptor type 5) (CCR5), закодированный геном Ccr5, IgG-рецептор IIB (IgG receptor IIB) (FCGR2b, также называемый CD32), закодированный геном Fcgr2b, или белок Fc-эпсилон-R1g (Fc epsilon R1g) (FCER1g), закодированный геном Fcer1g.Examples of inflammation-related proteins may include, for example, monocyte chemoattractant protein-1 (MCP1) encoded by the Ccr2 gene, CC chemokine receptor type 5 (CCR5) encoded by the Ccr5 gene, IgG receptor IIB (IgG receptor IIB) (FCGR2b, also called CD32), encoded by the Fcgr2b gene, or Fc-epsilon-R1g protein (Fc epsilon R1g) (FCER1g), encoded by the Fcer1g gene.

Примеры ассоциированных с заболеваниями сердечно-сосудистой системы белков могут включать, например, IL1B (интерлейкин 1, бета (interleukin 1, beta)), XDH (ксантиндегидрогеназу (xanthine dehydrogenase)), TP53 (опухолевый белок р53 (tumor protein р53)), PTGIS (простагландин-12(простациклин)-синтазу (prostaglandin I2 (prostacyclin) synthase)), MB (миоглобин (myoglobin)), IL4 (интерлейкин 4 (interleukin 4)), ANGPT1 (ангиопоэтин 1 (angiopoietin 1)), ABCG8 (АТФ-связывающую кассету, подсемейство G (WHITE), представитель 8 (ATP-binding cassette, sub-family G (WHITE), member 8)) или CTSK (катепсин K (cathepsin K)).Examples of proteins associated with diseases of the cardiovascular system may include, for example, IL1B (interleukin 1, beta (interleukin 1, beta)), XDH (xanthine dehydrogenase), TP53 (tumor protein p53 (tumor protein p53)), PTGIS (prostaglandin-12 (prostacyclin) synthase (prostaglandin I2 (prostacyclin) synthase)), MB (myoglobin (myoglobin)), IL4 (interleukin 4 (interleukin 4)), ANGPT1 (angiopoietin 1 (angiopoietin 1)), ABCG8 (A -binding cassette, subfamily G (WHITE), representative 8 (ATP-binding cassette, sub-family G (WHITE), member 8)) or CTSK (cathepsin K (cathepsin K)).

Примеры ассоциированных с болезнью Альцгеймера белков могут включать, например, белок, представляющий собой рецептор липопротеинов очень низкой плотности (very low density lipoprotein receptor protein) (VLDLR), закодированный геном VLDLR, убиквитин-подобный модификатор-активирующий фермент 1 (ubiquitin-like modifier activating enzyme 1) (UBA1), закодированный геном UBA1, или белок, являющийся каталитической субъединицей NEDD8-aKTHBHpyioinero фермента E1 (NEDD8-activatirig enzyme E1 catalytic subunit protein) (UBE1C), закодированный геном UBA3.Examples of proteins associated with Alzheimer's disease can include, for example, a protein that is a very low density lipoprotein receptor protein (VLDLR), encoded by the VLDLR gene, ubiquitin-like modifier activating enzyme 1 (ubiquitin-like modifier activating enzyme 1) (UBA1) encoded by the UBA1 gene, or a protein that is a catalytic subunit of the NEDD8-aKTHBHpyioinero enzyme E1 (NEDD8-activatirig enzyme E1 catalytic subunit protein) (UBE1C) encoded by the UBA3 gene.

Примеры белков, ассоциированных с расстройствами аутистического спектра, могут включать, например, белок 1, ассоциированный с периферическим бензодиазешшовым рецептором (benzodiazapine receptor (peripheral) associated protein 1) (BZRAP1), закодированный геном BZRAP1, белок, представитель 2 семейства AF4/FMR2 (AF4/FMR2 family member 2 protein) (AFF2), закодированный геном AFF2 (также называемый MFR2), белок-аутосомный гомолог 1, ассоциированный с умственной отсталостью, связанной с ломкой X-хромосомой (fragile X mental retardation autosomal homolog 1 protein) (FXR1), закодированный геном FXR1, или белок-аутосомный гомлог 2, ассоциированный с умственной отсталостью, связанной с ломкой Х-хромосомой (fragile X mental retardation autosomal homolog 2 protein) (FXR2), закодированный геном FXR2.Examples of proteins associated with autism spectrum disorders may include, for example, protein 1 associated with the benzodiazapine receptor (peripheral) associated protein 1) (BZRAP1), encoded by the BZRAP1 gene, protein, member 2 of the AF4 / FMR2 family (AF4 / FMR2 family member 2 protein) (AFF2), encoded by the AFF2 gene (also called MFR2), an autosomal homolog 1 protein associated with the fragile X mental retardation autosomal homolog 1 protein (FXR1) encoded by the FXR1 gene, or protein-autosomal homolog 2, assoc ovanny with mental retardation associated with Fragile X chromosome (fragile X mental retardation autosomal homolog 2 protein) (FXR2), encoded gene FXR2.

Примеры белков, ассоциированных с дегенерацией желтого пятна, могут включать, например, АТФ-связывающую кассету, белок-представитель 4 подсемейства A (ABC1) (ATP-binding cassette, sub-family A (ABC1) member 4 protein) (ABCA4), закодированный геном ABCR, белок-аполипротеин E (apolipoprotein E protein) (APOE), закодированный геном APOE, или белок-лиганд 2 хемокина (С-С мотив) (chemokine (С-С motif) Ligand 2 protein) (CCL2), закодированный геном CCL2.Examples of proteins associated with macular degeneration may include, for example, an ATP binding cassette, a representative protein of 4 subfamilies A (ABC1) (ATP-binding cassette, sub-family A (ABC1) member 4 protein) (ABCA4) encoded ABCR genome, apolipoprotein E protein (APOE) encoded by the APOE gene, or chemokine ligand 2 protein (CC motif) (chemokine (CC motif) Ligand 2 protein) (CCL2) encoded by the gene CCL2.

Примеры белков, ассоциированных с шизофренией, могут включать NRG1, ErbB4, CPLX1, TPH1, TPH2, NRXN1, GSK3A, BDNF, DISC1, GSK3B и их комбинации.Examples of proteins associated with schizophrenia may include NRG1, ErbB4, CPLX1, TPH1, TPH2, NRXN1, GSK3A, BDNF, DISC1, GSK3B, and combinations thereof.

Примеры белков, вовлеченных в подавление опухоли, могут включать, например, ATM (мутированный, атаксия-телеангиэктазия (ataxia telangiectasia mutated)), ATR (атаксия-телеангиэктазия- и Rad3-родственный (ataxia telangiectasia and Rad3 related)), EGFR (рецептор эпидермального фактора роста (epidermal growth factor receptor)), ERBB2 (гомолог 2 v-erb-b2 эритробластического лейкоза вирусного онкогена (v-erb-b2 erythroblastic leukemia viral oncogene homolog 2)), ERBB3 (гомолог 3 v-erb-b2 эритробластического лейкоза вирусного онкогена (v-erb-b2 erythroblastic leukemia viral oncogene homolog 3)), ERBB4 (гомолог 4 v-erb-b2 эритробластического лейкоза вирусного онкогена (v-erb-b2 erythroblastic leukemia viral oncogene homolog 4)), Notch 1, Notch2, Notch 3 или Notch 4.Examples of proteins involved in tumor suppression may include, for example, ATM (mutated, ataxia-telangiectasia mutated), ATR (ataxia-telangiectasia and Rad3-related (ataxia telangiectasia and Rad3 related)), EGFR (epidermal receptor growth factor (epidermal growth factor receptor)), ERBB2 (homolog 2 of v-erb-b2 erythroblastic leukemia of viral oncogen (v-erb-b2 erythroblastic leukemia viral oncogene homolog 2)), ERBB3 (homolog 3 of v-erb-b2 erythroblastic leukemia of viral oncogen (v-erb-b2 erythroblastic leukemia viral oncogene homolog 3)), ERBB4 (homolog 4 of v-erb-b2 erythroblastic viral oncogen leukemia (v-erb-b2 erythr oblastic leukemia viral oncogene homolog 4)), Notch 1, Notch2, Notch 3 or Notch 4.

Примеры белков, ассоциированных с нарушением, связанным с активностью секретазы, могут включать, например, PSENEN (presenilin enhancer 2 homolog (С. elegans)), CTSB (катепсин В (cathepsin В)), PSEN1 (пресенилин 1 (presenilin 1)), АРР (белок-предшественник бета-амилоида (A4) (amyloid beta (A4) precursor protein)), APH1B (anterior pharynx defective 1 homolog В (С. elegans)), PSEN2 (пресенилин 2 (болезнь Альцгеймера 4) (presenilin 2 (Alzheimer disease 4)) или BACE1 (АРР-расщепляющий фермент 1 по бета-сайту (beta-site APP-cleaving enzyme 1)).Examples of proteins associated with a disorder associated with secretase activity may include, for example, PSENEN (presenilin enhancer 2 homolog (C. elegans)), CTSB (cathepsin B (cathepsin B)), PSEN1 (presenilin 1 (presenilin 1)), APP (amyloid beta (A4) precursor protein (amyloid beta (A4) precursor protein)), APH1B (anterior pharynx defective 1 homolog B (C. elegans)), PSEN2 (presenilin 2 (Alzheimer's disease 4) (presenilin 2 ( Alzheimer disease 4)) or BACE1 (APP-cleaving enzyme 1).

Примеры белков, ассоциированных с амиотрофическим латеральным склерозом, могут включать, например, SOD1 (супероксиддисмутазу 1 (superoxide dismutase 1)), ALS2 (белок, ассоциированный с амиотрофическим латеральным склерозом 2 (amyotrophic lateral sclerosis 2)), FUS (РНК-связывающий белок FUS (fused in sarcoma)), TARDBP (TAR-ДНК связывающий белок (TAR DNA binding protein)), VAGFA (фактор роста эндотелия сосудов A (vascular endothelial growth factor A)), VAGFB (фактор роста эндотелия сосудов B (vascular endothelial growth factor В)) и VAGFC (фактор роста эндотелия сосудов C (vascular endothelial growth factor С)) и любую их комбинацию.Examples of proteins associated with amyotrophic lateral sclerosis may include, for example, SOD1 (superoxide dismutase 1 (superoxide dismutase 1)), ALS2 (protein associated with amyotrophic lateral sclerosis 2 (amyotrophic lateral sclerosis 2)), FUS (FUS RNA binding protein (fused in sarcoma)), TARDBP (TAR DNA binding protein), VAGFA (vascular endothelial growth factor A), VAGFB (vascular endothelial growth factor B (vascular endothelial growth factor B)) and VAGFC (vascular endothelial growth factor C (vascular endothelial growth factor C)) and any combination thereof.

Примеры белков, ассоциированных с прионными болезнями, могут включать SOD1 (супероксиддисмутазу 1), ALS2 (белок, ассоциированный с амиотрофическим латеральным склерозом 2 (amyotrophic lateral sclerosis 2)), FUS (РНК-связывающий белок FUS (fused in sarcoma)), TARDBP (TAR-ДНК связывающий белок (TAR DNA binding protein)), VAGFA (фактор роста эндотелия сосудов A (vascular endothelial growth factor A)), VAGFB (фактор роста эндотелия сосудов B (vascular endothelial growth factor В)) и VAGFC (фактор роста эндотелия сосудов C (vascular endothelial growth factor C)) и любую их комбинацию.Examples of proteins associated with prion diseases can include SOD1 (superoxide dismutase 1), ALS2 (protein associated with amyotrophic lateral sclerosis 2 (amyotrophic lateral sclerosis 2)), FUS (RNA-binding protein FUS (fused in sarcoma)), TARDBP ( TAR DNA binding protein), VAGFA (vascular endothelial growth factor A), VAGFB (vascular endothelial growth factor B) and VAGFC (endothelial growth factor vascular C (vascular endothelial growth factor C)) and any combination thereof.

Примеры белков, связанных с нейродегенеративными состояниями при прионных болезнях, могут включать, например, A2M (альфа-2-макроглобулин (Alpha-2-Macroglobulin)), AATF (фактор транскрипции, противодействующий апоптозу (Apoptosis antagonizing transcription factor)), ACPP (простатоспецифическую кислую фосфатазу (Acid phosphatase prostate)), ACTA2 (альфа-актин 2 гладкой мускулатуры аорты (Actin alpha 2 smooth muscle aorta)), ADAM22 (ADAM, металлопептидазный домен (ADAM metallopeptidase domain)), ADORA3 (аденозиновый рецептор A3 типа (Adenosine A3 receptor)) или ADRA1D (альфа-ID адренергический рецептор для альфа-ID адренорецептора (Alpha-ID adrenergic receptor for Alpha-ID adrenoreceptor)).Examples of proteins associated with neurodegenerative conditions in prion diseases may include, for example, A2M (Alpha-2-Macroglobulin), AATF (Apoptosis antagonizing transcription factor), ACPP (prostate-specific acid phosphatase (Acid phosphatase prostate)), ACTA2 (alpha-actin 2 smooth muscle aorta (Actin alpha 2 smooth muscle aorta)), ADAM22 (ADAM, metallopeptidase domain), ADORA3 (type A3 adenosine receptor (Adenosine A3 receptor)) or ADRA1D (alpha-ID adrenergic receptor for alpha-ID adrenergic receptor (Alpha-ID adrenergic receptor for Alph a-ID adrenoreceptor)).

Примеры белков, ассоциированных с иммунодефицитом, могут включать, например, A2M [альфа-2-макроглобулин (alpha-2-macroglobulin)]; AANAT [арилалкиламин-N-ацетилтрансферазу (arylalkylamine N-acetyltransferase)]; ABCA1 [АТФ-связывающую кассету, подсемейство A (ABC1), представитель 1 (ATP-binding cassette, sub-family A (ABC1), member 1)]; ABCA2 [АТФ-связывающую кассету, подсемейство A (ABC1), представитель 2 (ATP-binding cassette, sub-family A (ABC1), member 2)] или АВСАЗ [АТФ-связывающую кассету, подсемейство A (ABC1), представитель 3 (ATP-binding cassette, sub-family A (ABC1), member 3)].Examples of proteins associated with immunodeficiency may include, for example, A2M [alpha-2-macroglobulin (alpha-2-macroglobulin)]; AANAT [arylalkylamine-N-acetyltransferase (arylalkylamine N-acetyltransferase)]; ABCA1 [ATP-binding cassette, subfamily A (ABC1), representative 1 (ATP-binding cassette, sub-family A (ABC1), member 1)]; ABCA2 [ATP-binding cassette, subfamily A (ABC1), representative 2 (ATP-binding cassette, sub-family A (ABC1), member 2)] or ABCAZ [ATP-binding cassette, subfamily A (ABC1), representative 3 ( ATP-binding cassette, sub-family A (ABC1), member 3)].

Примеры белков, ассоциированных с нарушениями, связанными с тринуклеотидным повтором, включают, например, AR (андрогеновый рецептор (androgen receptor)), FMR1 (белок 1, ассоциированный с умственной отсталостью, связанной с ломкой X-хромосомой (fragile X mental retardation 1)), HTT (хантигтин (huntingtin)) или DMPK (протеинкиназу, ассоциированную с мышечной дистрофией (dystrophia myotonica-protein kinase)), FXN (фратаксин (frataxin)), ATXN2 (атаксин 2 (ataxin 2)).Examples of proteins associated with disorders associated with trinucleotide repeat include, for example, AR (androgen receptor), FMR1 (protein 1, associated with mental retardation associated with the fragility of the X chromosome (fragile X mental retardation 1)) , HTT (huntingtin) or DMPK (protein kinase associated with muscular dystrophy (dystrophia myotonica-protein kinase)), FXN (frataxin (frataxin)), ATXN2 (ataxin 2 (ataxin 2)).

Примеры белков, ассоциированных с нарушениями передачи нервных импульсов включают, например, SST (соматостатин (somatostatin)), NOS1 (синтазу оксида азота 1 (нейрональную) (nitric oxide synthase 1 (neuronal)), ADRA2A (адренергический, альфа-2A-, рецептор (adrenergic, alpha-2A-, receptor)), ADRA2C (адренергический, альфа-2С-, рецептор (adrenergic, alpha-2C-, receptor)), TACR1 (тахикининовый рецептор 1 (tachykinin receptor 1)) или HTR2c (5-гидрокситриптаминовый (серотониновый) рецептор 2С (5-hydroxytryptamine (serotonin) receptor 2C)).Examples of proteins associated with impaired transmission of nerve impulses include, for example, SST (somatostatin (somatostatin)), NOS1 (nitric oxide synthase 1 (neuronal) (nitric oxide synthase 1 (neuronal)), ADRA2A (adrenergic, alpha-2A-, receptor (adrenergic, alpha-2A-, receptor)), ADRA2C (adrenergic, alpha-2C-, receptor (adrenergic, alpha-2C-, receptor)), TACR1 (tachykinin receptor 1 (tachykinin receptor 1)) or HTR2c (5- hydroxytryptamine (serotonin) receptor 2C (5-hydroxytryptamine (serotonin) receptor 2C)).

Примеры последовательностей, ассоциированных с неврологическим развитием, включают, например, A2BP1 [атаксин 2-связывающий белок 1 (ataxin 2-binding protein 1)], AADAT [аминоадипатаминотрансферазу (aminoadipate aminotransferase)], AANAT [арилалкиламин-N-ацетилтрансферазу (arylalkylamine N-acetyltransferase)], ABAT [4-аминобутиратаминтрансферазу (4-aminobutyrate aminotransferase)], ABCA1 [АТФ-связывающую кассету, подсемейство A (ABC1), представитель 1 (ATP-binding cassette, sub-family A (ABC1), member 1)] или ABCA13 [АТФ-связывающую кассету, подсемейство A (АВС1), представитель 13 (ATP-binding cassette, sub-family A (АВС1), member 13)].Examples of sequences associated with neurological development include, for example, A2BP1 [ataxin 2-binding protein 1], AADAT [aminoadipate aminotransferase], AANAT [arylalkylamine-N-acetyltransferase (arylylamine acetyltransferase)], ABAT [4-aminobutyrate aminotransferase (4-aminobutyrate aminotransferase)], ABCA1 [ATP binding cassette, subfamily A (ABC1), representative 1 (ATP-binding cassette, sub-family A (ABC1), member 1)] or ABCA13 [ATP-binding cassette, subfamily A (ABC1), representative 13 (ATP-binding cassette, sub-family A (ABC1), member 13)].

Дополнительные примеры предпочтительных состояний, которые подлежат лечению с помощью данной системы, включают те, которые могут быть выбраны из синдрома Айкарди-Гутьереса; болезни Александера; синдрома Аллана-Херндона-Дадли; связанных с геном POLG нарушений; альфа-маннозидоза (II и III тип); синдрома Альстрема; синдрома Ангельмана; атаксии-телеангиэктазии; нейронного высоковидного липофусциноза; бета-талассемии; двусторонней атрофии зрительного нерва и (инфантильной) атрофии зрительного нерва 1 типа; ретинобластомы (двусторонней); болезни Канавана; церебро-окуло-фацио-скелетного синдрома 1 [COFS1]; церебротендинального ксантоматоза; синдрома Корнелии де Ланге; связанных с геном МАРТ нарушений; наследственных прионных болезней; синдрома Драве; семейной болезни Альцгеймера с ранним началом; атаксии Фридрейха [FRDA]; синдрома Фринса; фукозидоза; врожденной мышечной дистрофии Фукуямы; галактосиалидоза; болезни Гоше; органической ацидемии; гемофагоцитарного лимфогистиоцитоза; синдрома прогерии Гетчинсона-Гилфорда; муколипидоза II; инфантильной болезни накопления свободной сиаловой кислоты; ассоциированной с геном PLA2G6 нейродегенерации; синдрома Джервелла-Ланге-Нильсена; узелкового врожденного буллезного эпидермолиза; болезни Гентингтона; болезни Краббе (инфантильной); ассоциированного с митохондриальной ДНК синдрома Ли и NARP; синдрома Леша-Найхана; ассоциированной с геном LIS1 лиссэнцефалии; синдрома Лоу; болезни "кленового сиропа"; синдрома дупликации МЕСР2; связанных с геном ATP7A нарушений обмена меди; связанной с геном LAMA2 мышечной дистрофии; недостаточности арилсульфатазы A; мукополисахаридоза I, II или III типов; связанных с биогенезом пероксисом нарушений, спектра заболеваний по типу синдрома Цельвегера; нарушений по типу нейродегенерации с накоплением железа в головном мозге; недостаточности кислой сфингомиелиназы; болезни Ниманна-Пика C типа; глициновой энцефалопатии; связанных с геном ARX нарушений; нарушений орнитинового цикла; связанного с геном COL1A1/2 несовершенного остеогенеза; синдромов удаления митохондриальной ДНК; связанных с геном PLP1 нарушений; синдрома Перри; синдрома Фелана-МакДермида; болезни накопления гликогена II типа (болезни Помпе) (инфантильной); связанных с геном МАРТ нарушений; связанных с геном МЕСР2 нарушений; эпифизарной точечной хондродисплазии 1 типа костей верхних конечностей или бедренной кости; синдрома Робертса; болезни Сандхоффа; болезни Шиндлера - 1 типа; аденозиндезаминазной недостаточности; синдрома Смита-Лемли-Опитца; спинальной мышечной атрофии; спинально-церебеллярной атаксии с возникновением в младенческом возрасте; недостаточности гексозаминидазы; танатофорной дисплазии 1 типа; связанных с геном коллагена VI типа нарушений; синдрома Ашера I типа; врожденной мышечной дистрофии; синдрома Вольфа-Хиршхорна; недостаточности лизосомной кислой липазы и пигментной ксеродермы.Additional examples of preferred conditions that are to be treated with this system include those that can be selected from Aicardi-Gutieres syndrome; Alexander's disease; Allan-Herndon-Dudley Syndrome; POLG gene related disorders; alpha-mannosidosis (type II and III); Alstrom's syndrome; Angelman syndrome; ataxia-telangiectasia; high neuronal lipofuscinosis; beta thalassemia; bilateral optic atrophy and type 1 (infantile) optic atrophy; retinoblastoma (bilateral); Canavan disease cerebro-oculo-facies-skeletal syndrome 1 [COFS1]; cerebroendinal xanthomatosis; Cornelia de Lange syndrome; MART-related disorders; hereditary prion diseases; Drave syndrome; Alzheimer's familial disease with early onset; Friedreich's ataxia [FRDA]; frins syndrome; fucosidosis; congenital muscular dystrophy of Fukuyama; galactosialidosis; Gaucher disease organic acididemia; hemophagocytic lymphohistiocytosis; Hatchinson-Guildford Progeria Syndrome; mucolipidosis II; infantile disease accumulation of free sialic acid; neurodegeneration associated with the PLA2G6 gene; Jerwell-Lange-Nielsen syndrome; nodular congenital bullous epidermolysis; Huntington's disease; Crabbe disease (infantile); mitochondrial DNA associated Lee syndrome and NARP; Lesch-Nyhan syndrome; associated with the LIS1 gene of lissencephaly; low syndrome; maple syrup diseases; duplication syndrome MECP2; ATP7A-related copper metabolic disorders; muscle dystrophy associated with the LAMA2 gene; aryl sulfatase A deficiency; mucopolysaccharidosis of types I, II or III; disorders associated with biogenesis of peroxisis, a spectrum of diseases like Zellweger syndrome; disorders of the type of neurodegeneration with the accumulation of iron in the brain; acid sphingomyelinase deficiency; Nimann-Peak disease type C; glycine encephalopathy; ARX gene related disorders; disorders of the ornithine cycle; imperfect osteogenesis associated with the COL1A1 / 2 gene; mitochondrial DNA removal syndromes; PLP1 gene related disorders; perry syndrome; Phelan-McDermid syndrome; type II glycogen accumulation diseases (Pompe disease) (infantile); MART-related disorders; MECP2 gene related disorders; epiphyseal point chondrodysplasia of the 1st type of bones of the upper limbs or femur; Roberts syndrome; Sandhoff disease; Schindler's disease - type 1; adenosine deaminase deficiency; Smith-Lemley-Opitz syndrome; spinal muscular atrophy; spinal cerebellar ataxia with occurrence in infancy; hexosaminidase deficiency; thanatophore dysplasia type 1; type VI collagen-related disorders; Asher syndrome type I; congenital muscular dystrophy; Wolf-Hirschhorn syndrome; insufficiency of lysosomal acid lipase and pigment xeroderma.

Как будет понятно, предусматривается, что настоящую систему можно использовать для целенаправленного воздействия на любую представляющую интерес полинуклеотидную последовательность. Некоторые состояния или заболевания, которые можно эффективно лечить с использованием настоящей системы, включены в таблицы выше, и примеры известных на данный момент генов, ассоциированных с такими состояниями, также предоставлены в них. Тем не менее, гены, приведенные в качестве примеров, не являются исчерпывающими.As will be appreciated, it is contemplated that the present system can be used to target any polynucleotide sequence of interest. Some conditions or diseases that can be effectively treated using the present system are included in the tables above, and examples of currently known genes associated with such conditions are also provided therein. However, the genes given as examples are not exhaustive.

ПримерыExamples

Следующие примеры приведены с целью иллюстрации различных вариантов осуществления настоящего изобретения, и не предполагается, что они ограничивают настоящее изобретение каким-либо образом. Данные примеры совместно со способами, описанными в данном документе, в настоящее время отражают предпочтительные варианты осуществления, являются иллюстративными и не предназначены для ограничения объема настоящего изобретения. Изменения в данном документе и другие применения, которые охватываются сущностью настоящего изобретения, как определено формулой изобретения, будут очевидны специалистам в данной области.The following examples are provided to illustrate various embodiments of the present invention, and are not intended to limit the present invention in any way. These examples, together with the methods described herein, currently reflect preferred embodiments, are illustrative and are not intended to limit the scope of the present invention. Changes in this document and other applications that are covered by the essence of the present invention, as defined by the claims, will be apparent to experts in this field.

Пример 1: активность комплекса CRISPR в ядре эукариотической клеткиExample 1: activity of the CRISPR complex in the nucleus of a eukaryotic cell

Примером системы CRISPR II типа является локус CRISPR II типа из Streptococcus pyogenes SF370, который содержит группу из 4 генов Cas9, Cas1, Cas2 и Csn1, а также 2 некодирующих элемента РНК, tracrRNA и характерный массив повторяющихся последовательностей (прямых повторов), чередующихся с короткими фрагментами неповторяющихся последовательностей (спейсерами, примерно 30 п.о. каждый). В этой системе двухцепочечный разрыв (DSB) целевой ДНК образовывается в ходе четырех последовательных стадий (фигура 2А). Во-первых, две некодирующих РНК, массив pre-crRNA и tracrRNA, транскрибируются с локуса CRISPR. Во-вторых, tracrRNA гибридизируется с прямыми повторами pre-crRNA, которая затем процессируется в зрелые crRNA, содержащие индивидуальные спейсерные последовательности. В-третьих, комплекс зрелая crRNA:tracrRNA направляет Cas9 к ДНК-мишени, состоящей из протоспейсера и соответствующего PAM, посредством образования гетеродуплекса между спейсерным участком crRNA и протоспейсерной ДНК. И наконец, Cas9 опосредует расщепление целевой ДНК выше PAM с образованием DSB внутри протоспейсера (фигура 2А). В этом примере описывается иллюстративный способ приспособления этой РНК-программируемой нуклеазной системы к управлению активностью комплекса CRISPR в ядрах эукариотических клеток.An example of a type II CRISPR system is a type II CRISPR locus from Streptococcus pyogenes SF370, which contains a group of 4 genes Cas9, Cas1, Cas2 and Csn1, as well as 2 non-coding RNA elements, tracrRNA and a characteristic array of repeating sequences (direct repeats), alternating with short fragments of non-repeating sequences (spacers, approximately 30 bp each). In this system, double-stranded cleavage (DSB) of the target DNA is formed during four consecutive stages (Figure 2A). First, two non-coding RNAs, an array of pre-crRNA and tracrRNA, are transcribed from the CRISPR locus. Secondly, tracrRNA hybridizes with direct pre-crRNA repeats, which are then processed into mature crRNAs containing individual spacer sequences. Third, the mature crRNA: tracrRNA complex directs Cas9 to the target DNA, consisting of a protospacer and the corresponding PAM, through the formation of a heteroduplex between the spacer region of crRNA and protospacer DNA. Finally, Cas9 mediates cleavage of the target DNA above PAM with the formation of DSB inside the protospacer (Figure 2A). This example describes an illustrative method of adapting this RNA-programmable nuclease system to control the activity of the CRISPR complex in the nuclei of eukaryotic cells.

Клеточная культура и трансфекцияCell Culture and Transfection

Линию клеток почки человеческого эмбриона (HEK), HEK 293FT (Life Technologies), поддерживали в среде Игла в модификации Дульбекко (DMEM), дополненной 10% фетальной бычьей сыворотки (HyClone), 2 мМ GlutaMAX (Life Technologies), 100ед./мл пенициллина и 100 мкг/мл стрептомицина, при 37°C с инкубированием при 5% CO2. Линию мышиных клеток neuro2A (N2A) (АТСС) поддерживали в DMEM, дополненной 5% фетальной бычьей сывороткой (HyClone), 2 мМ GlutaMAX (Life Technologies), 100 ед./мл пенициллина и 100 мкг/мл стрептомицина, при 37°C с 5% CO2.The human embryo kidney cell line (HEK), HEK 293FT (Life Technologies), was maintained in Eagle's Dulbecco modification (DMEM) supplemented with 10% fetal bovine serum (HyClone), 2 mM GlutaMAX (Life Technologies), 100 units / ml penicillin and 100 μg / ml streptomycin, at 37 ° C with incubation at 5% CO 2 . The neuro2A (N2A) mouse cell line (ATCC) was maintained in DMEM supplemented with 5% fetal bovine serum (HyClone), 2 mM GlutaMAX (Life Technologies), 100 units / ml penicillin and 100 μg / ml streptomycin, at 37 ° C 5% CO 2 .

Клетки HEK 293FT или N2A высевали в 24-луночные планшеты (Corning) за один день до трансфекции с плотностью 200000 клеток на лунку. Клетки трансфицировали с применением Lipofectamine 2000 (Life Technologies), следуя рекомендованному производителем протоколу. Для каждой лунки 24-луночного планшета использовали в общей сложности 800 нг плазмид.HEK 293FT or N2A cells were seeded in 24-well plates (Corning) one day prior to transfection with a density of 200,000 cells per well. Cells were transfected using Lipofectamine 2000 (Life Technologies) following the manufacturer's recommended protocol. A total of 800 ng plasmids were used for each well of the 24-well plate.

Анализ с помощью Surveyor и анализ с помощью секвенирования на предмет наличия модификации геномаSurveyor analysis and sequencing analysis for genome modification

Клетки HEK 293FT или N2A трансфицировали плазмидной ДНК, как описано выше. После трансфекции клетки инкубировали при 37°C в течение 72 часов перед экстракцией геномной ДНК. Геномную ДНК экстрагировали с помощью набора QuickExtract DNA extraction kit (Epicentre), следуя протоколу производителя. Вкратце, клетки ресуспендировали в растворе QuickExtract и инкубировали при 65°C в течение 15 минут и при 98°C в течение 10 минут. Экстрагированную геномную ДНК подвергали немедленной обработке или хранили при -20°C.HEK 293FT or N2A cells were transfected with plasmid DNA as described above. After transfection, cells were incubated at 37 ° C for 72 hours before extraction of genomic DNA. Genomic DNA was extracted using the QuickExtract DNA extraction kit (Epicentre) following the manufacturer's protocol. Briefly, cells were resuspended in a QuickExtract solution and incubated at 65 ° C for 15 minutes and at 98 ° C for 10 minutes. The extracted genomic DNA was immediately processed or stored at -20 ° C.

Геномный участок, окружающий целевой сайт CRISPR, для каждого гена подвергали ПЦР амплификации и продукты очищали с использованием колонки QiaQuick Spin Column (Qiagen), следуя протоколу производителя. В общей сложности 400 нг очищенных ПЦР-продуктов смешивали с 2 мкл 10Х ПЦР-буфера для Taq-полимеразы (Enzymatics) и водой сверхвысокой чистоты до конечного объема 20 мкл и подвергали процессу повторного отжига для обеспечения образования гетеродуплекса: 95°C в течение 10 мин., линейное снижение температуры с 95°C до 85°C со скоростью 2°C/с, с 85°C до 25°C со скоростью 0,25°C/с и с выдерживанием при 25°C в течение 1 минуты. После повторного отжига продукты обрабатывали нуклеазой Surveyor и энхансером S Surveyor (Transgenomics), следуя рекомендованному производителем протоколу, и анализировали в 4-20% полиакриламидных гелях Novex ТВЕ (Life Technologies). Гели окрашивали красителем ДНК SYBR Gold (Life Technologies) в течение 30 минут и получали изображение с помощью системы обработки изображений Gel Doc gel imaging system (Bio-rad). Количественный анализ основывался на относительных интенсивностях полос в качестве единицы измерения фракции расщепленной ДНК. На фигуре 8 представлена схематическая иллюстрация данного анализа с помощью Surveyor.The genomic region surrounding the CRISPR target site was PCR amplified for each gene and the products were purified using a QiaQuick Spin Column (Qiagen) column following the manufacturer's protocol. A total of 400 ng of purified PCR products were mixed with 2 μl of 10X Taq polymerase PCR buffer (Enzymatics) and ultra-high purity water to a final volume of 20 μl and subjected to a re-annealing process to ensure heteroduplex formation: 95 ° C for 10 min ., a linear decrease in temperature from 95 ° C to 85 ° C at a speed of 2 ° C / s, from 85 ° C to 25 ° C at a speed of 0.25 ° C / s and with holding at 25 ° C for 1 minute. After repeated annealing, the products were treated with Surveyor nuclease and S Surveyor enhancer (Transgenomics), following the manufacturer's recommended protocol, and analyzed in 4-20% Novex TBE polyacrylamide gels (Life Technologies). The gels were stained with SYBR Gold DNA stain (Life Technologies) for 30 minutes and the image was obtained using the Gel Doc gel imaging system (Bio-rad) image processing system. Quantitative analysis was based on the relative intensities of the bands as a unit of measure for the fraction of cleaved DNA. Figure 8 is a schematic illustration of this analysis using Surveyor.

Анализ полиморфизма длины рестрикционных фрагментов для обнаружения гомологичной рекомбинации.Analysis of restriction fragment length polymorphism to detect homologous recombination.

Клетки HEK 293FT и N2A трансфицировали плазмидной ДНК и инкубировали при 37°C в течение 72 часов перед экстракцией геномной ДНК, как описано выше. Целевой геномный участок подвергали ПЦР амплификации с использованием праймеров за пределами гомологичных плеч матрицы для гомологичной рекомбинации (HR). ПЦР-продукты разделяли в 1% агарозном геле и экстрагировали с помощью набора MinElute GelExtraction Kit (Qiagen). Очищенные продукты расщепляли с помощью Hindlll (Fermentas) и анализировали в 6% полиакриламидном геле Novex ТВЕ (Life Technologies).HEK 293FT and N2A cells were transfected with plasmid DNA and incubated at 37 ° C for 72 hours before extraction of genomic DNA, as described above. The target genomic region was PCR amplified using primers outside the homologous arms of the template for homologous recombination (HR). PCR products were separated on a 1% agarose gel and extracted using the MinElute GelExtraction Kit (Qiagen). The purified products were digested with Hindlll (Fermentas) and analyzed on a 6% Novex TBE polyacrylamide gel (Life Technologies).

Прогнозирование и анализ вторичной структуры РНКPrediction and analysis of the secondary structure of RNA

Прогнозирование вторичной структуры РНК осуществляли с использованием доступного в режиме онлайн веб-сервера RNAfold, разработанного в Институте теоретической химии при Венском университете, использующего алгоритм прогнозирования структуры на основе центроидного метода (см., например, A.R. Gruber et al., 2008, Cell 106(1): 23-24; и PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62).The secondary structure of RNA was predicted using the online RNAfold web server developed at the Institute of Theoretical Chemistry at the University of Vienna using the centroid method for predicting structure (see, for example, AR Gruber et al., 2008, Cell 106 ( 1): 23-24; and PA Carr and GM Church, 2009, Nature Biotechnology 27 (12): 1151-62).

Анализ интерференции при трансформации бактериальными плазмидами Элементы локуса 1 CRISPR S. pyogenes, достаточные для активности CRISPR, воспроизводили у Е. coli с применением плазмиды pCRISPR (схематически изображенной на фигуре 10А). pCRISPR содержала tracrRNA, SpCas9 и лидерную последовательность, запускающую массив crRNA. Как показано, спейсеры (также упоминаются как "направляющие последовательности") встраивали в массив crRNA между сайтами BsaI с применением гибридизированных олигонуклеотидов. Контрольные плазмиды, применяемые в анализе интерференции, создавали путем встраивания протоспейсерной последовательности (также упоминающейся как "целевая последовательность") совместно со смежной последовательностью мотива CRISPR (PAM) в pUC19 (см. фигуру 10B). Контрольная плазмида содержала гены устойчивости к ампициллину. На фигуре 10C представлено схематическое изображение анализа интерференции. Химически компетентные штаммы Е. coli, уже несущие pCRISPR и соответствующий спейсер, трансформировали контрольной плазмидой, содержащей соответствующую последовательность протоспейсер-PAM. pUC19 применяли для оценки эффективности трансформации каждого компетентного штамма, несущего pCRISPR. Активность CRISPR приводила к расщеплению плазмиды pPSP, несущей протоспейсер, что устраняло устойчивость к ампициллину, в противном случае обеспечиваемую pUC19, не имеющему протоспейсера. На фигуре 10D представлена компетенция каждого штамма Е. coli, несущего pCRISPR, применяемого в анализах, которые изображены на фигуре 4C.Analysis of interference during transformation with bacterial plasmids Elements of the S. pyogenes CRISPR locus 1 sufficient for CRISPR activity were reproduced in E. coli using the plasmid pCRISPR (schematically depicted in Figure 10A). pCRISPR contained tracrRNA, SpCas9, and a leader sequence running the crRNA array. As shown, spacers (also referred to as "guide sequences") were inserted into the crRNA array between BsaI sites using hybridized oligonucleotides. The control plasmids used in the interference analysis were created by embedding the protospacer sequence (also referred to as the “target sequence”) together with the adjacent CRISPR motif sequence (PAM) in pUC19 (see FIG. 10B). The control plasmid contained ampicillin resistance genes. 10C is a schematic illustration of an interference analysis. Chemically competent E. coli strains already bearing pCRISPR and the corresponding spacer were transformed with a control plasmid containing the corresponding protospacer-PAM sequence. pUC19 was used to evaluate the transformation efficiency of each competent strain bearing pCRISPR. CRISPR activity led to cleavage of the pPSP plasmid carrying the protospacer, which eliminated ampicillin resistance, otherwise provided by pUC19 lacking a protospacer. Figure 10D presents the competence of each E. coli strain bearing pCRISPR used in the assays shown in Figure 4C.

Очистка РНКRNA purification

Клетки HEK 293FT поддерживали и трансфицировали, как указано выше. Клетки собирали путем трипсинизации с последующим промыванием в фосфатно-солевом буфере (PBS). Общую клеточную РНК экстрагировали с помощью реагента TRI (Sigma), следуя протоколу производителя. Выполняли количественный анализ общей экстрагированной РНК с использованием Naonodrop (Thermo Scientific) и данные нормализовали к такой же концентрации;HEK 293FT cells were maintained and transfected as described above. Cells were harvested by trypsinization followed by washing in phosphate buffered saline (PBS). Total cellular RNA was extracted using TRI reagent (Sigma) following the manufacturer's protocol. Quantitative analysis of total extracted RNA was performed using Naonodrop (Thermo Scientific) and the data was normalized to the same concentration;

Анализ экспрессии crRNA и tracrRNA в клетках млекопитающих с помощью нозерн-блоттингаAnalysis of the expression of crRNA and tracrRNA in mammalian cells using Northern blotting

РНК смешивали с равными объемами 2Х загрузочного буфера (Ambion), нагревали до 95°C в течение 5 мин., охлаждали на льду в течение 1 мин., а затем загружали в 8% денатурирующие полиакриламидные гели (SequaGel, National Diagnostics) после предварительного прогона геля в течение по меньшей мере 30 минут. Образцы подвергали электрофорезу в течение 1,5 часа при предельной мощности 40 Вт. После этого РНК переносили на мембрану Hybond N+ (GE Healthcare) при силе тока 300 мА в устройстве полусухого переноса (Bio-rad) при комнатной температуре в течение 1,5 часа. РНК сшивали с мембраной с использованием кнопки "автоматического сшивания" на приборе для автоматического сшивания с помощью ультрафиолета Stratagene UV Crosslinker the Stratalinker (Stratagene). Мембрану подвергали предварительной гибридизации в буфере для гибридизации ULTRAhyb-Oligo Hybridization Buffer (Ambion) в течение 30 мин. с вращением при 42°C, а затем добавляли зонды и проводили гибридизацию в течение ночи. Зонды заказывали у IDT и метили [гамма-32P] ATP (Perkin Elmer) с использованием полинуклеотид-киназы T4 (New England Biolabs). Мембрану промывали один раз предварительно подогретым (42°C) 2xSSC, 0,5% SDS в течение 1 мин. с последующими двумя промываниями по 30 минут при 42°C. Мембрану экспонировали на люминесцентном экране в течение одного часа или в течение ночи при комнатной температуре, а затем сканировали с использованием устройства для формирования изображения на люминесцентном фосфорном покрытии (Typhoon).RNA was mixed with equal volumes of 2X loading buffer (Ambion), heated to 95 ° C for 5 minutes, cooled on ice for 1 minute, and then loaded into 8% denaturing polyacrylamide gels (SequaGel, National Diagnostics) after a preliminary run gel for at least 30 minutes. Samples were subjected to electrophoresis for 1.5 hours at a maximum power of 40 watts. After that, the RNA was transferred to a Hybond N + membrane (GE Healthcare) at a current strength of 300 mA in a semi-dry transfer device (Bio-rad) at room temperature for 1.5 hours. RNA was crosslinked with the membrane using the “auto-crosslink” button on the auto-crosslinker using the Stratagene UV Crosslinker the Stratalinker (Stratagene). The membrane was pre-hybridized in the ULTRAhyb-Oligo Hybridization Buffer (Ambion) for 30 minutes. rotating at 42 ° C, and then probes were added and hybridization was performed overnight. Probes were ordered from IDT and labeled [gamma- 32 P] ATP (Perkin Elmer) using T4 polynucleotide kinase (New England Biolabs). The membrane was washed once with preheated (42 ° C) 2xSSC, 0.5% SDS for 1 min. followed by two washes for 30 minutes at 42 ° C. The membrane was exposed on a fluorescent screen for one hour or overnight at room temperature, and then scanned using an image forming apparatus on a phosphor phosphor coating (Typhoon).

Создание и оценка бактериальной системы CRISPRCreation and evaluation of the bacterial system CRISPR

Элементы локуса CRISPR, в том числе tracrRNA, Cas9 и лидерную последовательность, подвергали ПЦР амплификации из геномной ДНК Streptococcus pyogenes SF370 с фланкирующими гомологичными плечами для сборки по методу Гибсона. Два сайта BsaI типа IIS вводили между двумя прямыми повторами для обеспечения вставки спейсеров (фигура 9). ПЦР-продукты клонировали в расщепленный с помощью EcoRV pACYC184 ниже промотора tet с использованием мастер-микса для сборки по методу Гибсона Gibson Assembly Master Mix (NEB). Другие эндогенные элементы системы CRISPR пропускали, за исключением последних 50 п.о. Csn2. Олигонуклеотиды (Integrated DNA Technology), кодирующие спейсеры с комплементарными липкими концами клонировали в расщепленный с помощью BsaI вектор pDC000 (NEB), а затем лигировали с использованием лигазы Т7 (Enzymatics) с получением плазмид pCRISPR. Контрольные плазмиды, содержащие спейсеры с последовательностями PAM (также называемыми в данном документе "последовательностями мотива CRISPR"), создавали путем лигирования гибридизированных олигонуклеотидов, несущих совместимые липкие концы (Integrated ДНК Technology), в расщепленный с помощью BamHI pUC19. Клонирование для всех конструкций выполняли в штамме JM109 Е. coli (Zymo Research).Elements of the CRISPR locus, including tracrRNA, Cas9, and the leader sequence, were PCR amplified from Streptococcus pyogenes SF370 genomic DNA with flanking homologous arms for assembly using the Gibson method. Two BsaI sites of type IIS were introduced between two direct repeats to ensure insertion of spacers (Figure 9). PCR products were cloned into EcoRV digested pACYC184 downstream of the tet promoter using the Gibson Assembly Master Mix (NEB) master mix for assembly. Other endogenous elements of the CRISPR system were missed, with the exception of the last 50 bp. Csn2. Oligonucleotides (Integrated DNA Technology) encoding spacers with complementary sticky ends were cloned into a BsaI cleaved pDC000 vector (NEB) and then ligated using T7 ligase (Enzymatics) to obtain pCRISPR plasmids. Control plasmids containing spacers with PAM sequences (also referred to herein as CRISPR motif sequences) were created by ligation of hybridized oligonucleotides carrying compatible sticky ends (Integrated DNA Technology) into BamHI cleaved pUC19. Cloning for all constructs was performed in E. coli strain JM109 (Zymo Research).

Клетки, несущие pCRISPR, делали компетентными с применением Z-Competent Е. coli Transformation Kit и Buffer Set (Zymo Research, T3001) в соответствии с инструкциями производителя. При анализе трансформации производили оттаивание на льду 50 мкл аликвот компетентных клеток, несущих pCRISPR, и трансформировали 1 нг плазмиды со спейсером или pUC19 в течение 30 минут с последующим 45 секундами теплового шока при 42°C и 2 минутами на льду. Затем добавляли 250 мкл SOC (Invitrogen) с последующей инкубацией со встряхиванием при 37°C в течение 1 ч. и высеивали 100 мкл клеток, полученных после SOC, на двойные планшеты для отбора (12,5 мкг/мл хлорамфеникола, 100 мкг/мл ампициллина). Для получения КОЕ/нг ДНК общее число колоний умножали на 3.Cells carrying pCRISPR were made competent using the Z-Competent E. coli Transformation Kit and Buffer Set (Zymo Research, T3001) in accordance with the manufacturer's instructions. In the transformation analysis, 50 μl aliquots of competent cells bearing pCRISPR were thawed on ice and 1 ng of plasmid with spacer or pUC19 was transformed for 30 minutes followed by 45 seconds of heat shock at 42 ° C and 2 minutes on ice. Then, 250 μl of SOC (Invitrogen) was added, followed by incubation with shaking at 37 ° C for 1 h, and 100 μl of cells obtained after SOC were plated on double selection plates (12.5 μg / ml chloramphenicol, 100 μg / ml ampicillin). To obtain CFU / ng DNA, the total number of colonies was multiplied by 3.

Для улучшения экспрессии компонентов CRISPR в клетках млекопитающих два гена из локуса 1 Streptococcus pyogenes SF370 (S. pyogenes) были кодон-оптимизированы, Cas9 (SpCas9) и РНКазы III (SpRNase III). Для обеспечения ядерной локализации клеточный сигнал ядерной локализации (NLS) включали в амино (N)- или карбоксильные (C)-терминальные области и SpCas9, и SpRNase III (фигура 2B). Для обеспечения визуализации экспрессии белков ген флуоресцентного белка в качестве маркера также включали в N- или C-терминальные области обоих белков (фигура 2B). Также был создан вариант SpCas9 с NLS, прикрепленной и к N-, и к C-терминальным областям (2xNLS-SpCas9). Конструкции, содержащие слитый с NLS SpCas9 и SpRNase III трансфицировали в клетки почки эмбриона человека (HEK) 293FT, и было обнаружено, что относительное положение NLS относительно SpCas9 и SpRNase III влияет на их эффективность ядерной локализации. Хотя C-терминальной NLS было достаточно для нацеливания SpRNase III в ядро, прикрепление одной копии этих конкретных NLS либо к N-, либо к C-терминальным областям SpCas9 не было способно обеспечить адекватную ядерную локализацию в этой системе. В этом примере C-терминальная NLS была из нуклеоплазмина (KRPAATKKAGQAKKKK), а C-терминальная NLS был из большого T-антигена SV40 (PKKKRKV). Из тестируемых вариантов SpCas9 только 2xNLS-SpCas9 проявлял ядерную локализацию (фигура 2B).To improve the expression of CRISPR components in mammalian cells, two genes from Locus 1 of Streptococcus pyogenes SF370 (S. pyogenes) were codon-optimized, Cas9 (SpCas9) and RNase III (SpRNase III). To ensure nuclear localization, the cellular nuclear localization signal (NLS) was included in the amino (N) or carboxyl (C) terminal regions of both SpCas9 and SpRNase III (Figure 2B). To ensure visualization of protein expression, the fluorescent protein gene as a marker was also included in the N- or C-terminal regions of both proteins (Figure 2B). A SpCas9 variant was also created with NLS attached to both the N- and C-terminal domains (2xNLS-SpCas9). Constructs containing NLC fused SpCas9 and SpRNase III were transfected into human embryonic kidney cells (HEK) 293FT, and it was found that the relative position of NLS relative to SpCas9 and SpRNase III affects their nuclear localization efficiency. Although C-terminal NLS was sufficient to target SpRNase III into the nucleus, attaching one copy of these specific NLS to either the N- or C-terminal regions of SpCas9 was not able to provide adequate nuclear localization in this system. In this example, the C-terminal NLS was from nucleoplasmin (KRPAATKKAGQAKKKK), and the C-terminal NLS was from the large T40 antigen SV40 (PKKKRKV). Of the tested variants of SpCas9, only 2xNLS-SpCas9 showed nuclear localization (Figure 2B).

tracrRNA из локуса CRISPR S. pyogenes SF370 содержал два сайта инициации транскрипции, дающие начало двум транскриптам из 89 нуклеотидов (нт) и 171 нт, которые затем подвергались процессингу в идентичные зрелые tracrRNA из 75 нт. Более короткие tracrRNA из 89 нт отбирали на предмет экспрессии в клетках млекопитающих (экспрессирующая конструкция изображена на фигуре 7А, с функциональностью, как определено по результатам анализа с помощью Surveyor, показанным на фигуре 7B). Сайты инициации транскрипции обозначены как +1, а также указаны терминатор транскрипции и последовательность, анализированная с помощью нозерн-блоттинга. Экспрессию подвергнутой процессингу tracrRNA также подтверждали с помощью нозерн-блоттинга. На фигуре 7C показаны результаты анализа с помощью нозерн-блоттинга общей РНК, экстрагированной из клеток 293FT, трансфицированных экспрессирующими конструкциями U6, несущими длинную или короткую tracrRNA, а также SpCas9 и DR-EMX1(1)-DR. Левая и правая секции получены с клетками 293FT, трансфицированными без SpRNase III или с таковой, соответственно. U6 являются показателем для контроля загрузки при блоттинге с зондом, нацеленным на малую ядерную РНК (snRNA) U6 человека. Трансфекция экспрессирующей конструкции с короткой tracrRNA приводила к высоким уровням подвергшейся процессингу формы tracrRNA (~75 п.о.). Очень низкие количества длинных tracrRNA обнаруживали при нозерн-блоттинге.tracrRNA from the CRISPR locus of S. pyogenes SF370 contained two transcription initiation sites giving rise to two transcripts of 89 nucleotides (nt) and 171 nt, which were then processed into identical mature 75 nt tracrRNAs. Shorter 89 nt tracrRNAs were selected for expression in mammalian cells (the expression construct is depicted in Figure 7A, with functionality as determined by a Surveyor analysis shown in Figure 7B). Transcription initiation sites are designated +1, and the transcription terminator and sequence analyzed by Northern blotting are also indicated. The expression of the processed tracrRNA was also confirmed by Northern blotting. Figure 7C shows the results of Northern blot analysis of total RNA extracted from 293FT cells transfected with U6 expression constructs carrying long or short tracrRNA, as well as SpCas9 and DR-EMX1 (1) -DR. The left and right sections were obtained with 293FT cells transfected without SpRNase III or with one, respectively. U6 is an indicator for monitoring loading during blotting with a probe targeting small nuclear RNA (snRNA) of human U6. Transfection of the expressing construct with short tracrRNA led to high levels of the processed form of tracrRNA (~ 75 bp). Very low amounts of long tracrRNAs were detected by Northern blotting.

Для стимуляции точной инициации транскрипции промотор U6 на основе РНК-полимеразы III выбирали для управления экспрессией tracrRNA (фигура 2С). Подобным образом, конструкцию на основе промотора U6 разработали для экспрессии массива pre-crRNA, состоящего из одного спейсера, фланкированного двумя прямыми повторами (DR, также включены в выражение "парные tracr-последовательности"; фигура 2С). Исходный спейсер был разработан для нацеливания на целевой сайт из 33 пар оснований (п.о.) (протоспейсер из 30 п.о., а также последовательность мотива CRISPR (PAM) из 3 п.о., соответствующая мотиву узнавания NGG у Cas9) в локусе EMX1 человека (фигура 2С), ключевом гене в развитии коры головного мозга.To stimulate the precise initiation of transcription, the U6 promoter based on RNA polymerase III was chosen to control the expression of tracrRNA (Figure 2C). Similarly, a U6 promoter-based construct was designed to express a pre-crRNA array consisting of a single spacer flanked by two direct repeats (DR, also included in the expression “paired tracr sequences”; FIG. 2C). The initial spacer was designed to target a target site of 33 base pairs (bp) (a protospacer of 30 bp, as well as a 3-bp CRISPR sequence (PAM) corresponding to the NGG recognition motif of Cas9) at the human EMX1 locus (Figure 2C), a key gene in the development of the cerebral cortex.

Клетки HEK 293FT трансфицировали комбинацией компонентов CRISPR для того, чтобы определить, можно ли при гетерологичной экспрессии системы CRISPR (SpCas9, SpRNase III, tracrRNA и pre-crRNA) в клетках млекопитающих достичь целенаправленного расщепления хромосом млекопитающего. Поскольку DSB в ядрах млекопитающих частично репарируются с помощью пути негомологичного соединения концов (NHEJ), которое приводит к формированию вставок/делеций, анализ с помощью SURVEYOR использовали для выявления потенциальной активности для расщепления в целевом локусе EMX1 (фигура 8) (см., например, Guschin et al., 2010, Methods Mol Biol 649: 247). Совместная трансфекция всех четырех компонентов CRISPR была способна индуцировать расщепление, составляющее до 5,0%, в протоспейсере (см. фигура 2D). Совместная трансфекция всех компонентов CRISPR, за исключением SpRNase III, также индуцировала образование вставок/делеций в протоспейсере на уровне до 4,7%, что указывало на то, что могут существовать эндогенные РНКазы млекопитающих, которые способны помогать созреванию crRNA, такие как, например, родственные ферменты Dicer и Drosha. Удаление любого из трех остальных компонентов ликвидировало активность системы CRISPR для расщепления генома (фигура 2D). Секвенирование по Сэнгеру ампликонов, содержащих целевой локус, подтверждало активность для расщепления: на 43 подвергшихся секвенированию клонов было обнаружено 5 мутированных аллелей (11,6%). В подобных экспериментах с использованием ряда направляющих последовательностей процентные значения содержания вставок/делеций составляли до 29% (см. фигуры 4-7, 12 и 13). Эти результаты определяют трехкомпонентную систему для эффективной опосредованной CRISPR модификации генома в клетках млекопитающих. Для оптимизации эффективности расщепления заявители также определяли, влияют ли различные изоформы tracrRNA на эффективность расщепления, и обнаружили, что в этой иллюстративной системе только короткая (89 п.о.) форма транскрипта была способна опосредовать расщепление локуса генома EMX1 человека (фигура 6B).HEK 293FT cells were transfected with a combination of CRISPR components to determine if heterologous expression of the CRISPR system (SpCas9, SpRNase III, tracrRNA and pre-crRNA) in mammalian cells allows targeted mammalian chromosome cleavage to be achieved. Since DSBs in mammalian nuclei are partially repaired using the non-homologous terminal junction (NHEJ) pathway, which leads to the formation of inserts / deletions, SURVEYOR analysis was used to identify potential activity for cleavage at the target EMX1 locus (Figure 8) (see, for example, Guschin et al., 2010, Methods Mol Biol 649: 247). Joint transfection of all four CRISPR components was able to induce cleavage of up to 5.0% in the protospacer (see Figure 2D). Co-transfection of all CRISPR components, with the exception of SpRNase III, also induced up to 4.7% insertion / deletion in the protospacer, indicating that mammalian endogenous RNases may exist that could aid crRNA maturation, such as, for example, related enzymes Dicer and Drosha. Removal of any of the three remaining components eliminated the activity of the CRISPR system for genome cleavage (Figure 2D). Sanger sequencing of amplicons containing the target locus confirmed activity for cleavage: 5 mutated alleles were detected in 43 cloned sequencers (11.6%). In such experiments using a series of guide sequences, percentages of insertion / deletion were up to 29% (see figures 4-7, 12 and 13). These results define a three-component system for efficient CRISPR-mediated genome modification in mammalian cells. To optimize cleavage efficiency, applicants also determined whether various tracrRNA isoforms influenced cleavage efficiency and found that in this illustrative system only a short (89 bp) transcript was able to mediate cleavage of the human EMX1 genome locus (Figure 6B).

На фигуре 14 представлен дополнительный анализ процессинга crRNA в клетках млекопитающих с помощью нозерн-блоттинга. На фигуре 14А показано схематическое изображение вектора экспрессии для одного спейсера, фланкированного двумя прямыми повторами (DR-EMX1(1)-DR). Спейсер из 30 п.о., нацеленный на протоспейсер 1 локуса EMX1 человека (см. фигуру 6), и последовательности прямых повторов показаны в последовательности внизу фигуры 14A. Линия указывает на участок, обратно комплементарную последовательность которого использовали для создания зондов для нозерн-блоттинга для выявления crRNA EMX1(1). На фигуре 14B показаны результаты анализа с помощью нозерн-блоттинга общей РНК, экстрагированной из клеток 293FT, трансфицированных экспрессирующими конструкциями U6, несущими DR-EMX1(1)-DR. Левая и правая секции получены с клетками 293FT, трансфицированными без SpRNase III или с таковой, соответственно. DR-EMX1(1)-DR подвергался процессингу в зрелые crRNA только в присутствии SpCas9 и короткой tracrRNA и не зависел от присутствия SpRNase III. Зрелая crRNA, обнаруженная в общей РНК трансфицированных 293FT, имела длину ~33 п.о. и была короче, чем зрелая crRNA из S. pyogenes длиной 39-42 п.о. Эти результаты демонстрируют, что систему CRISPR можно переместить в эукариотические клетки и перепрограммировать для облегчения расщепления эндогенных целевых полинуклеотидов млекопитающих.The figure 14 presents an additional analysis of the processing of crRNA in mammalian cells using Northern blotting. Figure 14A shows a schematic representation of the expression vector for a single spacer flanked by two direct repeats (DR-EMX1 (1) -DR). A 30 bp spacer aimed at the protospacer 1 of the human EMX1 locus (see FIG. 6) and direct repeat sequences are shown in the sequence at the bottom of FIG. 14A. The line indicates a region whose inverse complementary sequence was used to create Northern blot probes to detect crRNA EMX1 (1). Figure 14B shows the results of Northern blot analysis of total RNA extracted from 293FT cells transfected with U6 expression constructs carrying DR-EMX1 (1) -DR. The left and right sections were obtained with 293FT cells transfected without SpRNase III or with one, respectively. DR-EMX1 (1) -DR was processed into mature crRNAs only in the presence of SpCas9 and short tracrRNA and was not dependent on the presence of SpRNase III. Mature crRNA found in total RNA transfected with 293FT was ~ 33 bp in length. and was shorter than the mature crRNA from S. pyogenes 39-42 bp in length These results demonstrate that the CRISPR system can be transferred to eukaryotic cells and reprogrammed to facilitate cleavage of the endogenous target mammalian polynucleotides.

На фигуре 2 показана бактериальная система CRISPR, описанная в этом примере. На фигуре 2А показано схематическое изображение локуса 1 CRISPR из Streptococcus pyogenes SF370 и предполагаемый механизм опосредованного CRISPR расщепления ДНК с помощью этой системы. Зрелая crRNA, подвергшаяся процессингу из массива прямых повторов-спейсеров, направляет Cas9 к мишеням в геноме, состоящим из комплементарных протоспейсеров и протоспейсерного смежного мотива (PAM). При спаривании оснований мишень-спейсер Cas9 опосредует двухцепочечный разрыв в целевой ДНК. На фигуре 2B показано конструирование Cas9 S. pyogenes (SpCas9) и RNase III (SpRNase III) с клеточными сигналами ядерной локализации (NLS) для обеспечения импорта в ядро млекопитающих. На фигуре 2С показана экспрессия SpCas9 и SpRNase III у млекопитающих, управляемая конститутивным промотором EF1a, и массива tracrRNA и pre-crRNA (DR-cneftcep-DR), управляемая промотором U6 РНК-полимеразы 3 для стимуляции точной инициации и терминации транскрипции. Протоспейсер из локуса EMX1 человека с удовлетворительной последовательностью PAM использовали в качестве спейсера в массиве pre-crRNA. На фигуре 2D показан анализ с помощью нуклеазы Surveyor для опосредованных SpCas9 минорных вставок и делеции. SpCas9 экспрессировался с SpRNase III, tracrRNA и массивом pre-crRNA, несущим целевой спейсер для EMX1, и без таковых. На фигуре 2Е показано схематическое изображение спаривания оснований между целевым локусом и нацеленной на EMX1 crRNA, а также иллюстративная хроматограмма, на которой показана микроделеция, смежная по отношению к сайту расщепления SpCas9. На фигуре 2F показаны мутированные аллели, идентифицированные в результате анализа секвенирования 43 клональных ампликонов, показывающие разнообразие микровставок и микроделеций. Штрихами указаны удаленные основания, а невыровненные или несовпадающие основания указывают на вставки или мутации. Масштабная метка = 10 мкм.Figure 2 shows the CRISPR bacterial system described in this example. Figure 2A shows a schematic representation of CRISPR locus 1 from Streptococcus pyogenes SF370 and a putative mechanism of CRISPR-mediated DNA cleavage using this system. The mature crRNA, which has undergone processing from an array of direct repeat spacers, directs Cas9 to targets in the genome consisting of complementary protospacer and protospacer adjacent motif (PAM). Upon base pairing, the Cas9 spacer target mediates double stranded cleavage in the target DNA. Figure 2B shows the construction of Cas9 S. pyogenes (SpCas9) and RNase III (SpRNase III) with nuclear localization cell signals (NLS) for import into the mammalian nucleus. Figure 2C shows the expression of SpCas9 and SpRNase III in mammals, driven by the constitutive promoter EF1a, and an array of tracrRNA and pre-crRNA (DR-cneftcep-DR), driven by the U6 promoter of RNA polymerase 3 to stimulate precise initiation and termination of transcription. A protospacer from a human EMX1 locus with a satisfactory PAM sequence was used as a spacer in a pre-crRNA array. Figure 2D shows a Surveyor nuclease assay for SpCas9-mediated minor insertions and deletions. SpCas9 was expressed with SpRNase III, tracrRNA, and a pre-crRNA array carrying the target spacer for EMX1, and without them. Figure 2E shows a schematic representation of base pairing between the target locus and EMR1-targeted crRNA, as well as an illustrative chromatogram showing microdeletion adjacent to the SpCas9 cleavage site. Figure 2F shows mutated alleles identified by sequencing analysis of 43 clonal amplicons, showing a variety of microinserts and microdeletions. Dashes indicate deleted bases, and unaligned or mismatched bases indicate insertions or mutations. Scale mark = 10 μm.

Для дальнейшего упрощения трехкомпонентной системы адаптировали химерную crRNA-tracrRNA гибридную структуру, в которой зрелую crRNA (содержащую направляющую последовательность) сливали с частичной tracrRNA через структуру по типу стебель-петля для имитации естественного дуплекса crRNA:tracrRNA (фигура 3A). Для повышения эффективности совместной доставки создавали бицистронный вектор экспрессии для управления коэкспрессией химерной РНК и SpCas9 в трансфицированных клетках (фигуры 3A и 8). Параллельно, бицистронные векторы использовали для экспрессии pre-crRNA (DR-направляющая последовательность-DR) с SpCas9, чтобы индуцировать процессинг в crRNA с участием отдельно экспрессируемой tracrRNA (сравнение на фигуре 13B: верхняя часть и нижняя часть). На фигуре 9 представлены схематические иллюстрации бицистронных векторов экспрессии для массива pre-crRNA (фигура 9А) или химерных crRNA (представлено короткой линией ниже сайта встраивания направляющей последовательности и выше промотора EF1α на фигуре 9B) с hSpCas9, показывающие положение различных элементов и точки встраивания направляющей последовательности. Расширенная последовательность вокруг положения сайта встраивания направляющей последовательности на фигуре 9B также показывает частичную последовательность DR (GTTTAGAGCTA) и частичную последовательности tracrRNA (TAGCAAGTTAAAATAAGGCTAGTCCGTTTTT). Направляющие последовательности можно встроить между сайтами BbsI с использованием гибридизированных олигонуклеотидов. Структуры последовательностей для олигонуклеотидов показаны ниже схематических иллюстраций на фигуре 9 с указанными подходящими адаптерами лигирования. WPRE представляет собой посттранскрипционный регуляторный элемент вируса гепатита сурков. Эффективность опосредованного химерной РНК расщепления исследовали путем целенаправленного воздействия на тот же локус EMX1, описанный выше. С использованием как анализа с помощью Surveyor, так и секвенирования ампликонов по Сэнгеру авторы настоящего изобретения подтвердили, что химерная структура РНК облегчает расщепление локуса EMX1 человека со степенью модификации примерно 4,7% (фигура 4).To further simplify the three-component system, a chimeric crRNA-tracrRNA hybrid structure was adapted in which mature crRNA (containing the guiding sequence) was fused to partial tracrRNA via a stem-loop structure to simulate the natural crRNA: tracrRNA duplex (Figure 3A). To increase the efficiency of co-delivery, a bicistronic expression vector was created to control coexpression of chimeric RNA and SpCas9 in transfected cells (Figures 3A and 8). In parallel, bicistronic vectors were used to express pre-crRNA (DR-directing sequence-DR) with SpCas9 to induce processing in crRNA involving separately expressed tracrRNA (comparison in Figure 13B: upper and lower). Figure 9 is a schematic illustration of bicistronic expression vectors for a pre-crRNA array (Figure 9A) or chimeric crRNA (represented by a short line below the insertion site of the guide sequence and above the EF1α promoter in Figure 9B) with hSpCas9 showing the position of the various elements and the points of insertion of the guide sequence . The extended sequence around the position of the insertion site of the guide sequence in Figure 9B also shows the partial DR sequence (GTTTAGAGCTA) and the partial tracrRNA sequence (TAGCAAGTTAAAATAAGGCTAGTCCGTTTTT). Guide sequences can be inserted between BbsI sites using hybridized oligonucleotides. The sequence structures for the oligonucleotides are shown below in the schematic illustrations in figure 9 with the indicated suitable ligation adapters. WPRE is a post-transcriptional regulatory element of the marmot hepatitis virus. The effectiveness of the mediated chimeric RNA cleavage was investigated by targeted exposure to the same EMX1 locus described above. Using both Surveyor analysis and Sanger amplicon sequencing, the authors of the present invention confirmed that the chimeric structure of RNA facilitates cleavage of the human EMX1 locus with a degree of modification of approximately 4.7% (Figure 4).

Генерализованность опосредованного CRISPR расщепления в эукариотических клетках исследовали путем целенаправленного воздействия на дополнительные локусы генома как в человеческих, так и мышиных клетках путем конструирования химерных РНК, целенаправленно воздействующих на множественные сайты в EMX1 и PVALB человека, а также на локусы Th мыши. На фигуре 15 показан выбор некоторых дополнительных служащих в качестве мишени протоспейсеров в локусах PVALB человека (фигура 15А) и Th мыши (фигура 15B). Приведены схематические изображения локусов генов и положения трех протоспейсеров в последнем экзоне каждого из них. Подчеркнутые последовательности включают последовательность протоспейсера из 30 п.о. и 3 п.о. на 3'-конце, соответствующую последовательностям PAM. Протоспейсеры на смысловой и антисмысловой нитях указаны выше и ниже последовательностей ДНК, соответственно. Степень модификации для локусов PVALB человека и Th мыши достигали 6,3% и 0,75%, соответственно, демонстрируя широкую применимость системы CRISPR при модификации различных локусов у многих организмов (фигуры 3B и 6). Хотя при использовании химерных конструкций расщепление обнаруживали только с одним из трех спейсеров для каждого локуса, все целевые последовательности расщеплялись с эффективностью получения вставок/делеций, достигающей 27%, при использовании схемы с коэкспрессируемой pre-crRNA (фигура 6)The generalization of CRISPR-mediated cleavage in eukaryotic cells was studied by targeting additional genome loci in both human and mouse cells by constructing chimeric RNAs that target multiple sites in human EMX1 and PVALB as well as mouse Th loci. Figure 15 shows the selection of some additional protospeakers serving as targets at the human PVALB loci (Figure 15A) and Th mouse (Figure 15B). Schematic images of gene loci and the positions of three protospacer in the last exon of each of them are presented. Underlined sequences include a 30 bp protospeiser sequence. and 3 bp at the 3'-end corresponding to the PAM sequences. The protospacers on the sense and antisense strands are indicated above and below the DNA sequences, respectively. The degree of modification for the human PVALB and Th loci of the mouse reached 6.3% and 0.75%, respectively, demonstrating the wide applicability of the CRISPR system for the modification of various loci in many organisms (figures 3B and 6). Although using chimeric constructs, cleavage was detected with only one of the three spacers for each locus, all target sequences were cleaved with insertion / deletion efficiencies as high as 27% using the co-expressed pre-crRNA scheme (Figure 6)

На фигуре 13 представлена дополнительная иллюстрация того, что SpCas9 можно перепрограммировать для целенаправленного воздействия на множественные локусы генома в клетках млекопитающих. На фигуре 13А представлено схематическое изображение локуса EMX1 человека, на котором показано положение пяти протоспейсеров, указанных с помощью подчеркнутых последовательностей. На фигуре 13B представлено схематическое изображение комплекса pre-crRNA/trcrRNA, на котором показана гибридизация между участком прямого повтора в pre-crRNA и tracrRNA (вверху), и схематическое изображение химерной структуры РНК, содержащей направляющую последовательность из 20 п.о. и парную tracr-последовательность и tracr-последовательность, состоящие из неполного прямого повтора и последовательностей tracrRNA, гибридизованных в "шпилечную" структуру (внизу). Результаты анализа с помощью Surveyor со сравнением эффективности опосредованного Cas9 расщепления в пяти протоспейсерах в локусе EMX1 человека показаны на фигуре 13С. Целенаправленное воздействие на каждый протоспейсер осуществляли либо с использованием подвергнутого процессингу комплекса pre-crRNA/tracrRNA (crRNA), либо с использованием химерной РНК (chiRNA).Figure 13 provides a further illustration of the fact that SpCas9 can be reprogrammed to target multiple loci of the genome in mammalian cells. Figure 13A is a schematic representation of the human EMX1 locus, which shows the position of the five protospacer indicated by the underlined sequences. 13B is a schematic representation of a pre-crRNA / trcrRNA complex, showing hybridization between the direct repeat region of pre-crRNA and tracrRNA (above), and a schematic representation of a chimeric RNA structure containing a 20 bp guide sequence. and a paired tracr sequence and a tracr sequence consisting of an incomplete direct repeat and tracrRNA sequences hybridized to a hairpin structure (bottom). The results of a Surveyor analysis comparing the efficacy of Cas9-mediated cleavage in five protospacer at the human EMX1 locus are shown in Figure 13C. A targeted effect on each protospacer was carried out either using the processed pre-crRNA / tracrRNA complex (crRNA) or using chimeric RNA (chiRNA).

Поскольку вторичная структура РНК может быть важной для межмолекулярных взаимодействий, алгоритм предсказания структуры на основе минимальной свободной энергии и ансамбля взвешенных структур по Больцману использовали для сравнения предполагаемой вторичной структуры всех направляющих последовательностей, используемых в эксперименте с целенаправленным воздействием на геном (фигура 3B) (см., например, Gruber et al., 2008, Nucleic Acids Research, 36: W70). Анализ выявил, что в большинстве случаев эффективные направляющие последовательности в контексте химерной crRNA, по сути, не содержали мотивов вторичной структуры, тогда как неэффективные направляющие последовательности с большей вероятностью образовывали внутренние вторичные структуры, которые могут препятствовать спариванию оснований с ДНК целевого протоспейсера. Следовательно, возможно, что вариабельность во вторичной структуре спейсера может оказывать воздействие на эффективность опосредованной CRISPR интерференции при использовании химерной crRNA.Since the secondary structure of RNA can be important for intermolecular interactions, the structure prediction algorithm based on the minimum free energy and the ensemble of weighted structures according to Boltzmann was used to compare the estimated secondary structure of all directing sequences used in the experiment with targeted action on the gene (Figure 3B) (see. e.g. Gruber et al., 2008, Nucleic Acids Research, 36: W70). The analysis revealed that in most cases, the effective guide sequences in the context of the chimeric crRNA, in fact, did not contain motifs of the secondary structure, while ineffective guide sequences were more likely to form internal secondary structures, which could interfere with the base pairing with the DNA of the target protospacer. Therefore, it is possible that variability in the secondary structure of the spacer may affect the effectiveness of CRISPR-mediated interference using chimeric crRNA.

На фигуре 3 показан пример векторов экспрессии. На фигуре 3A представлено схематическое изображение бицистронного вектора для управления экспрессией химерной синтетической конструкции crRNA-tracrRNA (химерной РНК), а также SpCas9. Химерная направляющая РНК содержит направляющую последовательность из 20 п.о., соответствующую протоспейсеру в геномном целевом сайте. На фигуре 3B представлено схематическое изображение, на котором показаны направляющие последовательности, нацеленные на локусы EMX1, PVALB человека и Th мыши, а также их предсказанные вторичные структуры. Эффективность модификации в каждом целевом сайте указана ниже рисунка вторичной структуры РНК (EMX1, n=216 считываемых фрагментов при секвенировании ампликонов; PVALB, n=224 считываемых фрагментов; Th, n=265 считываемых фрагментов). Представлены результаты по алгоритму укладки каждого основания, окрашенного соответственно его возможности принятия предсказанной вторичной структуры, как указано с помощью цветной шкалы, воспроизведенной на фигуре 3B в виде серой шкалы.Figure 3 shows an example of expression vectors. 3A is a schematic illustration of a bicistronic vector for controlling expression of the chimeric synthetic construct crRNA-tracrRNA (chimeric RNA) as well as SpCas9. The chimeric RNA guide contains a 20 bp guide sequence corresponding to the protospacer at the genomic target site. 3B is a schematic view showing guide sequences aimed at the mouse EMX1, PVALB loci of a human, and Th, as well as their predicted secondary structures. The modification efficiency at each target site is shown below the figure of the secondary structure of RNA (EMX1, n = 216 read fragments during amplicon sequencing; PVALB, n = 224 read fragments; Th, n = 265 read fragments). The results are presented for the laying algorithm of each base, colored according to its ability to accept the predicted secondary structure, as indicated by the color scale reproduced in figure 3B as a gray scale.

Структуры дополнительных векторов для SpCas9 показаны на фигуре 44, на которой показаны отдельные векторы экспрессии, включающие промотор U6, сцепленный с сайтом встраивания для направляющего олигонуклеотида, и промотор Cbh, сцепленный с кодирующей последовательностью SpCas9. Вектор, показанный на фигуре 44b, включает кодирующую последовательность tracrRNA, сцепленную с промотором H1.The structures of the additional vectors for SpCas9 are shown in FIG. 44, which shows individual expression vectors including the U6 promoter linked to the insertion site for the guide oligonucleotide and the Cbh promoter linked to the SpCas9 coding sequence. The vector shown in Figure 44b includes the coding sequence of tracrRNA linked to the H1 promoter.

Для того, чтобы определить, способны ли спейсеры со вторичными структурами функционировать в прокариотических клетках, где в естественных условиях функционируют CRISPR, интерференцию при трансформации плазмидами, несущими протоспейсеры, исследовали в штамме Е. coli, гетерологично экспрессирующем локус 1 CRISPR S. pyogenes SF370 (фигура 10). Локус CRISPR клонировали в низкокопийный вектор экспрессии Е. coli и массив crRNA замещали одним спейсером, фланкированным парой DR (pCRISPR). Штаммы Е. coli, несущие разные плазмиды pCRISPR, трансформировали контрольными плазмидами, содержащими соответствующий протоспейсер и последовательности PAM (фигура 10C). При анализе у бактерий все спейсеры способствовали эффективной CRISPR-интерференции (фигура 4С). Эти результаты указывают на то, что могут существовать дополнительные факторы, влияющие на эффективность активности CRISPR в клетках млекопитающих.In order to determine whether spacers with secondary structures are capable of functioning in prokaryotic cells, where CRISPR function in vivo, interference upon transformation with plasmids carrying protospacer was studied in E. coli strain heterologously expressing CRISPR locus 1 of S. pyogenes SF370 (figure 10). The CRISPR locus was cloned into a low copy E. coli expression vector and the crRNA array was replaced with a single spacer flanked by a DR pair (pCRISPR). E. coli strains carrying different pCRISPR plasmids were transformed with control plasmids containing the corresponding protospacer and PAM sequences (Figure 10C). When analyzing bacteria, all spacers contributed to effective CRISPR interference (Figure 4C). These results indicate that there may be additional factors affecting the effectiveness of CRISPR activity in mammalian cells.

Для исследования специфичности опосредованного CRISPR расщепления эффект однонуклеотидных мутаций в направляющей последовательности в отношении расщепления протоспейсера в геноме млекопитающих анализировали с использованием ряда целенаправленно воздействующих на EMX1 химерных crRNA с единичными точковыми мутациями (фигура 4А). На фигуре 4B показаны результаты анализа с помощью нуклеазы Surveyor со сравнением эффективности расщепления Cas9 при спаривании с различными мутантными химерными РНК. Несовпадение одного основания в участке вплоть до 12 п.о. с 5' в PAM, по сути, прекращало расщепление генома SpCas9, тогда как спейсеры с мутациями в положениях, расположенных в более отдаленных положениях выше относительно хода транскрипции сохраняли активность в отношении исходного протоспейсера-мишени (фигура 4B). В дополнение к PAM, SpCas9 характеризуется специфичностью в отношении одного основания в последних 12 п.о. спейсера. Кроме того, CRISPR способен опосредовать расщепление генома столь же эффективно, как и пара нуклеаз TALE (TALEN), целенаправленно воздействующих на тот же протоспейсер EMX1. На фигуре 4С представлено схематическое изображение, на котором показана структура TALEN, целенаправленно воздействующих на EMX1, и на фигуре 4D показано сравнение эффективности TALEN и Cas9 (n=3) при разгонке в геле продуктов, полученных в результате анализа с помощью Surveyor.To investigate the specificity of CRISPR-mediated cleavage, the effect of single nucleotide mutations in the guide sequence with respect to protospeiser cleavage in the mammalian genome was analyzed using a number of single point mutations targeted to EMX1 chimeric crRNAs (Figure 4A). 4B shows the results of a Surveyor nuclease assay comparing the efficiency of Cas9 cleavage when pairing with various mutant chimeric RNAs. Mismatch of one base in the area up to 12 bp from 5 'in PAM, essentially stopped the SpCas9 genome cleavage, while spacers with mutations at positions located at more distant positions above the transcription progression remained active with respect to the original protospeiser target (Figure 4B). In addition to PAM, SpCas9 is characterized by single base specificity in the last 12 bp. spacer. In addition, CRISPR is able to mediate genome cleavage as efficiently as a pair of TALE nucleases (TALEN), which specifically target the same protospacer EMX1. Figure 4C is a schematic view showing the structure of TALENs targeting EMX1, and Figure 4D shows a comparison of the efficiencies of TALEN and Cas9 (n = 3) in gel gel distillation of products obtained from a Surveyor analysis.

Установив набор компонентов для достижения опосредованного CRISPR редактирования генов в клетках млекопитающих посредством подверженного ошибкам механизма NHEJ, исследовали способность CRISPR к стимуляции гомологичной рекомбинации (HR), высокоточный путь репарации генов для создания точных редакционных изменений в геноме. SpCas9 дикого типа способен опосредовать сайт-специфические DSB, которые могут репарироваться как с помощью NHEJ, так и HR. Кроме того, замену аспартат-на-аланин (D10A) в каталитическом домене RuvC I в SpCas9 конструировали для превращения нуклеазы в никазу (SpCas9n; проиллюстрировано на фигуре 5А) (см., например, Sapranausaks et al., 2011, Nucleic Acids Resch, 39: 9275; Gasiunas et al., 2012, Proc. Natl. Acad. Sci. USA, 109: E2579) так, чтобы надрезанная геномная ДНК подвергалась высокоточной репарации с участием гомологичной рекомбинации (HDR). Анализ с помощью Surveyor подтвердил, что SpCas9n не создает вставок/делеций в протоспейсере-мишени EMX1. Как показано на фигуре 5B, коэкспрессия целенаправленно воздействующей на EMX1 химерной crRNA с SpCas9 давала вставки/делеции в целевом сайте, тогда как коэкспрессия с SpCas9n - нет (n=3). Более того, секвенирование 327 ампликонов не обнаружило каких-либо вставок/делеций, индуцированных SpCas9n. Для исследования опосредованной CRISPR HR при совместной трансфекции клеток HEK 293FT химерной РНК, целенаправленно воздействующей на EMX1, hSpCas9 или hSpCas9n, выбирали тот же локус, также как и матрицу для HR для введения пары сайтов рестрикции (HindIII и NheI) возле протоспейсера. На фигуре 5С приведена схематическая иллюстрация стратегии HR с относительными положениями точек рекомбинации и последовательностей для гибридизации праймеров (стрелки). SpCas9 и SpCas9n действительно катализировали интеграцию матрицы HR в локус EMX1. ПЦР амплификация целевого участка с последующим рестрикционным расщеплением HindIII выявила продукты расщепления, соответствующие ожидаемым размерам фрагментов (стрелки на результатах анализа полиморфизма длин рестрикционных фрагментов с помощью гель-электрофореза, показанных на фигуре 5D), причем SpCas9 и SpCas9n опосредуют подобные уровни эффективности HR. Заявители дополнительно подтверждали HR с использованием секвенирования геномных ампликонов по Сэнгеру (фигура 5Е). Эти результаты демонстрировали пригодность CRISPR для облегчения целенаправленной вставки генов в геном млекопитающего. С учетом специфичности целенаправленного воздействия в 14 п.о. (12 п.о. от спейсера и 2 п.о. от PAM) SpCas9 дикого типа, доступность никазы может значительно снизить вероятность нецелевых модификаций, поскольку одноцепочечные разрывы не являются субстратами для подверженного ошибкам пути NHEJ.Having established a set of components to achieve CRISPR-mediated gene editing in mammalian cells through the error-prone NHEJ mechanism, CRISPR's ability to stimulate homologous recombination (HR), a high-precision gene repair pathway to create accurate editorial changes in the genome, was investigated. Wild-type SpCas9 is able to mediate site-specific DSBs that can be repaired using both NHEJ and HR. In addition, the replacement of aspartate-on-alanine (D10A) in the RuvC I catalytic domain in SpCas9 was designed to convert nuclease to nickase (SpCas9n; illustrated in Figure 5A) (see, for example, Sapranausaks et al., 2011, Nucleic Acids Resch, 39: 9275; Gasiunas et al., 2012, Proc. Natl. Acad. Sci. USA, 109: E2579) so that the incised genomic DNA undergoes highly accurate repair using homologous recombination (HDR). Surveyor analysis confirmed that SpCas9n does not create insertions / deletions in the EMX1 protospacer target. As shown in FIG. 5B, coexpression of the chimeric crRNA with SpCas9 targeting EMX1 specifically resulted in insertion / deletion at the target site, while coexpression with SpCas9n did not (n = 3). Moreover, sequencing 327 amplicons did not reveal any SpCas9n-induced insertions / deletions. To study CRISPR HR-mediated co-transfection of HEK 293FT cells with chimeric RNA targeting EMX1, hSpCas9 or hSpCas9n, the same locus was chosen as well as the HR template for introducing a pair of restriction sites (HindIII and NheI) near the protospacer. 5C is a schematic illustration of an HR strategy with relative positions of recombination points and sequences for primer hybridization (arrows). SpCas9 and SpCas9n did catalyze the integration of the HR matrix into the EMX1 locus. PCR amplification of the target site followed by HindIII restriction digestion revealed cleavage products corresponding to the expected fragment sizes (arrows on the results of restriction fragment length polymorphism analysis using gel electrophoresis shown in Figure 5D), with SpCas9 and SpCas9n mediating similar levels of HR efficiency. Applicants further confirmed HR using Sanger genomic amplicon sequencing (Figure 5E). These results demonstrated the usefulness of CRISPR to facilitate targeted insertion of genes into the mammalian genome. Given the specificity of the targeted impact of 14 bp (12 bp from spacer and 2 bp from PAM) SpCas9 wild-type, the availability of nickase can significantly reduce the likelihood of inappropriate modifications, since single-stranded breaks are not substrates for the error-prone NHEJ path.

Экспрессирующие конструкции, имитирующие естественную архитектуру локусов CRISPR с собранными в массив спейсерами (фигура 2А), создавали для исследования возможности мультиплексного целенаправленного воздействия на последовательности. При использовании одного массива CRISPR, кодирующего пару спейсеров, нацеленных на EMX1 и PVALB, обнаруживали эффективное расщепление в обоих локусах (фигура 4F, на которой показаны как схематическая структура массива crRNA, так и блот, полученный после анализа с помощью Surveyor, показывающий эффективное опосредование расщепления). Также исследовали целенаправленную делецию геномных участков большего размера посредством одновременных DSB с использованием спейсеров против двух мишеней в EMX1, разделенных 119 п.о., и обнаруженная эффективность делеции составляла 1,6% (3 из 182 ампликонов; фигура 4G). Это демонстрирует, что система CRISPR может опосредовать мультиплексное редактирование в пределах одного генома. Пример 2: модификации и альтернативы системы CRISPR Возможность применения РНК для программирования специфичного к последовательности расщепления ДНК определяет новый класс инструментов для конструирования генома для разнообразных исследовательских и промышленных применений. Несколько аспектов системы CRISPR можно дополнительно улучшить для повышения эффективности и универсальности целенаправленного воздействия с помощью CRISPR. Оптимальная активность Cas9 может зависеть от доступности несвязанного Mg2+ на уровнях, которые превышают имеющиеся в ядре млекопитающего (см., например, Jinek et al., 2012, Science, 337: 816), и предпочтение в отношении мотива NGG непосредственно ниже протоспейсера ограничивает способность к целенаправленному воздействию в среднем на каждые 12 п.о. в геноме человека (фигура 11, оценка как плюс-, так и минус-нитей в хромосомных последовательностях человека). Некоторые из этих затруднений можно преодолеть путем изучения разнообразия локусов CRISPR в микробном метагеноме (см., например, Makarova et al., 2011, Nat Rev Microbiol, 9: 467). Другие локусы CRISPR можно переместить в микроокружение клетки млекопитающего с помощью способа, подобного описанному в примере 1. Например, на фигуре 12 показана адаптация системы CRISPR II типа из CRISPR 1 LMD-9 Streptococcus thermophilus для гетерологичной экспрессии в клетках млекопитающих, чтобы достичь опосредованного CRISPR редактирования генома. На фигуре 12А приведена схематическая иллюстрация CRISPR 1 из LMD-9 S. thermophilus. На фигуре 12B показана структура системы экспрессии для системы CRISPR S. thermophilus. Кодон-оптимизированный hStCas9 человека экспрессируется с помощью конститутивного промотора EF1α. Зрелые варианты tracrRNA и crRNA экспрессируются с помощью промотора U6 для стимуляции точной инициации транскрипции. Показаны последовательности из зрелых crRNA и tracrRNA. Одно основание, обозначенное буквой "а" в нижнем регистре в последовательности crRNA использовали для удаления последовательности polyU, которая служит в качестве терминатора транскрипции РНК polIII. На фигуре 12С представлено схематическое изображение, на котором показаны направляющие последовательности, нацеленные на локус EMX1 человека, а также их предсказанные вторичные структуры. Эффективность модификации в каждом целевом сайте указана ниже вторичных структур РНК. Алгоритм, генерирующий цвета структуры каждого основания соответственно его возможности принятия предсказанной вторичной структуры, которая указана с помощью цветной шкалы, воспроизведен на фигуре 12С в виде серой шкалы. На фигуре 12D показаны результаты опосредованного hStCas9 расщепления в целевом локусе с использованием анализа с помощью Surveyor. РНК направляющих спейсеров 1 и 2 индуцировали 14% и 6,4%, соответственно. Статистический анализ активности для расщепления по биологическим копиям в этих двух протоспейсерных сайтах также приведен на фигуре 6. На фигуре 16 приведено схематическое изображение дополнительного протоспейсера и соответствующих последовательностей PAM, являющихся мишенями для системы CRISPR S. thermophilics, в локусе EMX1 человека. Последовательности двух протоспейсеров выделены и их соответствующие последовательности PAM, удовлетворяющие мотиву NNAGAAW, обозначены путем подчеркивания в направлении 3' относительно соответствующей выделенной последовательности. Оба протоспейсера нацелены на антисмысловую нить.Expression constructs imitating the natural architecture of CRISPR loci with spacers assembled into an array (Figure 2A) created the possibility of a multiplex targeted effect on sequences. Using a single CRISPR array encoding a pair of spacers targeting EMX1 and PVALB, effective cleavage was detected at both loci (Figure 4F, which shows both the schematic structure of the crRNA array and the blot obtained after analysis by Surveyor, showing efficient cleavage mediation ) A targeted deletion of larger genomic regions was also investigated using simultaneous DSBs using spacers against two targets in EMX1 separated by 119 bp, and the detected deletion efficiency was 1.6% (3 of 182 amplicons; Figure 4G). This demonstrates that the CRISPR system can mediate multiplex editing within a single genome. Example 2: modifications and alternatives to the CRISPR system The possibility of using RNA for programming sequence-specific DNA cleavage defines a new class of tools for constructing the genome for a variety of research and industrial applications. Several aspects of the CRISPR system can be further improved to increase the effectiveness and versatility of targeted exposure using CRISPR. The optimal activity of Cas9 may depend on the availability of unbound Mg 2+ at levels that exceed those available in the mammalian nucleus (see, for example, Jinek et al., 2012, Science, 337: 816), and preference for the NGG motif immediately below the protospacer limits ability to target action on average for every 12 bp in the human genome (figure 11, the evaluation of both plus and minus threads in the chromosome sequences of a person). Some of these difficulties can be overcome by studying the diversity of CRISPR loci in the microbial metagenome (see, for example, Makarova et al., 2011, Nat Rev Microbiol, 9: 467). Other CRISPR loci can be transferred to the microenvironment of a mammalian cell using a method similar to that described in Example 1. For example, Figure 12 shows an adaptation of a CRISPR type II system from CRISPR 1 LMD-9 Streptococcus thermophilus for heterologous expression in mammalian cells to achieve CRISPR-mediated editing genome. Figure 12A is a schematic illustration of CRISPR 1 from S. thermophilus LMD-9. Figure 12B shows the structure of the expression system for the S. thermophilus CRISPR system. The codon-optimized human hStCas9 is expressed using the constitutive promoter EF1α. Mature variants of tracrRNA and crRNA are expressed using the U6 promoter to stimulate the precise initiation of transcription. Sequences from mature crRNA and tracrRNA are shown. One base, indicated by a lowercase letter “a” in the crRNA sequence, was used to remove the polyU sequence, which serves as the polIII RNA transcription terminator. Figure 12C is a schematic representation showing guide sequences aimed at the human EMX1 locus, as well as their predicted secondary structures. The modification efficiency at each target site is indicated below the secondary RNA structures. The algorithm that generates the colors of the structure of each base according to its ability to accept the predicted secondary structure, which is indicated by the color scale, is reproduced in figure 12C as a gray scale. Figure 12D shows the results of hStCas9-mediated cleavage at the target locus using a Surveyor assay. RNA guide spacers 1 and 2 induced 14% and 6.4%, respectively. A statistical analysis of the activity for cleavage by biological copies in these two protospacer sites is also shown in Figure 6. Figure 16 shows a schematic representation of an additional protospacer and corresponding PAM sequences that are targets for S. thermophilics CRISPR system at the human EMX1 locus. The sequences of the two protospacers are highlighted and their corresponding PAM sequences satisfying the NNAGAAW motif are indicated by underlining in the 3 'direction relative to the corresponding highlighted sequence. Both protospacer are aimed at antisense thread.

Пример 3: алгоритм выбора образцов целевой последовательностиExample 3: an algorithm for selecting samples of the target sequence

Создали компьютерную программу для идентификации кандидатных целевых последовательностей CRISPR на обеих нитях вводимой последовательности ДНК на основе длины желаемой направляющей последовательности и последовательности мотива CRISPR (PAM) для определенного фермента CRISPR. Например, целевые сайты для Cas9 из S. pyogenes с последовательностями PAM NGG можно идентифицировать путем поиска в отношении 5'-Nx-NGG-3' как на вводимой последовательности, так и на последовательности, обратно-комплементарной вводимой. Подобным образом, целевые сайты для Cas9 CRISPR1 S. thermophilus с последовательностью PAM NNAGAAW, можно идентифицировать путем поиска в отношении 5'-Nx-NNAGAAW-3' как на вводимой последовательности, так и на последовательности, обратно-комплементарной вводимой. Подобным образом, целевые сайты для Cas9 CRISPR3 S. thermophilus с последовательностью PAM NGGNG можно идентифицировать путем поиска в отношении 5'-Nx-NGGNG-3' как на вводимой последовательности, так и на последовательности, обратно-комплементарной вводимой. Значение "x" в Nx может фиксироваться программой или может быть определено пользователем, как, например, 20.A computer program was created to identify candidate CRISPR target sequences on both strands of the inserted DNA sequence based on the length of the desired guide sequence and the CRISPR motif sequence (PAM) for a particular CRISPR enzyme. For example, target sites for Cas9 from S. pyogenes with PAM NGG sequences can be identified by searching for 5'-N x -NGG-3 'in both the input sequence and the reverse complement sequence. Similarly, target sites for Cas9 CRISPR1 S. thermophilus with the PAM NNAGAAW sequence can be identified by searching for the 5'-N x -NNAGAAW-3 'on both the input sequence and the reverse complement sequence. Similarly, target sites for Cas9 CRISPR3 S. thermophilus with the PAM NGGNG sequence can be identified by searching for 5'-N x -NGGNG-3 'in both the input sequence and the back-complementary sequence. The value of "x" in N x may be fixed by the program or may be determined by the user, such as 20.

Поскольку несколько случаев появления целевого сайта ДНК в геноме могут приводить к неспецифическому редактированию генома, после идентификации всех возможных сайтов программа профильтровывает последовательности, исходя из количества раз, когда они встречаются в соответствующем эталонном геноме. Для тех ферментов CRISPR, для которых специфичность к последовательности определяется "затравочной" последовательностью, такой как находящаяся в 11-12 п.о. в направлении 5' от последовательности PAM, в том числе сама последовательность PAM, стадия фильтрования может основываться на затравочной последовательности. Следовательно, во избежание редактирования в дополнительных локусах генома результаты фильтруют, исходя из числа случаев обнаружения последовательности затравки : PAM в подходящем геноме. Пользователь может иметь возможность выбора длины затравочной последовательности. Пользователь также может иметь возможность определять число случаев обнаружения последовательности затравки : PAM в геноме применительно к прохождению фильтра. По умолчанию установлен скрининг в отношении уникальных последовательностей. Уровень фильтрования изменяют путем изменения как длины затравочной последовательности, так и числа случаев обнаружения последовательности в геноме. В качестве дополнения или альтернативы, программа может обеспечивать последовательность направляющей последовательности, комплементарную сообщенной(ым) целевой(ым) последовательности(ям) путем обеспечения последовательности, обратно комплементарной идентифицированной(ым) целевой(ым) последовательности(ям).Since several cases of the appearance of the target DNA site in the genome can lead to non-specific editing of the genome, after identifying all possible sites, the program filters the sequences based on the number of times they occur in the corresponding reference genome. For those CRISPR enzymes for which sequence specificity is determined by a “seed” sequence, such as 11-12 bp in the direction 5 'from the PAM sequence, including the PAM sequence itself, the filtering step may be based on the seed sequence. Therefore, in order to avoid editing at additional loci of the genome, the results are filtered based on the number of cases when a seed sequence has been detected: PAM in a suitable genome. The user may be able to select the length of the seed sequence. The user may also be able to determine the number of times a seed sequence has been detected: PAM in the genome as applied to the passage of the filter. The default screening is for unique sequences. The filtering level is changed by changing both the length of the seed sequence and the number of cases of sequence detection in the genome. As an addition or alternative, the program can provide a sequence of the guide sequence complementary to the reported target sequence (s) by providing a sequence that is backward complementary to the identified target sequence (s).

Дальнейшие детали способов и алгоритмов для оптимизации выбора последовательности можно найти в заявке на патент США с серийным номером 61/836080 (номер дела у патентного поверенного 44790.11.2022); включенной в данный документ при помощи ссылки.Further details of the methods and algorithms for optimizing sequence selection can be found in the US patent application with serial number 61/836080 (case number of the patent attorney 44790.11.2022); incorporated herein by reference.

Пример 4: оценка гибридов нескольких химерных crRNA-tracrRNAExample 4: Evaluation of the hybrids of several chimeric crRNA-tracrRNA

В данном примере описаны результаты, полученные для химерных РНК (chiRNA; содержащие направляющую последовательность, парную tracr-последовательность и tracr-последовательность в одном транскрипте), имеющих tracr-последовательности, которые включают фрагменты последовательности tracrRNA дикого типа с разной длиной. На фигуре 18а показано схематическое изображение бицистронного вектора экспрессии для химерной РНК и Cas9. Cas9 управляется промотором CBh, а химерная РНК управляется промотором U6. Химерная направляющая РНК состоит из направляющей последовательности (Ns) из 20 п.о., соединенной с tracr-последовательностью (проходящей от первого "U" в нижней нити к концу транскрипта), которая усечена в разных указанных положениях. Направляющие и tracr-последовательности разделены парной tracr-последовательностью GUUUUAGAGCUA, за которой следует последовательность петли GAAA. Результаты анализов с помощью SURVEYOR в отношении опосредованных Cas9 вставок/делеций в локусах EMX1 и PVALB человека показаны на фигурах 18b и 18c, соответственно. Стрелки указывают на ожидаемые фрагменты, полученные в результате расщепления с помощью SURVEYOR. ChiRNA показаны путем обозначения их "+n", a crRNA относится к гибридной РНК, в которой направляющие и tracr-последовательности экспрессируются в виде раздельных транскриптов. Количественный анализ этих результатов, выполненный в трех повторностях, проиллюстрирован с помощью гистограмм на фигурах 19а и 19b, соответствующих фигурам 18b и 18c, соответственно ("N.D." означает отсутствие обнаруженных вставок/делеций). ID (идентификационные данные) протоспейсеров и их соответствующей мишени в геноме, последовательность протоспейсера, последовательность PAM и положение нити приведены в таблице D. Направляющие последовательности разработаны так, чтобы они были комплементарны полной последовательности протоспейсера в случае отдельных транскриптов в гибридной системе или только подчеркнутой части в случае химерных РНК.This example describes the results obtained for chimeric RNAs (chiRNAs; containing the guide sequence, paired tracr sequence and tracr sequence in one transcript) having tracr sequences that include fragments of the wild-type tracrRNA sequence with different lengths. Figure 18a shows a schematic representation of a bicistronic expression vector for chimeric RNA and Cas9. Cas9 is driven by the CBh promoter, and chimeric RNA is driven by the U6 promoter. The chimeric RNA guide consists of a 20 bp guide sequence (Ns) connected to a tracr sequence (extending from the first “U” in the lower strand to the end of the transcript), which is truncated at different indicated positions. Guides and tracr sequences are separated by the GUUUUAGAGCUA paired tracr sequence, followed by the GAAA loop sequence. SURVEYOR assays for Cas9-mediated insertions / deletions at the human EMX1 and PVALB loci are shown in Figures 18b and 18c, respectively. Arrows indicate the expected fragments resulting from cleavage using SURVEYOR. ChiRNAs are shown by naming them “+ n,” and crRNA refers to hybrid RNA in which the guiding and tracr sequences are expressed as separate transcripts. A quantitative analysis of these results, performed in triplicate, is illustrated using the histograms in figures 19a and 19b, corresponding to figures 18b and 18c, respectively ("N.D." means the absence of detected inserts / deletions). The ID (identification data) of the protospacer and their corresponding target in the genome, the protospacer sequence, the PAM sequence and the position of the strand are shown in Table D. The guide sequences are designed so that they are complementary to the complete protospacer sequence in the case of individual transcripts in the hybrid system or only the underlined part in case of chimeric RNA.

Figure 00000032
Figure 00000032

Клеточная культура и трансфекцияCell Culture and Transfection

Линию клеток почки человеческого эмбриона (HEK) 293FT (Life Technologies) поддерживали в среде Игла в модификации Дульбекко (DMEM), дополненной 10% фетальной бычьей сыворотки (HyClone), 2 мМ GlutaMAX (Life Technologies), 100ЕД/мл пенициллина и 100 мкг/мл стрептомицина, при 37°C с инкубированием при 5% CO2. Клетки 293FT засевали в 24-луночные планшеты (Corning) за 24 часа до трансфекции при плотности 150000 клеток на лунку. Клетки трансфицировали с применением Lipofectamine 2000 (Life Technologies), следуя рекомендованному производителем протоколу. Для каждой лунки 24-луночного планшета использовали в общей сложности 500 нг плазмид.The human embryo kidney cell line (HEK) 293FT (Life Technologies) was maintained in Eagle's Dulbecco modification (DMEM) supplemented with 10% fetal bovine serum (HyClone), 2 mM GlutaMAX (Life Technologies), 100 U / ml penicillin and 100 μg / ml of streptomycin, at 37 ° C with incubation at 5% CO 2 . 293FT cells were seeded in 24-well plates (Corning) 24 hours prior to transfection at a density of 150,000 cells per well. Cells were transfected using Lipofectamine 2000 (Life Technologies) following the manufacturer's recommended protocol. A total of 500 ng plasmids were used for each well of the 24-well plate.

Анализ с помощью SURVEYOR на предмет наличия модификации геномаSURVEYOR analysis for genome modification

Клетки 293FT трансфицировали плазмидной ДНК, как описано выше. Клетки инкубировали при 37°C в течение 72 часов после трансфекции перед экстракцией геномной ДНК. Геномную ДНК экстрагировали с помощью раствора QuickExtract DNA Extraction Solution (Epicentre), следуя протоколу производителя. Вкратце, осажденные центрифугированием клетки ресуспендировали в растворе QuickExtract solution и инкубировали при 65°C в течение 15 минут и 98°C в течение 10 минут. Геномный участок, окружающий целевой сайт CRISPR, для каждого гена подвергали ПЦР амплификации (праймеры перечислены в таблице Е) и продукты очищали с использованием колонки QiaQuick Spin Column (Qiagen), следуя протоколу производителя. В общей сложности 400 нг очищенных ПЦР-продуктов смешивали с 2 мкл 10Х ПЦР-буфера для ДНК-полимеразы Taq (Enzymatics) и воды сверхвысокой чистоты до конечного объема 20 мкл и подвергали процессу повторного отжига для обеспечения образования гетеродуплекса: 95°C в течение 10 мин., линейное снижение температуры с 95°C до 85°C со скоростью 2°C/с, с 85°C до 25°C со скоростью 0,25°C/с и с выдерживанием при 25°C в течение 1 минуты. После повторного отжига продукты обрабатывали нуклеазой SURVEYOR и энхансером S SURVEYOR (Transgenomics), следуя рекомендованному производителем протоколу, и анализировали в 4-20% полиакриламидных гелях Novex ТВЕ (Life Technologies). Гели окрашивали красителем ДНК SYBR Gold (Life Technologies) в течение 30 минут и получали изображение с помощью системы обработки изображений Gel Doc gel imaging system (Bio-rad). Количественный анализ основывался на относительных интенсивностях полос.293FT cells were transfected with plasmid DNA as described above. Cells were incubated at 37 ° C for 72 hours after transfection before genomic DNA extraction. Genomic DNA was extracted with QuickExtract DNA Extraction Solution (Epicentre) following the manufacturer's protocol. Briefly, centrifuged cells were resuspended in a QuickExtract solution and incubated at 65 ° C for 15 minutes and 98 ° C for 10 minutes. The genomic region surrounding the CRISPR target site was PCR amplified for each gene (primers are listed in Table E) and the products were purified using a QiaQuick Spin Column (Qiagen) column following the manufacturer's protocol. A total of 400 ng of purified PCR products were mixed with 2 μl of 10X Taq DNA Enzymatics PCR buffer and ultra-high purity water to a final volume of 20 μl and subjected to a re-annealing process to ensure heteroduplex formation: 95 ° C for 10 min., linear decrease in temperature from 95 ° C to 85 ° C at a rate of 2 ° C / s, from 85 ° C to 25 ° C at a speed of 0.25 ° C / s and withstand at 25 ° C for 1 minute . After repeated annealing, the products were treated with SURVEYOR nuclease and S SURVEYOR enhancer (Transgenomics), following the protocol recommended by the manufacturer, and analyzed in 4-20% Novex TBE polyacrylamide gels (Life Technologies). The gels were stained with SYBR Gold DNA stain (Life Technologies) for 30 minutes and the image was obtained using the Gel Doc gel imaging system (Bio-rad) image processing system. Quantitative analysis was based on the relative intensities of the bands.

Figure 00000033
Figure 00000033

Вычислительная идентификация уникальных целевых сайтов CRISPRComputational Identification of Unique CRISPR Target Sites

Для идентификации уникальных целевых сайтов для фермента Cas9 (SpCas9) S. pyogenes SF370 в геноме человека, мыши, крысы, данио, плодовой мухи и С. elegans был разработан пакет программ для сканирования обеих нитей последовательности ДНК и идентификации всех возможных целевых сайтов SpCas9. Для этого примера каждый целевой сайт SpCas9 был оперативно определен как последовательность из 20 п.о., за которой следует последовательность мотива, смежного с протоспейсером (PAM) NGG, при этом были определены все последовательности, удовлетворяющие определению 5'-N20-NGG-3' на всех хромосомах. Для предотвращения неспецифического редактирования генома после идентификации всех потенциальных сайтов все целевые сайты фильтровали, исходя из количества раз, когда они встречаются в соответствующем эталонном геноме. Для того, чтобы извлечь пользу из специфичности к последовательности активности Cas9, обеспечиваемой "затравочной" последовательностью, которой может быть, например, последовательность из приблизительно 11-12 п.о. 5' от последовательности PAM, при этом последовательности 5'-NNNNNNNNNN-NGG-3' выбирали как уникальные в соответствующем геноме. Все геномные последовательности загружали из геномного браузера UCSC (геном человека hg19, геном мыши mm9, геном крысы rn5, геном данио danRer7, геном D. melanogaster dm4 и геном С. elegans ce10). Все результаты поиска доступны для просмотра с использованием информации из геномного браузера UCSC. Иллюстративная визуализация некоторых целевых сайтов в геноме человека представлена на фигуре 21.To identify unique target sites for the Cas9 (SpCas9) S. pyogenes SF370 enzyme in the human, mouse, rat, zebrafish, fruit fly, and C. elegans genome, a software package was developed to scan both strands of the DNA sequence and identify all possible SpCas9 target sites. For this example, each SpCas9 target site was promptly identified as a 20 bp sequence, followed by a sequence of motif adjacent to the NGG proto-spacer (PAM), with all sequences meeting the definition of 5'-N 20 -NGG- 3 'on all chromosomes. To prevent non-specific editing of the genome after identification of all potential sites, all target sites were filtered based on the number of times they are found in the corresponding reference genome. In order to benefit from the specificity for the Cas9 activity sequence provided by the “seed” sequence, which may be, for example, a sequence of about 11-12 bp 5 'from the PAM sequence, wherein the 5'-NNNNNNNNNN-NGG-3' sequences were selected as unique in the corresponding genome. All genomic sequences were downloaded from the UCSC genomic browser (hg19 human genome, mm9 mouse genome, rn5 rat genome, danRer7 zebrafish genome, D. melanogaster dm4 genome, and C. elegans ce10 genome). All search results are available for viewing using information from the genomic browser UCSC. Illustrative visualization of some target sites in the human genome is presented in figure 21.

Первоначально целенаправленному воздействию подвергали три сайта в пределах локуса EMX1 в клетках HEK 293FT человека. Эффективность модификации генома каждой chiРНК оценивали с использованием анализа с помощью нуклеазы SURVEYOR, который позволяет обнаруживать мутации, возникающие в результате двухцепочечных разрывов (DSB) ДНК и их последующей репарации с помощью пути репарации повреждения ДНК за счет негомологичного соединения концов (NHEJ). В конструкциях, обозначенных chiRNA(+n), указывается, что нуклеотиды в количестве до +n нуклеотида tracrRNA дикого типа включены в химерную РНК-конструкцию, при этом для n используются значения 48, 54, 67 и 85. Химерные РНК, содержащие более длинные фрагменты tracrRNA дикого типа (chiRNA(+67) и chiRNA(+85)), опосредовали расщепление ДНК во всех трех целевых сайтах EMX1, причем chiRNA(+85), в частности, демонстрировал значительно более высокие уровни расщепления ДНК, чем соответствующие гибриды crRNA/tracrRNA, у которых направляющие и tracr-последовательности экспрессируются в отдельных транскриптах (фигуры 18b и 19а). Два сайта в локусе PVALB, которые не давали обнаруживаемого расщепления с использованием гибридной системы (направляющая последовательность и tracr-последовательность, экспрессируемые в виде отдельных транскриптов), также подвергались целенаправленному воздействию с использованием chiRNA. ChiRNA(+67) и chiRNA(+85) были способны опосредовать значительное расщепление в двух протоспейсерах в PVALB (фигуры 18c и 19b).Three sites within the EMX1 locus in human HEK 293FT cells were initially targeted. The effectiveness of the modification of the genome of each chiRNA was assessed using SURVEYOR nuclease analysis, which allows the detection of mutations resulting from double-stranded DNA breaks (DSB) and their subsequent repair using the DNA damage repair pathway due to non-homologous termination (NHEJ). The constructs denoted by chiRNA (+ n) indicate that nucleotides of up to + n wild type tracrRNA nucleotides are included in the chimeric RNA construct, with values 48, 54, 67 and 85 used for n. Chimeric RNAs containing longer wild-type tracrRNA fragments (chiRNA (+67) and chiRNA (+85)) mediated DNA cleavage at all three EMX1 target sites, with chiRNA (+85), in particular, showing significantly higher levels of DNA cleavage than the corresponding crRNA hybrids / tracrRNA, in which the guiding and tracr sequences are expressed in separate transcripts (figures 18b and 19a). Two sites at the PVALB locus that did not show detectable cleavage using the hybrid system (the guide sequence and the tracr sequence expressed as separate transcripts) were also targeted using chiRNA. ChiRNA (+67) and chiRNA (+85) were able to mediate significant cleavage in the two protospacer in PVALB (figures 18c and 19b).

Для всех пяти мишеней в локусах EMX1 и PVALB наблюдали соответствующее повышение эффективности модификации генома с увеличением длины tracr-последовательности. Не вдаваясь в какую-либо теорию, вторичная структура, формируемая 3'-концом tracrRNA, может играть роль в увеличении скорости образования комплекса CRISPR. Иллюстрация предсказанных вторичных структур для каждой химерной РНК, использованной в этом примере, представлена на фигуре 21. Вторичную структуру предсказывали с применением RNAfold (http://RNA.tbi.univie.ac.at/cgi-bin/RNAfold.cgi) с использованием минимальной свободной энергии и алгоритма функции распределения. Псевдоцвет для каждого основания (воспроизведен в серой шкале) указывает на возможность спаривания. По причине того, что chiRNA с более длинными tracr-последовательностями были способны расщеплять мишени, которые не были расщеплены нативными гибридами crRNA/tracrRNA CRISPR, возможно, что химерная РНК может загружаться на Cas9 более эффективно, чем ее нативный гибридный аналог. Для обеспечения применения Cas9 для сайт-специфического редактирования генома в эукариотических клетках и организмах все предсказанные уникальные целевые сайты для Cas9 S. pyogenes определяли путем вычислений в геномах человека, мыши, крысы, данио, С. elegans и D. melanogaster. Химерные РНК можно разрабатывать для ферментов Cas9 из других микроорганизмов для расширения целевого пространства CRISPR РНК-программируемых нуклеаз.For all five targets at the EMX1 and PVALB loci, a corresponding increase in the efficiency of genome modification was observed with an increase in the length of the tracr sequence. Without going into any theory, the secondary structure formed by the 3'-end of tracrRNA can play a role in increasing the rate of formation of the CRISPR complex. An illustration of the predicted secondary structures for each chimeric RNA used in this example is shown in Figure 21. The secondary structure was predicted using RNAfold (http://RNA.tbi.univie.ac.at/cgi-bin/RNAfold.cgi) using minimum free energy and distribution function algorithm. The pseudocolor for each base (reproduced in the gray scale) indicates the possibility of mating. Due to the fact that chiRNAs with longer tracr sequences were able to cleave targets that were not cleaved by native crRNA / tracrRNA CRISPR hybrids, it is possible that chimeric RNA can be loaded onto Cas9 more efficiently than its native hybrid counterpart. To ensure the use of Cas9 for site-specific editing of the genome in eukaryotic cells and organisms, all predicted unique target sites for Cas9 S. pyogenes were determined by calculations in the genomes of human, mouse, rat, zebrafish, C. elegans and D. melanogaster. Chimeric RNAs can be developed for Cas9 enzymes from other microorganisms to expand the target space of CRISPR RNA-programmed nucleases.

На фигуре 22 показан примерный бицистронный вектор экспрессии для экспрессии химерной РНК, включающий tracr-последовательность РНК дикого типа вплоть до нуклеотида +85 и SpCas9 с последовательностями ядерной локализации. SpCas9 экспрессируется с промотора CBh и терминируется polyA-сигналом bGH (bGH pA). Расширенная последовательность, показанная непосредственно под схематическим изображением, соответствует участку, окружающему направляющую последовательность сайта встраивания, и включает от 5' до 3', 3'-часть промотора U6 (первый заштрихованный участок), сайты расщепления BbsI (стрелки), неполный прямой повтор (парная tracr-последовательность GTTTTAGAGCTA, подчеркнутая), последовательность петли GAAA и +85 tracr-последовательность (подчеркнутая последовательность, следующая за последовательностью петли). Иллюстративное встраивание направляющей последовательности изображено ниже сайта встраивания направляющей последовательности, при этом нуклеотиды направляющей последовательности для выбранной мишени представлены как "N".22 shows an exemplary bicistronic expression vector for chimeric RNA expression, including the wild-type tracr sequence of RNA up to nucleotide +85 and SpCas9 with nuclear localization sequences. SpCas9 is expressed from the CBh promoter and terminated with the bGH polyA signal (bGH pA). The extended sequence shown immediately below the schematic diagram corresponds to the region surrounding the guide sequence of the embedment site, and includes from 5 'to 3', the 3 'part of the U6 promoter (first hatched region), BbsI cleavage sites (arrows), incomplete direct repetition ( paired GTTTTAGAGCTA tracr sequence, underlined), GAAA loop sequence and +85 tracr sequence (underlined sequence following the loop sequence). Illustrative insertion of the guide sequence is shown below the site of insertion of the guide sequence, with the nucleotides of the guide sequence for the selected target are represented as "N".

Последовательности, описанные в приведенных выше примерах, представляют собой следующие (полинуклеотидные последовательности представлены от 5' к 3'):The sequences described in the above examples are as follows (polynucleotide sequences are from 5 ′ to 3 ′):

U6-короткая tracrRNA (Streptococcus pyogenes SF370):U6-short tracrRNA (Streptococcus pyogenes SF370):

Figure 00000034
Figure 00000034

Figure 00000035
(жирный шрифт = последовательность tracrRNA; подчеркивание = терминаторная последовательность)
Figure 00000035
(bold = tracrRNA sequence; underscore = terminator sequence)

U6-длинная tracrRNA (Streptococcus pyogenes SF370):U6-long tracrRNA (Streptococcus pyogenes SF370):

Figure 00000036
Figure 00000036

Figure 00000037
Figure 00000037

U6-DR-BbsI-ocTOB-DR (Streptococcus pyogenes SF370):U6-DR-BbsI-ocTOB-DR (Streptococcus pyogenes SF370):

Figure 00000038
Figure 00000038

U6-химерная PHK-BbsI-остов (Streptococcus pyogenes SF370)U6-chimeric PHK-BbsI-skeleton (Streptococcus pyogenes SF370)

Figure 00000039
Figure 00000039

NLS-SpCas9-EGFP:NLS-SpCas9-EGFP:

Figure 00000040
Figure 00000040

Figure 00000041
Figure 00000041

SpCas9-EGFP-NLS:SpCas9-EGFP-NLS:

Figure 00000042
Figure 00000042

Figure 00000043
Figure 00000043

NLS-SpCas9-EGFP-NLS:NLS-SpCas9-EGFP-NLS:

Figure 00000044
Figure 00000044

NLS-SpCas9-NLS:NLS-SpCas9-NLS:

Figure 00000045
Figure 00000045

NLS-mCherry-SpRNase3:NLS-mCherry-SpRNase3:

Figure 00000046
Figure 00000046

Figure 00000047
Figure 00000047

SpRNase3-mCherry-NLS:SpRNase3-mCherry-NLS:

Figure 00000048
Figure 00000048

NLS-SpCas9n-NLS (D10A мутация никазы представлена в нижнем регистре):NLS-SpCas9n-NLS (D10A nickase mutation is lowercase):

Figure 00000049
Figure 00000049

Figure 00000050
Figure 00000050

hEMX1-HR-матрица-HindII-NheI:hEMX1-HR-matrix-HindII-NheI:

Figure 00000051
Figure 00000051

Figure 00000052
Figure 00000052

NLS-StCsnl-NLS:NLS-StCsnl-NLS:

Figure 00000053
Figure 00000053

U6-St_tracrRNA(7-97):U6-St_tracrRNA (7-97):

Figure 00000054
Figure 00000054

U6-DR-cneficep-DR (S. pyogenes SF370)U6-DR-cneficep-DR (S. pyogenes SF370)

Figure 00000055
Figure 00000055

Figure 00000056
(нижний регистр, подчеркивание = прямой повтор; N = направляющая последовательность; жирный шрифт = терминатор)
Figure 00000056
(lower case, underline = direct repeat; N = guide sequence; bold = terminator)

Химерная РНК, содержащая +48 tracrRNA (S. pyogenes SF370)Chimeric RNA containing +48 tracrRNA (S. pyogenes SF370)

Figure 00000057
Figure 00000057

Figure 00000058
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)
Figure 00000058
(N = guide sequence; first underscore = paired tracr sequence; second underscore = tracr sequence; bold = terminator)

Химерная РНК, содержащая +54 tracrRNA (S. pyogenes SF370)Chimeric RNA containing +54 tracrRNA (S. pyogenes SF370)

Figure 00000059
Figure 00000059

Figure 00000060
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)
Figure 00000060
(N = guide sequence; first underscore = paired tracr sequence; second underscore = tracr sequence; bold = terminator)

Химерная РНК, содержащая +67 tracrRNA (S. pyogenes SF370)Chimeric RNA containing +67 tracrRNA (S. pyogenes SF370)

Figure 00000061
Figure 00000061

Figure 00000062
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)
Figure 00000062
(N = guide sequence; first underscore = paired tracr sequence; second underscore = tracr sequence; bold = terminator)

Химерная РНК, содержащая +85 tracrRNA (S. pyogenes SF370)Chimeric RNA containing +85 tracrRNA (S. pyogenes SF370)

Figure 00000063
Figure 00000063

Figure 00000064
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)
Figure 00000064
(N = guide sequence; first underscore = paired tracr sequence; second underscore = tracr sequence; bold = terminator)

CBh-NLS-SpCas9-NLSCBh-NLS-SpCas9-NLS

Figure 00000065
Figure 00000065

Figure 00000066
Figure 00000066

Figure 00000067
Figure 00000067

(подчеркивание = NLS-hSpCas9-NLS)(underline = NLS-hSpCas9-NLS)

Иллюстративная химерная РНК для Cas9 из CPJSPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)Illustrative chimeric RNA for Cas9 from CPJSPR1 LMD-9 S. thermophilus (with PAM NNAGAAW)

Figure 00000068
Figure 00000068

Figure 00000069
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)
Figure 00000069
(N = guide sequence; first underscore = paired tracr sequence; second underscore = tracr sequence; bold = terminator)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)Illustrative chimeric RNA for Cas9 from CRISPR1 LMD-9 S. thermophilus (with PAM NNAGAAW)

Figure 00000070
Figure 00000070

Figure 00000071
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)
Figure 00000071
(N = guide sequence; first underscore = paired tracr sequence; second underscore = tracr sequence; bold = terminator)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)Illustrative chimeric RNA for Cas9 from CRISPR1 LMD-9 S. thermophilus (with PAM NNAGAAW)

Figure 00000072
Figure 00000072

Figure 00000073
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)
Figure 00000073
(N = guide sequence; first underscore = paired tracr sequence; second underscore = tracr sequence; bold = terminator)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilic (с PAM NNAGAAW)Illustrative chimeric RNA for Cas9 from CRISPR1 LMD-9 S. thermophilic (with PAM NNAGAAW)

Figure 00000074
Figure 00000074

Figure 00000075
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание tracr-последовательность; жирный шрифт = терминатор)
Figure 00000075
(N = guide sequence; first underscore = paired tracr sequence; second underscore tracr sequence; bold = terminator)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)Illustrative chimeric RNA for Cas9 from CRISPR1 LMD-9 S. thermophilus (with PAM NNAGAAW)

Figure 00000076
Figure 00000076

Figure 00000077
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)
Figure 00000077
(N = guide sequence; first underscore = paired tracr sequence; second underscore = tracr sequence; bold = terminator)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)Illustrative chimeric RNA for Cas9 from CRISPR1 LMD-9 S. thermophilus (with PAM NNAGAAW)

Figure 00000078
Figure 00000078

Figure 00000079
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)
Figure 00000079
(N = guide sequence; first underscore = paired tracr sequence; second underscore = tracr sequence; bold = terminator)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)Illustrative chimeric RNA for Cas9 from CRISPR1 LMD-9 S. thermophilus (with PAM NNAGAAW)

Figure 00000080
Figure 00000080

Figure 00000081
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)
Figure 00000081
(N = guide sequence; first underscore = paired tracr sequence; second underscore = tracr sequence; bold = terminator)

Иллюстративная химерная РНК для Cas9 из CRISPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)Illustrative chimeric RNA for Cas9 from CRISPR1 LMD-9 S. thermophilus (with PAM NNAGAAW)

Figure 00000082
Figure 00000082

Figure 00000083
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)
Figure 00000083
(N = guide sequence; first underscore = paired tracr sequence; second underscore = tracr sequence; bold = terminator)

Иллюстративная химерная РНК для Cas9 из CPJSPR1 LMD-9 S. thermophilus (с PAM NNAGAAW)Illustrative chimeric RNA for Cas9 from CPJSPR1 LMD-9 S. thermophilus (with PAM NNAGAAW)

Figure 00000084
Figure 00000084

Figure 00000085
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)
Figure 00000085
(N = guide sequence; first underscore = paired tracr sequence; second underscore = tracr sequence; bold = terminator)

Иллюстративная химерная РНК для Cas9 из CRISPR3 LMD-9 S. thermophilus (с PAM NGGNG)Illustrative chimeric RNA for Cas9 from CRISPR3 LMD-9 S. thermophilus (with PAM NGGNG)

Figure 00000086
Figure 00000086

Figure 00000087
(N = направляющая последовательность; первое подчеркивание = парная tracr-последовательность; второе подчеркивание = tracr-последовательность; жирный шрифт = терминатор)
Figure 00000087
(N = guide sequence; first underscore = paired tracr sequence; second underscore = tracr sequence; bold = terminator)

Кодон-оптимизированный вариант Cas9 из локуса CRISPR3 LMD-9 S. thermophilus (с NLS и на 5'- и на 3'-концах)Codon-optimized version of Cas9 from the CRISPR3 LMD-9 S. thermophilus locus (with NLS at both 5'- and 3'-ends)

Figure 00000088
Figure 00000088

Figure 00000089
Figure 00000089

Figure 00000090
Figure 00000090

Пример 5: РНК-направляемое редактирование бактериальных геномов с применением систем CRISPR-CasExample 5: RNA-directed editing of bacterial genomes using CRISPR-Cas systems

Заявители использовали CPJSPR-ассоциированную эндонуклеазу Cas9 для введения точных мутаций в геномы Streptococcus pneumoniae и Escherichia coli. Подход опирался на Cas9-направленное расщепление в целевом сайте для уничтожения немутированных клеток и устранял необходимость в селектируемых маркерах или системах негативного отбора. Специфичность Cas9 перепрограммировали путем изменения последовательности короткой CRISPR РНК (crRNA) для внесения одно- или многонуклеотидных изменений, переносимых на матрицах редактирования. Одновременное использование двух crRNA обеспечивало мультиплексный мутагенез. У S. pneumoniae около 100% клеток, выживших после расщепления Cas9, содержали желаемую мутацию, и 65% при использовании в комбинации с рекомбинационной инженерией в Е. coli. Заявители тщательно анализировали плановые требования к Cas9 для определения диапазона последовательностей, представляющих собой мишени, и показали стратегии для редактирования сайтов, которые не отвечают данным требованиям, что указывает на универсальность этой методики для конструирования бактериального генома.Applicants have used Cas9 CPJSPR-associated endonuclease to introduce precise mutations into the genomes of Streptococcus pneumoniae and Escherichia coli. The approach relied on Cas9-directed cleavage at the target site to kill unmuted cells and eliminated the need for selectable markers or negative selection systems. The specificity of Cas9 was reprogrammed by changing the sequence of short CRISPR RNA (crRNA) to introduce single or multi-nucleotide changes carried on editing matrices. The simultaneous use of two crRNAs provided multiplex mutagenesis. In S. pneumoniae, about 100% of the cells surviving after Cas9 cleavage contained the desired mutation, and 65% when used in combination with recombination engineering in E. coli. Applicants carefully analyzed the planned requirements for Cas9 to determine the range of sequences representing the targets and showed strategies for editing sites that do not meet these requirements, which indicates the universality of this technique for constructing the bacterial genome.

Понимание функции гена зависит от возможности изменения последовательностей ДНК в клетке контролируемым образом. Сайт-специфический мутагенез у эукариот достигается путем использования специфичных к последовательностям нуклеаз, которые активируют гомологичную рекомбинацию ДНК-матрицы, содержащей мутацию, представляющую интерес. Нуклеазы с "цинковыми пальцами" (ZFN), эффекторные нуклеазы, подобные активаторам транскрипции (TALEN), и хоминг-мегануклеазы можно программировать для расщепления геномов в конкретных местоположениях, но эти подходы требуют конструирования новых ферментов для каждой целевой последовательности. В прокариотических организмах способы мутагенеза или предусматривают введение маркера отбора в редактируемый локус, или требуют двухстадийного процесса, который включает систему негативного отбора. Совсем недавно для рекомбинационной инженерии использовали рекомбинантные белки фагов, методика, которая обеспечивает гомологичную рекомбинацию линейной ДНК или олигонуклеотидов. Однако, поскольку нет выбора мутаций, эффективность рекомбинационной инженерии может быть относительно низкой (от 0,1-10% для точковых мутаций вплоть до 10-5-10-6 для более обширных модификаций), во многих случаях требуя скрининга большего числа колоний. Таким образом, все еще требуются новые технологии, которые являются доступными, легкими в применении и эффективными для генетического конструирования как эукариотических, так и прокариотических организмов.Understanding gene function depends on the ability to change DNA sequences in a cell in a controlled manner. Site-specific mutagenesis in eukaryotes is achieved by using sequence-specific nucleases that activate homologous recombination of a DNA template containing a mutation of interest. Zinc-finger nucleases (ZFNs), transcriptional activator-like effector nucleases (TALENs), and homing meganucleases can be programmed to cleave genomes at specific locations, but these approaches require the construction of new enzymes for each target sequence. In prokaryotic organisms, mutagenesis methods either involve the introduction of a selection marker at an editable locus, or require a two-step process that includes a negative selection system. More recently, recombinant phage proteins, a technique that provides homologous recombination of linear DNA or oligonucleotides, have been used for recombinant engineering. However, since there is no choice of mutations, the efficiency of recombination engineering can be relatively low (from 0.1-10% for point mutations up to 10 -5 -10 -6 for more extensive modifications), in many cases requiring screening of a larger number of colonies. Thus, new technologies are still required that are affordable, easy to use and effective for the genetic construction of both eukaryotic and prokaryotic organisms.

Недавние работы по CRISPR ("коротким палиндромным повторам, регулярно расположенным группами) адаптивной иммунной системы прокариот привели к идентификации нуклеаз, у которых специфичность к последовательности программируется малыми РНК. Локусы CRISPR состоят из серий повторов, разделенных "спейсерными" последовательностями, которые соответствуют геномам бактериофагов и другим мобильным генетическим элементам. Массив повторов-спейсеров транскрибируется в виде длинного предшественника и подвергается процессингу в последовательностях повторов для создания малой crRNA, которая определяет целевые последовательности (также известные как протоспейсеры) расщепленных с помощью CRISPR систем. Важным для расщепления является наличие мотива последовательности непосредственно ниже целевого участка, известного как смежный с протоспейсером мотив (PAM). CRISPR-ассоциированные (cas) гены обычно фланкируют массив повторов-спейсеров и кодируют ферментативный механизм, ответственный за биогенез crRNA и целенаправленное воздействие. Cas9 является дцДНК-эндонуклеазой, которая использует crRNA-гид для определения сайта расщепления. Загрузка crRNA-гида на Cas9 происходит во время процессинга предшественника crRNA и требует наличия малой антисмысловой РНК на предшественнике, tracrRNA и RNAse III. В отличие от редактирования генома с помощью ZFN или TALEN, изменение специфичности целенаправленного воздействия Cas9 не требует конструирования белков, а только разработки короткой crRNA-гида.Recent work on CRISPR ("short palindromic repeats, regularly arranged in groups) of the prokaryotic adaptive immune system has led to the identification of nucleases in which sequence specificity is programmed by small RNAs. CRISPR loci consist of a series of repeats separated by spacer sequences that correspond to bacteriophage genomes and other mobile genetic elements.The array of repeat spacers is transcribed as a long predecessor and is processed in sequences of second, to create a small crRNA that defines the target sequences (also known as protospacer) cleaved using CRISPR systems. Important for cleavage is the presence of a sequence motif immediately below the target region, known as the adjacent protospeiser motif (PAM). CRISPR-associated (cas) genes typically flank an array of repeat spacers and encode the enzymatic mechanism responsible for crRNA biogenesis and targeted exposure. Cas9 is a dsDNA endonuclease that uses a crRNA guide to determine the cleavage site. The loading of the crRNA guide onto Cas9 occurs during processing of the crRNA precursor and requires the presence of small antisense RNA on the precursor, tracrRNA and RNAse III. Unlike genome editing using ZFN or TALEN, changing the specificity of targeted Cas9 exposure does not require the construction of proteins, but only the development of a short crRNA guide.

Заявители в недавнее время показали на S. pneumoniae, что введение системы CRISPR, нацеленной на хромосомный локус, приводит к уничтожению трансформированных клеток. Было отмечено, что случайно выжившие клетки содержали мутации в целевом участке, что указывало на то, что эндонуклеазная активность, направленная на дцДНК, Cas9 по отношению к эндогенным мишеням может быть использована для редактирования генома. Заявители показали, что безмаркерные мутации можно вводить путем трансформации фрагмента ДНК-матрицы, который будет рекомбинировать в геноме и исключать распознавание мишеней Cas9. Управление специфичностью Cas9 с несколькими различными crRNA обеспечивает возможность введения многочисленных мутаций одновременно. Заявители также охарактеризовали в деталях требования к последовательности для направленного воздействия Cas9 и показали, что подход можно сочетать с рекомбинационной инженерией для редактирования генома у Е. coli.Applicants have recently shown to S. pneumoniae that the introduction of a CRISPR system aimed at the chromosomal locus leads to the destruction of transformed cells. It was noted that accidentally surviving cells contained mutations in the target region, which indicated that endonuclease activity directed to dsDNA, Cas9 in relation to endogenous targets could be used to edit the genome. Applicants have shown that markerless mutations can be introduced by transforming a fragment of a DNA template that will recombine in the genome and exclude recognition of Cas9 targets. Cas9 specificity management with several different crRNAs allows multiple mutations to be introduced simultaneously. Applicants have also described in detail the sequence requirements for targeted Cas9 exposure and have shown that the approach can be combined with recombination engineering to edit the genome in E. coli.

РЕЗУЛЬТАТЫ: редактирование генома с помощью расщепления Cas9 хромосомной мишениRESULTS: Genome editing using Cas9 cleavage of a chromosome target

Штамм crR6 S. pneumoniae содержит систему CRISPR на основе Cas9, которая расщепляет целевую последовательность, присутствующую в бактериофаге φ8232.5. Эту мишень интегрировали в хромосомный локус srtA второго штамма R68232.5. Измененную целевую последовательность, содержащую мутацию в участке PAM, интегрировали в локус srtA третьего штамма R6370.1, делая этот штамм "устойчивым" к расщеплению с помощью CRISPR (фигура 28а). Заявители трансформировали клетки геномной ДНК из клеток crR6, ожидая, что успешная трансформация клеток R68232.5 должна привести к расщеплению целевого локуса и гибели клеток. Вопреки этому ожиданию, заявители выделили трансформантов R68232.5, хотя и с примерно в 10 раз меньшей эффективностью, чем трансформантов R6370.1 (фигура 28b). Генетический анализ восьми трансформантов R68232.5 (фигура 28) выявил, что подавляющее большинство представляют собой продукт явления двойной рекомбинации, исключающей токсичность целенаправленного воздействия Cas9 путем замещения мишени φ8232.5 локусом дикого типа srtA генома crR6, который не содержит протоспейсер, требуемый для распознавания Cas9. Эти результаты были доказательством того, что одновременное введение системы CRISPR, нацеленной на локус генома (конструкция для целенаправленного воздействия), вместе с матрицей для рекомбинации в целевом локусе (матрица редактирования), приводило к целенаправленному редактированию генома (фигура 23а).Strain crR6 S. pneumoniae contains a Cas9-based CRISPR system that cleaves the target sequence present in the bacteriophage φ8232.5. This target was integrated into the srtA chromosomal locus of the second strain R6 8232.5 . The altered target sequence containing the mutation in the PAM region was integrated into the srtA locus of the third strain R6 370.1 , making this strain "resistant" to cleavage using CRISPR (Figure 28a). Applicants transformed genomic DNA cells from crR6 cells, expecting that successful transformation of R6 8232.5 cells should result in cleavage of the target locus and cell death. Contrary to this expectation, the applicants isolated R6 8232.5 transformants, although with about 10 times less potency than R6 370.1 transformants (Figure 28b). Genetic analysis of eight transformants of R6 8232.5 (Figure 28) revealed that the vast majority are the product of a double recombination phenomenon that excludes the toxicity of targeted Cas9 exposure by replacing the φ8232.5 target with the wild-type srtA locus of the crR6 genome that does not contain the protospacer required for Cas9 recognition. These results were evidence that the simultaneous introduction of a CRISPR system aimed at the genome locus (construct for targeted exposure), together with a matrix for recombination at the target locus (editing matrix), led to targeted editing of the genome (Figure 23a).

Для создания упрощенной системы для редактирования генома заявители модифицировали локус CRISPR в штамме crR6 путем делеции генов cas1, cas2 и csn2, которые, как было показано, являются необязательными для целенаправленного воздействия CRISPR, с получением штамма crR6M (фигура 28а). Этот штамм сохранял те же свойства, что и crR6 (фигура 28b). Для того, чтобы повысить эффективность редактирования на основе Cas9 и продемонстрировать, что выбранная ДНК-матрица может быть использована для контроля введенных мутаций, заявители котрансформировали клетки R68232.5 с ПЦР-продуктами гена srtA дикого типа или мутантной мишенью R6370.1, каждый из которых должен быть устойчивым к расщеплению Cas9. Это приводило к от 5- до 10-кратного повышения частоты трансформирования по сравнению с геномной ДНК crR6 в отдельности (фигура 23b). Эффективность редактирования также существенно увеличилась, при этом 8/8 тестированных трансформантов содержали копию srtA дикого типа, а 7/8 содержали PAM-мутацию, присутствующую в мишени R6370.1 (фигура 23b и фигура 29а). Взятые вместе, эти результаты свидетельствуют о возможности редактирования генома при помощи Cas9.To create a simplified system for editing the genome, the applicants modified the CRISPR locus in the crR6 strain by deletion of the cas1, cas2 and csn2 genes, which were shown to be optional for targeted CRISPR exposure, to obtain the crR6M strain (Figure 28a). This strain retained the same properties as crR6 (Figure 28b). In order to increase Cas9-based editing efficiency and demonstrate that the selected DNA template can be used to control the introduced mutations, the applicants co-transformed R6 8232.5 cells with PCR products of the wild-type srtA gene or mutant target R6 370.1 , each of which must be splitting resistant Cas9. This led to a 5 to 10-fold increase in the frequency of transformation compared to the genomic crR6 DNA alone (Figure 23b). Editing efficiency also increased significantly, with 8/8 of the tested transformants containing a wild-type srtA copy, and 7/8 containing the PAM mutation present in target R6 370.1 (Figure 23b and Figure 29a). Taken together, these results indicate the ability to edit the genome using Cas9.

Анализа плановых требований для Cas9. Для введения специфичных изменений в геном нужно использовать матрицу редактирования, несущую мутации, которые прекращают расщепление, опосредованное Cas9, тем самым предотвращая гибель клеток. Этого легко достичь, когда необходима делеция мишени или ее замещение другой последовательностью (вставка гена). Если целью является создание слияний генов или создание однонуклеотидных мутаций, ликвидирование нуклеазной активности Cas9 будет возможно только путем введения мутаций в матрицу редактирования, которые изменяют последовательности либо PAM, либо протоспейсера. Для определения затруднений опосредованного CRISPR редактирования заявители выполняли исчерпывающий анализ мутаций PAM и протоспейсера, которые подавляют целенаправленное воздействие CRISPR.Analysis of planned requirements for Cas9. To introduce specific changes in the genome, one needs to use an editing matrix that carries mutations that stop the cleavage mediated by Cas9, thereby preventing cell death. This is easy to achieve when a deletion of the target or its substitution by another sequence (insertion of a gene) is necessary. If the goal is to create gene fusions or to create single-nucleotide mutations, the elimination of the nuclease activity of Cas9 will be possible only by introducing mutations into the editing matrix, which alter the sequences of either PAM or protospacer. To determine the difficulties of CRISPR-mediated editing, applicants performed an exhaustive analysis of PAM and protospacer mutations that suppress the targeted effect of CRISPR.

Предыдущие исследования предполагали, что Cas9 S. pyogenes требует наличия PAM NGG непосредственно ниже протоспейсера. Однако по причине того, что на настоящий момент было описано только очень ограниченное количество мутаций, инактивирующих PAM, заявители провели систематический анализ для обнаружения всех 5-нуклеотидных последовательностей, расположенных после протоспейсера, которые исключают расщепление с помощью CRISPR. Заявители использовали рандомизированные олигонуклеотиды для создания всех возможных 1024 последовательностей PAM в гетерогенном ПЦР-продукте, который трансформировали в клетки crR6 или R6. Ожидалось, что конструкции, несущие функциональные PAM, будут распознаваться и разрушаться Cas9 в клетках crR6, но не в клетках R6 (фигура 24а). Более чем 2×105 колоний объединяли вместе с целью экстрагирования ДНК для использования в качестве матрицы для ко-амплификации всех мишеней. Поводили глубокое секвенирование ПЦР-продуктов, и было обнаружено, что они содержат все 1024 последовательности, с перекрыванием в диапазоне от 5 до 42472 считываемых фрагментов (см. раздел "Анализ данных глубокого секвенирования"). Функциональность каждого PAM оценивали по относительной доле его считываемых фрагментов в образце crR6 относительно образца R6. Анализ первых трех оснований PAM, усредненных по двум последним основаниям, ясно показал, что паттерн NGG был недостаточно представлен в трансформантах crR6 (фигура 24b). Кроме того, следующие два основания не имели заметного влияния на PAM NGG (см. раздел "Анализ данных глубокого секвенирования"), демонстрируя, что последовательность NGGNN была достаточной для разрешения проявления активности Cas9. Частичное целенаправленное воздействие наблюдалось для последовательностей PAM NAG (фигура 24b). Также паттерн NNGGN частично инактивировал целенаправленное воздействие CRISPR (таблица G), что указывало на то, что при сдвиге на 1 п.о. мотив NGG все еще мог узнаваться Cas9 с пониженной эффективностью. Эти данные пролили свет на молекулярный механизм распознавание мишеней Cas9, и было выявлено, что последовательности NGG (или CCN в комплементарной нити) являются достаточными для целенаправленного воздействия Cas9, и что следует избегать мутаций NGG на NAG или NNGGN в матрице редактирования. В связи с высокой частотой этих тринуклеотидных последовательностей (каждые 8 п.о.), это означает, что можно редактировать практически любое положение в геноме. Более того, заявители тестировали десять произвольно выбранных мишеней, несущих различные PAM, и было обнаружено, что все они являются функциональными (фигура 30).Previous studies have suggested that Cas9 S. pyogenes requires the presence of PAM NGG directly below the protospacer. However, due to the fact that only a very limited number of mutations inactivating PAM have been described so far, applicants have carried out a systematic analysis to detect all 5-nucleotide sequences located after the protospacer that exclude CRISPR cleavage. Applicants used randomized oligonucleotides to create all possible 1024 PAM sequences in a heterogeneous PCR product that was transformed into crR6 or R6 cells. It was expected that constructs bearing functional PAMs would be recognized and destroyed by Cas9 in crR6 cells, but not in R6 cells (Figure 24a). More than 2 × 10 5 colonies were combined together to extract DNA for use as a template for co-amplification of all targets. The PCR products were deeply sequenced, and it was found that they contain all 1024 sequences, overlapping in the range from 5 to 42472 read fragments (see the section "Analysis of deep sequencing data"). The functionality of each PAM was evaluated by the relative fraction of its read fragments in the sample crR6 relative to sample R6. Analysis of the first three bases of PAM averaged over the last two bases clearly showed that the NGG pattern was not sufficiently represented in crR6 transformants (Figure 24b). In addition, the following two bases did not significantly affect NGM PAM (see "Deep Sequencing Analysis" section), demonstrating that the NGGNN sequence was sufficient to resolve Cas9 activity. Partial targeted exposure was observed for PAM NAG sequences (Figure 24b). Also, the NNGGN pattern partially inactivated the targeted effect of CRISPR (Table G), which indicated that with a shift of 1 bp the NGG motif could still be recognized by Cas9 with reduced efficiency. These data shed light on the molecular mechanism of Cas9 target recognition, and it was found that the NGG sequences (or CCN in the complementary strand) are sufficient for targeted Cas9 exposure, and that NGG mutations on the NAG or NNGGN in the editing matrix should be avoided. Due to the high frequency of these trinucleotide sequences (every 8 bp), this means that almost any position in the genome can be edited. Moreover, the applicants tested ten randomly selected targets carrying different PAMs, and it was found that they were all functional (Figure 30).

Другим способом нарушения опосредованного Cas9 расщепления является введение мутаций в протоспейсерный участок матрицы редактирования. Известно, что точковые мутации в "затравочной последовательности" (от 8 до 10 нуклеотидов протоспейсера, непосредственно смежных с PAM) могут прекращать расщепление с помощью нуклеаз CRISPR. Однако точная длина этого участка неизвестна, и не ясно, могут ли мутации в каком-либо нуклеотиде в затравке нарушать распознавание мишеней Cas9. Заявители следовали тому же подходу глубокого секвенирования, который описан выше, для рандомизирования целой протоспейсерной последовательности, участвующей в контактах пар оснований с crRNA, и для определения всех последовательностей, которые препятствуют целенаправленному воздействию. Каждое положение 20 совпадающих нуклеотидов (14) в мишени spc1, присутствующих в клетках R68232.5 (фигура 23а), рандомизировали и трансформировали в клетки crR6 и R6 (фигура 24а). В соответствии с наличием затравочной последовательности только мутации в 12 нуклеотидах непосредственно выше PAM подавляли расщепление с помощью Cas9 (фигура 24c). Тем не менее, различные мутации отображали весьма разные эффекты. Дистальные (от PAM) положения затравки (от 12 до 7) выдерживали большинство мутаций, и только одно определенное замещение основания подавляло целенаправленное воздействие. В то же время, мутации в любом нуклеотиде в проксимальных положениях (от 6 до 1, за исключением 3) исключали активность Cas9, однако на разных уровнях для каждого конкретного замещения. В положении 3 только два замещения влияли на активность CRISPR и с разной силой. Заявители пришли к выводу, что хотя мутации затравочной последовательности могут предотвращать целенаправленное воздействие CRISPR, существуют ограничения в отношении изменений нуклеотидов, которые могут быть произведены в любом положении затравки. Более того, эти ограничения, наиболее вероятно, могут варьировать для разных спейсерных последовательностей. Таким образом, заявители полагают, что мутации в последовательности PAM, если это возможно, должны быть предпочтительной стратегией редактирования. Альтернативно, множественные мутации в затравочной последовательности можно вводить для предотвращения нуклеазной активности Cas9.Another way of disrupting Cas9-mediated cleavage is to introduce mutations into the protospacer region of the editing matrix. It is known that point mutations in the "seed sequence" (from 8 to 10 nucleotides of the protospacer directly adjacent to PAM) can stop cleavage with CRISPR nucleases. However, the exact length of this region is unknown, and it is not clear whether mutations in any nucleotide in the seed can interfere with Cas9 target recognition. Applicants followed the same deep sequencing approach as described above to randomize the whole protospacer sequence involved in base pair contacts with crRNA and to identify all sequences that interfere with targeted exposure. Each position of 20 matching nucleotides (14) in the spc1 target present in R6 8232.5 cells (Figure 23a) was randomized and transformed into crR6 and R6 cells (Figure 24a). In accordance with the presence of the seed sequence, only mutations in 12 nucleotides immediately above PAM suppressed cleavage with Cas9 (Figure 24c). However, different mutations displayed very different effects. Distal (from PAM) seed positions (12 to 7) withstood most mutations, and only one definite substitution of the base suppressed the targeted effect. At the same time, mutations in any nucleotide at proximal positions (from 6 to 1, with the exception of 3) excluded Cas9 activity, but at different levels for each specific substitution. At position 3, only two substitutions affected CRISPR activity and with different strengths. Applicants have concluded that although mutations in the seed sequence can prevent targeted effects of CRISPR, there are limitations to changes in nucleotides that can be made at any position of the seed. Moreover, these limitations are most likely to vary for different spacer sequences. Thus, applicants believe that mutations in the PAM sequence, if possible, should be the preferred editing strategy. Alternatively, multiple mutations in the seed sequence can be introduced to prevent the nuclease activity of Cas9.

Опосредованное Cas9 редактирование генома у S. pneumonia. Для разработки быстрого и эффективного способа для целенаправленного редактирования генома заявители конструировали штамм crR6Rk, штамм, в котором спейсеры можно легко вводить с помощью ПЦР (фигура 33). Заявители решили редактировать ген β-галактозидазы (bgaA) S. pneumoniae, активность которого может быть легко измерена. Заявители вводили аминокислотные замены на аланин в активный сайт этого фермента: Мутации R481A (R→А) и N563A, Е564А (NE→АА). Для иллюстрации различных стратегий редактирования заявители разрабатывали мутации как последовательности PAM, так и протоспейсера затравки. В обоих случаях использовали одну и ту же конструкцию для целенаправленного воздействия с crRNA, комплементарной участку гена β-галактозидазы, который является смежным с последовательностью PAM TGG (CCA в комплементарной нити, фигура 26). Матрица редактирования R→A производила трехнуклеотидное несовпадение в затравочной последовательности протоспейсера (CGT на GCA, также с введением сайта рестрикции BtgZI). В матрицу редактирования NE→АА заявители одновременно вводили синонимичную мутацию, которая производила неактивный PAM (TGG на TTG), совместно с мутациями, которые находились на 218 нуклеотидов ниже от участка протоспейсера (ААТ GAA на GCT GCA, также с созданием сайта рестрикции TseI). Эта последняя стратегия редактирования демонстрировала возможность использования удаленного PAM для создания мутаций в местах, где подходящую мишень может быть сложно выбрать. Например, хотя геном R6 S. pneumoniae, который характеризуется содержанием GC 39,7%, содержит в среднем один мотив PAM на каждые 12 п.о., некоторые мотивы PAM разделены вплоть до 194 п.о. (фигура 33). К тому же заявители разработали делецию внутри рамки считывания ΔbgaA длиной 6664 п.о. Во всех трех случаях котрансформацией матриц целенаправленного воздействия и редактирования производили в 10 раз больше устойчивых к канамицину клеток, чем котрансформацией с контрольной матрицей редактирования, содержащей последовательности дикого типа bgaA (фигура 25b). Заявители генотипировали 24 трансформанта (8 для каждого эксперимента редактирования) и обнаружили, что все кроме одного включали желаемое изменение (фигура 25c). Секвенирование ДНК также подтверждало не только присутствие введенных мутаций, но и отсутствие вторичных мутаций в целевом участке (фигура 29b, с). И наконец, заявители измеряли активность β-галактозидазы для подтверждения того, что все редактированные клетки демонстрировали ожидаемый фенотип (фигура 25d).Cas9-mediated genome editing in S. pneumonia. To develop a quick and effective method for targeted genome editing, applicants constructed a crR6Rk strain, a strain in which spacers can be easily introduced using PCR (Figure 33). Applicants decided to edit the S. pneumoniae β-galactosidase (bgaA) gene, the activity of which can be easily measured. Applicants introduced alanine amino acid substitutions into the active site of this enzyme: Mutations R481A (R → A) and N563A, E564A (NE → AA). To illustrate various editing strategies, applicants have developed mutations of both the PAM sequence and the protospacer primer. In both cases, the same construct was used for targeted exposure to crRNA, a complementary region of the β-galactosidase gene that is adjacent to the PAM TGG sequence (CCA in a complementary strand, Figure 26). The editing matrix R → A produced a trinucleotide mismatch in the seed sequence of the protospacer (CGT on GCA, also with the introduction of the BtgZI restriction site). Applicants simultaneously introduced a synonymous mutation into the NE → AA editing matrix, which produced an inactive PAM (TGG on TTG), together with mutations that were 218 nucleotides lower from the protospacer site (AAT GAA on GCT GCA, also with the creation of the TseI restriction site). This latest editing strategy has demonstrated the ability to use remote PAM to create mutations in places where a suitable target can be difficult to choose. For example, although the S. pneumoniae R6 gene, which is characterized by a GC content of 39.7%, contains on average one PAM motif per 12 bp, some PAM motifs are divided up to 194 bp. (figure 33). In addition, applicants developed a deletion within the 6,664 bp ΔbgaA reading frame. In all three cases, cotransformation of targeted action and editing matrices produced 10 times more kanamycin-resistant cells than cotransformation with a control editing matrix containing wild-type bgaA sequences (Figure 25b). Applicants genotyped 24 transformants (8 for each editing experiment) and found that all but one included the desired change (Figure 25c). DNA sequencing also confirmed not only the presence of introduced mutations, but also the absence of secondary mutations in the target region (Figure 29b, c). Finally, applicants measured β-galactosidase activity to confirm that all edited cells showed the expected phenotype (Figure 25d).

Опосредованное Cas9 редактирование также может быть использовано для создания множественных мутаций для изучения биологических путей. Заявители решили проиллюстрировать это для сортаза-зависимого пути, посредством которого поверхностные белки прикрепляются к оболочке грамположительных бактерий. Заявители вводили делецию гена сортазы с помощью котрансформации устойчивой к хлорамфениколу конструкции для целенаправленного воздействия и матрицы редактирования ΔsrtA (фигура 33а, b) с последующей делецией ΔbgaA с применением устойчивой к канамицину конструкции для целенаправленного воздействия, которая замещала предыдущую. У S. pneumoniae β-галактозидаза ковалентно связывается с клеточной стенкой с помощью сортазы. Таким образом, делеция srtA приводит к высвобождению поверхностного белка в супернатант, в то время как двойная делеция не приводит к заметной активности β-галактозидазы (фигура 34c). Такой последовательный отбор можно повторять столько раз, сколько требуется для создания множественных мутаций.Cas9-mediated editing can also be used to create multiple mutations to study biological pathways. Applicants have decided to illustrate this for the sortase-dependent pathway by which surface proteins attach to the membrane of gram-positive bacteria. Applicants introduced a deletion of the sortase gene by cotransformation of a chloramphenicol-resistant construct for targeted exposure and an ΔsrtA editing matrix (Figure 33a, b) followed by a deletion of ΔbgaA using a kanamycin-resistant construct for targeted exposure that replaced the previous one. In S. pneumoniae, β-galactosidase covalently binds to the cell wall using sortase. Thus, a srtA deletion leads to the release of a surface protein into the supernatant, while a double deletion does not lead to a noticeable activity of β-galactosidase (Figure 34c). This sequential selection can be repeated as many times as required to create multiple mutations.

Эти две мутации также можно вводить одновременно. Заявители разрабатывали конструкцию для целенаправленного воздействия, содержащую два спейсера, один, совпадающий с srtA, а другой, совпадающий с bgaA, и одновременно котрансформировали ее двумя матрицами редактирования (фигура 25е). Генетический анализ трансформантов показал, что редактирование происходило в 6/8 случаев (фигура 251). В частности, каждый из двух оставшихся клонов содержал делецию ΔsrtA или ΔbgaA, что предполагало возможность выполнения комбинаторного мутагенеза с применением Cas9. И наконец, для ликвидации последовательностей CRISPR заявители вводили плазмиду, содержащую мишень bgaA и ген устойчивости к спектиномицину совместно с геномной ДНК из штамма дикого типа R6. Устойчивые к спектиномицину трансформанты, которые сохраняли плазмиду, ликвидировали последовательности CRISPR (фигура 34а, d).These two mutations can also be introduced simultaneously. The applicants developed a design for targeted exposure, containing two spacers, one matching srtA and one matching bgaA, and co-transformed it with two editing matrices (Figure 25e). Genetic analysis of transformants showed that editing occurred in 6/8 cases (figure 251). In particular, each of the two remaining clones contained a deletion ΔsrtA or ΔbgaA, which suggested the possibility of performing combinatorial mutagenesis using Cas9. Finally, to eliminate the CRISPR sequences, applicants introduced a plasmid containing the bgaA target and the spectinomycin resistance gene together with the genomic DNA from the wild-type R6 strain. Spectinomycin-resistant transformants that retained the plasmid eliminated CRISPR sequences (Figure 34a, d).

Механизм и эффективность редактирования. Для понимания механизмов, лежащих в основе редактирования генома с помощью Cas9, заявители смоделировали эксперимент, в котором эффективность редактирования измеряли независимо от расщепления Cas9. Заявители интегрировали ген устойчивости к эритромицину ermAM в локус srtA и вводили преждевременный стоп-кодон с применением редактирования, опосредованного Cas9 (фигура 33). Полученный штамм (JEN53) содержит аллель ermAM(stop) и является чувствительным к эритромицину. Этот штамм можно использовать для оценки эффективности, с которой ген ermAM репарируется, с помощью количественного определения фракции клеток, у которых восстанавливается устойчивость к антибиотику с использованием или без использования расщепления Cas9. JEN53 трансформировали матрицей редактирования, которая восстанавливает аллель дикого типа, совместно либо с устойчивой к канамицину конструкцией CRISPR, нацеленной на аллель ermAM (stop) (CRISPR::ermAM(stop)), либо с контрольной конструкцией без спейсера (CRISPR::∅) (фигура 26а, b). При отсутствии отбора по канамицину фракция редактированных колоний составляла порядком 10-2 (устойчивые к эритромицину КОЕ/все КОЕ) (фигура 26c), что представляло базовую частоту рекомбинации без опосредованного Cas9 отбора против нередактированных клеток. Однако, если применяли отбор по канамицину и котрансформировали контрольную конструкцию CRISPR, фракция редактированных колоний возрастала до около 10-1 (устойчивые к канамицину и эритромицину КОЕ/устойчивые к канамицину КОЕ) (фигура 26c). Этот результат показывает, что отбор по рекомбинации локуса CRISPR проводили совместно с отбором по рекомбинации в локусе ermAM независимо от расщепления генома Cas9, что указывало на то, что субпопуляция клеток более подвержена трансформации и/или рекомбинации. Трансформация конструкции CRISPR::ermAM(stop) с последующим отбором по кантамицину приводила к увеличению фракции устойчивых к эритромицину редактированных клеток до 99% (фигура 26c). Для определения, является ли это увеличение обусловленным нередактированными клетками, заявители сравнивали устойчивые к канамицину колониеобразующие единицы (КОЕ), полученные после котрансформации клеток JEN53 конструкциями CRISPR::ermAM(stop) или CRISPR::∅.The mechanism and effectiveness of editing. To understand the mechanisms underlying genome editing using Cas9, applicants modeled an experiment in which editing efficiency was measured independently of Cas9 cleavage. Applicants have integrated the ermAM erythromycin resistance gene into the srtA locus and introduced a premature stop codon using Cas9-mediated editing (Figure 33). The resulting strain (JEN53) contains the ermAM allele (stop) and is sensitive to erythromycin. This strain can be used to assess the effectiveness with which the ermAM gene is repaired by quantifying the fraction of cells in which antibiotic resistance is restored with or without Cas9 cleavage. JEN53 was transformed with an editing matrix that reconstructs the wild-type allele, together with either the kanamycin-resistant CRISPR construct targeting the ermAM (stop) allele (CRISPR :: ermAM (stop)), or with the control construct without a spacer (CRISPR :: ∅) ( figure 26a, b). In the absence of kanamycin selection, the fraction of the edited colonies was of the order of 10 -2 (erythromycin-resistant CFU / all CFU) (Figure 26c), which represented the base recombination frequency without Cas9-mediated selection against unedited cells. However, if kanamycin selection was used and the CRISPR control construct was co-transformed, the fraction of the edited colonies increased to about 10 -1 (resistant to kanamycin and erythromycin CFU / resistant to kanamycin CFU) (Figure 26c). This result shows that the CRISPR locus was selected for recombination together with the recombination selection at the ermAM locus, regardless of the Cas9 genome cleavage, which indicated that the cell subpopulation was more susceptible to transformation and / or recombination. Transformation of the CRISPR :: ermAM construct (stop) followed by cantamycin selection led to an increase in the fraction of erythromycin-resistant edited cells to 99% (Figure 26c). To determine whether this increase was due to unedited cells, applicants compared kanamycin-resistant colony forming units (CFU) obtained after cotransformation of JEN53 cells with the CRISPR :: ermAM (stop) or CRISPR :: ∅ constructs.

Заявители насчитывали в 5,3 раза меньше устойчивых к канамицину колоний после трансформации конструкцией ermAM(stop) (2,5×104/4,7×103, фигура 35а), результат, который подтверждает, что определенное целенаправленное воздействие Cas9 на хромосомный локус ведет к гибели нередактированных клеток. И наконец, поскольку введение разрывов дцДНК в бактериальную хромосому, как известно, запускает механизмы репарации, которые повышают уровень рекомбинации поврежденной ДНК, заявители исследовали, индуцирует ли расщепление с помощью Cas9 рекомбинацию матрицы редактирования. Заявители насчитывали в 2,2 раза больше колоний после котрансформации конструкцией CRISPR::erm(stop), чем конструкцией CRISPR::∅ (фигура 26d), что указывало на незначительную индукцию рекомбинации. Взятые вместе, эти результаты свидетельствуют о том, что и совместный отбор трансформируемых клеток, и индукция рекомбинации с помощью опосредованного Cas9 расщепления, и отбор против нередактированных клеток способствовали высокой эффективности редактирования генома у S. pneumoniae.Applicants counted 5.3 times less kanamycin-resistant colonies after transformation with the ermAM (stop) construct (2.5 × 10 4 / 4.7 × 10 3 , Figure 35a), a result that confirms that a certain targeted effect of Cas9 on the chromosomal the locus leads to the death of unedited cells. Finally, since the introduction of dsDNA breaks into the bacterial chromosome is known to trigger repair mechanisms that increase the level of recombination of damaged DNA, the applicants investigated whether Cas9 cleavage induces recombination of the editing matrix. Applicants counted 2.2 times more colonies after cotransformation with the CRISPR :: erm (stop) construct than with the CRISPR :: ∅ construct (Figure 26d), which indicated a slight induction of recombination. Taken together, these results indicate that both co-selection of transformed cells, and induction of recombination using Cas9-mediated cleavage, and selection against unedited cells contributed to the high efficiency of genome editing in S. pneumoniae.

Поскольку расщепление генома с помощью Cas9 должно уничтожать нередактированные клетки, не ожидалось получение каких-либо клеток, получивших кассету устойчивости к канамицину, содержащую Cas9, но не матрицу редактирования. Однако при отсутствии матрицы редактирования заявители получали много устойчивых к канамицину колоний после трансформации конструкцией CRISPR::ermAM(stop) (фигура 35а). Эти клетки, которые "избежали" CRISPR-индуцированной гибели, создали фон, который определял предел способа. Эту фоновую частоту можно подсчитать в этом эксперименте как соотношение CRISPR::ermAM(stop)/CRISPR::∅ КОЕ, 2,6×10-3 (7,1×101/72,7×104), подразумевая, что если частота рекомбинации матрицы редактирования меньше этого значения, отбор с помощью CRISPR не может эффективно обеспечить получение желаемых мутантов в количестве, выше фонового. Для понимания происхождения этих клеток, заявители генотипировали 8 фоновых колоний и обнаружили, что 7 содержали делеций спейсера для целенаправленного воздействия (фигура 35b), и одна несла предположительно инактивирующую мутацию в Cas9 (фигура 35c).Since genome cleavage with Cas9 should destroy unedited cells, it was not expected to receive any cells that received a kanamycin resistance cassette containing Cas9, but not an editing matrix. However, in the absence of an editing matrix, applicants received many kanamycin-resistant colonies after transformation with the CRISPR :: ermAM (stop) construct (Figure 35a). These cells, which "escaped" CRISPR-induced death, created a background that determined the limit of the method. This background frequency can be calculated in this experiment as the ratio CRISPR :: ermAM (stop) / CRISPR :: ∅ CFU, 2.6 × 10 -3 (7.1 × 10 1 / 72.7 × 10 4 ), implying that if the recombination frequency of the editing matrix is less than this value, selection using CRISPR cannot effectively provide the desired mutants in quantities higher than the background. To understand the origin of these cells, applicants genotyped 8 background colonies and found that 7 contained spacer deletions for targeted exposure (Figure 35b), and one carried a supposedly inactivating mutation in Cas9 (Figure 35c).

Редактирование генома Cas9 у Е. coli. Активация целенаправленного воздействия Cas9 через хромосомную интеграцию системы CRISPR-Cas является единственно возможной у организмов, у которых наблюдается высокая частота рекомбинации. Для разработки более общего способа, который является применимым к другим микроорганизмам, заявители решили выполнить редактирование генома у Е. coli с применением системы на основе плазмиды CRISPR-Cas. Создавали две плазмиды: плазмиду pCas9, несущую tracrRNA, Cas9 и кассету устойчивости к хлорамфениколу (фигура 36), и плазмиду устойчивости к канамицину pCRISPR, несущую массив спейсеров CRISPR. Для оценки эффективности редактирования независимо от отбора с помощью CRISPR заявители стремились ввести трансверсию A на C в гене rpsL, вызывающую устойчивость к стрептомицину. Заявители создавали плазмиду pCRISPR::rpsL, несущую спейсер, который будет направлять расщепление Cas9 аллеля rpsL дикого типа, но не мутантного (фигура 27b). Сначала вводили плазмиду pCas9 Е. coli MG1655 и полученный штамм котрансформировали плазмидой pCRISPR::rpsL и W542, олигонуклеотидом для редактирования, содержащим мутацию замены A на C. Устойчивые к стрептомицину колонии после трансформации плазмидой pCRISPR::rpsL были единственными полученными, что свидетельствует о том, что расщепление Cas9 индуцирует рекомбинацию данного олигонуклеотида (фигура 37). Однако количество устойчивых к стрептомицину колоний было на два порядка величины меньше, чем количество устойчивых к канамицину колоний, которые предположительно представляют собой клетки, избегающие расщепления с помощью Cas9. Таким образом, в данных условиях расщепление с помощью Cas9 облегчало введение мутации, но с эффективностью, которая была недостаточной для отбора мутантных клеток в количестве, выше фонового количества "клеток, избежавших воздействия".Editing the Cas9 genome in E. coli. Activation of the targeted action of Cas9 through the chromosomal integration of the CRISPR-Cas system is the only possible in organisms in which a high frequency of recombination is observed. To develop a more general method that is applicable to other microorganisms, the applicants decided to edit the genome of E. coli using a CRISPR-Cas plasmid-based system. Two plasmids were created: the pCas9 plasmid carrying tracrRNA, Cas9 and the chloramphenicol resistance cassette (Figure 36), and the kanamycin resistance plasmid pCRISPR carrying the array of CRISPR spacers. To evaluate the effectiveness of editing, regardless of the selection using CRISPR, the applicants sought to introduce a transversion of A to C in the rpsL gene, causing resistance to streptomycin. Applicants created the plasmid pCRISPR :: rpsL carrying a spacer that would direct the Cas9 cleavage of the wild-type, but not mutant, rpsL allele (Figure 27b). The E. coli MG1655 plasmid pCas9 was first introduced and the resulting strain was co-transformed with the plasmid pCRISPR :: rpsL and W542, an editing oligonucleotide containing a mutation of substitution A to C. Streptomycin-resistant colonies after transformation with plasmid pCRISPR :: rpsL were the only ones obtained, which indicates that Cas9 cleavage induces the recombination of this oligonucleotide (Figure 37). However, the number of streptomycin-resistant colonies was two orders of magnitude less than the number of kanamycin-resistant colonies, which are presumably cells that avoid cleavage with Cas9. Thus, under these conditions, Cas9 cleavage facilitated the introduction of a mutation, but with an efficiency that was insufficient to select mutant cells in an amount higher than the background number of "cells that escaped exposure."

Для повышения эффективности редактирования генома у Е. coli, заявители применяли свою систему CRISPR с рекомбинационной инженерией с применением индуцированной Cas9 гибели клеток для отбора по желаемым мутациям. Плазмиду pCas9 вводили в штамм НМЕ63 (31), который подвергали рекомбинационной инженерии, имеющего функции Gam, Exo и Beta фага n-red. Полученный штамм котрансформировали плазмидой pCRISPR::rpsL (или контрольной pCRISPR::∅) и олигонуклеотидом W542 (фигура 27а). Эффективность рекомбинационной инженерии, рассчитанная как фракция всех клеток, ставших устойчивыми к стрептомицину, при использовании контрольной плазмиды составляла 5,3×10-5 (фигура 27c). В то же время трансформация плазмидой pCRISPR::rpsL повысила процентную долю мутантных клеток до 65±14% (фигуры 2c и 29f). Заявители наблюдали, что количество КОЕ после трансформации плазмидой pCRISPR::rpsL было приблизительно на три порядка величины ниже, чем после трансформации контрольной плазмидой (4,8×105/5,3×102, фигура 38а), что свидетельствовало о том, что отбор является следствием CRJSPR-индуцированной смерти нередактированных клеток. Для измерения уровня, при котором инактивировалось расщепление Cas9, который является важным параметром способа заявителей, заявители трансформировали клетки либо pCRISPR::rpsL, либо контрольной плазмидой без олигонуклеотида для редактирования W542 (фигура 38а). Это фоновое количество "клеток, избежавших воздействия" CRISPR, которое измеряли как соотношение pCRISPR::rpsL/pCRISPR::∅ КОЕ, составляло 2,5×10-4 (1,2×102/4,8×105). Генотипирование восьми из этих клеток, избежавших воздействия, выявило, что во всех случаях присутствовала делеция спейсера для целенаправленного воздействия (фигура 38b). Этот фоновое количество было выше значения эффективности рекомбинационной инженерии для мутации rpsL, 5,3×10-5, что свидетельствовало о том, что для получения 65% редактированных клеток расщепление Cas9 должно индуцировать рекомбинацию олигонуклеотида. Для подтверждения этого заявители сравнили число устойчивых к канамицину и стрептомицину КОЕ после трансформации pCRISPR::rpsL или pCRISPR::∅ (фигура 27d). Как в случае для S. pneumoniae, заявители наблюдали незначительную индукцию рекомбинации, приблизительно 6,7-кратную (2,0×10-4/3,0×10-5). Взятые вместе, эти результаты свидетельствуют о том, что система CRISPR обеспечивала способ отбора мутаций, введенных путем рекомбинационной инженерии.To increase the efficiency of genome editing in E. coli, the applicants applied their CRISPR system with recombination engineering using Cas9-induced cell death for selection according to the desired mutations. Plasmid pCas9 was introduced into strain HME63 (31), which was subjected to recombination engineering with the functions Gam, Exo, and Beta of phage n-red. The resulting strain was co-transformed with the plasmid pCRISPR :: rpsL (or control pCRISPR :: ∅) and the oligonucleotide W542 (Figure 27a). The efficiency of recombination engineering, calculated as the fraction of all cells that became resistant to streptomycin, using a control plasmid was 5.3 × 10 -5 (Figure 27c). At the same time, transformation with plasmid pCRISPR :: rpsL increased the percentage of mutant cells to 65 ± 14% (figures 2c and 29f). Applicants observed that the number of CFU after transformation with the plasmid pCRISPR :: rpsL was approximately three orders of magnitude lower than after transformation with the control plasmid (4.8 × 10 5 / 5.3 × 10 2 , figure 38a), which indicated that selection is a consequence of CRJSPR-induced death of unedited cells. To measure the level at which Cas9 cleavage, which is an important parameter of the applicants method, was inactivated, the applicants transformed cells either with pCRISPR :: rpsL or with a control plasmid without oligonucleotide for editing W542 (Figure 38a). This background number of CRISPR “escaped cells”, measured as pCRISPR :: rpsL / pCRISPR :: ∅ CFU, was 2.5 × 10 −4 (1.2 × 10 2 / 4.8 × 10 5 ). Genotyping of eight of these cells that escaped exposure revealed that a spacer deletion for targeted exposure was present in all cases (Figure 38b). This background amount was higher than the recombination engineering efficiency for the rpsL mutation, 5.3 × 10 -5 , which indicated that Cas9 cleavage should induce oligonucleotide recombination to obtain 65% of the edited cells. To confirm this, the applicants compared the number of resistant to kanamycin and streptomycin CFU after transformation pCRISPR :: rpsL or pCRISPR :: ∅ (figure 27d). As in the case of S. pneumoniae, applicants observed a slight induction of recombination, approximately 6.7-fold (2.0 × 10 -4 / 3.0 × 10 -5 ). Taken together, these results indicate that the CRISPR system provided a method for selecting mutations introduced by recombination engineering.

Заявители показали, что системы CRISPR-Cas можно использовать для целенаправленного редактирования генома у бактерий путем совместного введения конструкции для целенаправленного воздействия, которая уничтожала клетки дикого типа, и матрицы редактирования, которые совместно исключали расщепление с помощью CRISPR и обеспечивали введение желаемых мутаций. Можно создавать разные типы мутаций (вставки, делеции или scar-less однонуклеотидные замены). Множественные мутации можно вводить одновременно. Специфичность и универсальность редактирования с применением системы CRISPR основывались на нескольких уникальных свойствах эндонуклеазы Cas9: (i) ее специфичность целенаправленного воздействия можно программировать малыми РНК без необходимости конструировать фермент, (ii) специфичность целенаправленного воздействия, определенная с помощью взаимодействия РНК-ДНК на протяжении 20 п.о. с низкой вероятностью распознавания ложных мишеней, была очень высокой, (iii) практически любая последовательность может подвергаться целенаправленному воздействию, единственным требованием является наличие смежной последовательности NGG, (iv) практически любая мутация в последовательности NGG, а также мутации в затравочной последовательности протоспейсера исключают целенаправленное воздействие.Applicants have shown that CRISPR-Cas systems can be used for targeted editing of the genome in bacteria by co-introducing a construct for targeted exposure that destroys wild-type cells and editing matrices that jointly excluded CRISPR cleavage and enabled the introduction of the desired mutations. You can create different types of mutations (insertions, deletions or scar-less single nucleotide substitutions). Multiple mutations can be introduced simultaneously. The specificity and versatility of editing using the CRISPR system was based on several unique properties of Cas9 endonuclease: (i) its specificity of targeted exposure can be programmed with small RNAs without the need to construct an enzyme, (ii) specificity of targeted exposure determined using RNA-DNA interaction over 20 p .about. with a low probability of recognition of false targets, it was very high, (iii) almost any sequence can be targeted, the only requirement is the presence of an adjacent NGG sequence, (iv) almost any mutation in the NGG sequence, as well as mutations in the protospacer seed sequence, exclude targeted exposure .

Заявители показали, что конструирование генома с применением системы CRISPR работало не только у бактерий, у которых наблюдается высокая частота рекомбинации, таких как S. pneumoniae, но также у Е. coli. Результаты по Е. coli свидетельствовали о том, что способ можно применять к другим микроорганизмам, которым можно вводить плазмиды. В Е. coli данный подход дополняет рекомбинационную инженерию мутагенных олигонуклеотидов. Для использования этого метода в микроорганизмах, где рекомбинационная инженерия является невозможной, механизм гомологичной рекомбинации хозяина можно применять за счет обеспечения матрицы редактирования в плазмиде. К тому же, поскольку накопленные данные указывают на то, что опосредованное CRISPR расщепление приводит к гибели клеток многих бактерий и архей, можно предположить использование эндогенных систем CRISPR-Cas для целей редактирования.Applicants have shown that constructing a genome using the CRISPR system worked not only in bacteria that have a high recombination rate, such as S. pneumoniae, but also in E. coli. The E. coli results indicated that the method can be applied to other microorganisms to which plasmids can be introduced. In E. coli, this approach complements the recombination engineering of mutagenic oligonucleotides. To use this method in microorganisms where recombination engineering is impossible, the mechanism of homologous recombination of the host can be applied by providing an editing matrix in the plasmid. In addition, since the accumulated data indicate that CRISPR-mediated cleavage leads to the death of cells of many bacteria and archaea, it can be assumed that CRISPR-Cas endogenous systems are used for editing purposes.

И в S. pneumoniae, и в Е. coli заявители наблюдали, что хотя редактированию способствовали совместный отбор трансформируемых клеток и незначительная индукция рекомбинации в целевом сайте за счет расщепления Cas9, механизмом, который способствовал редактированию в наибольшей степени, являлся отбор против нередактированных клеток. Таким образом, основным ограничением способа было наличие фона клеток, которые избежали CRISPR-индуцированной гибели клеток и не имели желаемой мутации. Заявители показали, что эти "клетки, избежавшие воздействия" возникли в основном путем делеции спейсера для целенаправленного воздействия, предположительно после рекомбинации последовательностей повторов, которые фланкируют спейсер для целенаправленного воздействия. Дальнейшее совершенствование можно сосредоточить на конструировании фланкирующих последовательностей для исключения рекомбинации, которые все еще могут поддерживать биогенез функциональных crRNA, но которые достаточно отличаются друг от друга. Альтернативно можно исследовать прямую трансформацию химерных crRNA. В частном случае Е. coli создание системы CRISPR-Cas было невозможным, если этот организм также использовали в качестве хозяина для клонирования. Заявители решили эту проблему путем размещения Cas9 и tracrRNA на одной плазмиде, а CRISPR-массив на другой. Конструирование индуцибельной системы также может обойти это ограничение.In both S. pneumoniae and E. coli, applicants observed that although editing was facilitated by co-selection of transformable cells and a slight induction of recombination at the target site due to Cas9 cleavage, the mechanism that contributed to editing to the greatest extent was selection against unedited cells. Thus, the main limitation of the method was the presence of a background of cells that avoided CRISPR-induced cell death and did not have the desired mutation. Applicants have shown that these “avoidant cells" arose primarily by deletion of the spacer for targeted exposure, presumably after recombination of the repeat sequences that flank the spacer for targeted exposure. Further improvement can be concentrated on the design of flanking sequences to exclude recombination, which can still support the biogenesis of functional crRNAs, but which are quite different from each other. Alternatively, direct transformation of chimeric crRNAs can be investigated. In the particular case of E. coli, the creation of a CRISPR-Cas system was not possible if this organism was also used as a host for cloning. Applicants solved this problem by placing Cas9 and tracrRNA on one plasmid, and a CRISPR array on another. The construction of an inducible system can also circumvent this limitation.

Хотя новые технологии синтеза ДНК обеспечивают возможность с оптимальными затратами создавать любую последовательность с высокой производительностью, остается проблема интегрирования синтетической ДНК в живые клетки для создания функциональных геномов. Недавно было показано, что стратегия совместного отбора MAGE повышает эффективность мутаций рекомбинационной инженерии путем отбора субпопуляции клеток, которые характеризуются повышенной вероятностью достижения рекомбинации в или возле данного локуса. В этом способе, введение селектируемых мутации используют для повышения вероятности создания расположенных поблизости неселектируемых мутаций. В отличие от непрямого отбора обеспечиваемого этой стратегией, использование системы CRISPR делает возможным производить прямой отбор по желаемой мутации и получать ее с высокой эффективностью. Эти технологии дополняют панель инструментов специалистов в области генной инженерии и совместно с синтезом ДНК они могут существенно увеличить как возможность расшифровки функции гена, так и осуществления манипуляции с организмами в биотехнологических целях. Два других исследования также относятся к конструированию с помощью CRISPR геномов млекопитающих. Ожидается, что эти crRNA-направленные технологии редактирования генома могут широко применяться в фундаментальных и медицинских науках.Although new DNA synthesis technologies provide the opportunity to create any sequence with high productivity at optimal costs, the problem of integrating synthetic DNA into living cells to create functional genomes remains. It has recently been shown that the co-selection strategy of MAGE improves the efficiency of recombination engineering mutations by selecting a subpopulation of cells that are more likely to achieve recombination at or near a given locus. In this method, the introduction of breeding mutations is used to increase the likelihood of creating nearby non-breeding mutations. In contrast to the indirect selection provided by this strategy, the use of the CRISPR system makes it possible to perform direct selection for the desired mutation and obtain it with high efficiency. These technologies complement the toolbar of specialists in the field of genetic engineering and, together with DNA synthesis, they can significantly increase both the ability to decrypt gene functions and manipulate organisms for biotechnological purposes. Two other studies also relate to the construction of mammalian genomes using CRISPR. It is expected that these crRNA-directed genome editing technologies can be widely applied in basic and medical sciences.

Штаммы и условия культивирования. Штамм R6 S. pneumoniae был предоставлен д-ром Alexander Tomasz. Штамм crR6 получали в предыдущем исследовании. Культуры S. pneumoniae в жидкой среде выращивали в THYE (30 г/л агара Тодда-Хьюитта, 5 г/л дрожжевого экстракта). Клетки высевали на триптический соевый агар (TSA) с добавлением 5% дефибринированной овечьей крови. При необходимости добавляли следующие антибиотики: канамицин (400 мкг/мл), хлорамфеникол (5 мкг/мл), эритромицин (1 мкг/мл) стрептомицин (100 мкг/мл) или спектиномицин (100 мкг/мл). Измерения активности β-галактозидазы производили с применением анализа Миллера, как описано ранее.Strains and cultivation conditions. Strain R6 S. pneumoniae was provided by Dr. Alexander Tomasz. Strain crR6 was obtained in a previous study. Cultures of S. pneumoniae in liquid medium were grown in THYE (30 g / L Todd-Hewitt agar, 5 g / L yeast extract). Cells were plated on tryptic soy agar (TSA) supplemented with 5% defibrinated sheep blood. If necessary, the following antibiotics were added: kanamycin (400 μg / ml), chloramphenicol (5 μg / ml), erythromycin (1 μg / ml) streptomycin (100 μg / ml), or spectinomycin (100 μg / ml). Measurements of β-galactosidase activity were performed using Miller's assay as previously described.

Штаммы Е. coli MG1655 и HME63 (полученные из MG1655, Δ(argF-lac) U169 λ cI857 Δcro-bioA galK tyr 145 UAG mutS<>amp) (31) были предоставлены Jeff Roberts и Donald Court, соответственно. Культуры E. coli в жидкой среде выращивали в среде LB (Difco). При необходимости добавляли следующие антибиотики: хлорамфеникол (25 мкг/мл), канамицин (25 мкг/мл) и стрептомицин (50 мкг/мл).Strains of E. coli MG1655 and HME63 (derived from MG1655, Δ (argF-lac) U169 λ cI857 Δcro-bioA galK tyr 145 UAG mutS <> amp) (31) were provided by Jeff Roberts and Donald Court, respectively. E. coli cultures in liquid medium were grown in LB medium (Difco). If necessary, the following antibiotics were added: chloramphenicol (25 μg / ml), kanamycin (25 μg / ml) and streptomycin (50 μg / ml).

Трансформация S. pneumoniae. Компетентные клетки получали, как описано ранее (23). Для всех трансформаций для редактирования генома производили осторожное оттаивание клеток на льду и ресуспендировали их в 10 объемах среды M2 с добавлением 100 нг/мл стимулирующего компетенцию пептида CSP1(40) и с последующим добавлением конструкций для редактирования (конструкции для редактирования добавляли к клеткам при конечной концентрации от 0,7 нг/мкл до 2,5 мкг/мкл). Клетки инкубировали 20 мин. при 37°C перед добавлением 2 мкл конструкций для целенаправленного воздействия и затем инкубировали 40 мин. при 37°C. Серийные разбавления клеток высевали на соответствующую среду для определения количества колониеобразующих единиц (КОЕ).Transformation of S. pneumoniae. Competent cells were obtained as previously described (23). For all transformations for editing the genome, cells were thawed carefully on ice and resuspended in 10 volumes of M2 medium with the addition of 100 ng / ml of competence-stimulating peptide CSP1 (40) and then editing constructs were added (editing constructs were added to the cells at a final concentration from 0.7 ng / μl to 2.5 μg / μl). Cells were incubated for 20 minutes. at 37 ° C before adding 2 μl of constructs for targeted exposure and then incubated for 40 min. at 37 ° C. Serial cell dilutions were plated on an appropriate medium to determine the number of colony forming units (CFU).

Рекомбинационная инженерия Lambda-red Е. coli. Штамм НМЕ63 использовали для всех экспериментов рекомбинационной инженерии. Клетки для рекомбинационной инженерии получали и обрабатывали в соответствии с ранее опубликованным протоколом (6). Кратко, 2 мл суточной культуры (среда LB), инокулированной из одной колонии, полученной из чашки, выращивали при 30°C. Суточную культуру разводили в 100 раз и выращивали при 30°C со встряхиванием (200 об./мин.) до тех пор, пока OD600 не составляло 0,4-0,5 (приблизительно 3 часа). Для индукции Lambda-red культуру переносили на водяную баню при 42°C для встряхивания при 200 об./мин. в течение 15 мин. Сразу же после индукции культуру перемешивали в суспензии ледяной воды и охлаждали на льду в течение 5-10 мин. Клетки затем промывали и аликвотировали в соответствии с протоколом. Для электротрансформации 50 мкл клеток смешивали с 1 мМ обессоленных олигонуклеотидов (ГОТ) или 100-150 нг плазмидной ДНК (полученной с помощью QIAprep Spin Miniprep Kit, Qiagen). Клетки электропорировали с использованием 1 мм кюветы Gene Pulser (Bio-rad) при 1,8 кВ и сразу же ресуспендировали в 1 мл среды LB комнатной температуры. Клетки извлекали при 30°C в течение 1-2 часов перед высеванием на агар LB с соответствующей устойчивостью к антибиотику и инкубировали при 32°C на протяжении ночи.Recombination Engineering Lambda-red E. coli. Strain HME63 was used for all recombination engineering experiments. Cells for recombination engineering were obtained and processed in accordance with a previously published protocol (6). Briefly, 2 ml of a 24-hour culture (LB medium) inoculated from one colony obtained from a plate was grown at 30 ° C. The daily culture was diluted 100 times and grown at 30 ° C with shaking (200 rpm) until the OD 600 was 0.4-0.5 (approximately 3 hours). For Lambda-red induction, the culture was transferred to a water bath at 42 ° C for shaking at 200 rpm. within 15 minutes Immediately after induction, the culture was mixed in a suspension of ice water and cooled on ice for 5-10 minutes. The cells were then washed and aliquoted in accordance with the protocol. For electrotransformation, 50 μl of cells was mixed with 1 mM desalted oligonucleotides (GOT) or 100-150 ng of plasmid DNA (obtained using QIAprep Spin Miniprep Kit, Qiagen). Cells were electroporated using a 1 mm Gene Pulser cuvette (Bio-rad) at 1.8 kV and immediately resuspended in 1 ml LB medium at room temperature. Cells were harvested at 30 ° C for 1-2 hours before plating on LB agar with appropriate antibiotic resistance and incubated at 32 ° C overnight.

Получение геномной ДНК S. pneumoniae. В целях трансформации геномную ДНК S. pneumoniae выделяли с применением набора для очистки геномной ДНК Wizard, следуя инструкциям, предоставляемым производителем (Promega). В целях генотипирования 700 мкл суточных культур S. pneumoniae осаждали центрифугированием, ресуспендировали в 60 мкл раствора лизоцима (2 мг/мл) и инкубировали 30 мин. при 37°C. Геномную ДНК экстрагировали с применением набора QIAprep Spin Miniprep Kit (Qiagen).Obtaining genomic DNA of S. pneumoniae. For transformation, S. pneumoniae genomic DNA was isolated using the Wizard genomic DNA purification kit, following the instructions provided by the manufacturer (Promega). For genotyping, 700 μl of diurnal cultures of S. pneumoniae were precipitated by centrifugation, resuspended in 60 μl of lysozyme solution (2 mg / ml) and incubated for 30 min. at 37 ° C. Genomic DNA was extracted using the QIAprep Spin Miniprep Kit (Qiagen).

Создание штамма. Все праймеры, использованные в данном исследовании, представлены в таблице G. Для создания crR6M S. pneumoniae создавали промежуточный штамм LAM226. В этом штамме ген aphA-3 (обеспечивающий устойчивость к канамицину), смежный с массивом CRISPR штамма crR6 S. pneumoniae, замещали геном cat (обеспечивающим устойчивость к хлорамфениколу). Кратко, геномную ДНК crR6 амплифицировали с применением праймеров L448/L444 и L447/L481, соответственно. Ген cat амплифицировали из плазмиды pC194 с применением праймеров L445/L446. Каждый ПЦР-продукт очищали в геле и осуществляли слияние всех трех с помощью ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR) с праймерами L448/L481. Полученным ПЦР-продуктом трансформировали компетентные клетки crR6 S. pneumoniae и отбирали устойчивые к хлорамфениколу трансформанты. Для создания crR6M S. pneumoniae геномную ДНК crR6 S. pneumoniae амплифицировали с помощью ПЦР с применением праймеров L409/L488 и L448/L481, соответственно. Каждый ПЦР-продукт очищали в геле и осуществляли их слияние с помощью ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR) с праймерами L409/L481. Полученным ПЦР-продуктом трансформировали компетентные клетки LAM226 S. pneumoniae и отбирали устойчивые к канамицину трансформанты.The creation of the strain. All primers used in this study are presented in table G. To create S. pneumoniae crR6M, an intermediate strain LAM226 was created. In this strain, the aphA-3 gene (providing resistance to kanamycin) adjacent to the CRISPR array of S. pneumoniae crR6 strain was replaced by the cat gene (providing resistance to chloramphenicol). Briefly, crR6 genomic DNA was amplified using primers L448 / L444 and L447 / L481, respectively. The cat gene was amplified from plasmid pC194 using L445 / L446 primers. Each PCR product was gel purified and all three were fused using PCR with elongation of overlapping fragments (SOEing PCR) with L448 / L481 primers. Competent crR6 S. pneumoniae cells were transformed with the obtained PCR product and chloramphenicol resistant transformants were selected. To create S. pneumoniae crR6M, S. pneumoniae genomic crR6 DNA was amplified by PCR using primers L409 / L488 and L448 / L481, respectively. Each PCR product was gel purified and merged by PCR with elongation of overlapping fragments (SOEing PCR) with primers L409 / L481. The competent LAM226 S. pneumoniae cells were transformed with the obtained PCR product and kanamycin resistant transformants were selected.

Для создания crR6Mc S. pneumoniae геномную ДНК crR6R S. pneumoniae амплифицировали с помощью ПЦР с применением праймеров L430/W286 и геномную ДНК LAM226 S. pneumoniae амплифицировали с помощью ПЦР с применением праймеров W288/L481. Каждый ПЦР-продукт очищали в геле и осуществляли их слияние с помощью ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR) с праймерами L430/L481. Полученным ПЦР-продуктом трансформировали компетентные клетки crR6M S. pneumoniae и отбирали устойчивые к хлорамфениколу трансформанты.To create S. pneumoniae crR6Mc, S. pneumoniae genomic crR6R DNA was amplified by PCR using L430 / W286 primers and S. pneumoniae genomic DNA LAM226 was amplified by PCR using W288 / L481 primers. Each PCR product was gel purified and merged by PCR with elongation of overlapping fragments (SOEing PCR) with L430 / L481 primers. Competent crR6M S. pneumoniae cells were transformed with the obtained PCR product and chloramphenicol resistant transformants were selected.

Для создания crR6Rk S. pneumoniae геномную ДНК crR6M S. pneumoniae амплифицировали с помощью ПЦР с применением праймеров L430/W286 и W287/L481, соответственно. Каждый ПЦР-продукт очищали в геле и осуществляли их слияние с помощью ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR) с праймерами L430/L481. Полученным ПЦР-продуктом трансформировали компетентные клетки crR6Rc S. pneumoniae и отбирали устойчивые к канамицину трансформанты.To create S. pneumoniae crR6Rk, S. pneumoniae genomic crR6M DNA was amplified by PCR using primers L430 / W286 and W287 / L481, respectively. Each PCR product was gel purified and merged by PCR with elongation of overlapping fragments (SOEing PCR) with L430 / L481 primers. Competent crR6Rc S. pneumoniae cells were transformed with the obtained PCR product and kanamycin resistant transformants were selected.

Для создания JEN37 геномную ДНК crR6Rk S. pneumoniae амплифицировали с помощью ПЦР с применением праймеров L430/W356 и W357/L481, соответственно. Каждый ПЦР-продукт очищали в геле и осуществляли их слияние с помощью ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR) с праймерами L430/L481. Полученным ПЦР-продуктом трансформировали компетентные клетки crR6Rc S. pneumoniae и отбирали устойчивые к канамицину трансформанты.To create JEN37, S. pneumoniae genomic crR6Rk DNA was amplified by PCR using primers L430 / W356 and W357 / L481, respectively. Each PCR product was gel purified and merged by PCR with elongation of overlapping fragments (SOEing PCR) with L430 / L481 primers. Competent crR6Rc S. pneumoniae cells were transformed with the obtained PCR product and kanamycin resistant transformants were selected.

Для создания JEN38 геномную ДНК R6 амплифицировали с применением праймеров L422/L461 и L459/L426, соответственно. Ген ermAM (определяющий устойчивость к эритромицину) из плазмиды pFW15 43амплифицировали с применением праймеров L457/L458. Каждый ПЦР-продукт очищали в геле и осуществляли слияние всех трех с помощью ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR) с праймерами L422/L426. Полученным ПЦР-продуктом трансформировали компетентные клетки crR6Rc S. pneumoniae и отбирали устойчивые к эритромицину трансформанты.To create JEN38, R6 genomic DNA was amplified using primers L422 / L461 and L459 / L426, respectively. The ermAM gene (determining erythromycin resistance) from plasmid pFW15 43 was amplified using L457 / L458 primers. Each PCR product was gel purified and all three were fused by PCR with elongation of overlapping fragments (SOEing PCR) with L422 / L426 primers. Competent crR6Rc S. pneumoniae cells were transformed with the obtained PCR product and erythromycin resistant transformants were selected.

JEN53 S. pneumoniae создавали в две стадии. Сначала JEN43 создавали, как проиллюстрировано на фигуре 33. JEN53 создавали путем трансформирования компетентных клеток JEN43 геномной ДНК JEN25 и отбора, как по хлорамфениколу, так и по эритромицину.JEN53 S. pneumoniae was created in two stages. First, JEN43 was created, as illustrated in Figure 33. JEN53 was created by transforming competent JEN43 cells to JEN25 genomic DNA and selecting both chloramphenicol and erythromycin.

Для создания JEN62 S. pneumoniae геномную ДНК crR6Rk S. pneumoniae амплифицировали с помощью ПЦР с применением праймеров W256/W365 и W366/L403, соответственно. Каждый ПЦР-продукт очищали и лигировали с помощью сборки по методу Гибсона. Продуктом сборки трансформировали компетентные клетки crR6Rc S. pneumoniae и отбирали устойчивые к канамицину трансформанты.To create S. pneumoniae JEN62, S. pneumoniae genomic crR6Rk DNA was amplified by PCR using primers W256 / W365 and W366 / L403, respectively. Each PCR product was purified and ligated using a Gibson assembly. Competent crR6Rc S. pneumoniae cells were transformed with the assembly product and kanamycin resistant transformants were selected.

Создание плазмиды. pDB97 создавали посредством фосфорилирования и отжига олигонуклеотидов В296/В297 с последующим лигированием в pLZ12spec, расщепленный с помощью EcoRI/BamHI. Заявители полностью секвенировали pLZ12spec и депонировали его последовательность в Genbank (номер доступа: KC112384).Creation of a plasmid. pDB97 was created by phosphorylation and annealing of B296 / B297 oligonucleotides, followed by ligation in pLZ12spec, digested with EcoRI / BamHI. Applicants fully sequenced pLZ12spec and deposited its sequence at Genbank (access number: KC112384).

pDB98 получали после клонирования лидерной последовательности CRISPR совместно со структурной единицей повтор-спейсер-повтор в pLZ12spec. Этого достигали посредством амплификации ДНК crR6Rc с праймерами В298/В320 и В299/В321 с последующей ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR) для обоих продуктов и клонированием в pLZ12spec с сайтами рестрикциии BamHI/EcoRI. Таким образом, последовательность спейсера в pDB98 конструировали так, чтобы она содержала два сайта рестрикции BsaI в противоположных направлениях, что обеспечивало возможность scar-less клонирования новых спейсеров.pDB98 was obtained after cloning the CRISPR leader sequence together with the repeat-spacer-repeat structural unit in pLZ12spec. This was achieved by amplification of crR6Rc DNA with primers B298 / B320 and B299 / B321 followed by PCR with elongation of overlapping fragments (SOEing PCR) for both products and cloning into pLZ12spec with BamHI / EcoRI restriction sites. Thus, the spacer sequence in pDB98 was designed to contain two BsaI restriction sites in opposite directions, which allowed scar-less cloning of new spacers.

От pDB99 до pDB108 создавали путем отжига олигонуклеотидов В300/В301 (pDB99), В302/В303 (pDB100), В304/В305 (pDB101), В306/В307 (pDB102), B308/B309 (pDB103), B310/B311 (pDB104), B312/B313 (pDB105), B314/B315 (pDB106), B315/B317 (pDB107), B318/B319 (pDB108) с последующим лигированием в pDB98, разрезанным с помощью BsaI.From pDB99 to pDB108, they were created by annealing the oligonucleotides B300 / B301 (pDB99), B302 / B303 (pDB100), B304 / B305 (pDB101), B306 / B307 (pDB102), B308 / B309 (pDB103), B3B3 (pDB103), B3103 B312 / B313 (pDB105), B314 / B315 (pDB106), B315 / B317 (pDB107), B318 / B319 (pDB108) followed by ligation in pDB98, cut with BsaI.

Плазмиду pCas9 создавали следующим образом. Необходимые элементы CRISPR амплифицировали из геномной ДНК SF370 Streptococcus pyogenes с фланкирующими гомологичными плечами для сборки по методу Гибсона. tracrRNA и Cas9 амплифицировали с олигонуклеотидами НС008 и НС010. Лидерную последовательность и последовательности CRISPR амплифицировали с НС011/НС014 и НС015/НС009, так что два сайта BsaI типа IIS вводили между двумя прямыми повторами для обеспечения беспрепятственной вставки спейсеров.Plasmid pCas9 was created as follows. The necessary CRISPR elements were amplified from the genomic DNA of Streptococcus pyogenes SF370 with flanking homologous arms for assembly using the Gibson method. tracrRNA and Cas9 were amplified with oligonucleotides HC008 and HC010. The CRISPR leader and sequences were amplified with HC011 / HC014 and HC015 / HC009, so that two BsaI type IIS sites were inserted between two direct repeats to ensure seamless insertion of spacers.

pCRISPR создавали с помощью субклонирования массива CRISPR pCas9 в pZE21-MCS1 посредством амплификации с олигонуклеотидами В298+В299 и рестрикции EcoRI и BamHI. Спейсер для целенаправленного воздействия rpsL клонировали с помощью отжига олигонуклеотидов В352+В353 и клонирования в разрезанную BsaI pCRISPR с получением pCRISPR::rpsL.pCRISPR was created by subcloning an array of CRISPR pCas9 into pZE21-MCS1 by amplification with B298 + B299 oligonucleotides and restriction EcoRI and BamHI. The spacer for targeted rpsL exposure was cloned by annealing the B352 + B353 oligonucleotides and cloned into the cut BsaI pCRISPR to obtain pCRISPR :: rpsL.

Создание конструкций для целенаправленного воздействия и редактирования.Creating designs for focused exposure and editing.

Конструкций для целенаправленного воздействия, использованные для редактирования генома, получали с помощью сборки по методу Гибсона продуктов ПЦР с правыми и левыми праймерами (таблица G). Конструкции для редактирования получали посредством слияния ПЦР-продуктов A (ПЦР A), ПЦР-продуктов B (ПЦР В) и ПЦР-продуктов С (ПЦР С) при помощи ПЦР с удлинением перекрывающихся фрагментов (SOEing PCR), при необходимости (таблица G). Конструкции CRISPR::∅ и CRISPR::ermAM(stop) для целенаправленного воздействия получали с помощью ПЦР амплификации геномной ДНК JEN62 и crR6, соответственно, с олигонуклеотидами L409 и L481.Designs for targeted exposure, used to edit the genome, were obtained using the Gibson assembly of PCR products with right and left primers (table G). Editing constructs were obtained by fusing PCR products A (PCR A), PCR products B (PCR B) and PCR products C (PCR C) using PCR with elongation of overlapping fragments (SOEing PCR), if necessary (table G) . The CRISPR :: ∅ and CRISPR :: ermAM (stop) constructs for targeted exposure were obtained by PCR amplification of genomic DNA JEN62 and crR6, respectively, with oligonucleotides L409 and L481.

Получение мишеней с рандомизированными PAM или последовательностями протоспейсеров. 5 нуклеотидов, следующих за мишенью спейсера 1, рандомизировали посредством амплификации геномной ДНК R68232 5 с праймерами W377/L426. Этот ПЦР-продукт затем собирали с геном cat и участком srtA, находящимся выше, которые амплифицировали с той же матрицы с праймерами L422/W376. 80 нг собранной ДНК использовали для трансформации штаммов R6 и crR6. Образцы для рандомизированных мишеней получали с использованием следующих праймеров: B280-B290/L426 для рандомизирования оснований 1-10 мишени и B269-B278/L426 для рандомизирования оснований 10-20. Праймеры L422/B268 и L422/B279 использовали для амплификации гена cat и находящегося выше участка srtA для сборки с первыми и последними 10 ПЦР-продуктами, соответственно. Собранные конструкции объединяли вместе и с помощью 30 нг трансформировали R6 и crR6. После трансформации клетки высевали для отбора по хлорамфениколу. Для каждого образца более чем 2×105 клеток объединяли вместе в 1 мл THYE и геномную ДНК экстрагировали с помощью набора Promega Wizard kit. Праймеры В250/В251 использовали для амплификации целевого участка. ПЦР-продукты метили и прогоняли на дорожке для секвенирования спаренных концов Illurnina MiSeq с применением 300 циклов.Obtaining targets with randomized PAM or protospacer sequences. The 5 nucleotides following the spacer 1 target were randomized by amplification of R68232 5 genomic DNA with W377 / L426 primers. This PCR product was then harvested with the cat gene and the srtA region upstream that were amplified from the same matrix with L422 / W376 primers. 80 ng of collected DNA was used to transform strains R6 and crR6. Samples for randomized targets were obtained using the following primers: B280-B290 / L426 for randomizing the bases 1-10 of the target and B269-B278 / L426 for randomizing the bases 10-20. Primers L422 / B268 and L422 / B279 were used to amplify the cat gene and the upstream srtA region for assembly with the first and last 10 PCR products, respectively. The assembled constructs were combined together and 30 ng transformed R6 and crR6. After transformation, cells were seeded for selection by chloramphenicol. For each sample, more than 2 × 10 5 cells were combined together in 1 ml of THYE and genomic DNA was extracted using the Promega Wizard kit. The B250 / B251 primers were used to amplify the target site. PCR products were labeled and run on a Illurnina MiSeq twin-end sequencing run using 300 cycles.

Анализ данных глубокого секвенирования.Analysis of deep sequencing data.

Рандомизированные PAM. Для эксперимента с рандомизированными PAM получали 3429406 считываемых фрагментов для crR6 и 3253998 для R6. Ожидалось, что только половина из них будет соответствовать мишени PAM, в то время как другая половина будет секвенировать другой конец ПЦР-продукта. 1623008 из считываемых фрагментов crR6 и 1537131 из считываемых фрагментов R6 несли лишенную ошибок целевую последовательность. Встречаемость каждого возможного PAM среди этих считываемых фрагментов показана в дополнительном файле. Для оценки функциональности PAM вычисляли его относительную долю в образце crR6 в сравнении с образцом R6 и обозначали rijklm, где I, j, k, l, m представляют собой одно из 4 возможных оснований. Создавали следующую статистическую модель:Randomized PAM. For the experiment with randomized PAM, 3429,406 read fragments for crR6 and 3,253,998 for R6 were obtained. It was expected that only half of them would match the PAM target, while the other half would sequence the other end of the PCR product. 1623008 of the read fragments of crR6 and 1537131 of the read fragments of R6 carried an error-free target sequence. The occurrence of each possible PAM among these read fragments is shown in an additional file. To assess the functionality of PAM, its relative share in the crR6 sample was calculated in comparison with the R6 sample and denoted by r ijklm , where I, j, k, l, m represent one of 4 possible bases. The following statistical model was created:

log(rijklm) = μ+b2i+b3j+b4k+b2b3i,j+b3b4j,kijklm,log (r ijklm ) = μ + b2 i + b3 j + b4 k + b2b3 i, j + b3b4 j, k + ε ijklm ,

где ε представляет собой остаточную ошибку, b2 представляет собой эффект 2го основания PAM, b3 - третьего, b4 - четвертого, b2b3 представляет собой взаимодействие между вторым и третьим основаниями, b3b4 - между третьим и четвертым основаниями. Выполняли дисперсионный анализ:where ε is the residual error, b2 is the effect of the 2nd PAM base, b3 is the third, b4 is the fourth, b2b3 is the interaction between the second and third bases, b3b4 is between the third and fourth bases. The analysis of variance was performed:

Таблица дисперсионного анализаAnalysis of variance table

Figure 00000091
Figure 00000091

При добавлении в данную модель b1 или b5 оказываются незначимыми, и другие взаимодействия, кроме включенных, также можно исключать. Выбор модели осуществляли посредством последовательных сравнений более или менее полных моделей с применением метода дисперсионного анализа в R. Критерий подлинной значимости Тьюки использовали для определения, являются ли попарные различия между эффектами значимыми.When b1 or b5 is added to this model, they are insignificant, and other interactions, except those included, can also be excluded. Model selection was made through sequential comparisons of more or less complete models using the analysis of variance in R. The Tukey criterion of true significance was used to determine whether pairwise differences between effects are significant.

Паттерны NGGNN являлись достоверно отличными от всех других паттернов и имели самый сильный эффект (см. таблицу ниже).NGGNN patterns were significantly different from all other patterns and had the strongest effect (see table below).

Для того, чтобы показать, что положения 1, 4 или 5 не влияют на паттерн NGGNN, заявители рассматривали только эти последовательности. Оказывается, что их эффекты являются нормально распределенными (см. диаграмму "квантиль-квантиль" на фигуре 71), и сравнения моделей с применением метода дисперсионного анализа в R показывают, что нулевая модель является наилучшей, т.е. нет значимой роли b1, b4 и b5.In order to show that provisions 1, 4 or 5 do not affect the NGGNN pattern, applicants considered only these sequences. It turns out that their effects are normally distributed (see the quantile-quantile diagram in Figure 71), and comparisons of models using the analysis of variance in R show that the zero model is the best, i.e. there is no significant role for b1, b4 and b5.

Сравнение моделей с применением метода дисперсионного анализа в R для последовательностей NGGNNComparison of models using the analysis of variance in R for NGGNN sequences

Figure 00000092
Figure 00000092

Частичная интерференция паттернов NAGNN и NNGGNPartial interference of NAGNN and NNGGN patterns

Паттерны NAGNN являются достоверно отличными от всех других паттернов, но несут намного меньший эффект, чем NGGNN (см. критерий подлинной значимости Тьюки ниже).NAGNN patterns are significantly different from all other patterns, but they have a much smaller effect than NGGNN (see Tukey's true significance criterion below).

И наконец, паттерны NTGGN и NCGGN являются подобными и показывают значительно большую интерференцию CRISPR, чем паттерны NTGHN и NCGHN (где Н представляет собой A, T или C), как показано с помощью парного критерия Стьюдента с поправкой Бониферрони.Finally, the NTGGN and NCGGN patterns are similar and show significantly greater CRISPR interference than the NTGHN and NCGHN patterns (where H is A, T, or C), as shown using the Bonifronroni paired student criterion.

Парные сравнения эффекта b4 на последовательности NYGNN с применением t-критериев с суммарным среднеквадратическим отклонением (SD)Paired comparisons of the effect of b4 on NYGNN sequences using t-tests with a total standard deviation (SD)

Данные: b4Data: b4

Figure 00000093
Figure 00000093

Взятые вместе, эти результаты позволяют сделать вывод, что паттерны NNGGN в целом обеспечивают либо полную интерференцию, в случае NGGGN, либо частичную интерференцию, в случае NAGGN, NTGGN или NCGGN.Taken together, these results suggest that NNGGN patterns generally provide either complete interference, in the case of NGGGN, or partial interference, in the case of NAGGN, NTGGN, or NCGGN.

Множественные сравнения значений по Тьюки: уровень значимости с поправкой на эффект множественных сравнений 95%Multiple Tukey value comparisons: significance level adjusted for the effect of multiple comparisons 95%

5b2:b35b2: b3

Figure 00000094
Figure 00000094

Figure 00000095
Figure 00000095

sb3:b4sb3: b4

Figure 00000096
Figure 00000096

Рандомизированная мишеньRandom target

Для эксперимента с рандомизированными мишенями для crR6 получали 540726 считываемых фрагментов и 753,570 для R6. Как и прежде, ожидалось, что только половина считываемых фрагментов будет секвенировать конец ПЦР-продукта, представляющий интерес. После фильтрования для считываемых фрагментов, которые несут мишень, являющуюся лишенной ошибок или с одноточечной мутацией, оставалось 217656 и 353141 считываемых фрагментов для crR6 и R6, соответственно. Вычисляли относительную долю каждого мутанта в образце crR6 в сравнении с образцом R6 (фигура 24c). Все мутации вне затравочной последовательности (13-20 оснований от PAM) проявляли полную интерференцию. Эти последовательности использовали как идентификатор для определения, можно ли сказать, что мутации в затравочной последовательности значимо нарушают интерференцию. Нормальное распределение подбирали для этих последовательностей с использованием выравнивания функции распределения пакета MASS R. Квантиль 0,99 подобранного распределения показан как пунктирная линия на фигуре 24c. На фигуре 72 показана гистограмма плотности данных с подобранным нормальным распределением (черная линия) и квантилем 0,99 (пунктирная линия).For the experiment with randomized targets for crR6, 540,726 read fragments and 753,570 for R6 were obtained. As before, it was expected that only half of the read fragments would sequence the end of the PCR product of interest. After filtering for read fragments that carry a target that is devoid of errors or with a single-point mutation, there were 217656 and 353141 read fragments for crR6 and R6, respectively. The relative fraction of each mutant in the crR6 sample was calculated in comparison with the R6 sample (Figure 24c). All mutations outside the seed sequence (13-20 bases from PAM) showed complete interference. These sequences were used as an identifier to determine whether it can be said that mutations in the seed sequence significantly interfere with the interference. A normal distribution was selected for these sequences using the alignment of the distribution function of the MASS R. packet. A quantile 0.99 of the selected distribution is shown as a dashed line in Figure 24c. Figure 72 shows a histogram of data density with a matched normal distribution (black line) and a quantile of 0.99 (dashed line).

Figure 00000097
Figure 00000097

Figure 00000098
Figure 00000098

Figure 00000099
Figure 00000099

Figure 00000100
Figure 00000100

Figure 00000101
Figure 00000101

Пример 6: оптимизация направляющей РНК для Cas9 Streptococcus pyogenes (называемого SpCas9)Example 6: RNA Guide Optimization for Cas9 Streptococcus pyogenes (called SpCas9)

Заявители вносили мутации в tracrRNA и последовательности прямых повторов или вносили мутации в химерную направляющую РНК для повышения экспрессии РНК в клетках.Applicants introduced mutations in tracrRNA and direct repeat sequences, or introduced mutations in the chimeric RNA guide to increase RNA expression in cells.

Оптимизация основана на наблюдении, что присутствовали фрагменты тимина (Ts) в tracrRNA и направляющей РНК, которые могли приводить к ранней терминации Optimization is based on the observation that thymine (Ts) fragments were present in tracrRNA and RNA guide, which could lead to early termination

транскрипции посредством промотора pol 3. Таким образом заявители создавали следующие оптимизированные последовательности. Оптимизированная tracrRNA и соответствующий оптимизированный прямой повтор представлены в парах. Оптимизированная tracrRNA 1 (мутация подчеркнута):transcription by the pol 3 promoter. Thus, the applicants created the following optimized sequences. Optimized tracrRNA and the corresponding optimized direct repeat are presented in pairs. Optimized tracrRNA 1 (mutation underlined):

Figure 00000102
Figure 00000102

Оптимизированный прямой повтор 1 (мутация подчеркнута):Optimized direct repeat 1 (mutation underlined):

Figure 00000103
Figure 00000103

Оптимизированная tracrRNA 2 (мутация подчеркнута):Optimized tracrRNA 2 (mutation underlined):

Figure 00000104
Figure 00000104

Оптимизированный прямой повтор 2 (мутация подчеркнута):Optimized direct repeat 2 (mutation underlined):

Figure 00000105
Figure 00000105

Заявители также оптимизировали химерную направляющую РНК для оптимальной активности в эукариотических клетках.Applicants have also optimized a chimeric RNA guide for optimal activity in eukaryotic cells.

Исходная направляющая РНК:Original RNA Guide:

Figure 00000106
Figure 00000106

Оптимизированная химерная направляющая последовательность РНК 1:

Figure 00000107
Optimized chimeric guide sequence of RNA 1:
Figure 00000107

Оптимизированная химерная направляющая последовательность РНК 2:Optimized chimeric guide sequence for RNA 2:

Figure 00000108
Figure 00000108

Оптимизированная химерная направляющая последовательность РНК 3:Optimized RNA 3 chimeric guide sequence:

Figure 00000109
Figure 00000109

Заявители показали, что оптимизированная химерная направляющая РНК работает лучше, как показано на фигуре 3. Эксперимент проводили путем котрансфекции клеток 293FT Cas9 и ДНК-кассетой с U6-направляющей РНК для экспрессии одной из четырех форм РНК, показанных выше. Мишень направляющей РНК является таким же целевым сайтом в локусе EMX1 человека: "GTCACCTCCAATGACTAGGG".Applicants have shown that an optimized chimeric RNA guide works better, as shown in Figure 3. The experiment was performed by cotransfection of 293FT Cas9 cells and a DNA cassette with a U6 guide RNA to express one of the four RNA forms shown above. The RNA target target is the same target site at the human EMX1 locus: "GTCACCTCCAATGACTAGGG".

Пример 7: оптимизация Cas9 из CRISPR1 LMD-9 Streptococcus thermophiles (называемого StlCas9)Example 7: Cas9 optimization from CRISPR1 LMD-9 Streptococcus thermophiles (called StlCas9)

Заявители разрабатывали направляющие химерные РНК, как показано на фигуре 4. Направляющие РНК StlCas9 можно подвергать такому же типу оптимизации, как и направляющие РНК SpCas9, путем разрушения политиминовых фрагментов (Ts).Applicants have designed guiding chimeric RNAs as shown in Figure 4. StlCas9 guiding RNAs can be optimized in the same way as SpCas9 guiding RNAs by destroying polythymine fragments (Ts).

Пример 8: разнообразие и мутации Cas9Example 8: Cas9 diversity and mutations

Система CRISPR-Cas является адаптивным иммунным механизмом в отношении внедряющейся экзогенной ДНК, используемым разнообразными видами из числа бактерий и архей. Система CRISPR-Cas9 II типа состоит из набора генов, кодирующих белки, ответственные за "захват" чужеродной ДНК в локус CRISPR, а также из набора генов, кодирующих "выполнение" механизма расщепления ДНК; они включают ДНК-нуклеазу (Cas9), некодирующую транс-активирующую cr-RNA (tracrRNA) и массив полученных из чужеродной ДНК спейсеров, фланкированных прямыми повторами (crRNA). При созревании под действием Cas9 дуплекс tracRNA и crRNA направляет нуклеазу Cas9 к целевой последовательности ДНК, определенной спейсерными направляющими последовательностями и опосредует двухцепочечные разрывы в ДНК вблизи короткого мотива последовательности в целевой ДНК, которые требуются для расщепления и являются специфичными для каждой системы CRISPR-Cas. Системы CRISPR-Cas II типа обнаруживаются повсеместно в царстве бактерий и являются очень разнообразными по последовательности и размеру белка Cas9, последовательности прямого повтора tracrRNA и crRNA, организации этих элементов в геноме и требованиям к мотиву для целенаправленного расщепления. Один вид может иметь несколько отдельных систем CRISPR-Cas.The CRISPR-Cas system is an adaptive immune mechanism against intruding exogenous DNA, used by a variety of bacteria and archaea species. The CRISPR-Cas9 type II system consists of a set of genes encoding the proteins responsible for the "capture" of foreign DNA into the CRISPR locus, as well as a set of genes encoding the "execution" of the DNA cleavage mechanism; they include DNA nuclease (Cas9), a non-coding trans-activating cr-RNA (tracrRNA) and an array of foreign-derived spacers flanked by direct repeats (crRNA). Upon maturation by the action of Cas9, the duplex of tracRNA and crRNA directs Cas9 nuclease to the target DNA sequence defined by spacer guide sequences and mediates double-stranded breaks in the DNA near the short sequence motif in the target DNA, which are required for cleavage and are specific for each CRISPR-Cas system. CRISPR-Cas type II systems are found everywhere in the realm of bacteria and are very diverse in sequence and size of the Cas9 protein, the sequence of the direct repeat of tracrRNA and crRNA, the organization of these elements in the genome, and the motivation requirements for targeted cleavage. One view may have several separate CRISPR-Cas systems.

Заявители оценивали 207 предполагаемых Cas9 из видов бактерий, идентифицированных на основании гомологии последовательности с известными Cas9 и структурами, ортологичными известным субдоменам, в том числе домену эндонуклеазы HNH и доменам эндонуклеазы RuvC [информация от Eugene Koonin и Kira Makarova]. Филогенетический анализ, основанный на консервативности последовательности белка в этом наборе, позволил выявить пять семейств Cas9, включая три группы больших Cas9 (~1400 аминокислот) и две малых Cas9 (~1100 аминокислот) (фигуры 39 и 40A-F).Applicants evaluated 207 putative Cas9 from bacterial species identified based on sequence homology with known Cas9 and structures orthologous to known subdomains, including the HNH endonuclease domain and RuvC endonuclease domains [information from Eugene Koonin and Kira Makarova]. Phylogenetic analysis based on the conservatism of the protein sequence in this set revealed five Cas9 families, including three groups of large Cas9 (~ 1400 amino acids) and two small Cas9 (~ 1100 amino acids) (figures 39 and 40A-F).

В этом примере заявители показали, что следующие мутации могут превратить SpCas9 в надрезающий фермент: D10A, Е762А, Н840А, N854A, N863A, D986A.In this example, the applicants showed that the following mutations can turn SpCas9 into a notching enzyme: D10A, E762A, H840A, N854A, N863A, D986A.

Заявителями представлены последовательности, в которых показано, где локализованы точки мутаций в гене SpCas9 (фигура 41). Заявители также показывают, что никазы все еще могут опосредовать гомологичную рекомбинацию (анализ, указанный на фигуре 2). Более того, заявители показали, что SpCas9 с этими мутациями (отдельно) не индуцировал двухцепочечный разрыв (фигура 47).Applicants presented sequences in which it is shown where the mutation points in the SpCas9 gene are located (Figure 41). Applicants also show that nickases can still mediate homologous recombination (assay indicated in Figure 2). Moreover, the applicants showed that SpCas9 with these mutations (separately) did not induce double-stranded cleavage (Figure 47).

Пример 9: дополнение специфичности целенаправленного воздействия в отношении ДНК РНК-направляемой нуклеазы Cas9Example 9: Supplementing the Specificity of Targeted Exposure to DNA of RNA-Guided Cas9 Nuclease

Клеточная культура и трансфекцияCell Culture and Transfection

Линию клеток почки человеческого эмбриона (HEK) 293FT (Life Technologies) поддерживали в среде Игла в модификации Дульбекко (DMEM), дополненной 10% фетальной бычьей сыворотки (HyClone), 2 мМ GlutaMAX (Life Technologies), 100ЕД/мл пенициллина и 100 мкг/мл стрептомицина, при 37°C с инкубированием при 5% CO2.The human embryo kidney cell line (HEK) 293FT (Life Technologies) was maintained in Eagle's Dulbecco modification (DMEM) supplemented with 10% fetal bovine serum (HyClone), 2 mM GlutaMAX (Life Technologies), 100 U / ml penicillin and 100 μg / ml of streptomycin, at 37 ° C with incubation at 5% CO2.

Клетки 293FT засевали или на 6-луночные планшеты, 24-луночные планшеты, или на 96-луночные планшеты (Corning) за 24 часа до трансфекции. Клетки трансфицировали с применением Lipofectamine 2000 (Life Technologies) при 80-90% конфлуентности, следуя рекомендованному производителем протоколу. На каждую лунку 6-луночного планшета использовали в общей сложности 1 мкг плазмиды Cas9+sgRNA. На каждую лунку 24-луночного планшета использовали, если не указано иное, в общей сложности 500 нг плазмиды Cas9+sgRNA. На каждую лунку 96-луночного планшета использовали 65 нг плазмиды Cas9 при молярном соотношении ПЦР-продукта U6-sgRNA 1:1.293FT cells were seeded either on 6-well plates, 24-well plates, or on 96-well plates (Corning) 24 hours before transfection. Cells were transfected using Lipofectamine 2000 (Life Technologies) at 80-90% confluency following the manufacturer's recommended protocol. A total of 1 μg of Cas9 + sgRNA plasmid was used for each well of the 6-well plate. A total of 500 ng of the Cas9 + sgRNA plasmid was used for each well of the 24-well plate, unless otherwise indicated. 65 ng Cas9 plasmid was used for each well of a 96-well plate at a 1: 1 molar ratio of PCR product U6-sgRNA.

Клеточную линию эмбриональных стволовых клеток человека HUES 9 (Harvard Stem Cell Institute core) поддерживали в условиях без подслоя на GelTrex (Life Technologies) в среде mTesR (Stemcell Technologies) с добавлением 100 мкг/мл Normocin (InvivoGen). Клетки HUES9 трансфицировали с помощью набора Amaxa P3 Primary Cell 4-D Nucleofector Kit (Lonza), следуя протоколу производителя.The human embryonic stem cell line HUES 9 (Harvard Stem Cell Institute core) was maintained under conditions without sublayer on GelTrex (Life Technologies) in mTesR medium (Stemcell Technologies) supplemented with 100 μg / ml Normocin (InvivoGen). HUES9 cells were transfected using the Amaxa P3 Primary Cell 4-D Nucleofector Kit (Lonza) following the manufacturer's protocol.

Анализ с помощью SURVEYOR на предмет наличия модификации геномаSURVEYOR analysis for genome modification

Клетки 293FT трансфицировали плазмидной ДНК, как описано выше. Клетки инкубировали при 37°C в течение 72 часов после трансфекции перед экстракцией геномной ДНК. Геномную ДНК экстрагировали с помощью раствора QuickExtract DNA Extraction Solution (Epicentre), следуя протоколу производителя. Вкратце, осажденные центрифугированием клетки ресуспендировали в растворе QuickExtract solution и инкубировали при 65°C в течение 15 минут и 98°C в течение 10 минут.293FT cells were transfected with plasmid DNA as described above. Cells were incubated at 37 ° C for 72 hours after transfection before genomic DNA extraction. Genomic DNA was extracted with QuickExtract DNA Extraction Solution (Epicentre) following the manufacturer's protocol. Briefly, centrifuged cells were resuspended in a QuickExtract solution and incubated at 65 ° C for 15 minutes and 98 ° C for 10 minutes.

Геномный участок, фланкирующий целевой сайт CRISPR каждого гена, амплифицировали с помощью ПЦР (праймеры перечислены в таблицах J и К) и продукты очищали с применением колонки QiaQuick Spin Column (Qiagen), следуя протоколу производителя. В общей сложности 400 нг очищенных ПЦР-продуктов смешивали с 2 мкл 10Х ПЦР-буфера для ДНК-полимеразы Taq (Enzymatics) и воды сверхвысокой чистоты до конечного объема 20 мкл и подвергали процессу повторного отжига для обеспечения образования гетеродуплекса: 95°C в течение 10 мин., линейное снижение температуры с 95°C до 85°C со скоростью 2°C/с, с 85°C до 25°C со скоростью 0,25°C/с и с выдерживанием при 25°C в течение 1 минуты. После повторного отжига продукты обрабатывали нуклеазой SURVEYOR и энхансером S SURVEYOR (Transgenomics), следуя рекомендованному производителем протоколу, и анализировали в 4-20% полиакриламидных гелях Novex ТВЕ (Life Technologies). Гели окрашивали красителем ДНК SYBR Gold (Life Technologies) в течение 30 минут и получали изображение с помощью системы обработки изображений Gel Doc gel imaging system (Bio-rad). Количественный анализ основывался на относительных интенсивностях полос.The genomic region flanking the CRISPR target site of each gene was amplified by PCR (primers are listed in Tables J and K) and the products were purified using a QiaQuick Spin Column (Qiagen) column following the manufacturer's protocol. A total of 400 ng of purified PCR products were mixed with 2 μl of 10X Taq DNA Enzymatics PCR buffer and ultra-high purity water to a final volume of 20 μl and subjected to a re-annealing process to ensure heteroduplex formation: 95 ° C for 10 min., linear decrease in temperature from 95 ° C to 85 ° C at a rate of 2 ° C / s, from 85 ° C to 25 ° C at a speed of 0.25 ° C / s and withstand at 25 ° C for 1 minute . After repeated annealing, the products were treated with SURVEYOR nuclease and S SURVEYOR enhancer (Transgenomics), following the protocol recommended by the manufacturer, and analyzed in 4-20% Novex TBE polyacrylamide gels (Life Technologies). The gels were stained with SYBR Gold DNA stain (Life Technologies) for 30 minutes and the image was obtained using the Gel Doc gel imaging system (Bio-rad) image processing system. Quantitative analysis was based on the relative intensities of the bands.

Анализ экспрессии tracrRNA в клетках человека с помощью нозерн-блоттингаAnalysis of the expression of tracrRNA in human cells using Northern blotting

Анализы нозерн-блоттинга выполняли, как описано ранее 1. Кратко, молекулы РНК нагревали до 95°C в течение 5 мин. перед погружением в 8% денатурирующие полиакриламидные гели (SequaGel, National Diagnostics). После этого РНК переносили на предварительно гибридизированную мембрану Hybond N+ (GE Healthcare) и сшивали с помощью прибора для автоматического сшивания с помощью ультрафиолета Stratagene UV Crosslinker (Stratagene). Зонды метили [гамма-32Р] АТФ (Perkin Elmer) с полинуклеотидкиназой T4 (New England Biolabs). После промывания мембрану экспонировали на люминисцентном экране в течение одного часа и сканировали с использованием устройства для формирования изображения на люминесцентном фосфорном покрытии (Typhoon).Northern blot analyzes were performed as described previously 1. Briefly, RNA molecules were heated to 95 ° C for 5 minutes. before immersion in 8% denaturing polyacrylamide gels (SequaGel, National Diagnostics). After that, the RNA was transferred to a pre-hybridized Hybond N + membrane (GE Healthcare) and crosslinked using a Stratagene UV Crosslinker (Stratagene) automatic crosslinker. The probes were labeled with [gamma-32P] ATP (Perkin Elmer) with T4 polynucleotide kinase (New England Biolabs). After washing, the membrane was exposed on a luminescent screen for one hour and scanned using an image forming apparatus on a phosphor phosphor coating (Typhoon).

Бисульфитное секвенирование для оценки статуса метилирования ДНКBisulfite sequencing to assess DNA methylation status

Клетки HEK 293FT трансфицировали Cas9, как описано выше. Геномную ДНК выделяли с помощью набора DNeasy Blood & Tissue Kit (Qiagen) и подвергали бисульфитной модификации с помощью набора EZ DNA Methylation-Lightning Kit (Zymo Research). Бисульфитную ПЦР проводили с применением ДНК-полимеразы KAPA2G Robust HotStart (KAPA Biosystems) с праймерами, разработанными с применением Bisulfite Primer Seeker (Zymo Research, таблицы J и K). Полученные ПЦР-ампликоны очищали в геле, расщепляли EcoRI и Hindlll и лигировали в остов pUC19 перед трансформацией. Отдельные клоны затем секвенровали по Сэнгеру для оценки статуса метилирования ДНК.HEK 293FT cells were transfected with Cas9 as described above. Genomic DNA was isolated using the DNeasy Blood & Tissue Kit (Qiagen) and subjected to bisulfite modification using the EZ DNA Methylation-Lightning Kit (Zymo Research). Bisulfite PCR was performed using KAPA2G Robust HotStart DNA polymerase (KAPA Biosystems) with primers designed using Bisulfite Primer Seeker (Zymo Research, Tables J and K). The resulting PCR amplicons were gel purified, digested with EcoRI and Hindlll and ligated into the pUC19 backbone before transformation. Individual clones were then sequenced by Sanger to assess the status of DNA methylation.

In vitro транскрипция и анализ расщепленияIn vitro transcription and digestion assay

Клетки HEK 293FT трансфицировали Cas9, как описано выше. Цельноклеточные лизаты затем получали с применением лизирующего буфера (20 мМ HEPES, 100 мМ KCl, 5 мМ MgCl2, 1 мМ DTT, 5% глицерина, 0,1% Triton Х-100) с добавлением смеси ингибиторов протеаз (Roche). Управляемые T7 sgRNA транскрибировали in vitro с применением специальных олигонуклеотидов (пример 10) и набора для транскрипции in vitro HiScribe T7 (NEB), следуя рекомендованному производителем протоколу. Для получения метилированных целевых сайтов плазмиду pUC19 метилировали с помощью M.SssI и затем проводили линеаризацию с помощью NheI. Анализ расщепления in vitro выполняли следующим образом: для реакции расщепления 20 мкл 10 мкл клеточного лизата инкубировали с 2 мкл буфера для расщепления (100 мМ HEPES, 500 мМ KCl, 25 мМ MgCl2, 5 мМ DTT, 25% глицерина), транскрибированной in vitro РНК и 300 нг ДНК плазмиды pUC 19.HEK 293FT cells were transfected with Cas9 as described above. Whole-cell lysates were then prepared using lysis buffer (20 mM HEPES, 100 mM KCl, 5 mM MgCl2, 1 mM DTT, 5% glycerol, 0.1% Triton X-100) with the addition of a mixture of protease inhibitors (Roche). Controlled T7 sgRNAs were transcribed in vitro using special oligonucleotides (Example 10) and the in vitro HiScribe T7 transcription kit (NEB) following the manufacturer's recommended protocol. To obtain methylated target sites, the pUC19 plasmid was methylated using M.SssI and then linearized using NheI. The in vitro digestion assay was performed as follows: for the digestion reaction, 20 μl of 10 μl cell lysate was incubated with 2 μl of digestion buffer (100 mM HEPES, 500 mM KCl, 25 mM MgCl2, 5 mM DTT, 25% glycerol), transcribed in vitro RNA and 300 ng DNA of plasmid pUC 19.

Глубокое секвенирование для оценки специфичности целенаправленного воздействияDeep sequencing to assess the specificity of targeted exposure

Клетки HEK 293FT, которые высевали в 96-луночные планшеты, трансфицировали ПЦР кассетой с плазмидной ДНК Cas9 и одиночной направляющей РНК (sgRNA) за 72 часа до экстракции геномной ДНК (фиг. 72). Геномный участок, фланкирующий целевой сайт CRISPR каждого гена, амплифицировали (фиг. 74, фиг. 80, (пример 10)) с помощью метода ПЦР с перекрывающимися праймерами для присоединения адаптеров Illumina Р5, а также уникальных специфичных для каждого образца штрихкодов к целевым ампликонам (схематическое изображение, описанное на фиг. 73). ПЦР-продукты очищали с применением 96-луночных планшетов для фильтрования EconoSpin (Epoch Life Sciences), следуя рекомендованному производителем протоколу.HEK 293FT cells, which were seeded in 96-well plates, were transfected with a PCR cassette with Cas9 plasmid DNA and single RNA guide (sgRNA) 72 hours before genomic DNA extraction (Fig. 72). The genomic region flanking the CRISPR target site of each gene was amplified (Fig. 74, Fig. 80, (Example 10)) using the PCR method with overlapping primers for attaching Illumina P5 adapters, as well as unique barcodes specific for each sample to the target amplicons ( the schematic depiction described in Fig. 73). PCR products were purified using 96-well EconoSpin filter plates (Epoch Life Sciences) following the manufacturer's recommended protocol.

Очищенные образцы ДНК со штрих-кодами количественно определяли с помощью набора для анализа Quant-iT PicoGreen dsDNA или Qubit 2.0 Fluorometer (Life Technologies) и объединяли в эквимолярном соотношении. С библиотеками секвенирования затем проводили глубокое секвенирование с использованием секвенсера Illumina MiSeq Personal Sequencer (Life Technologies).Purified barcode DNA samples were quantified using the Quant-iT PicoGreen dsDNA or Qubit 2.0 Fluorometer assay kit (Life Technologies) and pooled in an equimolar ratio. The sequencing libraries were then deep sequenced using an Illumina MiSeq Personal Sequencer (Life Technologies) sequencer.

Анализ данных секвенирования и обнаружение вставок/делецийAnalysis of sequencing data and detection of inserts / deletions

Считываемые фрагменты MiSeq фильтровали с требуемым средним качеством Phred (оценка Q), по меньшей мере 23, а также полными соответствиями последовательностей к штрихкодам и прямым праймерам ампликона. Считываемые фрагменты из целевых и нецелевых локусов анализировали сначала с помощью выполнения выравниваний Смита-Ватермана против последовательностей ампликонов, которые включали 50 нуклеотидов выше и ниже целевого сайта (в общей сложности 120 п.о.). При этом выравнивания анализировали по вставкам/делециям от 5 нуклеотидов выше до 5 нуклеотидов ниже целевого сайта (в общей сложности 30 п.о.). Анализированные целевые участки исключали, если часть их выравнивания выходила за пределы самого считываемого фрагмента MiSeq или если совпавшие пары оснований содержали меньше 85% их общей длины.The read MiSeq fragments were filtered with the required average quality Phred (Q score) of at least 23, as well as full sequence matches to barcodes and direct amplicon primers. The read fragments from the target and non-target loci were analyzed first by performing Smith-Waterman alignments against amplicon sequences that included 50 nucleotides above and below the target site (a total of 120 bp). Alignments were analyzed by inserts / deletions from 5 nucleotides above to 5 nucleotides below the target site (a total of 30 bp). The analyzed target areas were excluded if part of their alignment went beyond the limits of the MiSeq readable fragment itself or if matching base pairs contained less than 85% of their total length.

Отрицательные контроли для каждого образца представляли эталон включения или исключения вставок/делеций как предполагаемых событий разрезания. Для каждого образца вставку/делецию учитывали, только если ее показатель качества превышал μ-σ, где μ представляло собой средний показатель качества отрицательного контроля, соответствующего образцу, и σ представляло собой его среднеквадратическое отклонение. Это дало соотношения всех вставок/делеций целевых участков, как для отрицательных контролей, так и их соответствующих образцов. С применением соотношений ошибок отрицательного контроля на-целевой-участок-на-считываемый фрагмент, q, наблюдаемое количество вставок/делеций образцов n и его количество считываемых фрагментов R, оценку максимального правдоподобия для фракции считываемых фрагментов, содержащих целевые участки с верными вставками/делециями, p, выявляли с помощью применения бионормальной модели ошибок, указанной ниже.The negative controls for each sample represented the standard for the inclusion or exclusion of insertions / deletions as expected cutting events. For each sample, insertion / deletion was taken into account only if its quality score exceeded μ-σ, where μ was the average quality score of the negative control corresponding to the sample, and σ was its standard deviation. This gave the ratio of all insertions / deletions of the target sites, both for negative controls and their corresponding samples. Using the error ratios of the negative control on the target-site-to-readable fragment, q, the observed number of insertions / deletions of samples n and its number of readable fragments R, the maximum likelihood estimate for the fraction of readable fragments containing target areas with correct insertions / deletions, p, was detected using the bionormal error model indicated below.

Допустив, что (неизвестное) количество считываемых фрагментов в образце, содержащих целевые участки, неправильно подсчитанные как такие, которые имеют по меньшей мере 1 вставку/делецию, равно E, можно написать (без внесения каких-либо предположений о количестве верных вставок/делеций)Assuming that the (unknown) number of read fragments in the sample containing the target areas incorrectly calculated as those that have at least 1 insert / deletion is equal to E, we can write (without making any assumptions about the number of correct inserts / deletions)

Figure 00000110
Figure 00000110

поскольку R(1-p) представляет собой количество считываемых фрагментов, содержащих целевые участки без верных вставок/делеций. При этом, поскольку количество считываемых фрагментов, наблюдаемых, как такие, которые содержат вставки/делеции, равно n, n=E+Rp, другими словами, количество считываемых фрагментов, содержащих целевые участки с ошибками, но без верных вставок/делеций, плюс количество считываемых фрагментов, чьи целевые участки содержат правильные вставки/делеции. Можно переписать указанное выше:because R (1-p) represents the number of read fragments containing the target areas without the correct insertions / deletions. Moreover, since the number of readable fragments observed, such as those that contain insertions / deletions, is n, n = E + Rp, in other words, the number of readable fragments containing target sections with errors, but without correct insertions / deletions, plus readable fragments whose target sections contain the correct insertion / deletion. You can rewrite the above:

Figure 00000111
Figure 00000111

Принимая, что все значения частоты целевых участков с верными вставками/делециями p априори являются равновероятными, Prob(n|p)∝Prob(p|n). Оценка максимального правдоподобия (MLE) частоты целевых участков с верными вставками/делециями, таким образом, устанавливали как величину p, которая максимизировала Prob(n|p) Это оценивали в числовом отношении.Assuming that all frequency values of the target sites with the correct insertions / deletions p are a priori equally probable, Prob (n | p) ∝Prob (p | n). The maximum likelihood score (MLE) of the frequency of the target sites with the correct insertions / deletions was thus set as the value of p, which maximized Prob (n | p). This was estimated numerically.

Для размещения границ ошибки относительно частот фрагментов считывания с верными вставками/делециями в их библиотеках секвенирования для каждого образца рассчитывали доверительные интервалы Вильсона (2), предоставляющие MLE-оценку целевых участков с верными вставками/делециями, Rp, и количество считываемых фрагментов R. Конкретно, нижнюю границу

Figure 00000112
и верхнюю границуu рассчитывали какTo place error boundaries relative to the frequencies of reading fragments with correct inserts / deletions in their sequencing libraries, Wilson confidence intervals (2) were calculated for each sample, providing an MLE estimate of the target areas with correct inserts / deletions, Rp, and the number of read fragments R. Specifically, lower bound
Figure 00000112
and the upper boundary u was calculated as

Figure 00000113
Figure 00000113

Figure 00000114
Figure 00000114

где z, стандартный показатель достоверности, требуемый для нормального распределения дисперсии 1, устанавливали на 1,96, что означало достоверность 95%. Максимальные верхние границы и минимальные нижние границы для каждой биологической повторности перечислены на фигурах 80-83.where z, the standard confidence indicator required for the normal distribution of variance 1, was set to 1.96, which meant a confidence of 95%. The maximum upper bounds and minimum lower bounds for each biological repetition are listed in figures 80-83.

Анализ qRT-PCR относительной экспрессии Cas9 и sgRNAQRT-PCR analysis of relative expression of Cas9 and sgRNA

Клетки 293FT, высеянные в 24-луночные планшеты, трансфицировали, как описано выше. Через 72 часа после трансфекции общую РНК собирали с помощью набора miRNeasy Micro Kit (Qiagen). Синтез минус-нити sgRNA выполняли с помощью набора qScript Flex cDNA kit (VWR) и специальных праймеров для синтеза первой нити (таблицы J и K). Анализ количественной ПЦР выполняли с использованием Fast SYBR Green Master Mix (Life Technologies) и специальных праймеров (таблицы J и K) с применением GAPDH в качестве эндогенного контроля. Относительный количественный анализ производили с помощью способа ΔΔCT.293FT cells seeded in 24-well plates were transfected as described above. 72 hours after transfection, total RNA was collected using the miRNeasy Micro Kit (Qiagen). The sgRNA negative strand was synthesized using the qScript Flex cDNA kit (VWR) and special primers for the synthesis of the first strand (Tables J and K). Quantitative PCR analysis was performed using Fast SYBR Green Master Mix (Life Technologies) and special primers (Tables J and K) using GAPDH as an endogenous control. Relative quantitative analysis was performed using the ΔΔCT method.

Figure 00000115
Figure 00000115

Figure 00000116
Figure 00000116

Figure 00000117
Figure 00000117

Анализ qRT-PCR экспрессии Cas9 и sgRNAAnalysis of qRT-PCR expression of Cas9 and sgRNA

Figure 00000118
Figure 00000118

Бисульфитная ПЦР и секвенированиеBisulfite PCR and sequencing

Figure 00000119
Figure 00000119

Figure 00000120
Figure 00000120

Figure 00000121
Figure 00000121

Figure 00000122
Figure 00000122

Figure 00000123
Figure 00000123

Пример 10: дополнительные последовательностиExample 10: additional sequences

Все последовательности представлены в направлении от 5' к 3'. Для транскрипции U6 черта подчеркнутого целевого сайта (Ts) выступает как терминатор транскрипции. U6 с короткой tracrRNA (Streptococcus pyogenes SF370):All sequences are presented in the direction from 5 'to 3'. For transcription of U6, the trait of the underlined target site (Ts) acts as a transcription terminator. U6 with short tracrRNA (Streptococcus pyogenes SF370):

Figure 00000124
Figure 00000124

(последовательность tracrRNA представлена жирным шрифтом)(the tracrRNA sequence is shown in bold)

> U6-DR-направляющая последовательность-DR (SF370 Streptococcus pyogenes)> U6-DR guide sequence-DR (SF370 Streptococcus pyogenes)

Figure 00000125
Figure 00000125

(прямой повтор последовательности выделен серым, а направляющая последовательность N представлена жирным шрифтом)(a direct repeat of the sequence is highlighted in gray, and the guide sequence N is shown in bold)

> sgRNA, содержащая +48 tracrRNA (SF370 Streptococcus pyogenes)> sgRNA containing +48 tracrRNA (SF370 Streptococcus pyogenes)

Figure 00000126
Figure 00000126

(направляющая последовательность представлена жирным шрифтом N, и фрагмент tracrRNA представлен жирным шрифтом)(the guide sequence is in bold N, and the tracrRNA fragment is in bold)

> sgRNA, содержащая +54 tracrRNA (SF370 Streptococcus pyogenes)> sgRNA containing +54 tracrRNA (SF370 Streptococcus pyogenes)

Figure 00000127
Figure 00000127

(направляющая последовательность представлена жирным шрифтом N, и фрагмент tracrRNA представлен жирным шрифтом)(the guide sequence is in bold N, and the tracrRNA fragment is in bold)

> sgRNA, содержащая +67 tracrRNA (SF370 Streptococcus pyogenes)> sgRNA containing +67 tracrRNA (SF370 Streptococcus pyogenes)

Figure 00000128
Figure 00000128

(направляющая последовательность представлена жирным шрифтом N, и фрагмент tracrRNA представлен жирным шрифтом)(the guide sequence is in bold N, and the tracrRNA fragment is in bold)

> sgRNA, содержащая +85 tracrRNA (SF370 Streptococcus pyogenes)> sgRNA containing +85 tracrRNA (SF370 Streptococcus pyogenes)

Figure 00000129
Figure 00000129

(направляющая последовательность представлена жирным шрифтом N, и фрагмент tracrRNA представлен жирным шрифтом)(the guide sequence is in bold N, and the tracrRNA fragment is in bold)

> CBh-NLS-SpCas9-NLS> CBh-NLS-SpCas9-NLS

Figure 00000130
Figure 00000130

Figure 00000131
Figure 00000131

Figure 00000132
Figure 00000132

Figure 00000133
Figure 00000133

(NLS-hSpCas9-NLS выделена жирным шрифтом)(NLS-hSpCas9-NLS in bold)

> Ампликон секвенирования для гидов EMX1 1.1, 1-14, 1.17> Sequencing amplicon for EMX1 1.1, 1-14, 1.17 guides

Figure 00000134
Figure 00000134

> Ампликон секвенирования для гидов EMX1 1.2, 1.16> Sequencing amplicon for EMX1 1.2, 1.16 guides

Figure 00000135
Figure 00000135

> Ампликон секвенирования для гидов EMX1 1.3, 1.13, 1.15> Sequencing amplicon for EMX1 1.3, 1.13, 1.15 guides

Figure 00000136
Figure 00000136

> Ампликон секвенирования для гидов EMX1 1.6> Sequencing amplicon for EMX1 1.6 guides

Figure 00000137
Figure 00000137

> Ампликон секвенирования для гидов EMX1 1.10> Sequencing amplicon for EMX1 1.10 guides

Figure 00000138
Figure 00000138

> Ампликон секвенирования для гидов EMX1 1.11, 1.12> Sequencing amplicon for EMX1 guides 1.11, 1.12

Figure 00000139
Figure 00000139

> Ампликон секвенирования для гидов EMX1 1.18, 1.19> Sequencing amplicon for EMX1 1.18, 1.19 guides

Figure 00000140
Figure 00000140

Figure 00000141
Figure 00000141

> Ампликон секвенирования для гидов EMX1 1.20> Sequencing amplicon for EMX1 1.20 guides

Figure 00000142
Figure 00000142

> Промотор T7 праймера F для отжига с целевой нитью> T7 promoter primer F for annealing with the target thread

Figure 00000143
Figure 00000143

> Олигонуклеотид, содержащий целевой сайт 1 pUC19 для метилирования (обратный T7)> Oligonucleotide containing target site 1 pUC19 for methylation (reverse T7)

Figure 00000144
Figure 00000144

> Олигонуклеотид, содержащий целевой сайт 2 pUC19 для метилирования (обратный T7)> Oligonucleotide containing pUC19 methylation target site 2 (reverse T7)

Figure 00000145
Figure 00000145

Пример 11: опосредованная олигонуклеотидами Са89-индуцированная гомологичная рекомбинацияExample 11 oligonucleotide-mediated Ca89-induced homologous recombination

Тест олигонуклеотидной гомологичной рекомбинации представляет собой сравнение эффективности всех различных вариантов Cas9 и различных матриц HR (олигонуклеотид по сравнению с плазмидой).The oligonucleotide homologous recombination test is a comparison of the efficacy of all different Cas9 variants and different HR matrices (oligonucleotide compared to plasmid).

Использовали клетки 293FT. SpCas9 = Cas9 дикого типа и SpCas9n = никаза Cas9 (D10A). Мишень химерной РНК представляет собой такую же протоспейсер-мишень 1 EMX1, как в примерах 5, 9 и 10, и олигонуклеотиды синтезированы с помощью IDT с применением очистки PAGE.Used 293FT cells. SpCas9 = Cas9 wild-type and SpCas9n = Nicase Cas9 (D10A). The chimeric RNA target is the same EMX1 protospacer target 1 as in Examples 5, 9 and 10, and the oligonucleotides were synthesized using IDT using PAGE purification.

На фигуре 44 изображена структура олигонуклеотидной ДНК, использованной как матрица гомологичной рекомбинации (HR) в этом эксперименте. Длинные олигонуклеотиды содержат гомологичность 100 п.о. к локусу EMX1 и сайт рестрикции HindIII. Клетки 293FT котрансфицировали: во-первых, плазмидой, содержащей целевой локус EMX1 человека, химерную РНК и белок cas9 дикого типа, и, во-вторых, олигонуклеотидной ДНК в качестве матрицы HR. Образцы получены из клеток 293FT, собранных через 96 часов после трансфекции Lipofectamine 2000. Все продукты амплифицировали с праймером EMX1 HR Primer, очищали на геле с последующим расщеплением HindIII для выявления эффективности интеграции матрицы HR в геном человека.Figure 44 shows the structure of the oligonucleotide DNA used as a homologous recombination (HR) matrix in this experiment. Long oligonucleotides contain a homology of 100 bp to the EMX1 locus and the HindIII restriction site. 293FT cells were co-transfected: first, with a plasmid containing the target human EMX1 locus, chimeric RNA and wild-type cas9 protein, and secondly, oligonucleotide DNA as an HR template. Samples were obtained from 293FT cells collected 96 hours after transfection with Lipofectamine 2000. All products were amplified with EMX1 HR Primer, gel purified, followed by HindIII digestion to determine the effectiveness of integrating the HR matrix into the human genome.

На фигурах 45 и 46 изображено сравнение эффективности HR, индуцированной с помощью разных комбинаций белка Cas9 и матрицы HR. Использованной конструкцией Cas9 были или Cas9 дикого типа, или вариант никазы Cas9 (Cas9n). Использованной матрицей HR были: антисмысловая олигонуклеотидная ДНК (антисмысловой олигонуклеотид на фигуре выше), или смысловая олигонуклеотидная ДНК (смысловой олигонуклеотид на фигуре выше), или матрица HR плазмиды (матрица HR на фигуре выше). Определение "смысловая/антисмысловая" означает, что активно транскрибируемая нить с последовательностью, соответствующей транскрибированной мРНК, определяется как смысловая нить в геноме. Эффективность HR показана как процентная доля группы расщепления HindIII от всего амплифицированного с помощью ПЦР продукта генома (числа внизу).Figures 45 and 46 show a comparison of HR efficacy induced using different combinations of Cas9 protein and HR matrix. The Cas9 construct used was either wild-type Cas9, or the Cas9 nickase variant (Cas9n). The HR matrices used were: antisense oligonucleotide DNA (antisense oligonucleotide in the figure above), or sense oligonucleotide DNA (sense oligonucleotide in the figure above), or the plasmid HR matrix (HR matrix in the figure above). The term “sense / antisense” means that an actively transcribed strand with a sequence corresponding to a transcribed mRNA is defined as a semantic strand in the genome. HR efficacy is shown as a percentage of the HindIII cleavage group of the total genome product amplified by PCR (numbers below).

Пример 12: мышь-аутистExample 12: an autistic mouse

Недавние широкомасштабные проекты по секвенированию представили большое количество генов, ассоциированных с заболеваниями. Выявление генов является только началом понимания, что делает ген и как это приводит к фенотипу заболеваний. Существующие технологии и подходы для изучения генов-кандидатов медленные и трудоемкие. Золотые стандарты, целенаправленное воздействие на ген и генные нокауты, требуют значительных инвестиций времени и ресурсов, как денежных, так и относительно исследовательского персонала. Заявители поставили задачу использовать нуклеазу hSpCas9 для целенаправленного воздействия на многие гены и сделать это с более высокой эффективностью и более низкой оборотностью по сравнению с любой другой технологией. По причине высокой эффективности hSpCas9 заявители могут производить инъекцию РНК в зиготы мышей и сразу же получать животных с модифицированным геномом без потребности в производстве каких-либо предварительных генов, целенаправленно воздействующих в mESC.Recent large-scale sequencing projects have introduced a large number of genes associated with diseases. Identifying genes is only the beginning of understanding what the gene does and how it leads to the phenotype of disease. Existing technologies and approaches for studying candidate genes are slow and time-consuming. Gold standards, targeted effects on the gene and gene knockouts, require a significant investment of time and resources, both monetary and relative to research personnel. Applicants have set the task of using hSpCas9 nuclease for targeted action on many genes and to do this with higher efficiency and lower turnover compared to any other technology. Due to the high efficiency of hSpCas9, applicants can inject RNA into mouse zygotes and immediately receive animals with a modified genome without the need to produce any preliminary genes that target mESC.

Ген хромодомен хеликазы ДНК-связывающего белка 8 (CHD8) является важнейшим геном, вовлеченным в раннее развитие позвоночных и морфогенез. Мыши без CHD8 умирают в ходе эмбрионального развития. Мутации в CHD8 ассоциировали с расстройством аутического спектра у людей. Эту ассоциацию проводили в трех разных статьях, опубликованных одновременно в Nature. В тех же трех исследованиях идентифицировали множество генов, ассоциированных с расстройством аутического спектра. Целью заявителей было создание нокаутных мышей по четырем генам, которые были обнаружены во всех статьях, Chd8, Katna12, Kctd13 и Scn2a. К тому же заявители выбрали два других гена, ассоциированных с расстройством аутического спектра, шизофренией и ADHD, GIT1, CACNA1C и CACNB2. И наконец, в качестве положительного контроля заявители решили задать MeCP2.The hemodase chromodomain gene of DNA-binding protein 8 (CHD8) is the most important gene involved in the early development of vertebrates and morphogenesis. Mice without CHD8 die during embryonic development. Mutations in CHD8 have been associated with autism spectrum disorder in humans. This association was carried out in three different articles published simultaneously in Nature. In the same three studies, many genes associated with autism spectrum disorder were identified. The applicants' goal was to create knockout mice on four genes that were found in all articles, Chd8, Katna12, Kctd13 and Scn2a. In addition, applicants selected two other genes associated with autism spectrum disorder, schizophrenia and ADHD, GIT1, CACNA1C and CACNB2. Finally, the applicants decided to set MeCP2 as a positive control.

Для каждого гена заявители разрабатывали три gRNA, которые, вероятно, нокаутировали бы гены. Нокаутирование происходило бы после того, как нуклеаза hSpCas9 произведет двухцепочечный разрыв, и подверженный ошибкам путь репарации ДНК, негомологичное соединение концов, устранит разрыв, создавая мутацию. Наиболее вероятным результатом является мутация со сдвигом рамки считывания, которая произвела бы нокаут гена. Стратегия целенаправленного воздействия включала нахождение протоспейсеров в экзонах гена, содержащего последовательность PAM, NGG, являющегося уникальным в геноме. Предпочтение отдавали протоспейсерам в первом экзоне, которые были бы наиболее разрушительными для гена.For each gene, applicants have developed three gRNAs that are likely to knock out the genes. Knocking out would occur after the hSpCas9 nuclease has double-stranded, and the error-prone DNA repair path, a non-homologous junction of the ends, clears the gap, creating a mutation. The most likely result is a frameshift mutation that would produce a gene knockout. The targeted exposure strategy included the presence of protospacer in the exons of a gene containing the PAM, NGG sequence, which is unique in the genome. Preference was given to protospacer in the first exon, which would be most damaging to the gene.

Каждую gRNA оценивали в клеточной линии мыши, Neuro-N2a, с помощью липосомальной неустойчивой котрансфекции hSpCas9. Через 72 часа после трансфекции геномную ДНК очищали с применением QuickExtract DNA от Epicentre. ПЦР выполняли для амплификации локуса, представляющего интерес. Затем следовало использование набора для обнаружения мутаций SURVEYOR от Transgenomics. Результаты анализа с помощью SURVEYOR для каждой gRNA и соответствующие контроли показаны на фигуре A1. Положительный результат анализа с помощью SURVEYOR представляет собой одну большую полосу, соответствующую геномной ПЦР, и две полосы поменьше, которые являются продуктами нуклеазы SURVEYOR, производящей двухцепочечный разрыв в сайте мутации. Среднюю эффективность разрезания каждой gRNA также определяли для каждой gRNA. gRNA, которую выбирали для инъекции, представляла собой gRNA наивысшей эффективности, которая была наиболее уникальной в геноме.Each gRNA was evaluated in a mouse cell line, Neuro-N2a, using liposomal unstable cotransfection of hSpCas9. 72 hours after transfection, genomic DNA was purified using Epicentre QuickExtract DNA. PCR was performed to amplify the locus of interest. This was followed by the use of the Transgenomics SURVEYOR mutation detection kit. SURVEYOR analysis results for each gRNA and corresponding controls are shown in Figure A1. A positive analysis result using SURVEYOR represents one large band corresponding to genomic PCR and two smaller bands, which are products of SURVEYOR nuclease, which produces a double-stranded break at the mutation site. The average cutting efficiency of each gRNA was also determined for each gRNA. The gRNA that was chosen for injection was the highest-performing gRNA that was most unique in the genome.

РНК (hSpCas9 + gRNA РНК) инъецировали в пронуклеус зиготы и позже пересаживали приемной матери. Матерей позволяли проходить полный срок беременности, а у детенышей отбирали пробы путем надреза хвоста через 10 дней после рождения. ДНК выделяли и использовали как матрицу для ПЦР, которую затем подвергали процессингу с помощью SURVEYOR. Кроме того, ПЦР-продукты отправляли на секвенирование. ПЦР-продукты генома животных, которых определяли как положительные либо при анализе с помощью SURVEYOR, либо при ПЦР секвенировании, клонировали в вектор pUC19 и секвенировали для определения предполагаемых мутаций каждого аллеля.RNA (hSpCas9 + gRNA RNA) was injected into the zygote pronucleus and later transplanted to the adoptive mother. Mothers were allowed to undergo a full gestation period, and samples were taken from the calves by notching the tail 10 days after birth. DNA was isolated and used as a template for PCR, which was then processed using SURVEYOR. In addition, PCR products were sent for sequencing. The PCR products of the animal genome, which were determined as positive either by SURVEYOR analysis or by PCR sequencing, were cloned into pUC19 vector and sequenced to determine putative mutations of each allele.

На сегодняшний день детенышей мышей из эксперимента целенаправленного воздействия Chd8 полностью подвергали обработке, до самого секвенирования аллеля. Результаты анализа с помощью Surveyor для 38 живых детенышей (дорожки 1-38), 1 мертвого детеныша (дорожка 39) и 1 детеныша дикого типа для сравнения (дорожка 40) показаны на фигуре A2. Детенышам 1-19 инъецировали gRNA Chd8.2, а детенышам 20-38 инъецировали gRNA СМ8.3. Из 38 живых детенышей 13 были положительными по мутации. У одного мертвого детеныша также была мутация. В образце дикого типа не было обнаружено мутации. ПЦР секвенирование генома соответствовало данным анализа с помощью SURVEYOR.To date, pups of mice from the experiment of targeted exposure to Chd8 were completely subjected to treatment, prior to allele sequencing. Surveyor analysis results for 38 live calves (lanes 1-38), 1 dead calf (lane 39) and 1 wild-type calf for comparison (lane 40) are shown in Figure A2. Cubs 1-19 were injected with Chd8.2 gRNA, and cubs 20-38 were injected with CM8.3 gRNA. Of the 38 live pups, 13 were positive for mutation. One dead calf also had a mutation. No mutation was detected in the wild-type sample. PCR genome sequencing was consistent with analysis using SURVEYOR.

Пример 13: опосредованная CRISPR/Cas модуляция транскрипцииExample 13: CRISPR / Cas-mediated Transcription Modulation

На фигуре 67 изображена структура CRISPR-TF (транскрипционного фактора), обладающего функцией активации транскрипции. Химерная РНК экспрессируется с помощью промотора U6, а кодон-оптимизированный для человека вариант двойного мутанта белка Cas9 (hSpCas9m), функционально связанного с трехкомпонентной NLS и функциональным доменом VP64, экспрессируется с помощью промотора EF1a. Двойные мутации, D10A и Н840А, делают белок Cas9 неспособным вносить какое-либо расщепление, но поддерживают его способность связываться с целевой ДНК при направлении химерной РНК.The figure 67 shows the structure of CRISPR-TF (transcription factor), with the function of activation of transcription. Chimeric RNA is expressed using the U6 promoter, and the codon-optimized variant of the Cas9 double mutant protein (hSpCas9m), functionally linked to the three-component NLS and VP64 functional domain, is expressed using the EF1a promoter. The double mutations, D10A and H840A, make the Cas9 protein incapable of introducing any cleavage, but support its ability to bind to the target DNA in the direction of chimeric RNA.

На фигуре 68 изображена активация транскрипции гена SOX2 человека с помощью системы CRISPR-TF (химерная РНК и слитый белок Cas9-NLS-VP64). Клетки 293FT трансфицировали плазмидами, несущей два компонента: (1) управляемые U6 различные химерные РНК, целенаправленно воздействующие на последовательности из 20 п.о. в локусе генома человека SOX2 или рядом с ним, и (2) управляемый EF1 hSpCas9m (двойной мутант)-слитый белок NLS-VP64. Через 96 часа после трансфекции клетки 293FT собирали и измеряли уровень активации посредством индукции экспрессии мРНК с применением анализа qRT-PCR. Все уровни экспрессии нормированы по сравнению с контрольной группой (серый столбец), представляющей результаты клеток, трансфицированных плазмидой с остовом CRISPR-TF без химерной РНК. Зонды qRT-PCR использовали для выявления мРНК SOX2 при анализе экспрессии генов Taqman Human (Life Technologies). Представлены данные всех экспериментов 3 биологических повторностей, n=3, планки погрешностей показывают стандартную ошибку среднего.Figure 68 shows the activation of transcription of the human SOX2 gene using the CRISPR-TF system (chimeric RNA and Cas9-NLS-VP64 fusion protein). 293FT cells were transfected with plasmids carrying two components: (1) U6-driven different chimeric RNAs that specifically target 20 bp sequences. at or near the locus of the human genome SOX2, and (2) EF1-driven hSpCas9m (double mutant) fusion protein NLS-VP64. 96 hours after transfection, 293FT cells were harvested and the level of activation was measured by induction of mRNA expression using qRT-PCR analysis. All expression levels are normalized compared to the control group (gray column), which represents the results of cells transfected with a CRISPR-TF plasmid without chimeric RNA. QRT-PCR probes were used to detect SOX2 mRNA in the analysis of Taqman Human gene expression (Life Technologies). The data of all experiments of 3 biological replicates, n = 3, are presented; error bars show the standard error of the mean.

Пример 14: NLS: Cas9-NLSExample 14: NLS: Cas9-NLS

Клетки 293FT трансфицировали плазмидой, содержащей два компонента: (1) промотор EF1, управляющий экспрессией Cas9 (Sp Cas9 дикого типа, кодон-оптимизированный для человека) с различными структурами NLS, (2) промотор U6, управляющий тем же локусом EMX1 человека, подвергающимся целенаправленному воздействию химерной РНК.293FT cells were transfected with a plasmid containing two components: (1) the EF1 promoter driving the expression of Cas9 (wild-type Sp Cas9, codon-optimized for humans) with different NLS structures, (2) the U6 promoter driving the same human EMX1 locus undergoing targeted exposure to chimeric RNA.

Клетки собирали в момент времени 72 часа после трансфекции и затем экстрагировали 50 мкл раствора для экстракции геномной ДНК QuickExtract, следуя протоколу производителя. Целевую геномную ДНК EMX1 амплифицировали с помощью ПЦР и затем очищали в геле с 1% агарозного геля. Геномный ПЦР-продукт вторично отжигали и подвергали анализу с помощью SURVEYOR, следуя протоколу производителя. Эффективность расщепления различных конструкций генома измеряли с применением SDS-PAGE в 4-12% геле TBE-PAGE (Life Technologies), анализировали и количественно определяли с использованием программного обеспечения ImageLab (Bio-rad), следуя протоколу производителя.Cells were harvested at 72 hours after transfection and then extracted with 50 μl of QuickExtract genomic DNA extraction solution following the manufacturer's protocol. The target genomic DNA EMX1 was amplified by PCR and then gel purified with 1% agarose gel. The genomic PCR product was annealed a second time and analyzed using SURVEYOR following the manufacturer's protocol. The cleavage efficiency of various genome constructs was measured using SDS-PAGE in a 4-12% TBE-PAGE gel (Life Technologies), analyzed and quantified using ImageLab software (Bio-rad), following the manufacturer's protocol.

На фигуре 69 изображена структура различных конструкций Cas9-NLS. Все Cas9 представляли собой кодон-оптимизированный для человека вариант Sp Cas9. Последовательности NLS связаны с геном cas9 либо на N-конце, либо на С-конце. Все варианты Cas9 с различными структурами NLS клонировали в вектор, содержащий остов, так что он управлялся промотором EF1a. В этом же векторе находилась химерная РНК, целенаправленно воздействующая на локус EMX1 человека, управляемый промотором U6, формирующим вместе с ней двухкомпонентную систему.69 illustrates the structure of various Cas9-NLS designs. All Cas9s were a human codon-optimized version of Sp Cas9. NLS sequences are linked to the cas9 gene at either the N-terminus or the C-terminus. All Cas9 variants with different NLS structures were cloned into a vector containing the backbone, so that it was driven by the EF1a promoter. In the same vector, there was a chimeric RNA that deliberately acts on the human EMX1 locus, driven by the U6 promoter, which forms a two-component system with it.

Figure 00000146
Figure 00000146

На фигуре 70 изображена эффективность геномного расщепления, индуцированного вариантами Cas9, несущими разные структуры NLS. Процентная доля указывает часть геномной ДНК EMX1 человека, которая подвергалась расщеплению каждой конструкцией. Все эксперименты получены из 3 биологических повторностей. n=3, ошибка означает S.E.M.Figure 70 depicts the effectiveness of genomic cleavage induced by Cas9 variants bearing different NLS structures. The percentage indicates the portion of the human genomic EMX1 DNA that was digested by each construct. All experiments were obtained from 3 biological replicates. n = 3, error means S.E.M.

Пример 15: конструирование микроводорослей с использованием Cas9Example 15: Design of Microalgae Using Cas9

Способы доставки Cas9Shipping Methods Cas9

Способ 1: заявители доставляли Cas9 и направляющую РНК с использованием вектора, который экспрессирует Cas9 под контролем конститутивного промотора, такого как промотор Hsp70A-Rbc S2 или бета-2-тубулиновый промотор.Method 1: Applicants delivered Cas9 and an RNA guide using a vector that expresses Cas9 under the control of a constitutive promoter, such as the Hsp70A-Rbc S2 promoter or beta-2-tubulin promoter.

Способ 2: заявители доставляли Cas9 и полимеразу T7 с использованием векторов, которые экспрессируют Cas9 и полимеразу T7 под контролем конститутивного промотора, такого как промотор Hsp70A-Rbc S2 или бета-2-тубулиновый промотор. Направляющая РНК будет доставляться с использованием вектора, содержащего промотор T7, управляющий экспрессией направляющей РНК.Method 2: Applicants delivered Cas9 and T7 polymerase using vectors that express Cas9 and T7 polymerase under the control of a constitutive promoter, such as the Hsp70A-Rbc S2 promoter or beta-2-tubulin promoter. Guide RNA will be delivered using a vector containing the T7 promoter that controls the expression of the guide RNA.

Способ 3: заявители доставляли мРНК Cas9 и in vitro транскрибировали направляющую РНК в клетках водорослей. РНК можно транскрибировать in vitro. мРНК Cas9 будет состоять из кодирующего участка для Cas9, а также 3' UTR из Cop1, чтобы обеспечивать стабилизацию мРНК Cas9.Method 3: Applicants delivered Cas9 mRNA and in vitro transcribed guide RNA in algal cells. RNA can be transcribed in vitro. Cas9 mRNA will consist of a coding region for Cas9, as well as 3 'UTR from Cop1, to provide stabilization of Cas9 mRNA.

Для гомологичной рекомбинации заявители обеспечивали дополнительную матрицу для репарации с участием гомологичной рекомбинации.For homologous recombination, applicants provided an additional repair matrix involving homologous recombination.

Последовательность для кассеты, управляющей экспрессией Cas9 под контролем бета-2-тубулинового промотора, за которой следует 3' UTR Cop1.The sequence for the cassette driving the expression of Cas9 under the control of the beta-2-tubulin promoter, followed by 3 'UTR Cop1.

Figure 00000147
Figure 00000147

Figure 00000148
Figure 00000148

Figure 00000149
Figure 00000149

Последовательность для кассеты, управляющей экспрессией полимеразы T7 под контролем бета-2-тубулинового промотора, за которой следует 3' UTR Cop1:The sequence for the cassette that controls the expression of T7 polymerase under the control of the beta-2-tubulin promoter, followed by 3 'UTR Cop1:

Figure 00000150
Figure 00000150

Figure 00000151
Figure 00000151

Последовательность направляющей РНК, управляемая промотором T7 (промотор T7, N представляют нацеливающую последовательность):The sequence of the RNA guide driven by the T7 promoter (T7 promoter, N represent the targeting sequence):

Figure 00000152
Figure 00000152

Доставка геновGene delivery

Штаммы СС-124 и СС-125 Chlamydomonas reinhardtii из Ресурсного центра Clilamydomonas (Clilamydomonas Resource Center) будут использоваться для электропорации. Протокол электропорации соответствует стандартному рекомендованному протоколу для набора GeneArt Clilamydomonas Engineering kit.The strains SS-124 and SS-125 Chlamydomonas reinhardtii from the Clilamydomonas Resource Center (Clilamydomonas Resource Center) will be used for electroporation. The electroporation protocol follows the standard recommended protocol for the GeneArt Clilamydomonas Engineering kit.

Заявители также получали линию Clilamydomonas reinhardtii, которая экспрессирует Cas9 конститутивно. Это можно выполнить при помощи pChlamyl (линеаризованная с использованием Pvul) и отбора в отношении устойчивых к гигромицину колоний. Последовательность для pChlamyl, содержащая Cas9, приведена ниже. В данном пути для достижения нокаутирования гена необходимо просто доставить РНК для направляющей РНК. Для гомологичной рекомбинации заявители доставляли направляющую РНК, а также линеаризованную матрицу для гомологичной рекомбинации.Applicants also received the Clilamydomonas reinhardtii line, which expresses Cas9 constitutively. This can be accomplished using pChlamyl (linearized using Pvul) and screening for hygromycin-resistant colonies. The sequence for pChlamyl containing Cas9 is shown below. In this way, to achieve gene knockout, you just need to deliver RNA to the RNA guide. For homologous recombination, applicants delivered an RNA guide as well as a linearized matrix for homologous recombination.

pChlamy1-Cas9:pChlamy1-Cas9:

Figure 00000153
Figure 00000153

Figure 00000154
Figure 00000154

Figure 00000155
Figure 00000155

Figure 00000156
Figure 00000156

Figure 00000157
Figure 00000157

Для всех модифицированных клеток Chlamydomonas reinhardtii заявители использовали ПЦР, анализ с помощью нуклеазы SURVEYOR и секвенирование ДНК для подтверждения успешной модификации.For all modified Chlamydomonas reinhardtii cells, the applicants used PCR, SURVEYOR nuclease analysis and DNA sequencing to confirm successful modification.

Пример 16: использование Cas9 как репрессора транскрипции у бактерийExample 16: Use of Cas9 as a Repressor of Transcription in Bacteria

Возможность искусственно контролировать транскрипцию является важной как для изучения функции гена, так и для создания синтетических генных сетей с желаемыми свойствами. Заявители описывают в данном документе использование РНК-направляемого белка Cas9 как программируемого репрессора транскрипции.The ability to artificially control transcription is important both for studying the function of a gene and for creating synthetic gene networks with the desired properties. Applicants describe in this document the use of Cas9 RNA-directed protein as a programmable transcriptional repressor.

Заявители ранее продемонстрировали, как белок Cas9 SF370 Streptococcus pyogenes можно использовать для направленного редактирования генома у Streptococcus pneumoniae. В данном исследовании заявители конструировали штамм crR6Rk, содержащий минимальную систему CRISPR, состоящую из cas9, tracrRNA и повтора. В этом штамме мутации D10A-H840 вводили в cas9 с получением штамма crR6Rk**. Четыре спейсера, целенаправленно воздействующие на различные положения промотора bgaA гена β-галактозидазы, клонировали в массив CRISPR, переносимый ранее описанной плазмидой pDB98. Заявители наблюдали X-Y-кратное снижение активности β-галактозидазы, зависящее от положения целенаправленного воздействия, демонстрирующее потенциал Cas9 как программируемого репрессора (фигура 73).Applicants have previously demonstrated how Cas9 SF370 Streptococcus pyogenes protein can be used for targeted genome editing in Streptococcus pneumoniae. In this study, applicants constructed a crR6Rk strain containing a minimal CRISPR system consisting of cas9, tracrRNA and repeat. In this strain, D10A-H840 mutations were introduced into cas9 to give the crR6Rk ** strain. Four spacers targeting different positions of the bgaA promoter of the β-galactosidase gene were cloned into a CRISPR array transferred by the previously described plasmid pDB98. Applicants observed an X-Y-fold decrease in β-galactosidase activity, depending on the position of the targeted exposure, demonstrating the potential of Cas9 as a programmable repressor (Figure 73).

С целью обеспечения репрессии Cas9** у Escherichia coli конструировали репортерную плазмиду (pDB127) с зеленым флуоресцентным белком (GFP) для экспрессии гена gfpmut2 с конститутивного промотора. Разрабатывали промотор, несущий несколько NPP PAM на обеих нитях, для измерения эффекта Cas9**, связывающегося в разных положениях. Заявители вводили мутации D10A-H840 в pCas9, при этом плазмиду, описанную как несущую tracrRNA, cas9 и минимальный массив CRISPR, разрабатывали для удобного клонирования новых спейсеров. Двадцать два различных спейсера разрабатывали для целенаправленного воздействия на различные участки промотора gfpmut2 и открытой рамки считывания. Приблизительно 20-кратное снижение флюоресценции наблюдали при целенаправленном воздействии на участки, перекрывающиеся или смежные по отношению к -35 и -10 элементам промотора и к последовательности Шайна-Дальгарно. Мишени на обеих нитях показывали подобные уровни репрессии. Эти результаты предполагают, что связывание Cas9** с каким-либо положением участка промотора предотвращает инициацию транскрипции предположительно посредством стерического ингибирования связывания RNAP.In order to ensure repression of Cas9 **, a reporter plasmid (pDB127) with green fluorescent protein (GFP) was constructed for Escherichia coli to express the gfpmut2 gene from the constitutive promoter. A promoter was developed that carried several NPP PAMs on both strands to measure the effect of Cas9 ** binding at different positions. Applicants introduced D10A-H840 mutations into pCas9, with the plasmid described as carrying tracrRNA, cas9 and the minimal CRISPR array designed to conveniently clone new spacers. Twenty-two different spacers were designed to target different regions of the gfpmut2 promoter and the open reading frame. An approximately 20-fold decrease in fluorescence was observed with targeted exposure to areas overlapping or adjacent to the -35 and -10 elements of the promoter and to the Shine-Dalgarno sequence. Targets on both strands showed similar levels of repression. These results suggest that the binding of Cas9 ** to any position of the promoter site prevents the initiation of transcription, presumably through steric inhibition of RNAP binding.

Для определения того, может ли Cas9** предотвращать элонгацию транскрипции, заявители направляли ее к рамке считывания gpfmut2. Снижение флюоресценции наблюдали при целенаправленном воздействии и на кодирующие, и на некодирующие нити, что указывало на то, что связывание Cas9 действительно достаточно сильное, чтобы представлять собой препятствие для прохождения RNAP. Тем не менее, в то время как 40% снижение экспрессии наблюдали, когда кодирующая нить являлась мишенью, 20-кратное снижение наблюдали для некодирующей нити (фиг. 21b, сравнение T9, T10 и T11 с B9, B10 и B11). Для непосредственного определения эффектов связывания Cas9** при транскрипции заявители выделяли РНК из штаммов, несущих либо Т5, Т10, В10, либо контрольную конструкцию, которая не воздействует целенаправленно на pDB127, и подвергали ее нозерн-блоттингу с применением зонда, связывающегося либо до (В477), либо после (В510) целевых сайтов В10 и Т10. В соответствии с флюоресцентными методами заявителей, не было обнаружено транскрипции gfpmut2 при направлении Cas9** к промоторному участку (мишень Т5), и транскрипцию наблюдали после целенаправленного воздействия на участок Т10. Интересно, что меньший транскрипт наблюдали с зондом В477. Эта полоса соответствует ожидаемому размеру транскрипта, который будет прерываться Cas9**, и является непосредственной индикацией терминации транскрипции, вызванной dgRNA::Cas9**, связывающейся с кодирующей нитью. На удивление, заявители не обнаружили транскрипт при целенаправленном воздействии на некодирующую нить (B10). Поскольку связывание Cas9** с участком B1 маловероятно препятствует инициации транскрипции, эти результаты предполагают, что мРНК была разрушена. Было показано, что DgRNA::Cas9 связывает ssPHK in vitro. Заявители предполагают, что связывание может запускать разрушение мРНК нуклеазами хозяина. Действительно, остановка рибосом может индуцировать расщепление на транслированной мРНК у Е. coli.To determine whether Cas9 ** can prevent transcription elongation, applicants sent it to the gpfmut2 reading frame. A decrease in fluorescence was observed with a targeted effect on both coding and non-coding strands, which indicated that Cas9 binding is indeed strong enough to constitute an obstacle to the passage of RNAP. However, while a 40% decrease in expression was observed when the coding strand was the target, a 20-fold decrease was observed for the non-coding strand (Fig. 21b, comparison of T9, T10 and T11 with B9, B10 and B11). To directly determine the effects of Cas9 ** binding upon transcription, the applicants isolated RNA from strains carrying either T5, T10, B10 or a control construct that did not specifically target pDB127, and subjected it to Northern blotting using a probe that binds either before (B477 ), or after (B510) target sites B10 and T10. In accordance with the fluorescence methods of the applicants, no gfpmut2 transcription was detected when Cas9 ** was directed to the promoter site (T5 target), and transcription was observed after targeted exposure to the T10 site. Interestingly, a smaller transcript was observed with the B477 probe. This band corresponds to the expected size of the transcript that Cas9 ** will interrupt, and is a direct indication of the transcription termination caused by dgRNA :: Cas9 **, which binds to the coding strand. Surprisingly, the applicants did not find a transcript when they targeted the non-coding strand (B10). Since the binding of Cas9 ** to B1 is unlikely to inhibit transcription initiation, these results suggest that mRNA was destroyed. DgRNA :: Cas9 has been shown to bind ssRNA in vitro. Applicants suggest that binding may trigger mRNA degradation by host nucleases. Indeed, stopping the ribosomes can induce cleavage on the translated mRNA in E. coli.

Некоторые применения требуют точного регулирования экспрессии генов, а не ее абсолютной репрессии. Заявители стремились к достижению промежуточных уровней репрессии за счет введения несовпадений, которые ослабили бы взаимодействия crRNA/мишень. Заявители создавали серии спейсеров на основе конструкций B1, Т5 и В10 с увеличением количества мутаций на 5'-конце crRNA. До 8 мутаций включительно в B1 и T5 не влияли на уровень репрессии, и прогрессивное повышение флюоресценции наблюдали для дополнительных мутации.Some applications require precise regulation of gene expression, rather than its absolute repression. Applicants sought to achieve intermediate levels of repression by introducing mismatches that would weaken the crRNA / target interactions. Applicants created a series of spacers based on constructs B1, T5 and B10 with an increase in the number of mutations at the 5'-end of crRNA. Up to 8 mutations inclusive in B1 and T5 did not affect the level of repression, and a progressive increase in fluorescence was observed for additional mutations.

Наблюдаемая репрессия с совпадением только 8 нт между crRNA и ее мишенью ставит вопрос эффектов нецелевого воздействия при использовании Cas9** как регулятора транскрипции. Поскольку подходящий PAM (NGG) также требуется для связывания Cas9, количество нуклеотидов в соответствии с получением определенного уровня рестрикции составляет 10. Совпадение в 10 нт встречается случайным образом каждый ~1 м.п.о., и такие сайты, таким образом, вероятно, можно найти даже в небольших бактериальных геномах. Однако для эффективной репрессии транскрипции необходимо, чтоб такие сайты находились в промоторном участке гена, который осуществляет нецелевое воздействие с намного меньшей вероятностью. Заявители также показали, что экспрессия генов может быть нарушена, если некодирующая нить гена подвергается целенаправленному воздействию. Для того, чтобы это произошло, произвольная мишень должна находиться в правильной ориентации, но эти события происходят с относительно большей вероятностью. Фактически, в ходе этого исследования заявители не смогли сконструировать один из разработанных спейсеров в pCas9**. Заявители позже обнаружили этот спейсер, характеризующийся совпадением 12 п.о., рядом с соответствующим PAM в ключевом гене murC. Такого нецелевого воздействия можно легко избежать путем систематического повреждения разработанных спейсеров.The observed repression with only 8 nt coincidence between crRNA and its target raises the question of the effects of inappropriate exposure when using Cas9 ** as a transcriptional regulator. Since a suitable PAM (NGG) is also required for Cas9 binding, the number of nucleotides in accordance with obtaining a certain level of restriction is 10. A match of 10 nt occurs randomly each ~ 1 bp, and such sites are thus likely can be found even in small bacterial genomes. However, for effective repression of transcription, it is necessary that such sites are located in the promoter region of the gene, which carries out inappropriate effects with a much lesser probability. Applicants have also shown that gene expression may be impaired if the non-coding strand of the gene is targeted. In order for this to happen, an arbitrary target must be in the correct orientation, but these events occur with a relatively greater probability. In fact, during this study, applicants were unable to construct one of the developed spacers in pCas9 **. Applicants later found this spacer, characterized by a 12 bp match, next to the corresponding PAM in the murC key gene. Such inappropriate effects can easily be avoided by systematically damaging the designed spacers.

Аспекты настоящего изобретения дополнительно описаны в следующих пронумерованных параграфах.Aspects of the present invention are further described in the following numbered paragraphs.

1. Векторная система, содержащая один или несколько векторов, где система содержит1. A vector system containing one or more vectors, where the system contains

a. первый регуляторный элемент, функционально связанный с парной traer-последовательностью и одним или несколькими сайтами встраивания для встраивания направляющей последовательности выше парной traer-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной traer-последовательностью, которая гибридизируется с traer-последовательностью; иa. a first regulatory element operably linked to a paired traer sequence and one or more embedding sites for embedding a guiding sequence above a paired traer sequence, where upon expression the guiding sequence controls the sequence-specific binding of the CRISPR complex to the target sequence in a eukaryotic cell, where the CRISPR complex contains CRISPR enzyme complexing with (1) a guide sequence that hybridizes to the target sequence lnostyu, and (2) traer-pair sequence that hybridizes to traer-sequence; and

b. второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации;b. a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising a nuclear localization sequence;

где компоненты (а) и (b) находятся в одном и том же или в различных векторах системы.where components (a) and (b) are in the same or in different vectors of the system.

2. Векторная система по параграфу 1, где компонент (а) дополнительно содержит traer-последовательность ниже парной traer-последовательности под контролем первого регуляторного элемента.2. The vector system according to paragraph 1, where component (a) additionally contains a traer sequence below the paired traer sequence under the control of the first regulatory element.

3. Векторная система по параграфу 1, где компонент (а) дополнительно содержит две или более направляющие последовательности, функционально связанные с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке.3. The vector system according to paragraph 1, where component (a) further comprises two or more guide sequences operably linked to the first regulatory element, where upon expression each of two or more guide sequences controls the sequence-specific binding of the CRISPR complex to its target sequence in eukaryotic cell.

4. Векторная система по параграфу 1, где система содержит traer-последовательность под контролем третьего регуляторного элемента.4. The vector system according to paragraph 1, where the system contains a traer sequence under the control of the third regulatory element.

5. Векторная система по параграфу 1, где traer-последовательность характеризуется по меньшей мере 50% комплементарности последовательности по длине парной traer-последовательности при оптимальном выравнивании.5. The vector system according to paragraph 1, where the traer sequence is characterized by at least 50% complementarity of the sequence along the length of the paired traer sequence with optimal alignment.

6. Векторная система по параграфу 1, где фермент CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки.6. The vector system according to paragraph 1, where the CRISPR enzyme contains one or more nuclear localization sequences that are effective enough to control the accumulation of the specified CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell.

7. Векторная система по параграфу 1, где фермент CRISPR является ферментом системы CRISPR II типа.7. The vector system according to paragraph 1, where the CRISPR enzyme is an enzyme of the type II CRISPR system.

8. Векторная система по параграфу 1, где фермент CRISPR является ферментом Cas9.8. The vector system according to paragraph 1, where the CRISPR enzyme is a Cas9 enzyme.

9. Векторная система по параграфу 1, где фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке.9. The vector system according to paragraph 1, where the CRISPR enzyme is codon-optimized for expression in a eukaryotic cell.

10. Векторная система по параграфу 1, где фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности.10. The vector system according to paragraph 1, where the CRISPR enzyme controls the cleavage of one or two strands at a specific point in the target sequence.

11. Векторная система по параграфу 1, где у фермента CRISPR отсутствует активность для расщепления нитей ДНК.11. The vector system according to paragraph 1, where the CRISPR enzyme lacks activity for cleaving DNA strands.

12. Векторная система по параграфу 1, где первый регуляторный элемент является промотором полимеразы III.12. The vector system according to paragraph 1, where the first regulatory element is a promoter of polymerase III.

13. Векторная система по параграфу 1, где второй регуляторный элемент является промотором полимеразы II.13. The vector system according to paragraph 1, where the second regulatory element is a promoter of polymerase II.

14. Векторная система по параграфу 4, где третий регуляторный элемент является промотором полимеразы III.14. The vector system according to paragraph 4, where the third regulatory element is a promoter of polymerase III.

15. Векторная система по параграфу 1, где направляющая последовательность составляет по меньшей мере 15 нуклеотидов в длину.15. The vector system according to paragraph 1, where the guide sequence is at least 15 nucleotides in length.

16. Векторная система по параграфу 1, где менее 50% нуклеотидов направляющей последовательности участвует в самокомплементарном спаривании оснований при оптимальном сворачивании.16. The vector system according to paragraph 1, where less than 50% of the nucleotides of the guide sequence are involved in self-complementary base pairing with optimal folding.

17. Вектор, содержащий регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей фермент CRISPR, содержащий одну или несколько последовательностей ядерной локализации, где указанный регуляторный элемент управляет транскрипцией фермента CRISPR в эукариотической клетке так, что указанный фермент CRISPR накапливается в обнаруживаемом количестве в ядре эукариотической клетки.17. A vector containing a regulatory element operably linked to an enzyme coding sequence for a CRISPR enzyme containing one or more nuclear localization sequences, wherein said regulatory element controls transcription of the CRISPR enzyme in a eukaryotic cell such that the CRISPR enzyme accumulates in a detectable amount in the nucleus eukaryotic cells.

18. Вектор по параграфу 17, где указанный регуляторный элемент является промотором полимеразы II.18. The vector according to paragraph 17, where the specified regulatory element is a promoter of polymerase II.

19. Вектор по параграфу 17, где указанный фермент CRISPR является ферментом системы CRISPR II типа.19. The vector according to paragraph 17, wherein said CRISPR enzyme is an enzyme of type II CRISPR system.

20. Вектор по параграфу 17, где указанный фермент CRISPR является ферментом Cas9.20. The vector of paragraph 17, wherein said CRISPR enzyme is a Cas9 enzyme.

21. Вектор по параграфу 17, где у указанного фермента CRISPR отсутствует способность расщеплять одну или несколько нитей целевой последовательности, с которой он связывается.21. The vector of paragraph 17, wherein said CRISPR enzyme lacks the ability to cleave one or more strands of the target sequence to which it binds.

22. Фермент CRISPR, содержащий одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки.22. The CRISPR enzyme, containing one or more nuclear localization sequences, sufficiently effective to control the accumulation of the specified CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell.

23. Фермент CRISPR по параграфу 22, где указанный фермент CRISPR является ферментом системы CRISPR II типа.23. The CRISPR enzyme according to paragraph 22, wherein said CRISPR enzyme is an enzyme of the type II CRISPR system.

24. Фермент CRISPR по параграфу 22, где указанный фермент CRISPR является ферментом Cas9.24. The CRISPR enzyme according to paragraph 22, wherein said CRISPR enzyme is a Cas9 enzyme.

25. Фермент CRISPR по параграфу 22, где у указанного фермента CRISPR отсутствует способность расщеплять одну или несколько нитей целевой последовательности, с которой он связывается.25. The CRISPR enzyme according to paragraph 22, wherein said CRISPR enzyme lacks the ability to cleave one or more strands of the target sequence with which it binds.

26. Эукариотическая клетка-хозяин, содержащая26. A eukaryotic host cell containing

a. первый регуляторный элемент, функционально связанный с парной traer-последовательностью и одним или несколькими сайтами встраивания для встраивания направляющей последовательности выше парной traer-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибиридизируется с целевой последовательностью, и (2) парной traer-последовательность, которая гибиридизируется с traer-последовательностью; и/илиa. a first regulatory element operably linked to a paired traer sequence and one or more embedding sites for embedding a guiding sequence above a paired traer sequence, where upon expression the guiding sequence controls the sequence-specific binding of the CRISPR complex to the target sequence in a eukaryotic cell, where the CRISPR complex contains CRISPR enzyme complexing with (1) a guide sequence that hybridizes with the target sequence elnostyu, and (2) traer-pair sequence which gibiridiziruetsya with traer-sequence; and / or

b. второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации.b. a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising a nuclear localization sequence.

27. Эукариотическая клетка-хозяин по параграфу 26, где указанная клетка-хозяин содержит компоненты (а) и (b).27. The eukaryotic host cell according to paragraph 26, wherein said host cell contains components (a) and (b).

28. Эукариотическая клетка-хозяин по параграфу 26, где компонент (а), компонент (b) или компоненты (а) и (b) стабильно интегрируются в геном эукариотической клетки-хозяина.28. The eukaryotic host cell according to paragraph 26, where component (a), component (b), or components (a) and (b) are stably integrated into the genome of the eukaryotic host cell.

29. Эукариотическая клетка-хозяин по параграфу 26, где компонент (а) дополнительно содержит traer-последовательность ниже парной traer-последовательности под контролем первого регуляторного элемента.29. The eukaryotic host cell according to paragraph 26, where component (a) further comprises a traer sequence below the paired traer sequence under the control of the first regulatory element.

30. Эукариотическая клетка-хозяин по параграфу 26, где компонент (а) дополнительно содержит две или более направляющие последовательности, функционально связанные с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке.30. The eukaryotic host cell according to paragraph 26, where component (a) further comprises two or more guide sequences operably linked to the first regulatory element, where upon expression each of two or more guide sequences controls the sequence-specific binding of the CRISPR complex to its target sequence in a eukaryotic cell.

31. Эукариотическая клетка-хозяин по параграфу 26, дополнительно содержащая третий регуляторный элемент, функционально связанный с указанной traer-последовательностью.31. The eukaryotic host cell according to paragraph 26, further comprising a third regulatory element operably linked to said traer sequence.

32. Эукариотическая клетка-хозяин по параграфу 26, где traer-последовательность характеризуется по меньшей мере 50% комплементарности последовательности по длине парной traer-последовательности при оптимальном выравнивании.32. The eukaryotic host cell according to paragraph 26, where the traer sequence is characterized by at least 50% complementarity of the sequence along the length of the paired traer sequence with optimal alignment.

33. Эукариотическая клетка-хозяин по параграфу 26, где фермент CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки.33. The eukaryotic host cell according to paragraph 26, where the CRISPR enzyme contains one or more nuclear localization sequences that are effective enough to control the accumulation of the specified CRISPR enzyme in a detectable amount in the nucleus of the eukaryotic cell.

34. Эукариотическая клетка-хозяин по параграфу 26, где фермент CRISPR является ферментом системы CRISPR II типа.34. The eukaryotic host cell according to paragraph 26, where the CRISPR enzyme is an enzyme of the type II CRISPR system.

35. Эукариотическая клетка-хозяин по параграфу 26, где фермент CRISPR является ферментом Cas9.35. The eukaryotic host cell according to paragraph 26, where the CRISPR enzyme is a Cas9 enzyme.

36. Эукариотическая клетка-хозяин по параграфу 26, где фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке.36. The eukaryotic host cell according to paragraph 26, where the CRISPR enzyme is codon-optimized for expression in a eukaryotic cell.

37. Эукариотическая клетка-хозяин по параграфу 26, где фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности.37. The eukaryotic host cell according to paragraph 26, where the CRISPR enzyme controls the cleavage of one or two strands at a specific point in the target sequence.

38. Эукариотическая клетка-хозяин по параграфу 26, где у фермента CRISPR отсутствует активность для расщепления нитей ДНК.38. The eukaryotic host cell according to paragraph 26, where the CRISPR enzyme lacks activity for cleaving DNA strands.

39. Эукариотическая клетка-хозяин по параграфу 26, где первый регуляторный элемент является промотором полимеразы III.39. The eukaryotic host cell according to paragraph 26, where the first regulatory element is a promoter of polymerase III.

40. Эукариотическая клетка-хозяин по параграфу 26, где второй регуляторный элемент является промотором полимеразы II.40. The eukaryotic host cell according to paragraph 26, where the second regulatory element is a promoter of polymerase II.

41. Эукариотическая клетка-хозяин по параграфу 31, где третий регуляторный элемент является промотором полимеразы III.41. The eukaryotic host cell according to paragraph 31, where the third regulatory element is a promoter of polymerase III.

42. Эукариотическая клетка-хозяин по параграфу 26, где направляющая последовательность составляет по меньшей мере 15 нуклеотидов в длину.42. The eukaryotic host cell according to paragraph 26, where the guide sequence is at least 15 nucleotides in length.

43. Эукариотическая клетка-хозяин по параграфу 26, где менее 50% нуклеотидов направляющей последовательности участвует в самокомплементарном спаривании оснований при оптимальном сворачивании.43. The eukaryotic host cell according to paragraph 26, where less than 50% of the nucleotides of the guide sequence is involved in self-complementary base pairing with optimal folding.

44. Отличное от человека животное, содержащее эукариотическую клетку-хозяина по любому одному из параграфов 26-43.44. A non-human animal containing a eukaryotic host cell according to any one of paragraphs 26-43.

45. Набор, содержащий векторную систему и инструкции по применению указанного набора, при этом векторная система содержит45. A kit containing a vector system and instructions for using the specified kit, while the vector system contains

a. первый регуляторный элемент, функционально связанный с парной traer-последовательностью и одним или несколькими сайтами встраивания для встраивания направляющей последовательности выше парной traer-последовательности, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибиридизируется с целевой последовательностью, и (2) парной tracr-последовательность, которая гибиридизируется с traer-последовательностью; и/илиa. a first regulatory element operably linked to a paired traer sequence and one or more embedding sites for embedding a guiding sequence above a paired traer sequence, where upon expression the guiding sequence controls the sequence-specific binding of the CRISPR complex to the target sequence in a eukaryotic cell, where the CRISPR complex contains CRISPR enzyme complexing with (1) a guide sequence that hybridizes with the target sequence elnostyu, and (2) tracr-pair sequence which gibiridiziruetsya with traer-sequence; and / or

b. второй регуляторный элемент, функционально связанный с кодирующей фермент последовательностью, кодирующей указанный фермент CRISPR, содержащий последовательность ядерной локализации.b. a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising a nuclear localization sequence.

46. Набор по параграфу 45, где указанный набор содержит компоненты (а) и (b), находящиеся в одном и том же или в различных векторах системы.46. The set according to paragraph 45, where the specified set contains components (a) and (b) located in the same or in different vectors of the system.

47. Набор по параграфу 45, где компонент (а) дополнительно содержит traer-последовательность ниже парной traer-последовательности под контролем первого регуляторного элемента.47. The kit of paragraph 45, wherein component (a) further comprises a traer sequence below the paired traer sequence under the control of the first regulatory element.

48. Набор по параграфу 45, где компонент (а) дополнительно содержит две или более направляющие последовательности, функционально связанные с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке.48. The kit of paragraph 45, wherein component (a) further comprises two or more guide sequences operably linked to the first regulatory element, where upon expression each of two or more guide sequences controls sequence specific binding of the CRISPR complex to its target sequence in eukaryotic the cage.

49. Набор по параграфу 45, где система содержит traer-последовательность под контролем третьего регуляторного элемента.49. The kit according to paragraph 45, where the system contains a traer sequence under the control of the third regulatory element.

50. Набор по параграфу 45, где traer-последовательность характеризуется по меньшей мере 50% комплементарности последовательности по длине парной traer-последовательности при оптимальном выравнивании.50. The kit of paragraph 45, wherein the traer sequence is characterized by at least 50% complementarity of the sequence along the length of the paired traer sequence with optimal alignment.

51. Набор по параграфу 45, где фермент CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в определяемом количестве в ядре эукариотической клетки.51. The kit of paragraph 45, wherein the CRISPR enzyme contains one or more nuclear localization sequences that are effective enough to control the accumulation of the specified CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell.

52. Набор по параграфу 45, где фермент CRISPR является ферментом системы CRISPR II типа.52. The kit according to paragraph 45, where the CRISPR enzyme is an enzyme of the CRISPR type II system.

53. Набор по параграфу 45, где фермент CRISPR является ферментом Cas9.53. The kit according to paragraph 45, where the CRISPR enzyme is a Cas9 enzyme.

54. Набор по параграфу 45, где фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке.54. The kit of paragraph 45, wherein the CRISPR enzyme is codon-optimized for expression in a eukaryotic cell.

55. Набор по параграфу 45, где фермент CRISPR управляет расщеплением одной или двух нитей в определенной точке целевой последовательности.55. The kit of paragraph 45, wherein the CRISPR enzyme controls the cleavage of one or two strands at a specific point in the target sequence.

56. Набор по параграфу 45, где у фермента CRISPR отсутствует активность для расщепления нитей ДНК.56. The kit of paragraph 45, wherein the CRISPR enzyme lacks activity for cleaving DNA strands.

57. Набор по параграфу 45, где первый регуляторный элемент является промотором полимеразы III.57. The kit of paragraph 45, wherein the first regulatory element is a polymerase III promoter.

58. Набор по параграфу 45, где второй регуляторный элемент является промотором полимеразы II.58. The kit according to paragraph 45, where the second regulatory element is a promoter of polymerase II.

59. Набор по параграфу 49, где третий регуляторный элемент является промотором полимеразы III.59. The kit according to paragraph 49, where the third regulatory element is a promoter of polymerase III.

60. Набор по параграфу 45, где направляющая последовательность составляет по меньшей мере 15 нуклеотидов в длину.60. The kit of paragraph 45, wherein the guide sequence is at least 15 nucleotides in length.

61. Набор по параграфу 45, где менее 50% нуклеотидов направляющей последовательности участвует в самокомплементарном спаривании оснований при оптимальном сворачивании.61. The kit according to paragraph 45, where less than 50% of the nucleotides of the guide sequence is involved in self-complementary base pairing with optimal folding.

62. Компьютерная система для отбора кандидатной целевой последовательности в пределах последовательности нуклеиновой кислоты в эукариотической клетке для целенаправленного воздействия комплекса CRISPR, при этом система содержит62. A computer system for selecting a candidate target sequence within a nucleic acid sequence in a eukaryotic cell for targeted exposure to the CRISPR complex, the system comprising

a. блок памяти, выполненный с возможностью получения и/или хранения указанной последовательности нуклеиновой кислоты; иa. a memory unit configured to receive and / or store said nucleic acid sequence; and

b. один или несколько процессоров отдельно или в комбинации, запрограммированных с возможностью (i) определения местонахождения последовательности мотива CRISPR в пределах указанной последовательности нуклеиновой кислоты и (ii) выбора последовательности, смежной с указанной последовательностью мотива CRISPR с определенным местонахождением, в качестве кандидатной целевой последовательности, с которой связывается комплекс CRISPR.b. one or more processors, individually or in combination, programmed to (i) locate a CRISPR motif sequence within a specified nucleic acid sequence and (ii) select a sequence adjacent to a specified locally defined CRISPR motif sequence as a candidate target sequence, with which binds CRISPR complex.

63. Компьютерная система по параграфу 62, где указанная стадия определения местонахождения включает идентификацию последовательности мотива CRISPR, расположенной менее чем приблизительно в 500 нуклеотидах от указанной целевой последовательности.63. The computer system of paragraph 62, wherein said locating step comprises identifying a CRISPR motif sequence located less than about 500 nucleotides from the specified target sequence.

64. Компьютерная система по параграфу 62, где указанная кандидатная целевая последовательность составляет по меньшей мере 10 нуклеотидов в длину.64. The computer system of paragraph 62, wherein said candidate target sequence is at least 10 nucleotides in length.

65. Компьютерная система по параграфу 62, где нуклеотид на 3'-конце кандидатной целевой последовательности расположен не более чем приблизительно в 10 нуклеотидах выше последовательности мотива CRISPR.65. The computer system of paragraph 62, wherein the nucleotide at the 3'-end of the candidate target sequence is located no more than about 10 nucleotides above the CRISPR motif sequence.

66. Компьютерная система по параграфу 62, где последовательность нуклеиновой кислоты в эукариотической клетке является эндогенной по отношению к эукариотическому геному.66. The computer system of paragraph 62, wherein the nucleic acid sequence in a eukaryotic cell is endogenous to the eukaryotic genome.

67. Компьютерная система по пункту 62, где последовательность нуклеиновой кислоты в эукариотической клетке является экзогенной по отношению к эукариотическому геному.67. The computer system of paragraph 62, wherein the nucleic acid sequence in the eukaryotic cell is exogenous to the eukaryotic genome.

68. Машиночитаемый носитель, содержащий коды, которые при выполнении одним или несколькими процессорами реализуют способ выбора кандидатной целевой последовательности в пределах последовательности нуклеиновой кислоты в эукариотической клетке для целенаправленного воздействия комплекса CRISPR, при этом указанный способ включает (а) определение местонахождения последовательности мотива CRISPR в пределах указанной последовательности нуклеиновой кислоты и (b) выбор последовательности, смежной с указанной последовательностью мотива CRISPR с определенным местонахождением, в качестве кандидатной целевой последовательности, с которой связывается комплекс CRISPR.68. A computer-readable medium containing codes that, when executed by one or more processors, implement a method for selecting a candidate target sequence within a nucleic acid sequence in a eukaryotic cell for targeted exposure to the CRISPR complex, the method comprising (a) locating the CRISPR motif sequence within said nucleic acid sequence; and (b) selecting a sequence adjacent to said CRISPR motif sequence with op edelennym located, as a candidate of a target sequence with which the complex binds CRISPR.

69. Машиночитаемый носитель по параграфу 68, где указанное определение местонахождения включает определение местонахождения последовательности мотива CRISPR, которая находится менее чем приблизительно в 500 нуклеотидах от указанной целевой последовательности.69. The computer-readable medium of paragraph 68, wherein said locating includes locating a CRISPR motif sequence that is less than about 500 nucleotides from the specified target sequence.

70. Машиночитаемый по параграфу 68, где указанная кандидатная целевая последовательность составляет по меньшей мере 10 нуклеотидов в длину.70. Machine-readable according to paragraph 68, wherein said candidate target sequence is at least 10 nucleotides in length.

71. Машиночитаемый по параграфу 68, где нуклеотид на 3'-конце кандидатной целевой последовательности расположен не более чем приблизительно в 10 нуклеотидах выше последовательности мотива CRISPR.71. Machine-readable according to paragraph 68, where the nucleotide at the 3'-end of the candidate target sequence is located no more than approximately 10 nucleotides above the sequence of the CRISPR motif.

72. Машиночитаемый по параграфу 68, где последовательность нуклеиновой кислоты в эукариотической клетке является эндогенной по отношению к эукариотическому геному.72. Machine-readable according to paragraph 68, where the nucleic acid sequence in a eukaryotic cell is endogenous to the eukaryotic genome.

73. Машиночитаемый по параграфу 68, где последовательность нуклеиновой кислоты в эукариотической клетке является экзогенной по отношению к эукариотическому геному.73. Machine-readable according to paragraph 68, where the nucleic acid sequence in a eukaryotic cell is exogenous to the eukaryotic genome.

74. Способ модификации целевого полинуклеотида в эукариотической клетке, при этом способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида с модификацией, таким образом, целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной traer-последовательностью, которая, в свою очередь, гибридизируется с traer-последовательностью.74. A method for modifying a target polynucleotide in a eukaryotic cell, the method comprising binding a CRISPR complex to a target polynucleotide to cleave said target polynucleotide, thereby modifying the target polynucleotide, where the CRISPR complex contains a CRISPR enzyme that is complexed with a guide sequence that hybridizes with the target sequence in the specified target polynucleotide, where the specified guide sequence is associated with a paired traer sequence consistently, which, in turn, hybridize to Traer-sequence.

75. Способ по параграфу 74, где указанное расщепление включает расщепление одной или двух нитей в определенной точке целевой последовательности указанным ферментом CRISPR.75. The method of paragraph 74, wherein said cleavage comprises cleaving one or two strands at a specific point in the target sequence with said CRISPR enzyme.

76. Способ по параграфу 74, где указанное расщепление приводит к сниженной транскрипции целевого гена.76. The method of paragraph 74, wherein said cleavage results in reduced transcription of the target gene.

77. Способ по параграфу 74, дополнительно включающий репарацию указанного расщепленного целевого полинуклеотида при помощи гомологичной рекомбинации с экзогенным матричным полинуклеотидом, где указанная репарация приводит к мутации, включающей вставку, делецию или замену одного или нескольких нуклеотидов указанного целевого полинуклеотида.77. The method of paragraph 74, further comprising repairing said cleaved target polynucleotide by homologous recombination with an exogenous matrix polynucleotide, wherein said repair leads to a mutation comprising the insertion, deletion, or substitution of one or more nucleotides of said target polynucleotide.

78. Способ по параграфу 77, где указанная мутация приводит к одной или нескольким аминокислотным заменам в белке, экспрессируемом с гена, содержащего целевую последовательность.78. The method of paragraph 77, wherein said mutation results in one or more amino acid substitutions in a protein expressed from a gene containing the target sequence.

79. Способ по параграфу 74, дополнительно включающий доставку одного или нескольких векторов в указанную эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из следующих: фермента CRISPR, направляющей последовательности, связанной с парной traer-последовательностью, и traer-последовательности.79. The method of paragraph 74, further comprising delivering one or more vectors to the indicated eukaryotic cell, where one or more vectors control the expression of one or more of the following: CRISPR enzyme, a guide sequence associated with a paired traer sequence, and a traer sequence.

80. Способ по параграфу 79, где указанные векторы доставляют в эукариотическую клетку в субъекте.80. The method of paragraph 79, wherein said vectors are delivered to a eukaryotic cell in a subject.

81. Способ по параграфу 74, где указанная модификация имеет место в указанной эукариотической клетке в клеточной культуре.81. The method of paragraph 74, wherein said modification takes place in said eukaryotic cell in cell culture.

82. Способ по параграфу 74, дополнительно включающий выделение указанной эукариотической клетки из субъекта перед указанной модификацией.82. The method of paragraph 74, further comprising isolating said eukaryotic cell from a subject prior to said modification.

83. Способ по параграфу 82, дополнительно включающий возвращение указанной эукариотической клетки и/или клеток, полученных из субъекта, указанному субъекту.83. The method of paragraph 82, further comprising returning said eukaryotic cell and / or cells obtained from a subject to said subject.

84. Способ модификации экспрессии полинуклеотида в эукариотической клетке, при этом способ включает обеспечение связывания комплекса CRISPR с полинуклеотидом так, что указанное связывание приводит к повышенной или пониженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизирующейся с целевой последовательностью в указанном полинуклеотиде, где указанная направляющая последовательность связана с парной traer-последовательностью, которая, в свою очередь, гибридизируется с traer-последовательностью.84. A method of modifying expression of a polynucleotide in a eukaryotic cell, the method comprising: binding the CRISPR complex to the polynucleotide so that said binding results in increased or decreased expression of the indicated polynucleotide; where the CRISPR complex contains the CRISPR enzyme, which forms a complex with a guide sequence that hybridizes to the target sequence in the specified polynucleotide, where the specified guide sequence is associated with a paired traer sequence, which, in turn, hybridizes with the traer sequence.

85. Способ по параграфу 74, дополнительно включающий доставку одного или нескольких векторов в указанные эукариотические клетки, где один или несколько векторов управляют экспрессией одного или нескольких из следующих: фермента CRISPR, направляющей последовательности, связанной с парной traer-последовательностью, и traer-последовательности.85. The method of paragraph 74, further comprising delivering one or more vectors to said eukaryotic cells, wherein one or more vectors control the expression of one or more of the following: a CRISPR enzyme, a guide sequence associated with a paired traer sequence, and a traer sequence.

86. Способ получения модельной эукариотической клетки, содержащей мутантный ген, ответственный за развитие заболевания, при этом способ включает86. A method for producing a model eukaryotic cell containing a mutant gene responsible for the development of a disease, the method comprising

a. введение одного или нескольких векторов в эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной traer-последовательностью, и traer-последовательности; иa. introducing one or more vectors into a eukaryotic cell, where one or more vectors control the expression of one or more of: the CRISPR enzyme, the guide sequence associated with the paired traer sequence, and the traer sequence; and

b. обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в указанном гене, ответственном за развитие заболевания, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью в целевом полинуклеотиде, и (2) парной traer-последовательностью, которая гибридизируется с traer-последовательностью, с получением, таким образом, модельной эукариотической клетки, содержащей мутантный ген, ответственный за развитие заболевания.b. providing binding of the CRISPR complex to the target polynucleotide to carry out the cleavage of the target polynucleotide in the indicated gene responsible for the development of the disease, where the CRISPR complex contains the CRISPR enzyme, complexing with (1) the guide sequence that hybridizes with the target sequence in the target polynucleotide, and (2) paired traer sequence that hybridizes with the traer sequence, thus obtaining a model eukaryotic cell containing the mutant gene, corresponding for developing the disease.

87. Способ по параграфу 86, где указанное расщепление включает расщепление одной или двух нитей в определенной точке целевой последовательности указанным ферментом CRISPR.87. The method of paragraph 86, wherein said cleavage comprises cleaving one or two strands at a specific point in the target sequence with said CRISPR enzyme.

88. Способ по параграфу 86, где указанное расщепление приводит к сниженной транскрипции целевого гена.88. The method of paragraph 86, wherein said cleavage results in reduced transcription of the target gene.

89. Способ по параграфу 86, дополнительно включающий репарацию указанного расщепленного целевого полинуклеотида при помощи гомологичной рекомбинации с экзогенным матричным полинуклеотидом, где указанная репарация приводит к мутации, включающей вставку, делецию или замену одного или нескольких нуклеотидов указанного целевого полинуклеотида.89. The method of paragraph 86, further comprising repairing said cleaved target polynucleotide by homologous recombination with an exogenous matrix polynucleotide, wherein said repair leads to a mutation comprising the insertion, deletion, or replacement of one or more nucleotides of said target polynucleotide.

90. Способ по параграфу 89, где указанная мутация приводит к одной или нескольким аминокислотным заменам в белке, экспрессируемом с гена, содержащего целевую последовательность.90. The method of paragraph 89, wherein said mutation results in one or more amino acid substitutions in a protein expressed from a gene containing the target sequence.

91. Способ получения биологически активного средства, которое модулирует процесс передачи сигнала в клетке, ассоциированный с геном, ответственным за развитие заболевания, включающий91. A method of obtaining a biologically active agent that modulates the signal transmission process in the cell associated with the gene responsible for the development of the disease, including

a. приведение тестового соединения в контакт с модельной клеткой по любому из параграфов 86-90 иa. bringing the test compound into contact with the model cell according to any one of paragraphs 86-90 and

b. обнаружение изменения при считывании, которое свидетельствует об уменьшении или усилении процесса передачи сигнала в клетке, ассоциированного с указанной мутацией в указанном гене, ответственном за развитие заболевания, с получением, таким образом, указанного биологически активного средства, которое модулирует указанный процесс передачи сигнала в клетке, ассоциированный с указанным геном, ответственным за развитие заболевания.b. detecting a change in reading, which indicates a decrease or increase in the process of signal transmission in the cell associated with the specified mutation in the specified gene responsible for the development of the disease, thus obtaining the specified biologically active agent that modulates the specified process of signal transmission in the cell, associated with the specified gene responsible for the development of the disease.

92. Рекомбинантный полинуклеотид, содержащий направляющую последовательность выше парной traer-последовательности, где направляющая последовательность при экспрессии управляет специфичным к последовательности связыванием комплекса CRISPR с соответствующей целевой последовательностью, присутствующей в эукариотической клетке.92. A recombinant polynucleotide containing a guide sequence above a paired traer sequence, where the guide sequence upon expression controls the sequence-specific binding of the CRISPR complex to the corresponding target sequence present in the eukaryotic cell.

93. Рекомбинантный полинуклеотид по параграфу 89, где целевая последовательность является вирусной последовательностью, присутствующей в эукариотической клетке.93. The recombinant polynucleotide of paragraph 89, wherein the target sequence is a viral sequence present in a eukaryotic cell.

94. Рекомбинантный полинуклеотид по параграфу 89, где целевая последовательность является протоонкогеном или онкогеном.94. The recombinant polynucleotide of paragraph 89, wherein the target sequence is a proto-oncogen or oncogen.

Несмотря на то, что предпочтительные варианты осуществления настоящего изобретения были показаны и описаны в данном документе, для специалиста в данной области будет очевидно, что такие варианты осуществления предоставлены только в качестве примера. Многочисленные вариации, изменения и замены теперь будут очевидны для специалиста в данной области без отступления от сути настоящего изобретения. Следует понимать, что различные альтернативные варианты вариантов осуществления настоящего изобретения, раскрытые в данном документе, можно применять при практическом осуществлении настоящего изобретения. Предполагают, что следующая формула изобретения определяет объем настоящего изобретения, и что, таким образом, охвачены способы и структуры в пределах объема данной формулы изобретения и их эквиваленты.Although preferred embodiments of the present invention have been shown and described herein, it will be apparent to those skilled in the art that such embodiments are provided by way of example only. Numerous variations, changes and substitutions will now be apparent to those skilled in the art without departing from the gist of the present invention. It should be understood that various alternative embodiments of the present invention disclosed herein can be used in the practical implementation of the present invention. The following claims are intended to define the scope of the present invention, and that thus, methods and structures within the scope of this claims and their equivalents are encompassed.

Библиографические ссылкиBibliographic references

1. Urnov, F.D., Rebar, E.J., Holmes, М.С., Zhang, H.S. & Gregory, P.D. Genome editing with engineered zinc finger nucleases. Nat. Rev. Genet. 11, 636-646 (2010).1. Urnov, F.D., Rebar, E.J., Holmes, M.S., Zhang, H.S. & Gregory, P.D. Genome editing with engineered zinc finger nucleases. Nat. Rev. Genet. 11, 636-646 (2010).

2. Bogdanove, A.J. & Voytas, D.F. TAL effectors: customizable proteins for DNA targeting. Science 333, 1843-1846 (2011).2. Bogdanove, A.J. & Voytas, D.F. TAL effectors: customizable proteins for DNA targeting. Science 333, 1843-1846 (2011).

3. Stoddard, B.L. Homing endonuclease structure and function. Q. Rev. Biophys. 38, 49-95 (2005).3. Stoddard, B.L. Homing endonuclease structure and function. Q. Rev. Biophys. 38, 49-95 (2005).

4. Bae, T. & Schneewind, O. Allelic replacement in Staphylococcus aureus with inducible counter-selection. Plasmid 55, 58-63 (2006).4. Bae, T. & Schneewind, O. Allelic replacement in Staphylococcus aureus with inducible counter-selection. Plasmid 55, 58-63 (2006).

5. Sung, C.K., Li, H., Claverys, J.P. & Morrison, D.A. An rpsL cassette, janus, for gene replacement through negative selection in Streptococcus pneumoniae. Appl. Environ. Microbiol. 67, 5190-5196 (2001).5. Sung, C.K., Li, H., Claverys, J.P. & Morrison, D.A. An rpsL cassette, janus, for gene replacement through negative selection in Streptococcus pneumoniae. Appl. Environ. Microbiol. 67, 5190-5196 (2001).

6. Sharan, S.K., Thomason, L.C., Kuznetsov, S.G. & Court, D.L. Recombineering: a homologous recombination-based method of genetic engineering. Nat. Protoc. 4, 206-223 (2009).6. Sharan, S.K., Thomason, L.C., Kuznetsov, S.G. & Court, D.L. Recombineering: a homologous recombination-based method of genetic engineering. Nat. Protoc. 4, 206-223 (2009).

7. Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012).7. Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012).

8. Deveau, H., Garneau, J.E. & Moineau, S. CRISPR/Cas system and its role in phage-bacteria interactions. Annu. Rev. Microbiol. 64, 475-493 (2010).8. Deveau, H., Garneau, J.E. & Moineau, S. CRISPR / Cas system and its role in phage-bacteria interactions. Annu. Rev. Microbiol. 64, 475-493 (2010).

9. Horvath, P. & Barrangou, R. CRISPR/Cas, the immune system of bacteria and archaea. Science 327, 167-170 (2010).9. Horvath, P. & Barrangou, R. CRISPR / Cas, the immune system of bacteria and archaea. Science 327, 167-170 (2010).

10. Terns, M.P. & Terns, R.M. CRISPR-based adaptive immune systems. Curr. Opin. Microbiol. 14, 321-327 (2011).10. Terns, M.P. & Terns, R.M. CRISPR-based adaptive immune systems. Curr. Opin. Microbiol. 14, 321-327 (2011).

11. van der Oost, J., Jore, M.M., Westra, E.R., Lundgren, M. & Brouns, S.J. CRISPR-based adaptive and heritable immunity in prokaryotes. Trends. Biochem. Sci. 34, 401-407 (2009).11. van der Oost, J., Jore, M.M., Westra, E.R., Lundgren, M. & Brouns, S.J. CRISPR-based adaptive and heritable immunity in prokaryotes. Trends Biochem. Sci. 34, 401-407 (2009).

12. Brouns, S.J. et al. Small CRISPR RNAs guide antiviral defense in prokaryotes. Science 321, 960-964 (2008).12. Brouns, S.J. et al. Small CRISPR RNAs guide antiviral defense in prokaryotes. Science 321, 960-964 (2008).

13. Carte, J., Wang, R., Li, H., Terns, R.M. & Terns, M.P. Cas6 is an endoribonuclease that generates guide RNAs for invader defense in prokaryotes. Genes Dev. 22, 3489-3496 (2008).13. Carte, J., Wang, R., Li, H., Terns, R. M. & Terns, M.P. Cas6 is an endoribonuclease that generates guide RNAs for invader defense in prokaryotes. Genes Dev. 22, 3489-3496 (2008).

14. Deltcheva, E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III. Nature 471, 602-607 (2011).14. Deltcheva, E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III. Nature 471, 602-607 (2011).

15. Hatoum-Aslan, A., Maniv, I. & Marraffini, L.A. Mature clustered, regularly interspaced, short palindromic repeats RNA (crRNA) length is measured by a ruler mechanism anchored at the precursor processing site. Proc. Natl. Acad. Sci. U.S.A. 108, 21218-21222 (2011).15. Hatoum-Aslan, A., Maniv, I. & Marraffini, L.A. Mature clustered, regularly interspaced, short palindromic repeats RNA (crRNA) length is measured by a ruler mechanism anchored at the precursor processing site. Proc. Natl. Acad. Sci. U.S.A. 108, 21218-21222 (2011).

16. Haurwitz, R.E., Jinek, M., Wiedenheft, B., Zhou, K. & Doudna, J.A. Sequence- and structure-specific RNA processing by a CRISPR endonuclease. Science 329, 1355-1358 (2010).16. Haurwitz, R.E., Jinek, M., Wiedenheft, B., Zhou, K. & Doudna, J.A. Sequence- and structure-specific RNA processing by a CRISPR endonuclease. Science 329, 1355-1358 (2010).

17. Deveau, H. et al. Phage response to CRISPR-encoded resistance in Streptococcus thermophilus. J. Bacteriol. 190, 1390-1400 (2008).17. Deveau, H. et al. Phage response to CRISPR-encoded resistance in Streptococcus thermophilus. J. Bacteriol. 190, 1390-1400 (2008).

18. Gasiunas, G., Barrangou, R., Horvath, P. & Siksnys, V. Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proc. Natl. Acad. Sci. U.S.A. (2012).18. Gasiunas, G., Barrangou, R., Horvath, P. & Siksnys, V. Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proc. Natl. Acad. Sci. U.S.A. (2012).

19. Makarova, K.S., Aravind, L., Wolf, Y.I. & Koonin, E.V. Unification of Cas protein families and a simple scenario for the origin and evolution of CRISPR-Cas systems. Biol. Direct. 6, 38 (2011).19. Makarova, K.S., Aravind, L., Wolf, Y.I. & Koonin, E.V. Unification of Cas protein families and a simple scenario for the origin and evolution of CRISPR-Cas systems. Biol. Direct 6, 38 (2011).

20. Barrangou, R. RNA-mediated programmable DNA cleavage. Nat. Biotechnol. 30, 836-838 (2012).20. Barrangou, R. RNA-mediated programmable DNA cleavage. Nat. Biotechnol. 30, 836-838 (2012).

21. Brouns, S.J. Molecular biology. A Swiss army knife of immunity. Science 337, 808-809 (2012).21. Brouns, S.J. Molecular biology. A Swiss army knife of immunity. Science 337, 808-809 (2012).

22. Carroll, D. A CRISPR Approach to Gene Targeting. Mol Ther. 20, 1658-1660 (2012).22. Carroll, D. A CRISPR Approach to Gene Targeting. Mol ther. 20, 1658-1660 (2012).

23. Bikard, D., Hatoum-Aslan, A., Mucida, D. & Marraffini, L.A. CRISPR interference can prevent natural transformation and virulence acquisition during in vivo bacterial infection. Cell Host Microbe 12, 177-186 (2012).23. Bikard, D., Hatoum-Aslan, A., Mucida, D. & Marraffini, L.A. CRISPR interference can prevent natural transformation and virulence acquisition during in vivo bacterial infection. Cell Host Microbe 12, 177-186 (2012).

24. Sapranauskas, R. et al. The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic Acids Res. (2011).24. Sapranauskas, R. et al. The Streptococcus thermophilus CRISPR / Cas system provides immunity in Escherichia coli. Nucleic Acids Res. (2011).

25. Semenova, E. et al. Interference by clustered regularly interspaced short palindromic repeat (CRISPR) RNA is governed by a seed sequence. Proc. Natl. Acad. Sci. U.S.A. (2011).25. Semenova, E. et al. Interference by clustered regularly interspaced short palindromic repeat (CRISPR) RNA is governed by a seed sequence. Proc. Natl. Acad. Sci. U.S.A. (2011).

26. Wiedenheft, B. et al. RNA-guided complex from a bacterial immune system enhances target recognition through seed sequence interactions. Proc. Natl. Acad. Sci. U.S.A. (2011).26. Wiedenheft, B. et al. RNA-guided complex from a bacterial immune system enhances target recognition through seed sequence interactions. Proc. Natl. Acad. Sci. U.S.A. (2011).

27. Zahner, D. & Hakenbeck, R. The Streptococcus pneumoniae beta-galactosidase is a surface protein. J. Bacteriol. 182, 5919-5921 (2000).27. Zahner, D. & Hakenbeck, R. The Streptococcus pneumoniae beta-galactosidase is a surface protein. J. Bacteriol. 182, 5919-5921 (2000).

28. Marraffini, L.A., Dedent, A.C. & Schneewind, O. Sortases and the art of anchoring proteins to the envelopes of gram-positive bacteria. Microbiol. Mol. Biol. Rev. 70, 192-221 (2006).28. Marraffini, L.A., Dedent, A.C. & Schneewind, O. Sortases and the art of anchoring proteins to the envelopes of gram-positive bacteria. Microbiol. Mol. Biol. Rev. 70, 192-221 (2006).

29. Motamedi, M.R., Szigety, S.K. & Rosenberg, S.M. Double-strand-break repair recombination in Escherichia coli: physical evidence for a DNA replication mechanism in vivo. Genes Dev. 13, 2889-2903 (1999).29. Motamedi, M.R., Szigety, S.K. & Rosenberg, S.M. Double-strand-break repair recombination in Escherichia coli: physical evidence for a DNA replication mechanism in vivo. Genes Dev. 13, 2889-2903 (1999).

30. Hosaka, T. et al. The novel mutation K87E in ribosomal protein S12 enhances protein synthesis activity during the late growth phase in Escherichia coli. Mol. Genet. Genomics 271, 317-324 (2004).30. Hosaka, T. et al. The novel mutation K87E in ribosomal protein S12 enhances protein synthesis activity during the late growth phase in Escherichia coli. Mol. Genet. Genomics 271, 317-324 (2004).

31. Costantino, N. & Court, D.L. Enhanced levels of lambda Red-mediated recombinants in mismatch repair mutants. Proc. Natl. Acad. Sci. U.S.A. 100, 15748-15753 (2003).31. Costantino, N. & Court, D.L. Enhanced levels of lambda Red-mediated recombinants in mismatch repair mutants. Proc. Natl. Acad. Sci. U.S.A. 100, 15748-15753 (2003).

32. Edgar, R. & Qimron, U. The Escherichia coli CRISPR system protects from lambda lysogenization, lysogens, and prophage induction. J. Bacteriol. 192, 6291-6294 (2010).32. Edgar, R. & Qimron, U. The Escherichia coli CRISPR system protects from lambda lysogenization, lysogens, and prophage induction. J. Bacteriol. 192, 6291-6294 (2010).

33. Marraffini, L.A. & Sontheimer, E.J. Self versus non-self discrimination during CRISPR RNA-directed immunity. Nature 463, 568-571 (2010).33. Marraffini, L.A. & Sontheimer, E.J. Self versus non-self discrimination during CRISPR RNA-directed immunity. Nature 463, 568-571 (2010).

34. Fischer, S. et al. An archaeal immune system can detect multiple Protospacer Adjacent Motifs (PAMs) to target invader DNA. J. Biol. Chem. 287, 33351-33363 (2012).34. Fischer, S. et al. An archaeal immune system can detect multiple Protospacer Adjacent Motifs (PAMs) to target invader DNA. J. Biol. Chem. 287, 33351-33363 (2012).

35. Gudbergsdottir, S. et al. Dynamic properties of the Sulfolobus CRISPR/Cas and CRISPR/Cmr systems when challenged with vector-borne viral and plasmid genes and protospacers. Mol. Microbiol. 19, 35-49 (2011).35. Gudbergsdottir, S. et al. Dynamic properties of the Sulfolobus CRISPR / Cas and CRISPR / Cmr systems when challenged with vector-borne viral and plasmid genes and protospacers. Mol. Microbiol. 19, 35-49 (2011).

36. Wang, H.H. et al. Genome-scale promoter engineering by coselection MAGE. Nat Methods 9, 591-593 (2012).36. Wang, H.H. et al. Genome-scale promoter engineering by coselection MAGE. Nat Methods 9, 591-593 (2012).

37. Cong, L. et al. Multiplex Genome Engineering Using CRISPR/Cas Systems. Science в печати (2013).37. Cong, L. et al. Multiplex Genome Engineering Using CRISPR / Cas Systems. Science in print (2013).

38. Mali, P. et al. RNA-Guided Human Genome Engineering via Cas9. Science в печати (2013).38. Mali, P. et al. RNA-Guided Human Genome Engineering via Cas9. Science in print (2013).

39. Hoskins, J. et al. Genome of the bacterium Streptococcus pneumoniae strain R6. J. Bacteriol. 183, 5709-5717 (2001).39. Hoskins, J. et al. Genome of the bacterium Streptococcus pneumoniae strain R6. J. Bacteriol. 183, 5709-5717 (2001).

40. Havarstein, L.S., Coomaraswamy, G. & Morrison, D.A. An unmodified heptadecapeptide pheromone induces competence for genetic transformation in Streptococcus pneumoniae. Proc. Natl. Acad. Sci. U.S.A. 92, 11140-11144 (1995).40. Havarstein, L.S., Coomaraswamy, G. & Morrison, D.A. An unmodified heptadecapeptide pheromone induces competence for genetic transformation in Streptococcus pneumoniae. Proc. Natl. Acad. Sci. U.S.A. 92, 11140-11144 (1995).

41. Horinouchi, S. & Weisblum, B. Nucleotide sequence and functional map of pC194, a plasmid that specifies inducible chloramphenicol resistance. J. Bacteriol. 150, 815-825 (1982).41. Horinouchi, S. & Weisblum, B. Nucleotide sequence and functional map of pC194, a plasmid that specifies inducible chloramphenicol resistance. J. Bacteriol. 150, 815-825 (1982).

42. Horton, R.M. In Vitro Recombination and Mutagenesis of DNA: SOEing Together Tailor-Made Genes. Methods Mol. Biol. 15, 251-261 (1993).42. Horton, R.M. In Vitro Recombination and Mutagenesis of DNA: SOEing Together Tailor-Made Genes. Methods Mol. Biol. 15, 251-261 (1993).

43. Podbielski, A., Spellerberg, В., Woischnik, M., Pohl, B. & Lutticken, R. Novel series of plasmid vectors for gene inactivation and expression analysis in group A streptococci (GAS). Gene 177, 137-147 (1996).43. Podbielski, A., Spellerberg, B., Woischnik, M., Pohl, B. & Lutticken, R. Novel series of plasmid vectors for gene inactivation and expression analysis in group A streptococci (GAS). Gene 177, 137-147 (1996).

44. Husmann, L.K., Scott, J.R., Lindahl, G. & Stenberg, L. Expression of the Arp protein, a member of the M protein family, is not sufficient to inhibit phagocytosis of Streptococcus pyogenes. Infection and immunity 63, 345-348 (1995).44. Husmann, L.K., Scott, J.R., Lindahl, G. & Stenberg, L. Expression of the Arp protein, a member of the M protein family, is not sufficient to inhibit phagocytosis of Streptococcus pyogenes. Infection and immunity 63, 345-348 (1995).

45. Gibson, D.G. et al. Enzymatic assembly of DNA molecules up to several hundred kilobases. Nat Methods 6, 343-345 (2009).45. Gibson, D.G. et al. Enzymatic assembly of DNA molecules up to several hundred kilobases. Nat Methods 6, 343-345 (2009).

Claims (59)

1. Не встречающаяся в природе или сконструированная композиция для изменения одного или нескольких представляющих интерес геномных локусов в эукариотической клетке, содержащая векторную систему, которая содержит один или несколько векторов, содержащих 1. A non-naturally occurring or engineered composition for modifying one or more genomic loci of interest in a eukaryotic cell, comprising a vector system that contains one or more vectors containing I) первый промотор, функционально связанный с нуклеотидной последовательностью, кодирующей химерную РНК (chiRNA) системы CRISPR-CAS, где chiRNA содержитI) a first promoter operably linked to a nucleotide sequence encoding a chimeric RNA (chiRNA) of the CRISPR-CAS system, where chiRNA contains (a) направляющую последовательность, способную гибридизоваться с целевой последовательностью в эукариотической клетке и направлять специфичное к последовательности связывание комплекса CRISPR с этой целевой последовательностью,(a) a guide sequence capable of hybridizing with a target sequence in a eukaryotic cell and directing sequence specific binding of the CRISPR complex to that target sequence, (b) парную tracr-последовательность, способную гибридизоваться с tracr-последовательностью, и (b) a paired tracr sequence capable of hybridizing with the tracr sequence, and (c) tracr-последовательность, и(c) a tracr sequence, and II) второй промотор, функционально связанный с кодирующей фермент последовательностью, кодирующей Cas9, содержащей по меньшей мере одну или несколько последовательностей ядерной локализации (NLS) вблизи конца Cas9,Ii) a second promoter operably linked to an enzyme coding sequence for Cas9, containing at least one or more nuclear localization sequences (NLS) near the end of Cas9, где (a), (b) и (c) расположены в 5’-3’ ориентации,where (a), (b) and (c) are located in a 5’-3 ’orientation, где компоненты I) и II) находятся в одном и том же или в различных векторах системы,where the components I) and II) are in the same or in different vectors of the system, где химерная РНК содержит две или более "шпильки",where the chimeric RNA contains two or more hairpins, где эукариотическая клетка не является клеткой зародышевой линии человека.where the eukaryotic cell is not a human germline cell. 2. Композиция по п. 1, отличающаяся тем, что используется множество chiRNA для получения мультиплексной системы.2. The composition according to p. 1, characterized in that it uses a lot of chiRNA to obtain a multiplex system. 3. Система CRISPR-Cas для изменения одного или нескольких представляющих интерес геномных локусов в эукариотической клетке, отличающаяся тем, что содержит один или несколько векторов, содержащих 3. The CRISPR-Cas system for changing one or more genomic loci of interest in a eukaryotic cell, characterized in that it contains one or more vectors containing I) первый промотор, функционально связанный с нуклеотидной последовательностью, кодирующей химерную РНК (chiRNA) системы CRISPR-CAS, где chiRNA содержитI) a first promoter operably linked to a nucleotide sequence encoding a chimeric RNA (chiRNA) of the CRISPR-CAS system, where chiRNA contains (a) направляющую последовательность, способную гибридизироваться с целевой последовательностью в эукариотической клетке и направлять специфичное к последовательности связывание комплекса CRISPR с этой целевой последовательностью,(a) a guide sequence capable of hybridizing with a target sequence in a eukaryotic cell and directing sequence specific binding of the CRISPR complex to that target sequence, (b) парную tracr-последовательность, способную гибридизоваться с tracr-последовательностью, и (b) a paired tracr sequence capable of hybridizing with the tracr sequence, and (c) tracr-последовательность, и(c) a tracr sequence, and II) второй промотор, функционально связанный с кодирующей фермент последовательностью, кодирующей фермент Cas9, содержащий по меньшей мере одну или несколько последовательностей ядерной локализации (NLS) вблизи конца Cas9,II) a second promoter operably linked to an enzyme-coding sequence encoding a Cas9 enzyme comprising at least one or more nuclear localization (NLS) sequences near the end of Cas9, где (a), (b) и (c) расположены в 5’-3’ ориентации,where (a), (b) and (c) are located in a 5’-3 ’orientation, где компоненты I) и II) находятся в одном и том же или в различных векторах системы,where the components I) and II) are in the same or in different vectors of the system, где chiRNA содержит две или более "шпильки" иwhere chiRNA contains two or more hairpins and где один или несколько векторов кодируют множество chiRNA,where one or more vectors encode multiple chiRNA, где эукариотическая клетка не является клеткой зародышевой линии человека.where the eukaryotic cell is not a human germline cell. 4. Композиция по п. 1 или 2 или система по п. 3, отличающаяся тем, что первый промотор является промотором полимеразы III.4. The composition according to p. 1 or 2 or the system according to p. 3, characterized in that the first promoter is a polymerase III promoter. 5. Композиция по п. 1 или 2 или система по п. 3, отличающаяся тем, что второй промотор является промотором полимеразы II.5. The composition according to p. 1 or 2 or the system according to p. 3, characterized in that the second promoter is a promoter of polymerase II. 6. Композиция по п. 1 или 2 или система по п. 3, отличающаяся тем, что Cas9 содержит одну или несколько NLS, достаточно эффективных, чтобы управлять накоплением указанного Cas9 в обнаруживаемом количестве в ядре эукариотической клетки.6. A composition according to claim 1 or 2 or a system according to claim 3, characterized in that Cas9 contains one or more NLS effective enough to control the accumulation of said Cas9 in a detectable amount in the nucleus of a eukaryotic cell. 7. Композиция по п. 1 или 2 или система по п. 3, отличающаяся тем, что tracr-последовательность характеризуется по меньшей мере 50% комплементарности последовательности по длине парной tracr-последовательности при оптимальном выравнивании.7. The composition according to p. 1 or 2 or the system according to p. 3, characterized in that the tracr sequence is characterized by at least 50% complementarity of the sequence along the length of the paired tracr sequence with optimal alignment. 8. Композиция по п. 1 или 2 или система по п. 3, отличающаяся тем, что фермент Cas9 является Cas9 из Streptococcus pyogenes.8. The composition according to p. 1 or 2 or the system according to p. 3, characterized in that the Cas9 enzyme is Cas9 from Streptococcus pyogenes. 9. Композиция по п. 1 или 2 или система по п. 3, отличающаяся тем, что фермент Cas9 является ферментом Cas9 из Staphylococcus aureus или Streptococcus thermophilus.9. The composition according to claim 1 or 2 or the system according to claim 3, wherein the Cas9 enzyme is a Cas9 enzyme from Staphylococcus aureus or Streptococcus thermophilus. 10. Композиция по п. 1 или 2 или система по п. 3, отличающаяся тем, что кодирующая фермент последовательность, кодирующая фермент Cas9, является кодон-оптимизированной для экспрессии в эукариотической клетке.10. The composition of claim 1 or 2 or the system of claim 3, wherein the enzyme coding sequence encoding the Cas9 enzyme is codon-optimized for expression in a eukaryotic cell. 11. Композиция по п. 1 или 2 или система по п. 3, отличающаяся тем, что направляющая последовательность составляет по меньшей мере 15 нуклеотидов в длину.11. The composition according to p. 1 or 2 or the system according to p. 3, characterized in that the guide sequence is at least 15 nucleotides in length. 12. Композиция по п. 1 или 2 или система по п. 3, отличающаяся тем, что полинуклеотидная последовательность химерной РНК содержит две, три, четыре или пять "шпилек".12. The composition according to p. 1 or 2 or the system according to p. 3, characterized in that the polynucleotide sequence of the chimeric RNA contains two, three, four or five "hairpins". 13. Не встречающаяся в природе или сконструированная композиция для изменения одного или нескольких представляющих интерес геномных локусов в эукариотической клетке, содержащая векторную систему, которая содержит один или несколько векторов, содержащих 13. A non-naturally occurring or engineered composition for modifying one or more genomic loci of interest in a eukaryotic cell, comprising a vector system that contains one or more vectors containing I) первый промотор, функционально связанный с нуклеотидной последовательностью, кодирующей направляющую РНК системы CRISPR-Cas, содержащейI) a first promoter operably linked to a nucleotide sequence encoding a RIS guide of a CRISPR-Cas system containing (a) направляющую последовательность, способную гибридизироваться с целевой последовательностью в эукариотической клетке и направлять специфичное к последовательности связывание комплекса CRISPR с этой целевой последовательностью, и(a) a guide sequence capable of hybridizing with a target sequence in a eukaryotic cell and directing sequence specific binding of the CRISPR complex to that target sequence, and (b) парную tracr-последовательность, способную гибридизоваться с tracr-последовательностью,(b) a paired tracr sequence capable of hybridizing with a tracr sequence, II) второй промотор, функционально связанный с кодирующей фермент последовательностью, кодирующей Cas9, содержащий по меньшей мере одну или несколько последовательностей ядерной локализации (NLS) вблизи конца Cas9, иII) a second promoter operably linked to an enzyme coding sequence encoding Cas9 containing at least one or more nuclear localization sequences (NLS) near the end of Cas9, and III) третий промотор, функционально связанный с нуклеотидной последовательностью, кодирующей tracrРНК, содержащую tracr-последовательность,III) a third promoter operably linked to a nucleotide sequence encoding a tracrRNA containing the tracr sequence, где компоненты I), II) и III) находятся в одном и том же или в различных векторах системы,where the components I), II) and III) are in the same or in different vectors of the system, где эукариотическая клетка не является клеткой зародышевой линии человека.where the eukaryotic cell is not a human germline cell. 14. Композиция по п. 13, отличающаяся тем, что используется множество направляющих последовательностей и одна tracr-последовательность для получения мультиплексной системы.14. The composition according to p. 13, characterized in that a plurality of guide sequences and one tracr sequence are used to obtain a multiplex system. 15. Система CRISPR-Cas для изменения одного или нескольких представляющих интерес геномных локусов в эукариотической клетке, отличающаяся тем, что содержит один или несколько векторов, включающих 15. The CRISPR-Cas system for changing one or more genomic loci of interest in a eukaryotic cell, characterized in that it contains one or more vectors, including I) первый промотор, функционально связанный с нуклеотидной последовательностью, кодирующей направляющую РНК системы CRISPR-Cas, содержащейI) a first promoter operably linked to a nucleotide sequence encoding a RIS guide of a CRISPR-Cas system containing (a) направляющую последовательность, способную гибридизироваться с целевой последовательностью в эукариотической клетке и направлять специфичное к последовательности связывание комплекса CRISPR с этой целевой последовательностью, и(a) a guide sequence capable of hybridizing with a target sequence in a eukaryotic cell and directing sequence specific binding of the CRISPR complex to that target sequence, and (b) парную tracr-последовательность, способную гибридизоваться с tracr-последовательностью, (b) a paired tracr sequence capable of hybridizing with a tracr sequence, II) второй промотор, функционально связанный с кодирующей фермент последовательностью, кодирующей Cas9, содержащий по меньшей мере одну или несколько последовательностей ядерной локализации (NLS) вблизи конца Cas9, иII) a second promoter operably linked to an enzyme coding sequence encoding Cas9 containing at least one or more nuclear localization sequences (NLS) near the end of Cas9, and III) третий промотор, функционально связанный с нуклеотидной последовательностью, кодирующей tracrРНК, содержащую tracr-последовательность,III) a third promoter operably linked to a nucleotide sequence encoding a tracrRNA containing the tracr sequence, где компоненты I), II) и III) находятся в одном и том же или в различных векторах системы,where the components I), II) and III) are in the same or in different vectors of the system, где один или несколько векторов кодируют множество направляющих последовательностей и одну tracr-последовательность,where one or more vectors encode multiple guide sequences and one tracr sequence, где эукариотическая клетка не является клеткой зародышевой линии человека.where the eukaryotic cell is not a human germline cell. 16. Композиция по п. 13 или 14 или система по п. 15, отличающаяся тем, что первый промотор является промотором полимеразы III.16. The composition according to p. 13 or 14 or the system according to p. 15, characterized in that the first promoter is a polymerase III promoter. 17. Композиция по п. 13 или 14 или система по п. 15, отличающаяся тем, что второй промотор является промотором полимеразы II.17. The composition according to p. 13 or 14 or the system according to p. 15, characterized in that the second promoter is a polymerase II promoter. 18. Композиция по п. 13 или 14 или система по п. 15, отличающаяся тем, что третий промотор является промотором полимеразы III.18. The composition according to p. 13 or 14 or the system according to p. 15, characterized in that the third promoter is a polymerase III promoter. 19. Композиция по п. 13 или 14 или система по п. 15, отличающаяся тем, что Cas9 содержит одну или несколько NLS, достаточно эффективных, чтобы управлять накоплением указанного Cas9 в обнаруживаемом количестве в ядре эукариотической клетки. 19. A composition according to claim 13 or 14 or a system according to claim 15, characterized in that Cas9 contains one or more NLS effective enough to control the accumulation of said Cas9 in a detectable amount in the nucleus of a eukaryotic cell. 20. Композиция по п. 13 или 14 или система по п. 15, отличающаяся тем, что tracr-последовательность характеризуется по меньшей мере 50% комплементарности последовательности по длине парной tracr-последовательности при оптимальном выравнивании.20. The composition according to p. 13 or 14 or the system according to p. 15, wherein the tracr sequence is characterized by at least 50% complementarity of the sequence along the length of the paired tracr sequence with optimal alignment. 21. Композиция по п. 13 или 14 или система по п. 15, отличающаяся тем, что Cas9 является Cas9 из Streptococcus pyogenes.21. The composition of claim 13 or 14 or the system of claim 15, wherein Cas9 is Cas9 from Streptococcus pyogenes. 22. Композиция по п. 13 или 14 или система по п. 15, отличающаяся тем, что Cas9 является ферментом Cas9 из Staphylococcus aureus или Streptococcus thermophilus.22. The composition of claim 13 or 14 or the system of claim 15, wherein Cas9 is a Cas9 enzyme from Staphylococcus aureus or Streptococcus thermophilus. 23. Композиция по п. 13 или 14 или система по п. 15, отличающаяся тем, что кодирующая фермент последовательность, кодирующая Cas9, является кодон-оптимизированной для экспрессии в эукариотической клетке.23. The composition of claim 13 or 14 or the system of claim 15, wherein the enzyme coding sequence encoding Cas9 is codon-optimized for expression in a eukaryotic cell. 24. Композиция по п. 13 или 14 или система по п. 15, отличающаяся тем, что направляющая последовательность составляет по меньшей мере 15 нуклеотидов в длину.24. The composition according to p. 13 or 14 or the system according to p. 15, characterized in that the guide sequence is at least 15 nucleotides in length. 25. Набор, содержащий композицию по любому из пп. 1, 2, 13 и 14 или систему по любому из пп. 3 и 15 и инструкции по применению указанного набора, для изменения одного или нескольких представляющих интерес геномных локусов в эукариотической клетке, где эукариотическая клетка не является клеткой зародышевой линии человека.25. A kit containing a composition according to any one of paragraphs. 1, 2, 13 and 14 or a system according to any one of paragraphs. 3 and 15 and instructions for using the kit to modify one or more genomic loci of interest in a eukaryotic cell, where the eukaryotic cell is not a human germline cell.
RU2015128102A 2012-12-12 2013-12-12 Crispr-cas system components, methods and compositions for sequence manipulation RU2701662C9 (en)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US201261736527P 2012-12-12 2012-12-12
US61/736,527 2012-12-12
US201361748427P 2013-01-02 2013-01-02
US61/748,427 2013-01-02
US201361757972P 2013-01-29 2013-01-29
US61/757,972 2013-01-29
US201361768959P 2013-02-25 2013-02-25
US61/768,959 2013-02-25
US201361791409P 2013-03-15 2013-03-15
US61/791,409 2013-03-15
US201361835931P 2013-06-17 2013-06-17
US61/835,931 2013-06-17
PCT/US2013/074611 WO2014093595A1 (en) 2012-12-12 2013-12-12 Crispr-cas component systems, methods and compositions for sequence manipulation

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2019127238A Division RU2796549C2 (en) 2012-12-12 2013-12-12 Components of the crispr-cas system, methods and compositions for sequence manipulation

Publications (4)

Publication Number Publication Date
RU2015128102A RU2015128102A (en) 2018-12-21
RU2015128102A3 RU2015128102A3 (en) 2018-12-21
RU2701662C2 RU2701662C2 (en) 2019-09-30
RU2701662C9 true RU2701662C9 (en) 2019-10-31

Family

ID=55306645

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015128102A RU2701662C9 (en) 2012-12-12 2013-12-12 Crispr-cas system components, methods and compositions for sequence manipulation

Country Status (4)

Country Link
DK (1) DK2825654T3 (en)
ES (3) ES2618531T3 (en)
HK (2) HK1208045A1 (en)
RU (1) RU2701662C9 (en)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
EP3177718B1 (en) 2014-07-30 2022-03-16 President and Fellows of Harvard College Cas9 proteins including ligand-dependent inteins
EP3365356B1 (en) 2015-10-23 2023-06-28 President and Fellows of Harvard College Nucleobase editors and uses thereof
GB2568182A (en) 2016-08-03 2019-05-08 Harvard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR102622411B1 (en) 2016-10-14 2024-01-10 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 AAV delivery of nucleobase editor
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
EP3601562A1 (en) 2017-03-23 2020-02-05 President and Fellows of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
EP3676376A2 (en) 2017-08-30 2020-07-08 President and Fellows of Harvard College High efficiency base editors comprising gam
KR20200121782A (en) 2017-10-16 2020-10-26 더 브로드 인스티튜트, 인코퍼레이티드 Uses of adenosine base editor
BR112021018606A2 (en) 2019-03-19 2021-11-23 Harvard College Methods and compositions for editing nucleotide sequences
DE112021002672T5 (en) 2020-05-08 2023-04-13 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EDIT BOTH STRANDS SIMULTANEOUSLY OF A DOUBLE STRANDED NUCLEOTIDE TARGET SEQUENCE

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100076057A1 (en) * 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004046321A2 (en) * 2002-11-15 2004-06-03 Trustees Of Boston University Cis/trans riboregulators
DK3284833T3 (en) * 2005-08-26 2022-02-07 Dupont Nutrition Biosci Aps USE OF CRISPR-ASSOCIATED GENES (CAS)
US20140113376A1 (en) * 2011-06-01 2014-04-24 Rotem Sorek Compositions and methods for downregulating prokaryotic genes

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100076057A1 (en) * 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
GASIUNAS G. et al. "Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria." Proceedings of the National Academy of Sciences, *
GASIUNAS G. et al. "Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria." Proceedings of the National Academy of Sciences, 2012 (published online September 4, 2012), 109(39): E2579-E2586. DELTCHEVA E. et al. "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Nature 471.7340 (2011): 602-607. BARRANGOU R. et al. "CRISPR provides acquired resistance against viruses in prokaryotes." Science, 2007, 315(5819): 1709-1712. MAKAROVA K.S. et al. "Evolution and classification of the CRISPR-Cas systems." NATURE REVIEWS. MICROBIOLOGY, 2011, 9: 467-477. *
JINEK M. et al. "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity." Science, AUGUST 2012, 337(6096): 816-821. *
ПУГАЧ К.С. и др. "CRISPR-системы адаптивного иммунитета прокариот", Молекулярная биология, март-апрель 2012, 46(2):195-203. *

Also Published As

Publication number Publication date
RU2019127238A (en) 2019-09-20
DK2825654T3 (en) 2017-08-21
HK1208045A1 (en) 2016-02-19
RU2701662C2 (en) 2019-09-30
RU2015128102A (en) 2018-12-21
ES2861623T3 (en) 2021-10-06
HK1247961A1 (en) 2018-10-05
RU2015128102A3 (en) 2018-12-21
ES2635244T3 (en) 2017-10-03
ES2618531T3 (en) 2017-06-21

Similar Documents

Publication Publication Date Title
JP7269990B2 (en) CRISPR-Cas Component Systems, Methods and Compositions for Sequence Engineering
JP7463436B2 (en) CRISPR-Cas Systems and Methods for Altering Expression of Gene Products
RU2701662C9 (en) Crispr-cas system components, methods and compositions for sequence manipulation
JP7198328B2 (en) Engineering Systems, Methods and Optimization Guide Compositions for Sequence Manipulation
DK2921557T3 (en) Design of systems, methods and optimized sequence manipulation guide compositions
KR102649341B1 (en) Compositions and methods for the expression of crispr guide rnas using the h1 promoter
JP2020511931A (en) Improved gene editing

Legal Events

Date Code Title Description
TH4A Reissue of patent specification