JP2022513602A - Droplet diagnostic system and method based on CRISPR system - Google Patents

Droplet diagnostic system and method based on CRISPR system Download PDF

Info

Publication number
JP2022513602A
JP2022513602A JP2021526645A JP2021526645A JP2022513602A JP 2022513602 A JP2022513602 A JP 2022513602A JP 2021526645 A JP2021526645 A JP 2021526645A JP 2021526645 A JP2021526645 A JP 2021526645A JP 2022513602 A JP2022513602 A JP 2022513602A
Authority
JP
Japan
Prior art keywords
rna
sequence
target
crispr
guide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021526645A
Other languages
Japanese (ja)
Other versions
JPWO2020102610A5 (en
Inventor
キャメロン ミルヴォルド
キャサリン アマンダ フレイジェ
ハイデン メトスキー
パルディス サベッティ
ゴーサム タック
ジャレッド ケーヘ
チェリー アッカーマン
ポール ブレイニー
デボラ ハン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Massachusetts Institute of Technology
Original Assignee
Massachusetts Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Massachusetts Institute of Technology filed Critical Massachusetts Institute of Technology
Publication of JP2022513602A publication Critical patent/JP2022513602A/en
Publication of JPWO2020102610A5 publication Critical patent/JPWO2020102610A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L3/00Containers or dishes for laboratory use, e.g. laboratory glassware; Droppers
    • B01L3/50Containers for the purpose of retaining a material to be analysed, e.g. test tubes
    • B01L3/502Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures
    • B01L3/5027Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures by integrated microfluidic structures, i.e. dimensions of channels and chambers are such that surface tension forces are important, e.g. lab-on-a-chip
    • B01L3/502761Containers for the purpose of retaining a material to be analysed, e.g. test tubes with fluid transport, e.g. in multi-compartment structures by integrated microfluidic structures, i.e. dimensions of channels and chambers are such that surface tension forces are important, e.g. lab-on-a-chip specially adapted for handling suspended solids or molecules independently from the bulk fluid flow, e.g. for trapping or sorting beads, for physically stretching molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/1023Microstructural devices for non-optical measurement
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01LCHEMICAL OR PHYSICAL LABORATORY APPARATUS FOR GENERAL USE
    • B01L2200/00Solutions for specific problems relating to chemical or physical laboratory apparatus
    • B01L2200/06Fluid handling related problems
    • B01L2200/0647Handling flowable solids, e.g. microscopic beads, cells, particles
    • B01L2200/0652Sorting or classification of particles or molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/107Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/60Detection means characterised by use of a special device
    • C12Q2565/629Detection means characterised by use of a special device being a microfluidic device
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G01N2021/6439Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Physics & Mathematics (AREA)
  • Dispersion Chemistry (AREA)
  • Fluid Mechanics (AREA)
  • Clinical Laboratory Science (AREA)
  • Virology (AREA)
  • Optics & Photonics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Hematology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

RNA標的タンパク質は、アトモル感度で液滴中で検出することにより、堅牢で大規模に多重化されたCRISPRベースの診断を提供するために利用される。ナノリットル容量で同等レベルの感度でDNAとRNAの両方を検出すると、例えば、ウイルスの検出、細菌株のタイピング、高感度のジェノタイピングを含む、ヒトの健康に関する複数のシナリオでのアプリケーションとともに、単一の塩基対の違いに基づいて標的と非標的を区別できる。【選択図】図1RNA target proteins are utilized to provide robust, massively multiplexed CRISPR-based diagnostics by detecting in droplets with atomor sensitivity. Detecting both DNA and RNA at comparable levels of sensitivity in nanoliter volumes is simply along with applications in multiple scenarios of human health, including, for example, virus detection, bacterial strain typing, and sensitive genotyping. Targets and non-targets can be distinguished based on the difference in one base pair. [Selection diagram] Fig. 1

Description

関連出願の相互参照
本出願は、2018年11月14日出願の米国仮出願第62/767,070号、2019年5月1日出願の米国仮出願第62/841,812号、及び2019年7月5日出願の米国仮出願第62/871,056号の権益を主張する。上述の出願の全内容は、参照により本明細書に完全に組み込まれる。
Mutual reference to related applications This application is for US provisional application Nos. 62 / 767,070 filed November 14, 2018, US provisional application Nos. 62 / 841,812 filed May 1, 2019, and 2019. Claims interests in US Provisional Application No. 62 / 871,056 filed on July 5th. The entire contents of the above application are incorporated herein by reference in their entirety.

電子配列表への参照
サイズは217KBで、2019年10月7日に作成された電子配列表(BROD_3830WP_ST25.txt)の内容は、参照によりその全体が本書に組み込まれる。
[技術分野]
Reference to electronic sequence listing The size is 217KB, and the entire contents of the electronic sequence listing (BROD_3830WP_ST25.txt) prepared on October 7, 2019 are incorporated herein by reference in their entirety.
[Technical field]

本明細書に開示される主題は、概して、CRISPR系の使用に関連する液滴診断を対象とする。 The subjects disclosed herein are generally intended for droplet diagnostics related to the use of the CRISPR system.

迅速な時間枠で多数のサンプルに対して高い感度と単一塩基特異性で核酸を迅速に検出する能力は、多くの疾患の診断とモニタリングに革命を起こし、貴重な疫学情報を提供し、一般化可能な科学ツールとして役立ち得る。一度に多数のサンプルを試験できるプラットフォームでは、少量のサンプルを利用することで、現在の最先端技術よりも明確な利点をもたらす。例えば、qPCRアプローチは高感度であるが、高価であり、複雑な機器に依存しているため、実験室の環境で高度に訓練されたオペレーターのみが使用できる。等温核酸増幅とポータブルプラットフォームを組み合わせた新しい方法(Du et al.,2017;Pardee et al.,2016)などの他のアプローチは、ポイントオブケア(POC)環境で高い検出特異性を提供するが、感度が低いため、アプリケーションが幾分制限される。核酸診断が様々なヘルスケアアプリケーションにますます重要になるにつれて、低コストで高い特異性と感度を備えた大規模な多重化を可能にする検出技術は、臨床と基礎研究の両方の環境で非常に有用であり、最終的にサンプルの汎ウイルス、汎細菌、または汎病原体の試験を可能にする。 The ability to rapidly detect nucleic acids with high sensitivity and single-base specificity for large numbers of samples in a rapid time frame has revolutionized the diagnosis and monitoring of many diseases, providing valuable epidemiological information and in general. It can be useful as a scientific tool that can be transformed. For platforms that can test large numbers of samples at once, using small samples offers clear advantages over current state-of-the-art technology. For example, the qPCR approach is sensitive, but expensive and relies on complex equipment, so it can only be used by highly trained operators in a laboratory environment. Other approaches, such as a new method combining isothermal nucleic acid amplification and a portable platform (Du et al., 2017; Pardee et al., 2016), provide high detection specificity in a point-of-care (POC) environment. The low sensitivity limits the application somewhat. As nucleic acid diagnostics become increasingly important in a variety of healthcare applications, detection techniques that enable large-scale multiplexing at low cost with high specificity and sensitivity are critical in both clinical and basic research environments. It is useful for testing pan-viruses, pan-bacteria, or pan-pathogens in a sample.

特定の例示的な実施形態では、検出CRISPR系、1つ以上の標的分子の光学バーコード、及びマイクロ流体デバイスを含む多重検出システムが提供される。いくつかの実施形態では、検出CRISPR系は、DNAまたはRNA標的タンパク質、対応する標的分子に結合するように設計された1つ以上のガイドRNA、マスキング構築物、及び光学バーコードを含む。いくつかの実施形態では、マイクロ流体デバイスは、マイクロウェルのアレイと、マイクロウェルの下に少なくとも1つのフローチャネルとを含み、マイクロウェルは、少なくとも2つの液滴を捕捉するサイズである。 In certain exemplary embodiments, a detection CRISPR system is provided that includes an optical barcode of one or more target molecules, and a multiplex detection system that includes a microfluidic device. In some embodiments, the detection CRISPR system comprises a DNA or RNA target protein, one or more guide RNAs designed to bind to the corresponding target molecule, a masking construct, and an optical barcode. In some embodiments, the microfluidic device comprises an array of microwells and at least one flow channel beneath the microwells, the microwells being sized to capture at least two droplets.

任意選択で核酸に基づくマスキング構築物は、いくつかの実施形態において、検出可能な陽性シグナルの生成を抑制する。他の実施形態では、RNAベースのマスキング構築物は、検出可能な陽性シグナルをマスキングするか、または代わりに検出可能な陰性シグナルを生成することにより、検出可能な陽性シグナルの生成を抑制する。一態様では、マスキング構築物はRNAベースである。特定の実施形態では、RNAベースのマスキング構築物は、レポーティング構築物によってコードされる遺伝子産物の生成を抑制するサイレンシングRNAを含み、遺伝子産物は、発現時に検出可能な陽性シグナルを生成する。 Nucleic acid-based masking constructs, optionally, suppress the generation of detectable positive signals in some embodiments. In other embodiments, the RNA-based masking construct suppresses the generation of detectable positive signals by masking the detectable positive signal or instead producing a detectable negative signal. In one aspect, the masking construct is RNA based. In certain embodiments, the RNA-based masking construct comprises silencing RNA that suppresses the production of the gene product encoded by the reporting construct, which produces a detectable positive signal upon expression.

RNAベースのマスキング構築物は、一実施形態において、陰性の検出可能なシグナルを生成するリボザイムであり得、ここで、陽性の検出可能なシグナルは、リボザイムが不活性化されたときに生成され、基質を第1の色に変換することができ、リボザイムが失活すると基質が第2の色に変換する。 An RNA-based masking construct can, in one embodiment, be a ribozyme that produces a negative detectable signal, where a positive detectable signal is produced when the ribozyme is inactivated and is a substrate. Can be converted to the first color, and when the ribozyme is inactivated, the substrate is converted to the second color.

いくつかの実施形態では、RNAベースのマスキング構築物は、検出可能なリガンド及びマスキング成分が付着するRNAオリゴヌクレオチドを含む。いくつかの実施形態では、検出可能なリガンドはフルオロフォアであり、マスキング成分はクエンチャー分子である。 In some embodiments, the RNA-based masking construct comprises an RNA oligonucleotide to which a detectable ligand and masking component are attached. In some embodiments, the detectable ligand is a fluorophore and the masking component is a quencher molecule.

RNAベースのマスキング構築物は、架橋分子によって凝集して保持されたナノ粒子を含むことができ、架橋分子の少なくとも一部はRNAを含み、ナノ粒子が溶液中に分散されると、溶液はカラーシフトを受け、任意選択で、ナノ粒子はコロイド金属であり、場合によってはコロイド金である。RNAベースのマスキング構築物はまた、連結分子によって1つ以上のクエンチャー分子に連結された量子ドットを含むことができ、連結分子の少なくとも一部はRNAを含む。 RNA-based masking constructs can contain nanoparticles aggregated and retained by cross-linking molecules, at least a portion of the cross-linking molecules contain RNA, and when the nanoparticles are dispersed in solution, the solution color shifts. And, optionally, the nanoparticles are colloidal metals and, in some cases, colloidal gold. RNA-based masking constructs can also contain quantum dots linked to one or more quencher molecules by a linking molecule, at least a portion of the linking molecule containing RNA.

場合によっては、RNAベースのマスキング構築物は、挿入剤と複合したRNAを含み、挿入剤はRNAの切断時に吸光度を変化させる。場合によっては、挿入剤はピロニン-Yまたはメチレンブルーである。 In some cases, RNA-based masking constructs include RNA compounded with an insert, which alters the absorbance upon cleavage of the RNA. In some cases, the insert may be pyronin-Y or methylene blue.

RNAベースのマスキング剤はまた、RNAアプタマーであることができ、及び/またはRNA係留阻害剤を含み、場合によっては、アプタマーまたはRNA係留阻害剤は酵素を隔離し、酵素は、基質に作用することによってアプタマーまたはRNA係留阻害剤からの放出時に検出可能なシグナルを生成する。特定の実施形態では、アプタマーは、酵素を阻害し、酵素が基質からの検出可能なシグナルの生成を触媒するのを妨げる阻害アプタマーであり、またはRNA係留阻害剤は、酵素を阻害し、酵素が基質からの検出可能なシグナルの生成を触媒するのを妨げる。酵素は、場合によっては、トロンビン、プロテインC、好中球エラスターゼ、サブチリシン、西洋ワサビペルオキシダーゼ、ベータ-ガラクトシダーゼ、または子ウシアルカリホスファターゼである。酵素がトロンビンの場合、基質はトロンビンのペプチド基質にパラニトロアニリドを共有結合するか、またはトロンビンのペプチド基質に7-アミノ-4-メチルクマリンを共有結合させることができる。アプタマーは、アプタマーから放出されたときに結合して検出可能なシグナルを生成する薬剤のペアを隔離できる。 RNA-based masking agents can also be RNA aptamers and / or include RNA anchoring inhibitors, in which cases the aptamer or RNA anchoring inhibitor sequesters the enzyme and the enzyme acts on the substrate. Generates a detectable signal upon release from an aptamer or RNA mooring inhibitor. In certain embodiments, the aptamer is an inhibitory aptamer that inhibits the enzyme and prevents the enzyme from catalyzing the production of a detectable signal from the substrate, or an RNA mooring inhibitor is an inhibitor of the enzyme and the enzyme. Prevents catalyzing the generation of detectable signals from the substrate. Enzymes are, in some cases, thrombin, protein C, neutrophil elastase, subtilisin, horseradish peroxidase, beta-galactosidase, or calf alkaline phosphatase. If the enzyme is thrombin, the substrate can be covalently bound to paranitroanilide to the thrombin peptide substrate or to covalently bind 7-amino-4-methylcoumarin to the thrombin peptide substrate. Aptamers can sequester pairs of drugs that bind when released from an aptamer to produce a detectable signal.

一態様では、本明細書に開示される実施形態は、サンプル中の標的核酸を検出する方法を対象とする。本明細書に開示される方法は、いくつかの実施形態において、第1のセットの液滴を生成するステップであって、第1のセットの液滴における各液滴は、少なくとも1つの標的分子及び光学バーコードを含む、ステップと;第2のセットの液滴を生成するステップであって、第2のセットの液滴の各液滴は、Casタンパク質、例えばRNA標的タンパク質、及び対応する標的分子に結合するように設計された1つ以上のガイドRNA、RNAベースのマスキング構築物、及び任意選択で光学バーコードを含む検出CRISPR系を含む、ステップと;第1のセットと第2のセットの液滴を組み合わせて液滴のプールにし、組み合わせた液滴のプールを、マイクロウェルのアレイ、及びマイクロウェルの下の少なくとも1つのフローチャネルを含むマイクロ流体デバイス上に流すステップであって、マイクロウェルが少なくとも2つの液滴を捕捉するサイズであるステップと;マイクロウェルで液滴を捕捉し、各マイクロウェルで捕捉された液滴の光学バーコードを検出するステップと;各マイクロウェルで捕捉された液滴を、各マイクロウェルで形成されたマージ液滴にマージするステップであって、マージ液滴の少なくともサブセットは、検出CRISPR系及び標的配列を含む、ステップと;検出反応を開始するステップと、を含む。次いで、マージ液滴は、1つ以上のガイドRNAを1つ以上の標的分子に結合させるのに十分な条件下で維持される。1つ以上のガイドRNAが標的核酸に結合すると、転じてCRISPRタンパク質を活性化する。活性化されると、CRISPRタンパク質は、例えば、検出可能な陽性シグナルがマスキング解除、放出、または生成されるようにマスキング構築物を切断することにより、マスキング構築物を不活性化する。1つ以上の時間周期で各マージ液滴の検出可能なシグナルの検出及び測定を行うことができ、例えば、陽性の検出可能なシグナルが存在するとき、標的分子の存在を示す。開示される方法は、標的分子を増幅するステップを含むことができ、増幅は、場合によっては、RPAまたはPCRであり得る。 In one aspect, the embodiments disclosed herein are directed to a method of detecting a target nucleic acid in a sample. The method disclosed herein is, in some embodiments, a step of producing a first set of droplets, where each droplet in the first set of droplets is at least one target molecule. And a step comprising an optical bar code; a second set of droplets, each droplet of which is a Cas protein, eg, an RNA target protein, and a corresponding target. With one or more guide RNAs designed to bind to the molecule, an RNA-based masking construct, and optionally a detection CRISPR system containing an optical barcode; the first set and the second set. A step of combining droplets into a pool of droplets and flowing the pool of combined droplets onto an array of microwells and a microfluidic device containing at least one flow channel under the microwells. Is a size that captures at least two droplets; a step that captures the droplets in the microwells and a step that detects the optical barcode of the droplets captured in each microwell; The step of merging the droplet into the merged droplet formed at each microwell, wherein at least a subset of the merged droplet comprises the detection CRISPR system and the target sequence; and the step of initiating the detection reaction. including. The merged droplets are then maintained under conditions sufficient to bind one or more guide RNAs to one or more target molecules. When one or more guide RNAs bind to the target nucleic acid, they in turn activate the CRISPR protein. Upon activation, the CRISPR protein inactivates the masking construct, for example by cleaving the masking construct so that a detectable positive signal is unmasked, released, or produced. The detectable signal of each merged droplet can be detected and measured in one or more time cycles, eg, the presence of a positive detectable signal indicates the presence of a target molecule. The disclosed method can include the step of amplifying the target molecule, and the amplification can optionally be RPA or PCR.

標的分子は、いくつかの実施形態において、生体サンプルまたは環境サンプルに含まれる。いくつかの実施形態では、サンプルはヒト由来である。生体サンプルは、いくつかの実施形態では、血液、血漿、血清、尿、大便、痰、粘液、リンパ液、滑液、胆汁、腹水、胸水、漿液腫、唾液、脳脊髄液、房水もしくは硝子体液、または任意の体の分泌物、濾出液、浸出液、または関節から得られた液体、または皮膚もしくは粘膜表面のスワブである。生体サンプルは、さらなる評価の前に、例えば、目的の細胞を濃縮または単離することを含む、さらに処理をされてもよい。 The target molecule is included in a biological sample or an environmental sample in some embodiments. In some embodiments, the sample is of human origin. In some embodiments, the biological sample is blood, plasma, serum, urine, stool, sputum, mucus, lymph, synovial fluid, bile, ascites, pleural effusion, serous tumor, saliva, cerebrospinal fluid, aqueous humor or vitreous humor. , Or any body fluid, serum, exudate, or fluid obtained from a joint, or a swab on the surface of the skin or mucous membrane. The biological sample may be further treated, including, for example, enriching or isolating the cells of interest prior to further evaluation.

1つ以上のガイドRNAは、(合成)ミスマッチを含む対応する標的分子に結合するように設計されており、ミスマッチは、標的分子における単一ヌクレオチド多型(SNP)または他の単一ヌクレオチド変異の上流または下流のミスマッチであり得る。1つ以上のガイドRNAは、標的RNAもしくはDNA中の一塩基多型、またはRNA転写物のスプライスバリアントを検出するように設計することができる。場合によっては、ウイルス感染における薬剤耐性SNPを検出するようにガイドRNAを設計することができる。いくつかの実施形態では、ガイドRNAは、疾患状態に特徴的な1つ以上の標的分子に結合するように設計することもできる。任意選択で、疾患状態は、薬剤耐性または感受性遺伝子または転写物またはポリペプチドの有無によって特徴付けることができ、場合によっては感染症でもあってもよい。場合によっては、感染症はウイルス、細菌、真菌、原虫、または寄生虫によって引き起こされる。ガイドRNAは、1つ以上の微生物株を区別するように設計されている。ガイドRNAは、場合によっては、少なくとも90のガイドRNAを含むことができる。 One or more guide RNAs are designed to bind to the corresponding target molecule, including the (synthetic) mismatch, where the mismatch is a single nucleotide polymorphism (SNP) or other single nucleotide mutation in the target molecule. It can be an upstream or downstream mismatch. One or more guide RNAs can be designed to detect single nucleotide polymorphisms in the target RNA or DNA, or spliced variants of RNA transcripts. In some cases, guide RNAs can be designed to detect drug-resistant SNPs in viral infections. In some embodiments, the guide RNA can also be designed to bind to one or more target molecules that are characteristic of the disease state. Optionally, the disease state can be characterized by the presence or absence of drug resistance or susceptibility genes or transcripts or polypeptides, and in some cases may be an infectious disease. In some cases, infections are caused by viruses, bacteria, fungi, protozoans, or parasites. Guide RNAs are designed to distinguish one or more microbial strains. The guide RNA can optionally include at least 90 guide RNAs.

標的タンパク質は、いくつかの実施形態において、1つ以上のRuvC様ドメインを含むことができる。特定の実施形態では、CRISPRタンパク質はCas12であり、実施形態では、Cas12はCpf1またはC2c1である。標的タンパク質は、いくつかの実施形態では、1つ以上のHEPNドメインを含むことができ、場合によってはRxxxxHモチーフ配列を含むことができる。場合によっては、RxxxHモチーフはR{N/H/K]XH(配列番号1)配列を含み、いくつかの実施形態では、Xは、R、S、D、E、Q、N、G、またはYであり、Xは、独立してI、S、T、V、またはLであり、Xは、独立してL、F、N、Y、V、I、S、D、E、またはAである。いくつかの特定の実施形態では、CRISPR RNA標的タンパク質は、Cas13である。特定の実施形態では、Cas13は、Cas13a、Cas13bl、Cas13b2、またはCas13cである、 The target protein can include one or more RuvC-like domains in some embodiments. In certain embodiments, the CRISPR protein is Cas12, and in embodiments, Cas12 is Cpf1 or C2c1. The target protein can, in some embodiments, include one or more HEPN domains, and optionally an RxxxxxxH motif sequence. In some cases, the RxxxH motif comprises an R {N / H / K] X 1 X 2 X 3 H (SEQ ID NO: 1) sequence, wherein in some embodiments X 1 is R, S, D, E, Q, N, G, or Y, X 2 is independently I, S, T, V, or L, and X 3 is independently L, F, N, Y, V, I, S, D, E, or A. In some specific embodiments, the CRISPR RNA target protein is Cas13. In certain embodiments, Cas13 is Cas13a, Cas13bl, Cas13b2, or Cas13c.

場合によっては、光学的評価を行うことは、各マイクロウェルの画像をキャプチャすることを含む。いくつかの実施形態では、光学バーコードは、光学顕微鏡法、蛍光顕微鏡法、ラマン分光法、またはそれらの組み合わせを使用することによって検出される。いくつかの実施形態では、光学バーコードは、特定のサイズ、形状、屈折率、色、またはそれらの組み合わせの粒子を含む。粒子を含む光学バーコードは、コロイド金属粒子、ナノシェル、ナノチューブ、ナノロッド、量子ドット、ヒドロゲル粒子、リポソーム、デンドリマー、または金属-リポソーム粒子を含むことができる。各光学バーコードは1つ以上の蛍光色素を含み、蛍光色素の比率が異なってもよい。測定可能な検出可能なシグナルは、場合によっては蛍光のレベルであってよい。 In some cases, performing an optical evaluation involves capturing an image of each microwell. In some embodiments, optical barcodes are detected by using light microscopy, fluorescence microscopy, Raman spectroscopy, or a combination thereof. In some embodiments, the optical barcode comprises particles of a particular size, shape, index of refraction, color, or a combination thereof. Optical barcodes containing particles can include colloidal metal particles, nanoshells, nanotubes, nanorods, quantum dots, hydrogel particles, liposomes, dendrimers, or metal-liposomal particles. Each optical barcode contains one or more fluorescent dyes, and the ratio of the fluorescent dyes may be different. The measurable detectable signal may optionally be the level of fluorescence.

本明細書に開示されるシステムの方法で使用されるデバイスは、少なくとも40,0000個のマイクロウェルまたは少なくとも190,000個のマイクロウェルのアレイを含むことができる。一実施形態において、RNA標的タンパク質、対応する標的分子に結合するように設計された1つ以上のガイドRNA、RNAベースのマスキング構築物、及び光学バーコードを含む検出CRISPR系と、1つ以上の標的分子の光学バーコードと、マイクロウェルのアレイ及び少なくとも2つの液滴を捕捉するサイズのマイクロウェル間の少なくとも1つのフローチャネルを含むマイクロ流体デバイスと、を含む多重検出システムも開示される。多重検出システムを含むキットも、本開示主題の実施形態で提供される。キットには、診断を実行するための使用説明書、試薬、機器のマイクロ流体プラットフォーム、試薬など、及び方法を校正または実行するための標準が含まれる。本発明によるキットで提供される使用説明書は、標識または別個の添付文書の形で適切な操作パラメーターを対象とすることができる。任意選択で、キットは標準または対照情報をさらに含み、試験サンプルを対照情報標準と比較して、一貫した結果が得られるかどうかを判定することができる。 Devices used in the methods of the system disclosed herein can include an array of at least 40,000 microwells or at least 190,000 microwells. In one embodiment, a detection CRISPR system comprising an RNA target protein, one or more guide RNAs designed to bind to the corresponding target molecule, an RNA-based masking construct, and an optical bar code, and one or more targets. Also disclosed is a multiplex detection system comprising an optical bar code of a molecule and a microfluidic device comprising an array of microwells and at least one flow channel between microwells sized to capture at least two droplets. A kit comprising a multiplex detection system is also provided in embodiments of this disclosed subject matter. The kit contains instructions for performing the diagnosis, reagents, microfluidic platform of the instrument, reagents, etc., and standards for calibrating or performing the method. The instructions provided in the kit according to the invention can be directed to the appropriate operating parameters in the form of signs or separate package inserts. Optionally, the kit further contains standard or control information and the test sample can be compared to the control information standard to determine if consistent results are obtained.

例示的な実施形態のこれら及び他の態様、目的、特徴、及び利点は、示された例示的な実施形態の以下の詳細な説明を考慮すれば、当業者には明らかになるであろう。 These and other aspects, objectives, features, and advantages of the exemplary embodiments will be apparent to those of skill in the art in light of the following detailed description of the exemplary embodiments presented.

本発明の特徴及び利点の理解は、本発明の原理が利用され得る例示的な実施形態を説明する以下の詳細な説明、及びその添付の図面を参照することによって得られるであろう。 An understanding of the features and advantages of the invention will be obtained by reference to the following detailed description illustrating exemplary embodiments in which the principles of the invention may be utilized, and the accompanying drawings thereof.

液滴検出の例示的な方法の概略図を提供する。SHERLOCKによる病原菌の検出は、マイクロウェルのアレイを備えたチップ上の液滴で検出を実行することにより、大量に多重化できる。増幅反応(RPAまたはPCRを使用)は、標準のチューブまたはマイクロウェルで実施できる。次いで、検出及び増幅混合物をマイクロウェルに並べる。蛍光色素の比率で構成される独自の蛍光バーコードを、各検出ミックス及び各標的に追加できる。バーコード化された試薬は油中で乳化され、エマルションからの液滴は一緒に1つのチューブにプールされる。液滴プールは、マイクロウェルアレイを搭載したPDMSチップにロードされる。各マイクロウェルは2つの液滴に対応し、プールされたすべての液滴のペアワイズの組み合わせをランダムに作成する。マイクロウェルをガラスに固定して各ウェルの内容物を隔離し、蛍光顕微鏡を使用してすべての液滴のバーコードを読み取り、各マイクロウェルの内容物を決定する。画像化後、液滴は電場にマージされ、検出ミックスと標的が混合され、検出反応が開始される。チップをインキュベートして反応を進行させ、蛍光顕微鏡を使用してSHERLOCK(特異的高感度酵素的レポーターunLOCKing)反応の進行をモニタリングする。A schematic diagram of an exemplary method of droplet detection is provided. Detection of pathogens by SHERLOCK can be massively multiplexed by performing detection on droplets on a chip equipped with an array of microwells. The amplification reaction (using RPA or PCR) can be performed in standard tubes or microwells. The detection and amplification mixture is then lined up in microwells. A unique fluorescent barcode consisting of the ratio of fluorescent dyes can be added to each detection mix and each target. The barcoded reagents are emulsified in oil and the droplets from the emulsion are pooled together in one tube. The droplet pool is loaded into a PDMS chip equipped with a microwell array. Each microwell corresponds to two droplets and randomly creates a pairwise combination of all pooled droplets. The contents of each well are isolated by fixing the microwells to the glass, and the barcode of all droplets is read using a fluorescence microscope to determine the contents of each microwell. After imaging, the droplets are merged into an electric field, the detection mix and target are mixed, and the detection reaction begins. The chip is incubated to allow the reaction to proceed, and a fluorescence microscope is used to monitor the progress of the SHERLOCK (specifically sensitive enzymatic reporter unLOCKing) reaction.

検出試薬と標的が油中で液滴として安定に乳化できることを示す画像を含む。左:油に乳化された標的の水溶液の白色光画像。右:検出試薬と標的のライブラリーがロードされたマイクロウェルチップの蛍光画像。それぞれに一意の蛍光バーコードを有する。各ウェルの内容物は、蛍光バーコードから決定できる。Includes images showing that the detection reagent and target can be stably emulsified as droplets in oil. Left: White light image of the target aqueous solution emulsified in oil. Right: Fluorescent image of a microwell chip loaded with detection reagents and target library. Each has a unique fluorescent barcode. The content of each well can be determined from the fluorescent barcode.

SHERLOCKがプレートと液滴で同等に良好に機能することを示すグラフを含む。左:プレート中のジカウイルスに対するSHERLOCKの感度曲線。右:液滴中のジカウイルスに対する同じSHERLOCKアッセイの感度曲線。左側のエラーバーは1つの標準偏差を示す。右側のエラーバーはS.E.M.である。Includes a graph showing that SHERLOCK works equally well on plates and droplets. Left: SHERLOCK sensitivity curve to Zika virus in the plate. Right: Sensitivity curve of the same SHERLOCK assay for Zika virus in droplets. The error bar on the left shows one standard deviation. The error bar on the right is S. E. M. Is.

SHERLOCKがプレートと液滴で同等に良好に一塩基多型(SNP)を区別することを示すグラフを提供する。左:ジカウイルスが米国に拡散した際に生じたSNPのSHERLOCKによる区別。右:同じSNPの液滴SHERLOCK検出。左側のエラーバーは1つの標準偏差を示す。右側のエラーバーはS.E.M.である。Provides a graph showing that SHERLOCK distinguishes single nucleotide polymorphisms (SNPs) equally well in plates and droplets. Left: SHERLOCK distinction of SNP that occurred when Zika virus spread to the United States. Right: Droplet SHERLOCK detection of the same SNP. The error bar on the left shows one standard deviation. The error bar on the right is S. E. M. Is.

マイクロウェルアレイ内の液滴中のSHERLOCK検出によってインフルエンザのサブタイプを区別できることを示すヒートマップを含む。crRNAプールのバックグラウンド減算後のフォールドターンオンは、ヒートマップに示される。Includes a heatmap showing that SHERLOCK detection in droplets within a microwell array can distinguish influenza subtypes. The fold turn-on after background subtraction of the crRNA pool is shown in the heatmap.

インフルエンザHサブタイプの多重検出のヒートマップ結果を含む。2008年以降に寄託された配列に基づいて、インフルエンザのHセグメントを標的とする41のcrRNAが設計された。ボックスは、各サブタイプに対して設計されたcrRNAのセットを示し、アスタリスクは、0または1のミスマッチを持つ各サブタイプの大多数のコンセンサス配列に整列するcrRNAを示す。H4、H8、及びH12に対する対照crRNAプールが示される。Includes heatmap results for multiple detections of influenza H subtypes. Based on the sequences deposited since 2008, 41 crRNAs targeting the H segment of influenza have been designed. Boxes indicate the set of crRNAs designed for each subtype, and asterisks indicate crRNAs that align to the majority consensus sequence of each subtype with a mismatch of 0 or 1. Control crRNA pools for H4, H8, and H12 are shown.

インフルエンザHサブタイプの多重検出の第2の設計のヒートマップを示す。2008年以降に寄託された配列に基づき、より新しい配列に優先的な重み付けをして、インフルエンザのHセグメントを標的とする28のcrRNAが設計された。ボックスは、各サブタイプに対して設計されたcrRNAのセットを示し、アスタリスクは、0または1のミスマッチを持つ各サブタイプの大多数のコンセンサス配列に整列するcrRNAを示す。H4、H8、及びH12に対する対照crRNAプールが示される。A second design heatmap for multiple detection of influenza H subtypes is shown. Based on the sequences deposited since 2008, 28 crRNAs targeting the H segment of influenza were designed with preferential weighting to newer sequences. Boxes indicate the set of crRNAs designed for each subtype, and asterisks indicate crRNAs that align to the majority consensus sequence of each subtype with a mismatch of 0 or 1. Control crRNA pools for H4, H8, and H12 are shown.

インフルエンザNサブタイプの多重検出のヒートマップを含む。2008年以降に寄託された配列に基づき、より新しい配列に優先的な重み付けをして、インフルエンザのHセグメントを標的とする35のcrRNAが設計された。ボックスは、各サブタイプに対して設計されたcrRNAのセットを示し、アスタリスクは、0または1のミスマッチを持つ各サブタイプの大多数のコンセンサス配列に整列するcrRNAを示す。「crRNA36」は、crRNAを添加していない陰性対照を示す。Includes a heatmap for multiple detections of influenza N-subtypes. Based on the sequences deposited since 2008, 35 crRNAs targeting the H segment of influenza were designed with preferential weighting to newer sequences. Boxes indicate the set of crRNAs designed for each subtype, and asterisks indicate crRNAs that align to the majority consensus sequence of each subtype with a mismatch of 0 or 1. "CrRNA36" indicates a negative control without the addition of crRNA.

液滴SHERLOCKを使用したHIV逆転写酵素の6つの変異の多重検出を含む。祖先及び派生配列の両方の合成標的を使用して、祖先及び派生の対立遺伝子を標的とするcrRNAの示された変異について、様々な時点での蛍光が示される。合成標的(10cp/μl)は、マルチプレックスPCRを使用して増幅され、液滴SHERLOCKを使用して検出された。エラーバー:S.E.M.Includes multiple detection of 6 mutations in HIV reverse transcriptase using droplet SHERLOCK. Using synthetic targets of both ancestral and derived sequences, fluorescence at various time points is shown for the indicated mutations in the crRNA targeting the ancestral and derived alleles. Synthetic targets ( 104 cp / μl) were amplified using multiplex PCR and detected using droplet SHERLOCK. Error bar: S. E. M.

HIV由来のv0と祖先v1の試験がどのように機能するかを示し、潜在的に一緒に使用できことを示す。It shows how the HIV-derived v0 and ancestor v1 tests work and can potentially be used together.

液滴SHERLOCKを使用したTBの薬剤耐性変異の多重検出の結果を含む。両方の対立遺伝子(参照及び薬剤耐性)について、30分後にバックグラウンドを差し引いた蛍光が示される。Includes the results of multiple detection of drug resistance mutations in TB using droplet SHERLOCK. For both alleles (reference and drug resistance), background-subtracted fluorescence is shown after 30 minutes.

SHERLOCKとマイクロウェルアレイチップテクノロジーの組み合わせが、これまでの多重検出で最高のスループットを提供することを示すグラフである。It is a graph showing that the combination of SHERLOCK and microwell array chip technology provides the highest throughput in multiple detection to date.

バーコード数とチップサイズの拡張により、いかに大量の多重化が可能になるかを示す。(左)3つの蛍光色素を使用して、現在の64のバーコードセットが105のバーコードに拡張された。第4の色素を追加する可能性は、既存のシステムと比較してコーディング精度を損なうことなく小規模で実証されており、数百のバーコードの規模に簡単に拡張できる。(右)既存のチップサイズを4倍にすることができ、アッセイ開発に必要なチップ数を4分の1に削減できる。It shows how a large amount of multiplexing is possible by expanding the number of barcodes and chip size. (Left) The current 64 barcode set was extended to 105 barcodes using 3 fluorochromes. The possibility of adding a fourth dye has been demonstrated on a small scale without compromising coding accuracy compared to existing systems and can easily be extended to hundreds of barcode scales. (Right) The existing chip size can be quadrupled, and the number of chips required for assay development can be reduced to one-fourth.

追加のバーコードと拡張されたチップ寸法の実装により、示されているように、ヒトに関連するすべてのウイルスについて約20のサンプルを一度に試験できることを示すグラフを含む。Includes a graph showing that with additional barcodes and enhanced chip size implementation, about 20 samples can be tested at once for all human-related viruses, as shown.

核酸の多重評価のための組み合わせ配列反応(CARMEN)。ヒト及び動物の集団で循環している複数の病原体の識別は、大規模な検出の問題を表す。Combination sequence reaction (CARMEN) for multiple evaluation of nucleic acids. Identification of multiple pathogens circulating in human and animal populations represents a large-scale detection problem. 核酸の多重評価のための組み合わせ配列反応(CARMEN)。CARMENワークフローの概略図。Combination sequence reaction (CARMEN) for multiple evaluation of nucleic acids. Schematic diagram of the CARMEN workflow. 核酸の多重評価のための組み合わせ配列反応(CARMEN)。ジカウイルスは、アトモル感度と数十の複製液滴ペア(黒い点)を用いた単一のCARMEN-Cas13アッセイによって検出される。赤い線はグラフの中央値を示し、下のヒートマップの作成に使用される。代表的な液滴画像は、グラフの上に表示される。Combination sequence reaction (CARMEN) for multiple evaluation of nucleic acids. Zika virus is detected by a single CARMEN-Cas13 assay with atomor sensitivity and dozens of duplicate droplet pairs (black dots). The red line shows the median of the graph and is used to create the heatmap below. A typical droplet image is displayed above the graph. 核酸の多重評価のための組み合わせ配列反応(CARMEN)。蛍光対入力濃度でグラフ化されたジカウイルスの検出。Combination sequence reaction (CARMEN) for multiple evaluation of nucleic acids. Detection of Zika virus graphed by fluorescence pair input concentration.

CARMEN-cas13によるヒト関連ウイルスの包括的な識別。A.10以上の利用可能なゲノム配列を持つすべてのヒト関連ウイルスのパネルの開発と試験。B.実験設計、及びC.CARMEN-cas13を使用した包括的なヒト関連ウイルスパネルの試験。ヒートマップは、検出の1時間後にバックグラウンドを差し引いた蛍光を示す。PCRプライマープールとウイルスの科は、それぞれヒートマップの下と左にある。灰色の線:試験されなかったcrRNA。Comprehensive identification of human-related viruses by CARMEN-cas13. A. Development and testing of a panel of all human-related viruses with 10 or more available genomic sequences. B. Experimental design and C.I. Comprehensive human-related virus panel testing using CARMEN-cas13. The heat map shows fluorescence with background subtracted 1 hour after detection. The PCR primer pool and the viral family are below and to the left of the heatmap, respectively. Gray line: crRNA not tested.

CARMEN-cas13によるインフルエンザのサブタイプの識別。CARMEN-cas13を使用したインフルエンザAサブタイプ識別の概略図。Identification of influenza subtypes by CARMEN-cas13. Schematic diagram of influenza A subtype identification using CARMEN-cas13. CARMEN-cas13によるインフルエンザのサブタイプの識別。CARMEN-cas13を使用したH1-H16の識別。ヒートマップは、cas13検出の1時間後にバックグラウンドを差し引いた蛍光を示す。合成標的は、104cp/ulで使用された。Identification of influenza subtypes by CARMEN-cas13. Identification of H1-H16 using CARMEN-cas13. The heat map shows the fluorescence with the background subtracted 1 hour after the detection of cas13. The synthetic target was used at 104 cp / ul. CARMEN-cas13によるインフルエンザのサブタイプの識別。CARMEN-cas13を使用したN1-N9の識別。ヒートマップは、cas13検出の3時間後にバックグラウンドを差し引いた蛍光を示す。合成標的は、104cp/ulで使用された。Identification of influenza subtypes by CARMEN-cas13. Identification of N1-N9 using CARMEN-cas13. The heat map shows the fluorescence with the background subtracted 3 hours after the detection of cas13. The synthetic target was used at 104 cp / ul. CARMEN-cas13によるインフルエンザのサブタイプの識別。ウイルス種ストック及び合成標的からのH及びNサブタイプの同定。ヒートマップは、cas13検出の3時間後にバックグラウンドを差し引いた蛍光を示す。合成標的は、104cp/ulで使用された。Identification of influenza subtypes by CARMEN-cas13. Identification of H and N subtypes from virus species stocks and synthetic targets. The heat map shows the fluorescence with the background subtracted 3 hours after the detection of cas13. The synthetic target was used at 104 cp / ul.

CARMEN-cas13による多重化DRM識別。A.CARMEN-cas13を使用したHIV薬剤耐性変異(DRM)識別の概略図。B.CARMEN-cas13を使用した6つの逆転写酵素変異の識別。C.CARMEN-cas13を使用した患者血漿サンプル中のDRM識別。D.CARMEN-cas13を使用した21のインテグラーゼDRMの識別。ヒートマップは、cas13検出の0.5~3時間後のSNPインデックスを示す。B及びDは、行ごとに正規化されている。B~Dにおいて、合成標的は、104cp/ulで使用された。Dにおけるアスタリスクは、変異のある標的を示す。ボックスは、同じコドン内の複数の変異を示す。E.K103N逆転写酵素変異についてのDRM頻度対SNPインデックスを示す。F.CARMEN-cas13を使用した患者血漿及び血清のサンプル中のDRM識別。Multiplexed DRM identification by CARMEN-cas13. A. Schematic diagram of HIV drug resistance mutation (DRM) identification using CARMEN-cas13. B. Identification of 6 reverse transcriptase mutations using CARMEN-cas13. C. DRM identification in patient plasma samples using CARMEN-cas13. D. Identification of 21 integrase DRM using CARMEN-cas13. The heat map shows the SNP index 0.5 to 3 hours after the detection of cas13. B and D are normalized row by row. In BD, the synthetic target was used at 104 cp / ul. An asterisk in D indicates a mutated target. The box indicates multiple mutations within the same codon. E. The DRM frequency vs. SNP index for the K103N reverse transcriptase mutation is shown. F. DRM identification in patient plasma and serum samples using CARMEN-cas13. CARMEN-cas13による多重化DRM識別。A.CARMEN-cas13を使用したHIV薬剤耐性変異(DRM)識別の概略図。B.CARMEN-cas13を使用した6つの逆転写酵素変異の識別。C.CARMEN-cas13を使用した患者血漿サンプル中のDRM識別。D.CARMEN-cas13を使用した21のインテグラーゼDRMの識別。ヒートマップは、cas13検出の0.5~3時間後のSNPインデックスを示す。B及びDは、行ごとに正規化されている。B~Dにおいて、合成標的は、104cp/ulで使用された。Dにおけるアスタリスクは、変異のある標的を示す。ボックスは、同じコドン内の複数の変異を示す。E.K103N逆転写酵素変異についてのDRM頻度対SNPインデックスを示す。F.CARMEN-cas13を使用した患者血漿及び血清のサンプル中のDRM識別。Multiplexed DRM identification by CARMEN-cas13. A. Schematic diagram of HIV drug resistance mutation (DRM) identification using CARMEN-cas13. B. Identification of 6 reverse transcriptase mutations using CARMEN-cas13. C. DRM identification in patient plasma samples using CARMEN-cas13. D. Identification of 21 integrase DRM using CARMEN-cas13. The heat map shows the SNP index 0.5 to 3 hours after the detection of cas13. B and D are normalized line by line. In BD, the synthetic target was used at 104 cp / ul. An asterisk in D indicates a mutated target. The box indicates multiple mutations within the same codon. E. The DRM frequency vs. SNP index for the K103N reverse transcriptase mutation is shown. F. DRM identification in patient plasma and serum samples using CARMEN-cas13. CARMEN-cas13による多重化DRM識別。A.CARMEN-cas13を使用したHIV薬剤耐性変異(DRM)識別の概略図。B.CARMEN-cas13を使用した6つの逆転写酵素変異の識別。C.CARMEN-cas13を使用した患者血漿サンプル中のDRM識別。D.CARMEN-cas13を使用した21のインテグラーゼDRMの識別。ヒートマップは、cas13検出の0.5~3時間後のSNPインデックスを示す。B及びDは、行ごとに正規化されている。B~Dにおいて、合成標的は、104cp/ulで使用された。Dにおけるアスタリスクは、変異のある標的を示す。ボックスは、同じコドン内の複数の変異を示す。E.K103N逆転写酵素変異についてのDRM頻度対SNPインデックスを示す。F.CARMEN-cas13を使用した患者血漿及び血清のサンプル中のDRM識別。Multiplexed DRM identification by CARMEN-cas13. A. Schematic diagram of HIV drug resistance mutation (DRM) identification using CARMEN-cas13. B. Identification of 6 reverse transcriptase mutations using CARMEN-cas13. C. DRM identification in patient plasma samples using CARMEN-cas13. D. Identification of 21 integrase DRM using CARMEN-cas13. The heat map shows the SNP index 0.5 to 3 hours after the detection of cas13. B and D are normalized line by line. In BD, the synthetic target was used at 104 cp / ul. An asterisk in D indicates a mutated target. The box indicates multiple mutations within the same codon. E. The DRM frequency vs. SNP index for the K103N reverse transcriptase mutation is shown. F. DRM identification in patient plasma and serum samples using CARMEN-cas13. CARMEN-cas13による多重化DRM識別。A.CARMEN-cas13を使用したHIV薬剤耐性変異(DRM)識別の概略図。B.CARMEN-cas13を使用した6つの逆転写酵素変異の識別。C.CARMEN-cas13を使用した患者血漿サンプル中のDRM識別。D.CARMEN-cas13を使用した21のインテグラーゼDRMの識別。ヒートマップは、cas13検出の0.5~3時間後のSNPインデックスを示す。B及びDは、行ごとに正規化されている。B~Dにおいて、合成標的は、104cp/ulで使用された。Dにおけるアスタリスクは、変異のある標的を示す。ボックスは、同じコドン内の複数の変異を示す。E.K103N逆転写酵素変異についてのDRM頻度対SNPインデックスを示す。F.CARMEN-cas13を使用した患者血漿及び血清のサンプル中のDRM識別。Multiplexed DRM identification by CARMEN-cas13. A. Schematic diagram of HIV drug resistance mutation (DRM) identification using CARMEN-cas13. B. Identification of 6 reverse transcriptase mutations using CARMEN-cas13. C. DRM identification in patient plasma samples using CARMEN-cas13. D. Identification of 21 integrase DRM using CARMEN-cas13. The heat map shows the SNP index 0.5 to 3 hours after the detection of cas13. B and D are normalized row by row. In BD, the synthetic target was used at 104 cp / ul. An asterisk in D indicates a mutated target. The box indicates multiple mutations within the same codon. E. The DRM frequency vs. SNP index for the K103N reverse transcriptase mutation is shown. F. DRM identification in patient plasma and serum samples using CARMEN-cas13. CARMEN-cas13による多重化DRM識別。A.CARMEN-cas13を使用したHIV薬剤耐性変異(DRM)識別の概略図。B.CARMEN-cas13を使用した6つの逆転写酵素変異の識別。C.CARMEN-cas13を使用した患者血漿サンプル中のDRM識別。D.CARMEN-cas13を使用した21のインテグラーゼDRMの識別。ヒートマップは、cas13検出の0.5~3時間後のSNPインデックスを示す。B及びDは、行ごとに正規化されている。B~Dにおいて、合成標的は、104cp/ulで使用された。Dにおけるアスタリスクは、変異のある標的を示す。ボックスは、同じコドン内の複数の変異を示す。E.K103N逆転写酵素変異についてのDRM頻度対SNPインデックスを示す。F.CARMEN-cas13を使用した患者血漿及び血清のサンプル中のDRM識別。Multiplexed DRM identification by CARMEN-cas13. A. Schematic diagram of HIV drug resistance mutation (DRM) identification using CARMEN-cas13. B. Identification of 6 reverse transcriptase mutations using CARMEN-cas13. C. DRM identification in patient plasma samples using CARMEN-cas13. D. Identification of 21 integrase DRM using CARMEN-cas13. The heat map shows the SNP index 0.5 to 3 hours after the detection of cas13. B and D are normalized row by row. In BD, the synthetic target was used at 104 cp / ul. An asterisk in D indicates a mutated target. The box indicates multiple mutations within the same codon. E. The DRM frequency vs. SNP index for the K103N reverse transcriptase mutation is shown. F. DRM identification in patient plasma and serum samples using CARMEN-cas13. CARMEN-cas13による多重化DRM識別。A.CARMEN-cas13を使用したHIV薬剤耐性変異(DRM)識別の概略図。B.CARMEN-cas13を使用した6つの逆転写酵素変異の識別。C.CARMEN-cas13を使用した患者血漿サンプル中のDRM識別。D.CARMEN-cas13を使用した21のインテグラーゼDRMの識別。ヒートマップは、cas13検出の0.5~3時間後のSNPインデックスを示す。B及びDは、行ごとに正規化されている。B~Dにおいて、合成標的は、104cp/ulで使用された。Dにおけるアスタリスクは、変異のある標的を示す。ボックスは、同じコドン内の複数の変異を示す。E.K103N逆転写酵素変異についてのDRM頻度対SNPインデックスを示す。F.CARMEN-cas13を使用した患者血漿及び血清のサンプル中のDRM識別。Multiplexed DRM identification by CARMEN-cas13. A. Schematic diagram of HIV drug resistance mutation (DRM) identification using CARMEN-cas13. B. Identification of 6 reverse transcriptase mutations using CARMEN-cas13. C. DRM identification in patient plasma samples using CARMEN-cas13. D. Identification of 21 integrase DRM using CARMEN-cas13. The heat map shows the SNP index 0.5 to 3 hours after the detection of cas13. B and D are normalized row by row. In BD, the synthetic target was used at 104 cp / ul. An asterisk in D indicates a mutated target. The box indicates multiple mutations within the same codon. E. The DRM frequency vs. SNP index for the K103N reverse transcriptase mutation is shown. F. DRM identification in patient plasma and serum samples using CARMEN-cas13.

CARMEN-cas13によるヒト関連ウイルスの包括的な識別。A.地域のウイルス診断及び監視への1つの潜在的なアプリケーションとともに利用可能なゲノム配列が10以上のヒト関連ウイルスの検出パネルの開発の概略図。B.軽度のデータフィルタリングにより、カラーコードの分類精度が向上する。C.CATCH dxを使用したプライマー及びcrRNAの設計のワークフロー。D.例示的な設計。E.CARMEN-cas13を使用した包括的なヒト関連ウイルスパネルの試験。ヒートマップは、Cas13検出の3時間後にバックグラウンドを差し引いた蛍光を示す。Comprehensive identification of human-related viruses by CARMEN-cas13. A. Schematic of the development of a detection panel for human-related viruses with 10 or more genomic sequences available with one potential application for regional virus diagnosis and surveillance. B. Mild data filtering improves color code classification accuracy. C. Workflow for designing primers and crRNA using CATCH dx. D. Illustrative design. E. Comprehensive human-related virus panel testing using CARMEN-cas13. The heat map shows fluorescence with background subtracted 3 hours after Cas13 detection. CARMEN-cas13によるヒト関連ウイルスの包括的な識別。A.地域のウイルス診断及び監視への1つの潜在的なアプリケーションとともに利用可能なゲノム配列が10以上のヒト関連ウイルスの検出パネルの開発の概略図。B.軽度のデータフィルタリングにより、カラーコードの分類精度が向上する。C.CATCH dxを使用したプライマー及びcrRNAの設計のワークフロー。D.例示的な設計。E.CARMEN-cas13を使用した包括的なヒト関連ウイルスパネルの試験。ヒートマップは、Cas13検出の3時間後にバックグラウンドを差し引いた蛍光を示す。Comprehensive identification of human-related viruses by CARMEN-cas13. A. Schematic of the development of a detection panel for human-related viruses with 10 or more genomic sequences available with one potential application for regional virus diagnosis and surveillance. B. Mild data filtering improves color code classification accuracy. C. Workflow for designing primers and crRNA using CATCH dx. D. Illustrative design. E. Comprehensive human-related virus panel testing using CARMEN-cas13. The heat map shows fluorescence with background subtracted 3 hours after Cas13 detection. CARMEN-cas13によるヒト関連ウイルスの包括的な識別。A.地域のウイルス診断及び監視への1つの潜在的なアプリケーションとともに利用可能なゲノム配列が10以上のヒト関連ウイルスの検出パネルの開発の概略図。B.軽度のデータフィルタリングにより、カラーコードの分類精度が向上する。C.CATCH dxを使用したプライマー及びcrRNAの設計のワークフロー。D.例示的な設計。E.CARMEN-cas13を使用した包括的なヒト関連ウイルスパネルの試験。ヒートマップは、Cas13検出の3時間後にバックグラウンドを差し引いた蛍光を示す。Comprehensive identification of human-related viruses by CARMEN-cas13. A. Schematic of the development of a detection panel for human-related viruses with 10 or more genomic sequences available with one potential application for regional virus diagnosis and surveillance. B. Mild data filtering improves color code classification accuracy. C. Workflow for designing primers and crRNA using CATCH dx. D. Illustrative design. E. Comprehensive human-related virus panel testing using CARMEN-cas13. The heat map shows fluorescence with background subtracted 3 hours after Cas13 detection. CARMEN-cas13によるヒト関連ウイルスの包括的な識別。A.地域のウイルス診断及び監視への1つの潜在的なアプリケーションとともに利用可能なゲノム配列が10以上のヒト関連ウイルスの検出パネルの開発の概略図。B.軽度のデータフィルタリングにより、カラーコードの分類精度が向上する。C.CATCH dxを使用したプライマー及びcrRNAの設計のワークフロー。D.例示的な設計。E.CARMEN-cas13を使用した包括的なヒト関連ウイルスパネルの試験。ヒートマップは、Cas13検出の3時間後にバックグラウンドを差し引いた蛍光を示す。Comprehensive identification of human-related viruses by CARMEN-cas13. A. Schematic of the development of a detection panel for human-related viruses with 10 or more genomic sequences available with one potential application for regional virus diagnosis and surveillance. B. Mild data filtering improves color code classification accuracy. C. Workflow for designing primers and crRNA using CATCH dx. D. Illustrative design. E. Comprehensive human-related virus panel testing using CARMEN-cas13. The heat map shows fluorescence with background subtracted 3 hours after Cas13 detection. CARMEN-cas13によるヒト関連ウイルスの包括的な識別。A.地域のウイルス診断及び監視への1つの潜在的なアプリケーションとともに利用可能なゲノム配列が10以上のヒト関連ウイルスの検出パネルの開発の概略図。B.軽度のデータフィルタリングにより、カラーコードの分類精度が向上する。C.CATCH dxを使用したプライマー及びcrRNAの設計のワークフロー。D.例示的な設計。E.CARMEN-cas13を使用した包括的なヒト関連ウイルスパネルの試験。ヒートマップは、Cas13検出の3時間後にバックグラウンドを差し引いた蛍光を示す。Comprehensive identification of human-related viruses by CARMEN-cas13. A. Schematic of the development of a detection panel for human-related viruses with 10 or more genomic sequences available with one potential application for regional virus diagnosis and surveillance. B. Mild data filtering improves color code classification accuracy. C. Workflow for designing primers and crRNA using CATCH dx. D. Illustrative design. E. Comprehensive human-related virus panel testing using CARMEN-cas13. The heat map shows fluorescence with background subtracted 3 hours after Cas13 detection.

CARMENの概略図。CARMEN-Cas13における核酸検出の詳細な分子概略図を含む。増幅(任意選択で逆転写を伴う)の後、増幅されたDNAをRNAに変換するインビトロ転写を使用して、Cas13で検出が実施される。結果として生じるRNAはCas13-crRNA複合体によって絶妙な配列特異性で検出され、付随切断は切断レポーターRNAを使用してシグナルを生成する。Schematic diagram of CARMEN. Includes a detailed molecular schematic of nucleic acid detection in CARMEN-Cas13. After amplification (optionally with reverse transcription), detection is performed on Cas13 using in vitro transcription that converts the amplified DNA to RNA. The resulting RNA is detected with exquisite sequence specificity by the Cas13-crRNA complex, and concomitant cleavage uses a cleavage reporter RNA to generate a signal. CARMENの概略図。詳細なCARMEN概略図を提供する。(ステップ1)サンプルを増幅し、カラーコード化し、乳化する。並行して、検出ミックスが組み立てられ、カラーコード化され、乳化される。(ステップ2)各エマルションからの液滴を単一のチューブにプールし、ピペッティングによって混合する。(ステップ3)液滴は、単一のピペッティングステップでチップにロードされる。側面図:液滴は、ロードスロットを介してチップとガラスの間のフロースペースに配置される。ローダーを傾けると、液滴のプールがフロースペースの周りに移動し、液滴がマイクロウェルに浮き上がる。(ステップ4)チップをガラスに固定し、各マイクロウェルの内容物を分離し、蛍光顕微鏡によって画像化して、各液滴のカラーコードと位置を識別する。(ステップ5)液滴がマージされ、検出反応が開始される。(ステップ6)各マイクロウェルの検出反応は、蛍光顕微鏡によって経時的に(数分から3時間)モニタリングされる。Schematic diagram of CARMEN. A detailed CARMEN schematic diagram is provided. (Step 1) The sample is amplified, color coded and emulsified. In parallel, the detection mix is assembled, color coded and emulsified. (Step 2) Droplets from each emulsion are pooled in a single tube and mixed by pipetting. (Step 3) The droplet is loaded onto the chip in a single pipetting step. Side view: Droplets are placed in the flow space between the chip and the glass via the load slot. Tilt the loader to move the pool of droplets around the flow space and lift the droplets into the microwells. (Step 4) The chip is fixed to glass, the contents of each microwell are separated and imaged with a fluorescence microscope to identify the color code and position of each droplet. (Step 5) The droplets are merged and the detection reaction is started. (Step 6) The detection reaction of each microwell is monitored over time (minutes to 3 hours) by a fluorescence microscope. CARMENの概略図。アクリルロード装置、液滴の流れ、マイクロウェルへの進入、及び2つの液滴のマージの詳細側面図である。Schematic diagram of CARMEN. It is a detailed side view of an acrylic loading device, a flow of droplets, an entry into a microwell, and the merging of two droplets.

チップの設計、製造、ロード、及び画像化。A.PCR産物または検出ミックスから作られた液滴用に最適化されたマイクロウェル設計。B.標準チップの寸法とレイアウト。水色はマイクロウェルアレイで覆われた領域である。C.標準チップの写真。D.画像化の準備が整った、アクリルローダー内に密封された標準チップの写真。E.標準チップと比較したmChipの寸法とレイアウト。薄紫色は、マイクロウェルアレイで覆われた領域である。F.mChipの製造に使用されるアクリル型のAutoCADレンダリング。G.mChipの写真。H.(左)mChipローダーの各部分のAutoCADレンダリング。(中央)mChipローダーのセットアップのAutoCADレンダリング。(右)ロードの準備の整ったローダー内のmChipのAutoCADレンダリング。I.ロードされているmChipの写真。J.図20Bのステップに対応するmChipのロード及び密閉:(ステップ3)mChipロード:液滴は、チップの端で、チップとアクリルローダーの間のフロースペースに配置される。ローダーを傾けると、液滴のプールがフロースペースの周りに移動し、液滴がマイクロウェルに浮き上がる。(ステップ4)チップとローダーの蓋をベースから取り外し、PCRフィルムに対して密閉する。mChipの密閉にガラスは使用されない。アクリルローダーの蓋から吊り下げられた密封されたmChipは、画像化のために顕微鏡に直接置くことができる。K.密閉され、画像化の準備ができているmChipの写真。Chip design, manufacturing, loading, and imaging. A. Microwell design optimized for droplets made from PCR products or detection mixes. B. Standard chip dimensions and layout. Light blue is the area covered by the microwell array. C. A photo of a standard chip. D. A photo of a standard chip sealed inside an acrylic loader, ready for imaging. E. MChip dimensions and layout compared to standard chips. The lilac is the area covered by the microwell array. F. Acrylic AutoCAD rendering used in the manufacture of mChip. G. A photo of mChip. H. (Left) AutoCAD rendering of each part of the mChip loader. (Center) AutoCAD rendering of mChip loader setup. (Right) AutoCAD rendering of mChip in a loader ready for loading. I. A photo of the loaded mChip. J. Load and Seal of mChip Corresponding to Step 20B: (Step 3) mChip Load: Droplets are placed at the edge of the chip in the flow space between the chip and the acrylic loader. Tilt the loader to move the pool of droplets around the flow space and lift the droplets into the microwells. (Step 4) Remove the chip and loader lids from the base and seal against the PCR film. No glass is used to seal the mChip. The sealed mChip suspended from the lid of the acrylic loader can be placed directly on the microscope for imaging. K. A photo of mChip that is sealed and ready for imaging.

CARMENを使用したジカ配列の多重検出-ジカ実験の詳細。A.3時間での合成ジカ配列のSHERLOCK検出のプレートリーダーデータ。B.プレートリーダー(図20A)と液滴(図15C)のデータの比較。C.液滴中のジカ検出のブートストラップ分析。図D.液滴中のジカ検出の受信者動作特性(ROC)曲線。AUC:曲線下面積。図E.アッセイ、試験、及び液滴ペアは命名を複製する。各多重化アッセイは、試験のマトリックスで構成され、マトリックスの寸法はMサンプル×N検出ミックスである。各試験は、1つの検出ミックスによって評価された1つのサンプルの結果である。試験の結果は、マイクロウェルアレイ内の一連の複製された液滴ペアの中央値である。Multiple detection of deca sequences using CARMEN-Details of deca experiments. A. Plate reader data for SHERLOCK detection of synthetic deer sequences at 3 hours. B. Comparison of data between plate reader (FIG. 20A) and droplet (FIG. 15C). C. Bootstrap analysis of deer detection in droplets. Figure D. Receiver operating characteristic (ROC) curve for deer detection in droplets. AUC: Area under the curve. Figure E. Assays, tests, and droplet pairs duplicate the naming. Each multiplexing assay consists of a matrix of tests, the size of which is M sample x N detection mix. Each test is the result of one sample evaluated by one detection mix. The result of the test is the median of a series of replicated droplet pairs in the microwell array.

定量的CARMEN-cas13。A.Cas13検出後に大部分の(T7)産物のシグナルの増加をもたらす、T7またはT3プロモーターを含む増幅プライマーを示す概略図。Cas13検出後に大部分の(T7)産物のシグナルの増加をもたらす、T7またはT3プロモーターを含む増幅プライマーを示す定量的CARMEN-cas13の概略図。B.定量的CARMEN-Cas13を使用した検出のダイナミックレンジの拡大。ダイナミックレンジは、グラフの上にある色付きのバーを使用して示される。エラーバーはSEMを示す。C.グラフは、実際の濃度と計算された濃度の間の線形相関を示す。Quantitative CARMEN-cas13. A. Schematic representation of amplification primers containing the T7 or T3 promoter, which results in increased signal for most (T7) products after Cas13 detection. Schematic of quantitative CARMEN-cas13 showing amplification primers containing the T7 or T3 promoter, which results in increased signal for most (T7) products after Cas13 detection. B. Expanding the dynamic range of detection using quantitative CARMEN-Cas13. Dynamic range is indicated using the colored bars above the graph. Error bars indicate SEM. C. The graph shows the linear correlation between the actual and calculated concentrations.

1050のカラーコードの設計と特性評価。A.1050のカラーコードの設計。B.210のカラーコードと1050のカラーコードの3色次元の特性評価。C.3色空間での210のカラーコードの性能。D.3色空間での1050のカラーコードの性能。E.第4の色次元の1050のカラーコードの特性評価。F.3色空間と4色空間での蛍光バーコードの拡張を示し、これには、第4の色次元での性能も含まれる。1050 color code design and characterization. A. 1050 color code design. B. Three-color characterization of 210 color codes and 1050 color codes. C. Performance of 210 color codes in 3 color spaces. D. Performance of 1050 color codes in 3 color spaces. E. Characterization of the 1050 color code in the fourth color dimension. F. It shows the extension of fluorescent barcodes in three and four color spaces, including performance in the fourth color dimension.

mChipの設計と製作。A.標準チップと比較したmChipの寸法とレイアウト。薄紫色は、マイクロウェルアレイで覆われた領域を示す。B.mChipの製造に使用されるアクリル型のAutoCADレンダリング。C.(左)mChipローダーの各部分のAutoCADレンダリング。(中央)mChipローダーのセットアップのAutoCADレンダリング。(右)ロードの準備の整ったローダー内のmChipのAutoCADレンダリング。D.mChipの写真。E.mChipが内部にあり、ロードの準備が整ったmChipローダーの写真(Cの右側の漫画に対応)。F.ロードされているmChipの写真。G.密閉され、画像化の準備が整ったmChipの写真(Dに示す概略図の出力)。Design and manufacture of mChip. A. MChip dimensions and layout compared to standard chips. The lilac indicates the area covered by the microwell array. B. Acrylic AutoCAD rendering used in the manufacture of mChip. C. (Left) AutoCAD rendering of each part of the mChip loader. (Center) AutoCAD rendering of mChip loader setup. (Right) AutoCAD rendering of mChip in a loader ready for loading. D. A photo of mChip. E. A photo of the mChip loader with the mChip inside and ready to load (corresponding to the cartoon on the right side of C). F. A photo of the loaded mChip. G. Photograph of mChip sealed and ready for imaging (output of schematic diagram shown in D).

ヒト関連ウイルスパネルのプライマーとcrRNAの設計の詳細図。NCBIには少なくとも1つのゲノム隣接を持つ576のヒト関連ウイルス種があり、10以上のゲノム隣接を持つ169がある。ゲノムをセグメントごとに整列させ、CATCH-dxを使用して配列多様性を分析し、最適なプライマー及びcrRNA結合部位を決定した(詳細については、方法を参照されたい)。Detailed view of the primer and crRNA design of the human-related virus panel. NCBI has 576 human-related viral species with at least one genomic adjacency and 169 with 10 or more genomic adjacencies. The genome was sorted segment by segment and sequence diversity was analyzed using CATCH-dx to determine optimal primers and crRNA binding sites (see Methods for details).

ヒト関連ウイルスパネル設計の統計。A.ヒト関連ウイルスパネル設計における各科の種数。B.各種内の配列多様性の少なくとも90%をキャプチャするために必要なプライマーペアの数。2つの種では、縮重塩基を含むプライマーペアの使用が必要であった。C.各種内の配列多様性の少なくとも90%をキャプチャするために必要なcrRNAの数。D.設計された各crRNAセットによってカバーされる各種内の配列の割合。小さいcrRNAセットは、169種のうちの164種について、90%以上のカバレッジで設計できた。Human-related virus panel design statistics. A. Species of each family in human-related virus panel design. B. The number of primer pairs required to capture at least 90% of the sequence diversity within the variety. The two species required the use of primer pairs containing degenerate bases. C. The number of crRNAs required to capture at least 90% of the sequence diversity within the variety. D. Percentage of sequences within the variety covered by each crRNA set designed. A small crRNA set could be designed with 90% or more coverage for 164 of the 169 species.

ヒト関連ウイルスパネルバージョン1の性能。A.ヒト関連ウイルスパネルの試験バージョン1からバックグラウンドを差し引いた蛍光ヒートマップ。B.crRNAは、配列分析(黒)によってまたは実験データ(オレンジ)に基づいて、オンターゲット、低活性、または交差反応性に分類された。C.低活性または交差反応性の潜在的な原因。Performance of human-related virus panel version 1. A. Fluorescent heatmap with background subtracted from test version 1 of the human-related virus panel. B. crRNAs were classified as on-target, hypoactive, or cross-reactive by sequence analysis (black) or based on experimental data (orange). C. Potential cause of low activity or cross-reactivity.

ヒト関連ウイルスパネル:ラウンド1と2の比較。A.ラウンド1、B.ラウンド2比較Human-related virus panel: Comparison of rounds 1 and 2. A. Round 1, B. Round 2 comparison

ヒト関連ウイルスパネル試験のラウンド1と2の比較。A.試験のラウンド1(上)とラウンド2(下)における各crRNA標的の複製液滴ペアの数の分布。A.ラウンド1と2でのcrRNA性能のまとめ。Comparison of rounds 1 and 2 of the human-related virus panel test. A. Distribution of the number of replicating droplet pairs for each crRNA target in Round 1 (top) and Round 2 (bottom) of the test. A. Summary of crRNA performance in rounds 1 and 2.

ラウンド1と2のヒト関連ウイルスパネルでの個々のガイドの性能。A.ラウンド1とラウンド2の個々のガイドの性能(x軸)。B.試験のラウンド1でのオンターゲットとオフターゲットの反応性の受信者動作特性(ROC)曲線下面積。性能の各範囲(>0.97、0.89~0.97、及び<0.89)について、代表的なオンターゲットとオフターゲットの分布が示される。C.試験のラウンド2でのオンターゲットとオフターゲットの反応性の受信者動作特性(ROC)曲線下面積。性能の各範囲(>0.97、0.89~0.97、及び<0.89)について、代表的なオンターゲットとオフターゲットの分布が示される。D.ラウンド1と2のAUCの比較。ラウンド2で特に性能の低いガイドを標識する。Performance of individual guides in rounds 1 and 2 human-related virus panels. A. Performance of individual guides in Round 1 and Round 2 (x-axis). B. Area under the receiver operating characteristic (ROC) curve of on-target and off-target reactivity in round 1 of the test. Typical on-target and off-target distributions are shown for each range of performance (> 0.97, 0.89 to 0.97, and <0.89). C. Area under the receiver operating characteristic (ROC) curve of on-target and off-target reactivity in Round 2 of the test. Typical on-target and off-target distributions are shown for each range of performance (> 0.97, 0.89 to 0.97, and <0.89). D. Comparison of rounds 1 and 2 AUC. Mark a particularly poor guide in Round 2.

インフルエンザA設計の概要と統計。A.インフルエンザAサブタイピングアッセイの設計目標。B.設計プロセスの4つのラウンドの概要。Overview and statistics of influenza A design. A. Design goals for the influenza A subtyping assay. B. An overview of the four rounds of the design process.

インフルエンザAの個々のcrRNAの性能。A.各標的を有するインフルエンザAの各HサブタイプcrRNAの液滴蛍光の分布。オンターゲット反応性(例えば、標的H1を有するcrRNA H1)対他のすべてのオフターゲット活性(例えば、任意の他の標的を有するcrRNA H1)に対する受信者動作特性(ROC)曲線を右に示す。B.各標的を有するインフルエンザAの各NサブタイプcrRNAの液滴蛍光の分布。オンターゲット反応性対他のすべてのオフターゲット活性の受信者動作特性(ROC)曲線を右に示す。AUC=曲線下面積Performance of individual crRNAs of influenza A. A. Distribution of droplet fluorescence of each H subtype crRNA of influenza A with each target. The receiver operating characteristic (ROC) curve for on-target reactivity (eg, crRNA H1 with target H1) vs. all other off-target activity (eg, crRNA H1 with any other target) is shown on the right. B. Distribution of droplet fluorescence of each N-subtype crRNA of influenza A with each target. The receiver operating characteristic (ROC) curve for on-target reactivity vs. all other off-target activity is shown on the right. AUC = area under the curve

インフルエンザAのNサブタイプの識別。ノイラミニダーゼを含むインフルエンザAゲノムセグメント内の配列多様性をキャプチャするように設計されたcrRNAの完全なセットを示すヒートマップ。設計された35のcrRNAを使用して、35の合成標的が試験された(10cp/μlで)。各サブタイプはオレンジ色のボックスで示され、各サブタイプのコンセンサス配列はアスタリスクを使用して示される。Identification of the N-subtype of influenza A. A heatmap showing the complete set of crRNAs designed to capture sequence diversity within the influenza A genomic segment containing neuraminidase. Thirty-five synthetic targets were tested ( at 104 cp / μl) using the designed 35 crRNAs. Each subtype is indicated by an orange box, and the consensus sequence for each subtype is indicated using an asterisk.

逆転写酵素変異についてのHIV液滴蛍光分布。ほとんどの場合では、30分後の各crRNA標的ペアの液滴蛍光の分布。V106M及びM184Vについては、3時間の時点が示される。図18Bに示されるSNPインデックスは、これらの分布の中央値から計算される。HIV droplet fluorescence distribution for reverse transcriptase mutations. In most cases, the distribution of droplet fluorescence for each crRNA target pair after 30 minutes. For V106M and M184V, a time point of 3 hours is shown. The SNP index shown in FIG. 18B is calculated from the median of these distributions.

逆転写酵素変異についてのHIV低対立遺伝子頻度。野生型逆転写酵素配列または示された6つの薬剤耐性変異のものを含む合成標的の1:3連続希釈を示す棒グラフ。6例中5例で、30%未満の対立遺伝子頻度が検出され、2例では3%まで減少した。HIV low allele frequency for reverse transcriptase mutations. A bar graph showing 1: 3 serial dilutions of synthetic targets, including wild-type reverse transcriptase sequences or those of the 6 drug resistance mutations shown. Less than 30% of allele frequencies were detected in 5 of 6 cases and decreased to 3% in 2 cases.

CARMEN-cas13を使用した包括的なヒト関連ウイルスパネルの試験。ヒートマップは、検出の1時間後にバックグラウンドを差し引いた蛍光を示す。PCRプライマープールとウイルスの科は、それぞれヒートマップの下と左にある。灰色の線:ラウンド2で試験されていないcrRNA。「デング」はデング熱ウイルスに感染した4人の患者からのサンプル、274「ジカ」はジカウイルスに感染した4人の患者からのサンプル、「健常」は健康なヒトドナーからプールされた血漿、血清、及び尿のサンプルを示す。感染患者のみで検出された場合のウイルス名は黒色で、陰性対照のいずれかで検出された場合のウイルス名は灰色で表示される。exe付きの紫色の線は、陰性対照で検出されたウイルスを示す。追加の臨床サンプルデータを図41A~41Fに示す。TLMV:トルクテノ様ミニウイルス、HPV:ヒトパピローマウイルス、HCV:C型肝炎ウイルス、HBV:B型肝炎ウイルス、HPIV-1:ヒトパラインフルエンザウイルス1、HIV:ヒト免疫不全ウイルス、B19ウイルス:パルボウイルスB19。Comprehensive human-related virus panel testing using CARMEN-cas13. The heat map shows fluorescence with background subtracted 1 hour after detection. The PCR primer pool and the viral family are below and to the left of the heatmap, respectively. Gray line: crRNA not tested in Round 2. "Dengue" is a sample from 4 patients infected with dengue fever virus, 274 "Zika" is a sample from 4 patients infected with Zika virus, "healthy" is plasma and serum pooled from healthy human donors. And a sample of urine is shown. The virus name when detected only in infected patients is displayed in black, and the virus name when detected in any of the negative controls is displayed in gray. The purple line with exe indicates the virus detected in the negative control. Additional clinical sample data are shown in FIGS. 41A-41F. TLMV: Torqueteno-like minivirus, HPV: human papillomavirus, HCV: hepatitis C virus, HBV: hepatitis B virus, HPIV-1: human parainfluenza virus 1, HIV: human immunodeficiency virus, B19 virus: parvovirus B19.

1,050のカラーコードの設計と特性評価。A.1,050のカラーコードの設計。B.210のカラーコードと1,050のカラーコードの3色次元の特性評価の概略図。C.210のカラーコードの特性評価からの生データ。D.3色空間での210のカラーコードの性能。E.3色空間での1,050のカラーコードの性能。F.3色空間でのスライド距離フィルター(円)の図示。G.第4の色次元の1,050のカラーコードの特性図と性能。1,050 color code design and characterization. A. 1,050 color code design. B. The schematic diagram of the characteristic evaluation of three color dimensions of 210 color code and 1,050 color code. C. Raw data from 210 color code characterization. D. Performance of 210 color codes in 3 color spaces. E. Performance of 1,050 color codes in 3 color spaces. F. Illustration of a slide distance filter (circle) in a three-color space. G. Characteristic diagram and performance of 1,050 color codes in the fourth color dimension.

ヒト関連ウイルス(HAV)パネルの設計図と統計。A.NCBIには少なくとも1つのゲノム隣接を持つ576のヒト関連ウイルス種があり、10以上のゲノム隣接を持つ169がある。ゲノムをセグメントにより整列させ、CATCH-dxを使用して配列多様性を分析し、最適なプライマー及びcrRNA結合部位を決定した(詳細については、方法を参照されたい)。B.ヒト関連ウイルスパネル設計における各科の種数。C.各種内の配列多様性の少なくとも90%をキャプチャするために必要なプライマーペアの数。2つの種では、縮重塩基を含むプライマーペアの使用が必要であった。D.各種内の配列多様性の少なくとも90%をキャプチャするために必要なcrRNAの数。E.設計された各crRNAセットによってカバーされる各種内の配列の割合。小さいcrRNAセットは、169種のうちの164種について、90%以上のカバレッジで設計された。HAVパネルの期待される性能と観察された性能を比較するために、F.プライマー及びG.crRNAは、配列分析(青もしくは黒)によってまたは実験データ(オレンジ)に基づいて、オンターゲット、低活性、または交差反応性に分類された。Blueprints and statistics for the Human-Related Virus (HAV) panel. A. NCBI has 576 human-related viral species with at least one genomic adjacency and 169 with 10 or more genomic adjacencies. The genome was sorted by segment and sequence diversity was analyzed using CATCH-dx to determine optimal primers and crRNA binding sites (see Methods for details). B. Species of each family in human-related virus panel design. C. The number of primer pairs required to capture at least 90% of the sequence diversity within the variety. The two species required the use of primer pairs containing degenerate bases. D. The number of crRNAs required to capture at least 90% of the sequence diversity within the variety. E. Percentage of sequences within the variety covered by each crRNA set designed. The small crRNA set was designed with 90% or more coverage for 164 of the 169 species. To compare the expected and observed performance of the HAV panel, F. Primer and G.M. crRNAs were classified as on-target, hypoactive, or cross-reactive by sequence analysis (blue or black) or based on experimental data (orange).

ヒト関連ウイルスパネルの試験中のcrRNAの性能。A.ラウンド1とラウンド2の個々のガイドの性能。試験のラウンド間の再設計と再希釈は、ラウンド1と2のデータの間に示される。「オンターゲット」:意図した標的のみに対する閾値を超える反応性。「交差反応性」:閾値を超えるオフターゲット反応性。「低活性」:閾値を超える反応性なし。B.ラウンド1と2でのcrRNA性能の概要棒グラフ。C.変更されていない試験のラウンド1と2の間の再設計、再希釈、及び一致の要約表。D.ラウンド1、及びE.ラウンド2、試験のラウンド1におけるオンターゲットとオフターゲットの反応性の受信者動作特性のランク付けされた曲線下面積(AUC)。表示されたランクについて、代表的なオンターゲット及びオフターゲットの分布が示される。Performance of crRNA during testing of human-related virus panels. A. The performance of the individual guides in Round 1 and Round 2. Redesigns and redilutions between rounds of the test are shown between the data in rounds 1 and 2. "On target": Reactivity that exceeds the threshold for only the intended target. "Cross-reactivity": Off-target reactivity above the threshold. "Low activity": No reactivity above the threshold. B. Summary bar graph of crRNA performance in rounds 1 and 2. C. A summary table of redesigns, redilutions, and matches between rounds 1 and 2 of the unchanged trial. D. Round 1 and E.I. Round 2, the under-curve area (AUC) of the receiver operating characteristics of on-target and off-target reactivity in round 1 of the test. Typical on-target and off-target distributions are shown for the displayed ranks.

HAVパネルを使用した合成標的及び臨床サンプルの試験。A.未知のサンプルのサンプル処理とデータ分析。15プールのマルチプレックスPCRに続いて、PCR産物は3セットにまとめられる。crRNAのサブセットは、展開されたヒートマップにおいて色で示される、各PCR産物プールのプライマーに対応する。複合ヒートマップは、拡張ヒートマップ内のPCR産物プールからのデータを組み合わせることで生成される。B.5つの合成標的(104cp/μl)をすべてのプライマープールで増幅し、HAVパネル+HCV crRNA2からの169のcrRNAを使用して検出した。対照はcに示したものと同一であった。C.HAV10パネル+HCV crRNA2を使用して、4つのHCV及び4つのHIV臨床サンプルを試験した。複合ヒートマップとして示される。D.HCV crRNAのみを含む図41Cからの同じサンプルの986の反応性。1時間及び3時間で示される。E.図37で示される、デング、ジカ、及び健康なサンプルからのウイルスのサブセットについてのPCR増幅スコアとCARMEN蛍光の比較。F.図41Cで示される、HIV、HCV、及び健康なサンプルからのウイルスのサブセットについてのPCR増幅スコアとCARMEN蛍光の比較。CARMENの蛍光は、1時間後のバックグラウンドを差し引いた蛍光であるが、HCV crRNA2は3時間後である。特に明記しない限り、ヒートマップは1時間後のバックグラウンドを差し引いた蛍光を示す。TLMV:トルクテノ様ミニウイルス、HPV:ヒトパピローマウイルス、HCV:C型肝炎ウイルス、HBV:B型肝炎ウイルス、HPIV-1:ヒトパラインフルエンザウイルス1、HIV:ヒト免疫不全ウイルス、B19ウイルス:パルボウイルスB19。Testing of synthetic targets and clinical samples using the HAV panel. A. Sample processing and data analysis of unknown samples. Following 15 pools of multiplex PCR, the PCR products are grouped into 3 sets. Subsets of crRNA correspond to the primers of each PCR product pool, shown in color in the developed heatmap. Composite heatmaps are generated by combining data from the PCR product pool in the extended heatmap. B. Five synthetic targets (104 cp / μl) were amplified in all primer pools and detected using 169 crRNAs from the HAV panel + HCV crRNA2. The control was the same as that shown in c. C. Four HCV and four HIV clinical samples were tested using the HAV10 panel + HCV crRNA2. Shown as a composite heat map. D. Reactivity of 986 of the same sample from FIG. 41C containing only HCV crRNA. Shown in 1 hour and 3 hours. E. Comparison of PCR amplification scores and CARMEN fluorescence for a subset of viruses from dengue, deer, and healthy samples, shown in FIG. 37. F. Comparison of PCR amplification scores and CARMEN fluorescence for a subset of viruses from HIV, HCV, and healthy samples, shown in FIG. 41C. The fluorescence of CARMEN is the fluorescence minus the background after 1 hour, whereas the HCV crRNA2 is after 3 hours. Unless otherwise stated, heatmaps show fluorescence minus background after 1 hour. TLMV: Torqueteno-like minivirus, HPV: human papillomavirus, HCV: hepatitis C virus, HBV: hepatitis B virus, HPIV-1: human parainfluenza virus 1, HIV: human immunodeficiency virus, B19 virus: parvovirus B19.

インフルエンザAサブタイピングとHIV逆転写酵素(RT)変異検出の性能。A.各標的を有するインフルエンザの各HサブタイプcrRNAの液滴蛍光の分布。オンターゲット反応性(例えば、標的H1を有するcrRNA H1)対すべてのオフターゲット活性(例えば、任意の他の標的を有するcrRNA H1)に対する受信者動作特性(ROC)曲線を示す。B.インフルエンザN配列の多様性をキャプチャするように設計されたcrRNAの完全なセットを示すヒートマップ。35の合成標的(104cp/μl)は、35のcrRNAを使用して試験された。灰色:検出閾値を下回る、緑:閾値を超える蛍光カウント、オレンジ色のアウトライン:サブタイプ、最下行には、検出された標的が表示される。C.ほとんどの場合、30分後の時点の各HIV RT crRNA標的ペアの液滴蛍光の分布。V106M及びM184Vでは3時間の時点。図4BのSNPインデックスは、これらの分布の中央値から計算される。Performance of influenza A subtyping and HIV reverse transcriptase (RT) mutation detection. A. Distribution of droplet fluorescence of each H subtype crRNA of influenza with each target. A receiver operating characteristic (ROC) curve for on-target reactivity (eg, crRNA H1 with target H1) vs. all off-target activity (eg, crRNA H1 with any other target) is shown. B. A heatmap showing the complete set of crRNAs designed to capture the diversity of influenza N sequences. Thirty-five synthetic targets (104 cp / μl) were tested using 35 crRNAs. Gray: below the detection threshold, green: fluorescence count above the threshold, orange outline: subtype, bottom row shows the detected target. C. In most cases, the distribution of droplet fluorescence of each HIV RT crRNA target pair at 30 minutes. At 3 hours for V106M and M184V. The SNP index of FIG. 4B is calculated from the median of these distributions.

本明細書の図は、例示のみを目的としており、必ずしも縮尺通りには描かれていない。 The figures herein are for illustration purposes only and are not necessarily drawn to scale.

例示的な実施形態の詳細な説明
一般的な定義
別途定義されない限り、本明細書において使用される技術用語及び科学用語は、本開示の関係する技術分野における当業者によって一般に理解されるものと同一の意味を有する。分子生物学の一般的な用語と技術の定義は、Molecular Cloning:A Laboratory Manual,2nd edition(1989)(Sambrook,Fritsch,and Maniatis);Molecular Cloning:A Laboratory Manual,4th edition(2012)(Green and Sambrook);Current Protocols in Molecular Biology (1987)(F.M.Ausubel et al.eds.);the series Methods in Enzymology(Academic Press,Inc.):PCR 2:A Practical Approach(1995)(M.J.MacPherson,B.D.Hames,and G.R.Taylor eds.):Antibodies,A Laboratory Manual(1988)(Harlow and Lane,eds.):Antibodies A Laboratory Manual,2nd edition 2013(E.A.Greenfield ed.);Animal Cell Culture(1987)(R.I.Freshney,ed.);Benjamin Lewin,Genes IX,Jones and Bartletにより公開、2008(ISBN 0763752223);Kendrew et al.(eds.),The Encyclopedia of Molecular Biology,Blackwell Science Ltd.により公開、1994(ISBN 0632021829);Robert A.Meyers (ed.),Molecular Biology and Biotechnology:a Comprehensive Desk Reference,VCH Publishers,Inc.により公開、1995(ISBN 9780471185710);Singleton et al.,Dictionary of Microbiology and Molecular Biology 2nd ed.,J.Wiley & Sons(New York,N.Y.1994),March,Advanced Organic Chemistry Reactions,Mechanisms and Structure 4th ed.,John Wiley & Sons(New York,N.Y.1992);及びMarten H.Hofker and Jan van Deursen,Transgenic Mouse Methods and Protocols,2nd edition(2011)に見出され得る。
Detailed Description of Exemplary Embodiments General Definitions Unless otherwise defined, the technical and scientific terms used herein are identical to those generally understood by those of skill in the art to which this disclosure relates. Has the meaning of. The general terms and technical definitions of molecular biology are Molecular Cloning: A Laboratory Manual, 2nd edition (1989) ( Sambrook , Fritsch, and Maniatis); Molecular Cloning: A Laboratory (A Laboratory) Green and Sambrook); Current Protocols in Molecular Biology (1987) (FM Ausubel et al. Eds.); The series Methods in Energy (Ac) J. MacPherson, BD Hames, and GR Taylor eds.): Antibodies, A Laboratory Manual (1988) ( Hallow and Lane, eds.): Antibodies A. A. Greenfield ed.); Animal Cell Culture (1987) (RI Frederick, ed.); Published by Benjamin Lewin, Genes IX, Jones and Bartlet, 2008 (ISBN 0763722223); Kend. (Eds.), The Encyclopedia of Molecular Biology, Blackwell Science Ltd. Published by 1994 (ISBN 0632021829); Robert A. et al. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, VCH Publishing, Inc. Published by 1995 (ISBN 9780471185710); Singleton et al. , Dictionary of Microbiology and Molecular Biology 2nd ed. , J. Wiley & Sons (New York, NY 1994), March, Advanced Organic Chemistry Reactions, Mechanisms and Structure 4th ed. , John Wiley & Sons (New York, NY 1992); and Martin H. et al. It can be found in Hofker and Jan Van Deursen , Transgenic Mouse Methods and Protocols, 2nd edition (2011).

本明細書で使用されるとき、単数形「a(不定冠詞)」、「an(不定冠詞)」、及び「the(定冠詞)」は、文脈がそうではないと明確に指示しない限り、単数及び複数の指示対象の両方を含む。 As used herein, the singular forms "a", "an", and "the" are singular and unless the context explicitly indicates otherwise. Includes both of multiple referents.

「任意選択的な」または「任意選択的に」という用語は、続いて記載された事象、状況、または置換基が起こっても起こらなくてもよいこと、ならびに記載が、当該事象または状況が起こる場合の例及びそれが起こらない場合の例を含むことを意味する。 The term "arbitrarily" or "arbitrarily" means that the event, situation, or substituent described subsequently may or may not occur, as well as the description that the event or situation occurs. It is meant to include examples of cases and cases where it does not occur.

端点による数値範囲の列挙は、それぞれの範囲内に包含されるすべての数及び分数、ならびに言及された端点を含む。 The enumeration of numerical ranges by endpoints includes all numbers and fractions contained within each range, as well as the endpoints mentioned.

本明細書で使用されるとき、「約」または「およそ」という用語は、パラメーター、量、時間的持続時間などの測定可能な値を指す場合、特定の値の及び特定の値からの変動を、そのような変動が、開示された本発明において行うために適切である限り、例えば、特定された値の及び特定の値からの+/-10%以下、+/-5%以下、+/-1%以下、及び+/-0.1%以下の変動を含むことを意味する。修飾語「約」または「およそ」が指す値自体はまた、具体的であり、かつ好ましくは開示されていることを理解されたい。 As used herein, the term "about" or "approximate" refers to measurable values such as parameters, quantities, time duration, etc., to refer to specific values and variations from specific values. As long as such variations are appropriate to make in the disclosed invention, for example, +/- 10% or less, +/- 5% or less, +/ It means that it includes fluctuations of -1% or less and +/- 0.1% or less. It should be understood that the value itself pointed to by the modifier "about" or "approximately" is also specific and preferably disclosed.

本明細書を通して「一実施形態」、「実施形態」、「実施形態の例」への言及は、実施形態に関連して記載された特定の特徴、構造または特性が本発明の少なくとも一つの実施形態に含まれることを意味する。したがって、本明細書全体の様々な場所における「一実施形態では」、「ある実施形態では」、または「実施形態の例」という語句の出現は、必ずしもすべてが同じ実施形態を指しているわけではない。さらに、特定の特徴、構造、または特性は、本開示から当業者には明らかなように、1つ以上の実施形態では、任意の適切な方法で組み合わせられてもよい。さらに、本明細書に記載されるいくつかの実施形態は、他の実施形態に含まれる他の特徴ではなくいくつかを含むが、異なる実施形態の特徴の組み合わせは、本発明の範囲内にあることを意味する。例えば、添付の特許請求の範囲において、特許請求される実施形態のいずれも、任意の組み合わせで使用され得る。 References to "one embodiment," "embodiments," and "examples of embodiments" throughout the specification are at least one embodiment of the invention with specific features, structures, or properties described in connection with embodiments. It means that it is included in the form. Accordingly, the appearance of the phrase "in one embodiment," "in one embodiment," or "example of an embodiment" at various locations throughout the specification does not necessarily all refer to the same embodiment. do not have. Moreover, certain features, structures, or properties may be combined in any suitable manner in one or more embodiments, as will be apparent to those of skill in the art from the present disclosure. Moreover, while some embodiments described herein include some rather than other features contained in other embodiments, combinations of features of different embodiments are within the scope of the invention. Means that. For example, in the appended claims, any of the claimed embodiments may be used in any combination.

「C2c2」は現在、「Cas13a」と呼ばれ、それらの用語は別段の指示がない限り、本明細書において交換可能に利用される。 "C2c2" is now referred to as "Cas13a" and these terms are interchangeably used herein unless otherwise indicated.

本明細書に引用されるすべての刊行物、公開特許文書、及び特許出願は、個々の出版物、公開特許文書、または特許出願が参照により組み込まれると具体的かつ個別に示されるのと同じ程度に、参照により本明細書に組み込まれる。 All publications, published patent documents, and patent applications cited herein are to the same extent as specifically and individually indicated that an individual publication, published patent document, or patent application is incorporated by reference. Incorporated herein by reference.

概要
本明細書に開示される実施形態は、RNA標的タンパク質を利用して、液滴中で検出を実施することにより、大規模に多重化されたアプリケーションに対して堅牢なCRISPRベースの診断を提供する。本明細書に開示される実施形態は、DNAとRNAの両方を同等の感度レベルで検出でき、ナノリットル容量での単一塩基対の違いに基づいて、非標的から標的を区別できる。そのような実施形態は、例えば、ウイルス検出、細菌株タイピング、高感度ジェノタイピング、マルチプレックスSNP検出、マルチプレックス株識別、及び疾患関連無細胞DNAの検出を含む、ヒトの健康における複数のシナリオで有用である。参照を容易にするために、本明細書に開示される実施形態は、SHERLOCK(特異的高感度酵素的レポーターunLOCKing)とも呼ばれる。これは、いくつかの実施形態では、多重化可能な液滴中で実行され、有利には、少量で高感度の検出を可能にする。
Summary The embodiments disclosed herein provide robust CRISPR-based diagnostics for large-scale multiplexed applications by utilizing RNA-targeted proteins to perform detection in droplets. do. The embodiments disclosed herein are capable of detecting both DNA and RNA at equivalent sensitivity levels and distinguishing targets from non-targets based on differences in single base pair at nanoliter volumes. Such embodiments include multiple scenarios in human health, including, for example, virus detection, bacterial strain typing, sensitive genotyping, multiplex SNP detection, multiplex strain identification, and detection of disease-related cell-free DNA. It is useful. For ease of reference, the embodiments disclosed herein are also referred to as SHERLOCK (specific sensitive enzymatic reporter unLOCKing). This is performed in some embodiments in a multiplexed droplet, advantageously allowing sensitive detection in small amounts.

現在開示されている主題は、特定のRNA感知のためのプラットフォームを提供するC2c2を含む、単一RNA誘導RNase(Shmakov et al.,2015;Abudayyeh et al.,2016;Smargon et al.,2017)を含むプログラム可能なエンドヌクレアーゼを利用する。微生物のクラスター化等間隔短鎖回分リピート(CRISPR)及びCRISPR関連(CRISPR-Cas)適応免疫システムからのRNA誘導RNAエンドヌクレアーゼは、CRISPR RNA(crRNA)を使用して簡単かつ便利に再プログラムして、標的RNAを切断できる。C2c2などのRNA誘導RNaseは、そのRNA標的を切断した後も活性を維持し、近接した非標的RNAの「付随的」切断をもたらす(Abudayyeh et al.,2016)。このcrRNAによってプログラムされた付随的RNA切断活性は、RNA誘導RNaseを使用して、読み出しとして使用できる、インビボでプログラムされた細胞死またはインビトロでの非特異的RNA分解を引き起こすことによって、特定のRNAの存在を検出する機会を提供する(Abudayyeh et al.,2016;East-Seletsky et al.,2016)。現在開示されている主題は、液滴適用における切断活性を利用して、少量のサンプルとの多重反応を可能にする。 The subject matter currently disclosed is a single RNA-induced RNase (Shmakov et al., 2015; Abdayyeh et al., 2016; Margon et al., 2017), which comprises C2c2, which provides a platform for specific RNA sensing. Utilizes programmable endonucleases, including. RNA-derived RNA endonucleases from CRISPR clustered equidistant short-chain batch repeats (CRISPR) and CRISPR-related (CRISPR-Cas) adaptive immune systems are easily and conveniently reprogrammed using CRISPR RNA (crRNA). , Can cleave the target RNA. RNA-induced RNases such as C2c2 remain active after cleavage of their RNA target, resulting in "incidental" cleavage of nearby non-target RNA (Abudayyeh et al., 2016). Concomitant RNA cleavage activity programmed with this crRNA can be used as a readout using RNA-induced RNase to induce in vivo programmed cell death or non-specific RNA degradation in vitro for specific RNA. Provides an opportunity to detect the presence of (Abdayyeh et al., 2016; East-Seletsky et al., 2016). The currently disclosed subject matter utilizes the cleavage activity in droplet application to allow multiple reactions with small samples.

一態様では、検出CRISPR系、1つ以上の標的分子の光学バーコード、及びマイクロ流体デバイスを含む多重検出システムが提供される。いくつかの実施形態では、検出CRISPR系は、RNA標的エフェクタータンパク質、対応する標的分子に結合するように設計された1つ以上のガイドRNA、RNAベースのマスキング構築物、及び光学バーコードを含む。いくつかの実施形態では、マイクロ流体デバイスは、マイクロウェルのアレイと、マイクロウェルの下に少なくとも1つのフローチャネルとを含み、マイクロウェルは、少なくとも2つの液滴を捕捉するサイズである。系は、キットとして提供できる。 In one aspect, a detection CRISPR system is provided that includes an optical barcode of one or more target molecules, and a multiplex detection system that includes a microfluidic device. In some embodiments, the detection CRISPR system comprises an RNA target effector protein, one or more guide RNAs designed to bind to the corresponding target molecule, an RNA-based masking construct, and an optical barcode. In some embodiments, the microfluidic device comprises an array of microwells and at least one flow channel beneath the microwells, the microwells being sized to capture at least two droplets. The system can be provided as a kit.

一態様では、本明細書に開示される実施形態は、サンプル中の標的核酸を検出する方法を対象とする。本明細書に開示される方法は、いくつかの実施形態において、第1のセットの液滴を生成するステップであって、第1のセットの液滴における各液滴は、少なくとも1つの標的分子及び光学バーコードを含む、ステップと;第2のセットの液滴を生成するステップであって、第2のセットの液滴の各液滴は、RNA標的エフェクタータンパク質、及び対応する標的分子に結合するように設計された1つ以上のガイドRNA、RNAベースのマスキング構築物、及び任意選択で光学バーコードを含む検出CRISPR系を含む、ステップと;第1のセットと第2のセットの液滴を組み合わせて液滴のプールにし、組み合わせた液滴のプールを、マイクロウェルのアレイと、マイクロウェルの下の少なくとも1つのフローチャネルとを含むマイクロ流体デバイス上に流すステップであって、マイクロウェルが少なくとも2つの液滴を捕捉するサイズであるステップと;マイクロウェルで液滴を捕捉し、各マイクロウェルで捕捉された液滴の光学バーコードを検出するステップと;各マイクロウェルで捕捉された液滴を、各マイクロウェルで形成されたマージ液滴にマージするステップであって、マージ液滴の少なくともサブセットは、検出CRISPR系及び標的配列を含む、ステップと;検出反応を開始するステップと、を含み得る。次いで、マージ液滴は、1つ以上のガイドRNAを1つ以上の標的分子に結合させるのに十分な条件下で維持される。1つ以上のガイドRNAが標的核酸に結合すると、転じてCRISPRエフェクタータンパク質を活性化する。活性化されると、CRISPRエフェクタータンパク質は、例えば、検出可能な陽性シグナルがマスキング解除、放出、または生成されるようにマスキング構築物を切断することにより、マスキング構築物を不活性化する。1つ以上の時間周期で各マージ液滴の検出可能なシグナルの検出及び測定を行うことができ、例えば、陽性の検出可能なシグナルが存在するとき、標的分子の存在を示す。 In one aspect, the embodiments disclosed herein are directed to a method of detecting a target nucleic acid in a sample. The method disclosed herein is, in some embodiments, a step of producing a first set of droplets, where each droplet in the first set of droplets is at least one target molecule. And a step that includes an optical barcode; a second set of droplets, each droplet of which is bound to an RNA target effector protein and a corresponding target molecule. A step and; a first set and a second set of droplets, including one or more guide RNAs, RNA-based masking constructs, and optionally a detection CRISPR system containing an optical bar code. A step of combining to form a pool of droplets and flowing the pool of combined droplets onto a microfluidic device containing an array of microwells and at least one flow channel under the microwells, wherein the microwells are at least. A step that is sized to capture two droplets; a step that captures the droplets in the microwells and a step that detects the optical barcode of the droplets captured in each microwell; the droplets captured in each microwell. To the merged droplets formed in each microwell, wherein at least a subset of the merged droplets comprises a detection CRISPR system and a target sequence; a step of initiating a detection reaction. obtain. The merged droplets are then maintained under conditions sufficient to bind one or more guide RNAs to one or more target molecules. When one or more guide RNAs bind to the target nucleic acid, they in turn activate the CRISPR effector protein. Upon activation, the CRISPR effector protein inactivates the masking construct, for example by cleaving the masking construct so that a detectable positive signal is unmasked, released, or produced. The detectable signal of each merged droplet can be detected and measured in one or more time cycles, eg, the presence of a positive detectable signal indicates the presence of a target molecule.

特定の実施形態では、システムは単一のサンプルを高度に標的化しており、バーコードの第2のセットの光学バーコードは必要ないか、任意選択である。特定の実施形態では、進歩した、改善された、またはより強力な前増幅法により、液滴のセット内の光学バーコードの省略が可能になる。したがって、液滴のセット内の光学バーコードは任意選択であり、他の可変要素の中でとりわけ、サンプルの品質、標的の特異性、前増幅技術など、特定の用途に応じて含めることができる。 In certain embodiments, the system is highly targeted to a single sample and a second set of barcodes is either unnecessary or optional. In certain embodiments, advanced, improved, or more powerful preamplification methods allow the omission of optical barcodes within a set of droplets. Therefore, the optical barcode within the set of droplets is optional and can be included, among other variable elements, depending on the particular application, such as sample quality, target specificity, preamplification technique, etc. ..

多重検出システム
多重システムも開示され、RNA標的エフェクタータンパク質、及び対応する標的分子に結合するように設計された1つ以上のガイドRNA、RNAベースのマスキング構築物、及び1つ以上の標的分子光学バーコードである光学バーコードを含む検出CRISPR系を含み、マイクロ流体デバイスは、マイクロウェルのアレイ及びマイクロウェルの下の少なくとも1つのフローチャネルを含む。実施形態では、マイクロウェルは少なくとも2つの液滴を捕捉するサイズである。
Multiple Detection System Multiplex systems are also disclosed, including RNA target effector proteins, and one or more guide RNAs designed to bind to the corresponding target molecule, RNA-based masking constructs, and one or more target molecule optical barcodes. The microfluidic device comprises an array of microwells and at least one flow channel under the microwells, including a detection CRISPR system that includes an optical bar code that is. In an embodiment, the microwell is sized to capture at least two droplets.

一般に、CRISPR-Cas、またはCRISPR系とは、本明細書、及びWO2014/093622(PCT/US2013/074667)などの文書で使用されているものであり、Cas遺伝子をコードする配列、tracr(トランス活性化CRISPR)配列(例えば、tracrRNAまたは活性部分tracrRNA)、tracr-mate配列(内因性CRISPR系の状況で「ダイレクトリピート」及びtracrRNAで処理された部分的なダイレクトリピートを含む)、ガイド配列(内因性CRISPR系の状況で「スペーサー」とも呼ばれる)、またはその用語が本明細書で使用される「RNA(複数可)」(例えば、Cas9などのCasをガイドするRNA(複数可)、例えばCRISPR RNA及びトランス活性化(tracr)RNAまたはシングルガイドRNA(sgRNA)(キメラRNA))またはCRISPR遺伝子座からの他の配列及び転写物を含む、CRISPR関連(「Cas」)遺伝子の活性の発現または活性の誘導に関与する転写物及び他の要素を総称的に指す。一般的に、CRISPR系は、標的配列の部位においてCRISPR複合体の形成を促進する要素(内因性CRISPR系の文脈においてプロトスペーサーとも呼ばれる)によって特徴付けられる。 In general, the CRISPR-Cas, or CRISPR system, is used herein and in documents such as WO2014 / 093622 (PCT / US2013 / 074667) and is a sequence encoding the Cas gene, tracr (trans activity). CRISPR) sequences (eg, tracrRNA or active partial tracrRNA), tracr-mate sequences (including "direct repeats" in the context of endogenous CRISPR systems and partial direct repeats treated with tracrRNA), guide sequences (intrinsic). Also referred to as "spacer" in the context of CRISPR systems), or "RNA (s)" as the term is used herein (eg, Cass-guided RNAs such as Cas9 (s), such as CRISPR RNA and Expression or induction of activity of CRISPR-related (“Cas”) genes, including trans-activated (tracr) RNA or single-guide RNA (sgRNA) (chimeric RNA)) or other sequences and transcripts from the CRISPR locus. Collectively refers to transcripts and other elements involved in. Generally, the CRISPR system is characterized by an element that promotes the formation of a CRISPR complex at the site of the target sequence (also called a protospacer in the context of the endogenous CRISPR system).

RNA標的Casタンパク質
Casタンパク質がC2c2タンパク質である場合、tracrRNAは必要ない。C2c2は、Abudayyeh et al.(2016)“C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector”;Science;DOI:10.1126/science.aaf5573、及びShmakov et al.(2015)“Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems”,Molecular Cell,DOI:dx.doi.org/10.1016/j.molcel.2015.10.008によって記載され、これらは、参照によりそのすべての内容が本明細書に組み込まれる。Cas13bは、Smargon et al.(2017)“Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNases Differentially Regulated by Accessory Proteins Csx27 and Csx28,”Molecular Cell.65,1-13;dx.doi.org/10.1016/j.molcel.2016.12.023に記載され、これらは、参照によりそのすべての内容が本明細書に組み込まれる。CRISPRエフェクタータンパク質は、国際出願第PCT/US2017/065477号の表1~6、40~52ページに記載され、本明細書で開示される方法、システム、及びデバイスにおいて使用することができ、参照により本明細書に具体的に組み込まれる。
RNA Target Cas Protein If the Cas protein is a C2c2 protein, tracrRNA is not needed. C2c2 is described in Abdayyeh et al. (2016) “C2c2 is a single-component prober RNA-guided RNA-targeting CRISPR effector”; Science; DOI: 10.1126 / science. aaf5573 and Shmakov et al. (2015) “Discovery and characterization of Diverse Class 2 CRISPR-Cas Systems”, Molecular Cell, DOI: dx. doi. org / 10.1016 / j. molcel. Described by 2015.10.08, these are all incorporated herein by reference. Cas13b is described in Smargon et al. (2017) “Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNases Differentially Regulated by Accessory Proteins Csx27 and Csx28,” Molecular C. 65, 1-13; dx. doi. org / 10.1016 / j. molcel. 2016.12.023, the entire contents of which are incorporated herein by reference. CRISPR effector proteins are described in International Application No. PCT / US2017 / 0654777, Tables 1-6, pages 40-52, and can be used in the methods, systems, and devices disclosed herein, by reference. Specifically incorporated herein.

2つ以上のCRISPR系は、RNA標的タンパク質、DNA標的エフェクタータンパク質、またはそれらの組み合わせであり得る。RNA標的タンパク質は、Cas13a、Cas13b、またはCas13cなどのCas13タンパク質であり得る。DNA標的タンパク質は、Cpf1及びC2c1などのCas12タンパク質であり得る。 The two or more CRISPR systems can be RNA target proteins, DNA target effector proteins, or a combination thereof. The RNA target protein can be a Cas13 protein such as Cas13a, Cas13b, or Cas13c. The DNA target protein can be a Cas12 protein such as Cpf1 and C2c1.

Cpf1オルソログ
本発明は、サブタイプV-Aとして示されるCpf1遺伝子座に由来するCpf1エフェクタータンパク質の使用を包含する。本明細書において、そのようなエフェクタータンパク質は、「Cpf1p」とも呼ばれ、例えば、Cpf1タンパク質である(また、そのようなエフェクタータンパク質またはCpf1タンパク質またはCpf1遺伝子座に由来するタンパク質は「CRISPR酵素」とも呼ばれる)。現在、サブタイプV-A遺伝子座には、casl、cas2、Cpf1と呼ばれる異なる遺伝子、及びCRISPRアレイが含まれる。Cpf1(CRISPR関連タンパク質Cpf1、サブタイプPREFRAN)は大きなタンパク質(約1300アミノ酸)であり、Cas9の対応するドメインに相同なRuvC様ヌクレアーゼドメインと、Cas9の特徴的なアルギニンリッチクラスターに対応するドメインを含む。しかしながら、Cpf1は、すべてのCas9タンパク質に存在するHNHヌクレアーゼドメインを欠いており、HNHドメインを含む長い挿入が含まれるCas9とは対照的に、Cpf1配列ではRuvC様ドメインが連続している。したがって、特定の実施形態では、CRISPR-Cas酵素は、RuvC様ヌクレアーゼドメインのみを含む。
Cpf1 ortholog The present invention includes the use of a Cpf1 effector protein derived from the Cpf1 locus represented as subtype VA. As used herein, such effector proteins are also referred to as "Cpf1p", eg, Cpf1 proteins (and such effector proteins or Cpf1 proteins or proteins derived from the Cpf1 locus are also referred to as "CRISPR enzymes". Called). Currently, subtype VA loci include different genes called casl, cas2, Cpf1 and CRISPR arrays. Cpf1 (CRISPR-related protein Cpf1, subtype PREFRAN) is a large protein (approximately 1300 amino acids) that contains a RuvC-like nuclease domain homologous to the corresponding domain of Cas9 and a domain corresponding to the characteristic arginine-rich cluster of Cas9. .. However, Cpf1 lacks the HNH nuclease domain present in all Cas9 proteins, and in contrast to Cas9, which contains long insertions containing the HNH domain, the Cpf1 sequence is contiguous with the RuvC-like domain. Therefore, in certain embodiments, the CRISPR-Cas enzyme comprises only the RuvC-like nuclease domain.

また、RNA誘導Cpf1のプログラム可能性、特異性、及び付随活性により、核酸の非特異的切断のための理想的な切り替え可能なヌクレアーゼとなっている。一実施形態において、Cpf1システムは、RNAの付随する非特異的切断を提供し、それを利用するように操作される。別の実施形態では、Cpf1システムは、ssDNAの付随する非特異的切断を提供し、それを利用するように操作される。したがって、操作されたCpf1システムは、核酸検出及びトランスクリプトーム操作のためのプラットフォームを提供する。Cpf1は、哺乳類の転写物のノックダウン及び結合ツールとして使用するために開発された。Cpf1は、配列特異的な標的化DNA結合によって活性化されると、RNA及びssDNAの強力な付随的切断が可能である。 Also, the programmable, specificity, and concomitant activity of RNA-induced Cpf1 makes it an ideal switchable nuclease for non-specific cleavage of nucleic acids. In one embodiment, the Cpf1 system is engineered to provide and utilize the accompanying non-specific cleavage of RNA. In another embodiment, the Cpf1 system is engineered to provide and utilize the associated non-specific cleavage of ssDNA. Therefore, the manipulated Cpf1 system provides a platform for nucleic acid detection and transcriptome manipulation. Cpf1 was developed for use as a knockdown and binding tool for mammalian transcripts. Cpf1 is capable of strong concomitant cleavage of RNA and ssDNA when activated by sequence-specific targeted DNA binding.

「オルソログ(orthologue)」(本明細書では「オルソログ(ortholog)」とも呼ばれる)及び「ホモログ(homolog)」(本明細書では「ホモログ(homologue)」とも呼ばれる)という用語は、当該技術分野で周知である。追加のガイダンスとして、本明細書で使用されるタンパク質の「ホモログ」は、ホモログの関係にあるタンパク質と同じまたは同様の機能を発揮する、同じ種のタンパク質である。相同タンパク質は、可能性としてはあり得るが、構造的に関連する必要はなく、またはその構造的な関連性は部分的なものにすぎない。本明細書で使用されるタンパク質の「オルソログ」は、オルソログの関係にあるタンパク質と同じまたは同様の機能を発揮する、異なる種のタンパク質である。オルソロガスタンパク質は、可能性としてはあり得るが、構造的に関連する必要はなく、またはその構造的な関連性は部分的なものにすぎない。ホモログ及びオルソログは、相同性モデリングによって同定され得る(例えば、Greer,Science vol.228(1985)1055,及びBlundell et al.Eur J Biochem vol 172(1988),513)または“tructural BLAST”(Dey F,Cliff Zhang Q,Petrey D,Honig B.Toward a “structural BLAST”:using structural relationships to infer function. Protein Sci.2013 Apr;22(4):359-66.doi:10.1002/pro.2225を参照されたい)。CRISPR-Cas遺伝子座の分野におけるアプリケーションについて、Shmakov et al.(2015)も参照されたい。相同タンパク質は、可能性としてはあり得るが、構造的に関連する必要はなく、またはその構造的な関連性は部分的なものにすぎない。 The terms "orthologue" (also referred to herein as "ortholog") and "homlog" (also referred to herein as "homologue") are well known in the art. Is. As additional guidance, a protein "homolog" as used herein is a protein of the same species that performs the same or similar function as a protein in a homologous relationship. Homological proteins are possible, but do not need to be structurally related, or their structural relevance is only partial. As used herein, a "ortholog" of a protein is a different species of protein that performs the same or similar function as a protein in an ortholog relationship. Orthologous proteins are possible, but do not need to be structurally related, or their structural relevance is only partial. Homologs and orthologs can be identified by homology modeling (eg, Greer, Structure vol. 228 (1985) 1055 and Blundell et al. Eur J Biochem vol 172 (1988), 513) or "trutical BLAST" (DeyF). , Cliff Zhang Q, Perry D, Hong B. Towerd a “Structural BLAST”: using structural resonances to infer faction. Protein Sci. 2013 Apr; 22. Please refer to). For applications in the field of the CRISPR-Cas locus, see Shmakov et al. See also (2015). Homological proteins are possible, but do not need to be structurally related, or their structural relevance is only partial.

Cpf1遺伝子は、いくつかの多様な細菌ゲノムに見られ、通常、casl、cas2、及びcas4遺伝子ならびにCRISPRカセットと同じ遺伝子座にある(例えば、Francisella cf.novicida Fx1のFNFX1_1431-FNFX1_1428)。したがって、この推定の新規CRISPR-Cas系の配置は、II-B型のものと同様であると思われる。さらに、Cas9と同様に、Cpf1タンパク質は、トランスポゾンORF-Bと相同的である容易に同定可能なC末端領域を含むとともに、活性なRuvC様ヌクレアーゼ、アルギニンリッチ領域、及びZnフィンガー(Cas9には存在しない)を含む。しかしながら、Cas9とは異なり、Cpf1は、CRISPR-Cas構成を含まないゲノムのいくつかにも存在しており、ORF-Bとの類似性が比較的高いことから、トランスポゾン構成要素である可能性が示唆される。これが真のCRISPR-Cas系であるならば、Cpf1はCas9の機能的アナログであり、新規のCRISPR-Cas型(すなわち、V型)となることが示唆された(Annotation and Classification of CRISPR-Cas Systems.Makarova KS,Koonin EV.Methods Mol Biol.2015;1311:47-75を参照されたい)。しかしながら、本明細書に記載のように、Cpf1は、同一のドメイン構造を有さないC2c1pと区別するためにV-Aサブタイプと表記され、したがって、C2c1pは、V-Bサブタイプと表記される。 The Cpf1 gene is found in several diverse bacterial genomes and is usually at the same locus as the CAS, cas2, and cass4 genes as well as the CRISPR cassette (eg, Francisella cf. novicida Fx1 FNFX1-1431-FNFX1-1428). Therefore, the arrangement of this presumed novel CRISPR-Cas system appears to be similar to that of type II-B. In addition, like Cas9, the Cpf1 protein contains an easily identifiable C-terminal region that is homologous to the transposon ORF-B, as well as an active RuvC-like nuclease, an arginine-rich region, and a Zn finger (present in Cas9). Does not include). However, unlike Cas9, Cpf1 is also present in some genomes that do not contain the CRISPR-Cas configuration and has a relatively high similarity to ORF-B, so it may be a transposon component. It is suggested. If this is a true CRISPR-Cas system, it has been suggested that Cpf1 is a functional analog of Cas9 and will be a novel CRISPR-Cas type (ie, V type) (Annotation and Classification of CRISPR-Cas Systems). . Makarova KS, Koonin EV. Methods Mol Biol. 2015; 1311: 47-75). However, as described herein, Cpf1 is referred to as the VA subtype to distinguish it from C2c1p which does not have the same domain structure, and thus C2c1p is referred to as the VB subtype. To.

特定の実施形態では、エフェクタータンパク質は、Streptococcus、Campylobacter、Nitratifractor、Staphylococcus、Parvibaculum、Roseburia、Neisseria、Gluconacetobacter、Azospirillum、Sphaerochaeta、Lactobacillus、Eubacterium、Corynebacter、Carnobacterium、Rhodobacter、Listeria、Paludibacter、Clostridium、Lachnospiraceae、Clostridiaridium、Leptotrichia、Francisella、Legionella、Alicyclobacillus、Methanomethyophilus、Porphyromonas、Prevotella、Bacteroidetes、Helcococcus、Letospira、Desulfovibrio、Desulfonatronum、Opitutaceae、Tuberibacillus、Bacillus、Brevibacilus、MethylobacteriumまたはAcidaminococcusを含む属からの生物に由来するCpf1エフェクタータンパク質である。 In certain embodiments, the effector protein, Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corynebacter, Carnobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, a Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, Cpf1 effector proteins derived from an organism from the genus including Methylobacterium or Acidaminococcus.

さらなる特定の実施形態では、Cpf1エフェクタータンパク質は、S.mutans、S.agalactiae、S.equisimilis、S.sanguinis、S.pneumonia;C.jejuni、C.coli;N.salsuginis、N.tergarcus;S.auricularis、S.carnosus;N.meningitides、N.gonorrhoeae;L.monocytogenes、L.ivanovii;C.botulinum、C.difficile、C.tetani、C.sordelliiから選択される生物に由来する。 In a further specific embodiment, the Cpf1 effector protein is S.I. Mutans, S.M. agalactiae, S.A. equimimilis, S. sanguinis, S.A. pneumonia; C.I. jejuni, C.I. colli; N. salsuginis, N. et al. tergarcus; S. auricalis, S.A. carnosus; N. Mentingitides, N.M. gonorroea; L. gonorrhoeae. monocytogenes, L. ivanovii; C.I. Botulinum, C.I. Difficile, C.I. tetany, C.I. Derived from an organism selected from sordellii.

エフェクタータンパク質は、第1のエフェクタータンパク質(例えば、Cpf1)オルソログに由来する第1の断片と、第2のエフェクタータンパク質(例えば、Cpf1)オルソログに由来する第2の断片と、を含み、第1のエフェクタータンパク質オルソログと第2のエフェクタータンパク質オルソログとは、異なるものであるキメラエフェクタータンパク質を含み得る。第1のエフェクタータンパク質(例えば、Cpf1)オルソログ及び第2のエフェクタータンパク質(例えば、Cpf1)オルソログのうちの少なくとも1つは、Streptococcus、Campylobacter、Nitratifractor、Staphylococcus、Parvibaculum、Roseburia、Neisseria、Gluconacetobacter、Azospirillum、Sphaerochaeta、Lactobacillus、Eubacterium、Corynebacter、Camobacterium、Rhodobacter、Listeria、Paludibacter、Clostridium、Lachnospiraceae、Clostridiaridium、Leptotrichia、Francisella、Legionella、Alicyclobacillus、Methanomethyophilus、Porphyromonas、Prevotella、Bacteroidetes、Helcococcus、Letospira、Desulfovibrio、Desulfonatronum、Opitutaceae、Tuberibacillus、Bacillus、Brevibacilus、MethylobacteriumまたはAcidaminococcusを含む生物に由来するエフェクタータンパク質(例えば、Cpf1)を含み得る;例えば、キメラエフェクタータンパク質は、第1の断片及び第2の断片を含み、第1の断片及び第2断片はそれぞれ、Streptococcus、Campylobacter、Nitratifractor、Staphylococcus、Parvibaculum、Roseburia、Neisseria、Gluconacetobacter、Azospirillum、Sphaerochaeta、Lactobacillus、Eubacterium、Corynebacter、Camobacterium、Rhodobacter、Listeria、Paludibacter、Clostridium、Lachnospiraceae、Clostridiaridium、Leptotrichia、Francisella、Legionella、Alicyclobacillus、Methanomethyophilus、Porphyromonas、Prevotella、Bacteroidetes、Helcococcus、Letospira、Desulfovibrio、Desulfonatronum、Opitutaceae、Tuberibacillus、Bacillus、Brevibacilus、MethylobacteriumまたはAcidaminococcusを含む生物のCpf1から選択され、第1の断片と第2の断片とは、同じ細菌に由来しない。例えば、キメラエフェクタータンパク質は、第1の断片及び第2の断片を含み、第1の断片及び第2の断片はそれぞれ、S.mutans、S.agalactiae、S.equisimilis、S.sanguinis、S.pneumonia、C.jejuni、C.coli、N.salsuginis、N.tergarcus、S.auricularis、S.carnosus、N.meningitides、N.gonorrhoeae、L.monocytogenes、L.ivanovii、C.botulinum、C.difficile、C.tetani、C.sordellii、Francisella tularensis 1、Prevotella albensis、Lachnospiraceae bacterium MC2017 1、Butyrivibrio proteoclasticus、Peregrinibacteria bacterium GW2011_GWA2_33_10、Parcubacteria bacterium GW2011_GWC2_44_17、Smithella sp.SCADC、Acidaminococcus sp.BV3L6、Lachnospiraceae bacterium MA2020、Candidatus Methanoplasma termitum、Eubacterium eligens、Moraxella bovoculi 237、Leptospira inadai、Lachnospiraceae bacterium ND2006、Porphyromonas crevioricanis 3、Prevotella disiens及びPorphyromonas macacaeのCpf1から選択され、第1の断片と第2断片とは、同じ細菌に由来しない。 The effector protein comprises a first fragment derived from a first effector protein (eg, Cpf1) ortholog and a second fragment derived from a second effector protein (eg, Cpf1) ortholog. The effector protein ortholog and the second effector protein ortholog may contain different chimeric effector proteins. At least one of a first effector protein (eg, Cpf1) ortholog and a second effector protein (eg, Cpf1) ortholog is Streptococcus, Campylobacter, Nitratifragtor, Staphylococcus, Parvibaculum, Rose. , Lactobacillus, Eubacterium, Corynebacter, Camobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus Can include effector proteins (eg, Cpf1) from organisms including, Brevibacillus, Metylobactium or Acidaminococcus; for example, the chimeric effector protein comprises a first fragment and a second fragment, a first fragment and a second fragment. each, Streptococcus, Campylobacter is, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corynebacter, Camobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus , M ethanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, selected from Cpf1 organisms including Methylobacterium or Acidaminococcus, the first fragment and the second fragment, the same bacteria Not derived from. For example, the chimeric effector protein comprises a first fragment and a second fragment, the first fragment and the second fragment being S.I. Mutans, S.M. agalactiae, S.A. equimimilis, S. sanguinis, S.A. pneumonia, C.I. jejuni, C.I. colli, N.M. salsuginis, N. et al. tergarcus, S.M. auricalis, S.A. carnosus, N. et al. Mentingitides, N.M. gonorroea, L. monocytogenes, L. ivanovii, C.I. Botulinum, C.I. Difficile, C.I. tetany, C.I. sordellii, Francisella tularensis 1, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, are selected from Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens of and Porphyromonas macacae Cpf1, the first fragment and the second fragment, Not derived from the same bacteria.

より好ましい実施形態では、Cpf1pは、Francisella tularensis 1、Prevotella albensis、Lachnospiraceae bacterium MC2017 1、Butyrivibrio proteoclasticus、Peregrinibacteria bacterium GW2011_GWA2_33_10、Parcubacteria bacterium GW2011_GWC2_44_17、Smithella sp.SCADC、Acidaminococcus sp.BV3L6、Lachnospiraceae bacterium MA2020、Candidatus Methanoplasma termitum、Eubacterium eligens、Moraxella bovoculi 237、Leptospira inadai、Lachnospiraceae bacterium ND2006、Porphyromonas crevioricanis 3、Prevotella disiens及びPorphyromonas macacaeから選択される細菌種に由来する。特定の実施形態では、Cpf1pは、Acidaminococcus sp.BV3L6、Lachnospiraceae bacterium MA2020から選択される細菌種に由来する。特定の実施形態では、エフェクタータンパク質は、Francisella tularensis 1の亜種に由来し、こうした亜種には、限定されないが、Francisella tularensis subsp.Novicidaが含まれる。 In a more preferred embodiment, Cpf1p is, Francisella tularensis 1, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, from Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens and bacterial species selected from Porphyromonas macacae. In certain embodiments, Cpf1p is defined as Acidaminococcus sp. It is derived from a bacterial species selected from BV3L6, Lachnospiraceae bacterium MA2020. In certain embodiments, the effector protein is derived from a variant of Francisella tularensis 1, and is not limited to, but is limited to, Francisella tularensis subspecies. Novicida is included.

いくつかの実施形態では、Cpf1pは、Eubacteriumからの生物に由来する。いくつかの実施形態では、CRISPRエフェクタータンパク質は、Eubacterium rectaleの細菌種に由来する生物に由来するCpf1タンパク質である。いくつかの実施形態では、Cpf1エフェクタータンパク質のアミノ酸配列は、NCBI参照配列WP_055225123.1、NCBI参照配列WP_055237260.1、NCBI参照配列WP_055272206.1、またはGenBank ID OLA16049.1に対応する。いくつかの実施形態では、Cpf1エフェクタータンパク質は、NCBI参照配列WP_055225123.1、NCBI参照配列WP_055237260.1、NCBI参照配列WP_055272206.1、またはGenBank ID OLA16049.1と少なくとも60%、より詳細には少なくとも70%、例えば、少なくとも80%、より好ましくは少なくとも85%、さらにより好ましくは少なくとも90%、例えば少なくとも95%の配列相同性または配列同一性を有する。当業者は、これがCpf1タンパク質の短縮形態を含み、それによって配列同一性が短縮形態の長さにわたって決定されることを理解するであろう。いくつかの実施形態では、Cpf1エフェクターはTTTNまたはCTTNのPAM配列を認識する。 In some embodiments, Cpf1p is derived from an organism from Eubacterium. In some embodiments, the CRISPR effector protein is a Cpf1 protein derived from an organism derived from a bacterial species of Eubacterium rectale. In some embodiments, the amino acid sequence of the Cpf1 effector protein corresponds to NCBI reference sequence WP_05522523.1, NCBI reference sequence WP_05523726.01, NCBI reference sequence WP_0552272206.1, or GenBank ID OLA16049.1. In some embodiments, the Cpf1 effector protein is at least 60% with NCBI reference sequence WP_05522523.1, NCBI reference sequence WP_055237260.1, NCBI reference sequence WP_0552272206.1, or at least 60%, more specifically at least 70. %, For example, at least 80%, more preferably at least 85%, even more preferably at least 90%, for example at least 95% sequence homology or sequence identity. One of skill in the art will appreciate that this comprises a shortened form of the Cpf1 protein, whereby sequence identity is determined over the length of the shortened form. In some embodiments, the Cpf1 effector recognizes the PAM sequence of TTTN or CTTN.

特定の実施形態では、本明細書で言及されるとき、Cpf1のホモログまたはオルソログは、Cpf1と少なくとも80%、より好ましくは少なくとも85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列相同性または配列同一性を有する。さらなる実施形態では、本明細書で言及されるとき、Cpf1のホモログまたはオルソログは、野生型Cpf1と少なくとも80%、より好ましくは少なくとも85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列同一性を有する。Cpf1が1つ以上の変異を有する(変異している)場合、本明細書で言及されるとき、当該Cpf1のホモログまたはオルソログは、変異型Cpf1と少なくとも80%、より好ましくは少なくとも85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列同一性を有する。 In certain embodiments, as referred to herein, the homolog or ortholog of Cpf1 is at least 80%, more preferably at least 85%, even more preferably at least 90%, eg, at least 95%, sequence of Cpf1. Has homology or sequence identity. In a further embodiment, as referred to herein, the homolog or ortholog of Cpf1 is at least 80%, more preferably at least 85%, even more preferably at least 90%, eg, at least 95% of wild-type Cpf1. Has sequence identity. When Cpf1 has (mutates) one or more mutations, when referred to herein, the homolog or ortholog of the Cpf1 is at least 80%, more preferably at least 85%, more preferably at least 85% with the variant Cpf1. More preferably, it has at least 90%, eg, at least 95%, sequence identity.

ある1つの実施形態では、Cpf1タンパクは、ある1つの属の生物のオルソログであり得、こうした生物には、限定されないが、Acidaminococcus sp、Lachnospiraceae bacteriumまたはMoraxella bovoculiが含まれる。特定の実施形態では、V型Casタンパク質は、ある1つの種の生物のオルソログであり得、こうした生物には、限定されないが、Acidaminococcus sp.BV3L6、Lachnospiraceae bacterium ND2006(LbCpf1)またはMoraxella bovoculi 237が含まれる。特定の実施形態では、本明細書で言及されるとき、Cpf1のホモログまたはオルソログは、本明細書に開示されるCpf1配列のうちの1つ以上と少なくとも80%、より好ましくは少なくとも85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列相同性または配列同一性を有する。さらなる実施形態では、本明細書で言及されるとき、Cpfのホモログまたはオルソログは、野生型FnCpf1、AsCpf1、またはLbCpf1と少なくとも80%、より好ましくは少なくとも85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列同一性を有する。 In one embodiment, the Cpf1 protein can be an ortholog of an organism of a genus, including, but not limited to, the Acidaminococcus sp, Lachnospiraceae bacterium or Moraxella bovoculi. In certain embodiments, the V-type Cas protein can be the ortholog of an organism of one species, including, but not limited to, the Acidaminococcus sp. Includes BV3L6, Lachnospiraceae bacteria ND2006 (LbCpf1) or Moraxella bovoculi 237. In certain embodiments, as referred to herein, the homolog or ortholog of Cpf1 is at least 80%, more preferably at least 85%, with one or more of the Cpf1 sequences disclosed herein. More preferably, it has at least 90%, eg, at least 95%, sequence homology or sequence identity. In a further embodiment, as referred to herein, the homolog or ortholog of Cpf is at least 80%, more preferably at least 85%, even more preferably at least 90%, eg, wild-type FnCpf1, AsCpf1, or LbCpf1. , Have at least 95% sequence identity.

特定の実施形態では、本発明のCpf1タンパク質は、FnCpf1、AsCpf1、またはLbCpf1と少なくとも60%、より詳細には少なくとも70%、例えば少なくとも80%、より好ましくは85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列相同性または配列同一性を有する。さらなる実施形態では、本明細書で言及されるとき、Cpf1タンパク質は、野生型AsCpf1またはLbCpf1と少なくとも60%、例えば少なくとも70%、より詳細には少なくとも80%、より好ましくは少なくとも85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列同一性を有する。特定の実施形態では、本発明のCpf1タンパク質は、FnCpf1と少なくとも60%未満の配列同一性を有する。当業者は、これがCpf1タンパク質の短縮形態を含み、それによって配列同一性が短縮形態の長さにわたって決定されることを理解するであろう。 In certain embodiments, the Cpf1 protein of the invention is at least 60%, more particularly at least 70%, such as at least 80%, more preferably 85%, even more preferably at least 90% with FnCpf1, AsCpf1, or LbCpf1. For example, it has at least 95% sequence homology or sequence identity. In a further embodiment, as referred to herein, the Cpf1 protein is at least 60%, eg, at least 70%, more particularly at least 80%, more preferably at least 85%, even more, with wild-type AsCpf1 or LbCpf1. It preferably has at least 90%, eg, at least 95%, sequence identity. In certain embodiments, the Cpf1 proteins of the invention have at least less than 60% sequence identity with FnCpf1. Those of skill in the art will appreciate that this comprises a shortened form of the Cpf1 protein, whereby sequence identity is determined over the length of the shortened form.

以下の特定のものでは、Cpf1アミノ酸の後に核局在化シグナル(NLS)(斜体)、グリシン-セリン(GS)リンカー、及び3×HAタグが続く。1-Franscisella tularensis subsp.novicida U112(FnCpf1);3-Lachnospiraceae bacterium MC2017(Lb3Cpf1);4-Butyri vibrio proteoclasticus(BpCpf1);5-Peregrinibacteria bacterium GW2011_GWA_33_10(PeCpf1);6-Parcubacteria bacterium GWC2011_GWC2_44_17(PbCpf1);7-Smithella sp.SC_K08D17(SsCpf1);8-Acidaminococcus sp.BV3L6(AsCpf1);9-Lachnospiraceae bacterium MA2020(Lb2Cpf1);10-Candidatus Methanoplasma termitum(CMtCpf1);11-Eubacterium eligens(EeCpf1);12-Moraxella bovoculi 237(MbCpf1);13-Leptospira inadai(LiCpf1);14-Lachnospiraceae bacterium ND2006(LbCpf1);15-Porphyromonas crevioricanis(PcCpf1);16-Prevotella disiens(PdCpf1);17-Porphyromonas macacae(PmCpf1);18-Thiomicrospira sp.XS5(TsCpf1);19-Moraxella bovoculi AAX08_00205(Mb2Cpf1);20-Moraxella bovoculi AAX11_00205(Mb3Cpf1);及び21-Butyrivibrio sp.NC3005(BsCpf1)。 In the following specific ones, the Cpf1 amino acid is followed by a nuclear localization signal (NLS) (italic), a glycine-serine (GS) linker, and a 3 × HA tag. 1-Francisella tularensis subsp. novicida U112 (FnCpf1); 3-Lachnospiraceae bacterium MC2017 (Lb3Cpf1); 4-Butyri vibrio proteoclasticus (BpCpf1); 5-Peregrinibacteria bacterium GW2011_GWA_33_10 (PeCpf1); 6-Parcubacteria bacterium GWC2011_GWC2_44_17 (PbCpf1); 7-Smithella sp. SC_K08D17 (SsCpf1); 8-Acidaminococcus sp. BV3L6 (AsCpf1); 9-Lachnospiraceae bacterium MA2020 (Lb2Cpf1); 10-Candidatus Methanoplasma termitum (CMtCpf1); 11-Eubacterium eligens (EeCpf1); 12-Moraxella bovoculi 237 (MbCpf1); 13-Leptospira inadai (LiCpf1); 14- Lachnospiraceae bacterium ND2006 (LbCpf1); 15-Porphylomanas reviolicanis (PcCpf1); 16-Prevotella disiens (PdCpf1); XS5 (TsCpf1); 19-Moraxella bovoculi AAX08_00205 (Mb2Cpf1); 20-Moraxella bovoculi AAX11_00205 (Mb3Cpf1); and 21-Butylivrio sp. NC3005 (BsCpf1).

さらなるCpf1オルソログには、NCBI WP_055225123.1、NCBI WP_055237260.1、NCBI WP_055272206.1、及びGenBank OLA16049.1が含まれる。 Further Cpf1 orthologs include NCBI WP_05522523.1, NCBI WP_05523726200.1, NCBI WP_0552272206.1, and GenBank OLA16049.1.

C2c1オルソログ
本発明は、サブタイプV-Bとして示されるC2c1遺伝子座に由来するC2c1エフェクタータンパク質の使用を包含する。本明細書において、そのようなエフェクタータンパク質は、「C2c1p」とも呼ばれ、例えば、C2c1タンパク質である(また、そのようなエフェクタータンパク質またはC2c1タンパク質またはC2c1遺伝子座に由来するタンパク質は「CRISPR酵素」とも呼ばれる)。現在、サブタイプV-B遺伝子座には、casl-Cas4融合、cas2、C2c1と呼ばれる異なる遺伝子、及びCRISPRアレイが含まれる。C2c1(CRISPR関連タンパク質C2c1)は大きなタンパク質(約1100~1300アミノ酸)であり、Cas9の対応するドメインに相同なRuvC様ヌクレアーゼドメインと、Cas9の特徴的なアルギニンリッチクラスターに対応するドメインを含む。しかしながら、C2c1は、すべてのCas9タンパク質に存在するHNHヌクレアーゼドメインを欠いており、HNHドメインを含む長い挿入が含まれるCas9とは対照的に、C2c1配列ではRuvC様ドメインが連続している。したがって、特定の実施形態では、CRISPR-Cas酵素は、RuvC様ヌクレアーゼドメインのみを含む。
C2c1 ortholog The present invention includes the use of a C2c1 effector protein derived from the C2c1 locus represented as subtype V-B. As used herein, such effector proteins are also referred to as "C2c1p", eg, C2c1 proteins (and such effector proteins or C2c1 proteins or proteins derived from the C2c1 locus are also referred to as "CRISPR enzymes". Called). Currently, the subtype V-B locus includes a casl-Cas4 fusion, a different gene called cas2, C2c1, and a CRISPR array. C2c1 (CRISPR-related protein C2c1) is a large protein (approximately 1100-1300 amino acids) that contains a RuvC-like nuclease domain homologous to the corresponding domain of Cas9 and a domain corresponding to the characteristic arginine-rich cluster of Cas9. However, C2c1 lacks the HNH nuclease domain present in all Cas9 proteins, and in contrast to Cas9, which contains long insertions containing the HNH domain, the C2c1 sequence is contiguous with the RuvC-like domain. Therefore, in certain embodiments, the CRISPR-Cas enzyme comprises only the RuvC-like nuclease domain.

C2c1(Cas12bとも呼ばれる)タンパク質は、RNA誘導ヌクレアーゼである。その切断はtracr RNAに依存して、ガイド配列と直接反復を含むガイドRNAを動員し、ガイド配列は標的ヌクレオチド配列とハイブリダイズしてDNA/RNAヘテロ二本鎖を形成する。現在の研究に基づくと、C2c1ヌクレアーゼ活性はPAM配列の認識に依存することも必要である。C2c1 PAM配列はTリッチ配列である。いくつかの実施形態では、PAM配列は、5’TTN3’または5’ATTN3’であり、Nは任意のヌクレオチドである。特定の実施形態では、PAM配列は5’TTC3’である。特定の実施形態では、PAMはPlasmodium falciparumの配列にある。 The C2c1 (also called Cas12b) protein is an RNA-inducing nuclease. The cleavage depends on the tracr RNA and recruits the guide RNA containing the guide sequence and the direct repeat, and the guide sequence hybridizes with the target nucleotide sequence to form a DNA / RNA heteroduplex. Based on current studies, C2c1 nuclease activity also needs to be dependent on recognition of PAM sequences. The C2c1 PAM sequence is a T-rich sequence. In some embodiments, the PAM sequence is 5'TTN3'or 5'ATTN3', where N is any nucleotide. In certain embodiments, the PAM sequence is 5'TTC3'. In certain embodiments, the PAM is in the sequence of Plasmodium falciparum.

C2c1は、標的遺伝子座において、標的配列のPAM遠位側に5’オーバーハング、または「突出末端」を備えたスタッガードカットを作成する。いくつかの実施形態では、5’オーバーハングは7ntである。Lewis and Ke,Mol Cell.2017 Feb 2;65(3):377-379を参照されたい。 C2c1 creates a staggered cut at the target locus with a 5'overhang, or "protruding end", distal to the PAM of the target sequence. In some embodiments, the 5'overhang is 7 nt. Lewis and Ke, Mol Cell. See 2017 Feb 2; 65 (3): 377-379.

本発明は、C2c1(タイプV-B;Cas12b)エフェクタータンパク質及びオルソログを提供する。「オルソログ(orthologue)」(本明細書では「オルソログ(ortholog)」とも呼ばれる)及び「ホモログ(homologue)」(本明細書では「ホモログ(homolog)」とも呼ばれる)という用語は、当該技術分野で周知である。追加のガイダンスとして、本明細書で使用されるタンパク質の「ホモログ」は、ホモログの関係にあるタンパク質と同じまたは同様の機能を発揮する、同じ種のタンパク質である。相同タンパク質は、可能性としてはあり得るが、構造的に関連する必要はなく、またはその構造的な関連性は部分的なものにすぎない。本明細書で使用されるタンパク質の「オルソログ」は、オルソログの関係にあるタンパク質と同じまたは同様の機能を発揮する、異なる種のタンパク質である。オルソロガスタンパク質は、可能性としてはあり得るが、構造的に関連する必要はなく、またはその構造的な関連性は部分的なものにすぎない。ホモログ及びオルソログは、相同性モデリングによって同定され得る(例えば、Greer,Science vol.228(1985)1055,及びBlundell et al.Eur J Biochem vol 172(1988),513)または“structural BLAST”(Dey F,Cliff Zhang Q,Petrey D,Honig B.Toward a “structural BLAST”:using structural relationships to infer function.Protein Sci.2013 Apr;22(4):359-66.doi:10.1002/pro.2225を参照されたい)。CRISPR-Cas遺伝子座の分野におけるアプリケーションについて、Shmakov et al.(2015)も参照されたい。相同タンパク質は、可能性としてはあり得るが、構造的に関連する必要はなく、またはその構造的な関連性は部分的なものにすぎない。 The present invention provides C2c1 (type VB; Cas12b) effector proteins and orthologs. The terms "orthologue" (also referred to herein as "ortholog") and "homlogue" (also referred to herein as "homolog") are well known in the art. Is. As additional guidance, a protein "homolog" as used herein is a protein of the same species that performs the same or similar function as a protein in a homologous relationship. Homological proteins are possible, but do not need to be structurally related, or their structural relevance is only partial. As used herein, a "ortholog" of a protein is a different species of protein that performs the same or similar function as a protein in an ortholog relationship. Orthologous proteins are possible, but do not need to be structurally related, or their structural relevance is only partial. Homologs and orthologs can be identified by homology modeling (eg, Greer, Structure vol. 228 (1985) 1055 and Blundell et al. Eur J Biochem vol 172 (1988), 513) or "Structural BLAST" (DeyF). , Cliff Zhang Q, Perry D, Hong B. Towerd a “Structural BLAST”: using structural resonances to infer faction.Protein Sci.2013 / 22. Please refer to). For applications in the field of the CRISPR-Cas locus, see Shmakov et al. See also (2015). Homological proteins are possible, but do not need to be structurally related, or their structural relevance is only partial.

C2c1遺伝子は、いくつかの多様な細菌ゲノムに見られ、通常、casl、cas2、及びcas4遺伝子ならびにCRISPRカセットと同じ遺伝子座にある。したがって、この推定の新規CRISPR-Cas系の配置は、II-B型のものと同様であると思われる。さらに、Cas9と同様に、C2c1タンパク質は、活性なRuvC様ヌクレアーゼ、アルギニンリッチ領域、及びZnフィンガー(Cas9には存在しない)を含む。 The C2c1 gene is found in several diverse bacterial genomes and is usually located at the same locus as the casl, cas2, and cas4 genes as well as the CRISPR cassette. Therefore, the arrangement of this presumed novel CRISPR-Cas system appears to be similar to that of type II-B. In addition, like Cas9, the C2c1 protein contains an active RuvC-like nuclease, an arginine-rich region, and a Zn finger (not present in Cas9).

特定の実施形態では、エフェクタータンパク質は、Alicyclobacillus、Desulfovibrio、Desulfonatronum、Opitutaceae、Tuberibacillus、Bacillus、Brevibacillus、Candidatus、Desulfatirhabdium、Citrobacter、Elusimicrobia、Methylobacterium、Omnitrophica、Phycisphaerae、Planctomycetes、Spirochaetes、及びVerrucomicrobiaceaeを含む属からの生物に由来するC2c1エフェクタータンパク質である。 In certain embodiments, effector proteins, Alicyclobacillus, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacillus, Candidatus, Desulfatirhabdium, Citrobacter, Elusimicrobia, Methylobacterium, Omnitrophica, Phycisphaerae, Planctomycetes, organisms from the genera comprising Spirochaetes, and Verrucomicrobiaceae It is a C2c1 effector protein derived from.

さらなる実施形態では、C2c1エフェクタータンパク質は、Alicyclobacillus acidoterrestris(例えば、ATCC 49025)、Alicyclobacillus contaminans(例えば、DSM 17975)、Alicyclobacillus macrosporangiidus(例えば、DSM 17980)、Bacillus hisashii株C4、Candidatus Lindowbacteria bacterium RIFCSPLOWO2、Desulfovibrio inopinatus(例えば、DSM 10711)、Desulfonatronum thiodismutans(例えば、株MLF-1)、Elusimicrobia bacterium RIFOXYA12、Omnitrophica WOR_2 bacterium RIFCSPHIGHO2、Opitutaceae bacterium TAV5、Phycisphaerae bacterium ST-NAGAB-D1、Planctomycetes bacterium RBG_13_46_10、Spirochaetes bacterium GWB1_27_13、Verrucomicrobiaceae bacterium UBA2429、Tuberibacillus calidus(例えば、DSM 17572)、Bacillus thermoamylovorans(例えば、株B4166)、Brevibacillus sp.CF112、Bacillus sp.NSP2.1、Desulfatirhabdium butyrativorans(例えば、DSM 18734)、Alicyclobacillus herbarius(例えば、DSM 13609)、Citrobacter freundii(例えば、ATCC 8090)、Brevibacillus agri(例えば、BAB-2500)、Methylobacterium nodulans(例えば、ORS 2060)から選択される種に由来する。 In a further embodiment, C2C1 effector proteins, Alicyclobacillus acidoterrestris (e.g., ATCC 49025), Alicyclobacillus contaminans (e.g., DSM 17975), Alicyclobacillus macrosporangiidus (e.g., DSM 17980), Bacillus hisashii strain C4, Candidatus Lindowbacteria bacterium RIFCSPLOWO2, Desulfovibrio inopinatus ( For example, DSM 10711), Desulfonatronum thiodismutans (e.g., strain MLF-1), Elusimicrobia bacterium RIFOXYA12, Omnitrophica WOR_2 bacterium RIFCSPHIGHO2, Opitutaceae bacterium TAV5, Phycisphaerae bacterium ST-NAGAB-D1, Planctomycetes bacterium RBG_13_46_10, Spirochaetes bacterium GWB1_27_13, Verrucomicrobiaceae bacterium UBA2429, Tubelibacillus calidus (eg, DSM 17572), Bacteria thermomylovorans (eg, strain B4166), Brevibacillus sp. CF112, Bacillus sp. NSP2.1, Desulfatirbdium butylativorans (eg, DSM 18734), Alicyclobacillus herbarius (eg, DSM 13609), Citrobacter freundii (eg, ATCC 8090), Brevibacillus, eg, Brevibacillus Derived from the species selected.

エフェクタータンパク質は、第1のエフェクタータンパク質(例えば、C2c1)オルソログに由来する第1の断片と、第2のエフェクタータンパク質(例えば、C2c1)オルソログに由来する第2の断片と、を含み、第1のエフェクタータンパク質オルソログと第2のエフェクタータンパク質オルソログとは、異なるものであるキメラエフェクタータンパク質を含み得る。第1及び第2のエフェクタータンパク質(例えば、C2c1)オルソログのうちの少なくとも1つは、Alicyclobacillus、Desulfovibrio、Desulfonatronum、Opitutaceae、Tuberibacillus、Bacillus、Brevibacillus、Candidatus、Desulfatirhabdium、Elusimicrobia、Citrobacter、Methylobacterium、Omnitrophicai、Phycisphaerae、Planctomycetes、Spirochaetes、及びVerrucomicrobiaceaeを含む生物に由来するエフェクタータンパク質(例えば、C2c1)を含み得る。例えば、キメラエフェクタータンパク質は、第1の断片及び第2の断片を含み、第1の断片及び第2断片はそれぞれAlicyclobacillus、Desulfovibrio、Desulfonatronum、Opitutaceae、Tuberibacillus、Bacillus、Brevibacillus、Candidatus、Desulfatirhabdium、Elusimicrobia、Citrobacter、Methylobacterium、Omnitrophicai、Phycisphaerae、Planctomycetes、Spirochaetes、及びVerrucomicrobiaceaeを含む生物のC2c1から選択され、第1の断片と第2の断片とは、同じ細菌に由来しない。例えば、キメラエフェクタータンパク質は、第1の断片及び第2の断片を含み、第1の断片及び第2断片はそれぞれAlicyclobacillus acidoterrestris(例えば、ATCC 49025)、Alicyclobacillus contaminans(例えば、DSM 17975)、Alicyclobacillus macrosporangiidus(例えば、DSM 17980)、Bacillus hisashii株C4、Candidatus Lindowbacteria bacterium RIFCSPLOWO2、Desulfovibrio inopinatus(例えば、DSM 10711)、Desulfonatronum thiodismutans(例えば、株MLF-1)、Elusimicrobia bacterium RIFOXYA12、Omnitrophica WOR_2 bacterium RIFCSPHIGHO2、Opitutaceae bacterium TAV5、Phycisphaerae bacterium ST-NAGAB-D1、Planctomycetes bacterium RBG_13_46_10、Spirochaetes bacterium GWB1_27_13、Verrucomicrobiaceae bacterium UBA2429、Tuberibacillus calidus(例えば、DSM 17572)、Bacillus thermoamylovorans(例えば、株B4166)、Brevibacillus sp.CF112、Bacillus sp.NSP2.1、Desulfatirhabdium butyrativorans(例えば、DSM 18734)、Alicyclobacillus herbarius(例えば、DSM 13609)、Citrobacter freundii(例えば、ATCC 8090)、Brevibacillus agri(例えば、BAB-2500)、Methylobacterium nodulans(例えば、ORS 2060)のC2c1から選択され、第1の断片と第2の断片とは、同じ細菌に由来しない。 The effector protein comprises a first fragment derived from a first effector protein (eg, C2c1) ortholog and a second fragment derived from a second effector protein (eg, C2c1) ortholog. The effector protein ortholog and the second effector protein ortholog may contain different chimeric effector proteins. First and second effector proteins (e.g., C2C1) at least one of the orthologs, Alicyclobacillus, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacillus, Candidatus, Desulfatirhabdium, Elusimicrobia, Citrobacter, Methylobacterium, Omnitrophicai, Phycisphaerae, It may contain an organism-derived effector protein (eg, C2c1), including Planctomycetota, Spirochaetes, and Verucomimicrobiotae. For example, the chimeric effector protein comprises a first fragment and a second fragment, the first fragment and the second fragment being Alicyclobacillus, Desulfobibrio, Desulfonatronum, Optitaskae, Tuberibacillus, Bacillus, Brevibacillus, respectively. , Methylobacterium, Omnitropiciai, Phycisphaerae, Planctomycetota, Spirochaetes, and Verrucomimicrobiotae, selected from C2c1 of organisms, the first fragment and the second fragment are not derived from the same bacterium. For example, the chimeric effector protein comprises a first fragment and a second fragment, the first fragment and the second fragment being Alicyclobacillus acidoterrestris (eg, ATCC 49025), Alicyclobacillus contaminens (eg, DSM 17975), Alicyclobacillus, respectively. For example, DSM 17980), Bacillus hisashii strain C4, Candidatus Lindowbacteria bacterium RIFCSPLOWO2, Desulfovibrio inopinatus (e.g., DSM 10711), Desulfonatronum thiodismutans (e.g., strain MLF-1), Elusimicrobia bacterium RIFOXYA12, Omnitrophica WOR_2 bacterium RIFCSPHIGHO2, Opitutaceae bacterium TAV5, Phycisphaerae bacterium ST-NAGAB-D1, Planctomycetes bacterium RBG_13_46_10, Spirochaetes bacterium GWB1_27_13, Verrucomicrobiaceae bacterium UBA2429, Tuberibacillus calidus (e.g., DSM 17572), Bacillus thermoamylovorans (e.g., strain B4166), Brevibacillus sp. CF112, Bacillus sp. NSP2.1, Desulfatirbdium butyrativorans (eg, DSM 18734), Alicyclobacillus herbarius (eg, DSM 13609), Citrobacter freundii (eg, ATCC 8090), Brevibacillus, eg, Brevibacillus, Brevibacillus Selected from C2c1, the first and second fragments are not derived from the same bacterium.

より好ましい実施形態では、C2c1pは、Alicyclobacillus acidoterrestris(例えば、ATCC 49025)、Alicyclobacillus contaminans(例えば、DSM 17975)、Alicyclobacillus macrosporangiidus(例えば、DSM 17980)、Bacillus hisashii株C4、Candidatus Lindowbacteria bacterium RIFCSPLOWO2、Desulfovibrio inopinatus(例えば、DSM 10711)、Desulfonatronum thiodismutans(例えば、株MLF-1)、Elusimicrobia bacterium RIFOXYA12、Omnitrophica WOR_2 bacterium RIFCSPHIGHO2、Opitutaceae bacterium TAV5、Phycisphaerae bacterium ST-NAGAB-D1、Planctomycetes bacterium RBG_13_46_10、Spirochaetes bacterium GWB1_27_13、Verrucomicrobiaceae bacterium UBA2429、Tuberibacillus calidus(例えば、DSM 17572)、Bacillus thermoamylovorans(例えば、株B4166)、Brevibacillus sp.CF112、Bacillus sp.NSP2.1、Desulfatirhabdium butyrativorans(例えば、DSM 18734)、Alicyclobacillus herbarius(例えば、DSM 13609)、Citrobacter freundii(例えば、ATCC 8090)、Brevibacillus agri(例えば、BAB-2500)、Methylobacterium nodulans(例えば、ORS 2060)から選択される細菌種に由来する。特定の実施形態では、C2c1pは、Alicyclobacillus acidoterrestris(例えば、ATCC 49025)、Alicyclobacillus contaminans(例えば、DSM 17975)から選択される細菌種に由来する。 In a more preferred embodiment, C2c1p is, Alicyclobacillus acidoterrestris (e.g., ATCC 49025), Alicyclobacillus contaminans (e.g., DSM 17975), Alicyclobacillus macrosporangiidus (e.g., DSM 17980), Bacillus hisashii strain C4, Candidatus Lindowbacteria bacterium RIFCSPLOWO2, Desulfovibrio inopinatus (e.g. , DSM 10711), Desulfonatronum thiodismutans (e.g., strain MLF-1), Elusimicrobia bacterium RIFOXYA12, Omnitrophica WOR_2 bacterium RIFCSPHIGHO2, Opitutaceae bacterium TAV5, Phycisphaerae bacterium ST-NAGAB-D1, Planctomycetes bacterium RBG_13_46_10, Spirochaetes bacterium GWB1_27_13, Verrucomicrobiaceae bacterium UBA2429, Tuberibacillus calidus (eg, DSM 17572), Bacteria thermomyloverans (eg, strain B4166), Brevibacillus sp. CF112, Bacillus sp. NSP2.1, Desulfatirbdium butyrativorans (eg, DSM 18734), Alicyclobacillus herbarius (eg, DSM 13609), Citrobacter freundii (eg, ATCC 8090), Brevibacillus, eg, Brevibacillus Derived from the selected bacterial species. In certain embodiments, C2c1p is derived from a bacterial species selected from Alicyclobacillus acidoterrestris (eg, ATCC 49025), Alicyclobacillus contaminens (eg, DSM 17975).

特定の実施形態では、本明細書で言及されるとき、C2c1のホモログまたはオルソログは、C2c1と少なくとも80%、より好ましくは少なくとも85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列相同性または配列同一性を有する。さらなる実施形態では、本明細書で言及されるとき、C2c1のホモログまたはオルソログは、野生型C2c1と少なくとも80%、より好ましくは少なくとも85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列同一性を有する。C2c1が1つ以上の変異を有する(変異している)場合、本明細書で言及されるとき、当該C2c1のホモログまたはオルソログは、変異型C2c1と少なくとも80%、より好ましくは少なくとも85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列同一性を有する。 In certain embodiments, as referred to herein, the homolog or ortholog of C2c1 is at least 80%, more preferably at least 85%, even more preferably at least 90%, eg, at least 95%, sequence of C2c1. Has homology or sequence identity. In a further embodiment, as referred to herein, the homolog or ortholog of C2c1 is at least 80%, more preferably at least 85%, even more preferably at least 90%, eg, at least 95% of wild-type C2c1. Has sequence identity. When C2c1 has (mutates) one or more mutations, when referred to herein, the homolog or ortholog of the C2c1 is at least 80%, more preferably at least 85%, more preferably at least 85% with the variant C2c1. More preferably, it has at least 90%, eg, at least 95%, sequence identity.

一実施形態では、C2c1タンパク質は、Alicyclobacillus、Desulfovibrio、Desulfonatronum、Opitutaceae、Tuberibacillus、Bacillus、Brevibacillus、Candidatus、Desulfatirhabdium、Elusimicrobia、Citrobacter、Methylobacterium、Omnitrophicai、Phycisphaerae、Planctomycetes、Spirochaetes、及びVerrucomicrobiaceaeを含むがこれらに限定されない属の生物のオルソログであり得る。特定の実施形態では、V型Casタンパク質は、Alicyclobacillus acidoterrestris(例えば、ATCC 49025)、Alicyclobacillus contaminans(例えば、DSM 17975)、Alicyclobacillus macrosporangiidus(例えば、DSM 17980)、Bacillus hisashii株C4、Candidatus Lindowbacteria bacterium RIFCSPLOWO2、Desulfovibrio inopinatus(例えば、DSM 10711)、Desulfonatronum thiodismutans(例えば、株MLF-1)、Elusimicrobia bacterium RIFOXYA12、Omnitrophica WOR_2 bacterium RIFCSPHIGHO2、Opitutaceae bacterium TAV5、Phycisphaerae bacterium ST-NAGAB-D1、Planctomycetes bacterium RBG_13_46_10、Spirochaetes bacterium GWB1_27_13、Verrucomicrobiaceae bacterium UBA2429、Tuberibacillus calidus(例えば、DSM 17572)、Bacillus thermoamylovorans(例えば、株B4166)、Brevibacillus sp.CF112、Bacillus sp.NSP2.1、Desulfatirhabdium butyrativorans(例えば、DSM 18734)、Alicyclobacillus herbarius(例えば、DSM 13609)、Citrobacter freundii(例えば、ATCC 8090)、Brevibacillus agri(例えば、BAB-2500)、Methylobacterium nodulans(例えば、ORS 2060)を含むがこれらに限定されない種の生物のオルソログであり得る。特定の実施形態では、本明細書で言及されるとき、C2c1のホモログまたはオルソログは、本明細書に開示されるC2c1配列のうちの1つ以上と少なくとも80%、より好ましくは少なくとも85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列相同性または配列同一性を有する。さらなる実施形態では、本明細書で言及されるとき、C2c1のホモログまたはオルソログは、野生型のAacC2c1またはBthC2c1と少なくとも80%、より好ましくは少なくとも85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列同一性を有する。 In one embodiment, C2C1 protein is not limited Alicyclobacillus, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacillus, Candidatus, Desulfatirhabdium, Elusimicrobia, Citrobacter, Methylobacterium, Omnitrophicai, Phycisphaerae, Planctomycetes, the Spirochaetes, and including Verrucomicrobiaceae these It can be an ortholog of a genus of organisms. In certain embodiments, V type Cas proteins, Alicyclobacillus acidoterrestris (e.g., ATCC 49025), Alicyclobacillus contaminans (e.g., DSM 17975), Alicyclobacillus macrosporangiidus (e.g., DSM 17980), Bacillus hisashii strain C4, Candidatus Lindowbacteria bacterium RIFCSPLOWO2, Desulfovibrio Inopinatus (e.g., DSM 10711), Desulfonatronum thiodismutans (e.g., strain MLF-1), Elusimicrobia bacterium RIFOXYA12, Omnitrophica WOR_2 bacterium RIFCSPHIGHO2, Opitutaceae bacterium TAV5, Phycisphaerae bacterium ST-NAGAB-D1, Planctomycetes bacterium RBG_13_46_10, Spirochaetes bacterium GWB1_27_13, Verrucomicrobiaceae bacterium UBA2429, Tubibacillus calidus (eg, DSM 17572), Bactillus thermomyloverans (eg, strain B4166), Brevibacillus sp. CF112, Bacillus sp. NSP2.1, Desulfitirhabdium butylativorans (eg, DSM 18734), Alicyclobacillus herbarius (eg, DSM 13609), Citrobacter freundii (eg, ATCC 8090), Brevibacillus, eg, Brevibacillus, Brevibacillus It can be an ortholog of organisms of species including, but not limited to, these. In certain embodiments, as referred to herein, the homolog or ortholog of C2c1 is at least 80%, more preferably at least 85%, with one or more of the C2c1 sequences disclosed herein. More preferably, it has at least 90%, eg, at least 95%, sequence homology or sequence identity. In a further embodiment, as referred to herein, the homolog or ortholog of C2c1 is at least 80%, more preferably at least 85%, even more preferably at least 90%, eg, at least at least with wild-type AacC2c1 or BthC2c1. Has 95% sequence identity.

特定の実施形態では、本発明のC2c1タンパク質は、AacC2c1またはBthC2c1と少なくとも60%、より詳細には少なくとも70%、例えば少なくとも80%、より好ましくは85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列相同性または配列同一性を有する。さらなる実施形態では、本明細書で言及されるとき、C2c1タンパク質は、野生型AacC2c1と少なくとも60%、例えば少なくとも70%、より詳細には少なくとも80%、より好ましくは少なくとも85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列同一性を有する。特定の実施形態では、本発明のC2c1タンパク質は、AacC2c1と少なくとも60%未満の配列同一性を有する。当業者は、これがC2c1タンパク質の短縮形態を含み、それによって配列同一性が短縮形態の長さにわたって決定されることを理解するであろう。 In certain embodiments, the C2c1 protein of the invention is at least 60%, more particularly at least 70%, more preferably at least 80%, more preferably 85%, even more preferably at least 90%, eg, AacC2c1 or BthC2c1. Have at least 95% sequence homology or sequence identity. In a further embodiment, as referred to herein, the C2c1 protein is at least 60%, eg, at least 70%, more specifically at least 80%, more preferably at least 85%, even more preferably wild-type AacC2c1. It has at least 90%, eg, at least 95%, sequence identity. In certain embodiments, the C2c1 protein of the invention has at least less than 60% sequence identity with AacC2c1. Those of skill in the art will appreciate that this comprises a shortened form of the C2c1 protein, whereby sequence identity is determined over the length of the shortened form.

本発明の特定の方法において、CRISPR-Casタンパク質は、変異型CRISPR-Casタンパク質が標的配列を含む標的遺伝子座の一方または両方のDNA鎖を切断する能力を欠くように、対応する野生型酵素に対して好ましく変異している。特定の実施形態では、C2c1タンパク質の1つ以上の触媒ドメインが変異されて、標的配列の1つのDNA鎖のみを切断する変異Casタンパク質を生成する。 In the particular method of the invention, the CRISPR-Cas protein is associated with the corresponding wild-type enzyme such that the mutant CRISPR-Cas protein lacks the ability to cleave one or both DNA strands of the target locus containing the target sequence. On the other hand, it is preferably mutated. In certain embodiments, one or more catalytic domains of the C2c1 protein are mutated to produce a mutant Cas protein that cleaves only one DNA strand of the target sequence.

特定の実施形態において、CRISPR-Casタンパク質は、変異CRISPR-Casタンパク質が実質的にすべてのDNA切断活性を欠くように、対応する野生型酵素に対して変異されてもよい。いくつかの実施形態では、変異酵素の切断活性が、酵素の非変異型の核酸切断活性の約25%、10%、5%、1%、0.1%、0.01%、またはそれ以下である場合、CRISPR-Casタンパク質は、すべてのDNA及び/またはRNA切断活性を実質的に欠いていると考えられる。例としては、変異型の核酸切断活性が非変異型と比較してゼロまたは無視できる場合であり得る。 In certain embodiments, the CRISPR-Cas protein may be mutated against the corresponding wild-type enzyme such that the mutated CRISPR-Cas protein lacks substantially all DNA cleavage activity. In some embodiments, the cleavage activity of the mutant enzyme is about 25%, 10%, 5%, 1%, 0.1%, 0.01%, or less than the non-mutant nucleic acid cleavage activity of the enzyme. If so, the CRISPR-Cas protein is considered to be substantially devoid of all DNA and / or RNA cleavage activity. An example may be when the mutant nucleic acid cleavage activity is zero or negligible compared to the non-mutant.

本明細書で提供される方法の特定の実施形態において、CRISPR-Casタンパク質は、1つのDNA鎖のみを切断する突然変異CRISPR-Casタンパク質、すなわちニッカーゼである。より具体的には、本発明の文脈において、ニッカーゼは、非標的配列、すなわち、標的配列の反対のDNA鎖上にあり、PAM配列の3’である配列内での切断を確実にする。さらなるガイダンスにより、非限定的に、Alicyclobacillus acidoterrestris由来のC2c1のNucドメインにおけるアルギニンからアラニンへの置換(R911A)は、C2c1を、両方の鎖を切断するヌクレアーゼからニカーゼ(一本鎖を切断する)に変換する。酵素がAacC2c1でない場合、対応する位置の残基で変異が生じ得ることは当業者には理解されるであろう。
特定の実施形態において、C2c1タンパク質は、RuvCドメインに変異を含む触媒的に不活性なC2c1である。いくつかの実施形態では、触媒的に不活性なC2c1タンパク質は、Alicyclobacillus acidoterrestrisのC2c1のアミノ酸位置D570、E848、またはD977に対応する変異を含む。いくつかの実施形態では、触媒的に不活性なC2c1タンパク質は、Alicyclobacillus acidoterrestrisのC2c1のD570A、E848A、またはD977Aに対応する変異を含む。
また、RNA誘導C2c1のプログラム可能性、特異性、及び付随活性により、核酸の非特異的切断のための理想的な切り替え可能なヌクレアーゼとなっている。一実施形態において、C2c1システムは、RNAの付随する非特異的切断を提供し、それを利用するように操作される。別の実施形態では、C2c1システムは、ssDNAの付随する非特異的切断を提供し、それを利用するように操作される。したがって、操作されたC2c1システムは、核酸検出及びトランスクリプトーム操作のためのプラットフォームを提供し、細胞死を誘導する。C2c1は、哺乳類の転写物のノックダウン及び結合ツールとして使用するために開発された。C2c1は、配列特異的な標的化DNA結合によって活性化されると、RNA及びssDNAの強力な付随的切断が可能である。
特定の実施形態において、C2c1は、インビトロシステムまたは細胞において、一過性または安定的に提供または発現され、細胞核酸を非特異的に切断するように標的化または誘発される。一実施形態において、C2c1は、ssDNA、例えばウイルスのssDNAをノックダウンするように操作される。別の実施形態において、C2c1は、RNAをノックダウンするように操作される。ノックダウンが細胞またはインビトロ系に存在する標的DNAに依存するか、または標的核酸を系または細胞に添加することによって引き起こされるように、システムを考案することができる。
一実施形態において、C2c1系は、例えば、異常なDNAの切断が不完全または無効である可能性がある場合、異常なDNA配列の存在によって区別可能な細胞のサブセットにおいてRNAを非特異的に切断するように操作される。非限定的な一例では、がん細胞に存在し、細胞形質転換を推進するDNA転座が標的とされる。染色体DNAと修復を受ける細胞の亜集団は生き残ることができるが、非特異的な付随的なリボヌクレアーゼ活性は、潜在的な生存者の細胞死を有利にもたらす。
最近、多くの臨床診断に役立つSHERLOCKと呼ばれる高感度で特異的な核酸検出プラットフォームに、付随する活動が活用された(Gootenberg,J.S.et al.Nucleic acid detection with CRISPR-cas13a/C2c2.Science 356,438-442(2017))。
本発明によれば、操作されたC2c1系は、DNAまたはRNAエンドヌクレアーゼ活性のために最適化され、哺乳動物細胞で発現され、細胞内のレポーター分子または転写物を効果的にノックダウンするように標的化され得る。
特定の実施形態において、プロトスペーサー隣接モチーフ(PAM)またはPAM様モチーフは、本明細書に開示されるエフェクタータンパク質複合体の目的の標的遺伝子座への結合を指示する。いくつかの実施形態では、PAMは、5’PAM(すなわち、プロトスペーサーの5’末端の上流に位置する)であり得る。他の実施形態では、PAMは、3’PAM(すなわち、プロトスペーサーの5’末端の下流に位置する)であり得る。「PAM」という用語は、「PFS」または「プロトスペーサー隣接部位」または「プロトスペーサー隣接配列」という用語と互換的に使用され得る。
好ましい実施形態において、CRISPRエフェクタータンパク質は、3’PAMを認識し得る。特定の実施形態において、CRISPRエフェクタータンパク質は、5’Hである3’PAMを認識し得、HはA、CまたはUである。特定の実施形態において、エフェクタータンパク質は、Leptotrichia shahiiのC2c2p、より好ましくは、Leptotrichia shahii DSM 19757のC2c2であってよく、3’PAMは、5’Hである。
CRISPR複合体形成の文脈において、「標的配列」は、ガイド配列が相補性を有するように設計される配列を指し、標的配列とガイド配列の間のハイブリダイゼーションがCRISPR複合体の形成を促進する。標的配列は、RNAポリヌクレオチドを含み得る。「標的RNA」という用語は、標的配列である、または標的配列を含むRNAポリヌクレオチドを指す。換言すると、標的RNAは、gRNAの一部、すなわちガイド配列が相補性を有するように設計され、それに対してCRISPRエフェクタータンパク質とgRNAを含む複合体によって媒介されるエフェクター機能が指示されるRNAポリヌクレオチドまたはRNAポリヌクレオチドの一部であり得る。いくつかの実施形態において、標的配列は、細胞の核または細胞質に位置する。
In certain embodiments of the methods provided herein, the CRISPR-Cas protein is a mutant CRISPR-Cas protein that cleaves only one DNA strand, i.e., a nickase. More specifically, in the context of the present invention, the nickase is on a non-target sequence, i.e., the DNA strand opposite the target sequence, ensuring cleavage within the 3'sequence of the PAM sequence. With further guidance, the substitution of arginine for alanine (R911A) in the Nuc domain of C2c1 from Alicyclobacillus acidoterrestris leads to C2c1 from a nuclease that cleaves both strands to a nicase (cleaves a single strand). Convert. It will be appreciated by those skilled in the art that if the enzyme is not AacC2c1, mutations can occur at the residue at the corresponding position.
In certain embodiments, the C2c1 protein is a catalytically inactive C2c1 containing a mutation in the RuvC domain. In some embodiments, the catalytically inert C2c1 protein comprises a mutation corresponding to the amino acid position D570, E848, or D977 of C2c1 of Alicyclobacillus acidoterrestris. In some embodiments, the catalytically inert C2c1 protein comprises a mutation corresponding to D570A, E848A, or D977A of C2c1 of Alicyclobacillus acidoterrestris.
Also, the programmable, specificity, and concomitant activity of RNA-induced C2c1 makes it an ideal switchable nuclease for non-specific cleavage of nucleic acids. In one embodiment, the C2c1 system is engineered to provide and utilize the accompanying non-specific cleavage of RNA. In another embodiment, the C2c1 system is engineered to provide and utilize the associated non-specific cleavage of ssDNA. Therefore, the engineered C2c1 system provides a platform for nucleic acid detection and transcriptome manipulation and induces cell death. C2c1 was developed for use as a knockdown and binding tool for mammalian transcripts. When activated by sequence-specific targeted DNA binding, C2c1 is capable of strong concomitant cleavage of RNA and ssDNA.
In certain embodiments, C2c1 is transiently or stably donated or expressed in an in vitro system or cell and is targeted or induced to cleave cellular nucleic acids non-specifically. In one embodiment, C2c1 is engineered to knock down ssDNA, eg, viral ssDNA. In another embodiment, C2c1 is engineered to knock down RNA. Systems can be devised such that knockdown depends on the target DNA present in the cell or in vitro system, or is caused by the addition of the target nucleic acid to the system or cell.
In one embodiment, the C2c1 system non-specifically cleaves RNA in a subset of cells distinguishable by the presence of aberrant DNA sequences, for example, if abnormal DNA cleavage may be incomplete or ineffective. It is operated to do. In one non-limiting example, DNA translocations that are present in cancer cells and promote cell transformation are targeted. Although chromosomal DNA and subpopulations of cells undergoing repair can survive, non-specific concomitant ribonuclease activity favors cell death of potential survivors.
Recently, an accompanying activity has been utilized in a sensitive and specific nucleic acid detection platform called SHERLOCK, which is useful for many clinical diagnoses (Goodenberg, J.S. et al. Nucleic acid detection with CRISPR-cas13a / C2c2.Science). 356,438-442 (2017)).
According to the invention, the engineered C2c1 system is optimized for DNA or RNA endonuclease activity, expressed in mammalian cells and effectively knocked down intracellular reporter molecules or transcripts. Can be targeted.
In certain embodiments, the protospacer flanking motif (PAM) or PAM-like motif dictates the binding of the effector protein complex disclosed herein to the target locus of interest. In some embodiments, the PAM can be a 5'PAM (ie, located upstream of the 5'end of the protospacer). In other embodiments, the PAM can be a 3'PAM (ie, located downstream of the 5'end of the protospacer). The term "PAM" may be used interchangeably with the terms "PFS" or "protospacer flanking sites" or "protospacer flanking sequences".
In a preferred embodiment, the CRISPR effector protein may recognize 3'PAM. In certain embodiments, the CRISPR effector protein may recognize 3'PAM, which is 5'H, where H is A, C or U. In certain embodiments, the effector protein may be C2c2p of Reptotricia shahii, more preferably C2c2 of Leptotricia shahii DSM 19757, where 3'PAM is 5'H.
In the context of CRISPR complex formation, "target sequence" refers to a sequence in which the guide sequence is designed to have complementarity, and hybridization between the target sequence and the guide sequence facilitates the formation of the CRISPR complex. The target sequence may include RNA polynucleotides. The term "target RNA" refers to an RNA polynucleotide that is or contains a target sequence. In other words, the target RNA is an RNA polynucleotide that is designed so that a portion of the gRNA, i.e., the guide sequence, has complementarity to which the effector function mediated by the complex containing the CRISPR effector protein and the gRNA is dictated. Or it can be part of an RNA polynucleotide. In some embodiments, the target sequence is located in the nucleus or cytoplasm of the cell.

CRISPRエフェクタータンパク質、特にC2c2をコードする核酸分子は、有利にはコドン最適化CRISPRエフェクタータンパク質である。コドン最適化配列の例は、この場合、真核生物、例えばヒトでの発現のために最適化された配列である(すなわち、ヒトでの発現のために最適化されている)、または本明細書で議論される別の真核生物、動物または哺乳動物のための配列である。例えば、WO2014/093622(PCT/US2013/074667)のSaCas9ヒトコドン最適化配列を参照されたい。これは好ましいが、他の例が可能であり、ヒト以外の宿主種に対するコドン最適化、または特定の臓器に対するコドン最適化が知られていることが理解されるであろう。いくつかの実施形態では、CRISPRエフェクタータンパク質をコードする酵素コード配列は、真核細胞などの特定の細胞での発現に最適化されたコドンである。真核生物細胞は、ヒトまたは非ヒト真核生物、あるいは本明細書で議論される動物または哺乳動物、例えば、マウス、ラット、ウサギ、イヌ、家畜、または非ヒト哺乳動物もしくは霊長類を含むがこれらに限定されない植物または哺乳動物などの特定の生物であり得るか、またはそれに由来し得る。いくつかの実施形態では、人間の生殖細胞系列の遺伝的同一性を改変するプロセス及び/または人間または動物に実質的な医学的利益をもたらすことなく苦痛をもたらす可能性のある動物の遺伝的同一性を改変するプロセス、及びそのようなプロセスから結果として生じる動物が除外され得る。一般に、コドン最適化は、天然の配列の少なくとも1つのコドン(例えば、約1、2、3、4、5、10、15、20、25、50、またはそれ以上のコドン)を、天然のアミノ酸配列を維持しながら、その宿主細胞の遺伝子でより頻繁にまたは最も頻繁に使用されるコドンと置き換えることによって、目的の宿主細胞における増強された発現のために核酸配列を改変するプロセスを指す。様々な種が、特定のアミノ酸の特定のコドンに対して特定のバイアスを示す。コドンバイアス(生物間のコドン使用頻度の違い)は、メッセンジャーRNA(mRNA)の翻訳効率と相関することが多く、これは、同じく、とりわけ、翻訳されるコドンの特性及び特定のトランスファーRNA(tRNA)分子の利用可能性に依存すると考えられている。細胞内の選択されたtRNAの優位性は、一般的にペプチド合成で最も頻繁に使用されるコドンを反映している。したがって、コドン最適化に基づいて、特定の生物における最適な遺伝子発現のために遺伝子を調整してもよい。コドン使用表は、例えばkazusa.orjp/codon/にある「Codon Usage Database」で容易に入手可能であり、これらの表は、多数の方法で適合され得る。Nakamura,Y.,et al.“Codon usage tabulated from the international DNA sequence databases: status for the year 2000”Nucl.Acids Res. 28:292 (2000)を参照されたい。Gene Forge(Aptagen;Jacobus、PA)など、特定の宿主細胞で発現する特定の配列をコドン最適化するコンピューターアルゴリズムも利用してもよい。いくつかの実施形態では、Casをコードする配列中の1つ以上のコドン(例えば、1、2、3、4、5、10、15、20、25、50もしくはそれ以上、またはすべてのコドン)は、特定のアミノ酸で最も頻繁に使用されるコドンに対応する。 The CRISPR effector protein, in particular the nucleic acid molecule encoding C2c2, is advantageously a codon-optimized CRISPR effector protein. Examples of codon-optimized sequences are, in this case, sequences optimized for expression in eukaryotes, eg, humans (ie, optimized for human expression), or herein. An array for another eukaryote, animal or mammal discussed in the book. See, for example, the SaCas9 human codon-optimized sequence of WO2014 / 093622 (PCT / US2013 / 074667). This is preferred, but other examples are possible and it will be appreciated that codon optimization for non-human host species, or codon optimization for specific organs, is known. In some embodiments, the enzyme coding sequence encoding the CRISPR effector protein is a codon optimized for expression in a particular cell, such as an eukaryotic cell. Eukaryotic cells include human or non-human eukaryotes, or the animals or mammals discussed herein, such as mice, rats, rabbits, dogs, domestic animals, or non-human mammals or primates. It can be, or is derived from, a particular organism such as a plant or mammal, not limited to these. In some embodiments, the process of altering the genetic identity of a human germline and / or the genetic identity of an animal that can cause distress without providing substantial medical benefit to the human or animal. Processes that alter sex, and the animals that result from such processes, can be excluded. In general, codon optimization involves at least one codon of the natural sequence (eg, about 1, 2, 3, 4, 5, 10, 15, 20, 25, 50, or more codons) of the natural amino acid. Refers to the process of modifying a nucleic acid sequence for enhanced expression in a host cell of interest by replacing it with a codon that is more frequently or most frequently used in the gene of that host cell while maintaining the sequence. Various species show a particular bias towards a particular codon of a particular amino acid. Codon bias (difference in codon usage between organisms) often correlates with the translation efficiency of messenger RNA (mRNA), which also, among other things, the properties of the codons being translated and the particular transfer RNA (tRNA). It is believed to depend on the availability of the molecule. The predominance of selected tRNAs in the cell reflects the codons commonly used most frequently in peptide synthesis. Therefore, genes may be adjusted for optimal gene expression in a particular organism based on codon optimization. The codon usage table is, for example, kazusa. It is readily available at "Codon Usage Database" at orjp / codon / and these tables can be adapted in a number of ways. Nakamura, Y. et al. , Et al. "Codon usage tagged from the international DNA sequence database: status for the year 2000" Nucl. Acids Res. 28: 292 (2000). Computer algorithms that codon-optimize specific sequences expressed in specific host cells, such as Gene Forge (Aptagen; Jacobus, PA), may also be utilized. In some embodiments, one or more codons in the sequence encoding Cas (eg, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 or more, or all codons). Corresponds to the most frequently used codons for a particular amino acid.

特定の実施形態において、本明細書に記載の方法は、Casトランスジェニック細胞、特にC2c2トランスジェニック細胞を提供することを含んでもよく、ここで、1つ以上のガイドRNAをコードする1つ以上の核酸が、1つ以上の目的の遺伝子のプロモーターを含む調節エレメントと作動可能に接続されて細胞内に提供または導入される。本明細書で使用されるとき、「Casトランスジェニック細胞」という用語は、Cas遺伝子がゲノム的に組み込まれている真核細胞などの細胞を指す。本発明によれば、細胞の性質、タイプ、または起源は特に限定されない。また、Cas導入遺伝子が細胞に導入される方法は様々であり得、当該技術分野で知られている任意の方法であり得る。特定の実施形態において、Casトランスジェニック細胞は、Cas導入遺伝子を単離細胞に導入することによって得られる。特定の他の実施形態において、Casトランスジェニック細胞は、Casトランスジェニック生物から細胞を単離することによって得られる。一例として、限定されないが、本明細書で言及されるCasトランスジェニック細胞は、Casノックイン真核生物などのCasトランスジェニック真核生物に由来し得る。WO2014/093622(PCT/US13/74667)が参照され、参照により本明細書に組み込まれる。Rosa遺伝子座を標的とすることを目的としたSangamo BioSciences,Inc.に帰属する米国特許公開第20120017290号及び第20110265198号の方法は、本発明のCRISPR Casシステムを利用するように改変され得る。Rosa遺伝子座を標的とすることを目的としたCellectisに帰属する米国特許公開第20130236946号の方法もまた、本発明のCRISPR Casシステムを利用するように改変され得る。さらなる例として、Cas9ノックインマウスを記載する、参照により本明細書に組み込まれる、Platt et.al.(Cell;159(2):440-455(2014))が参照される。Cas導入遺伝子はさらにLox-Stop-polyA-Lox(LSL)カセットを含むことができ、それによりCas発現をCreリコンビナーゼによって誘導可能にする。代替的に、Casトランスジェニック細胞は、Cas導入遺伝子を単離細胞に導入することによって得ることができる。導入遺伝子の送達システムは当該技術分野で周知である。例として、Casト導入遺伝子は、ベクター(例えば、AAV、アデノウイルス、レンチウイルス)及び/または粒子及び/またはナノ粒子送達によって、また本明細書のいずこかに記載のように、例えば真核細胞に送達されてもよい。 In certain embodiments, the methods described herein may include providing Cas transgenic cells, particularly C2c2 transgenic cells, wherein one or more encoding one or more guide RNAs. Nucleic acid is operably linked to a regulatory element containing the promoter of one or more genes of interest to provide or be introduced into the cell. As used herein, the term "Cas transgenic cell" refers to a cell, such as a eukaryotic cell, in which the Cas gene is genomically integrated. According to the present invention, the nature, type, or origin of the cell is not particularly limited. In addition, there can be various methods for introducing the Cas transgene into cells, and any method known in the art can be used. In certain embodiments, Cas transgenic cells are obtained by introducing the Cas transgene into isolated cells. In certain other embodiments, Cas transgenic cells are obtained by isolating the cells from a Cas transgenic organism. By way of example, the Cas transgenic cells referred to herein can be derived from Cas transgenic eukaryotes such as Cas knock-in eukaryotes. WO2014 / 093622 (PCT / US13 / 74667) is referenced and incorporated herein by reference. Sangamo BioSciences, Inc. aimed at targeting the Rosa locus. The methods of U.S. Patent Publication Nos. 20120017290 and 20110265198, which are attributed to, can be modified to utilize the CRISPR Cas system of the present invention. The method of US Patent Publication No. 20130236946 belonging to Cellectis aimed at targeting the Rosa locus can also be modified to utilize the CRISPR Cas system of the invention. As a further example, Cas9 knock-in mice are described, which are incorporated herein by reference, Platt et. al. (Cell; 159 (2): 440-455 (2014)). The Cas transgene can further include a Lox-Stop-polyA-Lox (LSL) cassette, which allows Cas expression to be induced by Cre recombinase. Alternatively, Cas transgenic cells can be obtained by introducing the Cas transgene into isolated cells. Transgene delivery systems are well known in the art. As an example, the Cast transgene can be used by vector (eg, AAV, adenovirus, lentivirus) and / or particle and / or nanoparticle delivery, and as described elsewhere herein, eg, true. It may be delivered to nuclear cells.

本明細書で言及されるCasトランスジェニック細胞などの細胞は、組み込まれたCas遺伝子、またはCasを標的遺伝子座に導くことが可能なRNAと複合体化した場合のCasの配列特異的作用から生じる変異を有することに加えて、さらなるゲノム変化を含み得ることは、当業者によって理解されるであろう。 Cells, such as the Cas transgenic cells referred to herein, result from the sequence-specific action of Cas when complexed with an integrated Cas gene or RNA capable of directing Cas to a target locus. It will be appreciated by those skilled in the art that in addition to having mutations, it may include additional genomic changes.

特定の態様において、本発明は、例えば、Cas及び/またはCasを標的遺伝子座に導くことができるRNA(すなわち、ガイドRNA)を細胞内に送達または導入するためだけでなく、これらの成分を増殖させるため(例えば、原核細胞内)のベクターを含む。本明細書で使用されるとき、「ベクター」は、ある環境から別の環境への実体の転送を可能にするまたは容易にするツールである。これは、プラスミド、ファージ、またはコスミドなどのレプリコンであり、挿入されたセグメントの複製をもたらすために別のDNAセグメントが挿入されてもよい。一般に、ベクターは適切な制御因子と結合している場合に複製することができる。一般に、「ベクター」という用語は、それが結合している別の核酸を輸送することができる核酸分子を指す。ベクターは、一本鎖、二本鎖、または部分的に二本鎖である核酸分子、1つ以上の自由末端を含む核酸分子、自由末端を含まない(例えば環状)核酸分子、DNA、RNAまたはその両方を含む核酸分子、及び当該技術分野に公知の他の様々なポリヌクレオチドを含むが、これらに限定されない。他の型のベクターは「プラスミド」であり、それは、標準的な分子クローニング技術などにより、追加的なDNAセグメントを挿入することのできる、環状二重鎖DNAループを指す。別の型のベクターは、ウイルスベクターであり、ウイルス由来のDNAまたはRNA配列が、ウイルス(例えば、レトロウイルス、複製欠損レトロウイルス、アデノウイルス、複製欠損アデノウイルス、及びアデノ随伴ウイルス(AAV))へパッケージ化するためのベクター中に存在する。ウイルスベクターはまた、宿主細胞へと遺伝子導入するためにウイルスによって担持されるポリヌクレオチドを含む。あるベクターは、それらが導入された宿主細胞において自律的複製が可能である(例えば、細菌の複製起点を有する細菌ベクター及びエピソーム哺乳動物ベクター)。他のベクター(例えば、非エピソーム哺乳動物ベクター)は、宿主細胞への導入の際、宿主細胞のゲノムに組み込まれ、それによって、宿主ゲノムとともに複製される。さらに、あるベクターは、それらが作動可能に連結された遺伝子の発現を駆動し得る。本明細書において、そのようなベクターは、「発現ベクター」と呼ばれる。組換えDNA技術において有用な一般的な発現ベクターは、しばしばプラスミドの形態である。 In certain embodiments, the invention proliferates these components as well as to deliver or introduce into cells, for example, RNA capable of directing Cas and / or Cas to a target locus (ie, a guide RNA). Contains a vector to allow (eg, in the prokaryotic cell). As used herein, a "vector" is a tool that enables or facilitates the transfer of an entity from one environment to another. This is a replicon such as a plasmid, phage, or cosmid, and another DNA segment may be inserted to result in replication of the inserted segment. In general, the vector can replicate if bound to the appropriate regulator. In general, the term "vector" refers to a nucleic acid molecule capable of transporting another nucleic acid to which it is bound. Vectors are single-stranded, double-stranded, or partially double-stranded nucleic acid molecules, nucleic acid molecules containing one or more free ends, free-ended (eg, circular) nucleic acid molecules, DNA, RNA, or Nucleic acid molecules containing both, and various other polynucleotides known in the art, but are not limited thereto. Another type of vector is a "plasmid", which refers to a circular double-stranded DNA loop into which additional DNA segments can be inserted, such as by standard molecular cloning techniques. Another type of vector is a viral vector, in which a virally derived DNA or RNA sequence is transferred to a virus (eg, retrovirus, replication-deficient retrovirus, adenovirus, replication-deficient adenovirus, and adeno-associated virus (AAV)). Present in the vector for packaging. Viral vectors also contain polynucleotides carried by the virus for gene transfer into host cells. Certain vectors are capable of autonomous replication in the host cell into which they have been introduced (eg, a bacterial vector having a bacterial origin of replication and an episome mammalian vector). Other vectors (eg, non-episome mammalian vectors) integrate into the host cell's genome upon introduction into the host cell, thereby replicating with the host genome. In addition, certain vectors can drive the expression of genes to which they are operably linked. As used herein, such vectors are referred to as "expression vectors". Common expression vectors useful in recombinant DNA technology are often in the form of plasmids.

組換え発現ベクターは、宿主細胞における核酸の発現に好適な形態で本発明の核酸を含み得、それは、組換え発現ベクターが、発現に使用される宿主細胞に基づいて選択してもよい、発現すべき核酸配列に作動可能に連結される1つ以上の調節エレメントを含むことを意味する。組換え発現ベクターにおいて、「作動可能に連結」は、目的のヌクレオチド配列が調節エレメント(複数可)にヌクレオチド配列の発現(例えば、インビトロ転写/翻訳系、またはベクターが宿主細胞に導入されるとき、宿主内において)を可能とする様式で連結されることを意味することを意図する。組換え及びクローニング方法に関しては、2004年9月2日にUS2004-0171156A1として公開された米国特許出願第10/815,730号が参照され、その内容は参照によりその全体が本明細書に組み込まれる。したがって、本明細書に開示される実施形態は、CRISPRエフェクターシステムを含むトランスジェニック細胞も含み得る。特定の例示的な実施形態では、トランスジェニック細胞は、個別の別個のボリュームとして機能することができる。換言すると、マスキング構築物を含むサンプルは、例えば適切な送達小胞内の細胞に送達され得、標的が送達小胞中に存在する場合、CRISPRエフェクターが活性化され、検出可能なシグナルが生成される。 The recombinant expression vector may comprise the nucleic acid of the invention in a form suitable for expression of the nucleic acid in the host cell, wherein the recombinant expression vector may be selected based on the host cell used for expression. It is meant to include one or more regulatory elements that are operably linked to the nucleic acid sequence to be. In a recombinant expression vector, "operably linked" means that the nucleotide sequence of interest is expressed in a regulatory element (s) of the nucleotide sequence (eg, an in vitro transcription / translation system, or when the vector is introduced into a host cell). It is intended to mean that they are linked in a manner that allows (in the host). For recombination and cloning methods, reference is made to US Patent Application No. 10 / 815,730 published as US2004-0171156A1 on September 2, 2004, the contents of which are incorporated herein by reference in their entirety. .. Accordingly, embodiments disclosed herein may also include transgenic cells comprising a CRISPR effector system. In certain exemplary embodiments, transgenic cells can function as separate and distinct volumes. In other words, the sample containing the masking construct can be delivered, for example, to cells within the appropriate delivery vesicles, where if the target is present in the delivery vesicles, the CRISPR effector is activated and a detectable signal is generated. ..

ベクター(複数可)は、調節エレメント(複数可)、例えばプロモーター(複数可)を含むことができる。ベクター(複数可)は、Casをコードする配列、及び/または単一の、しかしおそらくは、少なくとも3または8または16または32または48または50のガイドRNA(複数可)(例えば、sgRNA)をコードする配列、例えば1~2、1~3、1~4、1~5、3~6、3~7、3~8、3~9、3~10、3~16、3~30、3~32、3~48、3~50のRNA(複数可)(例えば、sgRNA)を含むことができる。単一のベクターでは、各RNA(例えば、sgRNA)に対するプロモーターが存在してもよく、最大約16個のRNA(複数可)がある場合に有利である。単一のベクターが16を超えるRNA(複数可)を提供する場合、1つ以上のプロモーター(複数可)が1を超えるRNA(複数可)の発現を駆動することができる。例えば、32のRNA(複数可)がある場合、各プロモーターは2つのRNA(複数可)の発現を駆動でき、48のRNA(複数可)がある場合、各プロモーターは3つのRNA(複数可)の発現を駆動できる。単純な算術及び十分に確立されたクローニングプロトコール、及び本開示における教示により、当業者は、AAVなどの適切な例示的ベクター及びU6プロモーターなどの適切なプロモーターに対してRNA(複数可)について、本発明を容易に実施することができる。例えば、AAVのパッケージングの制限は約4.7kbである。単一のU6-gRNA(及びクローニング用の制限部位)の長さは361bpである。したがって、当業者は、約12~16個、例えば13個のU6-gRNAカセットを単一のベクターに容易に適合させることができる。これは、TALEアセンブリ(genome-engineering.org/taleffectors/)に使用されるゴールデンゲート戦略などの任意の適切な手段によって組み立てることができる。当業者はまた、タンデムガイド戦略を使用して、U6-gRNAの数を約1.5倍、例えば12~16、例えば13から約18~24、例えば約19のU6-gRNAに増やすことができる。したがって、当業者は、単一のベクター、例えばAAVベクターにおいて約18~24、例えば約19のプロモーター-RNA、例えばU6-gRNAに容易に到達することができる。ベクター内のプロモーターとRNAの数を増やすためのさらなる手段は、単一のプロモーター(例えば、U6)を使用して、切断可能な配列によって隔てられたRNAのアレイを発現することである。また、ベクター内のプロモーター-RNAの数を増やすためのさらに別の手段は、コード配列または遺伝子のイントロン内の切断可能な配列によって隔てられたプロモーター-RNAのアレイを発現することである。そして、この場合、発現が増加し、組織特異的な様式で長いRNAの転写を可能にするポリメラーゼIIプロモーターを使用することが有利である。(例えば、nar.oxfordjoumals.org/content/34/7/e53.short、及びnature.com/mt/joumal/vl6/n9/abs/mt2008144a.htmlを参照されたい)。有利な実施形態では、AAVは、最大約50個の遺伝子を標的とするU6タンデムgRNAをパッケージすることができる。したがって、当業者は、当該技術分野の知識及び本開示における教示から、1つ以上のプロモーターの制御下またはそれに作動的もしくは機能的に連結された複数のRNAまたはガイドを発現するベクター(複数可)、例えば単一のベクターを容易に作成及び使用することができ、特に、本明細書で議論されるRNAまたはガイドの数に関して、過度の実験は必要ない。 The vector (s) can include regulatory elements (s), such as promoters (s). The vector (s) encodes a sequence encoding Cas and / or a single, but perhaps at least 3 or 8 or 16 or 32 or 48 or 50 guide RNA (s) (eg, sgRNA). Sequences such as 1-2, 1-3, 1-4, 1-5, 3-6, 3-7, 3-8, 3-9, 3-10, 3-16, 3-30, 3-32 It can contain 3 to 48, 3 to 50 RNAs (s) (eg, sgRNA). In a single vector, there may be a promoter for each RNA (eg, sgRNA), which is advantageous when there are up to about 16 RNAs (s). If a single vector provides more than 16 RNAs (s), one or more promoters (s) can drive the expression of RNAs (s) greater than 1. For example, if there are 32 RNAs (s), each promoter can drive the expression of 2 RNAs (s), and if there are 48 RNAs (s), each promoter has 3 RNAs (s). Can drive the expression of. With simple arithmetic and a well-established cloning protocol, and the teachings in the present disclosure, one of ordinary skill in the art will appreciate the RNA (s) for a suitable exemplary vector such as AAV and a suitable promoter such as the U6 promoter. The invention can be easily carried out. For example, the AAV packaging limit is about 4.7 kb. The length of a single U6-gRNA (and restriction site for cloning) is 361 bp. Thus, one of ordinary skill in the art can readily adapt about 12-16 U6-gRNA cassettes, eg 13 U6-gRNA cassettes, into a single vector. It can be assembled by any suitable means such as the golden gate strategy used in the TALE assembly (genome-enginging.org/talrefectors/). One of ordinary skill in the art can also use a tandem guide strategy to increase the number of U6-gRNA by about 1.5 times, eg 12-16, eg 13 to about 18-24, eg about 19 U6-gRNA. .. Thus, one of ordinary skill in the art can readily reach about 18-24, eg, about 19, promoter-RNAs, eg U6-gRNA, in a single vector, eg, AAV vector. A further means for increasing the number of promoters and RNAs in a vector is to use a single promoter (eg, U6) to express an array of RNAs separated by cleavable sequences. Yet another means for increasing the number of promoter-RNAs in a vector is to express an array of promoter-RNAs separated by a cleavable sequence within the coding sequence or intron of the gene. And in this case, it is advantageous to use the polymerase II promoter, which has increased expression and allows transcription of long RNA in a tissue-specific manner. (See, for example, nar.oxfordjoumals.org/content/34/7/e53.short, and nature.com/mt/joumal/vr6/n9/abs/mt2008144a.html). In an advantageous embodiment, the AAV can package a U6 tandem gRNA that targets up to about 50 genes. Accordingly, one of ordinary skill in the art expresses a plurality of RNAs or guides under the control of one or more promoters or operably or functionally linked thereto, based on the knowledge of the art and the teachings in the present disclosure. For example, a single vector can be easily prepared and used, and no undue experimentation is required, especially with respect to the number of RNAs or guides discussed herein.

ガイドRNA(複数可)をコードする配列及び/またはCasをコードする配列は、調節エレメント(複数可)に機能的または作動的に連結することができ、したがって調節エレメント(複数可)は発現を駆動する。プロモーター(複数可)は、構成的プロモーター(複数可)及び/または条件的プロモーター(複数可)及び/または誘導性プロモーター(複数可)及び/または組織特異的プロモーター(複数可)であり得る。プロモーターは、RNAポリメラーゼ、pol I、pol II、pol III、T7、U6、H1、レトロウイルスラウス肉腫ウイルス(RSV)LTRプロモーター、サイトメガロウイルス(CMV)プロモーター、SV40プロモーター、ジヒドロ葉酸還元酵素プロモーター、β-アクチンプロモーター、ホスホグリセロールキナーゼ(PGK)プロモーター、及びEF1αプロモーターからなる群から選択できる。有利なプロモーターはプロモーターU6である。 The sequence encoding the guide RNA (s) and / or the sequence encoding Cas can be functionally or operably linked to the regulatory element (s), so that the regulatory element (s) drives expression. do. The promoter (s) can be a constitutive promoter (s) and / or a conditional promoter (s) and / or an inducible promoter (s) and / or a tissue-specific promoter (s). The promoters are RNA polymerase, pol I, pol II, pol III, T7, U6, H1, retrovirus Raus sarcoma virus (RSV) LTR promoter, cytomegalovirus (CMV) promoter, SV40 promoter, dihydrofolate reductase promoter, β. -You can choose from the group consisting of the actin promoter, the phosphoglycerol kinase (PGK) promoter, and the EF1α promoter. The advantageous promoter is promoter U6.

いくつかの実施形態では、核酸標的化システムの1つ以上の要素は、内因性CRISPR RNA標的系を含む特定の生物に由来する。特定の例示的な実施形態では、エフェクタータンパク質CRISPR RNA標的系は、本明細書に記載のHEPNドメイン、当該技術分野で公知のHEPNドメイン、及びコンセンサス配列モチーフと比較してHEPNドメインであると認識されるドメインを含むがこれらに限定されない少なくとも1つのHEPNドメインを含む。そのようなドメインのいくつかが本明細書に提供される。1つの非限定的な例において、コンセンサス配列は、本明細書に提供されるC2c2またはCas13bオルソログの配列に由来し得る。特定の例示的な実施形態では、エフェクタータンパク質は、単一のHEPNドメインを含む。特定の他の例示的な実施形態では、エフェクタータンパク質は、2つのHEPNドメインを含む。当業者は、C2c2タンパク質の短縮形態を利用することができ、それによって配列同一性が短縮形態の長さにわたって決定されることを理解するであろう。 In some embodiments, one or more elements of the nucleic acid targeting system are derived from a particular organism, including an endogenous CRISPR RNA targeting system. In certain exemplary embodiments, the effector protein CRISPR RNA targeting system is recognized as a HEPN domain as compared to the HEPN domain described herein, the HEPN domain known in the art, and consensus sequence motifs. Includes, but is not limited to, at least one HEPN domain. Some of such domains are provided herein. In one non-limiting example, the consensus sequence can be derived from the sequence of C2c2 or Cas13b orthologs provided herein. In certain exemplary embodiments, the effector protein comprises a single HEPN domain. In certain other exemplary embodiments, the effector protein comprises two HEPN domains. One of skill in the art will appreciate that a shortened form of the C2c2 protein is available, thereby determining sequence identity over the length of the shortened form.

1つの例示的な実施形態において、エフェクタータンパク質は、RxxxxHモチーフ配列を含む1つ以上のHEPNドメインを含む。RxxxxHモチーフ配列は、非限定的に、本明細書に記載のHEPNドメインまたは当該技術分野で既知のHEPNドメインに由来し得る。RxxxxHモチーフ配列は、2つ以上のHEPNドメインの一部を組み合わせることにより作成されたモチーフ配列をさらに含む。前述のように、コンセンサス配列は、「Novel Type VI CRISPR Orthologs and Systems」と題するPCT/US2017/038154の例えば256~264ページ及び285~336ページ、「Novel CRISPR Enzymes and Systems」と題する米国仮特許出願62/471,710、2017年3月15日に出願された「Novel Type VI CRISPR Orthologs and Systems」と題する米国仮特許出願第62/484,786号、ならびに2017年4月12日に出願された「Novel Type VI CRISPR Orthologs and Systems」と題する米国仮特許出願第62/484,786号に開示されているオルソログの配列に由来し得る。 In one exemplary embodiment, the effector protein comprises one or more HEPN domains comprising the RxxxxxxH motif sequence. The RxxxxxxH motif sequence may be, but are not limited to, derived from the HEPN domain described herein or the HEPN domain known in the art. The RxxxxxxH motif sequence further includes a motif sequence created by combining parts of two or more HEPN domains. As mentioned above, the consensus sequence is PCT / US2017 / 038154, eg, pp. 256-264 and pp. 285-336, entitled "Novel CRISPR Orthologs and Systems", "Novel CRISPR Enzymes and tentative US patent application". 62 / 471,710, US Provisional Patent Application No. 62 / 484,786 entitled "Novel Type VI CRISPR Orthologs and Systems" filed March 15, 2017, and filed April 12, 2017. It can be derived from the sequence of orthologs disclosed in US Provisional Patent Application No. 62 / 484,786, entitled "Novell Type VI CRISPR Orthologs and Systems".

本発明の一実施形態において、HEPNドメインは、R{N/H/K}X1X2X3H(配列番号1)の配列を含む少なくとも1つのRxxxxHモチーフを含む。発明の一実施形態において、HEPNドメインは、R{N/H}X1X2X3H(配列番号2)の配列を含むRxxxxHモチーフを含む。本発明の一実施形態において、HEPNドメインは、R{N/K}X1X2X3H(配列番号3)の配列を含む。特定の実施形態では、X1はR、S、D、E、Q、N、G、Y、またはHである。特定の実施形態では、X2はI、S、T、V、またはLである。特定の実施形態では、X3はL、F、N、Y、V、I、S、D、E、またはAである。 In one embodiment of the invention, the HEPN domain comprises at least one RxxxxxxH motif comprising the sequence of R {N / H / K} X1X2X3H (SEQ ID NO: 1). In one embodiment of the invention, the HEPN domain comprises an RxxxxxxH motif comprising the sequence of R {N / H} X1X2X3H (SEQ ID NO: 2). In one embodiment of the invention, the HEPN domain comprises the sequence of R {N / K} X1X2X3H (SEQ ID NO: 3). In certain embodiments, X1 is R, S, D, E, Q, N, G, Y, or H. In certain embodiments, X2 is I, S, T, V, or L. In certain embodiments, X3 is L, F, N, Y, V, I, S, D, E, or A.

本発明によって使用するための追加のエフェクターは、例えば、casl遺伝子の開始から20kb及びcasl遺伝子の最後から20kbの領域内にあるが、これらに限定されない、casl遺伝子へのそれらの近接性によって同定することができる。特定の実施形態において、エフェクタータンパク質は、少なくとも1つのHEPNドメイン及び少なくとも500のアミノ酸を含み、C2c2エフェクタータンパク質は、Cas遺伝子またはCRISPRアレイの20kb上流または下流内の原核生物ゲノムに自然に存在する。Casタンパク質の非限定的な例は、Casl、CaslB、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(Csnl及びCsx12としても知られる)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csfl、Csf2、Csf3、Csf4、それらのホモログ、またはそれらの改変したものを含む。特定の例示的な実施形態では、C2c2エフェクタータンパク質は、Cas1遺伝子の20kb上流または下流内の原核生物ゲノムに自然に存在する。「オルソログ(orthologue)」(本明細書では「オルソログ(ortholog)」とも呼ばれる)及び「ホモログ(homologue)」(本明細書では「ホモログ(homolog)」とも呼ばれる)という用語は、当該技術分野で周知である。追加のガイダンスとして、本明細書で使用されるタンパク質の「ホモログ」は、ホモログの関係にあるタンパク質と同じまたは同様の機能を発揮する、同じ種のタンパク質である。相同タンパク質は、可能性としてはあり得るが、構造的に関連する必要はなく、またはその構造的な関連性は部分的なものにすぎない。本明細書で使用されるタンパク質の「オルソログ」は、オルソログの関係にあるタンパク質と同じまたは同様の機能を発揮する、異なる種のタンパク質である。オルソロガスタンパク質は、可能性としてはあり得るが、構造的に関連する必要はなく、またはその構造的な関連性は部分的なものにすぎない。 Additional effectors for use according to the invention are identified by their proximity to the casl gene, eg, within the region 20 kb from the start of the casl gene and 20 kb from the end of the casl gene, but not limited to these. be able to. In certain embodiments, the effector protein comprises at least one HEPN domain and at least 500 amino acids, and the C2c2 effector protein is naturally present in the prokaryotic genome within 20 kb upstream or downstream of the Cas gene or CRISPR array. Non-limiting examples of Cas proteins include Casl, CaslB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (also known as Csnl and Csx12), Cas10, Csyl, Csy2, Csy3, Csel, Cse2. , Cscl, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmrl, Cmr3, Cmr4, Cmr5, Cmr6, Csbl, Csb2, Csb3, Csx17, Csx1 , Csfl, Csf2, Csf3, Csf4, their homologs, or modifications thereof. In certain exemplary embodiments, the C2c2 effector protein is naturally present in the prokaryotic genome within 20 kb upstream or downstream of the Cas1 gene. The terms "orthologue" (also referred to herein as "ortholog") and "homlogue" (also referred to herein as "homolog") are well known in the art. Is. As additional guidance, a protein "homolog" as used herein is a protein of the same species that performs the same or similar function as a protein in a homologous relationship. Homological proteins are possible, but do not need to be structurally related, or their structural relevance is only partial. As used herein, a "ortholog" of a protein is a different species of protein that performs the same or similar function as a protein in an ortholog relationship. Orthologous proteins are possible, but do not need to be structurally related, or their structural relevance is only partial.

特定の実施形態では、VI型のRNA標的Cas酵素はC2c2である。他の実施形態では、VI型のRNA標的Cas酵素はCas13bである。特定の実施形態において、本明細書で言及されるC2c2などのVI型タンパク質のホモログまたはオルソログは、C2c2((例えば、Leptotrichia shahii C2c2、Lachnospiraceae bacterium MA2020 C2c2、Lachnospiraceae bacterium NK4A179 C2c2、Clostridium aminophilum(DSM 10710)C2c2、Carnobacterium gallinarum(DSM 4847)C2c2、Paludibacter propionicigenes (WB4)C2c2、Listeria weihenstephanensis(FSL R9-0317)C2c2、Listeriaceae bacterium(FSL M6-0635)C2c2、Listeria newyorkensis(FSL M6-0635)C2c2、Leptotrichia wadei(F0279)C2c2、Rhodobacter capsulatus(SB 1003)C2c2、Rhodobacter capsulatus(R121)C2c2、Rhodobacter capsulatus(DE442)C2c2、Leptotrichia wadei(Lw2)C2c2、またはListeria seeligeri C2c2)のいずれかの野生型の配列に基づいて)などのVI型タンパク質と、少なくとも30%、または少なくとも40%、または少なくとも50%、または少なくとも60%、または少なくとも70%、または少なくとも80%、より好ましくは少なくとも85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列相同性または同一性を有する。さらなる実施形態において、本明細書で言及されるC2c2などのVI型タンパク質のホモログまたはオルソログは、野生型C2c2((例えば、Leptotrichia shahii C2c2、Lachnospiraceae bacterium MA2020 C2c2、Lachnospiraceae bacterium NK4A179 C2c2、Clostridium aminophilum(DSM 10710)C2c2、Carnobacterium gallinarum(DSM 4847)C2c2、Paludibacter propionicigenes(WB4)C2c2、Listeria weihenstephanensis(FSL R9-0317)C2c2、Listeriaceae bacterium(FSL M6-0635)C2c2、Listeria newyorkensis(FSL M6-0635)C2c2、Leptotrichia wadei(F0279) C2c2、Rhodobacter capsulatus(SB 1003)C2c2、Rhodobacter capsulatus(R121)C2c2、Rhodobacter capsulatus(DE442)C2c2、Leptotrichia wadei(Lw2)C2c2、またはListeria seeligeri C2c2)のいずれかの野生型の配列に基づいて)と、少なくとも30%、または少なくとも40%、または少なくとも50%、または少なくとも60%、または少なくとも70%、または少なくとも80%、より好ましくは少なくとも85%、さらにより好ましくは少なくとも90%、例えば、少なくとも95%の配列同一性を有する。 In certain embodiments, the RNA-targeted Cas enzyme of type VI is C2c2. In another embodiment, the RNA-targeted Cas enzyme of type VI is Cas13b. In certain embodiments, homologs or orthologs of VI-type proteins such as C2c2 referred to herein are C2c2 (eg, Leptotricia shii C2c2, Lachnospiraceae bacterium MA2020 C2c2, LachnospiraCi C2c2, Carnobacterium gallinarum (DSM 4847) C2c2, Paludibacter propionicigenes (WB4) C2c2, Listeria weihenstephanensis (FSL R9-0317) C2c2, Listeriaceae bacterium (FSL M6-0635) C2c2, Listeria newyorkensis (FSL M6-0635) C2c2, Leptotrichia wadei ( F0279) C2c2, Rhodobacter bacterium (SB 1003) C2c2, Rhodobacter bacterium (R121) C2c2, Rhodobacter bacterus (DE442) C2c2, Listeriaceae (DE442) C2c2, Listeriaceae With VI-type proteins such as, at least 30%, or at least 40%, or at least 50%, or at least 60%, or at least 70%, or at least 80%, more preferably at least 85%, even more preferably at least 90%. , For example, have at least 95% sequence homology or identity. In a further embodiment, homologs or orthologs of VI-type proteins such as C2c2 referred to herein are wild-type C2c2 (eg, Leptotricia shahii C2c2, Lachnospiraceae bacterium MA2020 C2c2, LachnoCirbi ) C2c2, Carnobacterium gallinarum (DSM 4847) C2c2, Paludibacter propionicigenes (WB4) C2c2, Listeria weihenstephanensis (FSL R9-0317) C2c2, Listeriaceae bacterium (FSL M6-0635) C2c2, Listeria newyorkensis (FSL M6-0635) C2c2, Leptotrichia wadei (F0279) C2c2, Rhodobacter bacterium (SB 1003) C2c2, Rhodobacter bacterium (R121) C2c2, Rhodobacter bacterium (DE442) C2c2, Listeriaceae (DE442) C2c2, Listeriaceae ) And at least 30%, or at least 40%, or at least 50%, or at least 60%, or at least 70%, or at least 80%, more preferably at least 85%, even more preferably at least 90%, for example, at least. Has 95% sequence identity.

特定の他の例示的な実施形態では、CRISPR系のエフェクタータンパク質はC2c2ヌクレアーゼである。C2c2の活性は、2つのHEPNドメインの存在に依存していてもよい。これらは、RNaseドメイン、すなわちヌクレアーゼ(特にエンドヌクレアーゼ)切断RNAであることが示されている。C2c2 HEPNは、DNA、または潜在的にDNA及び/またはRNAを標的とし得る。C2c2のHEPNドメインが少なくともRNAに結合でき、野生型ではRNAの切断が可能であることに基づいて、C2c2エフェクタータンパク質はRNase機能を有することが好ましい。C2c2 CRISPR系に関しては、TYPE VI CRISPR ORTHOLOGS AND SYSTEMSと題する国際特許公開第WO/2017/219027号、2016年6月17日に出願された米国仮特許出願第62/351,662号、及び2016年8月17日に出願された米国仮特許出願第62/376,377号を参照されたい。2016年6月17日に出願された米国仮特許第62/351,803号も参照される。また、2016年12月8日に出願された、Broad Institute番号10035.PA4及び代理人ドケット番号47627.03.2133の「Novel Crispr Enzymes and Systems」と題する米国仮特許も参照される。さらに、East-Seletsky et al.“Two distinct RNase activities of CRISPR-C2c2 enable guide-RNA processing and RNA detection”Nature doi:10/1038/naturel9802、及びAbudayyeh et al.“C2c2 is a single-component programmable RNA-guided RNA targeting CRISPR effector”bioRxiv doi:10.1101/054742も参照される。 In certain other exemplary embodiments, the CRISPR-based effector protein is a C2c2 nuclease. The activity of C2c2 may depend on the presence of two HEPN domains. These have been shown to be RNase domains, ie nucleases (especially endonucleases) cleavage RNAs. C2c2 HEPN can target DNA, or potentially DNA and / or RNA. The C2c2 effector protein preferably has an RNase function, based on the fact that the HEPN domain of C2c2 can bind at least RNA and can cleave RNA in wild type. Regarding the C2c2 CRISPR system, International Patent Publication No. WO / 2017/219027 entitled TYPE VI CRISPR ORDHOLOGS AND SYSTEMS, US Provisional Patent Application No. 62 / 351,662 filed on June 17, 2016, and 2016. See US Provisional Patent Application No. 62 / 376,377 filed on August 17th. See also US Provisional Patent No. 62 / 351,803 filed June 17, 2016. Also, Broad Institute No. 10035, filed on December 8, 2016. Also referred to is the US provisional patent entitled "Novel CRISPR Enzymes and Systems" on PA4 and agent docket number 47627.03.2133. Furthermore, East-Seletsky et al. "Two digital RNase actives of CRISPR-C2c2 enable guide-RNA processing and RNA detection" Nature doi: 10/1038 / nature 9802, and Abdayyeh et al. See also "C2c2 is a single-component probe RNA-guided RNA targeting CRISPR effector" bioRxiv doi: 10.1101 / 054742.

CRISPR系におけるRNase機能は知られており、例えば、mRNA標的は特定のIII型CRISPR-Cas系で報告され(Hale et al.,2014,Genes Dev,vol.28,2432-2443、Hale et al.,2009,Cell,vol.139,945-956、Peng et al.,2015,Nucleic acids research,vol.43,406-417)、重要な利点を提供する。Staphylococcus epidermis III-A型システムでは、標的間の転写は、Cas10-Csmリボ核タンパク質エフェクタータンパク質複合体内の独立した活性部位によって媒介される標的DNAとその転写産物の切断をもたらす(Samai et al.,2015,Cell,vol.151,1164-1174を参照されたい)。したがって、本発明のエフェクタータンパク質を介してRNAを標的とするCRISPR-Cas系、組成物または方法が提供される。 RNase function in the CRISPR system is known, for example, mRNA targets have been reported in specific type III CRISPR-Cas systems (Hale et al., 2014, Genes Dev, vol. 28, 2432-2443, Hale et al. , 2009, Cell, vol. 139, 945-956, Peng et al., 2015, Nucleic acids research, vol. 43, 406-417). In the Staphylococcus epidermis III-A system, transcription between targets results in cleavage of the target DNA and its transcripts mediated by an independent active site within the Cas10-Csm ribonucleoprotein effector protein complex (Samai et al.,. See 2015, Cell, vol. 151,1164-1174). Therefore, a CRISPR-Cas system, composition or method that targets RNA via the effector protein of the invention is provided.

一実施形態において、Casタンパク質は、以下を含むがこれに限定されない属の生物のC2c2オルソログであり得る:Leptotrichia、Listeria、Corynebacter、Sutterella、Legionella、Treponema、Filifactor、Eubacterium、Streptococcus、Lactobacillus、Mycoplasma、Bacteroides、Flaviivola、Flavobacterium、Sphaerochaeta、Azospirillum、Gluconacetobacter、Neisseria、Roseburia、Parvibaculum、Staphylococcus、Nitratifractor、Mycoplasma、Campylobacter、及びLachnospira。そのような属の生物種はさもなければ、本明細書で議論された通りであり得る。 In one embodiment, the Cas protein can be a C2c2 ortholog of an organism of the genus including, but not limited to: Leptococcus, Listeria, Corynebacter, Suterella, Legionella, Treponema, Filactor, Flavobacterium, Eubacterium, , Flavivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Rosebulia, Parvibaculum, Staphylococcus, Nittramycoplasma, Nittracytoplasma, Species of such genera may otherwise be as discussed herein.

特定の例示的な実施形態では、本発明のC2c2エフェクタータンパク質には、非限定的に以下の21のオルソログ種が含まれる(複数のCRISPR遺伝子座を含む:Leptotrichia shahii;Leptotrichia wadei(Lw2);Listeria seeligeri;Lachnospiraceae bacterium MA2020;Lachnospiraceae bacterium NK4A179;[Clostridium]aminophilum DSM 10710;Carnobacterium gallinarum DSM 4847;Carnobacterium gallinarum DSM 4847(第2のCRISPR遺伝子座);Paludibacter propionicigenes WB4;Listeria weihenstephanensis FSL R9-0317;Listeriaceae bacterium FSL M6-0635;Leptotrichia wadei F0279;Rhodobacter capsulatus SB 1003;Rhodobacter capsulatus R121;Rhodobacter capsulatus DE442;Leptotrichia buccalis C-1013-b;Herbinix hemicellulosilytica;[Eubacterium]rectale;Eubacteriaceae bacterium CHKCI004;Blautia sp.Marseille-P2398;及びLeptotrichia sp.oral taxon 879 str.F0557。12のさらなる非限定的な例は以下の通りである:Lachnospiraceae bacterium NK4A144;Chloroflexus aggregans;Demequina aurantiaca;Thalassospira sp.TSL5-1;Pseudobutyrivibrio sp.OR37;Butyrivibrio sp.YAB3001;Blautia sp.Marseille-P2398;Leptotrichia sp.Marseille-P3007;Bacteroides ihuae;Porphyromonadaceae bacterium KH3CP3RA;Listeria riparia;及びInsolitispirillum peregrinum。 In certain exemplary embodiments, the C2c2 effector proteins of the invention include, but are not limited to, the following 21 ortholog species (including multiple CRISPR loci: Lachnospiraceae; Lachnospiraceae (Lw2); Listeria). seeligeri; Lachnospiraceae bacterium MA2020; Lachnospiraceae bacterium NK4A179; [Clostridium] aminophilum DSM 10710; Carnobacterium gallinarum DSM 4847; Carnobacterium gallinarum DSM 4847 (second CRISPR locus); Paludibacter propionicigenes WB4; Listeria weihenstephanensis FSL R9-0317; Listeriaceae bacterium FSL M6 -0635; Leptotrichia wadei F0279; Rhodobacter capsulatus SB 1003; Rhodobacter capsulatus R121; Rhodobacter capsulatus DE442; Leptotrichia buccalis C-1013-b; Herbinix hemicellulosilytica; [Eubacterium] rectale; Eubacteriaceae bacterium CHKCI004; Blautia sp.Marseille-P2398; and Leptotrichia sp Further non-limiting examples of .oral taxon 879 str. F0557.12 are as follows: Lachnospiraceae bacterium NK4A144; Chloroflexus aggregans; Demequina auranattiaca; Blautia sp. Marsaille-P2398; Leptoricia s p. Marseille-P3007; Bacteroides ihuae; Bacteroides bacterium KH3CP3RA; Listeria riparia; and Insolitis piryllum peregrinum.

CRISPR-Cas系酵素のオルソログを特定するいくつかの方法は、対象のゲノム内のtracr配列を特定することを含み得る。tracr配列の特定は、次のステップに関連し得る:データベースでダイレクトリピートまたはtracr mate配列を検索して、CRISPR酵素を含むCRISPR領域を特定する。センスとアンチセンスの両方向でCRISPR酵素に隣接するCRISPR領域の相同配列を検索する。転写ターミネーターと二次構造を探す。ダイレクトリピートまたはtracr mate配列ではないが、潜在的なtracr配列として、ダイレクトリピートまたはtracr mate配列と50%を超える同一性を持つ任意の配列を特定する。潜在的なtracr配列を取得し、それに関連する転写ターミネーター配列を分析する。 Several methods of identifying the ortholog of a CRISPR-Cas-based enzyme may include identifying the tracr sequence within the genome of interest. Identification of the tracr sequence may be relevant to the next step: Search the database for direct repeat or tracr mate sequences to identify the CRISPR region containing the CRISPR enzyme. Search for homologous sequences in the CRISPR region flanking the CRISPR enzyme in both sense and antisense directions. Look for a transfer terminator and secondary structure. Any sequence that is not a direct repeat or tracr mate sequence but has greater than 50% identity with a direct repeat or tracr mate sequence is identified as a potential tracr sequence. The potential tracr sequence is obtained and the associated transcription terminator sequence is analyzed.

本明細書に記載の機能のいずれも、複数のオルソログからの断片を含むキメラ酵素を含む、他のオルソログからのCRISPR酵素に操作できることが理解されよう。そのようなオルソログの例は、本明細書のいずこかに記載されている。したがって、キメラ酵素は、Leptotrichia、Listeria、Corynebacter、Sutterella、Legionella、Treponema、Filifactor、Eubacterium、Streptococcus、Lactobacillus、Mycoplasma、Bacteroides、Flaviivola、Flavobacterium、Sphaerochaeta、Azospirillum、Gluconacetobacter、Neisseria、Roseburia、Parvibaculum、Staphylococcus、Nitratifractor、Mycoplasma、及びCampylobacterを含むがこれらに限定されない生物のCRISPR酵素オルソログの断片を含み得る。キメラ酵素は、第1の断片及び第2の断片を含むことができ、断片は、本明細書で言及される属または本明細書で言及される種の生物のCRISPR酵素オルソログであり得る。有利には、断片は異なる種のCRISPR酵素オルソログに由来する。 It will be appreciated that any of the functions described herein can be engineered to CRISPR enzymes from other orthologs, including chimeric enzymes containing fragments from multiple orthologs. Examples of such orthologs are described elsewhere herein. Accordingly, a chimeric enzyme, Leptotrichia, Listeria, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor, It may contain fragments of the CRISPR enzyme orthologs of organisms including, but not limited to, Mycoplasma, and Campylobacter. The chimeric enzyme can include a first fragment and a second fragment, which can be the CRISPR enzyme ortholog of the genus referred to herein or the species referred to herein. Advantageously, the fragment is derived from a different species of CRISPR enzyme ortholog.

実施形態において、本明細書で言及されるC2c2タンパク質は、C2c2またはそのホモログもしくはオルソログの機能的バリアントも包含する。本明細書で使用されるとき、タンパク質の「機能的バリアント」は、そのタンパク質の活性を少なくとも部分的に保持する、そのようなタンパク質のバリアントを指す。機能的バリアント」には、多形体などを含む変異体(挿入、欠失、または置換変異体であり得る)が含まれ得る。また、機能的バリアントには、そのようなタンパク質と、通常は無関係な別の核酸、タンパク質、ポリペプチド、またはペプチドとの融合産物も含まれる。機能的バリアントは、天然に存在する場合もあれば、人工的に発生する場合もある。有利な実施形態は、操作された、または天然に存在しないVI型RNA標的エフェクタータンパク質を含み得る。 In embodiments, the C2c2 protein referred to herein also includes a functional variant of C2c2 or a homolog or ortholog thereof. As used herein, a "functional variant" of a protein refers to a variant of such a protein that at least partially retains the activity of the protein. "Functional variants" can include variants (which can be insertions, deletions, or substitution variants), including polymorphs and the like. Functional variants also include fusion products of such proteins with other nucleic acids, proteins, polypeptides, or peptides that are normally unrelated. Functional variants may be naturally occurring or artificially occurring. Preferred embodiments may include engineered or non-naturally occurring VI-type RNA target effector proteins.

一実施形態において、C2c2またはそのオルソログもしくはホモログをコードする核酸分子(複数可)は、真核細胞における発現のためにコドン最適化され得る。真核生物は、本明細書で論じられるものであり得る。核酸分子(複数可)は、操作されたものでも、天然に存在しないものでもよい。 In one embodiment, the nucleic acid molecule (s) encoding C2c2 or its ortholog or homolog can be codon-optimized for expression in eukaryotic cells. Eukaryotes can be those discussed herein. Nucleic acid molecules (s) may be engineered or non-naturally occurring.

一実施形態において、C2c2またはそのオルソログもしくはホモログは、1つ以上の変異を含み得る(したがって、それをコードする核酸分子(複数可)は変異(複数可)を有し得る)。変異は、人工的に導入された変異であり得、触媒ドメインにおける1つ以上の変異を含み得るが、これらに限定されない。Cas9酵素に関する触媒ドメインの例には、RuvC I、RuvC II、RuvC III及びHNHドメインが含まれ得るが、これらに限定されない。 In one embodiment, C2c2 or its ortholog or homolog can contain one or more mutations (thus, the nucleic acid molecule (s) encoding it may have a mutation (s)). Mutations can be artificially introduced mutations and can include, but are not limited to, one or more mutations in the catalytic domain. Examples of catalytic domains for Cas9 enzymes can include, but are not limited to, RuvC I, RuvC II, RuvC III and HNH domains.

一実施形態において、C2c2またはそのオルソログもしくはホモログは、1つ以上の変異を含み得る。変異は、人工的に導入された変異であり得、触媒ドメインにおける1つ以上の変異を含み得るが、これらに限定されない。Cas酵素に関する触媒ドメインの例には、HEPNドメインが含まれるが、これらに限定されない。
一実施形態において、C2c2またはそのオルソログもしくはホモログは、機能的ドメインに融合するか、または機能的ドメインに作動可能に連結される一般的な核酸結合タンパク質として使用され得る。例示的な機能ドメインには、翻訳開始剤、翻訳活性化因子、翻訳抑制因子、ヌクレアーゼ、特にリボヌクレアーゼ、スプライソソーム、ビーズ、光誘導可能/制御可能ドメイン、または化学的誘導可能/制御可能ドメインが含まれ得るが、これらに限定されない。
In one embodiment, C2c2 or its ortholog or homolog can contain one or more mutations. Mutations can be artificially introduced mutations and can include, but are not limited to, one or more mutations in the catalytic domain. Examples of catalytic domains for Cas enzymes include, but are not limited to, the HEPN domain.
In one embodiment, C2c2 or its ortholog or homolog can be used as a common nucleic acid binding protein that fuses with or is operably linked to a functional domain. Exemplary functional domains include translation initiators, translational activators, translational repressors, nucleases, especially ribonucleases, spliceosomes, beads, photoinducible / controllable domains, or chemically inducible / controllable domains. However, but not limited to these.

特定の例示的な実施形態において、C2c2エフェクタータンパク質は、Leptotrichia、Listeria、Corynebacter、Sutterella、Legionella、Treponema、Filifactor、Eubacterium、Streptococcus、Lactobacillus、Mycoplasma、Bacteroides、Flaviivola、Flavobacterium、Sphaerochaeta、Azospirillum、Gluconacetobacter、Neisseria、Roseburia、Parvibaculum、Staphylococcus、Nitratifractor、Mycoplasma、及びCampylobacterからなる群から選択される生物に由来し得る。 In certain exemplary embodiments, C2c2 effector proteins, Leptotrichia, Listeria, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, It may be derived from an organism selected from the group consisting of Rosebulia, Pavibaculum, Staphylococcus, Listeria, Mycoplasma, and Campylobactor.

特定の実施形態において、エフェクタータンパク質は、Listeria sp.C2c2p、好ましくはListeria seeligeria C2c2p、より好ましくはListeria seeligeria血清型1/2b株SLCC3954 C2c2pであり得、crRNA配列は、5’の29ntの直接反復(DR)及び15nt~18ntのスペーサーを含み、44~47ヌクレオチド長であり得る。 In certain embodiments, the effector protein is Listeria sp. It can be C2c2p, preferably Listeria Seeligeria C2c2p, more preferably Listeria Seeligeria serotype 1 / 2b strain SLCC3954 C2c2p, the crRNA sequence containing 5'29 nt direct repeats (DR) and 15 nt-18 nt spacers, 44- It can be 47 nucleotides in length.

特定の実施形態において、エフェクタータンパク質は、Leptotrichia sp.C2c2p、好ましくはLeptotrichia shahii C2c2p、より好ましくはLeptotrichia shahii DSM 19757 C2c2pであり得、crRNA配列は、5’直接反復が少なくとも24ntであり、例えば、5’の24~28nt直接反復(DR)を含み、少なくとも14ntのスペーサー、例えば、14nt~28ntのスペーサー、または少なくとも18nt、例えば、19、20、21、22、またはそれ以上のnt、例えば、18~28、19~28、20~28、21~28、または22~28ntのスペーサーを含み、42~58ヌクレオチド長であり得る。 In certain embodiments, the effector protein is Leptotricia sp. It can be C2c2p, preferably Leptotricia shahii C2c2p, more preferably Leptotricia shahii DSM 19757 C2c2p, and the crRNA sequence is at least 24 nt with 5'direct iterations, including, for example, 24-28 nt direct repeats (DR) of 5'. At least 14 nt spacers, eg 14 nt-28 nt spacers, or at least 18 nt, eg 19, 20, 21, 22 or more nts, eg 18-28, 19-28, 20-28, 21-28. , Or 22-28 nt spacers and can be 42-58 nucleotides in length.

特定の例示的な実施形態において、エフェクタータンパク質は、Leptotrichia sp.、Leptotrichia wadei F0279、またはListeria sp.、好ましくはListeria newyorkensis FSL M6-0635であり得る。 In certain exemplary embodiments, the effector protein is Leptotricia sp. , Leptotricia wadei F0279, or Listeria sp. , Preferably Listeria newyorkensis FSL M6-0635.

特定の実施形態において、本発明によるC2c2タンパク質は、オルソログの1つであるか、もしくはそれに由来するか、または本出願に記載のオルソログの2つ以上のキメラタンパク質であるか、またはオルソログの1つの変異体もしくはバリアント(またはキメラ変異体もしくはバリアント)であり、異種/機能ドメインとの融合の有無にかかわらず、本明細書の他の場所で定義される死C2c2、分割C2c2、不安定化C2c2などを含む。 In certain embodiments, the C2c2 protein according to the invention is one of the orthologs, or is derived from it, or is two or more chimeric proteins of the orthologs described in this application, or one of the orthologs. Variants or variants (or chimeric variants or variants) such as dead C2c2, split C2c2, destabilized C2c2, etc. as defined elsewhere herein, with or without fusion with a heterologous / functional domain. including.

特定の例示的な実施形態では、RNA標的エフェクタータンパク質は、Cas13b及びグループ29またはグループ30タンパク質などのVI-B型エフェクタータンパク質である。特定の例示的な実施形態では、RNA標的エフェクタータンパク質は、1つ以上のHEPNドメインを含む。特定の例示的な実施形態では、RNA標的エフェクタータンパク質は、C末端HEPNドメイン、N末端HEPNドメイン、またはその両方を含む。本発明に関連して使用できる例示的なタイプVI-Bエフェクタータンパク質に関して、2016年10月21日に出願された、「Novel CRISPR Enzymes and Systems」と題する米国特許出願第15/331,792号、2016年10月21日に出願された、「Novel CRISPR Enzymes and Systems」と題する国際特許出願第PCT/US2016/058302号、及びSmargon et al.“cas13b is a Type VI-B CRISPR-associated RNA-Guided RNase differentially regulated by accessory proteins Csx27 and Csx28” Molecular Cell,65,1-13(2017);dx.doi.org/10.1016/j.molcel.2016.12.023、及び2017年3月15日に出願された、「Novel cas13b Orthologues CRISPR Enzymes and System」と題する割り当てられる予定の米国仮出願を参照される。特定の例示的な実施形態では、参照により本明細書に組み込まれる国際出願第PCT/US2017/065477号、40~52ページの表1~6に記載される、2つのCas13aオルソログ、2つのCas13bオルソログ、または2つのCas13cオルソログなど、同じクラスのCRISPRエフェクタータンパク質からの異なるオルソログを使用することができる。特定の他の例示的な実施形態では、異なるヌクレオチド編集選好性を有する異なるオルソログ、例えば、Cas13a及びCas13bオルソログ、またはCas13a及びCas13cオルソログ、またはCas13bオルソログ及びCas13cオルソログなどを使用することができる。 In certain exemplary embodiments, the RNA target effector protein is a VI-B type effector protein such as Cas13b and a Group 29 or Group 30 protein. In certain exemplary embodiments, the RNA target effector protein comprises one or more HEPN domains. In certain exemplary embodiments, the RNA target effector protein comprises a C-terminal HEPN domain, an N-terminal HEPN domain, or both. U.S. Patent Application No. 15 / 331,792, entitled "Novel CRISPR Enzymes and Systems," filed October 21, 2016, with respect to exemplary type VI-B effector proteins that can be used in connection with the present invention. International Patent Application No. PCT / US2016 / 0583032, entitled "Novel CRISPR Enzymes and Systems," filed October 21, 2016, and Margon et al. "Cas13b is a Type VI-B CRISPR-assisted RNA-Guided RNase digitally regulent by acknowledge protein Csx27 and Csx28" Molecular Cell, 65- doi. org / 10.1016 / j. molcel. See 2016.12.023, and the upcoming US provisional application entitled "Novell cass13b CRISPR Enzymes and System" filed March 15, 2017. In certain exemplary embodiments, the two Cas13a orthologs and the two Cas13b orthologs described in Tables 1-6 of International Application No. PCT / US2017 / 065477, pages 40-52, which are incorporated herein by reference. , Or different orthologs from the same class of CRISPR effector proteins, such as two Cas13c orthologs. In certain other exemplary embodiments, different orthologs with different nucleotide editing preferences, such as Cas13a and Cas13b orthologs, or Cas13a and Cas13c orthologs, or Cas13b and Cas13c orthologs, can be used.

RNA標的エフェクタータンパク質は、いくつかの実施形態では、1つ以上のHEPNドメインを含むことができ、これは、場合によってはRxxxxHモチーフ配列を含むことができる。場合によっては、RxxxHモチーフはR{N/H/K]XH配列を含み、これは、いくつかの実施形態では、Xは、R、S、D、E、Q、N、G、またはYであり、Xは、独立してI、S、T、V、またはLであり、Xは、独立してL、F、N、Y、V、I、S、D、E、またはAである。いくつかの特定の実施形態では、CRISPR RNA標的エフェクタータンパク質は、C2c2である。 The RNA target effector protein can, in some embodiments, contain one or more HEPN domains, which can optionally include the RxxxxxxH motif sequence. In some cases, the RxxxH motif comprises an R {N / H / K] X 1 X 2 X 3 H sequence, which in some embodiments, X 1 is R, S, D, E, Q, N, G, or Y, X 2 is independently I, S, T, V, or L, and X 3 is independently L, F, N, Y, V, I, S, D, E, or A. In some specific embodiments, the CRISPR RNA target effector protein is C2c2.

非特異的ssDNA及びRNA指向タンパク質は必然的に、さらに、潜在的に、付随的切断を示し、検出に使用される可能性のある改良されたCasタンパク質をもたらし、検出に使用することができ、増幅された高感度の核酸標的の検出、特にSHERLOCK診断システムの多重検出により大きな幅を提供できる。 Non-specific ssDNA and RNA-oriented proteins inevitably, and also potentially, exhibit improved Cas proteins that may be used for detection, resulting in improved Cas proteins that can be used for detection. A large range can be provided by the detection of amplified and sensitive nucleic acid targets, especially the multiple detection of the SHERLOCK diagnostic system.

ガイド
本明細書で使用されるとき、V型またはVI型CRISPR-Cas遺伝子座エフェクタータンパク質の「crRNA」または「ガイドRNA」または「単一ガイドRNA」または「sgRNA」または「1つ以上の核酸構成要素」という用語は、標的核酸配列とハイブリダイズし、核酸標的化複合体が標的核酸配列へ配列特異的結合するように差し向けるのに、標的核酸配列と十分な相補性を有する任意のポリヌクレオチド配列を含む。いくつかの実施形態では、相補性の程度は、適切な整列アルゴリズムを使用して最適にアラインメントされる場合、約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、またはそれ以上である。最適なアラインメントは、アラインメント配列に適した任意のアルゴリズムを使用して決定され得るが、その非限定的な例には、Smith-Watermanアルゴリズム、Needleman-Wunschアルゴリズム、Burrows-Wheeler変換に基づくアルゴリズム(例えば、Burrows Wheeler Aligner)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies;www.novocraft.comで入手可能)、ELAND(Illumina、San Diego、CA)、SOAP(soap.genomics.org.cnで入手可能)、及びMaq(maq.sourceforge.netで入手可能)が挙げられる。核酸標的化複合体の標的核酸配列への配列特異的結合を指示するガイド配列(核酸標的化ガイドRNA内)の能力は、任意の適切なアッセイにより評価され得る。例えば、試験されるガイド配列を含む核酸標的化複合体を形成するのに十分な核酸標的化CRISPR系の構成要素は、核酸標的化複合体の構成要素をコードするベクターを用いるトランスフェクション、続いて、本明細書に記載のSurveyorアッセイなどによる、標的核酸配列内の優先的標的化(例えば、切断)の評価などによって、対応する標的核酸配列を有する宿主細胞に提供され得る。同様に、標的核酸配列の切断は、試験管内で、標的核酸配列、試験されるガイド配列及び試験ガイドとは異なる対照ガイド配列を含む核酸標的化複合体の構成要素を、を提供すること、ならびに試験と対照のガイドの配列の反応の間の標的配列での結合または切断速度の比較により評価され得る。他のアッセイもまた可能であり、当業者には明らかであろう。任意の標的核酸配列を標的とするために、ガイド配列、したがって核酸標的ガイドを選択してもよい。標的配列はDNAであってもよい。標的配列は、任意のRNA配列であってもよい。いくつかの実施形態では、標的配列は、メッセンジャーRNA(mRNA)、プレmRNA、リボソームRNA(rRNA)、トランスファーRNA(tRNA)、マイクロRNA(miRNA)、低分子干渉RNA(siRNA)、核内低分子RNA(snRNA)、低分子核小体RNA(snoRNA)、二本鎖RNA(dsRNA)、非コードRNA(ncRNA)、長非コードRNA(lncRNA)、及び低分子細胞質RNA(scRNA)からなる群より選択されるRNA分子内の配列であってもよい。いくつかの好ましい実施形態では、標的配列は、mRNA、プレmRNA、及びrRNAからなる群より選択されるRNA分子内の配列であってもよい。いくつかの好ましい実施形態では、標的配列は、ncRNA及びlncRNAからなる群より選択されるRNA分子内の配列であり得る。いくつかのより好ましい実施形態では、標的配列は、mRNA分子またはプレmRNA分子内の配列であってもよい。
Guide As used herein, the "crRNA" or "guide RNA" or "single guide RNA" or "sgRNA" or "one or more nucleic acid constructs" of a V-type or VI-type CRISPR-Cas locus effector protein. The term "element" is any polynucleotide that hybridizes with the target nucleic acid sequence and has sufficient complementarity with the target nucleic acid sequence to direct the nucleic acid targeting complex to sequence-specific binding to the target nucleic acid sequence. Contains sequences. In some embodiments, the degree of complementarity is approximately 50%, 60%, 75%, 80%, 85%, 90%, 95%, when optimally aligned using an appropriate alignment algorithm. 97.5%, 99%, or more. Optimal alignment can be determined using any algorithm suitable for the alignment sequence, but non-limiting examples thereof include the Smith-Waterman algorithm, the Needleman-Wunsch algorithm, and algorithms based on the Burrows-Wheeler transformation (eg,). , Burrows Wheeler Algorithm), CrystalW, Crystal X, BLAT, Novoalign (Novocraft Technologies; available at www.novocraft.com), ELAND (Illumina, SanGe. ), And Maq (available at maq.Sourceforge.net). The ability of the guide sequence (within the nucleic acid targeting guide RNA) to direct sequence-specific binding of the nucleic acid targeting complex to the target nucleic acid sequence can be assessed by any suitable assay. For example, a component of the nucleic acid targeting CRISPR system sufficient to form a nucleic acid targeting complex containing a guide sequence to be tested is transfection with a vector encoding a component of the nucleic acid targeting complex, followed by transfection. , By evaluation of preferential targeting (eg, cleavage) within a target nucleic acid sequence, such as by the Surveyor assay described herein, can be provided to host cells having the corresponding target nucleic acid sequence. Similarly, cleavage of the target nucleic acid sequence provides, in vitro, a component of the nucleic acid targeting complex, which comprises the target nucleic acid sequence, the guide sequence to be tested and the control guide sequence different from the test guide. It can be assessed by comparison of binding or cleavage rates at the target sequence between the reaction of the test and control guide sequences. Other assays are also possible and will be apparent to those of skill in the art. Guide sequences, and thus nucleic acid targeting guides, may be selected to target any target nucleic acid sequence. The target sequence may be DNA. The target sequence may be any RNA sequence. In some embodiments, the target sequence is messenger RNA (mRNA), premRNA, ribosome RNA (rRNA), transfer RNA (tRNA), microRNA (miRNA), small interfering RNA (siRNA), nuclear small molecule. From the group consisting of RNA (snRNA), small nuclei body RNA (snoRNA), double-stranded RNA (dsRNA), non-coding RNA (ncRNA), long non-coding RNA (lncRNA), and small cytoplasmic RNA (scRNA). It may be a sequence within the selected RNA molecule. In some preferred embodiments, the target sequence may be a sequence within an RNA molecule selected from the group consisting of mRNA, pre-mRNA, and rRNA. In some preferred embodiments, the target sequence can be a sequence within an RNA molecule selected from the group consisting of ncRNA and lncRNA. In some more preferred embodiments, the target sequence may be an mRNA molecule or a sequence within a pre-mRNA molecule.

いくつかの実施形態では、核酸標的ガイドは、核酸標的ガイド内の二次構造の程度を低下するように選択される。いくつかの実施形態では、核酸標的化ガイドのヌクレオチドのうち、最適にフォールディングされたときの自己相補的な塩基対形成に関与するヌクレオチドの割合は、約75%以下、約50%以下、約40%以下、約30%以下、約25%以下、約20%以下、約15%以下、約10%以下、約5%以下、約1%以下、またはそれ未満の%である。最適なフォールディングは、任意の適切なポリヌクレオチドフォールディングアルゴリズムによって決定され得る。いくつかのプログラムは、最小ギブズ自由エネルギーの計算に基づくものである。そのようなアルゴリズムの1つの例は、mFoldであり、mFoldは、Zuker and Stiegler (Nucleic Acids Res.9(1981),133-148)によって説明されている。フォールディングアルゴリズムの別の例は、重心構造予測アルゴリズムを使用するオンラインウェブサーバーRNAfoldであり、これは、Institute for Theoretical Chemistry at the University of Viennaで開発されたものである(例えば、A.R.Gruber et al.,2008,Cell 106(1):23-24;及びPA Carr and GM Church,2009,Nature Biotechnology 27(12):1151-62を参照されたい)。 In some embodiments, the nucleic acid target guide is selected to reduce the degree of secondary structure within the nucleic acid target guide. In some embodiments, the proportion of nucleotides in the nucleic acid targeting guide that are involved in self-complementary base pairing when optimally folded is about 75% or less, about 50% or less, about 40. % Or less, about 30% or less, about 25% or less, about 20% or less, about 15% or less, about 10% or less, about 5% or less, about 1% or less, or less. Optimal folding can be determined by any suitable polynucleotide folding algorithm. Some programs are based on the calculation of the minimum Gibbs free energy. One example of such an algorithm is mFold, which is described by Zuker and Steegler (Nucleic Acids Res. 9 (1981), 133-148). Another example of the folding algorithm is an online web server RNAfold that uses a center of gravity structure prediction algorithm, which was developed in the Institute for Theoretical Chemistry at the University of Vienna (eg, AR Gruber). Al., 2008, Cell 106 (1): 23-24; and PA Carr and GM Structure, 2009, Nature Biotechnology 27 (12): 1151-62).

特定の実施形態では、ガイドRNAまたはcrRNAは、ダイレクトリピート(DR)配列及びガイド配列またはスペーサー配列を含んでもよいし、本質的にそれらからなってもよいし、またはそれらからなってもよい。特定の実施形態では、ガイドRNAまたはcrRNAは、ガイド配列またはスペーサー配列に融合または連結されたダイレクトリピート配列を含んでもよいし、本質的にそれらからなってもよいし、またはそれらからなってもよい。特定の実施形態では、ダイレクトリピート配列は、ガイド配列またはスペーサー配列の上流(すなわち5’)に位置してもよい。他の実施形態では、ダイレクトリピート配列は、ガイド配列またはスペーサー配列の下流(すなわち、3’)に位置してもよい。 In certain embodiments, the guide RNA or crRNA may include, or may consist essentially of, a direct repeat (DR) sequence and a guide sequence or spacer sequence. In certain embodiments, the guide RNA or crRNA may include, or may consist essentially of, a direct repeat sequence fused or linked to a guide or spacer sequence. .. In certain embodiments, the direct repeat sequence may be located upstream (ie, 5') of the guide or spacer sequence. In other embodiments, the direct repeat sequence may be located downstream of the guide sequence or spacer sequence (ie, 3').

特定の実施形態では、crRNAは、ステムループ、好ましくは単一のステムループを含む。特定の実施形態では、ダイレクトリピート配列は、ステムループ、好ましくは単一のステムループを形成する。 In certain embodiments, the crRNA comprises a stem loop, preferably a single stem loop. In certain embodiments, the direct repeat sequence forms a stem-loop, preferably a single stem-loop.

特定の実施形態では、ガイドRNAのスペーサー長は、15~35ntである。特定の実施形態では、ガイドRNAのスペーサー長は、少なくとも15ヌクレオチドである。特定の実施形態では、スペーサー長は、15~17nt、例えば15、16、または17nt、17~20nt、例えば17、18、19、または20nt、20~24nt、例えば20、21、22、23、または24nt、23~25nt、例えば23、24、または25nt、24~27nt、例えば24、25、26、または27nt、27~30nt、例えば27、28、29、または30nt、30~35nt、例えば30、31、32、33、34、または35nt、または35nt以上である。 In certain embodiments, the spacer length of the guide RNA is 15-35 nt. In certain embodiments, the spacer length of the guide RNA is at least 15 nucleotides. In certain embodiments, the spacer length is 15 to 17 nt, such as 15, 16, or 17 nt, 17 to 20 nt, such as 17, 18, 19, or 20 nt, 20 to 24 nt, such as 20, 21, 22, 23, or. 24nt, 23-25nt, eg 23, 24, or 25nt, 24-27nt, eg 24, 25, 26, or 27nt, 27-30nt, eg 27, 28, 29, or 30nt, 30-35nt, eg 30, 31 , 32, 33, 34, or 35 nt, or 35 nt or more.

「tracrRNA」配列または類似の用語は、ハイブリダイズするのにcrRNA配列と十分な相補性を有する任意のポリヌクレオチド配列を含む。いくつかの実施形態では、最適にアラインメントされた場合の2つの短い方の長さに沿ったtracrRNA配列とcrRNA配列との間の相補性の程度は、約25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%、またはそれ以上である。いくつかの実施形態では、tracr配列は、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50以上、またはそれ以上の長さのヌクレオチドである。いくつかの実施形態では、tracr配列及びcrRNA配列は、単一の転写物内に含まれ、その結果、2つの間のハイブリダイゼーションは、ヘアピンなどの二次構造を有する転写物を生成する。本発明の一実施形態では、転写物または転写されたポリヌクレオチド配列は、少なくとも2つ以上のヘアピンを有する。好ましい実施形態では、転写物は、2つ、3つ、4つまたは5つのヘアピンを有する。本発明のさらなる実施形態では、転写物は最大で5つのヘアピンを有する。ヘアピン構造では、最後の「N」の5’配列、及びループの上流の一部が、tracr mate配列に対応し、ループの3’配列の一部がtracr配列に対応する。 The "tracrRNA" sequence or similar term includes any polynucleotide sequence that has sufficient complementarity with the crRNA sequence to hybridize. In some embodiments, the degree of complementarity between the tracrRNA sequence and the crRNA sequence along the two shorter lengths when optimally aligned is approximately 25%, 30%, 40%, 50. %, 60%, 70%, 80%, 90%, 95%, 97.5%, 99%, or more. In some embodiments, the tracr sequence is approximately 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, Nucleotides with a length of 50 or more. In some embodiments, the tracr and crRNA sequences are contained within a single transcript, so that hybridization between the two produces a transcript with secondary structure such as a hairpin. In one embodiment of the invention, the transcript or transcribed polynucleotide sequence has at least two or more hairpins. In a preferred embodiment, the transcript has two, three, four or five hairpins. In a further embodiment of the invention, the transcript has up to 5 hairpins. In the hairpin structure, the last "N" 5'sequence, and part of the upstream of the loop corresponds to the tracr mate sequence, and part of the loop's 3'array corresponds to the tracr sequence.

一般に、相補性の程度は、2つの配列のうち短い方の長さに沿った、sca配列及びtracr配列の最適なアラインメントに関するものである。最適なアライメントは、任意の適切なアライメントアルゴリズムによって決定してもよく、さらにsca配列またはtracr配列のいずれか内の自己相補性などの二次構造を考慮し得る。いくつかの実施形態では、最適にアラインメントした場合の2つの短い方の長さに沿ったtracr配列とsca配列の間の相補性の程度は、約25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%、またはそれ以上である。 In general, the degree of complementarity relates to the optimal alignment of the sca and tracr sequences along the shorter of the two sequences. Optimal alignment may be determined by any suitable alignment algorithm and may also take into account secondary structure such as self-complementarity within either the sca sequence or the tracr sequence. In some embodiments, the degree of complementarity between the tracr and sca sequences along the two shorter lengths when optimally aligned is approximately 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97.5%, 99%, or more.

一般に、CRISPR-Cas、CRISPR-Cas9、またはCRISPR系とは、WO2014/093622(PCT/US2013/074667)などの前述の文書で使用されているものであり、Cas遺伝子をコードする配列、特にCRISPR-Cas9の場合はCas9遺伝子、tracr(トランス活性化CRISPR)配列(例えば、tracrRNAまたは活性部分tracrRNA)、tracr-mate配列(内因性CRISPR系の状況で「ダイレクトリピート」及びtracrRNAで処理された部分的なダイレクトリピートを含む)、ガイド配列(内因性CRISPR系の状況で「スペーサー」とも呼ばれる)、またはその用語が本明細書で使用される「RNA(複数可)」(例えば、Cas9をガイドするRNA(複数可)、例えばCRISPR RNA及びトランス活性化(tracr)RNAまたはシングルガイドRNA(sgRNA)(キメラRNA))またはCRISPR遺伝子座からの他の配列及び転写物を含む、CRISPR関連(「Cas」)遺伝子の活性の発現または活性の誘導に関与する転写物及び他の要素を総称的に指す。一般的に、CRISPR系は、標的配列の部位においてCRISPR複合体の形成を促進する要素(内因性CRISPR系の文脈においてプロトスペーサーとも呼ばれる)によって特徴付けられる。CRISPR複合体形成の文脈において、「標的配列」は、ガイド配列が相補性を有するように設計される配列を指し、標的配列とガイド配列との間のハイブリダイゼーションがCRISPR複合体の形成を促進する。標的配列への相補性が切断活性にとって重要であるガイド配列のセクションは、本明細書ではシード配列と呼ばれる。標的配列は、DNAまたはRNAのポリヌクレオチドのような任意のポリヌクレオチドを含んでよい。いくつかの実施形態では、標的配列は、細胞の核または細胞質に位置し、細胞内に存在するミトコンドリア、オルガネラ、小胞、リポソームまたは粒子の中またはそれに由来する核酸を含んでもよい。いくつかの実施形態では、特に非核用途の場合、NLSは好ましくない。いくつかの実施形態では、CRISPR系は、1つ以上の核輸出シグナル(NES)を含む。いくつかの実施形態では、CRISPR系は、1つ以上のNLS及び1つ以上のNESを含む。いくつかの実施形態では、以下の基準のいずれかまたはすべてを満たす反復モチーフを検索することにより、インシリコでダイレクトリピートを同定し得る:1.タイプIICRISPR遺伝子座に隣接するゲノム配列の2Kbのウィンドウで見られる;2.20~50bpの範囲;及び3.20~50bpの間隔。いくつかの実施形態では、これらの基準のうちの2つ、例えば1と2、2と3、または1と3を使用し得る。いくつかの実施形態では、3つすべての基準を使用してもよい。 Generally, the CRISPR-Cas, CRISPR-Cas9, or CRISPR system is one used in the aforementioned documents such as WO2014 / 093622 (PCT / US2013 / 074667) and is a sequence encoding the Cas gene, especially the CRISPR-. In the case of Cas9, the Cas9 gene, tracr (trans-activated CRISPR) sequence (eg, tracrRNA or active partial CRISPRRNA), tracr-mate sequence ("direct repeat" and partially treated with tracrRNA in the context of an endogenous CRISPR system. A guide sequence (including direct repeats), a guide sequence (also referred to as a "spacer" in the context of an endogenous CRISPR system), or an "RNA (s)" as the term is used herein (eg, an RNA that guides Cas9 (eg, Cas9). Multiple), eg, CRISPR-related (“Cas”) genes, including CRISPR RNA and trans-activated (tracr) RNA or single-guide RNA (sgRNA) (chimera RNA)) or other sequences and transcripts from the CRISPR locus. Collectively refers to transcripts and other elements involved in the expression or induction of activity of. Generally, the CRISPR system is characterized by an element that promotes the formation of a CRISPR complex at the site of the target sequence (also called a protospacer in the context of the endogenous CRISPR system). In the context of CRISPR complex formation, "target sequence" refers to a sequence in which the guide sequence is designed to have complementarity, and hybridization between the target sequence and the guide sequence facilitates the formation of the CRISPR complex. .. The section of the guide sequence where complementarity to the target sequence is important for cleavage activity is referred to herein as the seed sequence. The target sequence may include any polynucleotide, such as a polynucleotide of DNA or RNA. In some embodiments, the target sequence may contain nucleic acids located in or derived from mitochondria, organelles, vesicles, liposomes or particles located in the nucleus or cytoplasm of the cell. In some embodiments, NLS is not preferred, especially for non-nuclear applications. In some embodiments, the CRISPR system comprises one or more nuclear export signals (NES). In some embodiments, the CRISPR system comprises one or more NLS and one or more NES. In some embodiments, direct repeats can be identified in in silico by searching for repetitive motifs that meet any or all of the following criteria: 1. Found in a 2 Kb window of genomic sequences flanking the type IICRISPR locus; ranges from 2.20 to 50 bp; and intervals from 3.20 to 50 bp. In some embodiments, two of these criteria, such as 1 and 2, 2 and 3, or 1 and 3, may be used. In some embodiments, all three criteria may be used.

本発明の実施形態では、用語ガイド配列及びガイドRNA、すなわちCasを標的ゲノム遺伝子座にガイドし得るRNAは、WO2014/093622(PCT/US2013/074667)などの前述の引用文献のように交換可能に使用される。一般的に、ガイド配列は、標的配列にハイブリダイズして、標的配列へのCRISPR複合体の配列特異的結合を導くのに十分な、標的ポリヌクレオチド配列との相補性を有する、任意のポリヌクレオチド配列である。いくつかの実施形態において、ガイド配列とその対応する標的配列との間の相補性の程度は、好適な整列アルゴリズムを用いて最適なアラインメントがなされるとき、約または約50%、60%、75%、80%、85%、90%、95%、97.5%、99%以上である。最適なアラインメントは、配列のアラインメントに適した任意のアルゴリズムを使用して決定され得るが、その非限定的な例には、Smith-Watermanアルゴリズム、Needleman-Wunschアルゴリズム、Burrows-Wheeler変換に基づくアルゴリズム(例えば、Burrows Wheeler Aligner)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies;www.novocraft.comで入手可能)、ELAND(Illumina、San Diego、CA)、SOAP(soap.genomics.org.cnで入手可能)、及びMaq(maq.sourceforge.netで入手可能)が挙げられる。いくつかの実施形態では、ガイド配列は、約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75、またはそれ以上のヌクレオチド長である。いくつかの実施形態において、ガイド配列は、約75、50、45、40、35、30、25、20、15、12未満またはそれ未満のヌクレオチド長である。好ましくは、ガイド配列は、10 30ヌクレオチド長である。CRISPR複合体の標的配列への配列特異的結合を指示するガイド配列の能力は、任意の適切なアッセイにより評価され得る。例えば、試験されるガイド配列を含む、CRISPR複合体を形成するのに十分なCRISPR系の構成要素は、CRISPR配列の構成要素をコードするベクターによるトランスフェクションなどにより、続いて、本明細書に記載のSurveyorアッセイなどによる、標的配列内の優先的切断の評価などによって、対応する標的配列を有する宿主細胞に提供され得る。同様に、標的ポリヌクレオチド配列の切断は、標的配列、試験すべきガイド配列、試験のガイド配列と異なる対照ガイド配列を含むCRISPR複合体の構成要素を提供し、試験及び対照ガイド配列の反応間で標的配列での結合またはその切断速度を比較することによって、試験管内で評価できる。他のアッセイも可能であり、当業者には明らかであろう。 In embodiments of the invention, the term guide sequences and guide RNAs, ie RNAs capable of guiding Cas to the target genomic locus, are interchangeable as in the aforementioned references such as WO2014 / 093622 (PCT / US2013 / 074667). used. In general, the guide sequence is any polynucleotide that has complementarity with the target polynucleotide sequence, sufficient to hybridize to the target sequence and induce sequence-specific binding of the CRISPR complex to the target sequence. It is an array. In some embodiments, the degree of complementarity between the guide sequence and its corresponding target sequence is about or about 50%, 60%, 75 when optimal alignment is made using a suitable alignment algorithm. %, 80%, 85%, 90%, 95%, 97.5%, 99% or more. Optimal alignment can be determined using any algorithm suitable for sequence alignment, but non-limiting examples include algorithms based on the Smith-Waterman algorithm, Needleman-Wunsch algorithm, and Burrows-Wheeler transformation ( For example, Burrows Wheeler Algorithm), CrystalW, Crystal X, BLAT, Novoalign (Novocraft Technologies; available at www.novocraft.com), ELAND (Illumina, SanGe. (Available), and Maq (available at maq.sourceforge.net). In some embodiments, the guide sequences are approximately 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, It has a nucleotide length of 28, 29, 30, 35, 40, 45, 50, 75, or longer. In some embodiments, the guide sequence has a nucleotide length of less than about 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 or less. Preferably, the guide sequence is 1030 nucleotides in length. The ability of the guide sequence to direct sequence-specific binding of the CRISPR complex to the target sequence can be assessed by any suitable assay. For example, sufficient components of the CRISPR system to form the CRISPR complex, including the guide sequence to be tested, are subsequently described herein, such as by transfection with a vector encoding a component of the CRISPR sequence. Can be provided to host cells having the corresponding target sequence, such as by evaluation of preferential cleavage within the target sequence, such as by the Surveyoor assay. Similarly, cleavage of the target polynucleotide sequence provides components of the CRISPR complex containing the target sequence, the guide sequence to be tested, the control guide sequence different from the test guide sequence, and between the reactions of the test and control guide sequences. It can be evaluated in vitro by comparing the binding or cleavage rate at the target sequence. Other assays are possible and will be apparent to those of skill in the art.

CRISPR-Cas系のいくつかの実施形態では、ガイド配列とその対応する標的配列との間の相補性の程度は、約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、または100%またはそれ以上であってもよく;ガイドまたはRNAまたはsgRNAは、約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75、またはそれ以上のヌクレオチド長であってもよく;あるいは、ガイドまたはRNAまたはsgRNAは、長さが約75、50、45、40、35、30、25、20、15、12またはそれ未満のヌクレオチド長であってもよく;有利には、tracr RNAは、30または50ヌクレオチド長である。しかし、本発明のある態様は、オフターゲット相互作用を低減すること、例えば、低い相補性を有する標的配列と相互作用するガイドを低減することである。実際、この実施例では、本発明は、CRISPR-Cas系が80%を超えて約95%までの相補性、例えば83%~84%または88~89%または94~95%の相補性を有する、標的配列とオフターゲット配列との間を区別し得る変異(例えば、18ヌクレオチドを有する標的と、1、2または3つのミスマッチを有する18ヌクレオチドのオフターゲットを区別する)を含むことが示されている。したがって、本発明の状況では、ガイド配列とその対応する標的配列との間の相補性の程度は、94.5%または95%または95.5%または96%または96.5%または97%または97.5%または98%または98.5%または99%または99.5%または99.9%、または100%より大きい。オフターゲットは、配列とガイドとの間の100%または99.9%または99.5%または99%または99%または98.5%または98%または97.5%または97%または96.5%または96%または95.5%または95%または94.5%または94%または93%または92%または91%または90%または89%または88%または87%または86%または85%または84%または83%または82%または81%または80%未満の相補性であり、オフターゲットが配列とガイドとの間で100%または99.9%または99.5%または99%または99%または98.5%または98%または97.5%または97%または96.5%または96%または95.5%または95%または94.5%の相補性であることが有利である。 In some embodiments of the CRISPR-Cas system, the degree of complementarity between the guide sequence and its corresponding target sequence is approximately 50%, 60%, 75%, 80%, 85%, 90%, 95. %, 97.5%, 99%, or 100% or more; the guide or RNA or sgRNA is about 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, It may have a nucleotide length of 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75, or longer; or a guide or The RNA or sgRNA may have a nucleotide length of about 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 or less; advantageously, the tracr RNA is 30 or It is 50 nucleotides in length. However, one aspect of the invention is to reduce off-target interactions, eg, to reduce guides that interact with target sequences with low complementarity. In fact, in this example, the invention has a CRISPR-Cas system of more than 80% and up to about 95% complementarity, eg 83% -84% or 88-89% or 94-95% complementarity. , Is shown to contain mutations that can distinguish between a target sequence and an off-target sequence (eg, distinguishing a target having 18 nucleotides from an 18 nucleotide off-target having one, two or three mismatches). There is. Thus, in the context of the invention, the degree of complementarity between the guide sequence and its corresponding target sequence is 94.5% or 95% or 95.5% or 96% or 96.5% or 97% or Greater than 97.5% or 98% or 98.5% or 99% or 99.5% or 99.9%, or 100%. Off-targets are 100% or 99.9% or 99.5% or 99% or 99% or 98.5% or 98% or 97.5% or 97% or 96.5% between the sequence and the guide. Or 96% or 95.5% or 95% or 94.5% or 94% or 93% or 92% or 91% or 90% or 89% or 88% or 87% or 86% or 85% or 84% or Complementarity of 83% or 82% or 81% or less than 80% and the off-target is 100% or 99.9% or 99.5% or 99% or 99% or 98.5 between the sequence and the guide. % Or 98% or 97.5% or 97% or 96.5% or 96% or 95.5% or 95% or 94.5% complementarity is advantageous.

本発明による特に好ましい実施形態では、ガイドRNA(Casを標的遺伝子座にガイドし得る)は、(1)真核細胞のゲノム標的遺伝子座にハイブリダイズし得るガイド配列;(2)tracr配列;及び(3)tracr mate配列を含んでもよい。(1)から(3)のすべてが単一のRNA、すなわちsgRNA(5’から3’方向に配置)に存在してもよいし、またはtracr RNAがガイド及びtracr配列を含むRNAとは異なるRNAであってもよい。tracrは、tracr mate配列にハイブリダイズし、CRISPR/Cas複合体を標的配列に指示する。tracr RNAがガイド及びtracr配列を含むRNAとは異なるRNA上にある場合、各RNAの長さを最適化し、それぞれのネイティブの長さから短くし、細胞RNaseによる分解から保護するため、そうでなければ安定性を増大するためにそれぞれを独立して化学的に改変してもよい。 In a particularly preferred embodiment according to the invention, the guide RNA (which can guide Cas to the target locus) is (1) a guide sequence capable of hybridizing to the genomic target locus of eukaryotic cells; (2) tracr sequence; and (3) A tracr mate sequence may be included. All of (1) to (3) may be present in a single RNA, ie sgRNA (located in the 5'to 3'direction, or the tracr RNA is different from the RNA containing the guide and tracr sequences. May be. The tracr hybridizes to the tracr mate sequence and directs the CRISPR / Cas complex to the target sequence. If the tracr RNA is on a different RNA than the RNA containing the guide and tracr sequences, it should be done to optimize the length of each RNA, shorten it from its native length and protect it from degradation by cellular RNases. For example, each may be independently chemically modified to increase stability.

本明細書に記載の本発明による方法は、本明細書に考察されるベクターを細胞に送達することを含む、本明細書に考察される真核細胞(インビトロ、すなわち単離された真核細胞)に1つ以上の変異を指示することを包含し、細胞に本明細書に考察されるようなベクターを送達することを含む。変異(複数可)には、ガイド(複数可)RNA(複数可)またはsgRNA(複数可)を介した細胞(複数可)の各標的配列での1つ以上のヌクレオチドの導入、削除、または置換が含まれ得る。変異は、ガイド(複数可)RNA(複数可)またはsgRNA(複数可)を介した当該細胞(複数可)の各標的配列での1~75ヌクレオチドの導入、欠失、または置換を含み得る。変異には、ガイドRNA(複数可)またはsgRNA(複数可)を介した、当該細胞(複数可)の各標的配列における1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50または75ヌクレオチドの導入、削除、または置換が含まれ得る。変異には、ガイド(複数可)RNA(複数可)またはsgRNA(複数可)を介した、当該細胞(複数可)の各標的配列における5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、または75ヌクレオチドの導入、削除、または置換が含まれ得る。変異には、ガイド(複数可)RNA(複数可)またはsgRNA(複数可)を介して、当該細胞(複数可)の各標的配列の10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、または75ヌクレオチドの導入、削除、または置換が含まれる。変異には、ガイド(複数可)RNA(複数可)またはsgRNA(複数可)を介した当該細胞(複数可)の各々の標的配列での20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、または75ヌクレオチドの導入、削除、または置換が含まれ得る。変異には、ガイド(複数可)RNA(複数可)またはsgRNA(複数可)を介した当該細胞(複数可)の各標的配列での40、45、50、75、100、200、300、400または500ヌクレオチドの導入、欠失、または置換が含まれてもよい。 The methods according to the invention described herein include delivering the vectors discussed herein to the cells, the eukaryotic cells discussed herein (in vitro, i.e., isolated eukaryotic cells). ) Includes pointing to one or more mutations, including delivering to cells the vector as discussed herein. Mutations (s) can be introduced, deleted, or substituted with one or more nucleotides in each target sequence of the cell (s) via a guide RNA (s) or sgRNA (s). Can be included. Mutations can include the introduction, deletion, or substitution of 1-75 nucleotides in each target sequence of the cell (s) via a guide RNA (s) or sgRNA (s). Mutations include 1, 5, 10, 11, 12, 13, 14, 15, 16, 17 in each target sequence of the cell (s) via guide RNA (s) or sgRNA (s). , 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 or 75 nucleotides can be introduced, deleted, or substituted. Mutations include 5, 10, 11, 12, 13, 14, 15, 16 in each target sequence of the cell (s) via a guide RNA (s) or sgRNA (s). , 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, or 75 nucleotides introduced, deleted, or substituted. obtain. Mutations include 10, 11, 12, 13, 14, 15, 16, 17 of each target sequence of the cell (s) via a guide RNA (s) or sgRNA (s). , 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, or 75 nucleotides introduced, deleted, or substituted. Mutations include 20, 21, 22, 23, 24, 25, 26, in each target sequence of the cell (s) via a guide RNA (s) or sgRNA (s). Introduction, deletion, or substitution of 27, 28, 29, 30, 35, 40, 45, 50, or 75 nucleotides may be included. Mutations include 40, 45, 50, 75, 100, 200, 300, 400 at each target sequence of the cell (s) via a guide RNA (s) or sgRNA (s). Alternatively, the introduction, deletion, or substitution of 500 nucleotides may be included.

毒性及びオフターゲット効果の最小化のために、Cas mRNAの濃度を制御し、送達されるRNAをガイドすることが重要であり得る。Cas mRNA及びガイドRNAの最適濃度は、細胞または非ヒト真核生物動物モデルで異なる濃度を試験すること、及び潜在的なオフターゲットゲノム遺伝子座での改変の程度を分析するディープ配列を使用することによって決定し得る。あるいは、毒性とオフターゲット効果のレベルを最小限に抑えるために、CasニッカーゼmRNA(例えば、D10A変異を有するS.pyogenes Cas9)を目的の部位を標的とする一対のガイドRNAで送達し得る。毒性とオフターゲット効果を最小限に抑えるためのガイド配列及び戦略は、WO2014/093622(PCT/US2013/074667)の通りであるか;または、本明細書の変異を介してであってもよい。 It may be important to control the concentration of Cas mRNA and guide the RNA to be delivered in order to minimize toxicity and off-target effects. Optimal concentrations of Cas mRNA and guide RNA should be tested at different concentrations in cellular or non-human eukaryotic animal models and using deep sequences to analyze the extent of modification at potential off-target genomic loci. Can be determined by. Alternatively, Cas nickase mRNA (eg, S. pyogenes Cas9 with the D10A mutation) can be delivered with a pair of guide RNAs targeting the site of interest to minimize the level of toxicity and off-target effects. Guide sequences and strategies for minimizing toxicity and off-target effects are as per WO2014 / 093622 (PCT / US2013 / 074667); or may be via mutations herein.

典型的に、内因性CRISPR系の文脈において、CRISPR複合体(標的配列にハイブリダイズして1つ以上のCasタンパク質と複合体形成するガイド配列を含む)の形成は、標的配列内またはその近接(例えば、1、2、3、4、5、6、7、8、9、10、20、50またはそれ以上の塩基対離れている)の1つまたは両方の鎖の切断を生じる。理論に拘束されることは望まないが、野生型のtracr配列のすべてまたは一部分を含むか、またはそれからなってよい、tracr配列(例えば、野生型tracr配列の約20、26、32、45、48、54、63、67、85またはそれ以上のヌクレオチド)はまた、ガイド配列に作動可能に連結するtracr mate配列のすべてまたは一部分に対するtracr配列の少なくとも一部分に沿ったハイブリダイゼーションなどによって、CRISPR複合体の部分を形成してもよい。 Typically, in the context of an endogenous CRISPR system, the formation of a CRISPR complex, including a guide sequence that hybridizes to a target sequence and forms a complex with one or more Cas proteins, is within or in the vicinity of the target sequence. For example, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 or more base pairs apart) results in cleavage of one or both chains. Although not bound by theory, a tracr sequence (eg, about 20, 26, 32, 45, 48 of a wild-type tracr sequence) may include or consist of all or part of a wild-type tracr sequence. , 54, 63, 67, 85 or more nucleotides) of the CRISPR complex, such as by hybridization along at least a portion of the tracr sequence to all or part of the tracr mate sequence operably linked to the guide sequence. A portion may be formed.

ガイド改変
ある特定の実施形態では、本発明のガイドは、天然には存在しない核酸、及び/または天然には存在しないヌクレオチド、及び/またはヌクレオチドアナログ、及び/または化学的改変を含む。天然には存在しない核酸としては、例えば、天然に存在するヌクレオチド、及び天然には存在しないヌクレオチドの混合物が挙げられる。天然には存在しないヌクレオチド及び/またはヌクレオチドアナログは、リボース部分、リン酸部分、及び/または塩基部分が改変され得る。本発明のある1つの実施形態では、ガイド核酸は、リボヌクレオチド及び非リボヌクレオチドを含む。そのような実施形態の1つでは、ガイドは、1つ以上のリボヌクレオチド及び1つ以上のデオキシリボヌクレオチドを含む。本発明のある1つの実施形態では、ガイドは、1つ以上の天然には存在しないヌクレオチドまたはヌクレオチドアナログ、例えば、ホスホロチオエート結合を有するヌクレオチド、ボラノリン酸連結を有する、リボース環の2’と4’炭素との間にメチレン架橋を含むロックド核酸(LNA)ヌクレオチド、ペプチド核酸(PNA)、または架橋型核酸(BNA)を含む。改変ヌクレオチドの他の例としては、2’-O-メチルアナログ、2’-デオキシアナログ、2’-チオウリジンアナログ、N6-メチルアデノシンアナログ、または2’-フルオロアナログが挙げられる。改変塩基の追加の例としては、2’位置の化学部分の連結が挙げられ、これには限定されないが、ペプチド、核局在化配列(NLS)、ペプチド核酸(PNA)、ポリエチレングリコール(PEG)、トリエチレングリコール、またはテトラエチレングリコール(TEG)が挙げられる。改変塩基のさらなるの例としては、限定されないが、2-アミノプリン、5-ブロモ-ウリジン、シュードウリジン(Ψ)、N-メチルシュードウリジン(meΨ)、5-メトキシウリジン(5moU)、イノシン、7-メチルグアノシンが挙げられる。ガイドRNAの化学改変の例としては、限定するものではないが、2’-O-メチル(M)、2’-O-メチル3’ホスホロチオエート(MS)、ホスホロチオエート(PS)、S-拘束エチル(cEt)、2’-O-メチル3’チオPACE(MSP)、または2’-O-メチル-3’-ホスホノアセテート(MP)を1つ以上の末端ヌクレオチドに組み込むことが挙げられる。化学的に改変されたそのようなガイドは、オンターゲット特異性とオフターゲット特異性との対比結果は予測不可能であるものの、非改変ガイドと比較して安定性の向上、及び活性の増大を含み得る(2015年6月29日にオンラインで公開されたHendel,2015,Nat Biotechnol.33(9):985-9,doi:10.1038/nbt.3290;Ragdarm et al.,0215,PNAS,E7110-E7111;Allerson et al.,J.Med.Chem.2005,48:901-904;Bramsen et al.,Front.Genet.,2012,3:154;Deng et al.,PNAS,2015,112:11870-11875;Sharma et al.,MedChemComm.,2014,5:1454-1471;Hendel et al.,Nat.Biotechnol.(2015)33(9):985-989;Li et al.,Nature Biomedical Engineering,2017,1,0066 DOI:10.1038/s41551-017-0066;Ryan et al.,Nucleic Acids Res.(2018)46(2):792-803を参照されたい)。いくつかの実施形態では、ガイドRNAの5’末端及び/または3’末端は、様々な機能性部分によって改変され、こうした機能性部分としては、蛍光色素、ポリエチレングリコール、コレステロール、タンパク質、または検出タグが含まれる。(Kelly et al.,2016,J.Biotech.233:74-83を参照されたい)。ある特定の実施形態では、ガイドは、標的DNAに結合する領域にリボヌクレオチドを含み、Cas9、Cpf1、またはC2c1に結合する領域に1つ以上のデオキシリボヌクレオチド及び/またはヌクレオチドアナログを含む。本発明のある1つの実施形態では、デオキシリボヌクレオチド及び/またはヌクレオチドアナログは、操作されたガイド構造、例えば、限定されないが、5’及び/または3’末端、ステムループ領域及びシード領域などに組み込まれる。ある特定の実施形態では、こうした改変は、ステムループ領域の5’ハンドルには存在しない。ガイドのステムループ領域の5’ハンドルを化学的に改変するとガイドの機能が消失し得る(Li,et al.,Nature Biomedical Engineering,2017,1:0066を参照されたい)。ある特定の実施形態では、ガイドのヌクレオチドのうちの少なくとも1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、30個、35個、40個、45個、50個、または75個のヌクレオチドが化学的に改変される。いくつかの実施形態では、ガイドの3’末端または5’末端のいずれかに位置する3~5ヌクレオチドが化学的に改変される。いくつかの実施形態では、シード領域にごく軽微な改変(2’-F改変など)が導入される。いくつかの実施形態では、ガイドの3’末端に2’-F改変が導入される。ある特定の実施形態では、ガイドの5’末端及び/または3’末端に位置する3~5ヌクレオチドが、2’-O-メチル(M)、2’-O-メチル3’ホスホロチオエート(MS)、S-拘束エチル(cEt)、2’-O-メチル3’-チオPACE(MSP)または2’-O-メチル-3’-ホスホノアセテート(MP)で化学的に改変される。そのような改変によってゲノム編集効率が増進し得る(Hendel et al.,Nat.Biotechnol.(2015)33(9):985-989;Ryan et al.,Nucleic Acids Res.(2018)46(2):792-803を参照されたい)。ある特定の実施形態では、遺伝子破壊のレベルを増進させるために、ガイドのホスホジエステル結合のすべてがホスホロチオエート(PS)で置き換えられる。ある特定の実施形態では、ガイドの5’末端及び/または3’末端に位置する5ヌクレオチド超が、2’-O-Me、2’-F、またはS-拘束エチル(cEt)で化学的に改変される。化学的に改変されたそのようなガイドでは、媒介する遺伝子破壊のレベルが増進し得る(Ragdarm et al.,0215,PNAS,E7110-E7111を参照されたい)。本発明のある1つの実施形態では、ガイドは、その3’末端及び/または5’末端に化学的部分を含むように改変される。そのような部分には、限定されないが、アミン、アジド、アルキン、チオ、ジベンゾシクロオクチン(DBCO)、ローダミン、ペプチド、核局在化配列(NLS)、ペプチド核酸(PNA)、ポリエチレングリコール(PEG)、トリエチレングリコール、またはテトラエチレングリコール(TEG)が挙げられる。ある特定の実施形態では、化学部分は、リンカー(アルキル鎖など)によってガイドに結合される。ある特定の実施形態では、改変ガイドの化学的部分は、ガイドを別の分子(DNA、RNA、タンパク質、またはナノ粒子など)に付加するために使用され得る。化学的に改変されたそのようなガイドは、CRISPR系によって一般に編集された細胞の同定または富化に使用され得る(Lee et al., eLife,2017,6:e25312,DOI:10.7554を参照されたい)。いくつかの実施形態では、3ヌクレオチドは、3’及び5’末端の各々で、化学的に改変される。特定の実施形態では、この改変は、2’-O-メチルまたはホスホロチオエートアナログを含む。特定の実施形態では、テトラループの12ヌクレオチド及びステムループ領域の16ヌクレオチドが、2’-O-メチルアナログで置き換えられている。このような化学改変は、インビボでの編集及び安定性を改善する。(Finn et al.,Cell Reports(2018),22:2227-2235を参照されたい)。いくつかの実施形態では、ガイドの60または70を超えるヌクレオチドが化学的に改変されている。いくつかの実施形態では、この改変は、ヌクレオチドの2’-O-メチルまたは2’-フルオロヌクレオチドアナログによる置換、またはホスホジエステル結合のホスホロチオエート(PS)改変を含む。いくつかの実施形態では、化学改変は、CRISPR複合体が形成される場合のヌクレアーゼタンパク質の外側に延びるガイドヌクレオチドの2’-O-メチルもしくは2’-フルオロ改変、またはガイドの3’末端の20から30以上のヌクレオチドのPS改変を含む。特定の実施形態では、化学改変は、ガイドの5’末端に2’-O-メチルアナログ、またはシード及びテール領域に2’-フルオロアナログをさらに含む。そのような化学改変は、ヌクレアーゼ分解に対する安定性を改善し、ゲノム編集活性または効率を維持または強化するが、すべてのヌクレオチドの改変は、ガイドの機能を無効にし得る(Yin et al.,Nat.Biotech.(2018),35(12):1179-1187を参照されたい)。このような化学改変は、限られた数のヌクレアーゼ及びRNA 2’-OH相互作用の知識を含む、CRISPR複合体の構造の知識によって導かれる場合がある(Yin et al.,Nat.Biotech.(2018),35(12):1179-1187を参照されたい)。いくつかの実施形態では、1つ以上のガイドRNAヌクレオチドは、DNAヌクレオチドで置き換えられてもよい。いくつかの実施形態では、5’末端テール/シードガイド領域の最大2、4、6、8、10、または12個のRNAヌクレオチドがDNAヌクレオチドで置換される。特定の実施形態では、3’末端のガイドRNAヌクレオチドの大部分がDNAヌクレオチドで置換されている。特定の実施形態では、3’末端の16個のガイドRNAヌクレオチドが、DNAヌクレオチドで置換されている。特定の実施形態では、5’末端テール/シード領域の8個のガイドRNAヌクレオチド及び3’末端の16個のRNAヌクレオチドが、DNAヌクレオチドで置換されている。特定の実施形態では、CRISPR複合体が形成されるときにヌクレアーゼタンパク質の外側に延びるガイドRNAヌクレオチドは、DNAヌクレオチドで置換される。複数のRNAヌクレオチドをDNAヌクレオチドでこのように置換すると、オフターゲット活性は低下するが、変更されていないガイドと比較して同様のオンターゲット活性につながる;ただし、3’末端のすべてのRNAヌクレオチドを置換すると、ガイドの機能が失われる場合がある(Yin et al.,Nat.Chem.Biol.(2018)14,311-316を参照されたい)。このような改変は、限られた数のヌクレアーゼ及びRNA 2’-OH相互作用の知識を含む、CRISPR複合体の構造の知識によって導かれる場合がある(Yin et al.,Nat.Chem.Biol.(2018)14,311-316を参照されたい)。
Guide Modifications In certain embodiments, the guides of the invention include non-naturally occurring nucleic acids and / or non-naturally occurring nucleotides and / or nucleotide analogs, and / or chemical modifications. Examples of non-naturally occurring nucleic acids include naturally occurring nucleotides and mixtures of non-naturally occurring nucleotides. Non-naturally occurring nucleotides and / or nucleotide analogs can be modified with ribose moieties, phosphate moieties, and / or base moieties. In one embodiment of the invention, the guide nucleic acid comprises ribonucleotides and non-ribonucleotides. In one such embodiment, the guide comprises one or more ribonucleotides and one or more deoxyribonucleotides. In one embodiment of the invention, the guide is one or more non-naturally occurring nucleotides or nucleotide analogs, such as nucleotides with phosphorothioate linkages, 2'and 4'carbons of the ribose ring with boranophosphate linkage. Includes a locked nucleic acid (LNA) nucleotide, peptide nucleic acid (PNA), or bridged nucleic acid (BNA) containing a methylene bridge between and. Other examples of modified nucleotides include 2'-O-methyl analogs, 2'-deoxy analogs, 2'-thiouridine analogs, N6-methyladenosine analogs, or 2'-fluoro analogs. Examples of additional modified bases include, but are not limited to, ligation of the chemical moiety at the 2'position: peptide, nuclear localized sequence (NLS), peptide nucleic acid (PNA), polyethylene glycol (PEG). , Triethylene glycol, or tetraethylene glycol (TEG). Further examples of the modified base include, but are not limited to, 2-aminopurine, 5-bromo-uridine, pseudouridine (Ψ), N1-methylpseudouridine (me 1 Ψ ), 5-methoxyuridine (5moU),. Examples include inosine and 7-methylguanosine. Examples of chemical modifications of guide RNA are, but are not limited to, 2'-O-methyl (M), 2'-O-methyl 3'phospholothioate (MS), phosphorothioate (PS), S-restricted ethyl ( cEt), 2'-O-methyl 3'thioPACE (MSP), or 2'-O-methyl-3'-phosphonoacetate (MP) may be incorporated into one or more terminal nucleotides. Such chemically modified guides provide improved stability and increased activity compared to unmodified guides, although the results of on-target and off-target specificity are unpredictable. May include (Hendel, 2015, Nat Biotechnol. 33 (9): 985-9, doi: 10.1038 / nbt. 3290; Ragdarm et al., 0215, PNAS, published online June 29, 2015. E7111-E7111; Allerson et al., J. Med. Chem. 2005, 48: 901-904; Bramsen et al., Front. Genet., 2012, 3: 154; Deng et al., PNAS, 2015, 112: 11870-11875; Sharma et al., MedChemComm., 2014,5:1454-1471; Hender et al., Nat. Biotechnol. (2015) 33 (9): 985-989; Li et al., Nature Biomedical Engine 2017, 1,0066 DOI: 10.1038 / s41551-017-0066; Ryan et al., Nuclear Acids Res. (2018) 46 (2): 792-803). In some embodiments, the 5'and / or 3'ends of the guide RNA are modified by various functional moieties such as fluorescent dyes, polyethylene glycols, cholesterol, proteins, or detection tags. Is included. (See Kelly et al., 2016, J. Biotech. 233: 74-83). In certain embodiments, the guide comprises a ribonucleotide in the region that binds to the target DNA and one or more deoxyribonucleotides and / or nucleotide analogs in the region that binds to Cas9, Cpf1, or C2c1. In one embodiment of the invention, deoxyribonucleotides and / or nucleotide analogs are incorporated into engineered guide structures such as, but not limited to, 5'and / or 3'ends, stem-loop regions and seed regions. .. In certain embodiments, such modifications are not present on the 5'handle of the stem-loop region. Chemical modification of the 5'handle in the stem-loop region of the guide can result in loss of guide function (see Li, et al., Nature Biomedical Enginering, 2017, 1: 0066). In certain embodiments, at least one, two, three, four, five, six, seven, eight, nine, ten, eleven, twelve, of the guide nucleotides, 13, 14, 15, 16, 17, 17, 18, 19, 20, 21, 21, 22, 23, 24, 25, 26, 27, 28, 29 , 30, 35, 40, 45, 50, or 75 nucleotides are chemically modified. In some embodiments, the 3-5 nucleotides located at either the 3'end or the 5'end of the guide are chemically modified. In some embodiments, minor modifications (such as 2'-F modifications) are introduced into the seed region. In some embodiments, a 2'-F modification is introduced at the 3'end of the guide. In certain embodiments, the 3-5 nucleotides located at the 5'and / or 3'ends of the guide are 2'-O-methyl (M), 2'-O-methyl 3'phosphorothioate (MS), It is chemically modified with S-restraint ethyl (cEt), 2'-O-methyl 3'-thioPACE (MSP) or 2'-O-methyl-3'-phosphonoacetate (MP). Such modifications can improve the efficiency of genome editing (Handel et al., Nat. Biotechnol. (2015) 33 (9): 985-989; Ryan et al., Nucleic Acids Res. (2018) 46 (2)). : See 792-803). In certain embodiments, all of the guide's phosphodiester bonds are replaced with phosphorothioates (PS) to increase the level of gene disruption. In certain embodiments, more than 5 nucleotides located at the 5'and / or 3'ends of the guide are chemically 2'-O-Me, 2'-F, or S-constrained ethyl (cEt). It will be modified. Such chemically modified guides may increase the level of mediated gene disruption (see Ragdalm et al., 0215, PNAS, E7110-E7111). In one embodiment of the invention, the guide is modified to include a chemical moiety at its 3'end and / or 5'end. Such moieties are, but are not limited to, amines, azides, alkynes, thios, dibenzocyclooctins (DBCO), rhodamines, peptides, nuclear localized sequences (NLS), peptide nucleic acids (PNA), polyethylene glycol (PEG). , Triethylene glycol, or tetraethylene glycol (TEG). In certain embodiments, the chemical moiety is attached to the guide by a linker (such as an alkyl chain). In certain embodiments, the chemical portion of the modification guide can be used to attach the guide to another molecule, such as DNA, RNA, protein, or nanoparticles. Such chemically modified guides can be used for cell identification or enrichment commonly edited by the CRISPR system (see Lee et al., ELife, 2017, 6: e25312, DOI: 10.7545). I want to be). In some embodiments, the 3 nucleotides are chemically modified at each of the 3'and 5'ends. In certain embodiments, this modification comprises a 2'-O-methyl or phosphorothioate analog. In certain embodiments, 12 nucleotides in the tetraloop and 16 nucleotides in the stem-loop region are replaced with 2'-O-methyl analogs. Such chemical modifications improve in vivo editing and stability. (See Finn et al., Cell Reports (2018), 22: 2227-2235). In some embodiments, more than 60 or 70 nucleotides in the guide are chemically modified. In some embodiments, the modification comprises substitution of the nucleotide with a 2'-O-methyl or 2'-fluoronucleotide analog, or a phosphodiester bond phosphorothioate (PS) modification. In some embodiments, the chemical modification is a 2'-O-methyl or 2'-fluoro modification of the guide nucleotide extending outside the nuclease protein when the CRISPR complex is formed, or a 20 at the 3'end of the guide. Contains PS modifications of more than 30 nucleotides. In certain embodiments, the chemical modification further comprises a 2'-O-methyl analog at the 5'end of the guide, or a 2'-fluoro analog at the seed and tail regions. Such chemical modifications improve stability to nuclease degradation and maintain or enhance genome editing activity or efficiency, but modifications of all nucleotides can negate the function of the guide (Yin et al., Nat. Biotech. (2018), 35 (12): 1179-1187). Such chemical modifications may be guided by knowledge of the structure of the CRISPR complex, including knowledge of a limited number of nucleases and RNA 2'-OH interactions (Yin et al., Nat. Biotech. ( 2018), 35 (12): 1179-1187). In some embodiments, one or more guide RNA nucleotides may be replaced with DNA nucleotides. In some embodiments, up to 2, 4, 6, 8, 10, or 12 RNA nucleotides in the 5'end tail / seed guide region are replaced with DNA nucleotides. In certain embodiments, the majority of guide RNA nucleotides at the 3'end are replaced with DNA nucleotides. In certain embodiments, the 16 guide RNA nucleotides at the 3'end are replaced with DNA nucleotides. In certain embodiments, 8 guide RNA nucleotides in the 5'end tail / seed region and 16 RNA nucleotides at the 3'end are replaced with DNA nucleotides. In certain embodiments, the guide RNA nucleotides that extend outside the nuclease protein when the CRISPR complex is formed are replaced with DNA nucleotides. This replacement of multiple RNA nucleotides with DNA nucleotides reduces off-target activity but leads to similar on-target activity compared to the unaltered guide; however, all RNA nucleotides at the 3'end If replaced, the function of the guide may be lost (see Yin et al., Nat. Chem. Biol. (2018) 14, 311-316). Such modifications may be guided by knowledge of the structure of the CRISPR complex, including knowledge of a limited number of nucleases and RNA 2'-OH interactions (Yin et al., Nat. Chem. Biol. (2018) 14, 311-316).

本発明の一態様では、ガイドは、改変Cpf1の改変crRNAを含み、これは5’ハンドルと、シード領域及び3’末端をさらに含むガイドセグメントと、を有する。いくつかの実施形態では、Acidaminococcus sp.BV3L6 Cpf1(AsCpf1);Francisella tularensis subsp.Novicida U112 Cpf1(FnCpf1);L.bacterium MC2017 Cpf1(Lb3Cpf1);Butyrivibrio proteoclasticus Cpf1(BpCpf1);Parcubacteria bacterium GWC2011_GWC2_44_17 Cpf1(PbCpf1);Peregrinibacteria bacterium GW2011_GWA_33_10 Cpf1(PeCpf1);Leptospira inadai Cpf1(LiCpf1);Smithella sp.SC_K08D17 Cpf1(SsCpf1);L.bacterium MA2020 Cpf1(Lb2Cpf1);Porphyromonas crevioricanis Cpf1(PcCpf1);Porphyromonas macacae Cpf1(PmCpf1);Candidatus Methanoplasma termitum Cpf1(CMtCpf1);Eubacterium eligens Cpf1(EeCpf1);Moraxella bovoculi 237 Cpf1(MbCpf1);Prevotella disiens Cpf1(PdCpf1);またはL.bacterium ND2006 Cpf1(LbCpf1)のうちいずれか1つのCpf1とともに改変ガイドを使用してもよい。 In one aspect of the invention, the guide comprises a modified crRNA of modified Cpf1, which has a 5'handle and a guide segment further comprising a seed region and a 3'end. In some embodiments, Acidaminococcus sp. BV3L6 Cpf1 (AsCpf1); Francisella tularensis subsp. Novicida U112 Cpf1 (FnCpf1); bacterium MC2017 Cpf1 (Lb3Cpf1); Butyrivibrio proteoclasticus Cpf1 (BpCpf1); Parcubacteria bacterium GWC2011_GWC2_44_17 Cpf1 (PbCpf1); Peregrinibacteria bacterium GW2011_GWA_33_10 Cpf1 (PeCpf1); Leptospira inadai Cpf1 (LiCpf1); Smithella sp. SC_K08D17 Cpf1 (SsCpf1); L. bacterium MA2020 Cpf1 (Lb2Cpf1); Porphyromonas crevioricanis Cpf1 (PcCpf1); Porphyromonas macacae Cpf1 (PmCpf1); Candidatus Methanoplasma termitum Cpf1 (CMtCpf1); Eubacterium eligens Cpf1 (EeCpf1); Moraxella bovoculi 237 Cpf1 (MbCpf1); Prevotella disiens Cpf1 (PdCpf1) ; Or L. A modification guide may be used with Cpf1 of any one of bacteria ND2006 Cpf1 (LbCpf1).

いくつかの実施形態では、ガイドに対する改変は、化学改変、挿入、欠失、または分割である。いくつかの実施形態では、化学改変には、限定されないが、2’-O-メチル(M)アナログ、2’-デオキシアナログ、2-チオウリジンアナログ、N6-メチルアデノシンアナログ、2’-フルオロアナログ、2-アミノプリン、5-ブロモ-ウリジン、シュードウリジン(Ψ)、N-メチルシュードウリジン(meΨ)、5-メトキシウリジン(5moU)、イノシン、7-メチルグアノシン、2’-O-メチル-3’-ホスホロチオエート(MS)、S-拘束エチル(cEt)、ホスホロチオエート(PS)、2’-O-メチル-3’-チオPACE(MSP)、または2’-O-メチル-3’-ホスホノアセテート(MP)を組み込むことが含まれる。いくつかの実施形態では、ガイドは、ホスホロチオエート改変のうちの1つ以上を含む。ある特定の実施形態では、ガイドのヌクレオチドのうちの少なくとも1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、または25個が化学的に改変される。いくつかの実施形態では、すべてのヌクレオチドが化学改変される。ある特定の実施形態では、シード領域における1つ以上のヌクレオチドが化学的に改変される。ある特定の実施形態では、3’末端における1つ以上のヌクレオチドが化学的に改変される。ある特定の実施形態では、5’ハンドルにおけるヌクレオチドはいずれも、化学的に改変されない。いくつかの実施形態では、シード領域における化学改変は、軽微な改変(2’-フルオロアナログの組み込みなど)である。特定の実施形態では、シード領域のヌクレオチドの1ヌクレオチドが、2’-フルオロアナログで置き換えられる。いくつかの実施形態では、3’末端における5または10個のヌクレオチドが化学的に改変される。Cpf1 CrRNAの3’末端をそのように化学的に改変することで、遺伝子切断効率が改善する(Li,et al.,Nature Biomedical Engineering,2017,1:0066を参照されたい)。特定の実施形態では、3’末端における5ヌクレオチドが、2’-フルオロアナログで置き換えられる。特定の実施形態では、3’末端における10のヌクレオチドが、2’-フルオロアナログで置き換えられる。特定の実施形態では、3’末端における5ヌクレオチドが、2’-O-メチル(M)アナログで置き換えられる。いくつかの実施形態では、3ヌクレオチドは、3’及び5’末端の各々で、化学的に改変される。特定の実施形態では、この改変は、2’-O-メチルまたはホスホロチオエートアナログを含む。特定の実施形態では、テトラループの12ヌクレオチド及びステムループ領域の16ヌクレオチドが、2’-O-メチルアナログで置き換えられている。このような化学改変は、インビボでの編集及び安定性を改善する(Finn et al.,Cell Reports(2018),22:2227-2235を参照されたい)。 In some embodiments, the modification to the guide is a chemical modification, insertion, deletion, or division. In some embodiments, the chemical modification is not limited to, but is limited to, 2'-O-methyl (M) analog, 2'-deoxy analog, 2-thiouridine analog, N6-methyladenosin analog, 2'-fluoro analog. , 2-aminopurine, 5-bromo-pseudouridine, pseudouridine (Ψ), N1 -methylpseudouridine (me 1 Ψ ), 5-methoxyuridine (5moU), inosin, 7-methylguanosine, 2'-O- Methyl-3'-phospholothioate (MS), S-restraint ethyl (cEt), phosphorothioate (PS), 2'-O-methyl-3'-thioPACE (MSP), or 2'-O-methyl-3'- Incorporating phosphonoacetate (MP) is included. In some embodiments, the guide comprises one or more of the phosphorothioate modifications. In certain embodiments, at least one, two, three, four, five, six, seven, eight, nine, ten, eleven, twelve, of the guide nucleotides, 13, 14, 15, 16, 17, 17, 18, 19, 20, or 25 are chemically modified. In some embodiments, all nucleotides are chemically modified. In certain embodiments, one or more nucleotides in the seed region are chemically modified. In certain embodiments, one or more nucleotides at the 3'end are chemically modified. In certain embodiments, none of the nucleotides in the 5'handle is chemically modified. In some embodiments, the chemical modification in the seed region is a minor modification (such as incorporation of a 2'-fluoro analog). In certain embodiments, one nucleotide of the nucleotide in the seed region is replaced with a 2'-fluoro analog. In some embodiments, 5 or 10 nucleotides at the 3'end are chemically modified. Such chemical modification of the 3'end of Cpf1 CrRNA improves gene cleavage efficiency (see Li, et al., Nature Biomedical Engineering, 2017, 1: 0066). In certain embodiments, the 5 nucleotides at the 3'end are replaced with 2'-fluoro analogs. In certain embodiments, the 10 nucleotides at the 3'end are replaced with 2'-fluoro analogs. In certain embodiments, the 5 nucleotides at the 3'end are replaced with 2'-O-methyl (M) analogs. In some embodiments, the 3 nucleotides are chemically modified at each of the 3'and 5'ends. In certain embodiments, this modification comprises a 2'-O-methyl or phosphorothioate analog. In certain embodiments, 12 nucleotides in the tetraloop and 16 nucleotides in the stem-loop region are replaced with 2'-O-methyl analogs. Such chemical modifications improve in vivo editing and stability (see Finn et al., Cell Reports (2018), 22: 2227-2235).

いくつかの実施形態では、ガイドの5’ハンドルのループが改変される。いくつかの実施形態では、欠失、挿入、分割、または化学改変を有するように、ガイドの5’ハンドルのループが改変される。ある特定の実施形態では、ループは、ヌクレオチドを3つ、4つ、または5つ含む。ある特定の実施形態では、ループは、UCUU、UUUU、UAUU、またはUGUUという配列を含む。いくつかの実施形態では、このガイド分子は、DNAであってもRNAであってもよい、非共有結合で連結された別の配列とステムループを形成する。 In some embodiments, the loop of the guide's 5'handle is modified. In some embodiments, the loop of the guide's 5'handle is modified to have a deletion, insertion, splitting, or chemical modification. In certain embodiments, the loop comprises three, four, or five nucleotides. In certain embodiments, the loop comprises the sequence UCUU, UUUU, UAUU, or UGUU. In some embodiments, the guide molecule forms a stem-loop with another non-covalently linked sequence, which may be DNA or RNA.

合成的に連結されたガイド
一態様では、ガイドは、非ホスホジエステル結合を介して化学的に連結または結合されるtracr配列及びtracr mate配列を含む。一態様では、このガイドは、非ヌクレオチドループを介して化学的に連結または結合されたtracr配列及びtracr mate配列を含む。いくつかの実施形態では、tracr及びtracr mate配列は、非ホスホジエステル共有リンカーを介して結合される。共有結合リンカーの例としては、限定するものではないが、カルバメート、エーテル、エステル、アミド、イミン、アミジン、アミノトリジン、ヒドロゾン、ジスルフィド、チオエーテル、チオエステル、ホスホロチオエート、ホスホロジチオエート、スルホンアミド、スルホネート、フルフォン、スルホキシド、尿素、チオ尿素、ヒドラジド、オキシム、トリアゾール、光不安定性結合、C-C結合形成基、例えば、ディールス・アルダー環付加ペアまたは閉環メタセシスペア、及びマイケル反応ペアからなる群より選択される化学基が挙げられる。
Syntheticly Linked Guides In one aspect, guides include tracr and tracr mate sequences that are chemically linked or linked via non-phosphodiester bonds. In one aspect, the guide comprises tracr and tracr mate sequences chemically linked or linked via non-nucleotide loops. In some embodiments, the tracr and tracr mate sequences are linked via a non-phosphodiester covalent linker. Examples of covalent linkers include, but are not limited to, carbamate, ether, ester, amide, imine, amidin, aminotridin, hydrozone, disulfide, thioether, thioester, phosphorothioate, phosphorodithioate, sulfonamide, sulfonate, Selected from the group consisting of fluphons, sulfoxides, ureas, thioureas, hydrazides, oximes, triazoles, photolabile bonds, CC bond-forming groups such as Deals-Alder ring-added or closed metacesipare, and Michael reaction pairs. Chemical groups are mentioned.

いくつかの実施形態では、tracr配列及びtracr mate配列は、標準的なホスホロアミダイト合成プロトコールを使用して最初に合成される(Herdewijn,P.,ed.,Methods in Molecular Biology Col 288,Oligonucleotide Synthesis:Methods and Applications,Humana Press,New Jersey(2012))。いくつかの実施形態では、tracr配列及びtracr mate配列を、当該技術分野において公知の標準的なプロトコールを使用して、ライゲーションに適した官能基を含むように機能化してもよい(Hermanson,G.T.,Bioconjugate Techniques,Academic Press(2013))。官能基の例としては、限定するものではないが、ヒドロキシル、アミン、カルボン酸、カルボン酸ハロゲン化物、カルボン酸活性エステル、アルデヒド、カルボニル、クロロカルボニル、イミダゾリルカルボニル、ヒドラジド、セミカルバジド、チオセミカルバジド、チオール、マレイミド、ハロアルキル、スルホニル、アリル、プロパルギル、ジエン、アルキン、及びアジドが挙げられる。一旦、このtracr配列及びtracr mate配列が機能化されると、この2つのオリゴヌクレオチドの間に共有結合または連結が形成され得る。化学結合の例としては、限定するものではないが、カルバメート、エーテル、エステル、アミド、イミン、アミジン、アミノトリアジン、ヒドロゾン(hydrozone)、ジスルフィド、チオエーテル、チオエステル、ホスホロチオエート、ホスホロジチオエート、スルホンアミド、スルホネート、フルフォン(fulfone)、スルホキシド、尿素、チオウレア、ヒドラジド、オキシム、トリアゾール、感光性結合、C-C結合形成基(ディールス・アルダー付加環化のペアまたは閉環メタセシスのペア、及びマイケル反応のペアなど)に基づくものが挙げられる。 In some embodiments, the tracr and tracr mate sequences are first synthesized using a standard phosphoramidite synthesis protocol (Herdewijn, P., ed., Methods in Molecular Biology Col 288, Orangelusetides S). : Methods and Applications, Humana Press, New Jersey (2012)). In some embodiments, the tracr and tracr mate sequences may be functionalized to include functional groups suitable for ligation using standard protocols known in the art (Hermanson, G. et al. T., Bioconjugate Technologies, Academic Press (2013)). Examples of functional groups include, but are not limited to, hydroxyls, amines, carboxylic acids, carboxylic acid halides, carboxylic acid active esters, aldehydes, carbonyls, chlorocarbonyls, imidazolylcarbonyls, hydrazides, semicarbazides, thiosemicarbazides, thiols, Examples include maleimide, haloalkyl, sulfonyl, allyl, propargyl, diene, alkyne, and azide. Once the tracr and tracr mate sequences are functionalized, covalent bonds or linkages can be formed between the two oligonucleotides. Examples of chemical bonds include, but are not limited to, carbamate, ether, ester, amide, imine, amidine, aminotriazine, hydrozone, disulfide, thioether, thioester, phosphorothioate, phosphorodithioate, sulfonamide, Sulfonates, fulfones, sulfoxides, ureas, thioureas, hydrazides, oximes, triazoles, photosensitive bonds, CC bond-forming groups (Deals alder-added cyclization pairs or closed-ring metasessis pairs, and Michael reaction pairs, etc.) ) Is mentioned.

いくつかの実施形態では、tracr配列及びtracr mate配列を、化学的に合成し得る。いくつかの実施形態では、この化学合成では、2’-アセトキシエチルオルトエステル(2’-ACE)化学(Scaringe et al.,J.Am.Chem.Soc.(1998)120:11820-11821;Scaringe,Methods Enzymol.(2000)317:3-18)、または2’-チオノカルバメート(2’-TC)化学(Dellinger et al.,J.Am.Chem.Soc.(2011)133:11540-11546;Hendel et al.,Nat.Biotechnol.(2015)33:985-989)を用いる自動化固相オリゴヌクレオチド合成機が使用される。 In some embodiments, the tracr and tracr mate sequences can be chemically synthesized. In some embodiments, in this chemical synthesis, 2'-acetoxyethyl orthoester (2'-ACE) chemistry et al., J. Am. Chem. Soc. (1998) 120: 11820-11821; Scaringe , Methods Enzymol. (2000) 317: 3-18), or 2'-thionocarbamate (2'-TC) chemistry (Dellinger et al., J. Am. Chem. Soc. (2011) 133: 11540-11546. An automated solid phase oligonucleotide synthesizer using Hender et al., Nat. Biotechnol. (2015) 33: 985-989) is used.

いくつかの実施形態では、tracr配列及びtracr mate配列を、糖、ヌクレオチド間ホスホジエステル結合、プリン及びピリミジン残基の改変を介して、様々なバイオコンジュゲート反応、ループ、架橋、及び非ヌクレオチド連結を使用して共有結合してもよい。Sletten et al.,Angew.Chem.Int.Ed.(2009)48:6974-6998;Manoharan,M.Curr.Opin.Chem.Biol.(2004)8:570-9;Behlke et al.,Oligonucleotides(2008)18:305-19;Watts,et al.,Drug.Discov.Today(2008)13:842-55;Shukla,et al.,ChemMedChem(2010)5:328-49。 In some embodiments, tracr and tracr mate sequences undergo various bioconjugate reactions, loops, crosslinks, and non-nucleotide linkages via sugar, internucleotide phosphodiester bonds, and modification of purine and pyrimidine residues. May be covalently combined using. Setten et al. , Angew. Chem. Int. Ed. (2009) 48: 6974-6998; Manoharan, M. et al. Curr. Opin. Chem. Biol. (2004) 8: 570-9; Behlke et al. , Oligonucleotides (2008) 18: 305-19; Watts, et al. , Drug. Discov. Today (2008) 13: 842-55; Shukla, et al. , ChemMedChem (2010) 5: 328-49.

いくつかの実施形態では、tracr配列及びtracr mate配列を、クリックケミストリーを使用して共有結合してもよい。いくつかの実施形態では、tracr及びtracr mate配列は、トリアゾールリンカーを使用して共有結合され得る。いくつかの実施形態では、tracr及びtracr mate配列を、アルキン及びアジドを含むHuisgen1,3-双極子環状付加反応を使用して共有結合して、非常に安定なトリアゾールリンカーを生成してもよい(He et al.,ChemBioChem(2015)17:1809-1812;WO2016/186745)。いくつかの実施形態では、tracr及びtracr mate配列は、5’-ヘキシンtracrRNA及び3’-アジドcrRNAを連結することにより共有結合される。いくつかの実施形態では、5’-ヘキシンtracrRNA及び3’-アジドcrRNAのいずれかまたは両方を2’-アセトキシエチルオルトエステル(2’-ACE)基で保護してもよく、これを、その後Dharmaconプロトコールを使用して除去してもよい(Scaringe et al.,J.Am.Chem.Soc.(1998)120:11820-11821;Scaringe,Methods Enzymol.(2000)317:3-18)。 In some embodiments, the tracr and tracr mate sequences may be covalently coupled using click chemistry. In some embodiments, the tracr and tracr mate sequences can be covalently linked using a triazole linker. In some embodiments, tracr and tracr mate sequences may be covalently linked using a Huisgen 1,3-dipole cycloaddition reaction containing an alkyne and azide to produce a highly stable triazole linker (). He et al., ChemBioChem (2015) 17: 1809-1812; WO2016 / 186745). In some embodiments, the tracr and tracr mate sequences are covalently linked by ligating 5'-hexyne tracrRNA and 3'-azidocrRNA. In some embodiments, either or both of the 5'-hexyne tracrRNA and the 3'-azido crRNA may be protected with a 2'-acetoxyethyl ortho ester (2'-ACE) group, which may then be protected by Dharmacon. It may be removed using a protocol (Scaringe et al., J. Am. Chem. Soc. (1998) 120: 11820-11821; Scaringe, Methods Enzymol. (2000) 317: 3-18).

いくつかの実施形態では、tracr及びtracr mate配列は、スペーサー、付着物、バイオコンジュゲート、発色団、レポーター基、色素標識RNA及び天然には存在しないヌクレオチドアナログなどの部分を含むリンカー(例えば、非ヌクレオチドループ)を介して共有結合され得る。より具体的には、本発明の目的に適したスペーサーとしては、限定するものではないが、ポリエーテル(例えば、ポリエチレングリコール、ポリアルコール、ポリプロピレングリコールまたはエチレングリコールとプロピレングリコールの混合物)、ポリアミン基(例えば、スペニン、スペルミジン及びそのポリマー誘導体)、ポリエステル(例えば、ポリ(エチルアクリレート))、ポリホスホジエステル、アルキレン、及びそれらの組み合わせが挙げられる。適切な結合としては、リンカーに対して、限定するものではないが、蛍光標識などの追加の特性をリンカーに追加し得る任意の部分が含まれる。適切なバイオコンジュゲートとしては、限定するものではないが、ペプチド、グリコシド、脂質、コレステロール、リン脂質、ジアシルグリセロール及びジアルキルグリセロール、脂肪酸、炭化水素、酵素基質、ステロイド、ビオチン、ジゴキシゲニン、炭水化物、多糖類が挙げられる。適切な発色団、レポーター基、及び色素標識RNAとしては、限定するものではないが、フルオレセイン及びローダミンなどの蛍光色素、化学発光、電気化学発光、ならびに生物発光マーカー化合物が挙げられる。2つのRNA成分を結合する例示的なリンカーの設計は、WO2004/015075にも記載されている。 In some embodiments, the tracr and tracr mate sequences include moieties such as spacers, deposits, bioconjugates, chromophores, reporter groups, dye-labeled RNAs and non-naturally occurring nucleotide analogs (eg, non-next). Can be covalently linked via a nucleotide loop). More specifically, the spacer suitable for the object of the present invention is, but is not limited to, a polyether (for example, polyethylene glycol, polyalcohol, polypropylene glycol or a mixture of ethylene glycol and propylene glycol), a polyamine group (for example). For example, spenin, spermidin and its polymer derivatives), polyesters (eg, poly (ethyl acrylate)), polyphosphodiesters, alkylenes, and combinations thereof. Suitable bindings include, but are not limited to, any moiety that may add additional properties to the linker, such as fluorescent labels. Suitable bioconjugates include, but are not limited to, peptides, glycosides, lipids, cholesterol, phospholipids, diacylglycerols and dialkylglycerols, fatty acids, hydrocarbons, enzyme substrates, steroids, biotin, digoxigenin, carbohydrates, polysaccharides. Can be mentioned. Suitable chromophores, reporter groups, and dye-labeled RNAs include, but are not limited to, fluorescent dyes such as fluorescein and rhodamine, chemiluminescent, electrochemiluminescent, and bioluminescent marker compounds. The design of an exemplary linker that binds two RNA components is also described in WO2004 / 015075.

リンカー(例えば、非ヌクレオチドループ)は、任意の長さであり得る。いくつかの実施形態では、リンカーは約0~16ヌクレオチドに等しい長さを有する。いくつかの実施形態では、リンカーは、約0~8ヌクレオチドに等しい長さを有する。いくつかの実施形態では、リンカーは約0~4ヌクレオチドに等しい長さを有する。いくつかの実施形態では、リンカーは約2ヌクレオチドに相当する長さを有する。リンカー設計の例は、WO2011/008730にも記載されている。 The linker (eg, non-nucleotide loop) can be of any length. In some embodiments, the linker has a length equal to about 0-16 nucleotides. In some embodiments, the linker has a length equal to about 0-8 nucleotides. In some embodiments, the linker has a length equal to about 0-4 nucleotides. In some embodiments, the linker has a length corresponding to about 2 nucleotides. An example of a linker design is also described in WO2011 / 008730.

典型的なタイプII Cas9 sgRNAは、(5’から3’方向に)以下を含む:ガイド配列、ポリU領域(tract)、第1の相補的ストレッチ(「繰り返し」)、ループ(テトラループ)、第2の相補的ストレッチ(「アンチリピート(anti-repeat)」はリピートを補完する)、ステム、さらにステムループ及びステム、ならびにポリA(RNAではポリUである場合が多い)テール(ターミネーター)。好ましい実施形態では、ガイド構造の特定の態様が保持され、ガイド構造の特定の態様が、例えば、特徴の追加、減算、または置換によって修正され得、一方、ガイド構造の特定の他の態様が維持される。挿入、削除、及び置換を含むがこれらに限定されない、設計されたsgRNA改変の好ましい場所としては、ガイド末端、及びCRISPRタンパク質及び/または標的、例えばテトラループ及び/またはループ2と複合したときに露出するsgRNAの領域が挙げられる。 A typical Type II Cas9 sgRNA contains (from 5'to 3'directions): guide sequence, poly U region (tract), first complementary stretch ("repetition"), loop (tetraloop), A second complementary stretch (“anti-repeat” complements the repeat), stem, as well as stem loops and stems, and poly A (often poly U in RNA) tail (terminator). In a preferred embodiment, certain aspects of the guide structure are retained, certain aspects of the guide structure can be modified, for example, by adding, subtracting, or replacing features, while certain other aspects of the guide structure are maintained. Will be done. Preferred locations for designed sgRNA modifications, including but not limited to insertions, deletions, and substitutions, are the guide ends and exposed when combined with CRISPR proteins and / or targets such as tetraloop and / or loop 2. The region of sgRNA to be used is mentioned.

特定の実施形態では、本発明のガイドは、アダプタータンパク質の特異的結合部位(例えばアプタマー)を含み、これは(例えば融合タンパク質を介して)1つ以上の機能的ドメインを含み得る。そのようなガイドがCRISPR複合体(すなわち、ガイド及び標的に結合するCRISPR酵素)を形成すると、アダプタータンパク質が結合し、アダプタータンパク質に関連付けられた機能ドメインが、空間的方向に配置され、属性機能が効果的になるために有利である。例えば、機能的ドメインが転写活性化因子(例えば、VP64またはp65)である場合、転写活性化因子は、標的の転写に影響を与えることを可能にする空間的な向きに配置される。同様に、転写抑制因子は、標的の転写に影響を及ぼすように有利に配置され、ヌクレアーゼ(例えば、Fok1)は、標的を切断または部分的に切断するように有利に配置される。 In certain embodiments, the guide of the invention comprises a specific binding site for an adapter protein (eg, an aptamer), which may include one or more functional domains (eg, via a fusion protein). When such a guide forms a CRISPR complex (ie, a CRISPR enzyme that binds to the guide and target), the adapter protein binds and the functional domain associated with the adapter protein is spatially oriented and attributed. It is advantageous to be effective. For example, if the functional domain is a transcriptional activator (eg, VP64 or p65), the transcriptional activator is spatially oriented to allow it to influence the transcription of the target. Similarly, transcriptional repressors are favorably placed to affect the transcription of the target, and nucleases (eg, Fok1) are favorably placed to cleave or partially cleave the target.

当業者は、アダプター+機能的ドメインの結合を可能にするが、アダプター+機能的ドメインの適切な配置は可能にしない(例えば、CRISPR複合体の三次元構造内の立体障害による)ガイドへの修正が、意図しない改変であることを理解するであろう。本明細書に記載のように、1つ以上の修正ガイドは、テトラループ、ステムループ1、ステムループ2、またはステムループ3で、好ましくはテトラループもしくはステムループ2のいずれかで、最も好ましくはテトラループとステムループ2の両方で改変され得る。 Those skilled in the art allow the binding of adapters + functional domains, but do not allow proper placement of adapters + functional domains (eg, due to steric hindrance within the three-dimensional structure of the CRISPR complex). However, you will understand that it is an unintended modification. As described herein, the one or more modification guides are tetraloop, stemloop 1, stemloop 2, or stemloop 3, preferably either tetraloop or stemloop 2, most preferably. It can be modified in both tetraloop and stemloop 2.

リピート:アンチリピート二重鎖は、sgRNAの二次構造から明らかであろう。これは、通常、ポリU領域(tract)の後(5’から3’方向)で、テトラループの前の最初の相補ストレッチであり;かつテトラループの後で、ポリA領域の前(5’から3’方向)の2番目の相補ストレッチであり得る。最初の相補ストレッチ(「リピート、繰り返し」)は、2番目の相補ストレッチに相補的である(「アンチリピート・反繰り返し」)。そのため、それらは、互いに折り畳まれた場合、ワトソン-クリック塩基対を形成して、dsRNAの二重鎖を形成する。そのようなものとして、アンチリピート(アンチリピート)配列は、A-UまたはC-G塩基対に関しては反復の相補配列であるが、アンチリピートは、テトラループに起因して逆方向にあるという事実に関しても同様である。 Repeat: The anti-repeat double chain will be apparent from the secondary structure of the sgRNA. This is usually the first complementary stretch after the poly U region (tract) (5'to 3'direction) and before the tetraloop; and after the tetraloop and before the poly A region (5'). Can be the second complementary stretch (from 3'direction). The first complementary stretch (“repeat, repeat”) is complementary to the second complementary stretch (“anti-repeat / anti-repetition”). As such, they form Watson-Crick base pairs when folded together to form double chains of dsRNA. As such, the fact that the anti-repeat sequence is a repeating complementary sequence for AU or CG base pairs, but the anti-repeat is in the opposite direction due to the tetraloop. The same applies to.

本発明の一実施形態では、ガイド構造の改変は、ステムループ2の塩基を置き換えることを含む。例えば、いくつかの実施形態では、「actt」(RNAでは「acuu」)及び「aagt」(RNAでは「aagu」)塩基は、ステムループ2において、「cgcc」及び「gcgg」に置き換えられる。いくつかの実施形態では、stemloop2の「actt」及び「aagt」塩基は、4ヌクレオチドの相補的なGCリッチ領域で置換される。いくつかの実施形態では、4ヌクレオチドの相補的なGCリッチ領域は「cgcc」及び「gcgg」(両方とも5’から3’の方向)である。いくつかの実施形態では、4ヌクレオチドの相補的なGCリッチ領域は、「gcgg」及び「cgcc」(両方とも5’から3’方向)である。4ヌクレオチドの相補的なGCリッチ領域でのCとGの他の組み合わせは、CCCCとGGGGを含めて明らかである。 In one embodiment of the invention, modification of the guide structure comprises replacing the base of stem-loop 2. For example, in some embodiments, the "actt" ("acuu" for RNA) and "agut" ("agu" for RNA) bases are replaced with "cgcc" and "gcgg" in stem-loop 2. In some embodiments, the "actt" and "agt" bases of stemloop2 are replaced with a complementary GC-rich region of 4 nucleotides. In some embodiments, the complementary GC-rich regions of 4 nucleotides are "cgcc" and "gcgg" (both in the 5'to 3'direction). In some embodiments, the complementary GC-rich regions of 4 nucleotides are "gcgg" and "cgcc" (both in the 5'to 3'direction). Other combinations of C and G in the complementary GC-rich region of 4 nucleotides are evident, including CCCC and GGGG.

一態様では、ステムループ2、例えば「ACTTgtttAAGT」は、「XXXXgtttYYYY」で置き換えられてもよく、例えば、XXXX及びYYYYは、互いに塩基対を形成してステムを作成する任意の相補的なヌクレオチドのセットを表す。 In one embodiment, the stem loop 2, eg, "ACTTgttAAGT", may be replaced by "XXXXXgtttYYYY", eg, XXXX and YYYY are any set of complementary nucleotides that base pair with each other to form a stem. Represents.

一態様では、ステムは、相補的なX及びY配列を含む少なくとも約4bpを含むが、より多くの、例えば5、6、7、8、9、10、11または12以下のステム、例えば3、2の塩基対も考えられる。したがって、例えば、X2-12及びY2-12(X及びYは、ヌクレオチドの任意の相補的なセットを表す)が考えられ得る。一態様では、X及びYヌクレオチドで作られたステムは、「gttt」とともに、二次構造全体で完全なヘアピンを形成する;そして、これは有利な場合があり、塩基対の量は、完全なヘアピンを形成する任意の量であってもよい。一態様では、sgRNA全体の二次構造が保存されている限り、任意の相補的X:Y塩基対形成配列(例えば長さに関して)が許容される。一態様では、ステムは、DR:tracr二重鎖及び3つのステムループを有するという点で、sgRNA全体の二次構造を破壊しないX:Y塩基対形成の形態であり得る。一態様では、ACTTとAAGT(またはX:Y塩基対で作られた任意の代替ステム)を接続する「gttt」テトラループは、sgRNAの二次構造全体を中断しない同じ長さ(4塩基対など)またはそれ以上の任意の配列であり得る。一態様では、ステムループは、ステムループ2をさらに長くする何かであってもよく、例えばMS2アプタマーであってもよい。一態様では、ステムループ3「GGCACCGagtCGGTGC」は、同様に「XXXXXXXagtYYYYYYY」形態をとってもよく、例えば、X7及びY7は、互いに塩基対を形成してステムを作成する、ヌクレオチドの任意の相補セットを表す。一態様では、ステムは、相補性X及びY配列を含む約7bpを含むが、より多いまたはより少ない塩基対のステムも企図される。一態様では、X及びYヌクレオチドでできたステムは、「agt」とともに、二次構造全体に完全なヘアピンを形成する。一態様では、sgRNA全体の二次構造が保存されている限り、任意の相補的なX:Y塩基対形成配列が許容される。一態様では、ステムは、DR:tracr二重鎖及び3つのステムループを有するという点で、sgRNA全体の二次構造を破壊しないX:Y塩基対形成の形態であってもよい。一態様では、ステムループ3の「agt」配列は、アプタマー、例えばMS2アプタマーまたはそうでない場合ステムループ3の構造を一般的に保存する配列によって延長されても、または置換されてもよい。代替のステムループ2及び/または3の1つの態様では、各X及びYのペアは任意の塩基対を指す場合がある。一態様では、非ワトソン・クリック塩基対合が企図され、そのような対合は、そうでなければ一般にその位置でステムループの構造を保存する。 In one embodiment, the stem comprises at least about 4 bp containing complementary X and Y sequences, but more, eg, 5, 6, 7, 8, 9, 10, 11 or 12 or less stems, eg 3, 3. Two base pairs are also possible. Thus, for example, X2-12 and Y2-12 (where X and Y represent any complementary set of nucleotides) can be considered. In one aspect, a stem made of X and Y nucleotides, together with "gttt", forms a complete hairpin throughout the secondary structure; and this can be advantageous and the amount of base pair is complete. It may be any amount that forms a hairpin. In one aspect, any complementary X: Y base pairing sequence (eg, with respect to length) is acceptable as long as the secondary structure of the entire sgRNA is preserved. In one aspect, the stem can be a form of X: Y base pairing that does not disrupt the secondary structure of the entire sgRNA in that it has a DR: tracr double chain and three stem loops. In one aspect, the "gttt" tetraloop connecting ACTT and AAGT (or any alternative stem made up of X: Y base pairs) has the same length (4 base pairs, etc.) without interrupting the entire secondary structure of the sgRNA. ) Or any higher sequence. In one aspect, the stem loop may be something that further lengthens the stem loop 2, eg, an MS2 aptamer. In one aspect, the stem loop 3 "GGCACCGagtCGGTGC" may also take the form "XXXXXXXXagtYYYYYYYY", eg, X7 and Y7 represent any complementary set of nucleotides that base pairs with each other to form a stem. In one aspect, the stem comprises about 7 bp containing complementary X and Y sequences, but stems with more or less base pairs are also contemplated. In one aspect, the stem made of X and Y nucleotides, together with the "agt", forms a complete hairpin throughout the secondary structure. In one aspect, any complementary X: Y base pairing sequence is acceptable as long as the secondary structure of the entire sgRNA is preserved. In one aspect, the stem may be in the form of X: Y base pairing that does not disrupt the secondary structure of the entire sgRNA in that it has a DR: tracr double chain and three stem loops. In one aspect, the "agt" sequence of stem-loop 3 may be extended or replaced by an aptamer, eg, an MS2 aptamer or otherwise a sequence that generally preserves the structure of stem-loop 3. In one embodiment of the alternative stem-loop 2 and / or 3, each X and Y pair may point to any base pair. In one aspect, non-Watson-Crick base pairing is contemplated, otherwise such pairing generally preserves the structure of the stemloop at that location.

一態様では、DR:tracrRNA二本鎖は、gYYYYag(N)NNNNxxxxNNNN(AAN)uuRRRRu(ヌクレオチドについて標準的なIUPAC命名法を使用)という形で置き換えてもよく、ここで(N)及び(AAN)は二重鎖のバルジの一部を表し、「xxxx」は、リンカー配列を表す。ダイレクトリピートのNNNNは、tracrRNAの対応するNNNN部分と塩基対を形成する限り、どのようなものでもかまわない。一態様では、DR:tracrRNA二重鎖は、全体の構造を変えない限り、任意の長さ(xxxx...)のリンカー、任意の塩基組成で接続され得る。 In one embodiment, the DR: tracrRNA double strand may be replaced in the form gYYYYag (N) NNNNxxxxxxNNNN (AAN) uuRRRRRu (using the standard IUPAC nomenclature for nucleotides), where (N) and (AAN). Represents part of a double chain bulge and "xxxxx" represents a linker sequence. The direct repeat NNNN may be any as long as it base pairs with the corresponding NNNN portion of the tracrRNA. In one aspect, the DR: tracrRNA duplex can be linked with a linker of any length (xxxxxx ...), of any base composition, as long as the overall structure is not altered.

一態様では、sgRNAの構造的要件は、二重鎖及び3つのステムループを有することである。ほとんどの態様では、DR:tracrRNA二重鎖の構造は保持されるべきであるが、ステム、ループ、バルジなどの構造を作成する配列は変更され得るという点で、特定の塩基要件の多くについて実際の配列要件は緩い。 In one aspect, the structural requirement of the sgRNA is to have a double strand and three stem loops. In most embodiments, the structure of the DR: tracrRNA duplex should be preserved, but in fact for many of the specific base requirements in that the sequences that make up the structure such as stems, loops, bulges, etc. can be altered. Arrangement requirements are loose.

アプタマー
第1のアプタマー/RNA結合タンパク質対を有する1つのガイドを、活性化因子に連結または融合してもよいが、第2のアプタマー/RNA結合タンパク質対を有する第2のガイドは、リプレッサーに連結または融合してもよい。ガイドは異なる標的(遺伝子座)のためのものであるため、これにより、1つの遺伝子を活性化し、1つの遺伝子を抑制することが可能になる。例えば、次の模式図はそのようなアプローチを示している。
ガイド1-MS2アプタマー-------MS2 RNA結合タンパク質-------VP64活性化因子;そして
ガイド2-PP7アプタマー-------PP7 RNA結合タンパク質-------SID4xリプレッサー。
Aptamer One guide with a first aptamer / RNA binding protein pair may be linked or fused to an activator, while a second guide with a second aptamer / RNA binding protein pair is to the repressor. It may be linked or fused. Since the guides are for different targets (loci), this allows one gene to be activated and one gene to be suppressed. For example, the following schematic diagram shows such an approach.
Guide 1-MS2 aptamer -------- MS2 RNA-binding protein -------- VP64 activator; and Guide 2-PP7 aptamer -------- PP7 RNA-binding protein --- --SID4x repressor.

本発明はまた、直交PP7/MS2遺伝子標的化にも関する。この実施例では、MS2-VP64またはPP7-SID4Xをリクルートするために、異なる遺伝子座を標的とするsgRNAを、異なるRNAループで改変し、それぞれそれらの標的遺伝子座を活性化及び抑制する。PP7は、バクテリオファージのPseudomonasのRNA結合コートタンパク質である。MS2と同様に、特定のRNA配列及び二次構造に結合する。PP7 RNA認識モチーフは、MS2のものとは異なる。その結果、PP7及びMS2を多重化して、異なるゲノム遺伝子座で異なる効果を同時に媒介してもよい。例えば、遺伝子座Aを標的とするsgRNAは、MS2-VP64活性化因子をリクルートするMS2ループで改変されてもよいが、遺伝子座Bを標的とする別のsgRNAを、PP7-SID4Xリプレッサードメインをリクルートする、PP7ループで改変してもよい。したがって、同じ細胞内で、dCas9は、直交する遺伝子座特異的改変を媒介し得る。この原理を拡張して、Q-ベータなどの他の直交RNA結合タンパク質を組み込んでもよい。 The invention also relates to orthogonal PP7 / MS2 gene targeting. In this example, to recruit MS2-VP64 or PP7-SID4X, sgRNAs targeting different loci are modified in different RNA loops, activating and suppressing those target loci, respectively. PP7 is a bacteriophage Pseudomonas RNA-binding coat protein. Similar to MS2, it binds to specific RNA sequences and secondary structures. The PP7 RNA recognition motif is different from that of MS2. As a result, PP7 and MS2 may be multiplexed to simultaneously mediate different effects at different genomic loci. For example, an sgRNA targeting locus A may be modified in an MS2 loop that recruits an MS2-VP64 activator, but another sgRNA targeting locus B may be modified with a PP7-SID4X repressor domain. It may be modified with a recruiting, PP7 loop. Thus, within the same cell, dCas9 can mediate orthogonal locus-specific modifications. This principle may be extended to incorporate other orthogonal RNA binding proteins such as Q-beta.

直交抑制の代替選択肢は、トランス活性化抑制機能を有する非コードRNAループをガイドに組み込むことを含む(ガイドに組み込まれたMS2/PP7ループと同様の位置またはガイドの3’末端のいずれかに)。例えば、ガイドは、非コーディング(ただし、抑制性であることが知られている)RNAループを使用して設計されている(例えば、哺乳類細胞のRNAポリメラーゼIIを妨害するAluリプレッサー(RNA内)を使用)。Alu RNA配列は、以下に位置していた:本明細書で使用されるMS2 RNA配列の代わりに(例えば、テトラループ及び/またはステムループ2で);及び/またはガイドの3’末端に。これにより、テトラループ及び/またはステムループ2の位置でMS2、PP7またはAluの可能な組み合わせが得られ、同様に、任意選択でガイドの3’末端にAluが追加される(リンカーの有無にかかわらず)。 Alternative options for orthogonal inhibition include incorporating a non-coding RNA loop with transactivation inhibitory function into the guide (either at a location similar to the MS2 / PP7 loop incorporated into the guide or at the 3'end of the guide). .. For example, the guide is designed using a non-coding (but known to be inhibitory) RNA loop (eg, an Alu repressor (intraRNA) that interferes with RNA polymerase II in mammalian cells). use). The Alu RNA sequence was located below: instead of the MS2 RNA sequence used herein (eg, in tetraloop and / or stemloop 2); and / or at the 3'end of the guide. This gives a possible combination of MS2, PP7 or Alu at the position of the tetraloop and / or stemloop 2, as well as optionally adding Alu to the 3'end of the guide (with or without a linker). figure).

2つの異なるアプタマー(別個のRNA)の使用により、活性化因子-アダプタータンパク質融合物及びリプレッサー-アダプタータンパク質融合物を、異なるガイドとともに使用して、一方の遺伝子の発現を活性化し、他方を抑制することが可能になる。それらは、異なるガイドと一緒に、多重化されたアプローチで一緒に、または実質的に一緒に施され得る。多数のこのような修正ガイドをすべて同時に、例えば、10または20または30など、使用してもよいが、比較的少数のCas9が多数の変更されたガイドとともに使用され得るので、Cas9を1つだけ(または少なくとも最小限の数)送達する。アダプタータンパク質は、1つ以上の活性化因子または1つ以上のリプレッサーと結合(好ましくは結合または融合)され得る。例えば、アダプタータンパク質は、第1の活性化因子及び第2の活性化因子と関連していてもよい。第1及び第2の活性因子は同じであってもよいが、好ましくは異なる活性因子である。例えば、一方はVP64で、もう一方はp65であってもよいが、これらは単なる例であり、他の転写活性化因子が想定されている。3つ以上、または4つ以上の活性化因子(またはリプレッサー)を使用してもよいが、パッケージのサイズによって、5つの異なる機能ドメインよりも多い数が制限される場合がある。リンカーは、2つ以上の機能的ドメインがアダプタータンパク質に結合しているアダプタータンパク質への直接融合よりも使用することが好ましい。適切なリンカーには、GlySerリンカーが含まれ得る。 By using two different aptamers (separate RNAs), activator-adapter protein fusions and repressor-adapter protein fusions are used with different guides to activate expression of one gene and suppress the other. It will be possible to do. They can be applied together, or substantially together, in a multiplexed approach, with different guides. A large number of such modification guides may be used all at the same time, eg, 10 or 20 or 30, but only one Cas9 can be used as a relatively small number of Cas9s can be used with a large number of modified guides. Deliver (or at least the minimum number). The adapter protein can be bound (preferably bound or fused) to one or more activators or one or more repressors. For example, the adapter protein may be associated with a first activator and a second activator. The first and second activators may be the same, but are preferably different activators. For example, one may be VP64 and the other may be p65, but these are just examples and other transcriptional activators are envisioned. Three or more, or four or more activators (or repressors) may be used, but the size of the package may limit more than five different functional domains. It is preferable to use the linker rather than direct fusion to the adapter protein in which two or more functional domains are attached to the adapter protein. Suitable linkers may include GlySer linkers.

酵素-ガイド複合体全体が2つ以上の機能的ドメインと関連し得ることも想定される。例えば、酵素に関連付けられた2つ以上の機能ドメインがあってもよいし、ガイドに関連付けられている2つ以上の機能ドメインがあってもよいし(1つ以上のアダプタータンパク質を介して)、または酵素に関連付けられている1つ以上の機能ドメイン、及びガイドに関連付けられた1つ以上の機能ドメイン(1つ以上のアダプタータンパク質を介して)があってもよい。 It is also envisioned that the entire enzyme-guide complex may be associated with more than one functional domain. For example, there may be more than one functional domain associated with an enzyme, or more than one functional domain associated with a guide (via one or more adapter proteins). Alternatively, there may be one or more functional domains associated with the enzyme and one or more functional domains associated with the guide (via one or more adapter proteins).

アダプタータンパク質と活性化因子またはリプレッサーとの間の融合は、リンカーを含み得る。例えば、GlySerリンカーGGGSを使用してもよい。必要に応じて適切な長さを提供するために、3((GGGGS))または6、9または12以上の繰り返しで使用してもよい。リンカーは、RNA結合タンパク質と機能ドメイン(活性化因子またはリプレッサー)の間、またはCRISPR酵素(Cas9)と機能ドメイン(活性化因子またはリプレッサー)の間で使用してもよい。リンカーは、ユーザーに適切な量の「機械的柔軟性」を与える。 The fusion between the adapter protein and the activator or repressor may include a linker. For example, the GlySer linker GGGS may be used. It may be used in 3 ((GGGGS) 3 ) or 6, 9 or 12 or more iterations to provide the appropriate length as needed. Linkers may be used between RNA-binding proteins and functional domains (activators or repressors) or between CRISPR enzymes (Cas9) and functional domains (activators or repressors). The linker gives the user the right amount of "mechanical flexibility".

デッドガイド:デッドガイド配列を含むガイドRNAは、本発明において使用され得る。
一態様では、本発明は、CRISPR複合体の形成及び標的への首尾よい結合を可能にし、同時に首尾よいヌクレアーゼ活性を許容しない(すなわち、ヌクレアーゼ活性なし/インデル活性なし)方法で改変されたガイド配列を提供する。説明のために、そのような修正されたガイド配列は、「デッドガイド」または「デッドガイド配列」と呼ばれる。これらのデッドガイドまたはデッドガイド配列は、ヌクレアーゼ活性に関して触媒的に不活性または立体構造的に不活性であると考えられ得る。ヌクレアーゼ活性は、当該技術分野で一般的に使用されるサーベイヤー(surveyor)分析またはディープシーケンシング、好ましくはサーベイヤー分析を使用して測定され得る。同様に、デッドガイド配列は、触媒活性を促進する能力、またはオンターゲット及びオフターゲット結合活性を区別する能力に関して、生産的な塩基対形成に十分に関与しない場合がある。簡単に言うと、サーベイヤーアッセイでは、遺伝子のCRISPR標的部位を精製及び増幅すること、及びCRISPR標的部位を増幅するプライマーとヘテロ二本鎖を形成することを含む。再アニーリング後、生成物は、製造業者の推奨プロトコールに従ってSURVEYORヌクレアーゼ及びSURVEYORエンハンサーS(Transgenomics)で処理し、ゲルで分析し、相対バンド強度に基づいて定量化する。
Dead guide: A guide RNA containing a dead guide sequence can be used in the present invention.
In one aspect, the invention allows for the formation of a CRISPR complex and successful binding to a target, while at the same time not allowing successful nuclease activity (ie, no nuclease activity / no indel activity) modified guide sequences. I will provide a. For illustration purposes, such modified guide sequences are referred to as "dead guides" or "dead guide sequences." These dead guides or dead guide sequences can be considered catalytically inactive or sterically inactive with respect to nuclease activity. Nuclease activity can be measured using surveyor analysis or deep sequencing, preferably surveyor analysis commonly used in the art. Similarly, dead guide sequences may not be fully involved in productive base pairing in terms of their ability to promote catalytic activity or distinguish between on-target and off-target binding activities. Briefly, the surveyor assay involves purifying and amplifying the CRISPR target site of a gene and forming a heteroduplex with a primer that amplifies the CRISPR target site. After reannealing, the product is treated with SURVEYOR nuclease and SURVEYOR Enhancer S (Transgenemics) according to the manufacturer's recommended protocol, analyzed on a gel and quantified based on relative band strength.

したがって、関連する態様では、本発明は、本明細書に記載の機能的Cas9を含む非天然に存在するか、または操作された組成物Cas9 CRISPR-Cas系、及びgRNAがデッドガイド配列を含むガイドRNA(gRNA)であって、これによりgRNAは標的配列にハイブリダイズし得、その結果、Cas9 CRISPR-Cas系が、SURVEYORアッセイによって検出されるように、この系の非変異Cas9酵素のヌクレアーゼ活性に起因する検出可能なインデル活性なしに細胞内の目的のゲノム遺伝子座に向けられるgRNAを提供する。簡単な目的のために、gRNAは、gRNAが標的配列にハイブリダイズし得るデッドガイド配列を含み、その結果、Cas9 CRISPR-Cas系は、本明細書で「デッドgRNA」と呼ばれるSURVEYORアッセイによって検出されるこの系の非変異Cas9酵素のヌクレアーゼ活性からのインデル活性の検出可能な結果なく細胞中の目的のゲノム遺伝子座に関する。本明細書の他のいずれかに記載の本発明によるgRNAのいずれも、本明細書の以下に記載のデッドガイド配列を含むデッドgRNA/gRNAとして使用され得ることを理解されたい。本明細書の他のいずれかに記載する方法、製品、組成物、及び使用のいずれも、以下でさらに詳述するデッドガイド配列を含むデッドgRNA/gRNAに等しく適用可能である。さらなるガイダンスにより、以下の特定の態様及び実施形態が提供される。 Thus, in a related aspect, the invention is a non-naturally occurring or engineered composition Cas9 CRISPR-Cas system comprising the functional Cas9 described herein, and a guide in which the gRNA comprises a dead guide sequence. An RNA (gRNA), which allows the gRNA to hybridize to a target sequence, so that the Cas9 CRISPR-Cas system becomes the nuclease activity of the non-mutated Cas9 enzyme of this system, as detected by the SURVEYOR assay. It provides a gRNA that is directed to a genomic locus of interest in a cell without the resulting detectable indel activity. For simple purposes, the gRNA contains a dead guide sequence in which the gRNA can hybridize to the target sequence, so that the Cas9 CRISPR-Cas system is detected by the SURVEYOR assay referred to herein as the "dead gRNA". With no detectable result of indel activity from the nuclease activity of the non-mutated Cas9 enzyme of this system, it relates to the genomic locus of interest in the cell. It should be appreciated that any of the gRNAs according to the invention described elsewhere herein can be used as dead gRNAs / gRNAs comprising the dead guide sequences described below herein. Any of the methods, products, compositions, and uses described elsewhere herein are equally applicable to dead gRNAs / gRNAs containing dead guide sequences further detailed below. Further guidance provides the following specific embodiments and embodiments:

標的配列へのCRISPR複合体の配列特異的結合を指示するデッドガイド配列の能力は、任意の適切なアッセイにより評価され得る。例えば、試験されるデッドガイド配列を含む、CRISPR複合体を形成するのに十分なCRISPR系の構成要素を、CRISPR配列の構成要素をコードするベクターでのトランスフェクション、続いて、標的配列内の好ましい切断のアセスメント、例えば、本明細書に記載のSurveyorアッセイなどによって、対応する標的配列を有する宿主細胞に提供してもよい。同様に、標的ポリヌクレオチド配列の切断は、試験管内で、標的配列、試験するデッドガイド配列及び試験デッドガイド配列とは異なる対照ガイド配列を含むCRISPR複合体の構成要素を提供すること、ならびに試験と対照のガイド配列反応との間の標的配列での結合または切断速度を比較することにより評価してもよい。他のアッセイもまた可能であり、当業者には明らかであろう。デッドガイド配列を選択して、任意の標的配列を標的としてもよい。いくつかの実施形態では、標的配列は、細胞のゲノム内の配列である。 The ability of the dead guide sequence to direct sequence-specific binding of the CRISPR complex to the target sequence can be assessed by any suitable assay. For example, transfection of a CRISPR system component sufficient to form a CRISPR complex, including the dead guide sequence to be tested, with a vector encoding a component of the CRISPR sequence, followed by preferred within the target sequence. Cleavage assessments, such as the Surveyor assay described herein, may be provided to host cells with the corresponding target sequence. Similarly, cleavage of the target polynucleotide sequence provides in vitro a component of the CRISPR complex containing the target sequence, the dead guide sequence to be tested and a control guide sequence different from the test dead guide sequence, as well as with the test. It may be evaluated by comparing the rate of binding or cleavage at the target sequence with the control guide sequence reaction. Other assays are also possible and will be apparent to those of skill in the art. A dead guide sequence may be selected to target any target sequence. In some embodiments, the target sequence is a sequence within the genome of a cell.

本明細書でさらに説明するように、いくつかの構造パラメーターにより、適切なフレームワークがそのようなデッドガイドに到達することが可能になる。デッドガイド配列は、それぞれのガイド配列よりも短く、その結果活性なCas9固有のインデルが形成される。デッドガイドは同じCas9に向けられたそれぞれのガイドよりも5%、10%、20%、30%、40%、50%短く、活性なCas9特異的なインデル形成につながる。 As further described herein, some structural parameters allow the appropriate framework to reach such dead guides. The dead guide sequences are shorter than the respective guide sequences, resulting in the formation of active Cas9-specific indels. Dead guides are 5%, 10%, 20%, 30%, 40%, 50% shorter than their respective guides directed to the same Cas9, leading to active Cas9-specific indel formation.

以下で説明し、当該技術分野で公知の通り、gRNAの1つの態様-Cas9特異性は、そのようなガイドに適切にリンクされるダイレクトリピート配列である。特に、これは、Cas9の起源に依存してダイレクトリピート配列が設計されることを意味する。したがって、検証済みのデッドガイド配列に利用され得る構造データを、Cas9特異的な等価物を設計するために使用してもよい。例えば、2つ以上のCas9エフェクタータンパク質のオルソロガスヌクレアーゼドメインRuvC間の構造的類似性を使用して、設計の等価なデッドガイドを移入し得る。したがって、本明細書のデッドガイドは、そのようなCas9特異的等価物を反映するように長さ及び配列を適切に改変してもよく、これは、CRISPR複合体の形成及び標的への首尾よい結合を可能にするが、ただし同時に、首尾よいヌクレアーゼ活性を可能にすることはない。 As described below and known in the art, one aspect of gRNA-Cas9 specificity is a direct repeat sequence that is appropriately linked to such a guide. In particular, this means that direct repeat sequences are designed depending on the origin of Cas9. Therefore, structural data that can be used for validated dead guide sequences may be used to design Cas9-specific equivalents. For example, structural similarities between the orthologous nuclease domain RuvC of two or more Cas9 effector proteins can be used to introduce equivalent dead guides for the design. Therefore, the dead guides herein may be appropriately modified in length and sequence to reflect such Cas9-specific equivalents, which are successful for the formation and targeting of CRISPR complexes. Allows binding, but at the same time does not allow successful nuclease activity.

本明細書の文脈及び最新技術におけるデッドガイドの使用は、インビトロ、エクスビボ、及びインビボの両方の用途における、ネットワーク生物学及び/またはシステム生物学のための驚くべき予想外のプラットフォームを提供し、それによって遺伝子標的化の多重化、特に双方向多重遺伝子標的化が可能になる。デッドガイドを使用する前は、例えば、遺伝子活性の活性化、抑制、及び/またはサイレンシングなど、複数の標的に対処することは困難であり、場合によっては不可能であった。デッドガイドを使用すると、多数の標的、従って、多数の活性が、例えば同じ細胞内、同じ動物内、または同じ患者内で、対処され得る。このような多重化は、同時に発生する場合もあり、または希望する時間枠でずらされる場合もある。 The use of dead guides in the context of this specification and in the latest technology provides a surprising and unexpected platform for network biology and / or systems biology in both in vitro, ex vivo, and in vivo applications. Allows gene targeting multiplexing, especially bidirectional multiplex gene targeting. Prior to the use of dead guides, it was difficult and in some cases impossible to address multiple targets, such as activation, suppression, and / or silencing of gene activity. With dead guides, multiple targets, and thus multiple activities, can be addressed, for example, within the same cell, within the same animal, or within the same patient. Such multiplexing may occur simultaneously or may be staggered in the desired time frame.

例えば、デッドガイドは、ここで、ヌクレアーゼ活性の結果なしに遺伝子標的化の手段としてgRNAを初めて使用することを可能にし、同時に活性化または抑制のための指向された手段を提供する。デッドガイドを含むガイドRNAは、遺伝子活性の活性化または抑制を可能にする方法で要素をさらに含むように改変されてもよく、特に本明細書のいずれかに記載のタンパク質アダプター(例えば、アプタマー)では遺伝子エフェクター(例えば、遺伝子活性の活性化因子またはリプレッサー)の機能的配置が可能になる。一例は、本明細書及び最新技術で説明されているように、アプタマーの組み込みである。タンパク質相互作用アプタマーを組み込むデッドガイドを含むgRNAを操作することにより(Konermann et al.,“Genome-scale transcription activation by an engineered CRISPR-Cas9 complex,”doi:10.1038/nature14136,参照により本明細書に組み込まれる)、複数の異なるエフェクタードメインからなる合成転写活性化複合体をアセンブルし得る。そのようなものは、自然な転写活性化プロセスの後にモデル化され得る。例えば、エフェクター(例えば、活性化因子またはリプレッサー;活性化因子またはリプレッサーとの融合タンパク質としての二量体化MS2バクテリオファージコートタンパク質)に選択的に結合するアプタマー、またはエフェクター(例えば、活性化因子またはリプレッサー)にそれ自体が結合するタンパク質は、デッドgRNAテトラループ及び/またはステムループ2に付加され得る。MS2の場合、融合タンパク質MS2-VP64は、テトラループ及び/またはステムループ2に結合し、次に、例えばNeurog2の転写の上方制御を媒介する。他の転写活性化因子は、例えばVP64、P65、HSF1、及びMyoD1である。この概念の単なる例として、MS2ステムループをPP7相互作用ステムループに置き換えることで、抑圧的な要素をリクルートし得る。 For example, dead guides here allow the first use of gRNA as a means of gene targeting without the consequences of nuclease activity, while at the same time providing directed means for activation or suppression. Guide RNAs, including dead guides, may be modified to include additional elements in a manner that allows activation or suppression of gene activity, particularly the protein adapters (eg, aptamers) described herein. Allows functional placement of gene effectors (eg, activators or repressors of gene activity). One example is the incorporation of aptamers, as described herein and in the latest technology. By manipulating a gRNA containing a dead guide that incorporates a protein-interaction aptamer (Konermann et al., "Genome-scale transition activation by an engineered CRISPR-Cas9 complex," doi: 10.1038 / nator 14 It is possible to assemble a synthetic transcriptional activation complex consisting of multiple different effector domains. Such can be modeled after a natural transcriptional activation process. For example, an aptamer or effector (eg, activation) that selectively binds to an effector (eg, an activator or repressor; a dimerized MS2 bacteriophage coat protein as a fusion protein with the activator or repressor). A protein that itself binds to a factor or repressor) can be added to the dead gRNA tetraloop and / or stemloop 2. In the case of MS2, the fusion protein MS2-VP64 binds to tetraloop and / or stemloop 2 and then mediates upregulation of transcription of, for example, Neurog2. Other transcriptional activators are, for example, VP64, P65, HSF1, and MyoD1. As a mere example of this concept, the repressive element can be recruited by replacing the MS2 stemloop with a PP7 interaction stemloop.

したがって、一態様は、デッドガイドを含む本発明のgRNAであり、gRNAは、本明細書に記載の遺伝子活性化または抑制を提供する改変をさらに含む。デッドgRNAは、1つ以上のアプタマーを含み得る。アプタマーは、遺伝子エフェクター、遺伝子活性化因子または遺伝子リプレッサーに特異的であり得る。あるいは、アプタマーは、次に、特定の遺伝子エフェクター、遺伝子活性化因子または遺伝子リプレッサーに特異的であり、それらをリクルート/それらに結合する、タンパク質に特異的であってもよい。活性化因子またはリプレッサーのリクルートのための複数の部位がある場合、その部位は活性化因子またはリプレッサーのいずれかに特異的であることが好ましい。活性化因子またはリプレッサー結合のための複数の部位がある場合、その部位は、同じ活性化因子または同じリプレッサーに特異的であり得る。その部位は、また、異なる活性化因子または異なるリプレッサーに特異的であり得る。遺伝子エフェクター、遺伝子活性化因子、遺伝子リプレッサーは、融合タンパク質の形態で存在してもよい。 Accordingly, one embodiment is a gRNA of the invention comprising a dead guide, which further comprises a modification that provides gene activation or suppression as described herein. A dead gRNA may contain one or more aptamers. Aptamers can be specific for gene effectors, gene activators or gene repressors. Alternatively, the aptamer may then be specific for a particular gene effector, gene activator or gene repressor and for the protein that recruits / binds them. If there are multiple sites for recruiting the activator or repressor, the sites are preferably specific for either the activator or the repressor. If there are multiple sites for activator or repressor binding, the sites can be specific for the same activator or repressor. The site can also be specific for different activators or different repressors. Gene effectors, gene activators, and gene repressors may be present in the form of fusion proteins.

一実施形態では、本明細書に記載のデッドgRNAまたは本明細書に記載のCas9 CRISPR-Cas複合体は、各タンパク質が1つ以上の機能ドメインに関連し、アダプタータンパク質が、そのデッドgRNAの少なくとも1つのループに挿入された別個のRNA配列(複数可)に結合する、2つ以上のアダプタータンパク質を含む、天然には存在しないか、または操作された組成物を含む。 In one embodiment, the dead gRNA described herein or the Cas9 CRISPR-Cas complex described herein each protein is associated with one or more functional domains and the adapter protein is at least the dead gRNA thereof. Includes a non-naturally occurring or engineered composition comprising two or more adapter proteins that bind to a separate RNA sequence (s) inserted in one loop.

したがって、一態様は、細胞内の目的のゲノム遺伝子座内の標的配列にハイブリダイズし得るデッドガイド配列を含むガイドRNA(gRNA)を含む天然には存在しないか、または操作された組成物を提供し、ここでこのデッドガイド配列は、本明細書で定義されるように、少なくとも1つ以上の核局在化配列を含むCas9であり、Cas9は任意選択で少なくとも1つの変異を含み、デッドgRNAの少なくとも1つのループは、1つ以上のアダプタータンパク質に結合する別個のRNA配列(複数可)の挿入によって改変され、ここでこのアダプタータンパク質は1つ以上の機能的ドメインに関連付けられているか;または、ここでこのデッドgRNAが少なくとも1つの非コード機能ループを有するように改変され、ここで、この組成物が2つ以上のアダプタータンパク質を含み、各タンパク質が1つ以上の機能ドメインに関連する。 Accordingly, one embodiment provides a naturally non-existent or engineered composition comprising a guide RNA (gRNA) containing a dead guide sequence capable of hybridizing to a target sequence within a target genomic locus of interest in a cell. However, here the dead guide sequence is Cas9 containing at least one nuclear localization sequence, as defined herein, Cas9 optionally containing at least one mutation, dead gRNA. At least one loop of is modified by the insertion of a separate RNA sequence (s) that bind to one or more adapter proteins, where the adapter protein is associated with one or more functional domains; or Here, the dead gRNA is modified to have at least one non-coding functional loop, where the composition comprises two or more adapter proteins, each protein associated with one or more functional domains.

特定の実施形態では、アダプタータンパク質は、機能的ドメインを含む融合タンパク質であり、この融合タンパク質は、任意選択でアダプタータンパク質と機能的ドメインとの間にリンカーを任意選択で含み、このリンカーは任意選択でGlySerリンカーを含む。 In certain embodiments, the adapter protein is a fusion protein comprising a functional domain, the fusion protein optionally comprising a linker between the adapter protein and the functional domain, the linker being optionally selected. Includes a GlySer linker.

特定の実施形態では、デッドgRNAの少なくとも1つのループは、2つ以上のアダプタータンパク質に結合する別個のRNA配列(複数可)の挿入により改変されない。 In certain embodiments, at least one loop of dead gRNA is not modified by insertion of a separate RNA sequence (s) that bind to two or more adapter proteins.

特定の実施形態では、アダプタータンパク質に関連する1つ以上の機能的ドメインは転写活性化ドメインである。 In certain embodiments, the one or more functional domains associated with the adapter protein are transcriptional activation domains.

特定の実施形態では、アダプタータンパク質に関連する1つ以上の機能的ドメインは、VP64、p65、MyoD1、HSF1、RTAまたはSET7/9を含む転写活性化ドメインである。 In certain embodiments, the one or more functional domains associated with the adapter protein are transcriptional activation domains comprising VP64, p65, MyoD1, HSF1, RTA or SET7 / 9.

特定の実施形態では、アダプタータンパク質に関連する1つ以上の機能的ドメインは転写抑制因子ドメインである。 In certain embodiments, the one or more functional domains associated with the adapter protein are transcriptional repressor domains.

特定の実施形態では、転写抑制因子ドメインはKRABドメインである。 In certain embodiments, the transcriptional repressor domain is the KRAB domain.

特定の実施形態では、転写抑制因子ドメインは、NuEドメイン、NcoRドメイン、SIDドメインまたはSID4Xドメインである。 In certain embodiments, the transcriptional repressor domain is a NuE domain, NcoR domain, SID domain or SID4X domain.

特定の実施形態では、アダプタータンパク質に関連する1つ以上の機能的ドメインの少なくとも1つは、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン改変活性、DNA結合活性、RNA切断活性、DNA切断活性、または核酸結合活性を含む1つ以上の活性を有する。 In certain embodiments, at least one of the one or more functional domains associated with the adapter protein is methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcriptional release factor activity, histone modification activity, DNA binding. It has one or more activities including activity, RNA cleavage activity, DNA cleavage activity, or nucleic acid binding activity.

特定の実施形態では、DNA切断活性は、Fok1ヌクレアーゼに起因する。 In certain embodiments, the DNA cleavage activity is due to the Fok1 nuclease.

特定の実施形態では、デッドgRNAは、デッドgRNAがアダプタータンパク質に結合し、さらにCas9及び標的に結合した後、機能ドメインがその帰属機能で機能することを可能にする空間配向にあるように改変される。 In certain embodiments, the dead gRNA is modified to be in a spatial orientation that allows the functional domain to function in its assigned function after the dead gRNA binds to the adapter protein and further to Cas9 and the target. To.

特定の実施形態では、デッドgRNAの少なくとも1つのループは、テトラループ及び/またはループ2である。特定の実施形態では、デッドgRNAのテトラループ及びループ2は、別個のRNA配列(複数可)の挿入により改変される。 In certain embodiments, the at least one loop of dead gRNA is a tetraloop and / or loop 2. In certain embodiments, the dead gRNA tetraloop and loop 2 are modified by insertion of separate RNA sequences (s).

特定の実施形態では、1つ以上のアダプタータンパク質に結合する別個のRNA配列(複数可)の挿入はアプタマー配列である。特定の実施形態では、このアプタマー配列は、同じアダプタータンパク質に特異的な2つ以上のアプタマー配列である。特定の実施形態では、アプタマー配列は、異なるアダプタータンパク質に特異的な2つ以上のアプタマー配列である。 In certain embodiments, the insertion of a separate RNA sequence (s) that bind to one or more adapter proteins is an aptamer sequence. In certain embodiments, the aptamer sequence is two or more aptamer sequences specific for the same adapter protein. In certain embodiments, the aptamer sequence is two or more aptamer sequences specific for different adapter proteins.

特定の実施形態では、アダプタータンパク質は、MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、7s、PRR1を含む。 In certain embodiments, the adapter proteins are MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, Includes NL95, TW19, AP205, ΦCb5, ΦCb8r, ΦCb12r, ΦCb23r, 7s, PRR1.

特定の実施形態では、細胞は真核細胞である。特定の実施形態では、真核細胞は哺乳動物細胞、任意選択でマウス細胞である。特定の実施形態では、哺乳動物細胞はヒト細胞である。 In certain embodiments, the cells are eukaryotic cells. In certain embodiments, the eukaryotic cell is a mammalian cell, optionally a mouse cell. In certain embodiments, the mammalian cell is a human cell.

特定の実施形態では、第1のアダプタータンパク質は、p65ドメインに関連し、第2のアダプタータンパク質はHSF1ドメインに関連する。 In certain embodiments, the first adapter protein is associated with the p65 domain and the second adapter protein is associated with the HSF1 domain.

特定の実施形態では、この組成物は、少なくとも3つの機能的ドメインを有するCas9 CRISPR-Cas複合体を含み、そのうち少なくとも1つはCas9に関連し、少なくとも2つはデッドgRNAに関連する。 In certain embodiments, the composition comprises a Cas9 CRISPR-Cas complex having at least three functional domains, of which at least one is associated with Cas9 and at least two are associated with dead gRNA.

特定の実施形態では、組成物は、第2のgRNAをさらに含み、第2のgRNAは、第2のCas9 CRISPR-Cas系が、その系のCas9酵素のヌクレアーゼ活性に起因する第2のゲノム遺伝子座で検出可能なインデル活性を有する細胞中で目的の第2のゲノム遺伝子座に向けられるように、第2の標的配列にハイブリダイズし得る生gRNAである。 In certain embodiments, the composition further comprises a second gRNA, wherein the second Cas9 CRISPR-Cas system is due to the nuclease activity of the Cas9 enzyme in that system. A raw gRNA that can hybridize to a second target sequence so that it is directed to the second genomic locus of interest in cells with detectable indel activity at the loci.

特定の実施形態では、組成物は、複数のデッドgRNA及び/または複数の生きたgRNAをさらに含む。 In certain embodiments, the composition further comprises a plurality of dead gRNAs and / or a plurality of live gRNAs.

本発明の一態様は、gRNA足場のモジュール性及びカスタマイズ可能性を利用して、別個のタイプのエフェクターを直交様式でリクルートするための異なる結合部位(特にアプタマー)を有する一連のgRNA足場を確立することである。同様に、より広い概念の例及び説明の問題で、MS2ステムループのPP7相互作用ステムループへの置き換えを使用して、抑制要素を結合/リクルートして、多重化された双方向転写制御を可能にしてもよい。したがって、一般に、デッドガイドを含むgRNAを使用して、多重転写制御及び好ましい双方向転写制御を提供し得る。この転写制御は、遺伝子の中で最も好ましい。例えば、デッドガイド(複数可)を含む1つ以上のgRNAは、1つ以上の標的遺伝子の活性化を標的とする際に使用され得る。同時に、1つ以上の標的遺伝子の抑制を標的にする際に、デッドガイド(複数可)を含む1つ以上のgRNAを使用してもよい。このような配列は、様々な異なる組み合わせで適用されてもよく、例えば、最初に標的遺伝子が抑制され、次いで、適切な期間に他の標的が活性化されるか、選択遺伝子が抑制されると同時に選択遺伝子が抑制され、続いて、さらに活性化及び/または抑圧される。結果として、1つ以上の生物学的系の複数の構成要素が一緒に有利に対処され得る。 One aspect of the invention utilizes the modularity and customizability of a gRNA scaffold to establish a series of gRNA scaffolds with different binding sites (particularly aptamers) for recruiting distinct types of effectors in an orthogonal fashion. That is. Similarly, in a broader conceptual example and description issue, the replacement of MS2 stemloops with PP7 interaction stemloops can be used to bind / recruit inhibitory elements to allow multiplexed bidirectional transcriptional control. You may do it. Therefore, in general, gRNAs containing dead guides can be used to provide multiple transcriptional control and preferred bidirectional transcriptional control. This transcriptional regulation is most preferred among genes. For example, one or more gRNAs containing a dead guide (s) can be used to target activation of one or more target genes. At the same time, one or more gRNAs containing a dead guide (s) may be used in targeting suppression of one or more target genes. Such sequences may be applied in a variety of different combinations, for example, if the target gene is first suppressed and then another target is activated or the selected gene is suppressed at the appropriate time. At the same time, the selected gene is suppressed, followed by further activation and / or suppression. As a result, multiple components of one or more biological systems can be advantageously addressed together.

ある態様では、本発明は、本明細書に記載のデッドgRNAまたはCas9 CRISPR-Cas複合体または組成物をコードする核酸分子(複数可)を提供する。 In some embodiments, the invention provides a nucleic acid molecule (s) encoding a dead gRNA or Cas9 CRISPR-Cas complex or composition described herein.

一態様では、本発明は、本明細書で定義されるデッドガイドRNAをコードする核酸分子を含むベクター系を提供する。特定の実施形態では、ベクター系は、Cas9をコードする核酸分子(複数可)をさらに含む。特定の実施形態では、ベクター系は、(生)gRNAをコードする核酸分子(複数可)をさらに含む。特定の実施形態では、核酸分子またはベクターは、ガイド配列(gRNA)をコードする核酸分子ならびに/またはCas9及び/または任意で核局在化配列(複数可)をコードする核酸分子に機能可能なように連結された真核細胞で作動可能な調節エレメント(複数可)をさらに含む。 In one aspect, the invention provides a vector system comprising a nucleic acid molecule encoding a dead guide RNA as defined herein. In certain embodiments, the vector system further comprises a nucleic acid molecule (s) encoding Cas9. In certain embodiments, the vector system further comprises a nucleic acid molecule (s) encoding a (raw) gRNA. In certain embodiments, the nucleic acid molecule or vector is capable of functioning as a nucleic acid molecule encoding a guide sequence (gRNA) and / or Cas9 and / or optionally a nucleic acid molecule encoding a nuclear localization sequence (s). It further contains regulatory elements (s) that can be actuated on eukaryotic cells linked to.

別の態様では、構造解析を使用して、デッドガイドと活性なCas9ヌクレアーゼ(DNA結合を可能にするがDNA切断は可能にしない)との間の相互作用を研究してもよい。このようにして、Cas9のヌクレアーゼ活性に重要なアミノ酸が決定される。そのようなアミノ酸の改変により、遺伝子編集に使用されるCas9酵素の改善が可能になる。 In another embodiment, structural analysis may be used to study the interaction between dead guides and active Cas9 nucleases (which allow DNA binding but not DNA cleavage). In this way, amino acids important for Cas9 nuclease activity are determined. Such amino acid modifications allow for the improvement of the Cas9 enzyme used for gene editing.

さらなる態様は、本明細書で説明されるデッドガイドの使用を、本明細書で説明されるとともに当該技術分野で公知であるCRISPRの他の用途と組み合わせることである。例えば、本明細書で説明するように、標的多重遺伝子活性化もしくは抑制または標的多重双方向遺伝子活性化/抑制のためのデッドガイド(複数可)を含むgRNAを、ヌクレアーゼ活性を維持するガイドを含むgRNAと組み合わせてもよい。ヌクレアーゼ活性を維持するガイドを含むそのようなgRNAは、遺伝子活性の抑制を可能にする改変(例えばアプタマー)をさらに含んでもよいし、含まなくてもよい。ヌクレアーゼ活性を維持するガイドを含むそのようなgRNAは、遺伝子活性の活性化を可能にする改変(例えば、アプタマー)をさらに含んでも含まなくてもよい。そのような方法で、多重遺伝子制御のためのさらなる手段が導入される(例えば、ヌクレアーゼ活性を伴わない/インデル活性を伴わない多重遺伝子標的活性化が同時に、またはヌクレアーゼ活性を伴う遺伝子標的抑制と組み合わせて提供される)。 A further aspect is to combine the use of the dead guides described herein with other uses of CRISPR as described herein and known in the art. For example, as described herein, a gRNA containing a dead guide (s) for target multiplex gene activation or suppression or target multiplex bidirectional gene activation / suppression, including a guide for maintaining nuclease activity. It may be combined with gRNA. Such gRNAs, including guides that maintain nuclease activity, may or may not further contain modifications (eg, aptamers) that allow suppression of gene activity. Such gRNAs, including guides that maintain nuclease activity, may or may not further contain modifications (eg, aptamers) that allow activation of gene activity. In such a manner, additional means for multiple gene regulation are introduced (eg, multiple gene target activation without nuclease activity / without indel activity simultaneously or in combination with gene target suppression with nuclease activity. Provided).

例えば、1)1つ以上の遺伝子に標的され遺伝子活性化因子のリクルートのための適切なアプタマーでさらに改変されたデッドガイト(複数可)を含む1つ以上の(例えば、1~50、1~40、1~30、1~20、好ましくは1~10、より好ましくは1~5)のgRNAを用い;2)1つ以上の遺伝子に標的され、遺伝子リプレッサーのリクルートのための適切なアプタマーでさらに改変されたデッドガイト(複数可)を含む1つ以上の(例えば、1~50、1~40、1~30、1~20、好ましくは1~10、より好ましくは1~5)のgRNAと組み合わせてもよい。1)及び/または2)は、3)1つ以上の遺伝子に標的された1つ以上のgRNA(例えば、1~50、1~40、1~30、1~20、好ましくは1~10、より好ましくは1~5)と組み合わされてもよい。次いで、この組み合わせは、次に、1)+2)+3)と4)とともに、1つ以上の遺伝子に標的され、遺伝子活性化因子のリクルートのための適切なアプタマーでさらに改変された1つ以上(例えば、1~50、1~40、1~30、1~20、好ましくは1~10、より好ましくは1~5)のgRNAを用いて行われる。次いで、この組み合わせは、次に、1)+2)+3)+4)と5)とともに、1つ以上の遺伝子に標的され、遺伝子リプレッサーのリクルートのための適切なアプタマーでさらに改変された1つ以上(例えば、1~50、1~40、1~30、1~20、好ましくは1~10、より好ましくは1~5)のgRNAを用いて行われる。結果として、種々の使用及び組み合わせが本発明に含まれる。例えば、組み合わせ1)+2);組み合わせ1)+3);組み合わせ2)+3);組み合わせ1)+2)+3);組み合わせ1)+2)+3)+4);組み合わせ1)+3)+4);組み合わせ2)+3)+4);組み合わせ1)+2)+4);組み合わせ1)+2)+3)+4)+5);組み合わせ1)+3)+4)+5);組み合わせ2)+3)+4)+5);組み合わせ1)+2)+4)+5);組み合わせ1)+2)+3)+5);組み合わせ1)+3)+5);組み合わせ2)+3)+5);組み合わせ1)+2)+5)。 For example, 1) one or more (eg, 1-50, 1-40) containing a dead guide (s) that are targeted to one or more genes and further modified with a suitable aptamer for recruiting gene activators. Using gRNAs from 1 to 30, 1 to 20, preferably 1 to 10, more preferably 1 to 5); 2) with suitable aptamers targeted to one or more genes and for recruiting gene repressors. With one or more (eg, 1-50, 1-40, 1-30, 1-20, preferably 1-10, more preferably 1-5) gRNAs comprising further modified dead guides (s). It may be combined. 1) and / or 2) are 3) one or more gRNAs targeted by one or more genes (eg, 1-50, 1-40, 1-30, 1-20, preferably 1-10, More preferably, it may be combined with 1 to 5). This combination was then targeted to one or more genes, along with 1) + 2) + 3) and 4), and further modified with the appropriate aptamer for recruitment of gene activators (1) or more ( For example, it is carried out using 1 to 50, 1 to 40, 1 to 30, 1 to 20, preferably 1 to 10, more preferably 1 to 5) gRNA. This combination was then targeted to one or more genes, along with 1) + 2) + 3) + 4) and 5), and further modified with the appropriate aptamer for recruiting gene repressors. (For example, 1 to 50, 1 to 40, 1 to 30, 1 to 20, preferably 1 to 10, more preferably 1 to 5) gRNA is used. As a result, various uses and combinations are included in the present invention. For example, combination 1) +2); combination 1) +3); combination 2) +3); combination 1) +2) +3); combination 1) +2) +3) +4); combination 1) +3) +4); combination 2) +3 ) +4); Combination 1) +2) +4); Combination 1) +2) +3) +4) +5); Combination 1) +3) +4) +5); Combination 2) +3) +4) +5); Combination 1) +2) +4 ) +5); Combination 1) +2) +3) +5); Combination 1) +3) +5); Combination 2) +3) +5); Combination 1) +2) +5).

一態様では、本発明は、Cas9 CRISPR-Cas系を標的遺伝子座に指示するためのデッドガイドRNA標的化配列(デッドガイド配列)を設計、評価、または選択するためのアルゴリズムを提供する。特に、デッドガイドRNAの特異性は、i)GCの含有量、及びii)標的化配列の長さを変化させることに関係し、それによって最適化され得ると判断された。一態様では、本発明は、デッドガイドRNAのオフターゲット結合または相互作用を最小化するデッドガイドRNA標的配列を設計または評価するためのアルゴリズムを提供する。本発明の一実施形態では、生物内の遺伝子座にCRISPR系を指示するためのデッドガイドRNA標的化配列を選択するためのアルゴリズムは、a)遺伝子座内の1つ以上のCRISPRモチーフを位置決定し、各CRISPRモチーフの下流の20nt配列を、i)配列のGC含有量を決定すること;及びii)生物のゲノム内のCRISPRモチーフに最も近い15の下流ヌクレオチドのオフターゲットマッチがあるか否かを決定すること、ならびにc)配列のGC含有量が70%以下であり、オフターゲット一致が識別されない場合、デッドガイドRNAで使用する15ヌクレオチド配列を選択することによって、分析することを含む。一実施形態では、GC含量が60%以下である場合、標的配列に対して配列が選択される。特定の実施形態では、GC含量が55%以下、50%以下、45%以下、40%以下、35%以下または30%以下である場合、標的配列に対して配列が選択される。一実施形態では、遺伝子座の2つ以上の配列が分析され、最も低いGC含量、または次に低いGC含量、または次に低いGC含量を有する配列が選択される。一実施形態では、オフターゲットのマッチが生物のゲノムで特定されない場合、標的配列に対して配列が選択される。一実施形態では、ゲノムの調節配列においてオフターゲットの一致が特定されない場合、標的化配列が選択される。 In one aspect, the invention provides an algorithm for designing, evaluating, or selecting a dead guide RNA targeting sequence (dead guide sequence) for directing the Cas9 CRISPR-Cas system to a target locus. In particular, it was determined that the specificity of the dead guide RNA is related to and can be optimized i) the content of GC and ii) the length of the targeted sequence. In one aspect, the invention provides an algorithm for designing or evaluating a dead guide RNA target sequence that minimizes off-target binding or interaction of dead guide RNA. In one embodiment of the invention, the algorithm for selecting a dead guide RNA targeting sequence to direct a CRISPR system to a locus in an organism a) locates one or more CRISPR motifs within the locus. Then, the 20 nt sequence downstream of each CRISPR motif is i) determine the GC content of the sequence; and ii) whether there is an off-target match of the 15 downstream nucleotides closest to the CRISPR motif in the genome of the organism. And c) if the GC content of the sequence is 70% or less and no off-target match is identified, it involves analysis by selecting the 15 nucleotide sequence to be used in the dead guide RNA. In one embodiment, if the GC content is 60% or less, the sequence is selected for the target sequence. In certain embodiments, when the GC content is 55% or less, 50% or less, 45% or less, 40% or less, 35% or less or 30% or less, the sequence is selected for the target sequence. In one embodiment, two or more sequences of loci are analyzed and the sequence with the lowest GC content, or the next lowest GC content, or the next lowest GC content is selected. In one embodiment, if an off-target match is not identified in the genome of the organism, the sequence is selected for the target sequence. In one embodiment, if no off-target match is identified in the regulatory sequence of the genome, the targeting sequence is selected.

一態様では、本発明は、機能化されたCRISPR系を生物の遺伝子座に指示するためのデッドガイドRNA標的化配列を選択する方法を提供し、この方法は、a)遺伝子座に1つ以上のCRISPRモチーフを配置すること;b)各CRISPRモチーフの下流の20nt配列を次の方法:i)配列のGC含有量を決定すること;及びii)生物のゲノム内の配列の最初の15ntのオフターゲットの一致があるか否かを判断すること;c)配列のGC含有量が70%以下で、かつオフターゲット一致が特定されない場合、ガイドRNAで使用する配列を選択すること、によって分析することを包含する。一実施形態では、GC含量が50%以下である場合、配列が選択される。一実施形態では、GC含有量が40%以下である場合、配列が選択される。一実施形態では、GC含量が30%以下である場合、配列が選択される。一実施形態では、2つ以上の配列が分析され、最も低いGC含有量を有する配列が選択される。一実施形態では、オフターゲットマッチは、生物の調節配列において決定される。ある態様では、遺伝子座は調節領域である。一態様は、前述の方法に従って選択された標的化配列を含むデッドガイドRNAを提供する。 In one aspect, the invention provides a method of selecting a dead guide RNA targeting sequence for directing a functionalized CRISPR system to an organism's locus, wherein a) one or more loci. Place the CRISPR motifs of; b) 20 nt sequences downstream of each CRISPR motif as follows: i) determine the GC content of the sequence; and ii) off the first 15 nt of the sequence within the genome of the organism. Determining if there is a target match; c) If the GC content of the sequence is 70% or less and no off-target match is identified, analyze by selecting the sequence to be used in the guide RNA. Including. In one embodiment, if the GC content is 50% or less, the sequence is selected. In one embodiment, if the GC content is 40% or less, the sequence is selected. In one embodiment, if the GC content is 30% or less, the sequence is selected. In one embodiment, two or more sequences are analyzed and the sequence with the lowest GC content is selected. In one embodiment, off-target matching is determined in the regulatory sequence of the organism. In some embodiments, the locus is a regulatory region. One aspect provides a dead guide RNA containing a targeted sequence selected according to the method described above.

一態様では、本発明は、機能化されたCRISPR系を生物の遺伝子座に標的化するためのデッドガイドRNAを提供する。本発明の一実施形態では、デッドガイドRNAは、標的配列のCG含有量が70%以下であり、標的配列の最初の15ntが生物の別の遺伝子座の調節配列のCRISPRモチーフから下流のオフターゲット配列と一致しない標的配列を含む。特定の実施形態では、標的化配列のGC含量は、60%以下、55%以下、50%以下、45%以下、40%以下、35%以下または30%以下である。特定の実施形態では、標的化配列のGC含量は、70%~60%または60%~50%または50%~40%または40%~30%である。一実施形態では、標的配列は、遺伝子座の潜在的な標的配列の中で最も低いCGコンテンツを有する。 In one aspect, the invention provides a dead guide RNA for targeting a functionalized CRISPR system to an organism locus. In one embodiment of the invention, the dead guide RNA has a CG content of 70% or less in the target sequence and the first 15 nt of the target sequence is an off-target downstream from the CRISPR motif of the regulatory sequence of another locus of the organism. Contains target sequences that do not match the sequence. In certain embodiments, the GC content of the targeted sequence is 60% or less, 55% or less, 50% or less, 45% or less, 40% or less, 35% or less or 30% or less. In certain embodiments, the GC content of the targeted sequence is 70% -60% or 60% -50% or 50% -40% or 40% -30%. In one embodiment, the target sequence has the lowest CG content of any potential target sequence at the locus.

本発明の実施形態では、デッドガイドの最初の15ntは標的配列と一致する。別の実施形態では、デッドガイドの最初の14ntが標的配列と一致する。別の実施形態では、デッドガイドの最初の13ntが標的配列と一致する。別の実施形態では、デッドガイドの最初の12ntが標的配列と一致する。別の実施形態では、デッドガイドの最初の11ntが標的配列と一致する。別の実施形態では、デッドガイドの最初の10ntが標的配列と一致する。本発明の一実施形態では、デッドガイドの最初の15ntが、別の遺伝子座の調節領域内のCRISPRモチーフの下流のオフターゲット配列と一致しない。他の実施形態では、デッドガイドの最初の14nt、または最初の13nt、またはガイドの最初の12nt、またはデッドガイドの最初の11nt、またはデッドガイドの最初の10ntは、別の遺伝子座の調節領域のCRISPRモチーフの下流にあるオフターゲット配列と一致しない。他の実施形態では、デッドガイドの最初の15nt、または14nt、または13nt、または12nt、または11ntは、ゲノムのCRISPRモチーフから下流のオフターゲット配列と一致しない。 In embodiments of the invention, the first 15nt of the dead guide coincides with the target sequence. In another embodiment, the first 14 nt of the dead guide matches the target sequence. In another embodiment, the first 13nt of the dead guide matches the target sequence. In another embodiment, the first 12 nt of the dead guide matches the target sequence. In another embodiment, the first 11nt of the dead guide matches the target sequence. In another embodiment, the first 10 nt of the dead guide matches the target sequence. In one embodiment of the invention, the first 15 nt of the dead guide does not coincide with the off-target sequence downstream of the CRISPR motif within the regulatory region of another locus. In other embodiments, the first 14 nt of the dead guide, or the first 13 nt, or the first 12 nt of the guide, or the first 11 nt of the dead guide, or the first 10 nt of the dead guide is a regulatory region of another locus. Does not match the off-target sequence downstream of the CRISPR motif. In other embodiments, the first 15 nt, or 14 nt, or 13 nt, or 12 nt, or 11 nt of the dead guide does not match the off-target sequence downstream from the CRISPR motif of the genome.

特定の実施形態では、デッドガイドRNAは、標的配列と一致しない3’末端に追加のヌクレオチドを含む。したがって、CRISPRモチーフの最初の15nt、または14nt、または13nt、または12nt、または11nt下流を含むデッドガイドRNAは、3’末端の長さが12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt、20nt、またはそれ以上の長さ伸長され得る。 In certain embodiments, the dead guide RNA comprises an additional nucleotide at the 3'end that does not match the target sequence. Therefore, dead guide RNAs containing the first 15 nt, or 14 nt, or 13 nt, or 12 nt, or 11 nt downstream of the CRISPR motif have 3'end lengths of 12 nt, 13 nt, 14 nt, 15 nt, 16 nt, 17 nt, 18 nt, 19 nt. , 20 nt, or more can be extended.

本発明は、デッドCas9(dCas9)または機能化Cas9系(機能化Cas9または機能化ガイドを含み得る)を含むがこれらに限定されないCas9 CRISPR-Cas系を遺伝子座に指示する方法を提供する。一態様では、本発明は、デッドガイドRNA標的化配列を選択し、機能化されたCRISPR系を生物の遺伝子座に指示する方法を提供する。一態様では、本発明は、機能化されたCas9 CRISPR-Cas系により、デッドガイドRNA標的化配列を選択し、標的遺伝子座の遺伝子調節を達成するための方法を提供する。特定の実施形態では、この方法は、オフターゲット効果を最小限に抑えながら標的遺伝子調節をもたらすために使用される。一態様では、本発明は、機能化されたCas9 CRISPR-Cas系によって2つ以上のデッドガイドRNA標的化配列を選択し、2つ以上の標的遺伝子座の遺伝子調節を達成する方法を提供する。特定の実施形態では、この方法を使用して、オフターゲット効果を最小限に抑えながら、2つ以上の標的遺伝子座の調節を達成する。 The present invention provides a method of directing a Cas9 CRISPR-Cas system to a locus, including but not limited to a dead Cas9 (dCas9) or a functionalized Cas9 system (which may include a functionalized Cas9 or a functionalized guide). In one aspect, the invention provides a method of selecting a dead guide RNA targeting sequence and directing a functionalized CRISPR system to an organism locus. In one aspect, the invention provides a method for selecting a dead guide RNA targeting sequence and achieving gene regulation of a target locus by a functionalized Cas9 CRISPR-Cas system. In certain embodiments, this method is used to result in target gene regulation with minimal off-target effects. In one aspect, the invention provides a method of selecting two or more dead guide RNA targeting sequences by a functionalized Cas9 CRISPR-Cas system to achieve gene regulation of two or more target loci. In certain embodiments, this method is used to achieve regulation of two or more target loci while minimizing off-target effects.

一態様では、本発明は、機能化Cas9を生物の遺伝子座に向けるためのデッドガイドRNA標的化配列を選択する方法を提供し、この方法は、以下:a)遺伝子座に1つ以上のCRISPRモチーフを配置すること;b)各CRISPRモチーフの下流の配列を、i)CRISPRモチーフに隣接する10から15ntを選択することし、ii)この配列のGC含有量を決定すること;及びc)この配列のGC含有量が40%以上の場合、ガイドRNAで使用する標的化配列として10~15ntの配列を選択すること、によって分析すること、を含む。一実施形態では、GC含有量が50%以上である場合、配列が選択される。一実施形態では、GC含有量が60%以上である場合、配列が選択される。一実施形態では、GC含有量が70%以上である場合、配列が選択される。一実施形態では、2つ以上の配列が分析され、最高のGC含量を有する配列が選択される。一実施形態では、この方法は、CRISPRモチーフの下流の配列と一致しない選択された配列の3’末端にヌクレオチドを追加することをさらに含む。一態様は、前述の方法に従って選択された標的化配列を含むデッドガイドRNAを提供する。 In one aspect, the invention provides a method of selecting a dead guide RNA targeting sequence for directing functionalized Cas9 to an organism's locus, which method: a) one or more CRISPRs at the locus. Placing the motifs; b) the downstream sequence of each CRISPR motif, i) selecting 10 to 15 nt adjacent to the CRISPR motif, ii) determining the GC content of this sequence; and c) this. When the GC content of the sequence is 40% or more, it comprises analyzing by selecting a sequence of 10-15 nt as the targeting sequence used in the guide RNA. In one embodiment, if the GC content is 50% or greater, the sequence is selected. In one embodiment, if the GC content is 60% or higher, the sequence is selected. In one embodiment, if the GC content is 70% or higher, the sequence is selected. In one embodiment, two or more sequences are analyzed and the sequence with the highest GC content is selected. In one embodiment, the method further comprises adding a nucleotide to the 3'end of a selected sequence that does not match the sequence downstream of the CRISPR motif. One aspect provides a dead guide RNA containing a targeted sequence selected according to the method described above.

一態様では、本発明は、機能化されたCRISPR系を生物の遺伝子座に指示するためのデッドガイドRNAを提供し、デッドガイドRNAの標的配列は、遺伝子座のCRISPRモチーフに隣接する10~15ヌクレオチドからなり、ここで標的配列のCG含量は50%以上である。特定の実施形態では、デッドガイドRNAは、遺伝子座のCRISPRモチーフの下流の配列と一致しない標的化配列の3’末端に付加されたヌクレオチドをさらに含む。 In one aspect, the invention provides a dead guide RNA for directing a functionalized CRISPR system to an organism's locus, where the target sequence of the dead guide RNA is 10-15 flanking the CRISPR motif of the locus. It consists of nucleotides, where the CG content of the target sequence is greater than or equal to 50%. In certain embodiments, the dead guide RNA further comprises a nucleotide added to the 3'end of a targeting sequence that does not match the sequence downstream of the CRISPR motif at the locus.

一態様では、本発明は、1つ以上、または2つ以上の遺伝子座に誘導される単一のエフェクターを提供する。特定の実施形態では、このエフェクターはCas9に関連付けられ、1つ以上、または2つ以上の選択されたデッドガイドRNAを使用して、Cas9関連エフェクターを1つ以上、または2つ以上の選択された標的遺伝子座に指示する。特定の実施形態では、このエフェクターは、Cas9酵素と複合体を形成した場合、それぞれが選択されたデッドガイドRNAである1つ以上、または2つ以上の選択されたデッドガイドRNAと関連付けられ、その関連付けられたエフェクターをデッドガイドRNA標的に局在化させる。そのようなCRISPR系の1つの非限定的な例は、同じ転写因子による調節を受ける1つ以上、または2つ以上の遺伝子座の活性を調節する。 In one aspect, the invention provides a single effector that is induced at one or more, or two or more loci. In certain embodiments, the effector is associated with Cas9, and one or more, or two or more selected dead guide RNAs are used to select one or more Cas9-related effectors. Instruct the target locus. In certain embodiments, the effector, when complexed with the Cas9 enzyme, is associated with one or more or two or more selected dead guide RNAs, each of which is a selected dead guide RNA. Localize the associated effector to a dead guide RNA target. One non-limiting example of such a CRISPR system regulates the activity of one or more or two or more loci that are regulated by the same transcription factor.

一態様では、本発明は、1つ以上の遺伝子座に誘導される2つ以上のエフェクターを提供する。特定の実施形態では、2つ以上のデッドガイドRNAを使用し、2つ以上のエフェクターのそれぞれが、選択されたデッドガイドRNAに関連付けられ、2つ以上のエフェクターのそれぞれがそのデッドガイドRNAの選択された標的に局在される。そのようなCRISPR系の1つの非限定的な例は、異なる転写因子による調節を受ける1つ以上、または2つ以上の遺伝子座の活性を調節する。したがって、1つの非限定的な実施形態では、2つ以上の転写因子は、単一の遺伝子の異なる調節配列に局在化される。別の非限定的な実施形態では、2つ以上の転写因子は、異なる遺伝子の異なる調節配列に局在化される。特定の実施形態では、1つの転写因子は活性化因子である。特定の実施形態では、1つの転写因子は阻害剤である。特定の実施形態では、1つの転写因子は活性化因子であり、かつ別の転写因子は阻害剤である。特定の実施形態では、同じ調節経路の異なる構成要素を発現する遺伝子座が調節される。特定の実施形態では、異なる調節経路の構成要素を発現する遺伝子座が調節される。 In one aspect, the invention provides two or more effectors that are directed to one or more loci. In certain embodiments, two or more dead guide RNAs are used, each of the two or more effectors is associated with a selected dead guide RNA, and each of the two or more effectors is a selection of that dead guide RNA. Localized to the targeted target. One non-limiting example of such a CRISPR system regulates the activity of one or more or two or more loci that are regulated by different transcription factors. Thus, in one non-limiting embodiment, two or more transcription factors are localized to different regulatory sequences of a single gene. In another non-limiting embodiment, two or more transcription factors are localized to different regulatory sequences of different genes. In certain embodiments, one transcription factor is an activator. In certain embodiments, one transcription factor is an inhibitor. In certain embodiments, one transcription factor is an activator and another is an inhibitor. In certain embodiments, loci expressing different components of the same regulatory pathway are regulated. In certain embodiments, loci expressing components of different regulatory pathways are regulated.

ある態様では、本発明はまた、活性なCas9 CRISPR-Cas系により媒介される標的DNA切断または標的結合及び遺伝子調節に特異的なデッドガイドRNAを設計及び選択するための方法及びアルゴリズムを提供する。特定の実施形態では、Cas9 CRISPR-Cas系は、1つの遺伝子座で標的DNAを切断すると同時に別の遺伝子座に結合して調節を促進する活性Cas9を使用した直交遺伝子制御を提供する。 In some embodiments, the invention also provides methods and algorithms for designing and selecting dead guide RNAs specific for target DNA cleavage or target binding and gene regulation mediated by the active Cas9 CRISPR-Cas system. In certain embodiments, the Cas9 CRISPR-Cas system provides orthogonal gene regulation using active Cas9 that cleaves the target DNA at one locus and at the same time binds to another locus to promote regulation.

ある態様では、本発明は、機能化Cas9を切断せずに生物の遺伝子座に指示するためのデッドガイドRNA標的化配列を選択する方法を提供し、これは、a)遺伝子座に1つ以上のCRISPRモチーフを配置すること;b)各CRISPRモチーフの下流の配列を、i)CRISPRモチーフに隣接する10から15ntを選択すること、ii)配列のGC含有量を決定することによって、分析すること;c)配列のGC含有量が30%以上、40%以上の場合、デッドガイドRNAで使用する標的化配列として10~15nt配列を選択することを含む。特定の実施形態では、標的化配列のGC含量は、35%以上、40%以上、45%以上、50%以上、55%以上、60%以上、65%以上、または70%以上である。特定の実施形態では、標的化配列のGC含量は、30%~40%または40%~50%または50%~60%または60%~70%である。本発明の一実施形態では、遺伝子座の2つ以上の配列を分析し、最高のGC含量を有する配列を選択する。 In some embodiments, the invention provides a method of selecting a dead guide RNA targeting sequence for directing to an organism's locus without cleaving functionalized Cas9, which a) one or more at the locus. CRISPR motifs are placed; b) downstream sequences of each CRISPR motif are analyzed by i) selecting 10 to 15 nt adjacent to the CRISPR motif, ii) determining the GC content of the sequence. C) When the GC content of the sequence is 30% or more and 40% or more, it includes selecting a 10 to 15 nt sequence as the targeting sequence to be used in the dead guide RNA. In certain embodiments, the GC content of the targeted sequence is 35% or greater, 40% or greater, 45% or greater, 50% or greater, 55% or greater, 60% or greater, 65% or greater, or 70% or greater. In certain embodiments, the GC content of the targeted sequence is 30% -40% or 40% -50% or 50% -60% or 60% -70%. In one embodiment of the invention, two or more sequences of loci are analyzed and the sequence with the highest GC content is selected.

本発明のある実施形態では、GC含量が評価される標的配列の部分は、PAMに最も近い15個の標的ヌクレオチドの10~15個の連続したヌクレオチドである。本発明のある実施形態では、ガイドの一部はGC含有量がPAMに最も近い15個のヌクレオチドのうち10~11ヌクレオチドまたは11~12ヌクレオチドまたは12~13ヌクレオチド、または13もしくは14もしくは15連続ヌクレオチドであるとみなされる。 In one embodiment of the invention, the portion of the target sequence for which the GC content is assessed is 10-15 contiguous nucleotides of the 15 target nucleotides closest to PAM. In certain embodiments of the invention, some of the guides are 10-11 nucleotides or 11-12 nucleotides or 12-13 nucleotides out of the 15 nucleotides with the closest GC content to PAM, or 13 or 14 or 15 contiguous nucleotides. Is considered to be.

一態様では、本発明はさらに、機能的活性化または機能的阻害を回避しながら、CRISPR系遺伝子座切断を促進するデッドガイドRNAを同定するためのアルゴリズムを提供する。16~20ヌクレオチドのデッドガイドRNAのGC含量の増大は、DNA切断の増大と機能的活性化の減少と一致することが観察されている。 In one aspect, the invention further provides an algorithm for identifying dead guide RNAs that promote CRISPR locus cleavage while avoiding functional activation or inhibition. It has been observed that an increase in GC content of 16-20 nucleotide dead guide RNA is consistent with an increase in DNA cleavage and a decrease in functional activation.

本明細書では、CRISPRモチーフの下流の標的配列と一致しないガイドRNAの3’末端にヌクレオチドを付加することにより、機能化Cas9の効率が増大され得ることも実証されている。例えば、長さが11~15ntのデッドガイドRNAの場合、ガイドが短いほど標的切断を促進する可能性が低くなる場合があるが、CRISPR系の結合と機能制御を促進する効率も低下し得る。特定の実施形態では、標的配列と一致しないヌクレオチドの追加を、デッドガイドRNAの3’末端に追加すると、活性化効率が増大するが、望ましくない標的切断は増大しない。ある態様では、本発明はまた、DNA結合及び遺伝子調節におけるCRISPRP系機能を効果的に促進し、DNA切断を促進しない、改善されたデッドガイドRNAを同定するための方法及びアルゴリズムを提供する。したがって、特定の実施形態では、本発明は、CRISPRモチーフの最初の15nt、または14nt、または13nt、または12nt、または11ntの下流を含み、標的を12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt、20nt、またはそれ以上にミスマッチするヌクレオチドによって3’末端で長さが伸長しているデッドガイドRNAを提供する。 It is also demonstrated herein that the efficiency of functionalized Cas9 can be increased by adding nucleotides to the 3'end of the guide RNA that does not match the target sequence downstream of the CRISPR motif. For example, in the case of a dead guide RNA having a length of 11 to 15 nt, the shorter the guide, the less likely it is to promote target cleavage, but the efficiency of promoting binding and functional control of the CRISPR system may also decrease. In certain embodiments, the addition of nucleotides that do not match the target sequence to the 3'end of the dead guide RNA increases activation efficiency, but does not increase unwanted target cleavage. In some embodiments, the invention also provides methods and algorithms for identifying improved dead guide RNAs that effectively promote CRISPRP system functions in DNA binding and gene regulation and do not promote DNA cleavage. Thus, in certain embodiments, the invention comprises the first 15 nt, or 14 nt, or 13 nt, or 12 nt, or 11 nt downstream of the CRISPR motif and targets 12 nt, 13 nt, 14 nt, 15 nt, 16 nt, 17 nt, 18 nt. , 19 nt, 20 nt, or more mismatched nucleotides provide a dead guide RNA whose length is extended at the 3'end.

一態様では、本発明は、選択的直交遺伝子制御を実施する方法を提供する。本明細書の開示から理解されるように、本発明によるデッドガイド選択は、ガイド長及びGC含量を考慮すれば、例えば活性化または阻害により遺伝子座の転写を調節するための機能的Cas9 CRISPR-Cas系による効果的かつ選択的な転写制御を提供し、オフターゲット効果を最小限に抑える。したがって、本発明は、個々の標的遺伝子座の効果的な調節を提供することにより、2つ以上の標的遺伝子座の効果的な直交調節も提供する。 In one aspect, the invention provides a method of performing selective orthogonal gene regulation. As understood from the disclosure herein, the dead guide selection according to the invention is a functional Cas9 CRISPR-for regulating locus transcription, eg, by activation or inhibition, given the guide length and GC content. It provides effective and selective transcriptional control by the Cas system and minimizes off-target effects. Accordingly, the present invention also provides effective orthogonal regulation of two or more target loci by providing effective regulation of individual target loci.

特定の実施形態では、直交遺伝子制御は、2つ以上の標的遺伝子座の活性化または阻害によるものである。特定の実施形態では、直交遺伝子制御は、1つ以上の標的遺伝子座の活性化または阻害、及び1つ以上の標的遺伝子座の切断によるものである。 In certain embodiments, orthogonal gene regulation is by activation or inhibition of two or more target loci. In certain embodiments, orthogonal gene regulation is by activation or inhibition of one or more target loci, and cleavage of one or more target loci.

一態様では、本発明は、1つ以上の遺伝子産物の発現が変更されている、本明細書に記載の方法またはアルゴリズムに従って開示または作製された1つ以上のデッドガイドRNAを含む天然には存在しないCas9 CRISPR-Cas系を含む細胞を提供する。本発明の一実施形態では、2つ以上の遺伝子産物の細胞内での発現が変更されている。本発明はまた、そのような細胞由来の細胞株を提供する。 In one aspect, the invention is naturally present, comprising one or more dead guide RNAs disclosed or made according to the methods or algorithms described herein in which the expression of one or more gene products has been altered. Don't provide cells containing the Cas9 CRISPR-Cas system. In one embodiment of the invention, the intracellular expression of two or more gene products is altered. The present invention also provides cell lines derived from such cells.

一態様では、本発明は、本明細書に記載の方法またはアルゴリズムに従って開示または作製された1つ以上のデッドガイドRNAを含む天然には存在しないCas9 CRISPR-Cas系を含む1つ以上の細胞を含む多細胞生物を提供する。一態様では、本発明は、本明細書に記載の方法またはアルゴリズムに従って開示または作製された1つ以上のデッドガイドRNAを含む天然には存在しないCas9 CRISPR-Cas系を含む細胞、細胞株、または多細胞生物由来の産物を提供する。 In one aspect, the invention comprises one or more cells comprising a non-naturally occurring Cas9 CRISPR-Cas system comprising one or more dead guide RNAs disclosed or made according to the methods or algorithms described herein. Provides multicellular organisms, including. In one aspect, the invention is a cell, cell line, or cell line comprising a non-naturally occurring Cas9 CRISPR-Cas system comprising one or more dead guide RNAs disclosed or made according to the methods or algorithms described herein. Provides products derived from multicellular organisms.

本発明のさらなる態様は、本明細書に記載のデッドガイド(複数可)を含むgRNAの使用であり、任意選択で本明細書に記載の、または最新技術におけるガイド(複数可)を含むgRNAと組み合わせた、系、例えば、細胞、トランスジェニック動物、トランスジェニックマウス、誘導性トランスジェニック動物、誘導性トランスジェニックマウス(Cas9の過剰発現または好ましくはCas9のノックインのいずれかために操作されている)と組み合わせた使用である。結果として、単一の系(例えば、トランスジェニック動物、細胞)が、系/ネットワーク生物学における多重遺伝子改変の基礎として機能し得る。デッドガイドの理由で、これはいまやインビトロ、エクスビボ、インビボの両方で可能である。 A further aspect of the invention is the use of a gRNA comprising the dead guides (s) described herein, optionally with a gRNA comprising the guides (s) described herein or in the latest art. Combined systems such as cells, transgenic animals, transgenic mice, inducible transgenic animals, inducible transgenic mice (manipulated for either overexpression of Cas9 or preferably knock-in of Cas9). Combined use. As a result, a single system (eg, transgenic animals, cells) can serve as the basis for multiple genetic modification in system / network biology. For dead guide reasons, this is now possible both in vitro, in vivo and in vivo.

例えば、一旦、Cas9が提供されれば、多重遺伝子調節、好ましくは多重双方向遺伝子調節を指示するために、1つ以上のデッドgRNAが提供され得る。1つ以上のデッドgRNAは、必要または望ましい場合(例えば、Cas9発現の組織特異的誘導)、空間的及び時間的に適切な方法で提供され得る。目的の細胞、組織、動物にトランスジェニック/誘導性Cas9が提供される(例えば、発現される)という理由で、デッドガイドを含むgRNAまたはガイドを含むgRNAの両方が等しく効果的である。同様に、本発明のさらなる態様は、本明細書に記載のデッドガイド(複数可)を含むgRNAを、任意選択では、本明細書に記載のガイド(複数可)を含むgRNAと組み合わせて、または最新技術で、ノックアウトCas9 CRISPR-Cas用に設計されている系(例えば、細胞、トランスジェニック動物、トランスジェニックマウス、誘導性トランスジェニック動物、誘導性トランスジェニックマウス)と組み合わせて使用する。 For example, once Cas9 is provided, one or more dead gRNAs may be provided to direct multiple gene regulation, preferably multiple bidirectional gene regulation. One or more dead gRNAs can be provided in a spatially and temporally appropriate manner where necessary or desirable (eg, tissue-specific induction of Cas9 expression). Both gRNAs containing dead guides or gRNAs containing guides are equally effective because the transgenic / inducible Cas9 is provided (eg, expressed) to the cells, tissues, and animals of interest. Similarly, a further aspect of the invention is a gRNA comprising a dead guide (s) described herein, optionally in combination with a gRNA comprising a guide (s) described herein, or. It is used in combination with the latest technology and systems designed for knockout Cas9 CRISPR-Cas (eg cells, transgenic animals, transgenic mice, inducible transgenic animals, inducible transgenic mice).

結果として、本明細書に記載のデッドガイドと本明細書に記載のCRISPR用途及び当該技術分野で公知のCRISPR用途との組み合わせは、系(例えば、ネットワーク生物学)の多重スクリーニングのための非常に効率的かつ正確な手段をもたらす。そのようなスクリーニングにより、例えば、疾患(例えば、オン/オフの組み合わせ)、特に遺伝子関連疾患の原因となる遺伝子を特定するための遺伝子活性の特定の組み合わせの特定が可能になる。そのようなスクリーニングの好ましい用途は癌である。同様に、そのような疾患の治療のスクリーニングも本発明に含まれる。細胞または動物は異常な状態にさらされ、疾患または病的な影響が生じる場合がある。候補組成物を提供し、所望の多重環境での効果についてスクリーニングしてもよい。例えば、どの遺伝子の組み合わせによって死に至るかについて患者のがん細胞をスクリーニングし、この情報を使用して適切な治療法を確立してもよい。 As a result, the combination of the dead guides described herein with the CRISPR applications described herein and the CRISPR applications known in the art is highly for multiple screening of systems (eg, network biology). It provides efficient and accurate means. Such screening allows, for example, to identify specific combinations of gene activity to identify diseases (eg, on / off combinations), especially genes responsible for gene-related diseases. A preferred use for such screening is cancer. Similarly, screening for the treatment of such diseases is also included in the invention. Cells or animals are exposed to abnormal conditions and may have disease or pathological effects. Candidate compositions may be provided and screened for efficacy in the desired multiple environment. For example, a patient's cancer cells may be screened for which gene combination leads to death and this information may be used to establish appropriate treatments.

一態様では、本発明は、本明細書に記載の構成要素の1つ以上を含むキットを提供する。このキットは、本明細書に記載のガイドの有無にかかわらず、本明細書に記載のデッドガイドを含んでもよい。 In one aspect, the invention provides a kit comprising one or more of the components described herein. The kit may include the dead guides described herein with or without the guides described herein.

本明細書で提供される構造情報は、標的DNA及びCas9とのデッドgRNA相互作用の調査を可能にし、デッドgRNA構造の操作または改変を可能にして、Cas9 CRISPR-Cas系全体の機能を最適化する。例えば、RNAに結合し得るアダプタータンパク質を挿入することにより、Cas9タンパク質と衝突することなく、デッドgRNAのループを延長してもよい。これらのアダプタータンパク質は、1つ以上の機能的ドメインを含むエフェクタータンパク質または融合体をさらにリクルートしてもよい。 The structural information provided herein allows the investigation of dead gRNA interactions with the target DNA and Cas9, allowing manipulation or modification of the dead gRNA structure and optimizing the functionality of the entire Cas9 CRISPR-Cas system. do. For example, by inserting an adapter protein that can bind to RNA, the loop of dead gRNA may be extended without colliding with the Cas9 protein. These adapter proteins may further recruit effector proteins or fusions containing one or more functional domains.

いくつかの好ましい実施形態では、機能的ドメインは転写活性化ドメイン、好ましくはVP64である。いくつかの実施形態では、機能的ドメインは、転写抑制ドメイン、好ましくはKRABである。いくつかの実施形態では、転写抑制ドメインは、SID、またはSIDのコンカテマー(例えば、SID4X)である。いくつかの実施形態では、機能的ドメインは、後成的改変ドメインであり、その結果、後成的改変酵素が提供される。いくつかの実施形態では、機能的ドメインは、活性化ドメインであり、これはP65活性化ドメインであってもよい。 In some preferred embodiments, the functional domain is a transcriptionally activated domain, preferably VP64. In some embodiments, the functional domain is a transcriptional repression domain, preferably KRAB. In some embodiments, the transcriptional repression domain is a SID, or a concatemer of the SID (eg, SID4X). In some embodiments, the functional domain is an epigenetic modification domain, which results in the provision of an epigenetic modification enzyme. In some embodiments, the functional domain is the activation domain, which may be the P65 activation domain.

本発明の態様は、上記の要素が単一の組成物に含まれるか、または個々の組成物に含まれることである。これらの組成物は、有利には、ゲノムレベルで機能的効果を引き出すために宿主に適用され得る。 Aspects of the invention are that the above elements are included in a single composition or in individual compositions. These compositions may advantageously be applied to the host to elicit a functional effect at the genomic level.

一般に、デッドgRNAは、結合する1つ以上の機能的ドメインを含むアダプタータンパク質(例えば融合タンパク質を介して)に特異的な結合部位(例えばアプタマー)を提供する方法で改変される。改変されたデッドgRNAは、そのデッドgRNAがCRISPR複合体を形成すると(すなわち、Cas9がデッドgRNAと標的に結合すると)アダプタータンパク質が結合し、アダプタータンパク質の機能ドメインが、属性付き関数が有効であるのに有利な空間配向に配置されるように改変される。例えば、機能的ドメインが転写活性化因子(例えば、VP64またはp65)である場合、転写活性化因子は、標的の転写に影響を与えることを可能にする空間的な向きに配置される。同様に、転写抑制因子は、標的の転写に影響を及ぼすように有利に配置され、ヌクレアーゼ(例えば、Fok1)は、標的を切断または部分的に切断するように有利に配置される。 In general, dead gRNAs are modified in a manner that provides a binding site (eg, an aptamer) specific for an adapter protein (eg, via a fusion protein) that contains one or more functional domains that bind. The modified dead gRNA is bound to the adapter protein when the dead gRNA forms a CRISPR complex (ie, when Cas9 binds to the dead gRNA to the target), and the functional domain of the adapter protein is valid for the attributed function. It is modified so that it is arranged in a spatial orientation that is favorable to the protein. For example, if the functional domain is a transcriptional activator (eg, VP64 or p65), the transcriptional activator is spatially oriented to allow it to influence the transcription of the target. Similarly, transcriptional repressors are favorably placed to affect the transcription of the target, and nucleases (eg, Fok1) are favorably placed to cleave or partially cleave the target.

当業者は、アダプター+機能的ドメインの結合を可能にするが、アダプター+機能的ドメインの適切な位置決めは可能にしない(例えば、CRISPR複合体の三次元構造内の立体障害に起因する)デッドgRNAに対する改変が、意図しない改変であることを理解する。本明細書に記載されているように、1つ以上の改変されたデッドgRNAは、テトラループ、ステムループ1、ステムループ2、またはステムループ3、好ましくはテトラループまたはステムループ2、最も好ましくはテトラループ及びステムループ2の両方で改変されてもよい。 Those of skill in the art allow binding of adapters + functional domains, but do not allow proper positioning of adapters + functional domains (eg, due to steric hindrance within the three-dimensional structure of the CRISPR complex). Understand that the modification to is an unintended modification. As described herein, the one or more modified dead gRNAs are tetraloop, stemloop 1, stemloop 2, or stemloop 3, preferably tetraloop or stemloop 2, most preferably. It may be modified with both tetraloop and stemloop 2.

本明細書で説明されるように、機能的ドメインは、例えば、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン改変活性、RNA切断活性、DNA切断活性、核酸結合活性、及び分子スイッチ(例、光誘導性)からなる群由来の1つ以上のドメインであり得る。場合によっては、さらに少なくとも1つのNLSが提供されることが有利である。場合によっては、NLSをN末端に配置することが有利である。2つ以上の機能ドメインが含まれる場合、その機能ドメインは同じであっても異なっていてもよい。 As described herein, functional domains include, for example, methylase activity, demethylase activity, transcriptional activation activity, transcriptional repressive activity, transcriptional release factor activity, histone modification activity, RNA cleavage activity, DNA cleavage activity, nucleic acid. It can be one or more domains from the group consisting of binding activity and molecular switches (eg, photoinducible). In some cases, it is advantageous to further provide at least one NLS. In some cases, it is advantageous to place the NLS at the N-terminus. When two or more functional domains are included, the functional domains may be the same or different.

デッドgRNAは、同じまたは異なるアダプタータンパク質に特異的な複数の結合認識部位(例えば、アプタマー)を含むように設計してもよい。デッドgRNAは、転写開始部位(すなわち、TSS)の上流の-1000-+1核酸、好ましくは-200核酸のプロモーター領域に結合するように設計してもよい。この配置により、遺伝子の活性化(例えば、転写活性化因子)または遺伝子の阻害(例えば、転写抑制因子)に影響する機能ドメインが改善される改変されたデッドgRNAは、組成物に含まれる、1つ以上の標的遺伝子座を標的とする1つ以上の改変されたデッドgRNA(例えば、少なくとも1gRNA、少なくとも2gRNA、少なくとも5gRNA、少なくとも10gRNA、少なくとも20gRNA、少なくとも30gRNA、少なくとも50gRNA)であってもよい。 The dead gRNA may be designed to contain multiple binding recognition sites (eg, aptamers) specific for the same or different adapter proteins. The dead gRNA may be designed to bind to the promoter region of the -1000- + 1 nucleic acid, preferably -200 nucleic acid, upstream of the transcription initiation site (ie, TSS). A modified dead gRNA that improves the functional domain that affects gene activation (eg, transcriptional activator) or gene inhibition (eg, transcriptional repressor) by this arrangement is included in the composition. It may be one or more modified dead gRNAs targeting one or more target loci (eg, at least 1 gRNA, at least 2 gRNA, at least 5 gRNA, at least 10 gRNA, at least 20 gRNA, at least 30 gRNA, at least 50 gRNA).

アダプタータンパク質は、改変されたデッドgRNAに導入されたアプタマーまたは認識部位に結合し、1つ以上の機能的ドメインの適切な位置決めを可能にする任意の数のタンパク質であり得、一旦デッドgRNAがCRISPR複合体に組み込まれると、属性付き関数で標的に影響を与える。本出願で詳細に説明されるように、それはコートタンパク質、好ましくはバクテリオファージコートタンパク質であってもよい。そのようなアダプタータンパク質(例えば、融合タンパク質の形態)に関連する機能的ドメインとしては、例えば、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン改変活性、RNA切断活性、DNA切断活性、核酸結合活性、及び分子スイッチ(例えば、光誘導性など)からなる群由来の1つ以上のドメインが含まれ得る。好ましいドメインは、Fok1、VP64、P65、HSF1、MyoD1である。機能的ドメインが転写活性化因子または転写抑制因子である場合、少なくともNLSが、好ましくはN末端にさらに提供されることが有利である。2つ以上の機能ドメインが含まれる場合、その機能ドメインは同じであっても異なっていてもよい。アダプタータンパク質は、公知のリンカーを利用してそのような機能的ドメインを結合する場合がある。 The adapter protein can be any number of proteins that bind to an aptamer or recognition site introduced into a modified dead gRNA and allow proper positioning of one or more functional domains, once the dead gRNA is a CRISPR. When incorporated into a complex, it affects the target with an attributed function. As described in detail in this application, it may be a coat protein, preferably a bacteriophage coat protein. Functional domains associated with such adapter proteins (eg, fusion protein morphology) include, for example, methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcriptional release factor activity, histone modification activity, RNA cleavage. It may include one or more domains from the group consisting of activity, DNA cleavage activity, nucleic acid binding activity, and molecular switch (eg, photoinducible, etc.). Preferred domains are Fok1, VP64, P65, HSF1 and MyoD1. If the functional domain is a transcriptional activator or transcriptional repressor, it is advantageous that at least NLS is preferably further donated to the N-terminus. When two or more functional domains are included, the functional domains may be the same or different. Adapter proteins may utilize known linkers to bind such functional domains.

Tしたがって、改変されたデッドgRNA、(不活性化された)Cas9(機能的ドメインを伴うかまたは伴わない)、及び1つ以上の機能的ドメインを伴う結合タンパク質は、それぞれ個別に組成物に含まれ、個別にまたは集合的に宿主に投与され得る。あるいは、これらの構成要素は、宿主への投与のために単一の組成物で提供されてもよい。宿主への投与は、当業者に公知であるか、または宿主への送達について本明細書に記載されているウイルスベクター(例えば、レンチウイルスベクター、アデノウイルスベクター、AAVベクター)を介して実施され得る。本明細書で説明されるように、異なる選択マーカーの使用(例えば、レンチウイルスgRNA選択のため)及びgRNAの濃度(例えば、複数のgRNAが使用されるか否かに依存する)は、改善された効果を引き出すために有利であり得る。 Therefore, the modified dead gRNA, Cas9 (with or without functional domain) (with or without functional domain), and the binding protein with one or more functional domains are each individually included in the composition. It can be administered to the host individually or collectively. Alternatively, these components may be provided in a single composition for administration to a host. Administration to the host can be performed via viral vectors known to those of skill in the art or described herein for delivery to the host (eg, lentiviral vector, adenoviral vector, AAV vector). .. As described herein, the use of different selectable markers (eg, for lentiviral gRNA selection) and the concentration of gRNA (eg, depending on whether multiple gRNAs are used) are improved. It can be advantageous to bring out the effect.

この概念に基づいて、DNA切断、遺伝子活性化、または遺伝子不活性化を含むいくつかのバリエーションが、ゲノム遺伝子座事象を誘発するのに適切である。提供された組成物を使用して、当業者は、有利にかつ特異的に、同一または異なる機能的ドメインを有する単一または複数の遺伝子座を標的として、1つ以上のゲノム遺伝子座事象を誘発し得る。組成物は、細胞内のライブラリーでのスクリーニング及びインビボでの機能モデリング(例えば、lincRNAの遺伝子活性化及び機能の同定;機能獲得モデリング;機能喪失モデリング;最適化及びスクリーニングの目的で細胞株及びトランスジェニック動物を確立するための本発明の組成物の使用)のために、広範な種々の方法に適用され得る。 Based on this concept, several variations, including DNA cleavage, gene activation, or gene inactivation, are suitable for inducing genomic locus events. Using the provided composition, one of ordinary skill in the art will advantageously and specifically induce one or more genomic locus events by targeting a single or multiple loci having the same or different functional domains. Can be. The compositions are screened in an intracellular library and functional modeling in vivo (eg, gene activation and functional identification of lincRNA; functional acquisition modeling; loss of function modeling; cell lines and trans for optimization and screening purposes. It can be applied to a wide variety of methods for the use of the compositions of the invention to establish a genetic animal).

本発明は、本発明または出願の前には考えられていなかった、条件付きまたは誘導性CRISPRトランスジェニック細胞/動物を確立及び利用するための本発明の組成物の使用を包含する。例えば、標的細胞は、条件付きでまたは誘導的に(例えば、Cre依存性構築物の形態で)Cas9を、及び/または条件的にもしくは誘導的にアダプタータンパク質を含み、標的細胞に導入されるベクターの発現時に、ベクターは標的細胞におけるCas9発現及び/またはアダプター発現の状態を誘導または引き起こすものを発現する。本発明の教示及び組成物を、CRISPR複合体を作成する公知の方法に適用することにより、機能的ドメインにより影響を受ける誘導性ゲノム事象も、本発明の態様である。この一例は、CRISPRノックイン/条件付きトランスジェニック動物(例えば、Lox-Stop-polyA-Lox(LSL)カセットを含むマウス)の作成、ならびに本明細書に記載される、1つ以上の改変されたデッドgRNAを提供する1つ以上の組成物のその後の送達である(例えば、遺伝子活性化の目的で目的の標的遺伝子のTSSに約-200ヌクレオチド)(例えば、MS2などのコートタンパク質によって認識される1つ以上のアプタマーを含む改変されたデッドgRNA)、本明細書に記載の1つ以上のアダプタータンパク質(1つ以上のVP64に連結されたMS2結合タンパク質)及び条件付き動物を誘導するための手段(例えば、Cas9発現を誘導可能にするためのCreリコンビナーゼ)である。あるいは、アダプタータンパク質は、条件付きまたは誘導可能なCas9を備えた条件付きまたは誘導可能な要素として提供されて、スクリーニング目的に効果的なモデルを提供し得、これは、多数の用途で特定のデッドgRNAの最小限の設計及び投与しか必要としないことが有利である。 The invention includes the use of the compositions of the invention for establishing and utilizing conditional or inducible CRISPR transgenic cells / animals that were not considered prior to the invention or filing. For example, the target cell contains Cas9 conditionally or inducibly (eg, in the form of a Cre-dependent construct) and / or conditionally or inductively contains an adapter protein of a vector that is introduced into the target cell. Upon expression, the vector expresses what induces or triggers the state of Cas9 expression and / or adapter expression in the target cell. Induced genomic events that are affected by functional domains by applying the teachings and compositions of the invention to known methods of creating CRISPR complexes are also embodiments of the invention. An example of this is the creation of a CRISPR knock-in / conditional transgenic animal (eg, a mouse comprising a Lux-Stop-polyA-Lox (LSL) cassette), as well as one or more modified dead described herein. Subsequent delivery of one or more compositions that provide gRNA (eg, about -200 nucleotides to the TSS of the target gene of interest for gene activation) (eg, recognized by a coat protein such as MS2 1). Modified dead gRNAs containing one or more aptamers), one or more adapter proteins described herein (MS2-binding proteins linked to one or more VP64s) and means for inducing conditional animals ( For example, Cre recombinase to make Cas9 expression inducible. Alternatively, the adapter protein may be provided as a conditional or inducible element with a conditional or inducible Cas9 to provide an effective model for screening purposes, which is a particular dead in a number of applications. It is advantageous that it requires minimal design and administration of gRNA.

別の態様では、特異性を改善するためにデッドガイドがさらに改変される。保護されたデッドガイドを合成してもよく、これにより、デッドガイドの3’末端に二次構造が導入され、特異性が改善される。保護されたガイドRNA(pgRNA)は、細胞内の目的のゲノム遺伝子座の標的配列にハイブリダイズし得るガイド配列、及びプロテクター鎖を含み、このプロテクター鎖は任意選択でガイド配列に相補的であり、このガイド配列は、一部はプロテクター鎖にハイブリダイズ可能であり得る。pgRNAには任意選択で拡張配列が含まれる。pgRNA-標的DNAハイブリダイゼーションの熱力学は、ガイドRNAと標的DNAとの間の相補的な塩基の数によって決定される。「熱力学的保護」を採用すれば、プロテクター配列を追加することにより、デッドgRNAの特異性が改善され得る。例えば、1つの方法では、様々な長さの相補的なプロテクター鎖を、デッドgRNA内のガイド配列の3’末端に追加する。その結果、プロテクター鎖は、デッドgRNAの少なくとも一部に結合し、保護されたgRNA(pgRNA)を提供する。次に、本明細書のデッドgRNA参照は、記載された実施形態を使用して容易に保護され得、その結果pgRNAがもたらされる。プロテクター鎖は、別個のRNA転写物、またはデッドgRNAガイド配列の3’末端に結合した鎖もしくはキメラ型のいずれであってもよい。 In another aspect, the dead guide is further modified to improve specificity. Protected dead guides may be synthesized, which introduces secondary structure at the 3'end of the dead guides and improves specificity. The protected guide RNA (pgRNA) contains a guide sequence that can hybridize to the target sequence of the genomic locus of interest in the cell, and a protector strand, which is optionally complementary to the guide sequence. This guide sequence may be partially hybridizable to the protector chain. The pgRNA optionally contains extended sequences. The thermodynamics of pgRNA-target DNA hybridization is determined by the number of complementary bases between the guide RNA and the target DNA. By adopting "thermodynamic protection", the specificity of dead gRNA can be improved by adding a protector sequence. For example, one method adds complementary protector strands of various lengths to the 3'end of the guide sequence within the dead gRNA. As a result, the protector strand binds to at least a portion of the dead gRNA to provide a protected gRNA (pgRNA). The dead gRNA reference herein can then be readily protected using the described embodiments, resulting in a pgRNA. The protector strand can be either a separate RNA transcript or a strand bound to the 3'end of the dead gRNA guide sequence or a chimeric form.

タンデムガイド及びマルチプレックス(タンデム)標的化アプローチでの使用
本発明者らは、本明細書で定義されるCRISPR酵素が、活性を失うことなく2つ以上のRNAガイドを使用し得ることを示した。これにより、本明細書で定義される単一の酵素、系または複合体を用いて、複数のDNA標的、遺伝子または遺伝子座を標的化するための、本明細書で定義されるCRISPR酵素、系または複合体の使用が可能になる。ガイドRNAは、タンデムに配列されてもよく、任意選択で、本明細書で定義されるダイレクトリピートなどのヌクレオチド配列によって隔てられてもよい。異なるガイドRNAの位置は、タンデムが活性に影響を与えないことである。「CRISPR-Cas系」、「CRISP-Cas複合体」、「CRISPR複合体」及び「CRISPR系」という用語は、互換的に使用されることに注意のこと。「CRISPR酵素」、「Cas酵素」、または「CRISPR-Cas酵素」という用語も互換的に使用され得る。好ましい実施形態では、当該CRISPR酵素、CRISP-Cas酵素またはCas酵素は、Cas9、または本明細書の他のいずれかに記載されているその改変または変異バリアントのいずれか1つである。
Use in tandem guides and multiplex (tandem) targeting approaches We have shown that the CRISPR enzyme defined herein can use more than one RNA guide without loss of activity. .. Thereby, the CRISPR enzyme, system as defined herein for targeting multiple DNA targets, genes or loci using a single enzyme, system or complex as defined herein. Or the complex can be used. Guide RNAs may be sequenced in tandem or, optionally, separated by nucleotide sequences such as direct repeats as defined herein. The position of the different guide RNAs is that the tandem does not affect the activity. Note that the terms "CRISPR-Cas", "CRISPR-Cas complex", "CRISPR complex" and "CRISPR" are used interchangeably. The terms "CRISPR enzyme", "Cas enzyme", or "CRISPR-Cas enzyme" may also be used interchangeably. In a preferred embodiment, the CRISPR enzyme, CRISP-Cas enzyme or Cas enzyme is Cas9, or any one of its modifications or mutation variants described elsewhere herein.

一態様では、本発明は、本明細書の他のいずれかに記載される、天然には存在しないかまたは操作されたCRISPR酵素、好ましくはクラス2 CRISPR酵素、好ましくはV型またはVI型CRISPR酵素、例えば、タンデムまたは複数の標的化のために使用される、本明細書の他のいずれかに記載される、限定するものではないが、Cas9を提供する。本明細書の他のいずれかに記載されている本発明によるCRISPR(またはCRISPR-CasまたはCas)酵素、複合体、または系のいずれも、そのようなアプローチで使用され得ることを理解されたい。本明細書の他のいずれかに記載されている任意の方法、生成物、組成物及び使用は、以下でさらに詳述される多重またはタンデム標的化アプローチに等しく適用可能である。さらなるガイダンスにより、以下の特定の態様及び実施形態が提供される。 In one aspect, the invention is a non-naturally occurring or engineered CRISPR enzyme, preferably a class 2 CRISPR enzyme, preferably a V-type or VI-type CRISPR enzyme, as described elsewhere herein. , For example, Cas9, as described elsewhere herein, used for tandem or multiple targeting, without limitation. It should be appreciated that any of the CRISPR (or CRISPR-Cas or Cas) enzymes, complexes, or systems according to the invention described elsewhere herein can be used in such an approach. Any method, product, composition and use described elsewhere herein is equally applicable to the multiplex or tandem targeting approaches further detailed below. Further guidance provides the following specific embodiments and embodiments:

一態様では、本発明は、複数の遺伝子座を標的とするための本明細書で定義されるCas9酵素、複合体または系の使用を提供する。一実施形態では、これは、複数の(タンデムまたはマルチプレックス)ガイドRNA(gRNA)配列を使用することにより確立され得る。 In one aspect, the invention provides the use of Cas9 enzymes, complexes or systems as defined herein for targeting multiple loci. In one embodiment, this can be established by using multiple (tandem or multiplex) guide RNA (gRNA) sequences.

一態様では、本発明は、タンデムまたはマルチプレックス標的化のために本明細書で定義されるCas9酵素、複合体または系の1つ以上の要素を使用する方法を提供し、ここで当該CRISPR系は、多数のガイドRNA配列を含む。好ましくは、当該gRNA配列は、本明細書の他のいずれかに定義されるようなダイレクトリピート配列などのヌクレオチド配列によって隔てられている。 In one aspect, the invention provides a method of using one or more elements of a Cas9 enzyme, complex or system as defined herein for tandem or multiplex targeting, wherein the CRISPR system. Contains a large number of guide RNA sequences. Preferably, the gRNA sequence is separated by a nucleotide sequence such as a direct repeat sequence as defined elsewhere herein.

本明細書で定義されるCas9酵素、系または複合体は、複数の標的ポリヌクレオチドを改変するための効果的な手段を提供する。本明細書で定義されるCas9酵素、系または複合体は、多数の細胞型における1つ以上の標的ポリヌクレオチドの改変(例えば、削除、挿入、転位、不活性化、活性化)を含む多種多様な有用性を有する。したがって、本発明の本明細書で定義されるCas9酵素、系、または複合体は、単一のCRISPR系内の複数の遺伝子座の標的化を含む、例えば、遺伝子治療、薬物スクリーニング、疾患診断、及び予後において幅広い用途を有する。 The Cas9 enzyme, system or complex as defined herein provides an effective means for modifying multiple target polynucleotides. Cas9 enzymes, systems or complexes as defined herein are diverse, including modification (eg, deletion, insertion, translocation, inactivation, activation) of one or more target polynucleotides in multiple cell types. It has great usefulness. Thus, Cas9 enzymes, systems, or complexes as defined herein include targeting multiple loci within a single CRISPR system, eg, gene therapy, drug screening, disease diagnosis, etc. And has a wide range of uses in prognosis.

一態様では、本発明は、本明細書で定義されるCas9酵素、系または複合体、すなわち、それと関連する少なくとも1つの不安定化ドメインを有するCas9タンパク質、及びDNA分子のような複数の核酸を標的とする複数のガイドRNAを有するCas9 CRISPR-Cas複合体を提供し、それにより、当該複数のガイドRNAのそれぞれが、その対応する核酸分子、例えばDNA分子を特異的に標的とする。各核酸分子標的、例えば、DNA分子は、遺伝子産物をコードするか、遺伝子座を含んでもよい。したがって、複数のガイドRNAを使用すると、複数の遺伝子座または複数の遺伝子を標的し得る。いくつかの実施形態では、Cas9酵素は、遺伝子産物をコードするDNA分子を切断し得る。いくつかの実施形態では、遺伝子産物の発現が変更される。Cas9タンパク質及びガイドRNAは、自然には一緒に発生しない。本発明は、タンデムに配置されたガイド配列を含むガイドRNAを包含する。本発明はさらに、真核細胞における発現のためにコドン最適化されているCas9タンパク質のコード配列を包含する。好ましい実施形態では、真核細胞は、哺乳動物細胞、植物細胞または酵母細胞であり、より好ましい実施形態では、哺乳動物細胞はヒト細胞である。遺伝子産物の発現は低下する場合がある。Cas9酵素は、CRISPR系または複合体の一部を形成し得、さらに一連の2、3、4、5、6、7、8、9、10、15、25、25、30、または30を超えるガイド配列を含むタンデムに配置されたガイドRNA(gRNA)を含み、それぞれが細胞内の目的のゲノム遺伝子座の標的配列に特異的にハイブリダイズし得る。いくつかの実施形態では、機能的Cas9 CRISPR系または複合体は、複数の標的配列に結合する。いくつかの実施形態では、機能的CRISPR系または複合体は、複数の標的配列を編集し得、例えば、標的配列はゲノム遺伝子座を含み得、いくつかの実施形態では、遺伝子発現の変化があり得る。いくつかの実施形態では、機能的CRISPR系または複合体は、さらなる機能的ドメインを含み得る。いくつかの実施形態では、本発明は、複数の遺伝子産物の発現を変更または改変する方法を提供する。この方法は、当該標的核酸、例えばDNA分子を含むか、または標的核酸、例えばDNA分子を含みかつ発現する細胞に導入することを含み得る;例えば、標的核酸は、遺伝子産物をコードしてもよいし、遺伝子産物(例えば、調節配列)の発現を提供してもよい。 In one aspect, the invention comprises multiple nucleic acids such as Cas9 enzymes, systems or complexes as defined herein, i.e., Cas9 proteins having at least one destabilizing domain associated thereto, and DNA molecules. A Cas9 CRISPR-Cas complex having a plurality of targeting guide RNAs is provided, whereby each of the plurality of guide RNAs specifically targets its corresponding nucleic acid molecule, eg, a DNA molecule. Each nucleic acid molecule target, eg, a DNA molecule, may encode a gene product or contain a locus. Therefore, multiple guide RNAs can be used to target multiple loci or genes. In some embodiments, the Cas9 enzyme can cleave the DNA molecule encoding the gene product. In some embodiments, the expression of the gene product is altered. Cas9 protein and guide RNA do not occur naturally together. The present invention includes a guide RNA containing a guide sequence arranged in tandem. The invention further comprises the coding sequence for the Cas9 protein, which is codon-optimized for expression in eukaryotic cells. In a preferred embodiment, the eukaryotic cell is a mammalian cell, a plant cell or a yeast cell, and in a more preferred embodiment, the mammalian cell is a human cell. Expression of gene products may be reduced. The Cas9 enzyme can form part of a CRISPR system or complex and further exceeds a series of 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 25, 25, 30, or 30. It contains guide RNAs (gRNAs) located in tandem containing guide sequences, each of which can specifically hybridize to the target sequence of the genomic locus of interest in the cell. In some embodiments, the functional Cas9 CRISPR system or complex binds to multiple target sequences. In some embodiments, the functional CRISPR system or complex may edit multiple target sequences, eg, the target sequence may contain genomic loci, and in some embodiments there are changes in gene expression. obtain. In some embodiments, the functional CRISPR system or complex may comprise additional functional domains. In some embodiments, the invention provides a method of altering or altering the expression of a plurality of gene products. The method may include introducing into a cell comprising or expressing the target nucleic acid, eg, a DNA molecule; eg, the target nucleic acid may encode a gene product. And may provide expression of a gene product (eg, a regulatory sequence).

好ましい実施形態では、多重標的化に使用されるCRISPR酵素は、Cas9であるか、またはCRISPR系もしくは複合体はCas9を含む。いくつかの実施形態では、多重標的化に使用されるCRISPR酵素は、AsCas9であるか、または多重標的化に使用されるCRISPR系もしくは複合体はAsCas9を含む。いくつかの実施形態では、CRISPR酵素は、LbCas9であるか、またはCRISPR系もしくは複合体は、LbCas9を含む。いくつかの実施形態では、多重標的化に使用されるCas9酵素は、DNAの両方の鎖を切断して、二本鎖切断(DSB)を生成する。いくつかの実施形態では、多重標的化に使用されるCRISPR酵素はニッカーゼである。いくつかの実施形態では、多重標的化に使用されるCas9酵素は、デュアルニッカーゼである。いくつかの実施形態では、多重標的化に使用されるCas9酵素は、本明細書の他のいずれかに定義されるDD Cas9酵素などのCas9酵素である。 In a preferred embodiment, the CRISPR enzyme used for multiple targeting is Cas9, or the CRISPR system or complex comprises Cas9. In some embodiments, the CRISPR enzyme used for multiple targeting is AsCas9, or the CRISPR system or complex used for multiple targeting comprises AsCas9. In some embodiments, the CRISPR enzyme is LbCas9, or the CRISPR system or complex comprises LbCas9. In some embodiments, the Cas9 enzyme used for multiple targeting cleaves both strands of DNA to produce double-strand breaks (DSBs). In some embodiments, the CRISPR enzyme used for multiple targeting is nickase. In some embodiments, the Cas9 enzyme used for multiple targeting is dual nickase. In some embodiments, the Cas9 enzyme used for multiple targeting is a Cas9 enzyme, such as the DD Cas9 enzyme defined elsewhere herein.

いくつかの一般的な実施形態では、多重標的化に使用されるCas9酵素は、1つ以上の機能的ドメインに関連付けられている。いくつかのより具体的な実施形態では、多重標的化に使用されるCRISPR酵素は、本明細書の他のいずれかで定義されているデッドCas9である。 In some common embodiments, the Cas9 enzyme used for multiple targeting is associated with one or more functional domains. In some more specific embodiments, the CRISPR enzyme used for multiple targeting is dead Cas9 as defined elsewhere herein.

ある態様では、本発明は、本明細書で定義される複数の標的化または本明細書で定義されるポリヌクレオチドで使用するためのCas9酵素、系または複合体を送達する手段を提供する。そのような送達手段の非限定的な例は、例えば、複合体の構成要素(複数可)を送達する粒子(複数可)、本明細書で考察されるポリヌクレオチド(複数可)を含むベクター(複数可)(例えば、CRISPR酵素をコードし、CRISPR複合体をコードするヌクレオチドを提供する)である。いくつかの実施形態では、ベクターは、プラスミドまたはウイルスベクター、例えばAAV、またはレンチウイルスであってもよい。特にAAVのサイズ制限、及びCas9がAAVに適合している間、追加のガイドRNAで上限に達する可能性があることを考えると、プラスミドを用いた、例えば、HEK細胞への一時的なトランスフェクションが有利であり得る。 In some embodiments, the invention provides a means of delivering a Cas9 enzyme, system or complex for use with multiple targeting or polynucleotides defined herein. Non-limiting examples of such delivery means are, for example, particles (s) that deliver the components of the complex (s), vectors containing the polynucleotides (s) discussed herein (s). Multiple) (eg, providing a nucleotide encoding a CRISPR enzyme and encoding a CRISPR complex). In some embodiments, the vector may be a plasmid or viral vector, such as AAV, or a lentivirus. Temporary transfection with plasmids, eg, to HEK cells, especially given the size limitation of AAV and the potential for additional guide RNA to reach the upper limit while Cas9 is compatible with AAV. Can be advantageous.

多重標的化で使用するために本明細書で使用されるCas9酵素、複合体または系を構成的に発現するモデルも提供される。生物はトランスジェニックであってもよく、本ベクターでトランスフェクトされていてもよいし、そのようにトランスフェクトされた生物の子孫であってもよい。さらなる態様では、本発明は、本明細書で定義されるCRISPR酵素、系及び複合体、または本明細書で説明されるポリヌクレオチドもしくはベクターを含む組成物を提供する。また、複数のガイドRNAを含むCas9 CRISPR系または複合体を、好ましくはタンデムに配置された形式で提供する。当該異なるガイドRNAは、ダイレクトリピート配列などのヌクレオチド配列によって隔てられてもよい。 Also provided are models that constitutively express the Cas9 enzyme, complex or system used herein for use in multiple targeting. The organism may be transgenic, transfected with this vector, or may be a progeny of such transfected organism. In a further aspect, the invention provides a composition comprising the CRISPR enzymes, systems and complexes defined herein, or the polynucleotides or vectors described herein. Also provided are Cas9 CRISPR systems or complexes containing multiple guide RNAs, preferably in tandem-arranged form. The different guide RNAs may be separated by a nucleotide sequence such as a direct repeat sequence.

また、対象、例えばそれを必要とする対象を治療する方法であって、対象をCas9 CRISPR系もしくは複合体または本明細書に記載の任意のポリヌクレオチドもしくはベクターをコードするポリヌクレオチドで形質転換することにより、遺伝子編集を指示すること、それらを対象に投与することを含む方法も提供される。適切な修復テンプレートも提供されてもよく、例えば、当該修復テンプレートを含むベクターによって送達されてもよい。対象、例えばそれを必要とする対象を治療する方法であって、本明細書に記載のポリヌクレオチドまたはベクターで対象を形質転換することにより、複数の標的遺伝子座の転写活性化または抑制を指示することを含む方法も提供され、当該ポリヌクレオチドまたはベクターは、複数のガイドRNAを含むCas9酵素、複合体または系を、好ましくはタンデム配置でコードするかまたは含む。例えば、細胞培養で、エクスビボで何らかの治療が行われているならば、「対象」という用語は「細胞または細胞培養」という語句に置き換えられてもよいことが理解されよう。 Also, a method of treating a subject, eg, a subject in need thereof, transforming the subject with a Cas9 CRISPR system or complex or a polynucleotide encoding any polynucleotide or vector described herein. Also provided are methods that include directing gene editing and administering them to a subject. Suitable repair templates may also be provided and may be delivered, for example, by a vector containing the repair template. A method of treating a subject, eg, a subject in need thereof, which directs transcriptional activation or suppression of multiple target loci by transforming the subject with the polynucleotides or vectors described herein. Also provided is that the polynucleotide or vector encodes or comprises a Cas9 enzyme, complex or system containing multiple guide RNAs, preferably in a tandem arrangement. For example, in cell culture, it will be understood that the term "subject" may be replaced by the phrase "cell or cell culture" if any treatment is being performed with Exvivo.

本明細書の他のいずれかに定義される治療の方法での使用のための、好ましくはタンデムに配列された複数のガイドRNAを含む、Cas9酵素、複合体もしくは系を含む組成物、または好ましくはタンデムに配列された複数のガイドRNAを含む当該Cas9酵素、複合体または系をコードするかまたは含むポリヌクレオチドまたはベクターもまた提供される。そのような組成物を含む部品のキットが提供されてもよい。そのような治療方法のための医薬の製造における当該組成物の使用も提供される。スクリーニングにおけるCas9 CRISPR系の使用も、本発明、例えば、機能獲得スクリーニングにより提供される。人為的に遺伝子を過剰発現するように強制された細胞は、例えば、負のフィードバックループによって、遺伝子を経時的に下方制御し得る(平衡を再確立する)。スクリーニングが開始されるまでに、調節されていない遺伝子は再び減少し得る。誘導性Cas9活性化因子を使用すると、スクリーニングの直前で転写を指示することが可能になり、したがって、偽陰性のヒットの可能性が最小限に抑えられる。したがって、スクリーニング、例えば機能獲得スクリーニングで本発明を使用することにより、偽陰性結果の機会が最小限に抑えられ得る。 A composition comprising a Cas9 enzyme, complex or system, preferably comprising multiple guide RNAs sequenced in tandem, for use in any of the therapeutic methods defined herein, or preferably. Also provided is a polynucleotide or vector encoding or containing the Cas9 enzyme, complex or system comprising multiple guide RNAs sequenced in tandem. Kits of parts containing such compositions may be provided. The use of such compositions in the manufacture of pharmaceuticals for such therapeutic methods is also provided. The use of the Cas9 CRISPR system in screening is also provided by the present invention, eg, gain of function screening. Cells that are artificially forced to overexpress a gene can downregulate (reestablish equilibrium) the gene over time, for example, through a negative feedback loop. By the time screening is initiated, unregulated genes may be reduced again. Inducible Cas9 activators allow transcription to be directed immediately prior to screening, thus minimizing the possibility of false negative hits. Therefore, by using the present invention in screening, such as gain of function screening, the chances of false negative results can be minimized.

一態様では、本発明は、細胞内の遺伝子産物をコードするDNA分子をそれぞれ特異的に標的とするCas9タンパク質及び複数のガイドRNAを含む操作された天然には存在しないCRISPR系を提供し、それによって、多数のガイドRNAは各々、遺伝子産物をコードする特定のDNA分子を標的し、Cas9タンパク質が遺伝子産物をコードする標的DNA分子を切断し、それにより遺伝子産物の発現が変化する;そして、CRISPRタンパク質とガイドRNAは、自然には一緒に発生しない。本発明は、複数のガイド配列を含む複数のガイドRNAを包含し、好ましくは、ダイレクトリピート配列などのヌクレオチド配列によって隔てられ、任意選択でtracr配列に融合される。本発明の一実施形態では、CRISPRタンパク質は、V型またはVI型CRISPR-Casタンパク質であり、より好ましい実施形態では、CRISPRタンパク質は、Cas9タンパク質である。本発明はさらに、真核細胞における発現のためにコドン最適化されているCas9タンパク質を包含する。好ましい実施形態では、真核細胞は、哺乳動物細胞であり、より好ましい実施形態では、哺乳動物細胞はヒト細胞である。本発明のさらなる実施形態では、遺伝子産物の発現が減少する。 In one aspect, the invention provides an engineered non-naturally occurring CRISPR system comprising a Cas9 protein and multiple guide RNAs, each specifically targeting a DNA molecule encoding an intracellular gene product. Each of the numerous guide RNAs targets a specific DNA molecule that encodes the gene product, and the Cas9 protein cleaves the target DNA molecule that encodes the gene product, thereby altering the expression of the gene product; and CRISPR. Proteins and guide RNAs do not naturally occur together. The present invention comprises a plurality of guide RNAs comprising a plurality of guide sequences, preferably separated by a nucleotide sequence such as a direct repeat sequence and optionally fused to a tracr sequence. In one embodiment of the invention, the CRISPR protein is a V-type or VI-type CRISPR-Cas protein, and in a more preferred embodiment, the CRISPR protein is a Cas9 protein. The invention further includes Cas9 proteins that are codon-optimized for expression in eukaryotic cells. In a preferred embodiment, the eukaryotic cell is a mammalian cell, and in a more preferred embodiment, the mammalian cell is a human cell. In a further embodiment of the invention, the expression of the gene product is reduced.

別の態様では、本発明は、遺伝子産物をコードするDNA分子をそれぞれ特異的に標的とする複数のCas9 CRISPR系ガイドRNAに機能可能なように連結された第1の調節エレメント、及び、CRISPRタンパク質をコードする機能可能なように連結された第2の調節エレメントを含む1つ以上のベクターを含む操作された天然には存在しないベクター系を提供する。両方の調節エレメントは、系の同じベクターまたは異なるベクターに配置され得る。複数のガイドRNAは、細胞内の複数の遺伝子産物をコードする複数のDNA分子を標的とし、CRISPRタンパク質は遺伝子産物をコードする複数のDNA分子を切断し得(一方もしくは両方の鎖を切断する場合もあるし、または実質的にヌクレアーゼ活性を持たない場合がある)、それによって複数の遺伝子産物の発現が変更され;そして、CRISPRタンパク質及び複数のガイドRNAは自然には一緒には存在しない。好ましい実施形態では、CRISPRタンパク質は、Cas9タンパク質であり、任意選択で真核細胞での発現に最適化されたコドンである。好ましい実施形態では、真核細胞は、哺乳動物細胞、植物細胞または酵母細胞であり、より好ましい実施形態では、哺乳動物細胞はヒト細胞である。本発明のさらなる実施形態では、複数の遺伝子産物のそれぞれの発現が変更され、好ましくは減少される。 In another aspect, the invention is a first regulatory element operably linked to multiple Cas9 CRISPR-based guide RNAs, each specifically targeting a DNA molecule encoding a gene product, and a CRISPR protein. Provided is an engineered non-naturally occurring vector system comprising one or more vectors containing a second regulatory element operably linked to encode. Both regulatory elements can be located in the same or different vectors of the system. Multiple guide RNAs target multiple DNA molecules encoding multiple gene products in the cell, and the CRISPR protein can cleave multiple DNA molecules encoding the gene product (if one or both strands are cleaved). It may or may not have substantially nuclease activity), thereby altering the expression of multiple gene products; and the CRISPR protein and multiple guide RNAs are not naturally present together. In a preferred embodiment, the CRISPR protein is a Cas9 protein, an optionally optimized codon for expression in eukaryotic cells. In a preferred embodiment, the eukaryotic cell is a mammalian cell, a plant cell or a yeast cell, and in a more preferred embodiment, the mammalian cell is a human cell. In a further embodiment of the invention, the expression of each of the plurality of gene products is altered, preferably reduced.

一態様では、本発明は、1つ以上のベクターを含むベクター系を提供する。いくつかの実施形態では、この系は,(a)ダイレクトリピート配列に機能可能なように連結された第1の調節エレメント、及びダイレクトリピート配列の上流または下流(いずれでか該当する場合)に1つ以上のガイド配列を挿入するための1つ以上の挿入部位であって、発現されると、1つ以上のガイド配列(複数可)は、真核細胞の1つ以上の標的配列(複数可)へのCRISPR複合体の配列特異的結合を誘導し、CRISPR複合体は、1つ以上の標的配列(複数可)にハイブリダイズする1つ以上のガイド配列(複数可)と複合体化されたCas9酵素を含む、挿入部位;ならびに(b)好ましくは少なくとも1つの核局在化配列及び/または少なくとも1つのNESを含む、当該Cas9酵素をコードする酵素コード配列に機能可能なように連結された第2の調節エレメントを含み;ここで、構成要素(a)及び(b)は、系の同じまたは異なるベクターに配置される。該当する場合、tracr配列も提供される。いくつかの実施形態では、構成要素(a)は、第1の調節エレメントに機能可能なように連結された2つ以上のガイド配列をさらに含み、ここで、発現された場合、2つ以上のガイド配列のそれぞれは、真核生物細胞中で、Cas9 CRISPR複合体の異なる標的配列への配列特異的結合を指示する。いくつかの実施形態では、CRISPR複合体は、真核細胞の核内または核外に検出可能な量で当該Cas9 CRISPR複合体の蓄積を駆動するのに十分な強度の1つ以上の核局在化配列及び/または1つ以上のNESを含む。いくつかの実施形態において、第1の調節エレメントはポリメラーゼIIIプロモーターである。いくつかの実施形態において、第2の調節エレメントはポリメラーゼIIプロモーターである。いくつかの実施形態では、各ガイド配列は、少なくとも16、17、18、19、20、25ヌクレオチド、または16~30、または16~25、または16~20ヌクレオチドの長さである。 In one aspect, the invention provides a vector system comprising one or more vectors. In some embodiments, the system is (a) a first regulatory element operably linked to the direct repeat sequence, and 1 upstream or downstream (if applicable) of the direct repeat sequence. One or more insertion sites for inserting one or more guide sequences, and when expressed, one or more guide sequences (s) are one or more target sequences (s) of eukaryotic cells. ) Is induced for sequence-specific binding of the CRISPR complex, and the CRISPR complex is complexed with one or more guide sequences (s) that hybridize to one or more target sequences (s). Insertion site comprising Cas9 enzyme; and (b) operably linked to an enzyme coding sequence encoding the Cas9 enzyme, preferably comprising at least one nuclear localization sequence and / or at least one NES. Includes a second regulatory element; where components (a) and (b) are placed in the same or different vectors of the system. If applicable, tracr sequences are also provided. In some embodiments, the component (a) further comprises two or more guide sequences operably linked to the first regulatory element, where, when expressed, two or more. Each of the guide sequences directs sequence-specific binding of the Cas9 CRISPR complex to different target sequences in eukaryotic cells. In some embodiments, the CRISPR complex has one or more nuclear localizations of sufficient intensity to drive the accumulation of the Cas9 CRISPR complex in a detectable amount in or out of the nucleus of the eukaryotic cell. Includes a chemical sequence and / or one or more NES. In some embodiments, the first regulatory element is the polymerase III promoter. In some embodiments, the second regulatory element is the polymerase II promoter. In some embodiments, each guide sequence is at least 16, 17, 18, 19, 20, 25 nucleotides, or 16-30, or 16-25, or 16-20 nucleotides in length.

組換え発現ベクターは、宿主細胞における核酸の発現に適した形態で、本明細書で定義される複数の標的化で使用するためのCas9酵素、系または複合体をコードするポリヌクレオチドを含んでもよく、これは、この組み換え発現ベクターが、1つ以上の調節エレメントを含み、これが発現に用いられる宿主細胞に基づいて選択され得、これが、発現される核酸配列に機能可能なように連結されていることを意味する。組換え発現ベクターにおいて、「作動可能に連結」は、目的のヌクレオチド配列が調節エレメント(複数可)にヌクレオチド配列の発現(例えば、インビトロ転写/翻訳系、またはベクターが宿主細胞に導入されるとき、宿主内において)を可能とする様式で連結されることを意味することを意図する。 The recombinant expression vector may contain a polynucleotide encoding a Cas9 enzyme, system or complex for use in multiple targets as defined herein in a form suitable for nucleic acid expression in host cells. This recombinant expression vector contains one or more regulatory elements that can be selected based on the host cell used for expression, which is operably linked to the nucleic acid sequence to be expressed. Means that. In a recombinant expression vector, "operably linked" means that the nucleotide sequence of interest is expressed in a regulatory element (s) of the nucleotide sequence (eg, an in vitro transcription / translation system, or when the vector is introduced into a host cell). It is intended to mean that they are linked in a manner that allows (in the host).

いくつかの実施形態では、宿主細胞は、本明細書で定義される複数の標的化で使用するためのCas9酵素、系または複合体をコードするポリヌクレオチドを含む1つ以上のベクターで一時的または非一時的にトランスフェクトされる。いくつかの実施形態では、細胞は、対象に自然に発生するときにトランスフェクトされる。いくつかの実施形態では、トランスフェクトされる細胞は対象から採取される。いくつかの実施形態では、細胞は、細胞株などの対象から採取された細胞に由来する。組織培養のための多種多様な細胞株が当該技術分野で公知であり、本明細書の他のいずれかに例示されている。細胞株は、当業者に公知である様々な供給源から入手可能である(例えば、American Type Culture Collection(ATCC)(Manassus,Va.)を参照のこと)。いくつかの実施形態では、本明細書で定義される複数の標的化で使用するためのCas9酵素、系または複合体をコードするポリヌクレオチドを含む1つ以上のベクターでトランスフェクトされた細胞を使用して、1つ以上のベクター由来配列を含む新しい細胞株を確立する。いくつかの実施形態では、本明細書に記載の複数の標的化で使用するためのCas9 CRISPR系または複合体の構成要素で一時的にトランスフェクトされ(1つ以上のベクターの一過性トランスフェクション、またはRNAによるトランスフェクションなど)、及びCas9 CRISPR系または複合体の活性を通じて改変された細胞を使用して、改変を含むが他の外因性配列を欠く細胞を含む新しい細胞株を確立する。いくつかの実施形態では、本明細書で定義される複数の標的化で使用するためのCas9酵素、系もしくは複合体をコードするポリヌクレオチドを含む1つ以上のベクターで一時的もしくは非一時的にトランスフェクトされた細胞、またはそのような細胞に由来する細胞株は、1つ以上の試験化合物を評価するのに使用される。 In some embodiments, the host cell is transiently or in one or more vectors comprising a polynucleotide encoding a Cas9 enzyme, system or complex for use in multiple targets as defined herein. Transfected non-temporarily. In some embodiments, cells are transfected when they occur spontaneously in a subject. In some embodiments, the cells to be transfected are harvested from the subject. In some embodiments, the cells are derived from cells taken from a subject, such as a cell line. A wide variety of cell lines for tissue culture are known in the art and are exemplified elsewhere herein. Cell lines are available from a variety of sources known to those of skill in the art (see, eg, American Type Culture Collection (ATCC) (Manassas, Va.)). In some embodiments, cells transfected with one or more vectors containing a polynucleotide encoding a Cas9 enzyme, system or complex for use in multiple targets as defined herein are used. To establish a new cell line containing one or more vector-derived sequences. In some embodiments, it is transiently transfected with a component of the Cas9 CRISPR system or complex for use in multiple targets described herein (transient transfection of one or more vectors). , Or transfection with RNA), and cells modified through the activity of the Cas9 CRISPR system or complex to establish new cell lines containing cells containing modifications but lacking other exogenous sequences. In some embodiments, transiently or non-temporarily with one or more vectors containing a polynucleotide encoding a Cas9 enzyme, system or complex for use in multiple targets as defined herein. Transfected cells, or cell lines derived from such cells, are used to evaluate one or more test compounds.

「調節エレメント」という用語は、本明細書の他のいずれかに定義されている通りである。 The term "regulatory element" is as defined elsewhere herein.

有利なベクターには、レンチウイルス及びアデノ随伴ウイルスが含まれ、そのようなベクターのタイプを、特定のタイプの細胞を標的とするために選択してもよい。 Advantageous vectors include lentiviruses and adeno-associated viruses, and the type of such vector may be selected to target specific types of cells.

一態様では、本発明は、(a)ダイレクトリピート配列に機能可能なように連結された第1の調節エレメント、及び1つ以上のガイドRNA配列をダイレクトリピート配列の上流または下流(いずれか適用可能なもの)に挿入するための1つ以上の挿入部位を含む真核宿主細胞であって、ここで発現される場合、ガイド配列(複数可)は、Cas9 CRISPR複合体の真核細胞におけるそれぞれの標的配列(複数可)への配列特異的結合を誘導し、Cas9 CRISPR複合体は、それぞれの標的配列(複数可)にハイブリダイズする1つ以上のガイド配列(複数可)と複合体を形成したCas9酵素を含むか;ならびに/あるいは(b)好ましくは少なくとも1つの核局在化配列及び/またはNESを含む当該Cas9酵素をコードする酵素コード配列に機能可能なように連結された第2の調節エレメント、を含む真核宿主細胞を提供する。いくつかの実施形態では、宿主細胞は、構成要素(a)及び(b)を含む。該当する場合、tracr配列も提供される。いくつかの実施形態では、構成要素(a)、構成要素(b)、または構成要素(a)及び(b)は、宿主真核細胞のゲノムに安定して組み込まれている。いくつかの実施形態では、構成要素(a)は、第1の調節エレメントに機能可能なように連結され、任意選択でダイレクトリピートにより隔てられた2つ以上のガイド配列をさらに含み、発現される場合、2つ以上のガイド配列のそれぞれが、真核生物細胞内で、種々の標的配列に対するCas9 CRISPR複合体の配列特異的結合を指示する。いくつかの実施形態では、Cas9酵素は、真核細胞の核内及び/または核外に検出可能な量で、当該CRISPR酵素の蓄積を駆動するのに十分な強度の1つ以上の核局在化配列及び/または核外輸送配列またはNESを含む。 In one aspect, the invention is (a) a first regulatory element operably linked to a direct repeat sequence, and one or more guide RNA sequences upstream or downstream of the direct repeat sequence (either applicable). A eukaryotic host cell containing one or more insertion sites for insertion, where expressed, the guide sequence (s) is each in the eukaryotic cells of the Cas9 CRISPR complex. Inducing sequence-specific binding to the target sequence (s), the Cas9 CRISPR complex formed a complex with one or more guide sequences (s) that hybridize to each target sequence (s). A second regulation operably linked to a Cas9 enzyme containing; and / or (b) preferably an enzyme coding sequence encoding the Cas9 enzyme, including at least one nuclear localization sequence and / or NES. Provides eukaryotic host cells, including the element. In some embodiments, the host cell comprises components (a) and (b). If applicable, tracr sequences are also provided. In some embodiments, the components (a), components (b), or components (a) and (b) are stably integrated into the genome of the host eukaryotic cell. In some embodiments, the component (a) is functionally linked to a first regulatory element and further comprises and is expressed by two or more guide sequences optionally separated by direct repeat. If so, each of the two or more guide sequences directs sequence-specific binding of the Cas9 CRISPR complex to various target sequences in eukaryotic cells. In some embodiments, the Cas9 enzyme has one or more nuclear localizations in a detectable amount in and / or out of the nucleus of eukaryotic cells that are strong enough to drive the accumulation of the CRISPR enzyme. Includes chemical sequences and / or nuclear export sequences or NES.

いくつかの実施形態では、Cas9酵素は、V型またはVI型CRISPR系酵素である。いくつかの実施形態では、Cas9酵素は、Cas9酵素である。いくつかの実施形態では、Cas9酵素はFrancisella tularensis 1、Francisella tularensis subsp. novicida、Prevotella albensis、Lachnospiraceae bacterium MC2017 1、Butyrivibrio proteoclasticus、Peregrinibacteria bacterium GW2011_GWA2_33_10、Parcubacteria bacterium GW2011_GWC2_44_17、Smithella sp.SCADC、Acidaminococcus sp.BV3L6、Lachnospiraceae bacterium MA2020、Candidatus Methanoplasma termitum、Eubacterium eligens、Moraxella bovoculi 237、Leptospira inadai、Lachnospiraceae bacterium ND2006、Porphyromonas crevioricanis 3、Prevotella disiens、またはPorphyromonas macacae Cas9に由来し、本明細書のいずれかに定義されるCas9のさらなる変更または改変を含み得、キメラCas9であってもよい。いくつかの実施形態では、Cas9酵素は、真核生物細胞中の発現のためにコドン最適化される。いくつかの実施形態では、CRISPR酵素は、標的配列の位置での1つまたは2つの鎖の切断を指示する。いくつかの実施形態において、第1の調節エレメントはポリメラーゼIIIプロモーターである。いくつかの実施形態において、第2の調節エレメントはポリメラーゼIIプロモーターである。いくつかの実施形態では、1つ以上のガイド配列(複数可)は、(それぞれ)少なくとも16、17、18、19、20、25ヌクレオチド、または16~30、または16~25、または16~20ヌクレオチド長である。複数のガイドRNAが使用される場合、それらは好ましくはダイレクトリピート配列により隔てられる。一態様では、本発明は、非ヒト真核生物を;好ましくは、記載された実施形態のいずれかによる真核宿主細胞を含む多細胞真核生物を提供する。他の態様では、本発明は真核生物を;好ましくは、記載された実施形態のいずれかによる真核宿主細胞を含む多細胞真核生物を提供する。これらの態様のいくつかの実施形態における生物は、動物、例えば哺乳動物であってよい。同様に、生物は昆虫のような節足動物であってよい。生物はまた、植物であってもよい。さらに、生物は真菌であってもよい。 In some embodiments, the Cas9 enzyme is a V-type or VI-type CRISPR-based enzyme. In some embodiments, the Cas9 enzyme is a Cas9 enzyme. In some embodiments, the Cas9 enzyme is Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacteria MC2017 1, Butyrivio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2 SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai Cas9 which, derived from Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens or Porphyromonas macacae Cas9,, as defined in any of the herein Can include further modifications or modifications of, and may be chimeric Cas9. In some embodiments, the Cas9 enzyme is codon-optimized for expression in eukaryotic cells. In some embodiments, the CRISPR enzyme directs the cleavage of one or two strands at the position of the target sequence. In some embodiments, the first regulatory element is the polymerase III promoter. In some embodiments, the second regulatory element is the polymerase II promoter. In some embodiments, the one or more guide sequences (s) are (each) at least 16, 17, 18, 19, 20, 25 nucleotides, or 16-30, or 16-25, or 16-20. Nucleotide length. When multiple guide RNAs are used, they are preferably separated by direct repeat sequences. In one aspect, the invention provides a non-human eukaryote; preferably a multicellular eukaryote comprising a eukaryotic host cell according to any of the described embodiments. In another aspect, the invention provides a eukaryote; preferably a multicellular eukaryote comprising a eukaryotic host cell according to any of the described embodiments. The organism in some embodiments of these embodiments may be an animal, eg a mammal. Similarly, the organism may be an arthropod such as an insect. The organism may also be a plant. In addition, the organism may be a fungus.

一態様では、本発明は、本明細書に記載の構成要素の1つ以上を含むキットを提供する。いくつかの実施形態では、このキットは、ベクター系及びキットを使用するための使用説明書を備える。いくつかの実施形態では、ベクター系は、(a)ダイレクトリピート配列に機能可能なように連結された第1の調節エレメントと、ダイレクトリピート配列の上流または下流(いずれか該当する場合)に1つ以上のガイド配列を挿入するための1つ以上の挿入部位であって、発現される場合、このガイド配列は、Cas9 CRISPR複合体の真核細胞の標的配列への配列特異的結合を誘導し、ここでこのCas9 CRISPR複合体は、標的配列にハイブリダイズするガイド配列と複合したCas9酵素を含む、挿入部位;及び/または(b)核局在化配列を含む当該Cas9酵素をコードする酵素コード配列に機能可能なように連結された第2の調節エレメント、を含む。該当する場合、tracr配列も提供される。いくつかの実施形態では、このキットは、系の同じまたは異なるベクター上に配置された構成要素(a)及び(b)を含む。いくつかの実施形態では、構成要素(a)は、第1の調節エレメントに機能可能なように連結された2つ以上のガイド配列をさらに含み、ここで、発現された場合、2つ以上のガイド配列のそれぞれは、真核生物細胞中で、CRISPR複合体の異なる標的配列への配列特異的結合を指示する。いくつかの実施形態において、Cas9酵素は、真核細胞の核における検出可能な量の前記CRISPR酵素の蓄積を導くのに十分な強度の1つ以上の核局在化配列を含む。いくつかの実施形態では、CRISPR酵素は、V型またはVI型CRISPR系酵素である。いくつかの実施形態において、CRISPR酵素はCas9酵素である。いくつかの実施形態では、Cas9酵素は、Francisella tularensis 1、Francisella tularensis subsp.novicida、Prevotella albensis、Lachnospiraceae bacterium MC2017 1、Butyrivibrio proteoclasticus、Peregrinibacteria bacterium GW2011_GWA2_33_10、Parcubacteria bacterium GW2011_GWC2_44_17、Smithella sp.SCADC、Acidaminococcus sp.BV3L6、Lachnospiraceae bacterium MA2020、Candidatus Methanoplasma termitum、Eubacterium eligens、Moraxella bovoculi 237、Leptospira inadai、Lachnospiraceae bacterium ND2006、Porphyromonas crevioricanis 3、Prevotella disiens、またはPorphyromonas macacae Cas9(例えば、少なくとも1つのDDを有するように改変されるか、または少なくとも1つのDDと関連される)に由来し、Cas9のさらなる変更または変異を含んでもよく、キメラCas9であってもよい。いくつかの実施形態では、DD-CRISPR酵素は、真核細胞での発現のためにコドン最適化されている。いくつかの実施形態では、DD-CRISPR酵素は、標的配列の位置で1つまたは2つの鎖の切断を指示する。いくつかの実施形態では、DD-CRISPR酵素は、DNA鎖切断活性を欠くか、または実質的に欠く(例えば、野生型酵素またはヌクレアーゼ活性を低下させる変異または変更を有さない酵素と比較して5%以下のヌクレアーゼ活性)。いくつかの実施形態において、第1の調節エレメントはポリメラーゼIIIプロモーターである。いくつかの実施形態において、第2の調節エレメントはポリメラーゼIIプロモーターである。いくつかの実施形態では、ガイド配列は、少なくとも16、17、18、19、20、25ヌクレオチド、または16~30、または16~25、または16~20ヌクレオチド長である。 In one aspect, the invention provides a kit comprising one or more of the components described herein. In some embodiments, the kit comprises a vector system and instructions for using the kit. In some embodiments, the vector system is (a) a first regulatory element operably linked to the direct repeat sequence and one upstream or downstream (if applicable) of the direct repeat sequence. When expressed at one or more insertion sites for inserting the above guide sequences, the guide sequences induce sequence-specific binding of the Cas9 CRISPR complex to the target sequence of eukaryotic cells. Here, the Cas9 CRISPR complex comprises an insertion site comprising a Cas9 enzyme complexed with a guide sequence that hybridizes to the target sequence; and / or an enzyme coding sequence encoding the Cas9 enzyme comprising (b) a nuclear localization sequence. Includes a second adjusting element, which is operably linked to. If applicable, tracr sequences are also provided. In some embodiments, the kit comprises components (a) and (b) placed on the same or different vectors of the system. In some embodiments, the component (a) further comprises two or more guide sequences operably linked to the first regulatory element, where, when expressed, two or more. Each of the guide sequences directs sequence-specific binding of the CRISPR complex to different target sequences in eukaryotic cells. In some embodiments, the Cas9 enzyme comprises one or more nuclear localization sequences of sufficient intensity to induce the accumulation of a detectable amount of the CRISPR enzyme in the nucleus of eukaryotic cells. In some embodiments, the CRISPR enzyme is a V-type or VI-type CRISPR-based enzyme. In some embodiments, the CRISPR enzyme is a Cas9 enzyme. In some embodiments, the Cas9 enzyme is Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacteria MC2017 1, Butyrivio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2 SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens or Porphyromonas macacae Cas9 (e.g., either modified to have at least one DD , Or associated with at least one DD), may contain further modifications or variations of Cas9, or may be chimeric Cas9. In some embodiments, the DD-CRISPR enzyme is codon-optimized for expression in eukaryotic cells. In some embodiments, the DD-CRISPR enzyme directs cleavage of one or two strands at the location of the target sequence. In some embodiments, the DD-CRISPR enzyme lacks or substantially lacks DNA strand cleavage activity (eg, wild-type enzyme or enzyme without mutations or alterations that reduce nuclease activity). Nuclease activity of 5% or less). In some embodiments, the first regulatory element is the polymerase III promoter. In some embodiments, the second regulatory element is the polymerase II promoter. In some embodiments, the guide sequence is at least 16, 17, 18, 19, 20, 25 nucleotides, or 16-30, or 16-25, or 16-20 nucleotides in length.

一態様では、本発明は、真核細胞などの宿主細胞中の複数の標的ポリヌクレオチドを改変する方法を提供する。いくつかの実施形態では、この方法は、Cas9 CRISPR複合体を複数の標的ポリヌクレオチドに結合させて、例えば、当該複数の標的ポリヌクレオチドの切断を生じさせ、それにより複数の標的ポリヌクレオチドを改変することを包含し、ここでCas9 CRISPR複合体は、複数のガイド配列と複合したCas9酵素を含み、それぞれが、当該標的ポリヌクレオチド内の特定の標的配列にハイブリダイズされており、当該複数のガイド配列は、ダイレクトリピート配列に連結されている。該当する場合、tracr配列も提供されてもよい(例えば、単一のガイドRNA、sgRNAを提供するため)。いくつかの実施形態では、当該切断は、当該Cas9酵素による各標的配列の位置で1つまたは2つの鎖を切断することを含む。いくつかの実施形態では、当該切断により、複数の標的遺伝子の転写が減少する。いくつかの実施形態では、この方法は、外因性テンプレートポリヌクレオチドとの相同組換えによって1つ以上の当該切断された標的ポリヌクレオチドを修復することをさらに含み、当該修復は、1つ以上の当該標的ポリヌクレオチドの1つ以上のヌクレオチドの挿入、欠失、または置換を含む変異をもたらす。いくつかの実施形態では、当該変異は、標的配列(複数可)の1つ以上を含む遺伝子から発現されるタンパク質の1つ以上のアミノ酸変化をもたらす。いくつかの実施形態では、この方法は、1つ以上のベクターを当該真核細胞に送達することをさらに含み、この1つ以上のベクターは、Cas9酵素及びダイレクトリピート配列に連結された多重ガイドRNA配列のうち1つ以上の発現を駆動する。該当する場合、tracr配列も提供される。いくつかの実施形態では、当該ベクターは、対象の真核細胞に送達される。いくつかの実施形態では、当該改変は、細胞培養物中の当該真核細胞で行われる。いくつかの実施形態では、この方法は、当該改変の前に対象から当該真核細胞を単離することをさらに含む。いくつかの実施形態では、この方法は、当該真核細胞及び/またはそれに由来する細胞を、当該対象に戻すことをさらに含む。 In one aspect, the invention provides a method of modifying a plurality of target polynucleotides in a host cell such as a eukaryotic cell. In some embodiments, the method binds the Cas9 CRISPR complex to a plurality of target polynucleotides, for example, causing cleavage of the plurality of target polynucleotides, thereby modifying the plurality of target polynucleotides. Thus, the Cas9 CRISPR complex comprises Cas9 enzymes complexed with a plurality of guide sequences, each of which is hybridized to a particular target sequence within the target polynucleotide and the plurality of guide sequences. Is concatenated to a direct repeat sequence. If applicable, tracr sequences may also be provided (eg, to provide a single guide RNA, sgRNA). In some embodiments, the cleavage comprises cleaving one or two strands at the position of each target sequence by the Cas9 enzyme. In some embodiments, the cleavage reduces transcription of multiple target genes. In some embodiments, the method further comprises repairing one or more of the cleaved target polynucleotides by homologous recombination with an extrinsic template polynucleotide, wherein the repair is one or more of the relevant. It results in mutations involving insertions, deletions, or substitutions of one or more nucleotides of the target polynucleotide. In some embodiments, the mutation results in one or more amino acid changes in a protein expressed from a gene containing one or more of the target sequences (s). In some embodiments, the method further comprises delivering one or more vectors to the eukaryotic cell, wherein the one or more vectors are a Cas9 enzyme and a multiplex guide RNA linked to a direct repeat sequence. Drives expression of one or more of the sequences. If applicable, tracr sequences are also provided. In some embodiments, the vector is delivered to eukaryotic cells of interest. In some embodiments, the modification is performed on the eukaryotic cell in a cell culture. In some embodiments, the method further comprises isolating the eukaryotic cell from the subject prior to the modification. In some embodiments, the method further comprises returning the eukaryotic cell and / or cells derived thereof to the subject.

一態様では、本発明は、真核細胞における複数のポリヌクレオチドの発現を改変する方法を提供する。いくつかの実施形態では、この方法は、当該結合が当該ポリヌクレオチドの発現の増大または減少をもたらすようにCas9 CRISPR複合体を複数のポリヌクレオチドに結合させることを含み;ここで、Cas9 CRISPR複合体は、それぞれが当該ポリヌクレオチド内の自身の標的配列に特異的にハイブリダイズする複数のガイド配列と複合したCas9酵素を含み、当該ガイド配列はダイレクトリピート配列に連結されている。該当する場合、tracr配列も提供される。いくつかの実施形態では、この方法は、1つ以上のベクターを当該真核細胞に送達することをさらに含み、ここで、1つ以上のベクターは、Cas9酵素及びダイレクトリピート配列に連結された複数のガイド配列、のうち1つ以上の発現を駆動する。該当する場合、tracr配列も提供され得る。 In one aspect, the invention provides a method of modifying the expression of multiple polynucleotides in eukaryotic cells. In some embodiments, the method comprises binding the Cas9 CRISPR complex to multiple polynucleotides such that the binding results in increased or decreased expression of the polynucleotide; where the Cas9 CRISPR complex is. Contains a Cas9 enzyme complexed with a plurality of guide sequences, each of which specifically hybridizes to its own target sequence within the polynucleotide, and the guide sequence is linked to a direct repeat sequence. If applicable, tracr sequences are also provided. In some embodiments, the method further comprises delivering one or more vectors to the eukaryotic cell, wherein the one or more vectors are linked to a Cas9 enzyme and a direct repeat sequence. Drives the expression of one or more of the guide sequences of. If applicable, tracr sequences may also be provided.

一態様では、本発明は、ダイレクトリピート配列の上流または下流(いずれか該当する場合)に複数のガイドRNA配列を含む組換えポリヌクレオチドを提供し、ここで各ガイド配列は、発現するとCas9 CRISPR複合体の、真核細胞に存在するその対応する標的配列に対する配列特異的結合を誘導する。いくつかの実施形態では、標的配列は、真核細胞に存在するウイルス配列である。該当する場合、tracr配列も提供され得る。いくつかの実施形態では、標的配列は癌原遺伝子または癌遺伝子である。 In one aspect, the invention provides a recombinant polynucleotide comprising a plurality of guide RNA sequences upstream or downstream (if applicable) of a direct repeat sequence, where each guide sequence is expressed as a Cas9 CRISPR complex. Induces sequence-specific binding of the body to its corresponding target sequence present in eukaryotic cells. In some embodiments, the target sequence is a viral sequence present in eukaryotic cells. If applicable, tracr sequences may also be provided. In some embodiments, the target sequence is a proto-oncogene or an oncogene.

本発明の態様は、少なくとも1つ以上の核局在化配列を含み得る、本明細書で定義される、細胞内の目的のゲノム遺伝子座の標的配列にハイブリダイズし得るガイド配列を含むガイドRNA(gRNA)及びCas9酵素を含み得る天然には存在しないかまたは人工の組成物を包含する。 Aspects of the invention include a guide RNA comprising a guide sequence capable of hybridizing to a target sequence of a genomic locus of interest in a cell as defined herein, which may comprise at least one nuclear localized sequence. Includes non-naturally occurring or artificial compositions that may contain (gRNA) and Cas9 enzymes.

本発明の一態様は、本明細書に記載の組成物のいずれかを細胞に導入することにより、細胞内の遺伝子発現を変化させるように目的のゲノム遺伝子座を改変する方法を包含する。 One aspect of the invention includes a method of modifying a genomic locus of interest to alter intracellular gene expression by introducing any of the compositions described herein into a cell.

本発明の態様は、上記の要素が単一の組成物に含まれるか、または個々の組成物に含まれることである。これらの組成物は、有利には、ゲノムレベルで機能的効果を引き出すために宿主に適用され得る。 Aspects of the invention are that the above elements are included in a single composition or in individual compositions. These compositions may advantageously be applied to the host to elicit a functional effect at the genomic level.

本明細書で使用する「ガイドRNA」または「gRNA」という用語は、本明細書のいずれかで使用される傾向を有し、標的核酸配列とハイブリダイズするための標的核酸配列との十分な相補性、及び標的核酸配列に対する核酸標的複合体の直接配列特異的な結合を有する任意のポリヌクレオチド配列を含む。各gRNAは、同じまたは異なるアダプタータンパク質に特異的な複数の結合認識部位(例えば、アプタマー)を含むように設計してもよい。各gRNAは、転写開始部位の上流の-1000-+1核酸(すなわち、TSS)、好ましくは-200核酸のプロモーター領域に結合するように設計してもよい。この配置により、遺伝子の活性化(例えば、転写活性化因子)または遺伝子の阻害(転写抑制因子など)に影響する機能ドメインが改善される。改変gRNAは、組成物に含まれる、1つ以上の標的遺伝子座を標的とする1つ以上の改変gRNAであってもよい(例えば、少なくとも1gRNA、少なくとも2gRNA、少なくとも5gRNA、少なくとも10gRNA、少なくとも20gRNA、少なくとも30gRNA、少なくとも50gRNA)。上記複数のgRNA配列はタンデムに配置してもよく、好ましくはダイレクトリピートにより隔てられる。 The terms "guide RNA" or "gRNA" as used herein tend to be used herein and are fully complementary to the target nucleic acid sequence for hybridization with the target nucleic acid sequence. Includes any polynucleotide sequence having sex and direct sequence-specific binding of the nucleic acid target complex to the target nucleic acid sequence. Each gRNA may be designed to contain multiple binding recognition sites (eg, aptamers) specific for the same or different adapter proteins. Each gRNA may be designed to bind to the promoter region of the -1000- + 1 nucleic acid (ie, TSS), preferably -200 nucleic acid, upstream of the transcription initiation site. This arrangement improves functional domains that affect gene activation (eg, transcriptional activators) or gene inhibition (such as transcriptional repressors). The modified gRNA may be one or more modified gRNAs that target one or more target loci contained in the composition (eg, at least 1 gRNA, at least 2 gRNA, at least 5 gRNA, at least 10 gRNA, at least 20 gRNA, At least 30 gRNA, at least 50 gRNA). The plurality of gRNA sequences may be arranged in tandem, preferably separated by direct repeat.

したがって、本明細書で定義されるgRNA、CRISPR酵素は、それぞれ個別に組成物に含まれ、個別にまたは集合的に宿主に投与されてもよい。あるいは、これらの構成要素は、宿主への投与のために単一の組成物で提供されてもよい。宿主への投与は、当業者に公知であるか、または宿主への送達について本明細書に記載されているウイルスベクター(例えば、レンチウイルスベクター、アデノウイルスベクター、AAVベクター)を介して実施され得る。本明細書で説明されるように、異なる選択マーカーの使用(例えば、レンチウイルスsgRNA選択のため)及びgRNAの濃度(例えば、複数のgRNAが使用されるか否かに依存する)は、改善された効果を引き出すために有利であり得る。この概念に基づいて、DNA切断、遺伝子活性化、または遺伝子不活性化を含むいくつかのバリエーションが、ゲノム遺伝子座事象を誘発するのに適切である。提供された組成物を使用して、当業者は、有利にかつ特異的に、同一または異なる機能的ドメインを有する単一または複数の遺伝子座を標的として、1つ以上のゲノム遺伝子座事象を誘発し得る。組成物は、細胞内のライブラリーでのスクリーニング及びインビボでの機能モデリング(例えば、lincRNAの遺伝子活性化及び機能の同定;機能獲得モデリング;機能喪失モデリング;最適化及びスクリーニングの目的で細胞株及びトランスジェニック動物を確立するための本発明の組成物の使用)のために、広範な種々の方法に適用され得る。 Therefore, the gRNA and CRISPR enzymes defined herein are each individually included in the composition and may be administered to the host individually or collectively. Alternatively, these components may be provided in a single composition for administration to a host. Administration to the host can be performed via viral vectors known to those of skill in the art or described herein for delivery to the host (eg, lentiviral vector, adenoviral vector, AAV vector). .. As described herein, the use of different selectable markers (eg, for lentivirus sgRNA selection) and the concentration of gRNA (eg, depending on whether multiple gRNAs are used) are improved. It can be advantageous to bring out the effect. Based on this concept, several variations, including DNA cleavage, gene activation, or gene inactivation, are suitable for inducing genomic locus events. Using the provided composition, one of ordinary skill in the art will advantageously and specifically induce one or more genomic locus events by targeting a single or multiple loci having the same or different functional domains. Can be. The compositions are screened in an intracellular library and functional modeling in vivo (eg, gene activation and functional identification of lincRNA; functional acquisition modeling; loss of function modeling; cell lines and trans for optimization and screening purposes. It can be applied to a wide variety of methods for the use of the compositions of the invention to establish a genetic animal).

本発明は、条件付きまたは誘導性のCRISPRトランスジェニック細胞/動物を確立及び利用するための本発明の組成物の使用を包含する;例えば、Platt et al.,Cell(2014)、159(2):440-455、またはWO2014/093622(PCT/US2013/074667)などの本明細書で引用したPCT特許公開を参照のこと。例えば、細胞または動物、例えば、非ヒト動物、例えば、脊椎動物または哺乳動物、例えば、げっ歯類、例えば、マウス、ラット、または他の実験動物もしくは野外動物、例えば、ネコ、イヌ、ヒツジなどは、「ノックイン」されてもよく、これにより、動物は条件的または誘導的にCas9をPlattらと同様に発現する。したがって、標的細胞または動物は、標的細胞に導入されたベクターの発現時に、条件的または誘導的に(例えば、Cre依存性構築物の形態で)CRISPR酵素(例えば、Cas9)を含み、標的細胞への導入されたベクターの発現の際に、ベクターは、標的細胞中のCRISPR酵素(例えば、Cas9)発現の状態を誘導または上昇させるものを発現する。本明細書で定義される教示及び組成物を、CRISPR複合体を作成する公知の方法に適用することにより、誘導可能なゲノム事象も本発明の態様である。そのような誘導事象の例は、本明細書の他のいずれかに説明されている。 The invention includes the use of the compositions of the invention to establish and utilize conditional or inducible CRISPR transgenic cells / animals; eg, Platt et al. , Cell (2014), 159 (2): 440-455, or WO 2014/093622 (PCT / US2013 / 074667), etc., see PCT patent publications cited herein. For example, cells or animals such as non-human animals such as vertebrates or mammals such as rodents such as rodents such as mice, rats or other laboratory or field animals such as cats, dogs, sheep and the like. , May be "knocked in", whereby the animal conditionally or inductively expresses Cas9 as well as Platt et al. Thus, the target cell or animal contains the CRISPR enzyme (eg, Cas9) conditionally or inductively (eg, in the form of a Cre-dependent construct) upon expression of the vector introduced into the target cell and into the target cell. Upon expression of the introduced vector, the vector expresses one that induces or enhances the state of expression of the CRISPR enzyme (eg, Cas9) in the target cell. Genomic events that can be induced by applying the teachings and compositions defined herein to known methods of making CRISPR complexes are also embodiments of the invention. Examples of such induced events are described elsewhere herein.

いくつかの実施形態では、発現型の変化は、好ましくは、特に治療の方法において、及び好ましくは表現型を修正または変更する修復テンプレートが提供される、遺伝的疾患を標的とするゲノム改変の結果である。 In some embodiments, changes in phenotype are preferably the result of genomic modification targeting a genetic disease, preferably in a method of treatment, and preferably provided with a repair template that modifies or alters the phenotype. Is.

いくつかの実施形態では、標的とされ得る疾患としては、疾患を引き起こすスプライス欠陥に関係する疾患が挙げられる。 In some embodiments, the disease that can be targeted includes diseases associated with the splice defect that causes the disease.

いくつかの実施形態では、細胞標的としては、造血幹細胞/前駆細胞(CD34+);ヒトT細胞;及び目(網膜細胞)-例えば、視細胞前駆細胞が挙げられる。 In some embodiments, cell targets include hematopoietic stem cells / progenitor cells (CD34 +); human T cells; and eyes (retinal cells)-eg, photoreceptor progenitor cells.

いくつかの実施形態では、遺伝子標的としては以下が挙げられる:ヒトベータグロビン-HBB(遺伝子変換を刺激することを含む(内因性テンプレートとして密接に関連するHBD遺伝子を使用する)鎌状赤血球貧血の治療用);CD3(T細胞);及びCEP920-網膜(目)。 In some embodiments, gene targets include: human betaglobin-HBB, which comprises stimulating gene conversion (using the closely related HBD gene as an endogenous template) for sickle cell anemia. (Therapeutic); CD3 (T cells); and CEP920-retina (eye).

いくつかの実施形態では、疾患標的には以下も挙げられる:癌;鎌状赤血球貧血(点変異に基づく);HBV、HIV;ベータサラセミア;及び眼疾患または眼疾患-例えばレーバー先天性黒内障(LCA)-スプライス欠陥の原因。 In some embodiments, disease targets also include: cancer; sickle cell anemia (based on point mutations); HBV, HIV; beta-thalassemia; and eye disease or eye disease-eg, Leber congenital cyst (LCA). ) -Cause of splice defects.

いくつかの実施形態では、送達方法としては、以下が挙げられる:酵素ガイド複合体(RiboNucleoProtein)のカチオン性脂質媒介「直接」送達及びプラスミドDNAのエレクトロポレーション。 In some embodiments, delivery methods include: cationic lipid-mediated "direct" delivery of the enzyme-guided complex (RiboNucleoProtein) and electroporation of plasmid DNA.

本明細書に記載される方法、生成物及び使用は、非治療目的に使用されてもよい。さらに、本明細書に記載された任意の方法は、インビトロ及びエクスビボで適用されてもよい。 The methods, products and uses described herein may be used for non-therapeutic purposes. In addition, any of the methods described herein may be applied in vitro and in Exvivo.

一態様では、以下を含む天然には存在しないか、または操作された組成物が提供され:
I.以下を含む2つ以上のCRISPR-Cas系ポリヌクレオチド配列
(a)ポリヌクレオチド遺伝子座の第1の標的配列にハイブリダイズし得る第1のガイド配列、
(b)ポリヌクレオチド遺伝子座の第2の標的配列にハイブリダイズし得る第2のガイド配列、
(c)ダイレクトリピート配列、
ならびに
II.Cas9酵素またはそれをコードする第2のポリヌクレオチド配列、
ここで、転写されると、第1及び第2のガイド配列は、それぞれ第1及び第2のCas9 CRISPR複合体の第1及び第2の標的配列への配列特異的結合を誘導し、
ここで、この第1のCRISPR複合体は、第1の標的配列にハイブリダイズ可能な第1のガイド配列と複合体化したCas9酵素を含み、
ここで、第2のCRISPR複合体は、第2の標的配列にハイブリダイズ可能な第2のガイド配列と複合体化したCas9酵素を含み、かつ
ここで、第1ガイド配列は、第1標的配列近くのDNA二重鎖の一方の鎖の切断を誘導し、第2のガイド配列は、二本鎖切断を誘発する第2標的配列近くの他方の鎖の切断を指示し、それにより生物または非ヒトまたは非ヒト生物を改変する。同様に、3つ以上のガイドRNAを含む組成物が想定され得、例えば、それぞれが1つの標的に特異的であり、本明細書に記載の組成物またはCRISPR系または複合体にタンデムに配列され得る。
In one aspect, a non-naturally occurring or engineered composition is provided that includes:
I. Two or more CRISPR-Cas-based polynucleotide sequences including: (a) A first guide sequence capable of hybridizing to a first target sequence at a polynucleotide locus,
(B) A second guide sequence that can hybridize to a second target sequence at the polynucleotide locus,
(C) Direct repeat sequence,
And II. Cas9 enzyme or a second polynucleotide sequence encoding it,
Here, when transcribed, the first and second guide sequences induce sequence-specific binding of the first and second Cas9 CRISPR complexes to the first and second target sequences, respectively.
Here, the first CRISPR complex comprises a Cas9 enzyme complexed with a first guide sequence capable of hybridizing to the first target sequence.
Here, the second CRISPR complex comprises a Cas9 enzyme complexed with a second guide sequence capable of hybridizing to the second target sequence, where the first guide sequence is the first target sequence. The second guide sequence directs the cleavage of one strand of the nearby DNA duplex and the second guide sequence directs the cleavage of the other strand near the second target sequence that induces double-strand breaks, thereby biological or non-biological. Modify human or non-human organisms. Similarly, compositions containing three or more guide RNAs can be envisioned, for example, each of which is specific for one target and is tandemly arranged in the compositions or CRISPR systems or complexes described herein. obtain.

別の実施形態では、Cas9はタンパク質として細胞に送達される。別の特に好ましい実施形態では、Cas9は、タンパク質またはそれをコードするヌクレオチド配列として細胞に送達される。タンパク質としての細胞への送達には、タンパク質が複数のガイドと複合している、リボ核タンパク質(RNP)複合体の送達が含まれる場合がある。 In another embodiment Cas9 is delivered to cells as a protein. In another particularly preferred embodiment, Cas9 is delivered to the cell as a protein or a nucleotide sequence encoding it. Delivery to cells as a protein may include delivery of a ribonucleoprotein (RNP) complex in which the protein is complexed with multiple guides.

ある態様では、幹細胞及びその子孫を含む、本発明の組成物、系もしくは改変された酵素により改変されたか、またはそれらを含む宿主細胞及び細胞株が提供される。 In some embodiments, host cells and cell lines modified by or containing the compositions, systems or modified enzymes of the invention, including stem cells and their progeny, are provided.

一態様では、例えば、単一の細胞または細胞の集団がサンプリングまたは培養される細胞療法の方法が提供され、その細胞(複数可)は、本明細書に記載されるようにエクスビボで改変されるか、または改変されており、その後、生物に再導入(サンプリングされた細胞)または導入(培養細胞)される。胚性幹細胞または多能性幹細胞または全能性幹細胞を誘導する幹細胞も、この点で特に好ましい。しかし、もちろん、インビボの実施形態も想定される。 In one aspect, for example, a method of cell therapy in which a single cell or population of cells is sampled or cultured is provided, the cells (s) being modified with Exvivo as described herein. It is either or modified and then reintroduced (sampled cells) or introduced (cultured cells) into the organism. Embryonic stem cells or pluripotent stem cells or stem cells that induce totipotent stem cells are also particularly preferred in this regard. However, of course, in vivo embodiments are also envisioned.

本発明の方法は、dsODNまたはssODNであり得る、修復テンプレートなどのテンプレートの送達をさらに含んでもよい(以下を参照)。テンプレートの送達は、CRISPR酵素またはガイドRNAのいずれかまたはすべての送達と同時または別個の送達を介してもよく、同じ送達メカニズムまたは異なる送達を介してもよい。いくつかの実施形態では、テンプレートは、ガイドRNA及び好ましくはCRISPR酵素とともに送達されることが好ましい。例は、CRISPR酵素がAsCas9またはLbCas9であるAAVベクターであり得る。 The method of the invention may further comprise delivery of a template, such as a repair template, which may be dsODN or ssODN (see below). Template delivery may be via simultaneous or separate delivery of either or all of the CRISPR enzyme or guide RNA, and may be via the same delivery mechanism or different delivery. In some embodiments, the template is preferably delivered with a guide RNA and preferably a CRISPR enzyme. An example can be an AAV vector in which the CRISPR enzyme is AsCas9 or LbCas9.

本発明の方法はさらに以下を含み得る:(a)当該二本鎖切断により生じるオーバーハングに相補的なオーバーハングを含む二本鎖オリゴデオキシヌクレオチド(dsODN)を細胞に送達することであって、ここで当該dsODNは、目的の遺伝子座に組み込まれている送達;または-(b)一本鎖オリゴデオキシヌクレオチド(ssODN)を細胞に送達することであって、ここで、当該ssODNは、当該二本鎖切断の修復に関する相同性のテンプレートとして機能する。本発明の方法は、個体における疾患の予防または治療のためのものであり得、任意選択で、上記疾患は、目的の当該遺伝子座の欠陥によって引き起こされる。本発明の方法は、個体においてインビボで、または個体から採取した細胞に対してエクスビボで実施することができ、任意選択で、当該細胞は個体に戻される。 The method of the invention may further include: (a) delivering to the cell a double-stranded oligodeoxynucleotide (dsODN) containing an overhang complementary to the overhang caused by the double-strand break. Here, the dsODN is a delivery integrated at a locus of interest; or-(b) delivery of a single-stranded oligodeoxynucleotide (ssODN) to a cell, wherein the ssODN is the second. Serves as a template for homology for repair of main-strand breaks. The methods of the invention can be for the prevention or treatment of a disease in an individual, and optionally, the disease is caused by a defect in the locus of interest. The method of the invention can be performed in vivo in an individual or in vivo against cells harvested from an individual, and optionally the cells are returned to the individual.

本発明はまた、本明細書で定義されるタンデムまたは多重標的化で使用するためのCRISPR酵素またはCas酵素またはCas9酵素またはCRISPR-CRISPR酵素またはCRISPR-Cas系またはCRISPR-Cas9系を使用することから得られる生成物を包含する。 The present invention also uses the CRISPR enzyme or Cas enzyme or Cas9 enzyme or CRISPR-CRISPR enzyme or CRISPR-Cas or CRISPR-Cas9 system for use in tandem or multiple targeting as defined herein. Includes the resulting product.

本発明によるCas9 CRISPR-Cas系のエスコートされたガイド
一態様では、本発明は、エスコート型Cas9 CRISPR-Cas系、または複合体、特にエスコート型のCas9 CRISPR-Cas系ガイドを含む系などを提供する。「エスコート型(escorted)」とは、Cas9 CRISPR-Cas系または複合体またはガイドが、選択された時間に細胞内に送達されるか、または細胞内の選択された場所に送達され、その結果、Cas9 CRISPR-Cas系または複合体またはガイドの活性が空間的または時間的に制御されることを意味する。例えば、Cas9 CRISPR-Cas系または複合体またはガイドの活性及び目的地は、アプタマーリガンド(細胞表面タンパク質または他の局在化細胞構成要素など)に対する結合親和性を有するエスコートRNAアプタマー配列によって制御され得る。あるいは、エスコートアプタマーは、例えば、一過性エフェクター(特定の時間に細胞に適用される外的エネルギー源など)などの細胞上アプタマーエフェクターまたは細胞内アプタマーエフェクターに応答性であり得る。
Cas9 CRISPR-Cas-based escorted guides according to the present invention In one aspect, the invention provides an escort-type Cas9 CRISPR-Cas system, or a complex, particularly a system comprising an escort-type Cas9 CRISPR-Cas-based guide. .. An "escorted" is when the Cas9 CRISPR-Cas system or complex or guide is delivered intracellularly at a selected time or to a selected location within the cell, as a result. Cas9 CRISPR-Cas means that the activity of the system or complex or guide is spatially or temporally regulated. For example, the activity and destination of the Cas9 CRISPR-Cas system or complex or guide can be controlled by an escort RNA aptamer sequence that has a binding affinity for an aptamer ligand, such as a cell surface protein or other localized cell component. .. Alternatively, the escort aptamer may be responsive to an intracellular or intracellular aptamer effector, such as a transient effector (such as an external energy source applied to a cell at a particular time).

エスコート型のCas9 CRISPR-Cas系またはC複合体は、gRNAの構造、構造様式、安定性、遺伝的発現、またはそれらの任意の組み合わせが改善するように設計された機能構造を有するgRNAを有する。そのような構造は、アプタマーを含んでもよい。 The escort-type Cas9 CRISPR-Cas system or C complex has a gRNA having a functional structure designed to improve the structure, structural mode, stability, genetic expression, or any combination thereof of the gRNA. Such structures may include aptamers.

アプタマーは、他のリガンドに堅固に結合するように設計されるか、または選択され得る生体分子であり、こうした設計または選択では、例えば、指数関数的濃縮によるリガンドの系統的進化(SELEX;Tuerk C,Gold L:“Systematic evolution of ligands by exponential enrichment:RNA ligands to bacteriophage T4 DNA polymerase.”Science 1990,249:505-510)と呼ばれる技術が使用される。核酸アプタマーは、例えば、ランダム配列のオリゴヌクレオチドのプールから選択してもよく、こうしたオリゴヌクレオチドは、生物医学的に関連する広範な標的に対して高い結合親和性及び特異性を有することから、アプタマーの治療有用性が広範囲にわたることが示唆されている(Keefe, Anthony D.,Supriya Pai,and Andrew Ellington.“Aptamers as therapeutics.”Nature Reviews Drug Discovery 9.7(2010):537-550)。こうした特徴は、薬物送達媒体としてのアプタマーの用途が広範囲にわたることも示唆している(Levy-Nissenbaum,Etgar,et al.“Nanotechnology and aptamers:applications in drug delivery.”Trends in biotechnology 26.8(2008):442-449;及びHicke BJ,Stephens AW.“Escort aptamers:a delivery service for diagnosis and therapy.”J Clin Invest 2000,106:923-928.)。特性変化による合図に応答することで分子スイッチとして機能するアプタマーを構築してもよく、こうしたアプタマーは、フルオロフォアに結合して緑色蛍光タンパク質の活性を模倣するRNAアプタマーなどである(Paige,Jeremy S.,Karen Y.Wu,and Samie R.Jaffrey.“RNA mimics of green fluorescent protein.”Science 333.6042(2011):642-646)。標的化されたsiRNA治療送達系の構成要素としてアプタマーを使用し得ることも示唆されており、こうしたsiRNA治療送達系では、例えば、細胞表面タンパク質が標的とされる(Zhou,Jiehua,and John J.Rossi.“Aptamer-targeted cell-specific RNA interference.”Silence 1.1(2010):4)。 Aptamers are biomolecules that are designed or may be selected to bind tightly to other ligands, with such design or selection being, for example, systematic evolution of ligands by exponential enrichment (SELEX; Tuerk C). , Gold L: "Systematic evolution of ligands by exponental enrichment: RNA ligands to bacteriophage T4 DNA polymerase." Science (1990, 249: 505-10). Nucleic acid aptamers may be selected, for example, from a pool of random sequence oligonucleotides, as these oligonucleotides have high binding affinity and specificity for a wide range of biomedically relevant targets. It has been suggested that the therapeutic usefulness of Nucleotide is widespread (Keefe, Anthony D., Supriya Pai, and Andrew Ellington. “Aptamers as therapeutics.” Nature Review5: 7 (37.Views. These features also suggest that aptamers as a drug delivery medium have a wide range of uses (Levy-Nissenbaum, Etgar, et al. "Nanotechnology and aptamers: applications in drug delivery." Trends in Biotechnology. "Trends in Biotechnology." ): 442-449; and Hicke BJ, Stephens AW. "Escort aptamers: a delivery service for disease and therapy." J Clin Invest 2000, 106: 923-928. Aptamers that function as molecular switches may be constructed in response to characterization cues, such as RNA aptamers that bind to the fluorophore and mimic the activity of green fluorescent protein (Paige, Jeremy S). , Karen Y. Wu, and Samie R. Jaffrey. "RNA mimics of green fluororescent protein." Science 333.6042 (2011): 642-646). It has also been suggested that aptamers may be used as components of targeted siRNA therapeutic delivery systems, in which, for example, cell surface proteins are targeted (Zhou, Jiehua, and John J. Rossi. Rossi. "Aptamer-targeted cell-specific RNA interference." Silence 1.1 (2010): 4).

したがって、本明細書に提供されるのは、例えば、細胞膜を横切るか、細胞内区画への、または核への送達を含む、gRNA送達を改善するように設計された1つ以上のアプタマー(複数可)による、改変されたgRNAである。そのような構造は、ガイドを選択エフェクターに対して送達性、誘導性、または応答性にさせるために、部分(複数可)を、1つ以上のアプタマー(複数可)に加えて、またはそのような1つ以上のアプタマー(複数可)部分(複数可)は含まずに、含んでもよい。したがって、本発明は、正常または病的な生理学的条件に応答するgRNAを包含し、こうした生理学的条件には、限定されないが、pH、低酸素、O濃度、温度、タンパク質濃度、酵素濃度、脂質構造、光に対する曝露、機械的な破砕(例えば、超音波)、磁場、電場、または電磁放射線が含まれる。 Accordingly, provided herein is one or more aptamers designed to improve gRNA delivery, including, for example, crossing the cell membrane, subcellular compartment, or to the nucleus. It is a modified gRNA according to (possible). Such structures add a portion (s) to one or more aptamers (s) or so to make the guide deliverable, inducible, or responsive to the selective effector. One or more aptamer (s) portions (s) may be included without being included. Accordingly, the invention includes gRNAs that respond to normal or pathological physiological conditions, including, but not limited to, pH, hypoxia, O2 concentration, temperature, protein concentration, enzyme concentration, and the like. Includes lipid structure, exposure to light, mechanical disruption (eg, ultrasound), magnetic fields, electric fields, or electromagnetic radiation.

本発明の態様は、以下を含むエスコート型ガイドRNA(egRNA)を含む天然には存在しないまたは操作された組成物を提供する:
細胞内の目的のゲノム遺伝子座の標的配列にハイブリダイズし得るRNAガイド配列;及び、
エスコートRNAアプタマー配列、ここで、エスコートアプタマーは、細胞上もしくは細胞内のアプタマーリガンドに対して結合親和性を有するか、またはエスコートアプタマーは、細胞上または細胞内の局在化アプタマーエフェクターに応答し、アプタマーリガンドもしくはエフェクターの細胞または細胞内の存在は空間的または時間的に制限されている。
Aspects of the invention provide a non-naturally occurring or engineered composition comprising an escort-type guide RNA (egRNA) comprising:
RNA-guided sequences that can hybridize to the target sequence of the genomic locus of interest in the cell;
Escort RNA aptamer sequences, where escort aptamers have binding affinity for intracellular or intracellular aptamer ligands, or escort aptamers respond to intracellular or intracellular localized aptamer effectors. The presence of aptamer ligands or effectors in or within cells is spatially or temporally restricted.

エスコートアプタマーは、例えば、細胞内のアプタマーリガンドまたはエフェクターとの相互作用に応じて立体構造を変化させ得る。 Escort aptamers can, for example, change their conformation depending on their interaction with intracellular aptamer ligands or effectors.

エスコートアプタマーは、アプタマーリガンドに対して特異的な結合親和性を有し得る。 Escort aptamers can have specific binding affinities for aptamer ligands.

アプタマーリガンドは、細胞の位置または区画、例えば細胞の膜上または細胞膜内に局在していてもよい。したがって、エスコートアプタマーのアプタマーリガンドへの結合は、細胞表面リガンドであるアプタマーリガンドへの結合により、細胞の内部などの細胞内の目的の位置にegRNAを誘導してもよい。このようにして、細胞核またはミトコンドリアなど、細胞内の様々な空間的に制限された場所を標的としてもよい。 Aptamer ligands may be localized to cell locations or compartments, such as on or within the cell membrane. Therefore, the binding of the escort aptamer to the aptamer ligand may induce the egRNA to a desired position in the cell such as inside the cell by binding to the aptamer ligand which is a cell surface ligand. In this way, various spatially restricted locations within the cell, such as the cell nucleus or mitochondria, may be targeted.

細胞のゲノム内の遺伝子の意図されたコピーを編集することなどにより、意図された変更が一旦、導入されると、その細胞における継続的なCRISPR/Cas9発現はもはや必要ではない。実際、持続的な発現は、意図しないゲノム部位などでのオフターゲット効果の場合など、特定のケースでは望ましくはない。したがって、時間制限のある発現が有用である。誘導発現は、1つのアプローチを提供するが、さらに、出願人は、CRISPRベクター自体内の非コーディングガイド標的配列の使用に依存する自己不活性化Cas9 CRISPR-Cas系を操作した。したがって、発現が始まった後、CRISPR系は、それ自身の破壊につながるが、破壊が完了する前に、標的遺伝子のゲノムコピーを編集する時間がある(二倍体細胞の正常な点変異では、せいぜい2つの編集しか要さない)。簡単に言えば、自己不活性化Cas9 CRISPR-Cas系には、CRISPR酵素自体のコーディング配列を標的とするか、または以下の1つ以上に存在する固有の配列に相補的な1つ以上の非コーディングガイド標的配列を標的とする追加のRNA(すなわちガイドRNA)が含まれている:(a)非コードRNA要素の発現を促進するプロモーター内、(b)Cas9遺伝子の発現を促進するプロモーター内、(c)Cas9コード配列のATG翻訳開始コドンの100bp内、(d)ウイルス送達ベクターの逆方向末端反復配列(iTR)内、例えばAAVゲノム内。 Once the intended changes have been introduced, such as by editing the intended copy of the gene within the cell's genome, continuous CRISPR / Cas9 expression in the cell is no longer necessary. In fact, sustained expression is not desirable in certain cases, such as for off-target effects such as at unintended genomic sites. Therefore, time-limited expression is useful. Induced expression provides one approach, but in addition, Applicants have engineered a self-inactivating Cas9 CRISPR-Cas system that relies on the use of non-coding guide target sequences within the CRISPR vector itself. Therefore, after the onset of expression, the CRISPR system leads to its own disruption, but before the disruption is complete, there is time to edit the genomic copy of the target gene (in normal point mutations in diploid cells). Only two edits are required at most). Simply put, the self-inactivating Cas9 CRISPR-Cas system targets one or more non-generic sequences that target the coding sequence of the CRISPR enzyme itself or are present in one or more of the following: Coding guides Contains additional RNA (ie, guide RNA) that targets the target sequence: (a) within a promoter that promotes expression of non-coding RNA elements, (b) within a promoter that promotes expression of the Cas9 gene, (C) within 100 bp of the ATG translation initiation codon of the Cas9 coding sequence, (d) within the reverse terminal repeat sequence (iTR) of the virus delivery vector, eg, within the AAV genome.

egRNAは、エスコートRNA配列をRNAガイド配列に機能可能なように連結するRNAアプタマー連結配列を含んでもよい。 The egRNA may include an RNA aptamer ligation sequence that operably links the escort RNA sequence to the RNA guide sequence.

実施形態では、egRNAは、1つ以上の光不安定性結合または天然には存在しない残基を含み得る。 In embodiments, the egRNA may contain one or more photolabile bindings or non-naturally occurring residues.

一態様では、エスコートRNAアプタマー配列は、細胞内に存在する場合も存在しない場合もある標的miRNAに相補的であり得、その結果、標的miRNAが存在する場合にのみ、標的miRNAへエスコートRNAアプタマー配列が結合し、細胞内のRNA誘導サイレンシング複合体(RISC)によるegRNAの切断が生じる。 In one aspect, the escort RNA aptamer sequence can be complementary to the target miRNA, which may or may not be present in the cell, so that the escort RNA aptamer sequence to the target miRNA only if the target miRNA is present. Binds, resulting in cleavage of the egRNA by intracellular RNA-induced silencing complex (RISC).

実施形態では、エスコートRNAアプタマー配列は、例えば、10~200ヌクレオチド長であり得、egRNAは、2つ以上のエスコートRNAアプタマー配列を含んでもよい。 In embodiments, the escort RNA aptamer sequence can be, for example, 10-200 nucleotides in length, and the egRNA may comprise two or more escort RNA aptamer sequences.

本明細書の他のいずれかに記載されている任意のRNAガイド配列は、本明細書に記載されているegRNAに使用され得ることを理解されたい。本発明の特定の実施形態では、ガイドRNAまたは成熟crRNAは、ダイレクトリピート配列及びガイド配列またはスペーサー配列を含むか、本質的にそれらからなるか、またはそれらからなる。特定の実施形態では、ガイドRNAまたは成熟crRNAは、ガイド配列またはスペーサー配列に連結されたダイレクトリピート配列を含むか、本質的にそれからなるか、またはそれからなる。特定の実施形態では、ガイドRNAまたは成熟crRNAは、19ntの部分的ダイレクトリピートとそれに続く23~25ntのガイド配列またはスペーサー配列を含む。特定の実施形態では、エフェクタータンパク質は、FnCas9エフェクタータンパク質であり、検出可能なDNA切断を達成するために少なくとも16ntのガイド配列、及びインビトロで効率的なDNA切断を達成するために最低17ntのガイド配列を必要とする。特定の実施形態では、ダイレクトリピート配列は、ガイド配列またはスペーサー配列の上流(すなわち、5’)に位置する。好ましい実施形態では、FnCas9ガイドRNAのシード配列(すなわち、標的遺伝子座の配列への認識及び/またはハイブリダイゼーションに不可欠な配列)は、ほぼガイド配列またはスペーサー配列の5’末端の最初の5nt以内にある。 It should be appreciated that any RNA guide sequence described elsewhere herein can be used for the egRNA described herein. In certain embodiments of the invention, the guide RNA or mature crRNA comprises, consists of, or consists of direct repeat sequences and guide sequences or spacer sequences. In certain embodiments, the guide RNA or mature crRNA comprises, consists essentially of, or consists of a direct repeat sequence linked to a guide sequence or spacer sequence. In certain embodiments, the guide RNA or mature crRNA comprises 19 nt partial direct repeats followed by 23-25 nt guide or spacer sequences. In certain embodiments, the effector protein is a FnCas9 effector protein with a guide sequence of at least 16 nt to achieve detectable DNA cleavage and a guide sequence of at least 17 nt to achieve efficient DNA cleavage in vitro. Needs. In certain embodiments, the direct repeat sequence is located upstream (ie, 5') of the guide or spacer sequence. In a preferred embodiment, the seed sequence of the FnCas9 guide RNA (ie, the sequence essential for recognition and / or hybridization of the target locus sequence) is approximately within the first 5 nt of the 5'end of the guide sequence or spacer sequence. be.

egRNAは、少なくとも1つの変異、例えばCas9が少なくとも1つの変異を有さないCas9のヌクレアーゼ活性の5%以下を有する、例えば少なくとも1つの変異を有さないCas9と比較して少なくとも97%または100%の減少したヌクレアーゼ活性を有するような変異を有し得るCas9とともに、天然には存在しないかまたは操作されたCas9 CRISPR-Cas複合体中に含まれてもよい。Cas9はまた、1つ以上の核局在化配列を含んでもよい。ヌクレアーゼ活性の低下などの調節された活性を有する変異Cas9酵素は、本明細書の他のいずれかに記載されている。 The egRNA has at least one mutation, eg Cas9 has at least 5% or less of the nuclease activity of Cas9 without at least one mutation, eg, at least 97% or 100% compared to Cas9 without at least one mutation. It may be included in a naturally absent or engineered Cas9 CRISPR-Cas complex, along with Cas9 which may have mutations such as having reduced nuclease activity. Cas9 may also contain one or more nuclear localization sequences. Mutant Cas9 enzymes with regulated activity, such as reduced nuclease activity, are described elsewhere herein.

操作されたCas9 CRISPR-Cas組成物は、真核細胞、哺乳動物細胞、またはヒト細胞などの細胞中に提供されてもよい。 The engineered Cas9 CRISPR-Cas composition may be provided in cells such as eukaryotic cells, mammalian cells, or human cells.

実施形態では、本明細書に記載の組成物は、少なくとも3つの機能的ドメインを有するCas9 CRISPR-Cas複合体を含み、その少なくとも1つはCas9に関連し、少なくとも2つはegRNAに関連する。 In embodiments, the compositions described herein comprise a Cas9 CRISPR-Cas complex having at least three functional domains, at least one of which is associated with Cas9 and at least two of which are associated with egRNA.

本明細書に記載の組成物は、真核細胞、特に哺乳類細胞、または非ヒト真核生物、特にマウスのような非ヒト哺乳動物などの宿主細胞にゲノム遺伝子座事象をインビボで導入するために使用してもよい。ゲノム遺伝子座事象は、遺伝子座の遺伝子活性化、遺伝子阻害、または切断に影響を及ぼすことを包含し得る。本明細書に記載される組成物はまた、目的のゲノム遺伝子座を改変して、細胞内の遺伝子発現を変化させるために使用してもよい。本明細書で提供されるCas9酵素を使用して宿主細胞にゲノム遺伝子座事象を導入する方法は、本明細書の他のいずれかに詳細に説明されている。組成物の送達は、例えば、組成物をコードする核酸分子(複数可)の送達によるものであり、その核酸分子(複数可)は調節配列(複数可)に機能可能なように連結されており、核酸分子(複数可)の発現は、インビボで、例えば、レンチウイルス、アデノウイルス、またはAAVによる。 The compositions described herein are used to introduce genomic locus events in vivo into eukaryotic cells, especially mammalian cells, or host cells such as non-human eukaryotes, especially non-human mammals such as mice. You may use it. Genomic locus events can include affecting gene activation, gene inhibition, or cleavage of a locus. The compositions described herein may also be used to modify the genomic locus of interest to alter intracellular gene expression. Methods for introducing genomic locus events into host cells using the Cas9 enzyme provided herein are described in detail elsewhere herein. Delivery of the composition is, for example, by delivery of the nucleic acid molecule (s) encoding the composition, the nucleic acid molecule (s) being operably linked to a regulatory sequence (s). , Nucleic acid molecules (s) are expressed in vivo, eg, by lentivirus, adenovirus, or AAV.

本発明は、gRNA媒介遺伝子編集活性が適合させられ得る組成物及び方法を提供する。本発明は、gRNAを増大させること及び/または細胞に送達されるRNAの量を増大させることにより、切断効率を改善するgRNA二次構造を提供する。gRNAは、軽度に不安定または誘導可能なヌクレオチドを含んでもよい。 The present invention provides compositions and methods to which gRNA-mediated gene editing activity can be adapted. The present invention provides gRNA secondary structure that improves cleavage efficiency by increasing gRNA and / or increasing the amount of RNA delivered to cells. The gRNA may contain a slightly unstable or inducible nucleotide.

gRNA、例えばウイルスまたは非ウイルス技術で送達されるgRNAの有効性を増大するために、出願人は、その安定性を向上し、遺伝子編集を改善する二次構造をgRNAに追加した。それとは別に、効果的な送達の欠如を克服するために、出願人は、細胞透過性RNAアプタマーでgRNAを改変した;アプタマーは細胞表面受容体に結合し、細胞へのgRNAの侵入を促進する。特に、細胞透過性アプタマーは、細胞特異的送達を媒介するために、特定の細胞受容体を標的とするように設計してもよい。出願人はまた、誘導可能なガイドも作成した。 To increase the effectiveness of gRNAs, such as gRNAs delivered by viral or non-viral techniques, Applicants have added secondary structures to gRNAs that improve their stability and improve gene editing. Separately, to overcome the lack of effective delivery, Applicants modified gRNAs with cell-permeable RNA aptamers; aptamers bind to cell surface receptors and promote the entry of gRNAs into cells. .. In particular, cell-permeable aptamers may be designed to target specific cell receptors in order to mediate cell-specific delivery. Applicants have also created a guide that can be guided.

誘導系の光応答性は、クリプトクロム-2及びCIB1の活性化及び結合を介して達成され得る。青色光による刺激によってクリプトクロム-2の立体構造変化の活性化が誘導され、その結果、その結合パートナーであるCIB1がリクルートされる。この結合は、迅速かつ可逆的であり、パルス刺激から15秒未満で飽和に達し、刺激の終了後から15分未満でベースラインに戻る。こうして結合動力学が迅速であることで、系を時間的に拘束するものは、誘導剤の取り込み及びクリアランスではなく、転写/翻訳及び転写物分解/タンパク質分解の速度のみとなる。クリプトクロム-2の活性化もまた、高度に感受性であることから、刺激に使用する光強度を低くすることを可能にし、光毒性のリスクを軽減する。さらに、インタクトな哺乳類脳などの状況では、刺激する領域のサイズを制御するために強度を変えて光を使用し得ることで、ベクター送達単体で得られ得るものと比較して高い精度を得ることが可能となり得る。 The photoresponsiveness of the inducible system can be achieved via activation and binding of cryptochrome-2 and CIB1. Stimulation with blue light induces activation of the conformational change of cryptochrome-2, resulting in recruitment of its binding partner, CIB1. This binding is rapid and reversible, reaching saturation in less than 15 seconds after pulse stimulation and returning to baseline in less than 15 minutes after the end of stimulation. This rapid binding kinetics thus constrains the system only in the rate of transcription / translation and transcription / proteolysis, not inducible uptake and clearance. Activation of cryptochrome-2 is also highly sensitive, allowing for lower light intensity used for irritation and reducing the risk of phototoxicity. In addition, in situations such as the intact mammalian brain, the ability to use light at varying intensities to control the size of the stimulating region provides higher accuracy compared to what can be obtained with vector delivery alone. Can be possible.

本発明は、ガイドを誘導するためのエネルギー源(電磁放射線、音エネルギー、または熱エネルギーなど)を企図する。有利なことに、電磁放射線は、可視光の構成要素である。好ましい実施形態では、光は、約450~約495nmの波長を有する青色光である。特に好ましい実施形態では、波長は、約488nmである。別の好ましい実施形態では、光刺激は、パルスを介するものである。光出力は、約0~9mW/cmの範囲であり得る。好ましい実施形態では、刺激系列を、15秒ごとに0.25秒という短いものにすれば、活性化が最大化することになる。 The present invention contemplates an energy source for guiding a guide (such as electromagnetic radiation, sound energy, or thermal energy). Advantageously, electromagnetic radiation is a component of visible light. In a preferred embodiment, the light is blue light having a wavelength of about 450-about 495 nm. In a particularly preferred embodiment, the wavelength is about 488 nm. In another preferred embodiment, the photostimulation is via a pulse. The light output can be in the range of about 0-9 mW / cm 2 . In a preferred embodiment, the stimulation sequence is as short as 0.25 seconds every 15 seconds to maximize activation.

本発明の実施に関与する細胞は、原核生物細胞であっても、または真核生物細胞であってもよく、動物細胞、植物細胞または酵母細胞であることが有利であり、さらに哺乳動物細胞であることが有利であり得る。 The cells involved in the practice of the present invention may be prokaryotic cells or eukaryotic cells, preferably animal cells, plant cells or yeast cells, and even mammalian cells. It can be advantageous to be.

化学的感受性またはエネルギー感受性のガイドは、化学源の結合またはエネルギーによって誘導されると、立体構造が変化することで、ガイドとして働くことが可能となり、Cas9 CRISPR-Cas系または複合体の機能を有し得る。本発明は、ガイド機能及びCas9 CRISPR-Cas系または複合体の機能を有するように化学源またはエネルギーを適用すること;及びゲノム遺伝子座の発現変化を任意選択でさらに決定すること、を含み得る。 A guide for chemical or energy sensitivity can act as a guide by changing the conformation when induced by the binding or energy of a chemical source and has the function of a Cas9 CRISPR-Cas system or complex. Can be. The invention may include applying a chemical source or energy to have guide function and function of the Cas9 CRISPR-Cas system or complex; and optionally further determining changes in the expression of genomic loci.

この化学的誘導系には、異なる設計がいくつか存在する:1.アブシジン酸(ABA)によって誘導可能なABI-PYLベースの系(例えば、http://stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2を参照のこと)、2.ラパマイシン(またはラパマイシンに基づく関連化学物質)によって誘導可能なFKBP-FRBベースの系(例えば、http://www.nature.com/nmeth/journal/v2/n6/full/nmeth763.htmlを参照のこと)、3.ジベレリン(GA)によって誘導可能なGID1-GAIベースの系(例えば、http://www.nature.com/nchembio/journal/v8/n5/full/nchembio.922.htmlを参照のこと)。 There are several different designs for this chemical induction system: 1. 2. ABI-PYL-based system inducible by abscisic acid (ABA) (see, eg, http: //stke.sciencemag.org/cgi/content/abstract/sigtrans; 4/164 / rs2). See FKBP-FRB-based system (eg, http://www.nature.com/nmeth/journal/v2/n6/full/nmeth763.html) that can be induced by rapamycin (or related chemicals based on rapamycin). ), 3. A GID1-GAI-based system that can be induced by gibberellin (GA) (see, eg, http: //www.nature.com/nchembio/journal/v8/n5/full/nchembio.922.html).

本発明により企図される別の系は、細胞内局在の変化に基づく化学的誘導系である。出願人はまた、ポリペプチドが、少なくとも5つ以上の転写活性化因子様エフェクター(Transcription activator-like effector)(TALE)モノマーを含むDNA結合ドメインを含む系を開発し、少なくとも1つ以上のエフェクタードメインに連結された目的のゲノム遺伝子座を標的とするように特に順序付けられた少なくとも1つ以上のハーフモノマーはさらに、化学的またはエネルギー感受性タンパク質へのさらなるリンカーである。このタンパク質は、化学的またはエネルギー感受性タンパク質への化学的またはエネルギー移動の結合時に、ポリペプチド全体の細胞内局在化の変化(すなわち、細胞質から細胞核へのポリペプチド全体の輸送)につながる。エフェクタードメインの基質が不足していることに起因して、その活性が隔離されている1つの細胞内区画またはオルガネラから、基質が存在する別のものへのポリペプチド全体のこの輸送により、ポリペプチド全体がその所望の基質(すなわち、哺乳動物の核内のゲノムDNA)と接触することが可能になり、かつ標的遺伝子発現の活性化または抑制がもたらされる。 Another system contemplated by the present invention is a chemically induced system based on changes in intracellular localization. Applicants have also developed a system in which the polypeptide comprises a DNA binding domain containing at least 5 or more Transcription activator-like effector (TALE) monomers and at least one effector domain. At least one half-monomer specifically ordered to target the genomic locus of interest linked to is further a linker to a chemical or energy sensitive protein. This protein leads to altered intracellular localization of the entire polypeptide (ie, transport of the entire polypeptide from the cytoplasm to the nucleus) upon binding of chemical or energy transfer to the chemical or energy sensitive protein. Due to the lack of substrate in the effector domain, this transport of the entire polypeptide from one intracellular compartment or organelle whose activity is isolated to another in which the substrate is present causes the polypeptide. The whole can be contacted with its desired substrate (ie, genomic DNA in the nucleus of the mammal), resulting in activation or suppression of target gene expression.

このタイプの系は、エフェクタードメインがヌクレアーゼである場合、細胞内の目的のゲノム遺伝子座の切断を指示するためにも使用され得る。 This type of system can also be used to direct cleavage of the genomic locus of interest in the cell if the effector domain is a nuclease.

化学的誘導系は、4-ヒドロキシタモキシフェン(4OHT)によって誘導可能なエストロゲン受容体(ER)ベースの系であり得る(例えば、http://www.pnas.org/content/104/3/1027.abstractを参照のこと)。エストロゲン受容体の変異リガンド結合ドメイン(ERT2と呼ばれる)は、4-ヒドロキシタモキシフェンが結合すると細胞の核に移行する。本発明の別の実施形態では、任意の核内受容体、甲状腺ホルモン受容体、レチノイン酸受容体、エストロゲン受容体、エストロゲン関連受容体、糖質コルチコイド受容体、プロゲステロン受容体、アンドロゲン受容体の任意の天然起源の誘導体または操作された誘導体が、ERベースの誘導系と類似の誘導系において使用され得る。 The chemical induction system can be an estrogen receptor (ER) -based system that can be induced by 4-hydroxytamoxifen (4OHT) (eg, http: //www.pnas.org/content/104/3/1027. See abstract). The mutated ligand-binding domain of the estrogen receptor (called ERT2) translocates to the cell nucleus upon binding of 4-hydroxytamoxifen. In another embodiment of the invention, any of any nuclear receptor, thyroid hormone receptor, retinoic acid receptor, estrogen receptor, estrogen-related receptor, glycocorticoid receptor, progesterone receptor, androgen receptor. Naturally occurring or engineered derivatives can be used in induction systems similar to ER-based induction systems.

別の誘導系は、エネルギー、熱、またはラジオ波によって誘導可能な一過性受容体電位型(TRP)イオンチャネルベースの系を使用する設計に基づくものである(例えば、http://www.sciencemag.org/content/336/6081/604を参照のこと)。TRPファミリーのこうしたタンパク質は、光及び熱を含めて、異なる刺激に応答する。このタンパク質が光または熱によって活性化されると、イオンチャネルが開口し、細胞膜へのイオン(カルシウムなど)の流入が可能となる。この流入イオンが、ガイドと、Cas9 CRISPR-Casの複合体または系の他の構成要素と、を含むポリペプチドに連結された細胞内イオン相互作用パートナーに結合することになり、この結合によってポリペプチドの細胞内局在化の変化が誘導され、ポリペプチド全体が細胞の核に入ることになる。ガイドタンパク質及びCas9 CRISPR-Cas複合体の他の構成要素は、核内に入ると活性となり、細胞における標的遺伝子の発現を調節することになる。 Another induction system is based on a design that uses a transient receptor potential channel (TRP) ion channel-based system that can be induced by energy, heat, or radio frequency (eg, http: // www. See sciencemag.org/content/336/6801/604). These proteins in the TRP family respond to different stimuli, including light and heat. When this protein is activated by light or heat, ion channels open, allowing the influx of ions (such as calcium) into the cell membrane. This influx ion binds to the intracellular ion interaction partner linked to the polypeptide, including the guide and other components of the Cas9 CRISPR-Cas complex or system, which binds the polypeptide. Changes in the intracellular localization of the peptide are induced, and the entire polypeptide enters the nucleus of the cell. The guide protein and other components of the Cas9 CRISPR-Cas complex become active upon entry into the nucleus and regulate the expression of the target gene in the cell.

このタイプの系は、細胞内の目的のゲノム遺伝子座の切断を指示するためにも使用してもよい;そして、この点で、Cas9酵素はヌクレアーゼであることに留意されたい。光は、レーザーまたはその他の形式のエネルギー源で生成されてもよい。熱は、エネルギー源からの温度上昇の結果、または電波の形で供給されるエネルギー源からエネルギーを吸収した後に熱を放出するナノ粒子から発生し得る。 It should be noted that this type of system may also be used to direct cleavage of the genomic locus of interest in the cell; and in this regard, the Cas9 enzyme is a nuclease. Light may be generated by a laser or other form of energy source. Heat can be generated as a result of temperature rise from an energy source or from nanoparticles that release heat after absorbing energy from an energy source supplied in the form of radio waves.

光による活性化は、有利な実施形態となり得る一方で、光が皮膚または他の臓器に浸透し得ないインビボの適用では特に、不利となる場合もある。この場合、他のエネルギー活性化方法が企図され、具体的には、同様の作用を有する電場エネルギー及び/または超音波が企図される。 While light activation can be an advantageous embodiment, it can also be disadvantageous, especially in in vivo applications where light cannot penetrate the skin or other organs. In this case, other energy activation methods are contemplated, specifically electric field energy and / or ultrasonic waves having similar effects.

電場エネルギーは、インビボ条件の下で約1ボルト/cm~約10kボルト/cmの1つ以上の電気パルスを使用して、当該技術分野において説明されるように実質的に付与することが好ましい。パルスの代わりに、またはパルスに加えて、連続様式で電場が送達され得る。電気パルスは、1μs~500ミリ秒間、好ましくは、1μs~100ミリ秒間印加され得る。電場は、約5分間、連続的に印加されるか、またはパルス様式で印加され得る。 Electric field energy is preferably applied substantially as described in the art using one or more electrical pulses from about 1 volt / cm to about 10 kvolt / cm under in vivo conditions. The electric field can be delivered in a continuous fashion instead of or in addition to the pulse. The electrical pulse can be applied for 1 μs to 500 ms, preferably 1 μs to 100 ms. The electric field can be applied continuously or in pulse form for about 5 minutes.

本明細書で使用される「電場エネルギー」とは、細胞が曝露される電気エネルギーである。好ましくは、電場は、インビボ条件の下で約1ボルト/cm~約10kボルト/cmの強度または約10kボルト/cm超の強度を有する(WO97/49450を参照のこと)。 As used herein, "electric field energy" is the electrical energy to which a cell is exposed. Preferably, the electric field has an intensity of about 1 volt / cm to about 10 kvolt / cm or more than about 10 kvolt / cm under in vivo conditions (see WO 97/49450).

本明細書で使用される「電場」という用語は、静電容量及び電圧が可変である1つ以上のパルスを含み、こうしたパルスには、指数波形及び/または方形波形及び/または被変調波形及び/または被変調方形波形のものが含まれる。電場及び電気に対する言及は、細胞の環境における電位差の存在に対する言及を含むと解釈されるべきである。そのような環境は、当該技術分野において知られるように静電気、交流電流(AC)、直流電流(DC)などによって構築され得る。電場は、均一、不均一、またはその他の状態にあってもよく、時間依存的な様式で強度及び/または方向が変わる場合がある。 As used herein, the term "electric field" includes one or more pulses with variable capacitance and voltage, such as exponential and / or rectangular and / or modulated waveforms. / Or those with a square waveform to be modulated are included. References to electric fields and electricity should be construed as including references to the presence of potential differences in the cellular environment. Such an environment can be constructed by static electricity, alternating current (AC), direct current (DC), etc., as is known in the art. The electric field may be in uniform, non-uniform, or other conditions and may change in intensity and / or direction in a time-dependent manner.

電場を単回または複数回印加することも、超音波を単回または複数回印加することも可能であり、こうした印加は、任意の順序かつ任意の組み合わせで行われる。超音波及び/または電場は、単回もしくは複数回の連続印加として送達されてもよいし、またはパルスとして送達(パルス送達)されてもよい。 The electric field can be applied once or multiple times, or the ultrasonic waves can be applied once or multiple times, and such application is performed in any order and in any combination. The ultrasonic and / or electric field may be delivered as a single or multiple continuous application, or may be delivered as a pulse (pulse delivery).

電気穿孔は、外来材料を生細胞に導入するためにインビトロの手順でもインビボの手順でも使用されている。インビトロで適用される場合、生細胞のサンプルは、目的物質と最初に混合され、電極(平行板など)の間に配置される。次に、電極によって、細胞/導入物混合物に電場が印加される。インビトロで電気穿孔を実施する系の例としては、Electro Cell Manipulator ECM600製品、及びElectro Square Porator T820が挙げられ、これらは両方とも、Genetronics,IncのBTX Divisionによって製造されている(米国特許第5,869,326号を参照のこと)。 Electroporation has been used in both in vitro and in vivo procedures to introduce foreign materials into living cells. When applied in vitro, a sample of living cells is first mixed with the substance of interest and placed between electrodes (such as parallel plates). The electrodes then apply an electric field to the cell / introduction mixture. Examples of systems for performing electroporation in vitro include the Electro Cell Manipulator ECM600 product and the Electro Quaire Portor T820, both manufactured by Genetronics, Inc. BTX Division (US Pat. No. 5, Inc.). See 869,326).

公知の電気穿孔技術(インビトロのものとインビボのものとの両方)は、処理領域の周りに配置された電極に高電圧の短パルスを印加することによって機能する。電極間に生じる電場によって細胞膜が一時的に多孔性となり、そこで目的物質の分子が細胞に導入される。既知の電気穿孔用途では、この電場は、持続時間が約100.mu.sの1000V/cmオーダーの単一の方形波パルスを含む。そのようなパルスは、例えば、Electro Square Porator T820の既知の印加法で発生され得る。 Known electroporation techniques (both in vitro and in vivo) work by applying high voltage short pulses to the electrodes placed around the treatment area. The electric field generated between the electrodes temporarily makes the cell membrane porous, where the molecule of the target substance is introduced into the cell. In known electroporation applications, this electric field has a duration of about 100. mu. Includes a single square wave pulse on the order of 1000 V / cm in s. Such a pulse can be generated, for example, by a known application method of the ElectroSquare Motorator T820.

好ましくは、電場は、インビトロ条件の下で約1V/cm~約10kV/cmの強度を有する。したがって、電場は、1V/cm、2V/cm、3V/cm、4V/cm、5V/cm、6V/cm、7V/cm、8V/cm、9V/cm、10V/cm、20V/cm、50V/cm、100V/cm、200V/cm、300V/cm、400V/cm、500V/cm、600V/cm、700V/cm、800V/cm、900V/cm、1kV/cm、2kV/cm、5kV/cm、10kV/cm、20kV/cm、50kV/cm、または50kV/cm超の強度を有し得る。より好ましくは、インビトロ条件の下で約0.5kV/cm~約4.0kV/cmである。好ましくは、電場は、インビボ条件の下で約1V/cm~約10kV/cmの強度を有する。しかしながら、標的部位に送達されるパルスの数を増やす場合には、電場の強度が下げられ得る。したがって、電場強度を下げたパルス電場送達が想定される。 Preferably, the electric field has an intensity of about 1 V / cm to about 10 kV / cm under in vitro conditions. Therefore, the electric field is 1V / cm, 2V / cm, 3V / cm, 4V / cm, 5V / cm, 6V / cm, 7V / cm, 8V / cm, 9V / cm, 10V / cm, 20V / cm, 50V. / Cm, 100V / cm, 200V / cm, 300V / cm, 400V / cm, 500V / cm, 600V / cm, 700V / cm, 800V / cm, 900V / cm, 1kV / cm, 2kV / cm, 5kV / cm It can have an intensity of more than 10 kV / cm, 20 kV / cm, 50 kV / cm, or 50 kV / cm. More preferably, it is from about 0.5 kV / cm to about 4.0 kV / cm under in vitro conditions. Preferably, the electric field has an intensity of about 1 V / cm to about 10 kV / cm under in vivo conditions. However, if the number of pulses delivered to the target site is increased, the strength of the electric field can be reduced. Therefore, pulsed electric field delivery with reduced electric field strength is assumed.

好ましくは、電場の印加は、複数パルスの形態をとるものであり、こうした複数パルスの形態は、強度及び静電容量が同じ二重パルスの形態、あるいは強度及び/または静電容量が異なる連続パルスの形態などである。本明細書で使用される「パルス」という用語は、静電容量及び電圧が可変である1つ以上の電気パルスを含み、こうした電気パルスには、指数波形及び/または方形波形及び/または被変調波形/被変調方形波形のものが含まれる。 Preferably, the application of an electric field is in the form of multiple pulses, such as the form of double pulses with the same intensity and capacitance, or continuous pulses with different intensities and / or capacitances. And so on. As used herein, the term "pulse" includes one or more electrical pulses with variable capacitance and voltage, such electrical pulses as exponential and / or square waveforms and / or modulated. Waveform / modulated square waveforms are included.

好ましくは、電気パルスは、指数波形、方形波形、被変調波形、及び被変調方形波形から選択される波形として送達される。 Preferably, the electrical pulse is delivered as a waveform selected from an exponential waveform, a square waveform, a modulated waveform, and a modulated square waveform.

好ましい実施形態では、低電圧で直流電流が利用される。したがって、出願人は、1V/cm~20V/cmの電場強度で100ミリ秒間以上、より好ましくは15分間以上、細胞、組織、または組織塊に印加される電場の使用を開示す。 In a preferred embodiment, a direct current is utilized at a low voltage. Therefore, the applicant discloses the use of an electric field applied to a cell, tissue or tissue mass for 100 milliseconds or more, more preferably 15 minutes or more at an electric field intensity of 1 V / cm to 20 V / cm.

超音波は、約0.05W/cm~約100W/cmの出力レベルで有利に印加される。診断用または治療用の超音波が使用されるか、またはそれらの組み合わせが使用され得る。 Ultrasound is advantageously applied at an output level of about 0.05 W / cm 2 to about 100 W / cm 2 . Diagnostic or therapeutic ultrasound may be used, or a combination thereof may be used.

本明細書で使用される「超音波」という用語は、ヒトが聞き取れる範囲を超えるほど高い周波数の機械的振動からなる形態のエネルギーを指す。超音波スペクトルの周波数の下限値は、一般に、約20kHzとされ得る。超音波の診断用途の多くでは、1~15MHz’の範囲の周波数が利用される(From Ultrasonics in Clinical Diagnosis,P.N.T.Wells,ed.,2nd.Edition,Publ.Churchill Livingstone [Edinburgh,London & NY,1977])。 As used herein, the term "ultrasonic" refers to energy in the form of mechanical vibrations at frequencies higher than human audible. The lower limit of the frequency of the ultrasonic spectrum can generally be about 20 kHz. Frequencies in the range of 1 to 15 MHz'are used in many ultrasonic diagnostic applications (From Londonics in Clinical Diagnostics, PNT Wells, ed., 2nd. Edition, Publ. Churchill Livingstone [Edinburgh]. London & NY, 1977]).

超音波は、診断用途でも治療用途でも使用されている。診断ツール(「診断用超音波」)として使用されるとき、超音波は、典型的には、最大約100mW/cmのエネルギー密度範囲(FDAの推奨範囲)で使用されるが、最大750mW/cmのエネルギー密度が使用されている。理学療法では、超音波は、典型的には、最大約3~4W/cmの範囲(WHOの推奨範囲)でエネルギー源として使用される。他の治療用途では、より高い強度の超音波が利用される可能性があり、例えば、100W/cm~最大1kW/cmのHIFU(またはさらに高い強度のもの)が短時間使用される。本明細書で使用される「超音波」という用語は、診断用超音波、治療用超音波、及び集束超音波を包含することが意図される。 Ultrasound is used in both diagnostic and therapeutic applications. When used as a diagnostic tool (“diagnostic ultrasound”), ultrasound is typically used in an energy density range of up to about 100 mW / cm 2 (FDA recommended range), but up to 750 mW / cm. An energy density of cm 2 is used. In physiotherapy, ultrasound is typically used as an energy source in the range of up to about 3-4 W / cm 2 (WHO recommended range). In other therapeutic applications, higher intensity ultrasound may be utilized, for example, HIFU (or even higher intensity ones) of 100 W / cm up to 1 kW / cm 2 is used for short periods of time. The term "ultrasound" as used herein is intended to include diagnostic ultrasound, therapeutic ultrasound, and focused ultrasound.

集束超音波(FUS)は、侵襲性のプローブを使用せずに熱エネルギーを送達することを可能にするものである(Morocz et al 1998 Journal of Magnetic Resonance Imaging Vol.8,No.1,pp.136-142を参照のこと)。別の形態の集束超音波は、高密度焦点式超音波(HIFU)であり、HIFUは、Moussatov et al in Ultrasonics(1998)Vol.36,No.8,pp.893-900、及びTranHuuHue et al in Acustica(1997)Vol.83,No.6,pp.1103-1106によって概説されている。 Focused ultrasound (FUS) makes it possible to deliver thermal energy without the use of invasive probes (Morochz et al 1998 Journal of Magnetic Resonance Imaging Vol. 8, No. 1, pp. See 136-142). Another form of focused ultrasound is high intensity focused ultrasound (HIFU), which is described in Mousetov et al in Ultrasonics (1998) Vol. 36, No. 8, pp. 893-900, and TranHuuHue et al in Acoustica (1997) Vol. 83, No. 6, pp. It is outlined by 1103-1106.

好ましくは、診断用超音波と治療量超音波とが組み合わせて利用される。この組み合わせは、限定を意図するものではなく、むしろ、任意の様々な組み合わせで超音波が使用され得ることを当業者なら理解するであろう。さらに、エネルギー密度、超音波の周波数、及び曝露時間も異なり得る。 Preferably, diagnostic ultrasound and therapeutic dose ultrasound are used in combination. This combination is not intended to be limiting, but rather one of skill in the art will appreciate that ultrasound can be used in any variety of combinations. In addition, energy densities, ultrasonic frequencies, and exposure times can vary.

好ましくは、超音波エネルギー源への曝露は、約0.05~約100Wcm-2の出力密度で行われる。さらにより好ましくは、超音波エネルギー源への曝露は、約1~約15Wcm-2の出力密度で行われる。 Preferably, exposure to an ultrasonic energy source takes place at a power density of about 0.05 to about 100 Wcm -2 . Even more preferably, exposure to an ultrasonic energy source takes place at a power density of about 1 to about 15 Wcm -2 .

好ましくは、超音波エネルギー源への曝露は、約0.015~約10.0MHzの周波数で行われる。より好ましくは、超音波エネルギー源への曝露は、約0.02~約5.0MHzまたは約6.0MHzの周波数で行われる。最も好ましくは、超音波は、3MHzの周波数で印加される。 Preferably, the exposure to the ultrasonic energy source is at a frequency of about 0.015 to about 10.0 MHz. More preferably, exposure to ultrasonic energy sources takes place at frequencies of about 0.02 to about 5.0 MHz or about 6.0 MHz. Most preferably, the ultrasonic waves are applied at a frequency of 3 MHz.

好ましくは、曝露時間は、約10ミリ秒~約60分である。好ましくは、曝露時間は、約1秒~約5分である。より好ましくは、超音波は、約2分間印加される。しかしながら、特定の破壊対象標的細胞によっては、曝露時間は長くなり得、例えば、15分間である。 Preferably, the exposure time is from about 10 ms to about 60 minutes. Preferably, the exposure time is from about 1 second to about 5 minutes. More preferably, the ultrasonic waves are applied for about 2 minutes. However, depending on the particular target cell to be destroyed, the exposure time can be long, for example 15 minutes.

有利には、標的組織は、約0.015~約10MHzの範囲の周波数を用いて約0.05Wcm-2~約10Wcm-2の音響出力密度で超音波エネルギー源に曝露される(WO98/52609を参照のこと)。しかしながら、代替条件も可能であり、例えば、音響出力密度は100Wcm-2超であるが、時間を短くして超音波エネルギー源への曝露が行われ、例えば、時間をミリ秒範囲以下として1000Wcm-2で曝露が行われる。 Advantageously, the target tissue is exposed to an ultrasonic energy source with an acoustic output density of about 0.05 Wcm -2 to about 10 Wcm -2 using frequencies in the range of about 0.015 to about 10 MHz (WO98 / 52609). checking). However, alternative conditions are also possible, for example, the acoustic output density is greater than 100 Wcm -2 , but the exposure to the ultrasonic energy source is carried out for a shorter period of time, for example, 1000 Wcm - with the time in the millisecond range or less. Exposure is done at 2 .

好ましくは、超音波の印加は、多重パルスの形態で行われ、したがって、連続波とパルス波(超音波のパルス送達)との両方が、任意の組み合わせで利用され得る。例えば、連続波の超音波が印加された後、パルス波の超音波が印加され得、逆もまた同様である。この印加は、任意の順序かつ組み合わせで、任意の回数、反復して行われ得る。連続波の超音波のバックグラウンドに対してパルス波の超音波が印加され得、任意の数のパルスが、任意の数の群で使用され得る。 Preferably, the application of ultrasonic waves is in the form of multiple pulses, so both continuous and pulsed waves (pulse delivery of ultrasonic waves) can be utilized in any combination. For example, a continuous wave ultrasonic wave may be applied followed by a pulsed wave ultrasonic wave, and vice versa. This application may be repeated any number of times in any order and in any combination. A pulsed ultrasonic wave may be applied to a continuous wave ultrasonic background and any number of pulses may be used in any number of groups.

好ましくは、超音波は、パルス波の超音波を含み得る。非常に好ましい実施形態では、超音波は、0.7Wcm-2または1.25Wcm-2の出力密度で連続波として印加される。パルス波の超音波が使用されるのであれば、より高い出力密度が利用され得る。 Preferably, the ultrasonic waves may include ultrasonic waves of pulse waves. In a highly preferred embodiment, the ultrasonic waves are applied as a continuous wave with an output density of 0.7 Wcm -2 or 1.25 Wcm-2. Higher power densities may be utilized if pulsed ultrasonic waves are used.

超音波は、光と同様に、正確に標的に集束し得るため、超音波を使用することは有利である。さらに、超音波は、光とは異なり、組織のより深い部分に集束し得るため、有利である。したがって、全組織(限定されないが、肝葉など)透過または全臓器(限定されないが、全肝臓もしくは全筋肉(心臓など)など)治療に、超音波はより適している。別の重要な利点は、超音波が、多種多様な診断用途及び治療用途で使用される非侵襲性の刺激であるということである。例として、超音波は、医療用造影技術に加えて、整形治療においてもよく認知されている。さらに、対象脊椎動物への超音波の印加に適した機器は広く利用可能であり、その使用は、当該技術分野においてよく知られている。 It is advantageous to use ultrasound because it can focus exactly on the target, just like light. Moreover, ultrasound, unlike light, is advantageous because it can focus on deeper parts of the tissue. Therefore, ultrasound is more suitable for permeation of all tissues (such as, but not limited to, liver lobe) or treatment of all organs (such as, but not limited to, whole liver or whole muscle (such as heart)). Another important advantage is that ultrasound is a non-invasive stimulus used in a wide variety of diagnostic and therapeutic applications. As an example, ultrasound is well recognized in orthopedic treatment in addition to medical contrast techniques. In addition, devices suitable for applying ultrasound to target vertebrates are widely available and their use is well known in the art.

本発明の迅速な転写応答及び内因性標的化は、転写動力学の研究のための理想的な系を作る。例えば、本発明を使用して、標的遺伝子の誘導発現によるバリアント産生の動態を研究してもよい。転写サイクルのもう一方の端では、mRNA分解の研究は、多くの遺伝子の発現レベルの変化を引き起こす、強い細胞外刺激に応答して実行されることが多い。本発明は、内因性標的の転写を可逆的に指示するために利用され得、その後、点刺激が停止され得、固有の標的の分解動力学が追跡され得る。 The rapid transcriptional response and endogenous targeting of the present invention make an ideal system for the study of transcriptional dynamics. For example, the present invention may be used to study the kinetics of variant production by induced expression of a target gene. At the other end of the transcription cycle, studies of mRNA degradation are often performed in response to strong extracellular stimuli that cause changes in the expression levels of many genes. The present invention can be utilized to reversibly direct transcription of an endogenous target, after which point stimulation can be stopped and the degradation kinetics of the unique target can be traced.

本発明の時間的精度は、実験的介入と協調して遺伝的調節を時間調整する力を提供し得る。例えば、長期増強(LTP)への関与が疑われる標的は、器官型または解離型ニューロン培養で調整され得るが、細胞の正常な発達を妨げないように、LTPを指示する刺激中のみである。同様に、疾患の表現型を示す細胞モデルでは、特定の治療の有効性に関与していると疑われる標的は、治療中にのみ調節される。逆に、遺伝的標的は病理学的刺激中にのみ調節される場合がある。外部の実験的刺激に対する遺伝的合図のタイミングが関連する多数の実験が、本発明の有用性から利益を得る可能性がある。 The temporal accuracy of the present invention may provide the ability to time regulate genetic regulation in coordination with experimental intervention. For example, targets suspected of being involved in long-term potentiation (LTP) can be tuned in organ-type or dissociative neuronal cultures, but only during stimuli that direct LTP so as not to interfere with the normal development of cells. Similarly, in cell models that represent disease phenotypes, targets suspected of being involved in the efficacy of a particular treatment are regulated only during treatment. Conversely, genetic targets may be regulated only during pathological stimuli. Numerous experiments involving the timing of genetic cues to external experimental stimuli may benefit from the usefulness of the invention.

インビボの状況は、本発明が遺伝子発現を制御する等しく豊富な機会を提供する。光誘導性は、空間精度の可能性を提供する。オプトロード技術の開発を活用して、刺激的な光ファイバー読み取りを正確な脳領域に配置してもよい。刺激領域のサイズは、光の強度によって調整してもよい。これは、本発明のCas9 CRISPR-Cas系または複合体の送達と併せて行ってもよく、またはトランスジェニックCas9動物の場合、本発明のガイドRNAを送達してもよく、オプトロード技術により、正確な脳領域での遺伝子発現の調整が可能になり得る。透明なCas9発現生物は、それに投与される本発明のガイドRNAを有し得、その後、非常に正確なレーザー誘発局所遺伝子発現変化があり得る。 The in vivo situation provides an equally abundant opportunity for the invention to control gene expression. Photoinducibility offers the possibility of spatial accuracy. Utilizing the development of optode technology, stimulating fiber optic readings may be placed in the correct brain region. The size of the stimulation area may be adjusted by the intensity of light. This may be done in conjunction with the delivery of the Cas9 CRISPR-Cas system or complex of the invention, or in the case of transgenic Cas9 animals, the guide RNA of the invention may be delivered and is accurate by optrol technology. It may be possible to regulate gene expression in various brain regions. A clear Cas9 expressing organism may have a guide RNA of the invention administered to it, followed by highly accurate laser-induced local gene expression changes.

宿主細胞を培養するための培地としては、とりわけM199-earle base、Eagle MEM(E-MEM)、Dulbecco MEM(DMEM)、SC-UCM102、UP-SFM(GIBCO BRL)、EX-CELL302(ニチレイ)、EX-CELL293-S(ニチレイ)、TFBM-01(ニチレイ)、ASF104などの組織培養に一般的に使用される培地が挙げられる。特定の細胞タイプに適した培養培地は、American Type Culture Collection(ATCC)またはEuropean Collection of Cell Cultures(ECACC)見出され得る。培養培地には、L-グルタミンなどのアミノ酸、塩、抗真菌剤または抗菌剤、例えばファンギゾン(登録商標)、ペニシリン-ストレプトマイシン、動物血清などを補充してもよい。細胞培養培地は、任意選択で無血清であってもよい。 As the medium for culturing the host cells, especially M199-earle base, Eagle MEM (E-MEM), Dulbecco MEM (DMEM), SC-UCM102, UP-SFM (GIBCO BRL), EX-CELL302 (Nichirei), Examples thereof include media generally used for tissue culture such as EX-CELL293-S (Nichirei), TFBM-01 (Nichirei), and ASF104. Culture media suitable for a particular cell type can be found in the American Type Culture Collection (ATCC) or the European Collection of Cell Cultures (ECACC). The culture medium may be supplemented with amino acids such as L-glutamine, salts, antifungal or antibacterial agents such as fungizone®, penicillin-streptomycin, animal serum and the like. The cell culture medium may be optionally serum-free.

本発明はまた、インビボで貴重な時間的精度を提供し得る。本発明を使用して、特定の発達段階中に遺伝子発現を変更し得る。本発明を使用して、特定の実験ウィンドウへの遺伝的合図を計時し得る。例えば、学習に関係する遺伝子は、無傷のげっ歯類または霊長類の脳の正確な領域での学習刺激中にのみ過剰発現または抑制される場合がある。さらに、本発明を使用して、疾患発症の特定の段階でのみ遺伝子発現の変化を誘発し得る。例えば、腫瘍が特定のサイズまたは転移期に達したときのみ、がん遺伝子が過剰発現し得る。逆に、アルツハイマー病の発症で疑われるタンパク質は、動物の生活の中で、かつ特定の脳領域内の定義された時点でのみノックダウンされ得る。これらの例は、本発明の潜在的な用途を網羅的に列挙するものではないが、本発明が強力な技術となり得る分野のいくつかを強調している。 The invention may also provide valuable temporal accuracy in vivo. The present invention can be used to alter gene expression during a particular developmental stage. The present invention can be used to time a genetic signal to a particular experimental window. For example, learning-related genes may be overexpressed or suppressed only during learning stimuli in the exact region of the brain of an intact rodent or primate. In addition, the invention can be used to induce changes in gene expression only at specific stages of disease onset. For example, oncogenes can be overexpressed only when the tumor reaches a certain size or metastatic stage. Conversely, proteins suspected of developing Alzheimer's disease can only be knocked down in the life of an animal and at defined times within a particular brain region. These examples do not exhaustively list the potential uses of the invention, but highlight some of the areas in which the invention can be a powerful technique.

保護されたガイド:本発明によるCasタンパク質は、保護されたガイドRNAと組み合わせて用いられ得る
一態様では、本発明の目的は、標的DNAに対するガイドRNAの結合特異性の熱力学的調整により、個々のガイドRNAを与えられたCas9の特異性をさらに高めることである。これは、ゲノムのオフターゲット上の標的されたゲノム遺伝子座に、熱力学的な利点を与えるために、ゲノム標的とその潜在的なオフターゲット遺伝子座との間で共有される相補塩基対ミスマッチ塩基の数を増減するために、ガイド配列のミスマッチ、伸長または切断を導入するという一般的なアプローチである。
Protected Guide: The Cas protein according to the invention can be used in combination with a protected guide RNA. In one aspect, the object of the invention is to individually adjust the binding specificity of the guide RNA to the target DNA. Is to further enhance the specificity of Cas9 given the guide RNA of. It is a complementary base pair mismatched base shared between a genomic target and its potential off-target locus to provide a thermodynamic advantage to the targeted genomic locus on the off-target of the genome. A common approach is to introduce a guide sequence mismatch, extension or cleavage to increase or decrease the number of loci.

一態様では、本発明は、Cas9 CRISPR-Cas系の特異性を高めるために二次構造により改変されるガイド配列を提供し、それによりこの二次構造はエキソヌクレアーゼ活性から保護し、ガイド配列への3’付加を可能にする。 In one aspect, the invention provides a guide sequence that is modified by secondary structure to enhance the specificity of the Cas9 CRISPR-Cas system, thereby protecting this secondary structure from exonuclease activity and into the guide sequence. 3'addition is possible.

一態様では、本発明は、「プロテクターRNA」をガイド配列にハイブリダイズさせることを提供し、この「プロテクターRNA」とは、ガイドRNA(gRNA)の5’末端に相補的なRNA鎖であり、それにより、部分的に二本鎖のgRNAが生成される。本発明の実施形態では、完全に相補的なプロテクター配列でミスマッチ塩基を保護することにより、3’末端でミスマッチ塩基対に結合する標的DNAの可能性が低下する。本発明の実施形態では、延長された長さを含む追加の配列も存在し得る。 In one aspect, the invention provides to hybridize a "protector RNA" to a guide sequence, which "protector RNA" is an RNA strand complementary to the 5'end of the guide RNA (gRNA). This partially produces double-stranded gRNA. In embodiments of the invention, protecting the mismatched base with a fully complementary protector sequence reduces the likelihood of target DNA binding to the mismatched base pair at the 3'end. In embodiments of the invention, there may also be additional sequences containing extended lengths.

ゲノム標的に一致するガイドRNA(gRNA)伸長は、gRNA保護を提供し、特異性を高める。特異性を高めるために、個々のゲノム標的のスペーサーシードの末端の遠位に一致する配列を用いるgRNAの伸長が想定されている。特異性を高めるgRNA伸長の適合は、切断のない細胞で観察されている。これらの安定した長さの伸長に伴うgRNA構造の予測は、スペーサー伸長及びスペーサーシードの相補配列に起因して、伸長がgRNAシードと閉ループを形成する保護状態から安定した形態が生じることを示している。これらの結果、保護ガイドの概念には、20マーのスペーサー結合領域の遠位のゲノム標的配列に一致する配列も含まれることが示されている。熱力学的予測を使用して、完全に一致するか、または部分的に一致するガイド拡張を予測し、gRNAの状態を保護し得る。これにより、保護されたgRNAの概念が、XとZの間の相互作用に拡張され、ここで、Xは一般に17-20ntの長さで、Zは1-30ntの長さである。熱力学的予測を使用して、Zの最適な伸長状態を決定し、Zに可能性としては少数のミスマッチを導入して、XとZの間の保護された立体構造の形成を促進し得る。本出願全体で、「X」という用語及びシード長(SL)は、標的DNAが結合するために利用可能なヌクレオチドの数を示す露出長(EpL)という用語と交換可能に使用され;用語「Y」及びプロテクターの長さ(PL)は、プロテクターの長さを表すために交換可能に使用され、用語「Z」、「E」、「E’」及び「EL」は、標的配列が延長されるヌクレオチドの数を表す、延長された長さ(ExL)という用語に対応するように交換可能に使用される。 Guide RNA (gRNA) elongation that matches the genomic target provides gRNA protection and enhances specificity. Elongation of gRNAs using sequences that match distal ends of spacer seeds of individual genomic targets is envisioned for increased specificity. Fits for gRNA elongation that enhance specificity have been observed in cells without cleavage. Predictions of gRNA structure associated with these stable length extensions indicate that due to spacer elongation and the complementary sequences of spacer seeds, stable morphology arises from the protected state in which the elongation forms a closed loop with the gRNA seed. There is. These results indicate that the concept of protection guides also includes sequences that match the genomic target sequences distal to the 20-mer spacer binding region. Thermodynamic predictions can be used to predict fully or partially matched guide dilations and protect the state of gRNA. This extends the concept of protected gRNA to the interaction between X and Z, where X is generally 17-20 nt in length and Z is 1-30 nt in length. Thermodynamic predictions can be used to determine the optimal elongation state of Z and introduce a potentially small number of mismatches into Z to facilitate the formation of a protected conformation between X and Z. .. Throughout this application, the term "X" and the seed length (SL) are used interchangeably with the term exposure length (EpL), which indicates the number of nucleotides available for binding of the target DNA; the term "Y". And the protector length (PL) are used interchangeably to represent the protector length, and the terms "Z", "E", "E'" and "EL" extend the target sequence. Used interchangeably to correspond to the term extended length (ExL), which represents the number of nucleotides.

延長された長さ(ExL)に対応する延長配列は、保護されたガイド配列の3’末端でガイド配列に任意選択で直接付加されてもよい。伸長配列は、2~12ヌクレオチド長であってもよい。好ましくは、ExLは、長さが0、2、4、6、8、10、または12ヌクレオチドとして示され得る。好ましい実施形態では、ExLは、長さが0または4ヌクレオチドとして示される。より好ましい実施形態では、ExLは、4ヌクレオチド長である。拡張配列は、標的配列に相補的であってもなくてもよい。 The extended sequence corresponding to the extended length (ExL) may optionally be added directly to the guide sequence at the 3'end of the protected guide sequence. The extension sequence may be 2-12 nucleotides in length. Preferably, ExL can be shown as 0, 2, 4, 6, 8, 10, or 12 nucleotides in length. In a preferred embodiment, ExL is shown as 0 or 4 nucleotides in length. In a more preferred embodiment, ExL is 4 nucleotides in length. The extended sequence may or may not be complementary to the target sequence.

伸長配列はさらに任意選択で、保護されたガイド配列の5’末端でガイド配列に対して、同様に保護配列の3’末端に対して、直接結合されてもよい。結果として、伸長配列は、保護された配列と保護されている配列との間の連結配列として機能する。理論に拘束されることを望まないが、そのようなリンクは、保護されている配列の保護された配列への結合を改善するために、保護している配列を保護された配列の近くに配置してもよい。シード、プロテクター、及び伸長の上述の関係は、ガイドの遠位端(すなわち、標的化端)が5’端である場合に適用され、例えば、機能するガイドはCas9系であることが理解される。ガイドの遠位端が3’端である実施形態では、関係は逆になる。そのような実施形態では、本発明は、「プロテクターRNA」をガイド配列にハイブリダイズさせ、「プロテクターRNA」は、ガイドRNA(gRNA)の3’末端に相補的なRNA鎖であり、それにより部分的に二重の鎖gRNAが生成される。 The extension sequence may further optionally bind directly to the guide sequence at the 5'end of the protected guide sequence and also to the 3'end of the protected sequence. As a result, the extended sequence acts as a concatenated sequence between the protected sequence and the protected sequence. Although not bound by theory, such links place the protected sequence close to the protected sequence in order to improve the binding of the protected sequence to the protected sequence. You may. The above relationship of seed, protector, and elongation applies when the distal end of the guide (ie, the targeted end) is the 5'end, for example, it is understood that the functioning guide is the Cas9 system. .. In embodiments where the distal end of the guide is the 3'end, the relationship is reversed. In such an embodiment, the invention hybridizes a "protector RNA" to a guide sequence, wherein the "protector RNA" is an RNA strand complementary to the 3'end of the guide RNA (gRNA), thereby partially. Double-stranded gRNA is produced.

gRNAの遠位端へのgRNAミスマッチの付加は、増強された特異性を実証し得る。Yの保護されていない遠位ミスマッチの導入または遠位ミスマッチ(g)を有するgRNAの伸長は、特異性の増強を実証し得る。前述のこの概念は、保護されたgRNAで使用されるX、Y、及びZの構成要素に結び付けられている。保護されていないミスマッチの概念は、保護されたガイドRNAについて説明したX、Y、及びZの概念にさらに一般化され得る。 Addition of a gRNA mismatch to the distal end of the gRNA may demonstrate enhanced specificity. The introduction of an unprotected distal mismatch of Y or the elongation of a gRNA with a distal mismatch (g) can demonstrate enhanced specificity. This concept described above is linked to the components of X, Y, and Z used in protected gRNAs. The concept of unprotected mismatch can be further generalized to the concepts of X, Y, and Z that describe protected guide RNAs.

Cas9。一態様では、本発明は、Cas9特異性の強化を提供し、保護ガイドRNA(pgRNA)の二本鎖3’末端は、2つの可能な結果を可能にする:(1)RNA標的DNA鎖交換をガイドするガイドRNAプロテクターRNAが生じ、このガイドは、標的に完全に結合するか、または(2)ガイドRNAが標的に完全に結合できず、Cas9標的切断は、Cas9触媒DSBを活性化するために、ガイドRNA:標的DNA結合を必要とする複数ステップの速度論的反応であり、ここでCas9切断は、ガイドRNAが適切に結合しない場合には発生しない。特定の実施形態によれば、保護されたガイドRNAは、天然に存在するCRISPR-Cas系と比較して標的結合の特異性を改善する。特定の実施形態によれば、保護された改変ガイドRNAは、天然に存在するCRISPR-Casと比較して安定性を改善する。特定の実施形態によれば、プロテクター配列は、3~120ヌクレオチドの長さを有し、ガイドまたはプロテクターの別の配列に相補的な3つ以上の連続したヌクレオチドを含む。特定の実施形態によれば、プロテクター配列は、ヘアピンを形成する。特定の実施形態によれば、ガイドRNAは、保護された配列及び露出された配列をさらに含む。特定の実施形態によれば、露出配列は1~19ヌクレオチドである。より具体的には、露出された配列は、標的配列に対して少なくとも75%、少なくとも90%または約100%相補的である。特定の実施形態によれば、ガイド配列は、プロテクター鎖に対して少なくとも90%または約100%相補的である。特定の実施形態によれば、ガイド配列は、標的配列に対して少なくとも75%、少なくとも90%または約100%相補的である。特定の実施形態によれば、ガイドRNAはさらに伸長配列を含む。より具体的には、ガイドの遠位端が3’端である場合、延長配列は保護ガイド配列の3’端に機能可能なように連結され、任意選択で保護されたガイド配列の3’端に直接連結される。特定の実施形態によれば、伸長配列は1~12ヌクレオチドである。特定の実施形態によれば、伸長配列は、保護されたガイド配列の3’末端及びプロテクター鎖の5’末端でガイド配列に機能可能なように連結され、任意選択で保護ガイド配列の3’末端、及びプロテクター鎖の5’末端に直接連結され、ここで、伸長配列は、保護された配列と保護鎖との間の連結配列である。特定の実施形態によれば、伸長配列は、プロテクター鎖に100%相補的ではなく、任意選択で少なくとも95%、少なくとも90%、少なくとも80%、少なくとも70%、少なくとも60%、または少なくとも50%がプロテクター鎖に非相補的である。特定の実施形態によれば、ガイド配列は、このガイド配列の最後に付加されたミスマッチをさらに含み、このミスマッチは特異性を熱力学的に最適化する。 Cas9. In one aspect, the invention provides enhanced Cas9 specificity and the double-stranded 3'end of a protective guide RNA (pgRNA) allows for two possible outcomes: (1) RNA target DNA strand exchange. Guide RNA protector RNA is generated that guides the guide RNA, either because it binds completely to the target, or (2) the guide RNA cannot bind completely to the target, and Cas9 target cleavage activates the Cas9-catalyzed DSB. In addition, a guide RNA: a multi-step rhythmic reaction that requires target DNA binding, where Cas9 cleavage does not occur if the guide RNA does not bind properly. According to certain embodiments, the protected guide RNA improves the specificity of target binding as compared to the naturally occurring CRISPR-Cas system. According to certain embodiments, the protected modified guide RNA improves stability compared to naturally occurring CRISPR-Cas. According to certain embodiments, the protector sequence has a length of 3 to 120 nucleotides and comprises three or more contiguous nucleotides complementary to another sequence of guides or protectors. According to certain embodiments, the protector array forms a hairpin. According to certain embodiments, the guide RNA further comprises a protected sequence and an exposed sequence. According to certain embodiments, the exposed sequence is 1-19 nucleotides. More specifically, the exposed sequence is at least 75%, at least 90% or about 100% complementary to the target sequence. According to certain embodiments, the guide sequence is at least 90% or about 100% complementary to the protector strand. According to certain embodiments, the guide sequence is at least 75%, at least 90% or about 100% complementary to the target sequence. According to certain embodiments, the guide RNA further comprises an extended sequence. More specifically, if the distal end of the guide is a 3'end, the extension sequence is operably linked to the 3'end of the protected guide sequence and optionally protected at the 3'end of the guide sequence. Directly linked to. According to certain embodiments, the extension sequence is 1-12 nucleotides. According to certain embodiments, the extended sequence is operably linked to the guide sequence at the 3'end of the protected guide sequence and the 5'end of the protector chain, optionally at the 3'end of the protected guide sequence. , And directly linked to the 5'end of the protector chain, where the extension sequence is the linking sequence between the protected sequence and the protected chain. According to certain embodiments, the extended sequences are not 100% complementary to the protector strand and are optionally at least 95%, at least 90%, at least 80%, at least 70%, at least 60%, or at least 50%. It is non-complementary to the protector chain. According to certain embodiments, the guide sequence further comprises a mismatch added to the end of the guide sequence, which thermodynamically optimizes the specificity.

本発明によれば、特定の実施形態では、鎖の侵入を妨げるガイドの改変が望ましい。例えば、特定の実施形態では、オフターゲット活性を最小化するために、オフターゲット部位での鎖侵入を妨げるガイドを設計または修正することが望ましいであろう。特定のこのような実施形態では、オンターゲット結合効率を犠牲にしてガイドを設計または修正することが許容可能または有用であり得る。特定の実施形態では、オフターゲット活動を実質的に低減する、標的部位でのガイド標的ミスマッチが許容され得る。 According to the present invention, in certain embodiments, it is desirable to modify the guide to prevent chain entry. For example, in certain embodiments, it may be desirable to design or modify guides that prevent chain entry at off-target sites in order to minimize off-target activity. In certain such embodiments, it may be acceptable or useful to design or modify the guide at the expense of on-target coupling efficiency. In certain embodiments, guided target mismatches at the target site may be tolerated, which substantially reduces off-target activity.

本発明の特定の実施形態では、保護されたガイドの結合特性を調整して、オフターゲットCRISPR活性を最小化することが望ましい。したがって、熱力学的予測アルゴリズムを使用して、オンターゲット及びオフターゲットの結合の強度を予測する。代わりに、またはそれに加えて、選択方法を使用して、オフターゲット効果を、絶対的な尺度によって、または相対的にオンターゲット効果に対して低減または最小化する。 In certain embodiments of the invention, it is desirable to adjust the binding properties of the protected guides to minimize off-target CRISPR activity. Therefore, a thermodynamic prediction algorithm is used to predict the strength of on-target and off-target coupling. Alternatively, or in addition, the selection method is used to reduce or minimize off-target effects by absolute scale or relative to on-target effects.

設計オプションとしては、限定するものではないが、i)保護された鎖に結合するプロテクター鎖の長さを調整すること、ii)露出された保護された鎖の部分の長さの調整、iii)保護された鎖に対する外部(遠位)に位置するステム-ループを有する(すなわち、ステムループが遠位端で保護された鎖の外部になるように設計されている)保護された鎖を伸長すること、iv)保護された鎖の全部または一部によりステムループを形成する保護された鎖の追加によって保護された鎖を延長すること、v)1つ以上の塩基のミスマッチ及び/または1つ以上の非標準的な塩基対を設計することにより、保護された鎖へのプロテクター鎖の結合を調整すること、vi)保護された鎖へのプロテクター鎖のハイブリダイゼーションによって形成されるステムの位置を調整すること、ならびにvii)保護鎖の末端への非構造化プロテクターの追加が挙げられる。 Design options include, but are not limited to, i) adjusting the length of the protector strand that binds to the protected strand, ii) adjusting the length of the exposed protected strand portion, iii). Extends a protected strand with a stem-loop located externally (distal) to the protected strand (ie, the stem loop is designed to be outside the protected strand at the distal end) That, iv) extending the chain protected by the addition of a protected chain that forms a stem loop with all or part of the protected chain, v) mismatching one or more bases and / or one or more. Adjusting the binding of the protector strand to the protected strand by designing a non-standard base pair, vi) Adjusting the position of the stem formed by the hybridization of the protector strand to the protected strand. And vii) the addition of an unstructured protector to the end of the protective chain.

一態様では、本発明は、Casタンパク質及び細胞内の遺伝子産物をコードするDNA分子を標的とする保護されたガイドRNAを含む、操作された、天然には存在しないCRISPR-Cas系を提供し、それにより保護されたガイドRNAは、遺伝子産物をコードするDNA分子を標的し、及びCasタンパク質は、この遺伝子産物をコードするDNA分子を切断し、それにより遺伝子産物の発現が変更される;そして、ここで、Cas9タンパク質及び保護されたガイドRNAは、自然には一緒に存在しない。本発明は、ダイレクトリピート配列に融合されたガイド配列を含む保護されたガイドRNAを包含する。本発明はさらに、真核生物細胞における発現のためにコドン最適化されているCRISPRタンパク質を包含する。好ましい実施形態では、真核細胞は、哺乳動物細胞、植物細胞または酵母細胞であり、より好ましい実施形態では、哺乳動物細胞はヒト細胞である。本発明のさらなる実施形態では、遺伝子産物の発現が減少する。いくつかの実施形態では、CRISPRタンパク質は、Cas12またはCas13である。いくつかの実施形態では、CRISPRタンパク質はCas12aである。いくつかの実施形態では、Cas12aタンパク質は、Acidaminococcus sp.BV3L6、Lachnospiraceae bacteriumまたはFrancisella Novicida Cas12aであり、これらの生物に由来する変異したCas12aが含まれる場合がある。タンパク質は、さらなるCas12aホモログまたはオルソログであり得る。いくつかの実施形態では、Casタンパク質をコードするヌクレオチド配列は、真核細胞での発現のためにコドン最適化されている。いくつかの実施形態では、Cas9またはCas12aタンパク質は、標的配列の位置で1つまたは2つの鎖の切断を指示する。いくつかの実施形態において、第1の調節エレメントはポリメラーゼIIIプロモーターである。いくつかの実施形態において、第2の調節エレメントはポリメラーゼIIプロモーターである。一般に、そして本明細書を通して、「ベクター」という用語は、それが連結されている別の核酸を輸送し得る核酸分子を指す。ベクターとしては、限定するものではないが、一本鎖、二本鎖、または部分的に二本鎖の核酸分子;1つ以上の遊離端を含み、自由端を含まない核酸分子(例えば、環状);DNA、RNA、またはその両方を含む核酸分子;及び当技術分野で公知の他の種類のポリヌクレオチドが挙げられる。ベクターの1つのタイプは「プラスミド」であり、これは、標準的な分子クローニング技術などによって追加のDNAセグメントを挿入し得る環状二本鎖DNAループを指す。別のタイプのベクターは、ウイルス由来のDNAまたはRNA配列がウイルスにパッケージングするためにベクターに存在するウイルスベクターである(例えば、レトロウイルス、複製欠損レトロウイルス、アデノウイルス、複製欠損アデノウイルス、及びアデノ随伴ウイルス)。ウイルスベクターにはまた、宿主細胞へのトランスフェクションのためにウイルスによって運ばれるポリヌクレオチドも含まれる。特定のベクターは、それらが導入される宿主細胞内で自律複製が可能である(例えば、細菌の複製起点を有する細菌ベクター及びエピソーム哺乳動物ベクター)。他のベクター(例えば、非エピソーム哺乳動物ベクター)は、宿主細胞への導入時に宿主細胞のゲノムに組み込まれ、それにより宿主ゲノムとともに複製される。さらに、特定のベクターは、それらが機能可能なように連結されている遺伝子の発現を誘導し得る。そのようなベクターは、本明細書では「発現ベクター」と呼ばれる。組換えDNA技術で有用な一般的な発現ベクターは、しばしばプラスミドの形態である。 In one aspect, the invention provides an engineered, non-naturally occurring CRISPR-Cas system comprising a protected guide RNA targeting a Cas protein and a DNA molecule encoding an intracellular gene product. The guide RNA thus protected targets the DNA molecule encoding the gene product, and the Cas protein cleaves the DNA molecule encoding this gene product, thereby altering the expression of the gene product; Here, the Cas9 protein and the protected guide RNA are not naturally present together. The present invention includes a protected guide RNA containing a guide sequence fused to a direct repeat sequence. The invention further includes CRISPR proteins that are codon-optimized for expression in eukaryotic cells. In a preferred embodiment, the eukaryotic cell is a mammalian cell, a plant cell or a yeast cell, and in a more preferred embodiment, the mammalian cell is a human cell. In a further embodiment of the invention, the expression of the gene product is reduced. In some embodiments, the CRISPR protein is Cas12 or Cas13. In some embodiments, the CRISPR protein is Cas12a. In some embodiments, the Cas12a protein is a Cidaminococcus sp. BV3L6, Lachnospiraceae bacterium or Francisella Novicida Cas12a, which may include mutated Cas12a from these organisms. The protein can be an additional Cas12a homolog or ortholog. In some embodiments, the nucleotide sequence encoding the Cas protein is codon-optimized for expression in eukaryotic cells. In some embodiments, the Cas9 or Cas12a protein directs the cleavage of one or two strands at the position of the target sequence. In some embodiments, the first regulatory element is the polymerase III promoter. In some embodiments, the second regulatory element is the polymerase II promoter. In general, and throughout the specification, the term "vector" refers to a nucleic acid molecule capable of transporting another nucleic acid to which it is linked. Vectors include, but are not limited to, single-stranded, double-stranded, or partially double-stranded nucleic acid molecules; nucleic acid molecules containing one or more free ends and no free ends (eg, circular). ); Nucleic acid molecules containing DNA, RNA, or both; and other types of polynucleotides known in the art. One type of vector is a "plasmid", which refers to a circular double-stranded DNA loop into which additional DNA segments can be inserted, such as by standard molecular cloning techniques. Another type of vector is a viral vector in which a virus-derived DNA or RNA sequence is present in the vector for packaging into the virus (eg, retrovirus, replication-deficient retrovirus, adenovirus, replication-deficient adenovirus, and Adenovirus). Viral vectors also include polynucleotides carried by the virus for transfection into host cells. Certain vectors are capable of autonomous replication within the host cell into which they are introduced (eg, a bacterial vector having a bacterial origin of replication and an episome mammalian vector). Other vectors (eg, non-episome mammalian vectors) integrate into the host cell's genome upon introduction into the host cell, thereby replicating with the host genome. In addition, certain vectors can induce the expression of genes to which they are operably linked. Such vectors are referred to herein as "expression vectors". Common expression vectors useful in recombinant DNA technology are often in the form of plasmids.

組換え発現ベクターは、宿主細胞における核酸の発現に適した形態で本発明の核酸を含んでもよく、これは、組換え発現ベクターが、発現される核酸配列に機能可能なように連結されている、発現に使用される宿主細胞に基づいて選択され得る、1つ以上の調節エレメントを含むことを意味する。組換え発現ベクター内で、「機能可能なように連結された(operably linked)」とは、目的のヌクレオチド配列が、ヌクレオチド配列の発現を可能にする方法で(例えば、インビトロ転写/翻訳系において、またはベクターが宿主細胞に導入される場合、宿主細胞内で)調節エレメント(複数可)に連結されることを意味することを意図する。 The recombinant expression vector may comprise the nucleic acid of the invention in a form suitable for expression of the nucleic acid in the host cell, wherein the recombinant expression vector is operably linked to the nucleic acid sequence to be expressed. , Means to include one or more regulatory elements that may be selected based on the host cell used for expression. Within a recombinant expression vector, "operably linked" is a method by which the nucleotide sequence of interest allows expression of the nucleotide sequence (eg, in an in vitro transcription / translation system). Alternatively, when the vector is introduced into a host cell, it is intended to mean that it is linked to a regulatory element (s) (s) within the host cell.

有利なベクターとしては、レンチウイルス及びアデノ随伴ウイルスが含まれ、そのようなベクターのタイプを、特定のタイプの細胞を標的とするために選択してもよい。 Advantageous vectors include lentiviruses and adeno-associated viruses, and the type of such vector may be selected to target specific types of cells.

一態様では、本発明は、真核宿主細胞であって、(a)ダイレクトリピート配列に機能可能なように連結された第1の調節エレメントと、ダイレクトリピート配列の下流に1つ以上のガイド配列を挿入するための1つ以上の挿入部位であって、ここで発現されると、ガイド配列は、真核細胞の標的配列へのCRISPR複合体の配列特異的結合を誘導し、CRISPR複合体が、標的配列にハイブリダイズするガイド配列を含むガイドRNAと複合したCRISPR酵素を含むもの、及び/または、(b)核局在化配列を含む当該Cas9酵素をコードする酵素コード配列に機能可能なように連結された第2の調節エレメントを含む真核宿主細胞を提供する。いくつかの実施形態では、宿主細胞は、構成要素(a)、及び構成要素(b)を含む。いくつかの実施形態では、構成要素(a)、構成要素(b)、または構成要素(a)及び(b)は、宿主真核生物細胞のゲノムに安定に組み込まれる。いくつかの実施形態では、構成要素(a)はさらに、第1の調節エレメントに機能可能なように連結された2つ以上のガイド配列を含み、発現されると、2つ以上のガイド配列のそれぞれは、CRISPR複合体の配列特異的結合を真核生物細胞中の異なる標的配列に向ける。いくつかの実施形態では、Cas9酵素は、標的配列の位置で1つまたは2つの鎖の切断を指示する。いくつかの実施形態では、Cas9酵素は、DNA鎖切断活性を欠いている。いくつかの実施形態では、第1の調節エレメントは、ポリメラーゼIIIプロモーターである。いくつかの実施形態では、第2の調節エレメントは、ポリメラーゼIIプロモーターである。 In one aspect, the invention is a eukaryotic host cell in which (a) a first regulatory element operably linked to a direct repeat sequence and one or more guide sequences downstream of the direct repeat sequence. One or more insertion sites for insertion, where expressed, the guide sequence induces sequence-specific binding of the CRISPR complex to the target sequence of eukaryotic cells, the CRISPR complex. To be capable of functioning into a CRISPR enzyme complexed with a guide RNA comprising a guide sequence that hybridizes to the target sequence and / or (b) an enzyme coding sequence encoding the Cas9 enzyme comprising a nuclear localized sequence. Provided is a eukaryotic host cell containing a second regulatory element linked to. In some embodiments, the host cell comprises a component (a), and a component (b). In some embodiments, the components (a), components (b), or components (a) and (b) are stably integrated into the genome of the host eukaryotic cell. In some embodiments, the component (a) further comprises two or more guide sequences operably linked to the first regulatory element and, when expressed, of the two or more guide sequences. Each directs the sequence-specific binding of the CRISPR complex to different target sequences in eukaryotic cells. In some embodiments, the Cas9 enzyme directs the cleavage of one or two strands at the location of the target sequence. In some embodiments, the Cas9 enzyme lacks DNA strand cleavage activity. In some embodiments, the first regulatory element is the polymerase III promoter. In some embodiments, the second regulatory element is the polymerase II promoter.

一態様では本発明は、非ヒト真核生物を;好ましくは、記載された実施形態のいずれかによる真核宿主細胞を含む多細胞真核生物を提供する。他の態様では、本発明は真核生物を;好ましくは、記載された実施形態のいずれかによる真核宿主細胞を含む、多細胞真核生物を提供する。これらの態様のいくつかの実施形態における生物は、動物;例えば、哺乳動物であってもよい。また、生物は昆虫などの節足動物でもよい。生物はまた、植物であっても、または酵母であってもよい。さらに、生物は真菌であってもよい。 In one aspect, the invention provides a non-human eukaryote; preferably a multicellular eukaryote comprising a eukaryotic host cell according to any of the described embodiments. In another aspect, the invention provides a eukaryote; preferably a multicellular eukaryote comprising a eukaryote host cell according to any of the described embodiments. The organism in some embodiments of these embodiments may be an animal; for example, a mammal. The organism may also be an arthropod such as an insect. The organism may also be a plant or a yeast. In addition, the organism may be a fungus.

一態様では、本発明は、本明細書で上記した構成要素の1つ以上を含むキットを提供する。いくつかの実施形態では、このキットは、ベクター系及びキットを使用するための指示書を備える。いくつかの実施形態では、ベクター系は、(a)ダイレクトリピート配列に機能可能なように連結された第1の調節エレメントと、ダイレクトリピート配列の下流に1つ以上のガイド配列を挿入するための1つ以上の挿入部位であって、発現されると、ガイド配列はCas9 CRISPR複合体の真核細胞の標的配列への配列特異的結合を指示し、ここでこのCRISPR複合体は、標的配列にハイブリダイズするガイド配列を含む保護されたガイドRNAと複合したCas9酵素を含むもの、及び/または(b)核局在化配列を含む当該Cas9酵素をコードする酵素コード配列に機能可能なように連結された第2の調節エレメント、を含む。いくつかの実施形態では、キットは、系の同じまたは異なるベクター上に配置された構成要素(a)及び(b)を含む。いくつかの実施形態では、構成要素(a)はさらに、第1の調節エレメントに機能可能なように連結された2つ以上のガイド配列を含み、発現されると、2つ以上のガイド配列のそれぞれが、CRISPR複合体の配列特異的結合を、真核生物細胞中で異なる標的配列に指示する。いくつかの実施形態では、Cas9酵素は、真核細胞の核内に検出可能な量で当該Cas9酵素の蓄積を駆動するのに十分な強度の1つ以上の核局在化配列を含む。いくつかの実施形態では、Cas9酵素は、Acidaminococcus sp.BV3L6、Lachnospiraceae bacterium MA2020またはFrancisella tularensis 1 Novicida Cas9であり、及びこれらの生物に由来する変異Cas9を含む場合がある。酵素は、Cas9ホモログまたはオルソログであり得る。いくつかの実施形態では、CRISPR酵素は、真核細胞での発現のためにコドン最適化されている。いくつかの実施形態では、CRISPR酵素は、標的配列の位置での1つまたは2つの鎖の切断を指示する。いくつかの実施形態では、CRISPR酵素は、DNA鎖切断活性を欠いている。いくつかの実施形態では、第1の調節エレメントは、ポリメラーゼIIIプロモーターである。いくつかの実施形態では、第2の調節エレメントはポリメラーゼIIプロモーターである。 In one aspect, the invention provides a kit comprising one or more of the components described herein. In some embodiments, the kit comprises a vector system and instructions for using the kit. In some embodiments, the vector system is (a) for inserting a first regulatory element operably linked to the direct repeat sequence and one or more guide sequences downstream of the direct repeat sequence. At one or more insertion sites, when expressed, the guide sequence directs sequence-specific binding of the Cas9 CRISPR complex to the target sequence of eukaryotic cells, where the CRISPR complex is directed to the target sequence. Those containing a Cas9 enzyme complexed with a protected guide RNA containing a hybridizing guide sequence and / or (b) operably linked to an enzyme coding sequence encoding the Cas9 enzyme containing a nuclear localization sequence. Includes a second adjusting element, which has been made. In some embodiments, the kit comprises components (a) and (b) arranged on the same or different vectors of the system. In some embodiments, the component (a) further comprises two or more guide sequences operably linked to the first regulatory element and, when expressed, of the two or more guide sequences. Each directs sequence-specific binding of the CRISPR complex to different target sequences in eukaryotic cells. In some embodiments, the Cas9 enzyme comprises one or more nuclear localization sequences of sufficient intensity to drive the accumulation of the Cas9 enzyme in a detectable amount in the nucleus of the eukaryotic cell. In some embodiments, the Cas9 enzyme is an Acidaminococcus sp. It is BV3L6, Lachnospiraceae bacterium MA2020 or Francisella tularensis 1 Novicida Cas9, and may contain mutant Cas9 derived from these organisms. The enzyme can be a Cas9 homolog or ortholog. In some embodiments, the CRISPR enzyme is codon-optimized for expression in eukaryotic cells. In some embodiments, the CRISPR enzyme directs the cleavage of one or two strands at the position of the target sequence. In some embodiments, the CRISPR enzyme lacks DNA strand cleavage activity. In some embodiments, the first regulatory element is the polymerase III promoter. In some embodiments, the second regulatory element is the polymerase II promoter.

一態様では、本発明は、真核細胞中の標的ポリヌクレオチドを改変する方法を提供する。いくつかの実施形態では、本方法は、CRISPR複合体を標的ポリヌクレオチドに結合させて、当該標的ポリヌクレオチドの切断を行い、それによって標的ポリヌクレオチドを改変することを含み、ここでCRISPR複合体は、当該標的ポリヌクレオチド内の標的配列にハイブリダイズしたガイド配列を含む保護されたガイドRNAと複合したCas9酵素を含む。いくつかの実施形態では、当該切断は、当該Cas9酵素による標的配列の位置での1つまたは2つの鎖の切断を含む。いくつかの実施形態では、当該切断は、標的遺伝子の転写の減少をもたらす。いくつかの実施形態では、この方法は、非相同末端結合(NHEJ)に基づく遺伝子挿入機構により、より具体的には外因性テンプレートポリヌクレオチドを用いて、当該切断された標的ポリヌクレオチドを修復することをさらに含み、ここで、当該修復は、当該標的ポリヌクレオチドの1つ以上のヌクレオチドの挿入、欠失、または置換を含む変異を生じる。いくつかの実施形態では、当該変異は、標的配列を含む遺伝子から発現されるタンパク質の1つ以上のアミノ酸変化をもたらす。いくつかの実施形態では、この方法は、1つ以上のベクターを当該真核細胞に送達することをさらに含み、ここで1つ以上のベクターは、Cas9酵素、ダイレクトリピート配列に連結されたガイド配列を含む保護されたガイドRNAのうちの1つ以上の発現を駆動する。いくつかの実施形態では、当該ベクターは、対象の真核細胞に送達される。いくつかの実施形態では、当該改変は、細胞培養物中の当該真核細胞で行われる。いくつかの実施形態では、この方法は、当該改変の前に対象から当該真核細胞を単離することをさらに含む。いくつかの実施形態では、この方法は、当該真核細胞及び/またはそれに由来する細胞を当該対象に戻すことをさらに含む。 In one aspect, the invention provides a method of modifying a target polynucleotide in a eukaryotic cell. In some embodiments, the method comprises attaching a CRISPR complex to a target polynucleotide to cleave the target polynucleotide, thereby modifying the target polynucleotide, wherein the CRISPR complex is: , Includes Cas9 enzyme complexed with a protected guide RNA containing a guide sequence hybridized to the target sequence within the target polynucleotide. In some embodiments, the cleavage comprises cleavage of one or two strands at the position of the target sequence by the Cas9 enzyme. In some embodiments, the cleavage results in a decrease in transcription of the target gene. In some embodiments, the method repairs the cleaved target polynucleotide by a non-homologous end joining (NHEJ) -based gene insertion mechanism, more specifically using an exogenous template polynucleotide. Further comprising, where the repair results in a mutation comprising the insertion, deletion, or substitution of one or more nucleotides of the target polynucleotide. In some embodiments, the mutation results in one or more amino acid changes in the protein expressed from the gene containing the target sequence. In some embodiments, the method further comprises delivering one or more vectors to the eukaryotic cell, wherein the one or more vectors are a guide sequence linked to a Cas9 enzyme, a direct repeat sequence. Drives the expression of one or more of the protected guide RNAs, including. In some embodiments, the vector is delivered to eukaryotic cells of interest. In some embodiments, the modification is performed on the eukaryotic cell in a cell culture. In some embodiments, the method further comprises isolating the eukaryotic cell from the subject prior to the modification. In some embodiments, the method further comprises returning the eukaryotic cell and / or cells derived thereof to the subject.

一態様では、本発明は、真核細胞におけるポリヌクレオチドの発現を改変する方法を提供する。いくつかの実施形態では、この方法は、Cas9 CRISPR複合体をポリヌクレオチドに結合させて、当該結合が当該ポリヌクレオチドの発現の増大または減少をもたらすことを含み;ここで、CRISPR複合体は、当該ポリヌクレオチド内の標的配列にハイブリダイズしたガイド配列を含む保護されたガイドRNAと複合されたCas9酵素を含む。いくつかの実施形態では、この方法は、1つ以上のベクターを当該真核細胞に送達することをさらに含み、この1つ以上のベクターは、Cas9酵素及び保護されたガイドRNAのうち1つ以上の発現を駆動する。 In one aspect, the invention provides a method of modifying the expression of a polynucleotide in eukaryotic cells. In some embodiments, the method comprises binding the Cas9 CRISPR complex to a polynucleotide, which results in an increase or decrease in expression of the polynucleotide; where the CRISPR complex is said. Includes a Cas9 enzyme complexed with a protected guide RNA containing a guide sequence hybridized to a target sequence within a polynucleotide. In some embodiments, the method further comprises delivering one or more vectors to the eukaryotic cell, wherein the one or more vectors are one or more of Cas9 enzymes and protected guide RNAs. Drives the expression of.

一態様では、本発明は、変異疾患遺伝子を含むモデル真核細胞を生成する方法を提供する。いくつかの実施形態では、疾患遺伝子は、疾患を有するまたは発症するリスクの増大に関連する任意の遺伝子である。いくつかの実施形態では、この方法は、(a)1つ以上のベクターを真核細胞に導入することであって、この1つ以上のベクターは、Cas9酵素及びダイレクトリピート配列に連結されたガイド配列を含む保護されたガイドRNAのうち1つ以上の発現を駆動すること;ならびに(b)CRISPR複合体を標的ポリヌクレオチドに結合させて、当該疾患遺伝子内の標的ポリヌクレオチドの切断を達成することであって、ここでCRISPR複合体は、標的ポリヌクレオチド内の標的配列にハイブリダイズされる配列を含むガイドRNAと複合したCas9酵素を含み、それによって、変異された疾患遺伝子を含むモデル真核細胞を生成すること、を含む。いくつかの実施形態では、当該切断は、当該Cas9酵素による標的配列の位置での1つまたは2つの鎖の切断を含む。いくつかの実施形態では、当該切断は、標的遺伝子の転写の減少をもたらす。いくつかの実施形態では、この方法は、外因性テンプレートポリヌクレオチドとの非相同末端結合(NHEJ)に基づく遺伝子挿入機構によって当該切断された標的ポリヌクレオチドを修復することをさらに含み、当該修復は、当該標的ポリヌクレオチドの1つ以上のヌクレオチドの挿入、欠失、または置換を含む変異をもたらす。いくつかの実施形態では、当該変異は、標的配列を含む遺伝子からのタンパク質発現の1つ以上のアミノ酸変化をもたらす。 In one aspect, the invention provides a method of producing a model eukaryotic cell containing a mutant disease gene. In some embodiments, the disease gene is any gene that is associated with an increased risk of having or developing the disease. In some embodiments, the method is (a) introducing one or more vectors into eukaryotic cells, the one or more vectors being linked to a Cas9 enzyme and a direct repeat sequence. Driving the expression of one or more of the protected guide RNAs containing the sequence; and (b) binding the CRISPR complex to the target polynucleotide to achieve cleavage of the target polynucleotide within the disease gene. Thus, the CRISPR complex comprises a Cas9 enzyme complexed with a guide RNA comprising a sequence that hybridizes to a target sequence within a target polynucleotide, thereby a model eukaryotic cell comprising a mutated disease gene. Including, to generate. In some embodiments, the cleavage comprises cleavage of one or two strands at the position of the target sequence by the Cas9 enzyme. In some embodiments, the cleavage results in a decrease in transcription of the target gene. In some embodiments, the method further comprises repairing the cleaved target polynucleotide by a non-homologous end joining (NHEJ) -based gene insertion mechanism with an extrinsic template polynucleotide. It results in a mutation involving the insertion, deletion, or substitution of one or more nucleotides of the target polynucleotide. In some embodiments, the mutation results in one or more amino acid changes in protein expression from the gene containing the target sequence.

一態様では、本発明は、疾患遺伝子に関連する細胞シグナル伝達事象を調節する生物学的に活性な薬剤を開発する方法を提供する。いくつかの実施形態では、疾患遺伝子は、疾患を有するか、または発症するリスクの増大に関連する任意の遺伝子である。いくつかの実施形態では、この方法は、(a)記載された実施形態のいずれか1つのモデル細胞と試験化合物を接触させること;及び(b)当該疾患遺伝子の当該変異に関連する細胞シグナル伝達事象の減少または増大を示す読み取りの変化を検出し、それによって、当該疾患遺伝子に関連する当該細胞シグナル伝達事象を調節する当該生物活性剤を開発することを含む。 In one aspect, the invention provides a method of developing a biologically active agent that regulates cellular signaling events associated with a disease gene. In some embodiments, the disease gene is any gene that has or is associated with an increased risk of developing the disease. In some embodiments, the method involves contacting the test compound with (a) the model cell of any one of the described embodiments; and (b) cell signaling associated with the mutation in the disease gene. It involves developing the bioactive agent that detects changes in readings that indicate a decrease or increase in the event, thereby regulating the cellular signaling event associated with the disease gene.

一態様では、本発明は、ダイレクトリピート配列の下流に保護されたガイド配列を含む組換えポリヌクレオチドを提供し、ここで保護されたガイド配列は、発現されると、真核生物細胞に存在する対応する標的配列へのCRISPR複合体の配列特異的結合を指示する。いくつかの実施形態では、標的配列は真核細胞に存在するウイルス配列である。いくつかの実施形態では、標的配列は、癌原遺伝子または癌遺伝子である。 In one aspect, the invention provides a recombinant polynucleotide comprising a protected guide sequence downstream of a direct repeat sequence, wherein the protected guide sequence is present in eukaryotic cells when expressed. Directs sequence-specific binding of the CRISPR complex to the corresponding target sequence. In some embodiments, the target sequence is a viral sequence present in eukaryotic cells. In some embodiments, the target sequence is a proto-oncogene or an oncogene.

一態様では、本発明は、1つ以上の細胞(複数可)の遺伝子に1つ以上の変異を導入することによって、1つ以上の細胞(複数可)を選択する方法を提供し、この方法は、1つ以上のベクターを細胞(複数可)に導入することであって、ここでこの1つ以上のベクターが、Cas9酵素、ガイド配列を含む保護されたガイドRNA、及び編集テンプレートのうちの1つ以上の発現を駆動し;ここでこの編集テンプレートは、Cas9酵素切断を無効にする1つ以上の変異を含むこと;選択される細胞(複数可)中の標的ポリヌクレオチドを用いて編集テンプレートの非相同末端結合(NHEJ)ベースの遺伝子挿入機構を可能にすること;CRISPR複合体を標的ポリヌクレオチドに結合させて、当該遺伝子内の標的ポリヌクレオチドの切断を達成することを可能にすることであって、ここでCRISPR複合体は、標的ポリヌクレオチド内の標的配列にハイブリダイズされるガイド配列を含む保護されたガイドRNAと複合体化したCas9酵素を含み、ここで、CRISPR複合体の標的ポリヌクレオチドへの結合が、細胞死を誘導し、それにより1つ以上の変異が導入された1つ以上の細胞(複数可)を選択することを可能にすることを含む。本発明の好ましい実施形態では、選択される細胞は真核細胞であってもよい。本発明の態様は、選択マーカーを必要とせずに特定の細胞の選択を可能にするか、逆選択系を含み得る2ステッププロセスを可能にする。 In one aspect, the invention provides a method of selecting one or more cells (s) by introducing one or more mutations into the gene of one or more cells (s). Is to introduce one or more vectors into a cell (s), where the one or more vectors are among Cas9 enzymes, protected guide RNAs containing guide sequences, and editing templates. Drive one or more expression; where this editing template contains one or more mutations that negate Cas9 enzymatic cleavage; the editing template using the target polynucleotide in the selected cell (s). To enable a non-homologous end binding (NHEJ) -based gene insertion mechanism; by binding the CRISPR complex to a target polynucleotide and allowing cleavage of the target polynucleotide within the gene to be achieved. Here, the CRISPR complex comprises a Cas9 enzyme complexed with a protected guide RNA containing a guide sequence that is hybridized to the target sequence within the target polynucleotide, where the target poly of the CRISPR complex. Binding to a nucleotide comprises inducing cell death, thereby allowing the selection of one or more cells (s) into which one or more mutations have been introduced. In a preferred embodiment of the invention, the cells selected may be eukaryotic cells. Aspects of the invention allow for the selection of specific cells without the need for selectable markers or allow for a two-step process that may include an adverse selection system.

Cas9酵素の変異に関して、酵素がFnCas9ではない場合、変異は本明細書の他のいずれかに記載されている通りであり得る;置換アミノ酸のいずれかの保存的置換も想定される。一態様では、本発明は、CRISPR酵素が少なくとも1つ以上、または少なくとも2つ以上の変異を含み、少なくとも1つ以上の変異または少なくとも2つ以上の変異が、本明細書の他のいずれかに説明されているものから選択される、本明細書で考察されるいずれかまたはそれぞれまたはすべての実施形態に関して提供する。 With respect to mutations in the Cas9 enzyme, if the enzyme is not FnCas9, the mutation may be as described elsewhere in this specification; conservative substitutions of any of the substituted amino acids are also envisioned. In one aspect, the invention comprises at least one or more mutations in the CRISPR enzyme, and at least one or more mutations or at least two or more mutations in any other of the specification. Provided with respect to any or each or all embodiments discussed herein, selected from those described.

さらなる態様では、本発明は、CRISPR-Cas9系またはその機能的部分に適合するかまたは結合する可能性のある化合物を同定または設計するため(またはその逆を含む)のコンピューター支援方法、(潜在的なCRISPR-Cas9系または望ましい化合物に結合するためのその機能部分を同定または設計するためのコンピューター支援方法)または潜在的なCRISPR-Cas9系を特定または設計するためのコンピューター支援方法(例えば、例えば、結晶構造データに基づいて、またはCas9オルソログのデータに基づいて、操作され得るCRISPR-Cas9系の領域を予測することに関して、または活性化因子もしくはリプレッサーなどの官能基をCRISPR-Cas9系に結合させ得る場合に関して、またはCas9切断に関して、もしくはニッカーゼを設計することに関して)に関与し、当該方法は以下を含む: In a further aspect, the invention is a computer-assisted method (including potential) for identifying or designing compounds that may match or bind to the CRISPR-Cas9 system or functional portions thereof (including vice versa). A computer-assisted method for identifying or designing a CRISPR-Cas9 system or its functional part for binding to a desired compound) or a computer-assisted method for identifying or designing a potential CRISPR-Cas9 system (eg, eg, eg. With respect to predicting regions of the CRISPR-Cas9 system that can be manipulated based on crystal structure data or based on Cas9 ortholog data, or by binding a functional group such as an activator or repressor to the CRISPR-Cas9 system. Involved in obtaining, or in Cas9 cleavage, or in designing nickases), the methods include:

コンピューターシステム、例えば、プロセッサ、データストレージシステム、入力デバイス、及び出力デバイスを含むプログラムされたコンピューターを使用する以下のステップ: The following steps using a programmed computer including a computer system, such as a processor, data storage system, input device, and output device:

(a)例えば、CRISPR-Cas9系結合ドメインまたは代替として、または追加して、Cas9オルソログの中の変化に基づいて変化するドメイン中で、またはCas9sに関してまたはニッカーゼに関して、または機能的群に関して、任意選択で、CRISPR-Cas9系複合体(複数可)からの構造情報を用いて、CRISPR-Cas9結晶構造からの、またはCRISPR-Cas9結晶構造に関連する原子のサブセットの3次元座標を含む当該入力デバイスデータを介してプログラムされたコンピューターに入力し、それによって、データセットを生成すること; (A) Optional choices, for example, in a CRISPR-Cas9-based binding domain or alternative, or in addition, in a domain that changes based on changes in the Cas9 ortholog, or with respect to Cas9s, with respect to nickase, or with respect to the functional group. The input device data, including the three-dimensional coordinates of a subset of atoms from the CRISPR-Cas9 crystal structure or related to the CRISPR-Cas9 crystal structure, using structural information from the CRISPR-Cas9 system complex (s). Input to a computer programmed through, thereby generating a dataset;

(b)上記プロセッサを使用して、上記データセットを、上記コンピューターデータストレージシステムに記憶された構造のコンピューターデータベース、例えば、CRISPR-Cas9系に結合もしくは推定結合するか、または結合することが望まれる化合物の構造と、またはCas9オルソログ(例えば、Cas9sまたはCas9オルソログ間で異なるドメインまたは領域)またはCRISPR-Cas9結晶構造またはニッカーゼに関してまたは官能基に関して比較すること; (B) It is desirable to use the processor to bind, presumably, or bind the data set to a computer database having a structure stored in the computer data storage system, for example, a CRISPR-Cas9 system. Comparing the structure of a compound with respect to Cas9 orthologs (eg, different domains or regions between Cas9s or Cas9 orthologs) or CRISPR-Cas9 crystal structures or nickases or functional groups;

(c)コンピューター手法を使用して、上記のデータベースから、構造-例えば、所望の構造に結合し得るCRISPR-Cas9構造、特定のCRISPR-Cas9構造に結合し得る所望の構造、操作され得るCRISPR-Cas9系の一部(例えば、CRISPR-Cas9結晶構造の他の部分由来、及び/またはCas9オルソログ、切断されたCas9s、新規ニッカーゼもしくは特定の官能基、または官能基もしくは官能基CRISPR-Cas9系を結合するための位置からのデータに基づいて)を選択すること; (C) Using computer techniques, from the above database, structures-eg, CRISPR-Cas9 structures that can bind to a desired structure, desired structures that can bind to a particular CRISPR-Cas9 structure, CRISPR that can be manipulated-. Part of the Cas9 system (eg, derived from other parts of the CRISPR-Cas9 crystal structure and / or Cas9 ortholog, cleaved Cas9s, novel nickase or specific functional group, or functional group or functional group CRISPR-Cas9 system attached. (Based on the data from the position to do);

(d)選択された構造(複数可)のモデルを、コンピューター法を使用して構築すること;ならびに (D) Building a model of the selected structure (s) using computer methods;

(e)選択した構造(複数可)を当該出力デバイスに出力すること; (E) Output the selected structure (s) to the output device;

ならびに任意選択で、選択した構造(複数可)の1つ以上を合成すること; And, optionally, synthesize one or more of the selected structures (s);

ならびに、任意選択で、当該合成された選択された構造(複数可)を、CRISPR-Cas9系として、またはCRISPR-Cas9系で、さらに試験すること; Also, optionally, the synthesized selected structure (s) may be further tested as a CRISPR-Cas9 system or in a CRISPR-Cas9 system;

あるいは、当該方法は、CRISPR-Cas9結晶構造の少なくとも2つの原子の座標、例えば、CRISPR-Cas9結晶構造の本明細書の結晶構造表の少なくとも2つの原子の座標、またはCRISPR-Cas9結晶構造の少なくともサブドメインの座標(「選択された座標」)を提供すること、例えば、CRISPR-Cas9結晶構造の他の一部由来、及び/またはCas9オルソログ由来のデータに基づいて、操作され得る結合分子を含む候補の構造またはCRISPR-Cas9系の一部を提供すること、ならびに候補の構造を選択された座標にあてはめて、それによって、所望の構造に結合し得るCRISPR-Cas9構造、特定のCRISPR-Cas9構造に結合し得る所望の構造、操作され得るCRISPR-Cas9系の一部、切断されたCas9、新規ニッカーゼ、または特定の官能基、または官能基または官能基CRISPR-Cas9系に結合するための位置、及びその出力を含む生成物データをその出力を用いて取得すること;及び任意選択で、上記製品データから化合物(複数可)を合成し、さらに、任意選択で、CRISPR-Cas9系として、またはCRISPR-Cas9系内で当該合成化合物(複数可)を試験することを含む。 Alternatively, the method comprises the coordinates of at least two atoms of the CRISPR-Cas9 crystal structure, eg, the coordinates of at least two atoms in the crystal structure table herein of the CRISPR-Cas9 crystal structure, or at least the coordinates of the CRISPR-Cas9 crystal structure. Provide subdomain coordinates (“selected coordinates”), including binding molecules that can be manipulated, eg, based on data from other parts of the CRISPR-Cas9 crystal structure and / or from Cas9 orthologs. CRISPR-Cas9 structures, specific CRISPR-Cas9 structures that can provide a candidate structure or part of the CRISPR-Cas9 system, as well as fit the candidate structure to selected coordinates and thereby bind to the desired structure. A desired structure that can be attached to, a portion of the CRISPR-Cas9 system that can be manipulated, a cleaved Cas9, a novel nickase, or a specific functional group, or a functional group or a position for attaching to the functional group CRISPR-Cas9 system. And to obtain product data including its output using its output; and optionally synthesize a compound (s) from the above product data and optionally as a CRISPR-Cas9 system or CRISPR. -Includes testing the synthetic compound (s) in a Cas9 system.

試験は、例えば、結合に関して、または所望の機能を実行することに関して、合成された選択された構造(複数可)から生じるCRISPR-Cas9系を分析することを含み得る。 The test may include analyzing the CRISPR-Cas9 system resulting from the synthesized selected structure (s), eg, with respect to binding or performing the desired function.

前述の方法における出力は、データ送信、例えば、電気通信、電話、ビデオ会議、マスコミュニケーション、例えば、コンピュータープレゼンテーション(例えば、POWERPOINT)などのプレゼンテーション、インターネット、電子メール、文書通信、例えば、コンピュータープログラム(例:WORD)文書などを介した情報の送信を含み得る。したがって、本発明はまた、本明細書で参照される結晶構造による原子座標データ、CRISPR-Cas9またはその少なくとも1つのサブドメインの3次元構造を定義する原子座標データ、またはCRISPR-Cas9の構造要因データを包含するコンピューター読み取り可能な媒体を含み、当該構造因子データは、本明細書で参照される結晶構造の原子座標データから導出可能である。コンピューター読み取り可能な媒体は、前述の方法の任意のデータも含んでもよい。本発明はさらに、以下のいずれかを含む前述の方法のような合理的設計を生成または実行するためのコンピューターシステムの方法を含む:本明細書に引用される結晶構造による原子座標データであって、当該データは、CRISPR-Cas9またはその少なくとも1つのサブドメインの三次元構造、またはCRISPR-Cas9の構造因子データを提供し、当該構造因子データは、本明細書で参照される結晶構造の原子座標データから導出可能である。本発明はさらに、コンピューターシステムまたは媒体またはCRISPR-Cas9またはその少なくとも1つのサブドメインの三次元構造、またはCRISPR-Cas9の構造因子データをユーザーに提供することを含むビジネスを行う方法を包含し、当該構造は示されており、かつ当該構造因子データは、本明細書で参照される結晶構造の原子座標データ、または本明細書のコンピューター媒体または本明細書のデータ送信から導出可能である。 The output in the aforementioned method is data transmission, eg telecommunications, telephone, video conferencing, mass communication, eg presentations such as computer presentations (eg POWERPOINT), internet, email, document communications, eg computer programs (eg computer programs). : WORD) May include transmission of information via documents and the like. Accordingly, the present invention also includes atomic coordinate data according to the crystal structure referred to herein, atomic coordinate data defining the three-dimensional structure of CRISPR-Cas9 or at least one subdomain thereof, or structural factor data of CRISPR-Cas9. Including a computer-readable medium comprising, the structural factor data can be derived from the atomic coordinate data of the crystal structure referred to herein. The computer-readable medium may also include any data from the methods described above. The invention further includes methods of computer systems for generating or performing rational designs, such as those described above, including any of the following: Atomic coordinate data in crystal structure cited herein. , The data provides the three-dimensional structure of CRISPR-Cas9 or at least one subdomain thereof, or the structural factor data of CRISPR-Cas9, which is the atomic coordinates of the crystal structure referred to herein. It can be derived from the data. The invention further embraces a method of doing business comprising providing a user with a three-dimensional structure of a computer system or medium or CRISPR-Cas9 or at least one subdomain thereof, or structural factor data of CRISPR-Cas9. The structure is shown and the structural factor data can be derived from the atomic coordinate data of the crystal structure referenced herein, or from the computer media herein or data transmission herein.

「結合部位」または「活性部位」は、結合に関与している核酸分子などの化合物に結合し得る結合空洞または領域中の部位(原子、アミノ酸残基の官能基または複数のそのような原子及び/または基など)を含むか、または本質的にそれらからなるか、またはそれらからなる。 A "binding site" or "active site" is a site in a binding cavity or region that can bind to a compound such as a nucleic acid molecule involved in the binding (atom, functional group of amino acid residues or multiple such atoms and / Or groups, etc.), or essentially consist of, or consist of them.

「フィッティング、あてはめ、適合」とは、自動または半自動手段により、候補分子の1つ以上の原子と本発明の構造の少なくとも1つの原子との間の相互作用を決定すること、及び、そのような相互作用が安定である程度を計算することを意味する。相互作用としては、電荷、立体的な考慮事項などによってもたらされる引力及び反発が挙げられる。フィッティングのための様々なコンピューターベースの方法をさらに説明する。 "Fit, fit, fit" means determining the interaction between one or more atoms of a candidate molecule and at least one atom of the structure of the invention by automatic or semi-automatic means, and such. It means that the interaction is stable and calculates to some extent. Interactions include attraction and repulsion brought about by charge, steric considerations, and the like. Various computer-based methods for fitting are further described.

「平均平方根(またはrms)偏差」とは、平均からの偏差の平方の算術平均の平方根を意味する。 "Root mean square (or rms) deviation" means the arithmetic mean square root of the square root of the deviation from the mean.

「コンピューターシステム」とは、原子座標データを分析するために使用されるハードウェア手段、ソフトウェア手段、及びデータ記憶手段を意味する。本発明のコンピューターベースのシステムの最小ハードウェア手段は、典型的には中央処理装置(CPU)、入力手段、出力手段及びデータ記憶手段を含む。構造データを視覚化するために、ディスプレイまたはモニターを設けることが望ましい。データ記憶手段は、RAMであっても、または本発明のコンピューター読み取り可能な媒体にアクセスするための手段であってもよい。そのようなシステムの例は、Unix、Windows、またはAppleオペレーティングシステムを実行しているコンピューター及びタブレットデバイスである。 "Computer system" means hardware means, software means, and data storage means used to analyze atomic coordinate data. Minimal hardware means of a computer-based system of the present invention typically include a central processing unit (CPU), input means, output means and data storage means. It is desirable to have a display or monitor to visualize the structural data. The data storage means may be RAM or means for accessing the computer-readable medium of the present invention. Examples of such systems are computers and tablet devices running the Unix, Windows, or Apple operating systems.

「コンピューター読み取り可能媒体」とは、例えば、コンピューターが直接的または間接的に読み取り及びアクセスし得る任意の媒体(複数可)であって、例えば、その結果、その媒体は上述のコンピューターシステムでの使用に適している媒体を意味する。このような媒体としては、限定するものではないが、磁気記憶媒体;例えば、フロッピーディスク、ハードディスクストレージメディア、及び磁気テープ;光学ディスクまたはCD-ROMなどの光学記憶媒体;RAM及びROMなどの電気記憶媒体;サムドライブデバイス;クラウドストレージデバイスならびに磁気/光ストレージメディアなど、これらのカテゴリのハイブリッドが挙げられる。 A "computer-readable medium" is, for example, any medium (s) that can be read and accessed directly or indirectly by a computer, for example, as a result of which the medium is used in the computer system described above. Means a suitable medium. Such media include, but are not limited to, magnetic storage media; for example, floppy disks, hard disk storage media, and magnetic tapes; optical storage media such as optical disks or CD-ROMs; electrical storage such as RAMs and ROMs. Media; thumb drive devices; cloud storage devices and hybrids of these categories such as magnetic / optical storage media.

本発明は、本明細書に記載の最適化された機能的CRISPR-Cas酵素系における本明細書の上記の保護ガイドの使用を包含する。 The invention includes the use of the above protection guides herein in the optimized functional CRISPR-Cas enzyme system described herein.

セットカバーアプローチ
特定の実施形態において、例えば、ウイルス及び微生物の定義されたセット内のすべてのウイルス及び/または微生物種を同定できるプライマー及び/またはプローブが設計される。そのような方法は、特定の例示的な実施形態に記載されている。セットカバー解法は、標的配列全体または標的配列のセット、例えばゲノム配列のセットをカバーするために必要な最小数の標的配列プローブまたはプライマーを識別できる。セットカバーアプローチは、通常20~50塩基対の範囲で、プライマー及び/またはマイクロアレイプローブを識別するために以前に使用されている。例えば、Pearson et al.,cs.virginia.edu/~robins/papers/primers_damll_fmal.pdf、Jabado et al.Nucleic Acids Res.2006 34(22):6605-ll、Jabado et al.Nucleic Acids Res.2008,36(l):e3 doi10.1093/nar/gkmll06、Duitama et al.Nucleic Acids Res.2009,37(8):2483-2492、Phillippy et al.BMC Bioinformatics.2009,10:293 doi:10.1186/1471-2105-10-293を参照されたい。このようなアプローチでは、一般に、各プライマー/プローブをk-merとして扱い、完全一致を検索するか、またはサフィックスアレイを使用して不正確一致を可能にする。さらに、これらの方法は、一般に、各入力配列が1つのプライマーまたはプローブによって結合されることのみを必要とし、配列に沿ったこの結合の位置は無関係であるように、プライマーまたはプローブを選択することにより、ハイブリダイゼーションを検出するためのバイナリアプローチを取る。別の方法では、標的ゲノムを事前定義されたウィンドウに分割し、バイナリアプローチの下で各ウィンドウを個別の入力配列として効果的に扱うことができる。すなわち、特定のプローブまたはガイドRNAが各ウィンドウ内で結合するかどうかを決定し、すべてのウィンドウが、いくつかのプライマーまたはプローブの状態によって結合されている必要がある。事実上、これらのアプローチは、セットカバー問題の「ユニバース」の各要素を入力配列全体または入力配列の事前定義されたウィンドウのいずれかとして扱い、各要素は、プローブまたはガイドRNAの開始が、要素内で結合する場合、「カバーされている」とみなされる。
Set Cover Approach In certain embodiments, primers and / or probes that can identify, for example, all viruses and / or microbial species within a defined set of viruses and microorganisms are designed. Such methods are described in certain exemplary embodiments. The set cover solution can identify the minimum number of target sequence probes or primers required to cover the entire target sequence or set of target sequences, such as a set of genomic sequences. Set cover approaches have previously been used to identify primers and / or microarray probes, typically in the range of 20-50 base pairs. For example, Pearson et al. , Cs. Virginia. edu / ~ robins / papers / primers_damll_fmal. pdf, Jabado et al. Nucleic Acids Res. 2006 34 (22): 6605-ll, Jabado et al. Nucleic Acids Res. 2008, 36 (l): e3 doi10.1093 / nar / gkmll06, Duitama et al. Nucleic Acids Res. 2009, 37 (8): 2483-2492, Phillippy et al. BMC Bioinformatics. 2009, 10: 293 doi: 10.1186 / 1471-2105-10-293. Such an approach generally treats each primer / probe as a kmer and either searches for an exact match or uses a suffix array to allow inaccurate matches. Moreover, these methods generally only require that each input sequence be bound by one primer or probe, and the primer or probe is selected so that the position of this binding along the sequence is irrelevant. Takes a binary approach to detect hybridization. Alternatively, the target genome can be divided into predefined windows and each window can be effectively treated as a separate input sequence under a binary approach. That is, it is necessary to determine whether a particular probe or guide RNA binds within each window and all windows are bound by the state of some primers or probes. In effect, these approaches treat each element of the "universe" of the set cover problem as either the entire input sequence or a predefined window of the input sequence, where each element has the start of a probe or guide RNA. When combined within, it is considered "covered".

いくつかの実施形態では、本明細書に開示される方法は、単一のアッセイで所与のウイルスのすべての変異体、または複数の異なるウイルスを同定するために使用され得る。さらに、本明細書に開示される方法は、セットカバー問題における「ユニバース」の各要素を標的配列のヌクレオチドとして扱い、プローブまたはガイドRNAが、要素を含む標的ゲノムのいくつかのセグメントに結合する限り、各要素は「カバーされている」とみなされる。所与のプライマーまたはプローブが所与のウィンドウに結合するか結合しないかを尋ねるだけでなく、そのようなアプローチを使用してハイブリダイゼーションパターンを検出することができる。すなわち、所定のプライマーまたはプローブが1つの標的配列または複数の標的配列に結合する場合、それらのハイブリダイゼーションパターンから、サンプルからの濃縮とありとあらゆる標的配列の配列決定の両方を可能にするのに十分な程度に標的配列のセットをカバーするために必要なプライマーまたはプローブの最小数を決定する。これらのハイブリダイゼーションパターンは、損失関数を最小限に抑える特定のパラメーターを定義することによって決定でき、これにより、例えば、各種の多様性を反映するように、パラメーターを各種に対して変動させることを可能にする方法で、またプライマーまたはプローブの設計コンテキストで以前に適用されたものなど、セットカバー解法の単純なアプリケーションを使用して達成することができないコンピューター的に効率的な方法で、最小限のプローブまたはガイドRNAのセットの同定が可能となる。 In some embodiments, the methods disclosed herein can be used to identify all variants of a given virus, or multiple different viruses, in a single assay. Further, the methods disclosed herein treat each element of the "universe" in the set cover problem as a nucleotide of the target sequence, as long as the probe or guide RNA binds to several segments of the target genome containing the element. , Each element is considered "covered". In addition to asking if a given primer or probe binds or does not bind to a given window, such an approach can be used to detect hybridization patterns. That is, when a given primer or probe binds to a single target sequence or multiple target sequences, their hybridization pattern is sufficient to allow both enrichment from the sample and sequencing of any target sequence. To some extent determine the minimum number of primers or probes needed to cover a set of target sequences. These hybridization patterns can be determined by defining specific parameters that minimize the loss function, thereby varying the parameters relative to each other, eg, to reflect different varieties. Minimal, in a way that enables, and in a computer-efficient way that cannot be achieved using simple applications of setcover solutions, such as those previously applied in the design context of primers or probes. Allows identification of a set of probes or guide RNAs.

複数の転写産物の存在量を検出する能力は、特定の表現型を示す独特なウイルスまたは微生物のシグネチャーの生成を可能にできる。様々な機械学習技術を使用して、遺伝子シグネチャーを導き出すことができる。したがって、本発明のプライマー及び/またはプローブを使用して、特定の表現型を検出するために、遺伝子シグネチャーによって定義されるバイオマーカーの相対レベルを同定及び/または定量することができる。特定の例示的な実施形態では、遺伝子シグネチャーは、特定の治療に対する感受性、治療に対する耐性、またはそれらの組み合わせを示す。 The ability to detect the abundance of multiple transcripts can allow the generation of unique viral or microbial signatures that exhibit a particular phenotype. Various machine learning techniques can be used to derive gene signatures. Thus, the primers and / or probes of the invention can be used to identify and / or quantify the relative levels of biomarkers defined by the gene signature to detect a particular phenotype. In certain exemplary embodiments, the gene signature indicates susceptibility to a particular treatment, resistance to treatment, or a combination thereof.

本発明の一態様において、方法は、1つ以上の病原体を検出することを含む。このようにして、個々の微生物による対象の感染の区別を得ることができる。いくつかの実施形態では、そのような区別により、臨床医は特定の疾患、例えば、疾患の様々なバリアントを検出または診断することができる。好ましくは、ウイルスまたは病原体配列は、ウイルスもしくは病原体のゲノムまたはその断片である。この方法は、病原体の進化を決定することをさらに含み得る。病原体の進化を決定することは、病原体の変異、例えば、ヌクレオチド欠失、ヌクレオチド挿入、ヌクレオチド置換の同定を含み得る。後者には、非同義、同義、及び非コード置換がある。変異は、アウトブレイク中は非同義であることが多い。この方法は、上述のように分析された2つの病原体配列間の置換率を決定することをさらに含み得る。変異が有害であるか適応性があるかは、機能分析が必要になるが、非同義変異の割合は、この流行の継続的な進行が病原体適応の機会を与える可能性があることを示唆しており、迅速な封じ込めの必要性を強調する。したがって、この方法は、ウイルス適応のリスクを評価することをさらに含むことができ、非同義変異の数が決定される。(Gire,et al.,Science 345,1369,2014)。この方法は、本明細書のいずこかに記載されている診断ガイド設計を含むことができる。 In one aspect of the invention, the method comprises detecting one or more pathogens. In this way, it is possible to obtain a distinction between infections of the subject by individual microorganisms. In some embodiments, such a distinction allows the clinician to detect or diagnose a particular disease, eg, various variants of the disease. Preferably, the virus or pathogen sequence is a genome or fragment thereof of the virus or pathogen. This method may further include determining the evolution of the pathogen. Determining the evolution of a pathogen can include the identification of pathogen mutations, such as nucleotide deletions, nucleotide insertions, and nucleotide substitutions. The latter include non-synonymous, synonymous, and non-code substitutions. Mutations are often non-synonymous during an outbreak. This method may further comprise determining the substitution rate between the two pathogen sequences analyzed as described above. Whether the mutation is harmful or adaptive requires functional analysis, but the proportion of non-synonymous mutations suggests that continued progression of this epidemic may provide opportunities for pathogen adaptation. Emphasizes the need for prompt containment. Therefore, this method can further include assessing the risk of viral adaptation and the number of non-synonymous mutations is determined. (Gire, et al., Science 345, 1369, 2014). This method can include diagnostic guide designs described elsewhere herein.

RNAベースのマスキング構築物
本明細書で使用されるとき、「マスキング構築物」は、本明細書に記載の活性化されたCRISPR系エフェクタータンパク質によって切断またはさもなければ不活性化され得る分子を指す。「マスキング構築物」という用語は、代わりに「検出構築物」と呼ばれ得る。特定の例示的な実施形態において、マスキング構築物は、RNAベースのマスキング構築物である。RNAベースのマスキング構築物は、CRISPRエフェクタータンパク質によって切断可能なRNA要素を含む。RNA要素の切断は、薬剤を解放するか、検出可能なシグナルが生成されることを可能にする構造変化を生成する。どのようにRNA要素を使用して検出可能なシグナルの生成を防止またはマスキングできるかを示す例示的な構築物が以下に記載されており、本発明の実施形態は、それらの改変を含む。切断の前、またはマスキング構築物が「活性」状態にある場合、マスキング構築物は、検出可能な陽性シグナルの生成または検出をブロックする。特定の例示的な実施形態では、活性RNAマスキング構築物の存在下で最小限のバックグラウンドシグナルが生成され得ることが理解されるであろう。陽性の検出可能なシグナルは、光学的、蛍光的、化学発光的、電気化学的、または当該技術分野で公知の他の検出方法を使用して検出できる任意のシグナルであり得る。「検出可能な陽性シグナル」という用語は、マスキング構築物の存在下で検出可能である可能性のある他の検出可能シグナルと区別するために使用される。例えば、特定の実施形態では、マスキング剤が存在するときに第1のシグナルを検出することができ(すなわち、検出可能な陰性シグナル)、これは、次いで、標的分子の検出時及び活性化されたCRISPRエフェクタータンパク質によるマスキング剤の切断または非活性化時に、第2のシグナル(例えば、検出可能な陽性シグナル)に変換される。
RNA-Based Masking Constructs As used herein, "masking constructs" refers to molecules that can be cleaved or otherwise inactivated by the activated CRISPR-based effector proteins described herein. The term "masking construct" may instead be referred to as "detection construct". In certain exemplary embodiments, the masking construct is an RNA-based masking construct. RNA-based masking constructs contain RNA elements that can be cleaved by the CRISPR effector protein. Cleavage of the RNA element produces a structural change that allows the drug to be released or a detectable signal to be generated. Exemplary constructs are described below showing how RNA elements can be used to prevent or mask the generation of detectable signals, and embodiments of the invention include modifications thereof. Prior to cleavage, or if the masking construct is in the "active" state, the masking construct blocks the generation or detection of a detectable positive signal. It will be appreciated that in certain exemplary embodiments, minimal background signal can be generated in the presence of an active RNA masking construct. The positive detectable signal can be optical, fluorescent, chemiluminescent, electrochemical, or any signal that can be detected using other detection methods known in the art. The term "detectable positive signal" is used to distinguish it from other detectable signals that may be detectable in the presence of masking constructs. For example, in certain embodiments, the first signal can be detected in the presence of the masking agent (ie, a detectable negative signal), which is then activated and at the time of detection of the target molecule. Upon cleavage or deactivation of the masking agent by the CRISPR effector protein, it is converted to a second signal (eg, a detectable positive signal).

したがって、本発明の特定の実施形態において、RNAベースのマスキング構築物は、検出可能な陽性シグナルの生成を抑制するか、またはRNAベースのマスキング構築物は、検出可能な陽性シグナルをマスキングすることにより、もしくは代わりに検出可能な陰性シグナルを生成することにより、検出可能な陽性シグナルの生成を抑制するか、またはRNAベースのマスキング構築物は、レポーティング構築物によってコードされる遺伝子産物の生成を抑制するサイレンシングRNAを含み、遺伝子産物は、発現時に検出可能な陽性シグナルを生成する。 Thus, in certain embodiments of the invention, the RNA-based masking construct suppresses the generation of detectable positive signals, or the RNA-based masking construct masks the detectable positive signal, or Instead, it suppresses the generation of detectable positive signals by producing detectable negative signals, or RNA-based masking constructs suppress the production of gene products encoded by the reporting constructs with silencing RNA. Including, the gene product produces a detectable positive signal upon expression.

さらなる実施形態において、RNAベースのマスキング構築物は、検出可能な陰性シグナルを生成するリボザイムであり、リボザイムが不活性化されると、検出可能な陽性シグナルが生成されるか、またはリボザイムが基質を第1の色に変換し、リボザイムが不活性化されたときに基質が第2の色に変換される。 In a further embodiment, the RNA-based masking construct is a ribozyme that produces a detectable negative signal, and when the ribozyme is inactivated, a detectable positive signal is produced or the ribozyme is the substrate. It is converted to the first color and the substrate is converted to the second color when the ribozyme is inactivated.

他の実施形態において、RNAベースのマスキング剤はRNAアプタマーであるか、またはアプタマーは酵素を隔離し、酵素は基質に作用することによりアプタマーからの放出時に検出可能なシグナルを生成するか、またはアプタマーは、アプタマーから放出されたときに結合して検出可能なシグナルを生成する剤のペアを隔離する。 In other embodiments, the RNA-based masking agent is an RNA aptamer, or the aptamer sequesters the enzyme, and the enzyme acts on the substrate to generate a detectable signal upon release from the aptamer, or the aptamer. Isolates a pair of agents that bind when released from an aptamer to produce a detectable signal.

別の実施形態では、RNAベースのマスキング構築物は、検出可能なリガンド及びマスキング成分が付着するRNAオリゴヌクレオチドを含む。別の実施形態では、検出可能なリガンドはフルオロフォアであり、マスキング成分はクエンチャー分子、またはNASBAまたはRPA試薬などであるがこれらに限定されない標的RNA分子を増幅する試薬である。 In another embodiment, the RNA-based masking construct comprises an RNA oligonucleotide to which a detectable ligand and masking component are attached. In another embodiment, the detectable ligand is a fluorophore and the masking component is a reagent that amplifies a target RNA molecule, such as, but not limited to, a quencher molecule, or NASBA or RPA reagent.

特定の例示的な実施形態では、マスキング構築物は遺伝子産物の生成を抑制し得る。遺伝子産物は、サンプルに加えられるレポーター構築物によってコードされ得る。マスキング構築物は、短鎖ヘアピンRNA(shRNA)または低分子干渉RNA(siRNA)など、RNA干渉経路に関与する干渉RNAであり得る。マスキング構築物は、マイクロRNA(miRNA)も含み得る。マスキング構築物が存在する間、遺伝子産物の発現を抑制する。遺伝子産物は、蛍光タンパク質もしくは他のRNA転写物、またはさもなければマスキング構築物が存在しない場合は、標識プローブ、アプタマー、または抗体によって検出可能であるタンパク質であり得る。エフェクタータンパク質が活性化されると、マスキング構築物が切断されるか、さもなければサイレンシングされ、遺伝子産物の発現及び検出が検出可能な陽性シグナルとして可能になる。 In certain exemplary embodiments, the masking construct may suppress the production of gene products. The gene product can be encoded by a reporter construct added to the sample. The masking construct can be interfering RNA involved in the RNA interference pathway, such as short hairpin RNA (SHRNA) or small interfering RNA (siRNA). Masking constructs can also include microRNAs (miRNAs). Suppresses the expression of gene products during the presence of masking constructs. The gene product can be a fluorescent protein or other RNA transcript, or a protein that can be detected by a labeled probe, aptamer, or antibody in the absence of a masking construct. When the effector protein is activated, the masking construct is cleaved or otherwise silenced, allowing expression and detection of the gene product as a detectable positive signal.

特定の例示的な実施形態では、マスキング構築物は、検出可能な陽性シグナルを生成するために必要な1つ以上の試薬を隔離し、それによってマスキング構築物からの1つ以上の試薬の放出が検出可能な陽性シグナルの生成をもたらすようにすることができる。1つ以上の試薬を組み合わせて比色シグナル、化学発光シグナル、蛍光シグナル、または他の任意の検出可能なシグナルを生成することができ、そのような目的に適していることが知られている任意の試薬を含むことができる。特定の例示的な実施形態において、1つ以上の試薬は、1つ以上の試薬に結合するRNAアプタマーによって隔離される。標的分子の検出時にエフェクタータンパク質が活性化され、RNAアプタマーが分解されると、1つ以上の試薬が放出される。 In certain exemplary embodiments, the masking construct isolates one or more reagents required to generate a detectable positive signal, thereby detecting the release of one or more reagents from the masking construct. Can result in the production of positive signals. Any one or more reagents that can be combined to produce a colorimetric signal, chemiluminescent signal, fluorescent signal, or any other detectable signal and is known to be suitable for such purposes. Reagents can be included. In certain exemplary embodiments, one or more reagents are isolated by RNA aptamers that bind to one or more reagents. When the effector protein is activated upon detection of the target molecule and the RNA aptamer is degraded, one or more reagents are released.

特定の例示的な実施形態では、マスキング構築物は、個別の別個のボリューム(以下でさらに定義される)内の固体基質上に固定化され、単一の試薬を隔離することができる。例えば、試薬は色素を含むビーズであり得る。固定化試薬によって隔離された場合、個々のビーズは拡散しすぎて検出可能なシグナルを生成できないが、マスキング構築物からの放出時に、例えば凝集または溶液濃度の単純な増加によって、検出可能なシグナルを生成できる。特定の例示的な実施形態では、固定化されたマスキング剤は、標的分子の検出時に活性化エフェクタータンパク質によって切断され得るRNAベースのアプタマーである。 In certain exemplary embodiments, the masking construct is immobilized on a solid substrate within separate separate volumes (further defined below), allowing a single reagent to be isolated. For example, the reagent can be beads containing a dye. When isolated by immobilization reagents, individual beads are too diffused to produce a detectable signal, but upon release from the masking construct, for example by aggregation or a simple increase in solution concentration, produce a detectable signal. can. In certain exemplary embodiments, the immobilized masking agent is an RNA-based aptamer that can be cleaved by the activated effector protein upon detection of the target molecule.

特定の他の例示的な実施形態では、マスキング構築物は、溶液中で固定化された試薬に結合し、それにより、溶液中で遊離している別個の標識結合パートナーに試薬が結合する能力をブロックする。したがって、サンプルに洗浄ステップを適用すると、標的分子が存在しない状態で、標識された結合パートナーをサンプルから洗い流すことができる。しかしながら、エフェクタータンパク質が活性化されると、マスキング構築物は、マスキング構築物が試薬に結合する能力を妨害するのに十分な程度に切断され、それにより、標識された結合パートナーが固定化試薬に結合できるようになる。したがって、標識された結合パートナーは、洗浄ステップの後も残存し、サンプル中の標的分子の存在を示す。特定の態様において、固定化試薬に結合するマスキング構築物はRNAアプタマーである。固定化試薬はタンパク質であってもよく、標識された結合パートナーは標識された抗体であってもよい。代替的に、固定化試薬はストレプトアビジンであってもよく、標識結合パートナーは標識ビオチンであってもよい。上述の実施形態で使用される結合パートナー上の標識は、当該技術分野で既知の任意の検出可能な標識であり得る。さらに、本明細書に記載の全体的な設計に従って、他の既知の結合パートナーを使用することができる。 In certain other exemplary embodiments, the masking construct binds to the reagent immobilized in solution, thereby blocking the ability of the reagent to bind to a separate labeled binding partner free in solution. do. Therefore, applying the wash step to the sample can wash the labeled binding partner from the sample in the absence of the target molecule. However, when the effector protein is activated, the masking construct is cleaved to such an extent that it interferes with the ability of the masking construct to bind to the reagent, thereby allowing the labeled binding partner to bind to the immobilization reagent. It will be like. Therefore, the labeled binding partner remains after the wash step, indicating the presence of the target molecule in the sample. In certain embodiments, the masking construct that binds to the immobilization reagent is an RNA aptamer. The immobilization reagent may be a protein and the labeled binding partner may be a labeled antibody. Alternatively, the immobilization reagent may be streptavidin and the labeled binding partner may be labeled biotin. The label on the binding partner used in the above embodiments can be any detectable label known in the art. In addition, other known binding partners can be used according to the overall design described herein.

特定の例示的な実施形態では、マスキング構築物はリボザイムを含み得る。リボザイムは、触媒特性を持つRNA分子である。リボザイムは、天然及び操作されたものであり、本明細書に開示されるエフェクタータンパク質によって標的とされ得るRNAを含むか、またはRNAからなる。リボザイムは、検出可能な陰性シグナルを生成するか、または陽性対照シグナルの生成を防止する反応を触媒するように選択または操作することができる。活性化エフェクタータンパク質によるリボザイムの不活性化により、陰性対照シグナルを生成する反応、または検出可能な陽性シグナルの生成を妨げる反応が除去され、それにより検出可能な陽性シグナルが生成されることを可能にする。1つの例示的な実施形態において、リボザイムは比色反応を触媒し、溶液を第1の色として見せることができる。リボザイムが不活性化されると、溶液は第2の色に変わり、第2の色は検出可能な陽性シグナルになる。比色反応を触媒するためにリボザイムを使用し得る方法の例は、Zhao et al.“Signal amplification of glucosamine-6-phosphate based on ribozyme glmS,”Biosens Bioelectron.2014;16:337-42に記載され、及びどのようにそのようなシステムが本明細書に開示された実施形態との関連で機能するように変更できるかの例を提供する。代替的に、リボザイムは、存在する場合、例えばRNA転写物の切断産物を生成することができる。したがって、検出可能な陽性シグナルの検出は、リボザイムの非存在下でのみ生成される非切断RNA転写物の検出を含み得る。 In certain exemplary embodiments, the masking construct may include a ribozyme. Ribozymes are RNA molecules with catalytic properties. Ribozymes are natural and engineered and contain or consist of RNA that can be targeted by the effector proteins disclosed herein. Ribozymes can be selected or manipulated to catalyze a reaction that produces a detectable negative signal or prevents the production of a positive control signal. Inactivation of the ribozyme by the activating effector protein eliminates reactions that produce negative control signals or interfere with the production of detectable positive signals, allowing the generation of detectable positive signals. do. In one exemplary embodiment, the ribozyme can catalyze the colorimetric reaction and make the solution appear as a first color. When the ribozyme is inactivated, the solution changes to a second color, which becomes a detectable positive signal. Examples of methods in which ribozymes can be used to catalyze colorimetric reactions are described in Zhao et al. "Signal amplification of glucosamine-6-phosphate based on ribozyme glmS," Biosensor Biosensor. 2014; 16: 337-42, and provides an example of how such a system can be modified to function in the context of the embodiments disclosed herein. Alternatively, ribozymes, if present, can produce cleavage products of, for example, RNA transcripts. Therefore, detection of a detectable positive signal may include detection of uncleaved RNA transcripts produced only in the absence of ribozymes.

特定の例示的な実施形態では、1つ以上の試薬は、比色、化学発光、または蛍光シグナルなどの検出可能なシグナルの生成を促進することのできる、酵素などのタンパク質であり、タンパク質が、1つ以上のRNAアプタマーのタンパク質への結合により、検出可能なシグナルを生成できないように阻害または隔離されている。本明細書に開示されるエフェクタータンパク質の活性化時に、RNAアプタマーは、検出可能なシグナルを生成するタンパク質の能力をもはや阻害しない程度に切断または分解される。特定の例示的な実施形態では、アプタマーはトロンビン阻害剤アプタマーである。特定の例示的な実施形態では、トロンビン阻害剤アプタマーは、GGGAACAAAGCUGAAGUACUUACCC(配列番号4)の配列を有する。このアプタマーが切断されると、トロンビンが活性化し、ペプチドの比色基質または蛍光基質を切断する。特定の例示的な実施形態では、比色基質は、トロンビンのペプチド基質に共有結合しているパラニトロアニリド(pNA)である。トロンビンによって切断されると、pNAが放出されて黄色になり、目に見えやすくなる。特定の例示的な実施形態では、蛍光基質は、蛍光検出器を使用して検出することができる青色蛍光体である7-アミノ-4-メチルクマリンである。阻害アプタマーは、セイヨウワサビペルオキシダーゼ(HRP)、ベータ-ガラクトシダーゼ、または子ウシアルカリホスファターゼ(CAP)にも、上述の一般原則の範囲内で使用できる。 In certain exemplary embodiments, the one or more reagents are proteins, such as enzymes, that can facilitate the production of detectable signals such as colorimetric, chemiluminescent, or fluorescent signals. Binding of one or more RNA aptamers to a protein inhibits or isolates it from producing a detectable signal. Upon activation of the effector proteins disclosed herein, RNA aptamers are cleaved or degraded to such an extent that they no longer interfere with the protein's ability to produce detectable signals. In certain exemplary embodiments, the aptamer is a thrombin inhibitor aptamer. In certain exemplary embodiments, the thrombin inhibitor aptamer has the sequence of GGGAACAAAGCUGAAGUACUUACCC (SEQ ID NO: 4). When this aptamer is cleaved, thrombin is activated and cleaves the colorimetric or fluorescent substrate of the peptide. In certain exemplary embodiments, the colorimetric substrate is paranitroanilide (pNA) covalently attached to the peptide substrate of thrombin. When cleaved by thrombin, pNA is released and turns yellow, making it more visible. In certain exemplary embodiments, the fluorescent substrate is 7-amino-4-methylcoumarin, a blue phosphor that can be detected using a fluorescence detector. Inhibitor aptamers can also be used for horseradish peroxidase (HRP), beta-galactosidase, or calf alkaline phosphatase (CAP), within the scope of the general principles described above.

特定の実施形態において、RNase活性は、酵素阻害アプタマーの切断を介して比色分析的に検出される。RNase活性を比色シグナルに変換する1つの潜在的なモードは、RNAアプタマーの切断と、比色出力を生成できる酵素の再活性化を合わせることである。RNA切断がない場合、インタクトなアプタマーは酵素標的に結合し、その活性を阻害する。この読み出しシステムの利点は、酵素が追加の増幅ステップを提供することである:付随活性(例えばCas13a付随活性)を介してアプタマーから解放されると、比色酵素は比色産物を生成し続け、シグナルの増殖をもたらす。 In certain embodiments, RNase activity is detected colorimetrically via cleavage of the enzyme inhibitor aptamer. One potential mode of converting RNase activity to a colorimetric signal is to combine cleavage of the RNA aptamer with reactivation of an enzyme capable of producing a colorimetric output. In the absence of RNA cleavage, intact aptamers bind to enzyme targets and inhibit their activity. The advantage of this readout system is that the enzyme provides an additional amplification step: when released from the aptamer via associated activity (eg Cas13a associated activity), the chromogen continues to produce chromophore. Causes signal proliferation.

特定の実施形態では、比色読み出しを持つ酵素を阻害する既存のアプタマーが使用される。トロンビン、プロテインC、好中球エラスターゼ、サブチリシンなど、比色読み出しを持ついくつかのアプタマー/酵素のペアが存在する。これらのプロテアーゼは、pNAに基づく比色基質を持ち、市販されている。特定の実施形態では、一般的な比色酵素を標的とする新規アプタマーが使用される。ベータガラクトシダーゼ、セイヨウワサビペルオキシダーゼ、または子ウシ腸のアルカリホスファターゼなどの一般的で堅牢な酵素は、SELEXなどの選択戦略によって設計された操作されたアプタマーの標的となり得る。このような戦略により、ナノモル結合効率のアプタマーをすばやく選択でき、比色読み出し用の追加の酵素/アプタマーペアの開発に使用できる。 In certain embodiments, existing aptamers that inhibit enzymes with colorimetric readout are used. There are several aptamer / enzyme pairs with colorimetric readout, such as thrombin, protein C, neutrophil elastase, and subtilisin. These proteases have pNA-based colorimetric substrates and are commercially available. In certain embodiments, novel aptamers targeting common colorigenic enzymes are used. Common and robust enzymes such as beta galactosidase, horseradish peroxidase, or calf intestinal alkaline phosphatase can be targets for engineered aptamers designed by selection strategies such as SELEX. Such a strategy allows rapid selection of aptamers with nanomolar binding efficiency and can be used to develop additional enzyme / aptamer pairs for colorimetric readout.

特定の実施形態において、RNase活性は、RNA係留阻害剤の切断を介して比色分析的に検出される。多くの一般的な比色酵素には、競合的で可逆的な阻害剤がある。例えば、ベータガラクトシダーゼはガラクトースによって阻害され得る。これらの阻害剤の多くは弱いが、局所濃度を上げることで効果を高めることができる。阻害剤の局所濃度をRNase活性に関連付けることにより、比色酵素と阻害剤のペアを操作してRNaseセンサーに組み込むことができる。小分子阻害剤に基づく比色RNaseセンサーには、比色酵素、阻害剤、及び阻害剤と酵素の両方に共有結合して阻害剤を酵素に係留する架橋RNAの3つのコンポーネントが含まれる。切断されていない構成では、酵素は小分子の局所濃度の増加によって阻害される。RNAが切断されると(例えば、cas13a付随切断によって)、阻害剤が放出され、比色酵素が活性化される。 In certain embodiments, RNase activity is detected colorimetrically through cleavage of the RNA mooring inhibitor. Many common colorigenic enzymes have competitive and reversible inhibitors. For example, beta-galactosidase can be inhibited by galactose. Many of these inhibitors are weak, but their effectiveness can be enhanced by increasing local concentrations. By associating the local concentration of the inhibitor with the RNase activity, the colorimetric enzyme-inhibitor pair can be manipulated and incorporated into the RNase sensor. Small molecule inhibitor-based colorimetric RNase sensors include three components: a colorigenic enzyme, an inhibitor, and a cross-linked RNA that covalently binds to both the inhibitor and the enzyme to anchor the inhibitor to the enzyme. In the uncleaved configuration, the enzyme is inhibited by an increase in the local concentration of small molecules. When RNA is cleaved (eg, by cass13a-associated cleavage), the inhibitor is released and the colorigenic enzyme is activated.

特定の実施形態において、RNase活性は、G四重鎖の形成及び/または活性化を介して比色分析的に検出される。DNAのG四重鎖は、ヘム(鉄(III)-プロトポルフィリンIX)と複合体を形成して、ペルオキシダーゼ活性を持つDNAザイムを形成することができる。ペルオキシダーゼ基質(例えば、ABTS:(2,2’-アジノビス[3-エチルベンゾチアゾリン-6-スルホン酸]-ジアンモニウム塩))とともに供給される場合、過酸化水素の存在下でG四重鎖-ヘム錯体が基質の酸化を引き起こし、これにより溶液中で緑色が形成される。G四重鎖を形成するDNA配列の例は、GGGTAGGGCGGGTTGGGA(配列番号5)である。このDNAアプタマーにRNA配列をハイブリダイズさせることにより、G四重鎖構造の形成が制限される。RNase付随的活性化(C2c2複合体側副活性化など)により、RNAステープルが切断され、G四重鎖が形成され、ヘムが結合する。この戦略は特に魅力的である。なぜなら、発色は酵素的であり、RNaseの活性化以外にも追加の増幅があることを意味するためである。 In certain embodiments, RNase activity is detected colorimetrically through the formation and / or activation of G quadruplexes. The G quadruplex of DNA can form a complex with heme (iron (III) -protoporphyrin IX) to form a DNAzyme with peroxidase activity. When supplied with a peroxidase substrate (eg, ABTS: (2,2'-azinobis [3-ethylbenzothiazolin-6-sulfonic acid] -diammonate)), G quadruplex in the presence of hydrogen peroxide- The heme complex causes oxidation of the substrate, which forms a green color in solution. An example of a DNA sequence forming a G quadruplex is GGGTAGGGCGGGGTTGGA (SEQ ID NO: 5). Hybridization of the RNA sequence to this DNA aptamer limits the formation of the G quadruplex structure. RNase-associated activation (such as C2c2 complex-side subactivation) cleaves RNA staples, forms G quadruplexes, and binds heme. This strategy is particularly attractive. This is because color development is enzymatic, meaning that there is additional amplification beyond RNase activation.

特定の例示的な実施形態では、マスキング構築物は、個別の別個のボリューム(以下でさらに定義される)内の固体基質上に固定化され、単一の試薬を隔離することができる。例えば、試薬は色素を含むビーズであり得る。固定化試薬によって隔離された場合、個々のビーズは拡散しすぎて検出可能なシグナルを生成できないが、マスキング構築物からの放出時に、例えば凝集または溶液濃度の単純な増加によって、検出可能なシグナルを生成できる。特定の例示的な実施形態では、固定化されたマスキング剤は、標的分子の検出時に活性化エフェクタータンパク質によって切断され得るRNAベースのアプタマーである。 In certain exemplary embodiments, the masking construct is immobilized on a solid substrate within separate separate volumes (further defined below), allowing a single reagent to be isolated. For example, the reagent can be beads containing a dye. When isolated by immobilization reagents, individual beads are too diffused to produce a detectable signal, but upon release from the masking construct, for example by aggregation or a simple increase in solution concentration, produce a detectable signal. can. In certain exemplary embodiments, the immobilized masking agent is an RNA-based aptamer that can be cleaved by the activated effector protein upon detection of the target molecule.

1つの例示的な実施形態では、マスキング構築物は、検出剤が溶液中で凝集しているか分散しているかに応じて色を変化させる検出剤を含む。例えば、コロイド金などの特定のナノ粒子は、凝集体から分散粒子に移動するときに、紫から赤への可視的なカラーシフトを受ける。したがって、特定の例示的な実施形態では、そのような検出剤は、1つ以上の架橋分子によって凝集して保持され得る。架橋分子の少なくとも一部はRNAを含む。本明細書に開示されるエフェクタータンパク質の活性化時に、架橋分子のRNA部分が切断され、検出剤が分散し、対応する色の変化をもたらす。特定の例示的な実施形態において、架橋分子はRNA分子である。特定の例示的な実施形態では、検出剤はコロイド金属である。コロイド金属材料は、液体、ヒドロゾル、または金属ゾル中に分散した水不溶性金属粒子または金属化合物を含むことができる。コロイド金属は、周期表のIA、IB、IIB及びIIIB族の金属、ならびに遷移金属、特にVIII族の金属から選択することができる。好ましい金属には、金、銀、アルミニウム、ルテニウム、亜鉛、鉄、ニッケル及びカルシウムが含まれる。他の適切な金属には、様々な酸化状態のすべての次のものも含まれる:リチウム、ナトリウム、マグネシウム、カリウム、スカンジウム、チタン、バナジウム、クロム、マンガン、コバルト、銅、ガリウム、ストロンチウム、ニオブ、モリブデン、パラジウム、インジウム、スズ、タングステン、レニウム、プラチナ、及びガドリニウム。金属は、好ましくは、適切な金属化合物に由来する、イオン形態、例えば、Al3+、Ru3+、Zn2+、Fe3+、Ni2+、及びCa2+のイオンとして提供される。 In one exemplary embodiment, the masking construct comprises a detector that changes color depending on whether the detector is aggregated or dispersed in solution. Certain nanoparticles, such as colloidal gold, undergo a visible color shift from purple to red as they move from aggregates to dispersed particles. Thus, in certain exemplary embodiments, such detection agents can be aggregated and retained by one or more cross-linking molecules. At least some of the cross-linking molecules contain RNA. Upon activation of the effector proteins disclosed herein, the RNA portion of the cross-linking molecule is cleaved, the detection agent is dispersed, resulting in a corresponding color change. In certain exemplary embodiments, the cross-linking molecule is an RNA molecule. In certain exemplary embodiments, the detector is a colloidal metal. Colloidal metal materials can include water-insoluble metal particles or metal compounds dispersed in liquids, hydrosols, or metal sol. Colloidal metals can be selected from Group IA, IB, IIB and IIIB metals in the Periodic Table, as well as transition metals, especially Group VIII metals. Preferred metals include gold, silver, aluminum, ruthenium, zinc, iron, nickel and calcium. Other suitable metals include all of the following in various oxidation states: lithium, sodium, magnesium, potassium, scandium, titanium, vanadium, chromium, manganese, cobalt, copper, gallium, strontium, niobium, Molybdenum, palladium, indium, tin, tungsten, rhenium, platinum, and gadolinium. The metal is preferably provided as an ion form, eg, an ion of Al 3+ , Ru 3+ , Zn 2+ , Fe 3+ , Ni 2+ , and Ca 2+ , derived from a suitable metal compound.

活性化されたCRISPRエフェクターによりRNAブリッジが切断されると、前述のカラーシフトが観察される。特定の例示的な実施形態では、粒子はコロイド金属である。特定の他の例示的な実施形態では、コロイド金属はコロイド金である。特定の例示的な実施形態において、コロイドナノ粒子は、15nmの金ナノ粒子(AuNP)である。コロイド金ナノ粒子の独特の表面特性により、溶液中に完全に分散し、肉眼では赤色に見える場合、520nmで最大吸光度が観察される。AuNPが凝集すると、最大吸光度において赤方偏移し、色が濃くなり、最終的に溶液から暗紫色の凝集体として沈殿する。特定の例示的な実施形態において、ナノ粒子は、ナノ粒子の表面から伸長するDNAリンカーを含むように修飾される。個々の粒子は、RNAの各端でDNAリンカーの少なくとも一部にハイブリダイズする一本鎖RNA(ssRNA)ブリッジによって互いに連結される。したがって、ナノ粒子は、連結された粒子と凝集体の網を形成し、暗い沈殿物として現れる。本明細書に開示されるCRISPRエフェクターの活性化時に、ssRNAブリッジが切断され、連結されたメッシュからAU NPSが解放され、目に見える赤色が生成される。DNAリンカーとRNAブリッジ配列の例を以下に示す。DNAリンカーの末端にあるチオールリンカーは、AuNPSへの表面コンジュゲートに使用できる。他の形態のコンジュゲートが使用されてもよい。特定の例示的な実施形態では、AuNPの2つの集団が、各DNAリンカーに対して1つ生成され得る。これにより、ssRNAブリッジが適切な方向に適切に結合しやすくなる。特定の例示的な実施形態において、第1のDNAリンカーは3’末端によってコンジュゲートされ、第2のDNAリンカーは5’末端によってコンジュゲートされている。

Figure 2022513602000002
When the RNA bridge is cleaved by the activated CRISPR effector, the aforementioned color shift is observed. In certain exemplary embodiments, the particles are colloidal metals. In certain other exemplary embodiments, the colloidal metal is colloidal gold. In certain exemplary embodiments, the colloidal nanoparticles are 15 nm gold nanoparticles (AuNP). Due to the unique surface properties of colloidal gold nanoparticles, maximum absorbance is observed at 520 nm when completely dispersed in solution and appear red to the naked eye. When AuNP aggregates, it shifts red at maximum absorbance, darkens in color, and finally precipitates from solution as dark purple aggregates. In certain exemplary embodiments, the nanoparticles are modified to include a DNA linker that extends from the surface of the nanoparticles. The individual particles are linked to each other by a single-strand RNA (ssRNA) bridge that hybridizes to at least a portion of the DNA linker at each end of RNA. Thus, the nanoparticles form a network of aggregates with the linked particles and appear as a dark precipitate. Upon activation of the CRISPR effector disclosed herein, the ssRNA bridge is cleaved and the AUNPS is released from the ligated mesh, producing a visible red color. Examples of DNA linkers and RNA bridge sequences are shown below. The thiol linker at the end of the DNA linker can be used for surface conjugates to AuNPS. Other forms of conjugates may be used. In certain exemplary embodiments, two populations of AuNP can be generated, one for each DNA linker. This facilitates proper binding of the ssRNA bridge in the proper direction. In certain exemplary embodiments, the first DNA linker is conjugated by the 3'end and the second DNA linker is conjugated by the 5'end.
Figure 2022513602000002

特定の他の例示的な実施形態では、マスキング構築物は、検出可能な標識及びその検出可能な標識のマスキング剤が付着するRNAオリゴヌクレオチドを含み得る。このような検出可能な標識/マスキング剤のペアの例は、フルオロフォア及びフルオロフォアのクエンチャーである。フルオロフォアと別のフルオロフォアまたは非蛍光分子との間の非蛍光複合体の形成の結果として、フルオロフォアのクエンチが起こり得る。このメカニズムは、基底状態の複合体形成、静的クエンチング、または接触クエンチングとして知られている。したがって、RNAオリゴヌクレオチドは、フルオロフォア及びクエンチャーが接触クエンチングが起こるのに十分近接するように設計され得る。フルオロフォア及びそれらの同種のクエンチャーは当該技術分野で知られており、当業者がこの目的のために選択することができる。特定のフルオロフォア/クエンチャーのペアは、本発明の文脈において重要ではなく、フルオロフォア/クエンチャーのペアの選択のみが、フルオロフォアのマスキングを確実にする。本明細書に開示されるエフェクタータンパク質の活性化時に、RNAオリゴヌクレオチドが切断され、それにより、接触クエンチング効果を維持するために必要なフルオロフォアとクエンチャーとの間の近接性が切断される。したがって、フルオロフォアの検出は、サンプル中の標的分子の存在を決定するために使用され得る。 In certain other exemplary embodiments, the masking construct may include a detectable label and an RNA oligonucleotide to which the masking agent for the detectable label is attached. An example of such a detectable label / masking agent pair is a fluorophore and fluorophore quencher. Quenching of the fluorophore can occur as a result of the formation of a non-fluorescent complex between the fluorophore and another fluorophore or non-fluorescent molecule. This mechanism is known as ground state complex formation, static quenching, or contact quenching. Therefore, RNA oligonucleotides can be designed so that the fluorophore and quencher are close enough for contact quenching to occur. Fluorophores and similar quenchers thereof are known in the art and can be selected by one of ordinary skill in the art for this purpose. The particular fluorophore / quencher pair is not important in the context of the present invention, only the selection of the fluorophore / quencher pair ensures fluorofore masking. Upon activation of the effector proteins disclosed herein, RNA oligonucleotides are cleaved, thereby breaking the accessibility between the fluorophore and the quencher required to maintain the contact quenching effect. .. Therefore, fluorophore detection can be used to determine the presence of a target molecule in a sample.

特定の他の例示的な実施形態では、マスキング構築物は、金ナノ粒子などの1つ以上の金属ナノ粒子が付着する1つ以上のRNAオリゴヌクレオチドを含み得る。いくつかの実施形態では、マスキング構築物は、閉ループを形成する複数のRNAオリゴヌクレオチドによって架橋された複数の金属ナノ粒子を含む。一実施形態では、マスキング構築物は、閉ループを形成する3つのRNAオリゴヌクレオチドによって架橋された3つの金ナノ粒子を含む。いくつかの実施形態では、CRISPRエフェクタータンパク質によるRNAオリゴヌクレオチドの切断は、金属ナノ粒子によって生成される検出可能なシグナルをもたらす。 In certain other exemplary embodiments, the masking construct may include one or more RNA oligonucleotides to which one or more metal nanoparticles, such as gold nanoparticles, are attached. In some embodiments, the masking construct comprises multiple metal nanoparticles crosslinked by multiple RNA oligonucleotides forming a closed loop. In one embodiment, the masking construct comprises three gold nanoparticles crosslinked by three RNA oligonucleotides forming a closed loop. In some embodiments, cleavage of the RNA oligonucleotide by the CRISPR effector protein results in a detectable signal produced by the metal nanoparticles.

特定の他の例示的な実施形態では、マスキング構築物は、1つ以上の量子ドットが付着する1つ以上のRNAオリゴヌクレオチドを含み得る。いくつかの実施形態では、CRISPRエフェクタータンパク質によるRNAオリゴヌクレオチドの切断は、量子ドットによって生成される検出可能なシグナルをもたらす。 In certain other exemplary embodiments, the masking construct may include one or more RNA oligonucleotides to which one or more quantum dots are attached. In some embodiments, cleavage of the RNA oligonucleotide by the CRISPR effector protein results in a detectable signal produced by the quantum dots.

1つの例示的な実施形態では、マスキング構築物は量子ドットを含み得る。量子ドットは、表面に付着した複数のリンカー分子を有してもよい。リンカー分子の少なくとも一部はRNAを含む。リンカー分子は、量子ドットの一方の端に、及びリンカーの長さに沿ってまたはリンカーの末端で1つ以上のクエンチャーに結合し、量子ドットのクエンチングが発生するのに十分に近接してクエンチャーが維持されるようにする。リンカーは分岐していてもよい。上述のように、量子ドット/クエンチャーのペアは重要ではなく、量子ドット/クエンチャーのペアを選択するだけでフルオロフォアのマスキングが保証される。量子ドット及びそれらの同種のクエンチャーは当該技術分野で知られており、当業者がこの目的のために選択することができる。本明細書に開示されるエフェクタータンパク質の活性化時に、リンカー分子のRNA部分が切断され、それにより、クエンチング効果を維持するために必要な量子ドットと1つ以上のクエンチャーとの間の近接性が排除される。特定の例示的な実施形態では、量子ドットはストレプトアビジンコンジュゲートである。RNAはビオチンリンカーを介して結合され、クエンチング分子を配列/5Biosg/UCUCGUACGUUC/3IAbRQSp/(配列番号9)または/5Biosg/UCUCGUACGUUCUCUCGUACGUUC/3IAbRQSp/(配列番号10)で動員し、ここで、/5Biosg/はビオチンタグであり、/31AbRQSp/はアイオワブラッククエンチャーである。切断すると、本明細書に開示される活性化エフェクターにより、量子ドットは目に見える蛍光を発する。 In one exemplary embodiment, the masking construct may include quantum dots. Quantum dots may have a plurality of linker molecules attached to the surface. At least some of the linker molecules contain RNA. The linker molecule binds to one or more quenchers at one end of the quantum dot and along the length of the linker or at the end of the linker and is close enough for quantum dot quenching to occur. Ensure that the quencher is maintained. The linker may be branched. As mentioned above, the quantum dot / quencher pair is not important and simply selecting the quantum dot / quencher pair guarantees fluorofore masking. Quantum dots and similar quenchers thereof are known in the art and can be selected by one of ordinary skill in the art for this purpose. Upon activation of the effector proteins disclosed herein, the RNA portion of the linker molecule is cleaved, thereby the proximity between the quantum dots and one or more quenchers required to maintain the quenching effect. Gender is excluded. In certain exemplary embodiments, the quantum dots are streptavidin conjugates. RNA is linked via a biotin linker to sequence the quenching molecule / 5Biosg / UCUCGUACGUUC / 3IAbRQSp / (SEQ ID NO: 9) or / 5Biosg / UCUCGUACGUUCUCUCGUACGUUC / 3IAbRQSp / (SEQ ID NO: 10). Is a biotin tag and / 31AbRQSp / is an Iowa black quencher. Upon cleavage, the activation effectors disclosed herein cause the quantum dots to emit visible fluorescence.

同様に、蛍光エネルギー移動(FRET)を使用して、検出可能な陽性シグナルを生成することができる。FRETは、エネルギー的に励起されたフルオロフォア(すなわち、「ドナーフルオロフォア」)からの光子が、別の分子(すなわち、「アクセプター」)の電子のエネルギー状態を励起一重項状態のより高い振動レベルに上げる非放射プロセスである。ドナーフルオロフォアは、そのフルオロフォアに特有の蛍光を発することなく基底状態に戻る。アクセプターは、別のフルオロフォアまたは非蛍光分子であり得る。アクセプターがフルオロフォアである場合、伝達されたエネルギーはそのフルオロフォアの蛍光特性として放出される。アクセプターが非蛍光分子の場合、吸収されたエネルギーは熱として損失する。したがって、本明細書に開示される実施形態の文脈において、フルオロフォア/クエンチャーのペアは、オリゴヌクレオチド分子に結合したドナーフルオロフォア/アクセプターのペアで置き換えられる。インタクトである場合、マスキング構築物は、アクセプターから放出された蛍光または熱によって検出される最初のシグナル(検出可能な陰性シグナル)を生成する。本明細書に開示されるエフェクタータンパク質の活性化により、RNAオリゴヌクレオチドが切断され、FRETが破壊され、そのためドナーフルオロフォアの蛍光(検出可能な陽性シグナル)が検出される。 Similarly, fluorescence energy transfer (FRET) can be used to generate a detectable positive signal. FRET is a higher vibration level of the singlet state in which photons from an energetically excited fluorophore (ie, "donor fluorofore") excite the electron energy state of another molecule (ie, "acceptor"). It is a non-radiative process. The donor fluorophore returns to the ground state without emitting the fluorescence peculiar to the fluorophore. The acceptor can be another fluorophore or non-fluorescent molecule. If the acceptor is a fluorophore, the transferred energy is emitted as the fluorescent property of that fluorophore. If the acceptor is a non-fluorescent molecule, the absorbed energy is lost as heat. Thus, in the context of the embodiments disclosed herein, a fluorophore / quencher pair is replaced with a donor fluorophore / acceptor pair bound to an oligonucleotide molecule. When intact, the masking construct produces the first signal (detectable negative signal) detected by fluorescence or heat emitted from the acceptor. Activation of the effector proteins disclosed herein cleaves RNA oligonucleotides, disrupts FRET, and thus detects donor fluorophore fluorescence (detectable positive signal).

特定の例示的な実施形態では、マスキング構築物は、長いRNAの短いヌクレオチドへの切断に応答してそれらの吸光度を変化させる挿入色素の使用を含む。いくつかのそのような色素が存在する。例えば、ピロニン-YはRNAと複合体を形成し、572nmでの吸光度を有する複合体を形成する。RNAの切断により、吸光度が失われ、色が変化する。メチレンブルーも同様の方法で使用でき、RNA切断時に688nmでの吸光度が変化する。したがって、特定の例示的な実施形態では、マスキング構築物は、本明細書に開示されるエフェクタータンパク質によるRNAの切断時に吸光度を変化させるRNA及び挿入色素複合体を含む。 In certain exemplary embodiments, masking constructs include the use of insert dyes that alter their absorbance in response to cleavage of long RNA into short nucleotides. There are several such pigments. For example, pyronin-Y forms a complex with RNA, forming a complex with an absorbance at 572 nm. Cleavage of RNA causes loss of absorbance and color change. Methylene blue can be used in a similar manner, with a change in absorbance at 688 nm upon RNA cleavage. Thus, in certain exemplary embodiments, the masking construct comprises RNA and an inserted dye complex that alters the absorbance upon cleavage of RNA by the effector proteins disclosed herein.

特定の例示的な実施形態では、マスキング構築物は、HCR反応のための開始剤を含み得る。例えば、Dirks and Pierce.PNAS 101,15275-15728(2004)を参照されたい。HCR反応は、2つのヘアピン種の潜在的エネルギーを利用する。ヘアピンの1つの対応する領域に相補的な部分を有する一本鎖の開始剤が、以前に安定していた混合物に放出されると、1つの種のヘアピンが開かれる。このプロセスでは、転じて、他の種のヘアピンを開く一本鎖領域が露出する。転じて、このプロセスにより、元の開始剤と同一の一本鎖領域が露出する。結果として生じる連鎖反応は、ヘアピン供給が枯渇するまで成長する、ニックのある二重らせんの形成をもたらし得る。得られた生成物の検出は、ゲル上または比色的に行うことができる。比色検出方法の例には、例えば、Lu et al.“Ultra-sensitive colorimetric assay system based on the hybridization chain reaction-triggered enzyme cascade amplification ACS Appl Mater Interfaces,2017,9(1):167-175,Wang et al.“An enzyme-free colorimetric assay using hybridization chain reaction amplification and split aptamers”Analyst 2015,150,7657-7662、及びSong et al.“Non covalent fluorescent labeling of hairpin DNA probe coupled with hybridization chain reaction for sensitive DNA detection.”Applied Spectroscopy,70(4):686-694(2016)に開示されるものが含まれる。 In certain exemplary embodiments, the masking construct may include an initiator for the HCR reaction. For example, Dirks and Piece. See PNAS 101, 15275-15728 (2004). The HCR reaction utilizes the potential energy of two hairpin species. When a single-stranded initiator having a complementary portion to one corresponding region of a hairpin is released into a previously stable mixture, one type of hairpin is opened. This process in turn exposes the single-stranded area that opens the hairpins of other species. In turn, this process exposes the same single-stranded region as the original initiator. The resulting chain reaction can result in the formation of a nicked double helix that grows until the hairpin supply is depleted. Detection of the resulting product can be performed on a gel or chromatically. Examples of the colorimetric detection method include, for example, Lu et al. "Ultra-sensitive colorimetric assay system based on the hybridization chain reaction-triggered enzyme cascade amplification ACS Appl Mater Interfaces, 2017,9 (1):. 167-175, Wang et al" An enzyme-free colorimetric assay using hybridization chain reaction amplification and split adapters "Anallyst 2015, 150, 7657-7662, and Song et al." Non covalent fluorescent labeling of colorimetry DNA product grouped withimetry. "Applied Spectroscopy, 70 (4): 686-694 (2016).

特定の例示的な実施形態では、マスキング構築物は、HCR開始剤配列、及び開始剤がHCR反応を開始するのを妨げる、ループまたはヘアピンなどの切断可能な構造要素を含み得る。活性化されたCRISPRエフェクタータンパク質によって構造要素が切断されると、開始剤が放出されてHCR反応を引き起こし、その検出はサンプル中の1つ以上の標的の存在を示す。特定の例示的な実施形態において、マスキング構築物は、RNAループを有するヘアピンを含む。活性化されたCRISRPエフェクタータンパク質がRNAループを切断すると、開始剤が放出されてHCR反応が誘発され得る。 In certain exemplary embodiments, the masking construct may include an HCR initiator sequence and a cleavable structural element such as a loop or hairpin that prevents the initiator from initiating the HCR reaction. When structural elements are cleaved by the activated CRISPR effector protein, the initiator is released and triggers an HCR reaction, the detection of which indicates the presence of one or more targets in the sample. In certain exemplary embodiments, the masking construct comprises a hairpin with an RNA loop. When the activated CRISRP effector protein cleaves the RNA loop, the initiator can be released and the HCR reaction can be triggered.

光学バーコード、バーコード、及び一意の分子識別子(UMI)
本明細書に開示されるシステムは、1つ以上の標的分子の光学バーコード、及び検出CRISPR系に関連する光学バーコードを含み得る。例えば、1つ以上の標的分子及び標的分子を含む目的のサンプルのバーコードを、光学バーコードを含有するCRISPR検出システムを含む液滴とマージすることができる。
Optical barcodes, barcodes, and unique molecular identifiers (UMIs)
The system disclosed herein may include optical barcodes of one or more target molecules, as well as optical barcodes associated with the detection CRISPR system. For example, the barcode of the target sample containing one or more target molecules and the target molecule can be merged with a droplet containing a CRISPR detection system containing an optical barcode.

本明細書で使用されるとき、「バーコード」という用語は、標的分子及び/または標的核酸などの関連分子の識別子として、または起源細胞などの関連分子の供給源の識別子として使用されるヌクレオチドの短い配列(例えば、DNAまたはRNA)を指す。バーコードはまた、核酸断片の起源を特定するために使用され得る、任意の固有の天然に存在しない核酸配列を指し得る。発明のメカニズムを理解する必要はないが、バーコード配列は、単一細胞、ウイルスベクター、標識リガンド(例えば、アプタマー)、タンパク質、shRNA、sgRNA、またはcDNAに関連するバーコードの高品質の個別読み取りを提供し、そのため、複数の種を一緒に配列決定できるようにすると考えられている。 As used herein, the term "barcode" is used as an identifier for a related molecule such as a target molecule and / or a target nucleic acid, or as an identifier for a source of a related molecule such as a cell of origin. Refers to a short sequence (eg, DNA or RNA). Barcodes can also refer to any unique, non-naturally occurring nucleic acid sequence that can be used to identify the origin of a nucleic acid fragment. Although it is not necessary to understand the mechanism of the invention, barcode sequences are high quality individual readings of barcodes associated with single cells, viral vectors, labeled ligands (eg, aptamers), proteins, shRNAs, sgRNAs, or cDNAs. Is believed to allow multiple species to be sequenced together.

バーコード化は、その全体が本明細書に組み込まれる特許公開WO2014047561 A1,Compositions and methods for labeling of agentsに開示されている組成物または方法のいずれかに基づいて実行することができる。特定の実施形態では、バーコード化ではエラー訂正スキームを使用する(T.K.Moon,Error Correction Coding:Mathematical Methods and Algorithms(Wiley,New York,ed.1,2005))。理論に縛られることなく、単一細胞からの増幅された配列は、各細胞に関連付けられたバーコードに基づいて一緒に配列決定され、決定される。 Barcoding can be performed on the basis of any of the compositions or methods disclosed in Japanese Patent Publication WO2014047561 A1, Combinations and methods for labeling of agents, which is incorporated herein in its entirety. In certain embodiments, bar coding uses an error correction scheme (TK Moon, Error Correction Coding: Mathematic Methods and Algorithms (Wiley, New York, ed. 1, 2005)). Without being bound by theory, amplified sequences from a single cell are sequenced and determined together based on the barcode associated with each cell.

光学的にコード化された粒子は、各ウェル内の光学的にコード化された粒子のランダムな組み合わせをもたらす個別のボリュームにランダムに送達されてもよいし、または光学的にコード化された粒子の一意の組み合わせが各個別のボリュームに具体的に割り当てられてもよい。次いで、光学的にコード化された粒子の観察可能な組み合わせを使用して、各個別のボリュームを識別することができる。表現型などの光学的評価は、個別のボリュームごとに作成及び記録することができる。場合によっては、バーコードは、光または蛍光顕微鏡で視覚化できる光学的に検出可能なバーコードであり得る。特定の例示的な実施形態では、光学バーコードは、一連の定義された色から区別可能な色のフルオロフォアまたは量子ドットのサブセットを含む。場合によっては、光学的にコード化された粒子は、各ウェル内の光学的にコード化された粒子のランダムな組み合わせをもたらす個別のボリュームにランダムに送達されてもよいし、または光学的にコード化された粒子の一意の組み合わせが各個別のボリュームに具体的に割り当てられてもよい。 The optically coded particles may be randomly delivered to individual volumes resulting in a random combination of optically coded particles within each well, or the optically coded particles. A unique combination of can be specifically assigned to each individual volume. An observable combination of optically coded particles can then be used to identify each individual volume. Optical evaluations such as phenotypes can be created and recorded for each individual volume. In some cases, the barcode can be an optically detectable barcode that can be visualized with a light or fluorescence microscope. In certain exemplary embodiments, the optical barcode comprises a subset of fluorophores or quantum dots of color distinguishable from a set of defined colors. In some cases, the optically coded particles may be randomly delivered to individual volumes resulting in a random combination of optically coded particles within each well, or optically coded. A unique combination of optics may be specifically assigned to each individual volume.

例示的な実施形態では、3つの蛍光色素、例えば、様々なレベルのAlexa Fluor 555、594、647で、105個のバーコードを生成できる。第4の色素を追加して使用することができ、数百の一意のバーコードの規模に拡張することができる。同様に、5色は、色の比率を変えることで達成できる一意のバーコードの数を増やすことができる。異なる比率の色素で標識することにより、正規化後に色素が対数座標で等間隔になるように色素比率を選択することができる。 In an exemplary embodiment, 105 barcodes can be generated with three fluorescent dyes, such as different levels of Alexa Fluor 555, 594, 647. A fourth dye can be added and used and expanded to the scale of hundreds of unique barcodes. Similarly, the five colors can increase the number of unique barcodes that can be achieved by varying the color ratio. By labeling with different ratios of dye, the dye ratio can be selected so that the dyes are evenly spaced in logarithmic coordinates after normalization.

一実施形態において、各液滴または個別のボリュームで受け取られるフルオロフォアの割り当てられたまたはランダムなサブセット(複数可)は、各個別のボリュームにおける個別の光学的にコード化された粒子の観察可能なパターンを決定し、それにより、各個別のボリュームが独立して識別されることを可能にする。各個々のボリュームは、光学的にコード化された粒子を検出する適切な画像化技術で画像化される。例えば、光学的にコード化された粒子が蛍光標識されている場合、各個別のボリュームは、蛍光顕微鏡を使用して画像化される。別の例では、光学的にコード化された粒子が比色的に標識されている場合、各個別のボリュームは、各カラーラベルに固有の波長または吸収スペクトルまたは発光スペクトルに一致する1以上のフィルターを備えた顕微鏡を使用して画像化される。使用される光学システムに適合する他の検出方法、例えば、量子ドット、色素などを検出するための当該技術分野で知られている方法が企図される。各個別のボリュームについて観察された個別の光学的にコード化された粒子のパターンは、後の使用のために記録することができる。 In one embodiment, an assigned or random subset (s) of fluorophores received in each droplet or individual volume are observable of individual optically coded particles in each individual volume. The pattern is determined, thereby allowing each individual volume to be identified independently. Each individual volume is imaged with appropriate imaging techniques to detect optically coded particles. For example, if the optically coded particles are fluorescently labeled, each individual volume is imaged using a fluorescence microscope. In another example, if the optically coded particles are colorimetrically labeled, each individual volume has one or more filters that match the wavelength or absorption spectrum or emission spectrum unique to each color label. Is imaged using a microscope equipped with. Other detection methods suitable for the optical system used, such as those known in the art for detecting quantum dots, dyes, etc., are contemplated. The pattern of the individual optically coded particles observed for each individual volume can be recorded for later use.

光学バーコードは、任意選択で一意のオリゴヌクレオチド配列を含むことができ、生成方法は、例えば、国際特許出願公開第WO/2014/047561号の[050]~[0115]に記載されている通りであり得る。1つの例示的な実施形態では、プライマー粒子識別子は標的分子に組み込まれている。当該技術分野で知られている次世代シーケンシング(NGS)技術は、1つ以上の標的配列の配列類似性によるクラスタリングを伴うシーケンシングに使用することができる。配列変動によるアライメントは、整列された配列情報に組み込まれた粒子識別子に基づいて、個別のボリュームに送達された光学的にコード化された粒子の識別を可能にする。一実施形態では、整列された配列情報に組み込まれた各プライマーの粒子識別子は、アンプリコンが生成される対応する個別のボリュームで観察可能である光学的にコード化された粒子のパターンを示す。このようにして、核酸配列の変化を元の個別のボリュームに相関させ、さらにその個別のボリュームの核酸を含む標本で作成された表現型などの光学的評価に一致させることができる。 The optical barcode can optionally contain a unique oligonucleotide sequence, and the generation method is described, for example, in International Patent Application Publication No. WO / 2014/047561 [050] to [0115]. Can be. In one exemplary embodiment, the primer particle identifier is incorporated into the target molecule. Next-generation sequencing (NGS) techniques known in the art can be used for sequencing involving clustering by sequence similarity of one or more target sequences. Alignment by sequence variation allows identification of optically coded particles delivered to individual volumes based on the particle identifier incorporated in the aligned sequence information. In one embodiment, the particle identifier of each primer incorporated into the aligned sequence information indicates a pattern of optically encoded particles that can be observed in the corresponding individual volumes in which the amplicon is generated. In this way, changes in the nucleic acid sequence can be correlated to the original individual volume and further matched to optical evaluations such as phenotypes made with specimens containing nucleic acid in that individual volume.

好ましい実施形態では、配列決定は、一意の分子識別子(UMI)を使用して実行される。本明細書で使用される「一意の分子識別子」(UMI)という用語は、分子タグを使用して一意の増幅産物を検出及び定量化する方法で使用される配列決定リンカーまたは核酸バーコードのサブタイプを指す。UMIは、単一のクローンによる効果と複数のクローンによる効果を区別するために使用される。本明細書で使用されるとき、「クローン」という用語は、配列決定される単一のmRNAまたは標的核酸を指し得る。UMIはまた、増幅産物を生じた転写産物の数、または本明細書に記載の標的バーコードの場合、結合事象の数を決定するために使用され得る。好ましい実施形態では、増幅はPCRまたは多重置換増幅(MDA)によるものである。 In a preferred embodiment, the sequencing is performed using a unique molecular identifier (UMI). As used herein, the term "unique molecular identifier" (UMI) is a subsequence of a sequencing linker or nucleic acid barcode used in methods of detecting and quantifying unique amplification products using molecular tags. Refers to the type. UMI is used to distinguish between the effects of a single clone and the effects of multiple clones. As used herein, the term "clone" can refer to a single mRNA or target nucleic acid to be sequenced. UMI can also be used to determine the number of transcripts that produced the amplification product, or, in the case of the target barcodes described herein, the number of binding events. In a preferred embodiment, amplification is by PCR or multiplex substitution amplification (MDA).

特定の実施形態では、4~20塩基対のランダム配列を有するUMIがテンプレートに付加され、増幅され、配列決定される。好ましい実施形態では、UMIはテンプレートの5’末端に付加される。配列決定により高解像度の読み取りが可能になり、真のバリアントの正確な検出が可能になる。本明細書で使用されるとき、「真のバリアント」は、元のクローンに由来するすべての増幅産物に存在し、すべての産物をUMIと整列させることによって識別される。増幅された各クローンは、増幅された産物がそのクローンに由来することを示す異なるランダムUMIを有する。真のバリアントはすべての増幅された産物に存在し、ランダムエラーを表すバックグラウンドは単一の増幅産物にのみ存在するため、増幅プロセスの忠実度に起因するバックグラウンドは排除できる(例えば、Islam S.et al.,2014.Nature Methods No:11,163-166を参照されたい)。理論に縛られることなく、UMIは、増幅または配列決定中に最大4~7のエラーが発生しても、オリジナルへの割り当てが発生するように設計されている。理論に拘束されるものではなく、UMIを使用して真のバーコード配列を識別できる。 In certain embodiments, a UMI with a random sequence of 4-20 base pairs is added to the template, amplified and sequenced. In a preferred embodiment, the UMI is added to the 5'end of the template. Sequencing allows for high resolution readings and accurate detection of true variants. As used herein, a "true variant" is present in all amplification products from the original clone and is identified by aligning all products with UMI. Each amplified clone has a different random UMI indicating that the amplified product is derived from that clone. Since the true variant is present in all amplified products and the background representing random errors is present only in a single amplified product, the background due to the fidelity of the amplification process can be eliminated (eg Islam S). . Et al., 2014. Nature Methods No: 11,163-166). Without being bound by theory, UMI is designed to generate an assignment to the original even if up to 4-7 errors occur during amplification or sequencing. Without being bound by theory, UMI can be used to identify true barcode sequences.

一意の分子識別子は、例えば、可変増幅効率のサンプルを正規化するために使用できる。例えば、様々な実施形態において、核酸バーコード(例えば、同じ配列を共有する複数のバーコード)が付着する固体または半固体の支持体(例えば、ヒドロゲルビーズ)を特徴とし、バーコードの各々はさらに、特定の固体または半固体支持体上のすべてのバーコードが個別の一意の分子識別子を受け取るように、一意の分子識別子に結合し得る。次いで、例えば、標的分子が核酸バーコードだけでなく、その固体または半固体支持体に由来する識別子の間で一意の識別子も受け取るように、一意の分子識別子を、関連するバーコードとともに標的分子に移すことができる。 The unique molecular identifier can be used, for example, to normalize a sample of variable amplification efficiency. For example, in various embodiments, each of the barcodes further comprises a solid or semi-solid support (eg, hydrogel beads) to which a nucleic acid barcode (eg, multiple barcodes sharing the same sequence) is attached. , All barcodes on a particular solid or semi-solid support may be bound to a unique molecular identifier so that they receive a unique unique molecular identifier. The unique molecular identifier is then given to the target molecule, along with the associated barcode, so that, for example, the target molecule receives not only the nucleic acid barcode but also an identifier unique among the identifiers derived from its solid or semi-solid support. Can be transferred.

核酸バーコードまたはUMIは、例えば、少なくとも4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80、90、または100ヌクレオチド長であり、一本鎖または二本鎖の形態であり得る。標的分子及び/または標的核酸は、核酸バーコードコンカテマーなどのコンビナトリアル様式で複数の核酸バーコードで標識することができる。典型的には、核酸バーコードを、標的分子及び/または標的核酸を、特定の個別のボリュームに由来するもの、特定の物理的特性(例えば、親和性、長さ、配列など)を有するもの、または特定の治療条件に供されるものとして識別するために使用される。標的分子及び/または標的核酸を複数の核酸バーコードに関連付けて、これらすべての特徴(及びそれ以上)に関する情報を提供できる。一方、UMIの特定の集団の各メンバーは、通常、同一の特定の(例えば、個別のボリューム、物理的特性、または処理条件固有)核酸バーコードの特定のセットの個々のメンバーと関連付けられている(例えば、同じ分子に共有結合しているかその構成要素である)。したがって、例えば、同一または一致するバーコード配列を有する起源特異的核酸バーコードのセットの各メンバー、または他の核酸識別子またはコネクターオリゴヌクレオチドは、区別できるかまたは異なるUMIと関連付けられていてもよい(例えば、同じ分子に共有結合しているかその構成要素である)。 Nucleic acid barcodes or UMIs are, for example, at least 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, It is 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 60, 70, 80, 90, or 100 nucleotides in length and can be in single- or double-stranded form. The target molecule and / or the target nucleic acid can be labeled with multiple nucleic acid barcodes in a combinatorial fashion such as a nucleic acid barcode concatemer. Typically, nucleic acid barcodes, target molecules and / or target nucleic acids, derived from specific individual volumes, having specific physical properties (eg, affinity, length, sequence, etc.), Or used to identify as being subject to specific therapeutic conditions. Target molecules and / or target nucleic acids can be associated with multiple nucleic acid barcodes to provide information on all these features (and more). On the other hand, each member of a particular population of UMI is usually associated with an individual member of the same particular set of nucleic acid barcodes (eg, individual volumes, physical properties, or processing conditions specific). (For example, covalently attached to or a component of the same molecule). Thus, for example, each member of a set of origin-specific nucleic acid barcodes having the same or matching barcode sequence, or other nucleic acid identifiers or connector oligonucleotides, may be associated with distinguishable or different UMIs (for example). For example, it is covalently attached to or a component of the same molecule).

本明細書に開示されるように、一意の核酸識別子は、標的分子及び/または標的核酸、例えば起源特異的バーコードなどを標識するために使用される。核酸識別子、核酸バーコードは、関連する分子、位置、または状態の識別子として使用できるヌクレオチドの短い配列を含むことができる。特定の実施形態において、核酸識別子は、1つ以上の一意の分子識別子及び/またはバーコード受容アダプターをさらに含む。核酸識別子は、例えば、約4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、60、70、80、90、または100塩基対(bp)またはヌクレオチド(nt)の長さを有してもよい。特定の実施形態において、核酸識別子は、ランダムに選択されたインデックス(例えば、約1、2、3、4、5、6、7、8、9、または10個のインデックス)を組み合わせることにより、コンビナトリアルな様式で構築され得る。そのような各インデックスは、異なる配列を持つヌクレオチドの短い配列(例えば、DNA、RNA、またはそれらの組み合わせ)である。インデックスは、例えば、約4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25bpまたはntの長さを有してもよい。核酸識別子は、例えば、その各々の全体が参照により本明細書に組み込まれる、国際特許公開第WO2014/047556号及びWO2014/143158号に記載されているもののようなスプリットプール合成方法によって生成することができる。 As disclosed herein, unique nucleic acid identifiers are used to label target molecules and / or target nucleic acids, such as origin-specific barcodes. Nucleic acid identifiers, nucleic acid barcodes can include short sequences of nucleotides that can be used as identifiers for related molecules, positions, or states. In certain embodiments, the nucleic acid identifier further comprises one or more unique molecular identifiers and / or barcode accepting adapters. Nucleic acid identifiers are, for example, about 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25. , 26, 27, 28, 29, 30, 35, 40, 45, 50, 60, 70, 80, 90, or 100 base pairs (bp) or nucleotides (nt) in length. In certain embodiments, nucleic acid identifiers are combinatorial by combining randomly selected indexes (eg, about 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 indexes). Can be constructed in any style. Each such index is a short sequence of nucleotides with different sequences (eg, DNA, RNA, or a combination thereof). The index is, for example, about 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 bp. Alternatively, it may have a length of nt. Nucleic acid identifiers can be generated, for example, by split pool synthesis methods such as those described in International Patent Publication Nos. WO2014 / 047556 and WO2014 / 143158, each of which is incorporated herein by reference in its entirety. can.

1つ以上の核酸識別子(例えば、核酸バーコード)を標的分子に付着または「タグ付け」することができる。この結合は、直接的(例えば、標的分子への核酸識別子の共有または非共有結合)または間接的(例えば、追加の分子を介した)であり得る。このような間接的な付着には、例えば、標的分子を認識する特異的結合剤に結合したバーコードが含まれる。特定の実施形態において、バーコードはプロテインGに付着し、標的分子は抗体または抗体断片である。標的分子(例えば、タンパク質及び他の生体分子)へのバーコードの付着は、当該技術分野で周知の標準的な方法を使用して行うことができる。例えば、バーコードは、システイン残基(例えば、C末端システイン残基)を介してリンクできる。他の例では、適切な基特異的試薬を使用して、ポリペプチド上の様々な官能基を介して、バーコードをポリペプチド(例えば、抗体)に化学的に導入できる(例えば、www.drmr.com/abconを参照されたい)。特定の実施形態では、バーコードタグ付けは、本明細書に記載されるように、標的分子と会合した(例えば、付着した)バーコード受容アダプターを介して起こり得る。 One or more nucleic acid identifiers (eg, nucleic acid barcodes) can be attached or "tagged" to the target molecule. This binding can be direct (eg, covalent or non-covalent binding of the nucleic acid identifier to the target molecule) or indirectly (eg, via an additional molecule). Such indirect attachment includes, for example, a barcode bound to a specific binder that recognizes the target molecule. In certain embodiments, the barcode adheres to protein G and the target molecule is an antibody or antibody fragment. Barcode attachment to target molecules (eg, proteins and other biomolecules) can be performed using standard methods well known in the art. For example, barcodes can be linked via cysteine residues (eg, C-terminal cysteine residues). In another example, a suitable group-specific reagent can be used to chemically introduce the barcode into the polypeptide (eg, an antibody) via various functional groups on the polypeptide (eg, www.drmr). See .com / abcon). In certain embodiments, barcode tagging can occur via a barcode receiving adapter associated (eg, attached) with a target molecule, as described herein.

標的分子は、任意選択で複数のバーコードをコンビナトリアルな様式で標識でき(例えば、標的分子を特異的に認識する1つ以上の特異的結合剤に結合した複数のバーコードを使用して)、したがって、特定のバーコードプール内で可能な一意の識別子の数を大幅に拡大する。特定の実施形態において、バーコードは、標的分子に付着した成長中のバーコードコンカテマーに、例えば、一度に1つずつ付加される。他の実施形態では、複数のバーコードが、標的分子に付着する前に組み立てられる。複数のバーコードをコンカテマー化するための組成物及び方法は、例えば、参照によりその全体が本明細書に組み込まれる国際特許公開第WO2014/047561号に記載されている。 The target molecule can optionally label multiple barcodes in a combinatorial manner (eg, using multiple barcodes bound to one or more specific binding agents that specifically recognize the target molecule). Therefore, it greatly expands the number of unique identifiers possible within a particular barcode pool. In certain embodiments, barcodes are added, for example, one at a time to a growing barcode concatemer attached to a target molecule. In other embodiments, multiple barcodes are assembled prior to attachment to the target molecule. Compositions and methods for concatenating multiple barcodes are described, for example, in International Patent Publication No. WO2014 / 047561, which is incorporated herein by reference in its entirety.

いくつかの実施形態では、核酸識別子(例えば、核酸バーコード)は、増幅及び配列決定を可能にする配列(例えば、IlluminaシーケンシングのためのSBS3及びP5要素)に付加されてもよい。特定の実施形態では、核酸バーコードは、バーコードの末端に付着したプライマー(例えば、一本鎖DNAプライマー)のハイブリダイゼーション部位をさらに含むことができる。例えば、起源特異的バーコードは、バーコード及び特異的プライマーのハイブリダイゼーション部位を含む核酸であり得る。特定の実施形態では、起源特異的バーコードのセットは、例えばランダム化されたオリゴタイプNNNNNNNNNNNN(配列番号11)を使用して作成された一意のプライマー特異的バーコードを含む。 In some embodiments, nucleic acid identifiers (eg, nucleic acid barcodes) may be added to sequences that allow amplification and sequencing (eg, SBS3 and P5 elements for Illumina sequencing). In certain embodiments, the nucleic acid barcode can further include a hybridization site for a primer (eg, a single-stranded DNA primer) attached to the end of the barcode. For example, the origin-specific barcode can be a nucleic acid containing a hybridization site for the barcode and specific primers. In certain embodiments, the set of origin-specific barcodes comprises a unique primer-specific barcode created using, for example, the randomized oligotype NNNNNNNNNNNNNN (SEQ ID NO: 11).

核酸識別子は、例えば、核酸識別子の1つ以上が付着する共通の支持体に特異的な一意の分子識別子及び/または追加のバーコードをさらに含むことができる。したがって、標的分子のプールは、例えば、異なる処理条件を表す複数の固体または半固体の支持体(例えば、ビーズ)を含む個別のボリュームに追加することができ(及び/または、例えば、1つ以上の追加の固体または半固体の支持体を、標的分子プールの導入後、個別のボリュームに連続して追加でき)、そのため、特定の標的分子がさらされた条件の正確な組み合わせは続いて、それに関連付けられている一意の分子識別子を配列決定することによって決定できる。 The nucleic acid identifier can further include, for example, a unique molecular identifier and / or additional barcode specific to a common support to which one or more of the nucleic acid identifiers attach. Thus, pools of target molecules can be added, for example, to individual volumes containing multiple solid or semi-solid supports (eg, beads) representing different processing conditions (and / or, eg, one or more). Additional solid or semi-solid supports can be added continuously to individual volumes after introduction of the target molecule pool), so that the exact combination of conditions to which a particular target molecule is exposed is followed by it. It can be determined by sequencing the associated unique molecular identifier.

標識された標的分子及び/または標的核酸に関連する起源特異的核酸バーコード(任意選択で、本明細書に記載の他の核酸バーコードと組み合わせて)は、ポリメラーゼ連鎖反応(PCR)などの当該技術分野で公知の方法によって増幅することができる。例えば、核酸バーコードは、PCR増幅及びその後のハイスループット配列決定のためのPCRプライマーが結合できるユニバーサルプライマー認識配列を含むことができる。特定の実施形態では、核酸バーコードは、バーコード及び配列決定アダプター要素が両方とも標的分子に結合するように、配列決定アダプター(例えば、ユニバーサルプライマー認識配列)を含むか、またはそれに結合される。特定の例では、起源特異的バーコードの配列は、例えばPCRを使用して増幅される。いくつかの実施形態では、起源特異的バーコードはさらに配列決定アダプターを含む。いくつかの実施形態では、起源特異的バーコードはさらにユニバーサルプライミング部位を含む。核酸バーコード(またはそのコンカテマー)、標的核酸分子(例えば、DNAまたはRNA分子)、標的ペプチドまたはポリペプチドをコードする核酸、及び/または特異的結合剤をコードする核酸は、任意選択で、当該技術分野で既知の任意の方法、例えば、次世代シーケンシングまたはディープシーケンシングとしても知られるハイスループットシーケンシングの方法によって配列決定される。バーコード(例えば、起源特異的バーコード)で標識された核酸標的分子をバーコードで配列決定して、標的分子とバーコードの両方の配列またはその一部を含む単一の読み取り及び/またはコンティグを生成することができる。例示的な次世代シーケンシング技術には、例えば、とりわけ、Illuminaシーケンシング、Ion Torrentシーケンシング、454シーケンシング、SOLiDシーケンシング、ナノポアシーケンシングなどが含まれる。いくつかの実施形態では、標識された標的分子の配列は非配列決定ベースの方法によって決定される。例えば、可変長のプローブまたはプライマーを使用して、例えば、バーコードの長さ、標的核酸の長さ、または標的ポリペプチドをコードする核酸の長さなどによって、異なる標的分子を標識するバーコード(例えば、起源特異的バーコード)を区別できる。他の例では、バーコードは、例えば、特定の標的分子(例えば、ポリペプチド、核酸、小分子、または脂質)の分子のタイプを識別する配列を含むことができる。例えば、複数のタイプの標的分子を含む標識された標的分子のプールにおいて、ポリペプチド標的分子は1つの識別配列を受け取ることができ、標的核酸分子は異なる識別配列を受け取ることができる。このような識別配列は、例えば、特定の種類の標的分子に特異的な識別配列に特異的なPCRプライマーを使用することにより、特定の種類の標的分子を標識するバーコードを選択的に増幅するために使用することができる。例えば、ポリペプチド標的分子を標識するバーコードをプールから選択的に増幅することができ、それにより標的分子プールのポリペプチドサブセットからバーコードのみを取り出すことができる。 Origin-specific nucleic acid barcodes associated with labeled target molecules and / or target nucleic acids (optionally in combination with other nucleic acid barcodes described herein) are such as the polymerase chain reaction (PCR). It can be amplified by a method known in the art. For example, nucleic acid barcodes can include universal primer recognition sequences to which PCR primers can bind for PCR amplification and subsequent high-throughput sequencing. In certain embodiments, the nucleic acid barcode comprises or is bound to a sequencing adapter (eg, a universal primer recognition sequence) such that both the barcode and the sequencing adapter element bind to the target molecule. In certain examples, the sequence of origin-specific barcodes is amplified using, for example, PCR. In some embodiments, the origin-specific barcode further comprises a sequencing adapter. In some embodiments, the origin-specific barcode further comprises a universal priming site. Nucleic acid barcodes (or concatemers thereof), target nucleic acid molecules (eg, DNA or RNA molecules), nucleic acids encoding target peptides or polypeptides, and / or nucleic acids encoding specific binding agents are optionally such techniques. It is sequenced by any method known in the art, for example, high throughput sequencing methods also known as next-generation sequencing or deep sequencing. Barcode-labeled nucleic acid target molecules (eg, origin-specific barcodes) are barcoded and a single read and / or contig containing both the target molecule and the barcode sequence or a portion thereof. Can be generated. Exemplary next-generation sequencing techniques include, among others, Illumina sequencing, Ion Torrent sequencing, 454 sequencing, SOLiD sequencing, nanopore sequencing, and the like. In some embodiments, the sequence of the labeled target molecule is determined by a non-sequencing based method. For example, barcodes that use variable length probes or primers to label different target molecules, for example, depending on the length of the barcode, the length of the target nucleic acid, or the length of the nucleic acid encoding the target polypeptide. For example, origin-specific barcodes) can be distinguished. In another example, the barcode can include, for example, a sequence that identifies the type of molecule of a particular target molecule (eg, a polypeptide, nucleic acid, small molecule, or lipid). For example, in a pool of labeled target molecules containing multiple types of target molecules, the polypeptide target molecule can receive one discriminant sequence and the target nucleic acid molecule can receive different discriminant sequences. Such discriminant sequences selectively amplify barcodes that label a particular type of target molecule, for example by using PCR primers specific for the particular type of target molecule. Can be used for. For example, the barcode labeling the polypeptide target molecule can be selectively amplified from the pool, thereby extracting only the barcode from the polypeptide subset of the target molecule pool.

核酸バーコードは、例えば切断後に配列決定されて、標的分子の存在、量、または他の特徴を決定することができる。特定の実施形態において、核酸バーコードは、さらなる核酸バーコードにさらに付着することができる。例えば、核酸バーコードは、特異的結合剤が標的分子またはタグ(例えば、標的分子から切断されたコード化されたポリペプチド識別子要素)に結合した後、特異的結合剤から切断され、次いで、核酸バーコードは、起源特異的バーコードに連結できる。結果として生じる核酸バーコードコンカテマーは、他のそのようなコンカテマーとプールされ、配列決定され得る。配列決定読み取りを使用して、どの標的分子がどの個別ボリュームに元々存在していたかを特定できる。 Nucleic acid barcodes can be sequenced, for example, after cleavage to determine the presence, amount, or other characteristics of the target molecule. In certain embodiments, the nucleic acid barcode can be further attached to additional nucleic acid barcodes. For example, nucleic acid barcodes are cleaved from the specific binder after the specific binder binds to the target molecule or tag (eg, a encoded polypeptide identifier element cleaved from the target molecule) and then the nucleic acid. Barcodes can be linked to origin-specific barcodes. The resulting nucleic acid barcode concatemer can be pooled and sequenced with other such concatemers. Sequencing reads can be used to identify which target molecule was originally present in which individual volume.

固体基板に可逆的に結合したバーコード
いくつかの実施形態では、起源特異的バーコードが固体または半固体の基板に可逆的に結合される。いくつかの実施形態では、起源特異的バーコードは、標的核酸に特異的に結合する核酸捕捉配列及び/または標的分子に特異的に結合する特異的結合剤をさらに含む。特定の実施形態では、起源特異的バーコードは起源特異的バーコードの2つ以上の集団を含み、第1の集団は核酸捕捉配列を含み、第2の集団は標的分子に特異的に結合する特異的結合剤を含む。いくつかの例において、起源特異的バーコードの第1の集団は、標的核酸バーコードをさらに含み、標的核酸バーコードは、核酸を標識するものとして集団を識別する。いくつかの例において、起源特異的バーコードの第2の集団は、標的分子バーコードをさらに含み、標的分子バーコードは、標的分子を標識するものとして集団を識別する。
Barcodes Reversibly Bound to Solid Substrates In some embodiments, origin-specific barcodes are reversibly bound to solid or semi-solid substrates. In some embodiments, the origin-specific barcode further comprises a nucleic acid capture sequence that specifically binds to the target nucleic acid and / or a specific binding agent that specifically binds to the target molecule. In certain embodiments, the origin-specific barcode comprises two or more populations of origin-specific barcodes, the first population comprises a nucleic acid capture sequence and the second population specifically binds to a target molecule. Contains specific binders. In some examples, the first population of origin-specific barcodes further comprises a target nucleic acid barcode, which identifies the population as a label for the nucleic acid. In some examples, a second population of origin-specific barcodes further comprises a target molecule barcode, which identifies the population as a label for the target molecule.

切断部位を有するバーコード
核酸バーコードは、例えば、特異的結合剤が標的分子に結合した後、特異的結合剤から切断可能であり得る。いくつかの実施形態では、起源特異的バーコードはさらに1つ以上の切断部位を含む。いくつかの例において、少なくとも1つの切断部位は、その部位での切断が、それが結合しているビーズ、例えばヒドロゲルビーズなどの基板から起源特異的バーコードを放出するように配向されている。いくつかの例において、少なくとも1つの切断部位は、その部位での切断が標的分子特異的結合剤から起源特異的バーコードを放出するように配向されている。いくつかの例では、切断部位は、特定の核酸配列に存在するエンドヌクレアーゼ部位などの酵素切断部位である。他の実施形態において、切断部位は、特定の酵素がアミノ酸配列を切断できるようなペプチド切断部位である。さらに他の実施形態では、切断部位は化学的切断の部位である。
Barcodes with cleavage sites Nucleic acid barcodes may be cleaved from the specific binder, for example, after the specific binder has bound to the target molecule. In some embodiments, the origin-specific barcode further comprises one or more cleavage sites. In some examples, at least one cleavage site is oriented such that the cleavage at that site emits an origin-specific barcode from the substrate to which it is attached, such as a hydrogel bead. In some examples, at least one cleavage site is oriented such that cleavage at that site releases an origin-specific barcode from the target molecule-specific binder. In some examples, the cleavage site is an enzyme cleavage site, such as an endonuclease site present in a particular nucleic acid sequence. In other embodiments, the cleavage site is a peptide cleavage site such that a particular enzyme can cleave the amino acid sequence. In yet another embodiment, the cleavage site is the site of chemical cleavage.

バーコードアダプター
いくつかの実施形態では、標的分子は、核酸などの起源特異的バーコード受容アダプターに結合される。いくつかの例では、起源特異的バーコード受容アダプターはオーバーハングを含み、起源特異的バーコードはオーバーハングにハイブリダイズできる配列を含む。バーコード受容アダプターは、起源特異的核酸バーコードなどの核酸バーコードを受容または受けるように構成される分子である。例えば、バーコード受容アダプターは、例えば、バーコードに核酸バーコードの一部または全体に相補的な配列を介して、所与のバーコード(例えば、起源特異的バーコード)にハイブリダイズできる一本鎖核酸配列(例えば、オーバーハング)を含むことができる。特定の実施形態では、バーコードのこの部分は、個々のバーコード間で一定に保持される標準配列である。ハイブリダイゼーションにより、バーコード受容アダプターがバーコードに結合する。いくつかの実施形態では、バーコード受容アダプターが標的分子に会合していて(例えば、付着していて)もよい。このように、バーコード受容アダプターは、起源特異的バーコードを標的分子に付着させる手段として機能することができる。バーコード受容アダプターは、当該技術分野で既知の方法に従って標的分子に付着することができる。例えば、バーコード受容アダプターは、システイン残基(例えば、C末端システイン残基)でポリペプチド標的分子に付着することができる。バーコード受容アダプターを使用して、1つ以上の標的分子に関連する特定の状態、例えば、起源細胞または起源の個別のボリュームなどを識別することができる。例えば、標的分子は、細胞によって発現される細胞表面タンパク質であり得、細胞特異的バーコード受容アダプターを受容する。細胞が1つ以上の条件にさらされると、バーコード受容アダプターを1つ以上のバーコードに結合させることができ、標的分子の元の起源細胞及び細胞がさらされている各々の状態は、その後、バーコード受容アダプター/バーコードコンカテマーの配列を特定することによって決定することができる。
Barcode Adapter In some embodiments, the target molecule is attached to a source-specific barcode accepting adapter such as nucleic acid. In some examples, origin-specific barcode accepting adapters include overhangs, and origin-specific barcodes contain sequences that can hybridize to overhangs. Barcode acceptance adapters are molecules configured to receive or receive nucleic acid barcodes, such as origin-specific nucleic acid barcodes. For example, a barcode accepting adapter is one that can hybridize to a given barcode (eg, origin-specific barcode), for example, via a sequence that complements the barcode in part or in whole of the nucleic acid barcode. Chain nucleic acid sequences (eg, overhangs) can be included. In certain embodiments, this portion of the barcode is a standard sequence that is held constant between the individual barcodes. Hybridization causes the barcode receiving adapter to bind to the barcode. In some embodiments, the barcode accepting adapter may be associated (eg, attached) to the target molecule. Thus, the barcode accepting adapter can serve as a means of attaching origin-specific barcodes to the target molecule. The barcode accepting adapter can be attached to the target molecule according to a method known in the art. For example, a barcode accepting adapter can attach to a polypeptide target molecule at a cysteine residue (eg, a C-terminal cysteine residue). Barcode receiving adapters can be used to identify specific conditions associated with one or more target molecules, such as cells of origin or individual volumes of origin. For example, the target molecule can be a cell surface protein expressed by a cell and accepts a cell-specific barcode accepting adapter. When a cell is exposed to one or more conditions, the barcode accepting adapter can be attached to one or more barcodes, and the original origin cell of the target molecule and each state to which the cell is exposed are then , Can be determined by identifying the sequence of the barcode accepting adapter / barcode concatemer.

捕捉部分を有するバーコード
いくつかの実施形態では、起源特異的バーコードには、共有結合または非共有結合で結合した捕捉部分がさらに含まれる。したがって、いくつかの実施形態では、捕捉部分を含む、起源特異的バーコード、及びそこに結合または付着したいずれかのものは、捕捉部分に特異的に結合する特異的結合剤で捕捉される。いくつかの実施形態では、捕捉部分が表面に吸着またはさもなければ捕捉される。特定の実施形態では、標的プローブは、例えば、インビトロ転写中にビオチン-16-UTPを組み込むことにより、ビオチンで標識され、後でストレプトアビジンによる捕捉が可能になる。起源特異的バーコードを標識、捕捉、及び検出する他の手段には、アミノアリル標識ヌクレオチドの取り込み、スルフヒドリル標識ヌクレオチドの取り込み、アリルまたはアジド含有ヌクレオチドの取り込み、及び参照により本明細書に具体的に組み込まれる、Bioconjugate Techniques(2nd Ed),Greg T.Hermanson,Elsevier(2008)に記載される他の多数の方法が含まれる。いくつかの実施形態では、標的プローブは、サンプルに接触する前に、アミノアリル標識ヌクレオチドの取り込みに続いて1-エチル-3-(3-ジメチルアミノプロピル)カルボジイミド(EDC)のカルボキシ活性化固体支持体へのカップリングなどの方法を使用して、またはBioconjugate Techniquesに記載される他の方法を使用して、固体支持体または他の捕捉デバイスに共有結合される。いくつかの実施形態では、特異的結合剤が例えば固体支持体に固定化されており、それにより起源特異的バーコードを単離する。
Barcodes with Captive Instances In some embodiments, origin-specific barcodes further include captive moieties covalently or non-covalently coupled. Thus, in some embodiments, origin-specific barcodes, including capture moieties, and either bound or attached thereto, are captured with a specific binder that specifically binds to the capture moiety. In some embodiments, the capture portion is adsorbed or otherwise captured on the surface. In certain embodiments, the target probe is labeled with biotin, for example by incorporating biotin-16-UTP during in vitro transcription, allowing later capture with streptavidin. Other means of labeling, capturing, and detecting origin-specific barcodes include aminoallyl-labeled nucleotide uptake, sulfhydryl-labeled nucleotide uptake, allyl or azide-containing nucleotide uptake, and specifically incorporated herein by reference. Bioconjugate Technologies (2nd Ed), Greg T. et al. Hermanson, Elsevier (2008) includes a number of other methods described. In some embodiments, the target probe is a carboxy-activated solid support of 1-ethyl-3- (3-dimethylaminopropyl) carbodiimide (EDC) following uptake of aminoallyl labeled nucleotides prior to contact with the sample. Covalently coupled to a solid support or other capture device using a method such as coupling to or using other methods described in Bioconjugate Technologies. In some embodiments, the specific binder is immobilized, for example, on a solid support, thereby isolating the origin-specific barcode.

他のバーコード化の実施形態
DNAバーコード化は、生物のDNA内の短い遺伝子マーカーを使用して、特定の種に属するものとして識別する分類学的手法でもある。これは、主な目的が分類を決定することではなく、既知の分類に関して未知のサンプルを特定することであるという点で、分子系統発生学とは異なる。Kress et al.,“Use of DNA barcodes to identify flowering plants”Proc.Natl.Acad.Sci.U.S.A.102(23):8369-8374(2005)。バーコードは、未知の種を識別する、または種を組み合わせるもしくは分離する必要があるかどうかを評価するためにしばしば使用される。Koch H.,“Combining morphology and DNA barcoding resolves the taxonomy of Western Malagasy Liotrigona Moure,1961”African Invertebrates 51(2):413-421(2010)、及びSeberg et al.,“How many loci does it take to DNA barcode a crocus?”PLoS One 4(2):e4598(2009)。例えば、花や果実を得られない場合でも植物の葉を識別する、胃の内容物や糞に基づいて動物の食事を識別する、または商業製品(ハーブのサプリメントまたは木材など)を識別するために、バーコードが使用されている。Soininen et al.,“Analysing diet of small herbivores:the efficiency of DNA barcoding coupled with high-throughput pyrosequencing for deciphering the composition of complex plant mixtures”Frontiers in Zoology 6:16(2009)。
Other Barcoding Embodiments DNA barcoding is also a taxonomic technique that uses short genetic markers in the DNA of an organism to identify it as belonging to a particular species. It differs from molecular phylogenetics in that its main purpose is not to determine classification, but to identify unknown samples for known classifications. Kless et al. , "Use of DNA barcodes to identify flowering plants" Proc. Natl. Acad. Sci. U. S. A. 102 (23): 8369-8374 (2005). Barcodes are often used to identify unknown species or to assess whether species need to be combined or separated. Koch H. , "Combining morphology and DNA barcoding resolves the taxonomy of Western Malagasy Liotrigona Moure, 1961" African Invertebrates 51 (2): 10 (2): 10 (2). , "How many loci does it take to DNA barcode a crocus?" PLOS One 4 (2): e4598 (2009). For example, to identify plant leaves even when flowers and fruits are not available, to identify animal diets based on stomach contents and feces, or to identify commercial products (such as herbal supplements or wood). , Barcode is used. Soininen et al. , "Analysing diet of small herbivores: the efficiency of DNA barcoding coupled with high-throughput200

DNAバーコード化にとって望ましい遺伝子座を標準化して、その遺伝子座の配列の大規模なデータベースを開発できるようにする必要があることが示唆されている。関心のある分類群のほとんどは、種特異的PCRプライマーなしで配列決定可能な遺伝子座を持っている。CBOL Plant Working Group,“A DNA barcode for land plants”PNAS 106(31):12794-12797(2009)。さらに、これらの推定バーコード遺伝子座は、現在の技術で簡単に配列決定できるほど短いと考えられている。Kress et al.,“DNA barcodes:Genes,genomics,and bioinformatics”PNAS 105(8):2761-2762(2008)。したがって、これらの遺伝子座は、種内の比較的少量の変動と組み合わせて、種間の大きな変動を提供する。Lahaye et al.,“DNA barcoding the floras of biodiversity hotspots”Proc Natl Acad Sci USA 105(8):2923-2928(2008)。 It has been suggested that the desired loci for DNA bar coding need to be standardized so that a large database of sequences of those loci can be developed. Most of the taxa of interest have loci that can be sequenced without species-specific PCR primers. CBOL Plant Working Group, "A DNA barcode for land plants" PNAS 106 (31): 12794-1297 (2009). Moreover, these putative barcode loci are believed to be short enough to be easily sequenced with current technology. Kless et al. , "DNA barcodes: Genes, genomics, and bioinformatics" PNAS 105 (8): 2761-2762 (2008). Therefore, these loci, in combination with relatively small intraspecific variability, provide large interspecies variability. Lahaye et al. , "DNA barcoding the floras of biodiversity hotspots" Proc Natl Acad Sci USA 105 (8): 2923-2928 (2008).

DNAバーコード化は、比較的単純な概念に基づいている。例えば、ほとんどの真核細胞にはミトコンドリアが含まれており、ミトコンドリアDNA(mtDNA)の変異速度は比較的速いため、種間でmtDNA配列に大きな変化が生じ、原則として、種内では比較的小さな差異が生じる。ミトコンドリアのシトクロムcオキシダーゼサブユニット1(CO1)遺伝子の648-bp領域が、潜在的な「バーコード」として提案された。2009年の時点で、CO1配列のデータベースには、58,000種を超える動物種からの少なくとも620,000の標本が含まれており、他のいずれかの遺伝子で利用可能なデータベースよりも大規模である。Ausubel,J.,“A botanical macroscope”Proceedings of the National Academy of Sciences 106(31):12569(2009)。 DNA barcodes are based on a relatively simple concept. For example, most eukaryotic cells contain mitochondria, and the rate of mutation of mitochondrial DNA (mtDNA) is relatively high, resulting in large changes in the mtDNA sequence between species, and in principle, relatively small within the species. There will be a difference. The 648-bp region of the mitochondrial cytochrome c oxidase subunit 1 (CO1) gene has been proposed as a potential "barcode". As of 2009, the database of CO1 sequences contains at least 620,000 specimens from more than 58,000 animal species, which is larger than the databases available for any other gene. Is. Ausubel, J. et al. , "A botanical macroscope" Proceedings of the National Academia of Sciences 106 (31): 12569 (2009).

DNAバーコード化のソフトウェアには、フィールド情報管理システム(FIMS)、ラボ情報管理システム(LIMS)、配列分析ツール、フィールドデータとラボデータを接続するためのワークフロー追跡、データベース送信ツール、及びエコシステム規模のプロジェクトにスケールアップするためのパイプライン自動化の統合が必要である。Geneious Proは配列分析コンポーネントに使用でき、Moorea Biocode Projectを通じて無料で入手できる2つのプラグイン、Biocode LIMS及びGenbank Submissionプラグインが、FIMS、LIMS、ワークフロー追跡、及びデータベース送信との統合を処理する。 DNA bar coding software includes field information management systems (FIMS), lab information management systems (LIMS), sequence analysis tools, workflow tracking for connecting field and lab data, database transmission tools, and ecosystem scale. Need to integrate pipeline automation to scale up to your project. Geneius Pro can be used for sequence analysis components, and two plug-ins, Biocode LIMS and Genbank Submission plug-ins, which are available free of charge through the Moorea Biocode Project, handle integration with FIMS, LIMS, workflow tracking, and database transmission.

さらに、他のバーコード設計とツールについても記載されている(例えば、Birrell et al.,(2001)Proc.Natl Acad.Sci.USA 98,12608-12613、Giaever,et al.,(2002)Nature 418,387-391、Winzeler et al.,(1999)Science 285,901-906、及びXu et al.,(2009)Proc Natl Acad Sci USA.Feb 17;106(7):2289-94を参照されたい)。 In addition, other barcode designs and tools have been described (eg, Birrell et al., (2001) Proc. Natl Acad. Sci. USA 98, 12608-12613, Giaever, et al., (2002) Nature. 418, 387-391, Windzeler et al., (1999) Science 285,901-906, and Xu et al., (2009) Proc Natl Acad Sci USA. Feb 17; 106 (7): 2289-94. sea bream).

本明細書に記載の標的分子は、任意の標的核酸配列を含むことができ、実施形態において、1つ以上のガイドRNAは、疾患状態に特徴的な1つ以上の標的分子に結合するように設計される。さらなる実施形態において、疾患状態は、感染症、臓器疾患、血液疾患、免疫系疾患、がん、脳及び神経系疾患、内分泌疾患、妊娠または出産関連疾患、遺伝性疾患、または環境によって獲得される疾患である。なおさらなる実施形態において、疾患状態は、微生物感染症を含む感染症である。 The target molecules described herein can include any target nucleic acid sequence so that, in embodiments, one or more guide RNAs bind to one or more target molecules that are characteristic of the disease state. Designed. In a further embodiment, the disease state is acquired by an infectious disease, organ disease, blood disease, immune system disease, cancer, brain and nervous system disease, endocrine disease, pregnancy or childbirth-related disease, hereditary disease, or environment. It is a disease. In still further embodiments, the disease state is an infectious disease, including a microbial infection.

さらなる実施形態では、感染症はウイルス、細菌、もしくは真菌によって引き起こされるか、または感染症はウイルス感染症である。特定の実施形態では、ウイルス感染は、二本鎖RNAウイルス、プラス鎖RNAウイルス、マイナス鎖RNAウイルス、レトロウイルス、またはそれらの組み合わせによって引き起こされる。特定の実施形態において、用途は、多重化された株識別を達成することができる。いくつかの実施形態では、病原菌サブタイピングを検出でき、一実施形態では、インフルエンザサブタイピング、Staphまたはstrepサブタイピング、及び細菌の重複感染サブタイプの検出を行うことができる。1つの好ましい実施形態では、インフルエンザAウイルスのすべてのH及びNサブタイプの多重検出及び同定を行うことができる。一態様において、プールされた(または配列された)crRNAは、サブタイプ内の変動を捕捉するために使用される。特定の場合によっては、感染症はHIVである。一実施形態において、HIV逆転写酵素における薬剤耐性変異は、SNP検出を介して行うことができる。いくつかの実施形態では、変異はK65R、K103N、V106M、Y181C、M184V、G190Aであってよい。同様に、結核などの他の感染症におけるSNP検出を行うことができる。いくつかの実施形態では、変異はkatG、315ACC;イソニアジド耐性、rpoB、531TTG:リファンピン耐性、gyrA、94GGC:フルオロキノロン耐性、rrs、1401G:アミノグリコシド耐性であってよい。さらに、HIV/TBの同時感染も検出できる。汎ウイルス、ウイルスゾーン汎ウイルス、汎細菌、または汎病原菌の検出のための大規模な多重化を実現できる。 In a further embodiment, the infection is caused by a virus, bacterium, or fungus, or the infection is a viral infection. In certain embodiments, viral infection is caused by double-stranded RNA virus, plus-strand RNA virus, minus-strand RNA virus, retrovirus, or a combination thereof. In certain embodiments, the application can achieve multiplexed strain identification. In some embodiments, pathogen subtyping can be detected, and in one embodiment, influenza subtyping, staff or strept subtyping, and bacterial coinfection subtypes can be detected. In one preferred embodiment, multiple detection and identification of all H and N subtypes of influenza A virus can be performed. In one embodiment, the pooled (or sequenced) crRNA is used to capture variations within the subtype. In certain cases, the infection is HIV. In one embodiment, drug resistance mutations in HIV reverse transcriptase can be made via SNP detection. In some embodiments, the mutation may be K65R, K103N, V106M, Y181C, M184V, G190A. Similarly, SNP detection in other infectious diseases such as tuberculosis can be performed. In some embodiments, the mutation may be katG, 315ACC; isoniazid resistant, rpoB, 513TTG: rifampin resistant, gyrA, 94GGC: fluoroquinolone resistant, rs, 1401G: aminoglycoside resistant. In addition, co-infection with HIV / TB can be detected. Large-scale multiplexing for detection of pan-virus, virus zone pan-virus, pan-bacteria, or pan-pathogen can be achieved.

本明細書に記載されるように、本発明で使用するための標的分子を含むサンプルは、食品サンプル(新鮮な果物または野菜、肉)、飲料サンプル、紙の表面、布地の表面、金属表面、木材表面、プラスチック表面、土壌サンプル、淡水サンプル、廃水サンプル、塩水サンプル、大気への暴露または他のガスサンプル、またはそれらの組み合わせなどの生物学的または環境的サンプルであり得る。例えば、金属、木材、プラスチック、ゴムなどを含むがこれらに限定されない任意の材料で作られた家庭用/商業用/工業用の表面は、綿棒で拭き取り、汚染物質について試験することができる。土壌サンプルは、環境目的及び/またはヒト、動物、または植物の病気の検査のために、病原性細菌または寄生虫、または他の微生物の存在について検査することができる。淡水サンプル、廃水サンプル、または塩水サンプルなどの水サンプルは、清潔さと安全性、及び/または可搬性について評価して、例えば、Cryptosporidium parvum、Giardia lambda、またはその他の微生物汚染の存在を検出できる。さらなる実施形態では、生体サンプルは、組織サンプル、唾液、血液、血漿、血清、大便、尿、痰、粘膜、リンパ液、滑液、脳脊髄液、腹水、胸水、漿液腫、膿、または皮膚もしくは粘膜表面のスワブを含むがこれらに限定されない供給源より取得できる。いくつかの特定の実施形態では、環境サンプルまたは生体サンプルは粗サンプルであり得、及び/または1つ以上の標的分子は、方法の適用前にサンプルから精製または増幅されなくてもよい。微生物の同定は、様々な用途に有用であり、及び/または必要であり、したがって、当業者によって適切とみなされる任意の供給源からの任意のタイプのサンプルが本発明に従って使用され得る。 As described herein, samples containing target molecules for use in the present invention include food samples (fresh fruit or vegetables, meat), beverage samples, paper surfaces, fabric surfaces, metal surfaces, etc. It can be a biological or environmental sample such as a wood surface, a plastic surface, a soil sample, a freshwater sample, a wastewater sample, a saltwater sample, an air exposure or other gas sample, or a combination thereof. For example, household / commercial / industrial surfaces made of any material, including but not limited to metal, wood, plastic, rubber, etc., can be wiped with a cotton swab and tested for contaminants. Soil samples can be tested for the presence of pathogenic bacteria or parasites, or other microorganisms for environmental purposes and / or for testing for human, animal, or plant diseases. Water samples, such as freshwater samples, wastewater samples, or saltwater samples, can be evaluated for cleanliness and safety, and / or portability to detect, for example, the presence of Cryptosporidium paravum, Giardia lambda, or other microbial contamination. In a further embodiment, the biological sample is a tissue sample, saliva, blood, plasma, serum, stool, urine, sputum, mucous membrane, lymph, synovial fluid, cerebrospinal fluid, ascites, pleural effusion, seroma, pus, or skin or mucous membrane. Obtained from sources including, but not limited to, surface swabs. In some specific embodiments, the environmental or biological sample can be a crude sample, and / or one or more target molecules need not be purified or amplified from the sample prior to application of the method. Identification of microorganisms is useful and / or necessary for a variety of applications, and therefore any type of sample from any source deemed appropriate by one of ordinary skill in the art can be used in accordance with the present invention.

生体サンプルは、さらなる評価の前に、例えば、目的の細胞を濃縮または単離することを含む、さらに処理をされてもよい。一態様では、生体サンプル中の細胞は、さらなる処理及び/またはライブラリー調製の前に、最初に濃縮または選別される。実施形態において、細胞は、蛍光活性化細胞選別(FACS)または磁気活性化細胞選別(MACS)によって選別される。例示的な実施形態では、細胞は、例えば、抗原特異的T細胞を分類するために、例えば抗体コーティングされた(常)磁性ビーズを使用して最初に分類される。MACSのチューブベースとカラムベースの両方の方法を使用して、まれな細胞集団を分離するか、または目的の細胞(サブ)集団をさらに濃縮することができる。MACSの複数のラウンドは、細胞をさらに濃縮することができ、連続するラウンドで同じエピトープタグまたは異なるエピトープタグで濃縮する。例えば、Lee et al.,J.Biomol.Tech.2012 Jull 23(2):69-77を参照されたい。必要に応じて磁気ビーズを除去して細胞を溶出し、さらに濃縮するなど、さらに処理することができる。一実施形態では、T細胞は、赤血球を溶解することにより、及び例えばPERCOLL(商標)勾配による遠心分離によって単球を枯渇させることにより末梢血から単離できる。CD28+、T細胞などのT細胞の特定の亜集団は、陽性または陰性選択技術によってさらに単離され得る。例えば、好ましい一実施形態では、T細胞は、所望のT細胞を陽性選択するのに十分な時間にわたって、DYNABEADS(登録商標)M-450 CD3/CD28 TまたはXCYTE DYNABEADS(商標)などの抗CD3/抗CD28(すなわち、3×28)コンジュゲートビーズとのインキュベーションによって、単離される。一実施形態では、期間は約30分である。さらなる実施形態では、期間は、30分~36時間またはそれ以上及びその間のすべての整数値の範囲である。さらなる実施形態では、期間は、少なくとも1、2、3、4、5、または6時間である。さらに別の実施形態では、期間は、10~24時間である。好ましい一実施形態では、インキュベーション時間は24時間である。目的の細胞が選別、濃縮、及び/または単離されると、サンプルは、例えば、核酸の抽出、バーコードの付加、液滴形成及び分析によってさらに処理され得る。 The biological sample may be further treated, including, for example, enriching or isolating the cells of interest prior to further evaluation. In one aspect, cells in a biological sample are first concentrated or sorted prior to further processing and / or library preparation. In embodiments, cells are sorted by fluorescence activated cell sorting (FACS) or magnetically activated cell sorting (MACS). In an exemplary embodiment, cells are first classified using, for example, antibody-coated (paramagnetic) magnetic beads to classify antigen-specific T cells. Both tube-based and column-based methods of MACS can be used to isolate rare cell populations or further concentrate cell (sub) populations of interest. Multiple rounds of MACS can further concentrate the cells, concentrating with the same epitope tag or different epitope tags in successive rounds. For example, Lee et al. , J. Biomol. Tech. See 2012 Jull 23 (2): 69-77. If necessary, the magnetic beads can be removed to elute the cells and further concentrate the cells for further treatment. In one embodiment, T cells can be isolated from peripheral blood by lysing red blood cells and, for example, by depleting monocytes by centrifugation over a PERCOLL ™ gradient. Certain subpopulations of T cells, such as CD28 +, T cells, can be further isolated by positive or negative selection techniques. For example, in a preferred embodiment, the T cells are anti-CD3 / such as DYNABEADS® M-450 CD3 / CD28 T or XCYTE DYNABEADS ™ over a period of time sufficient to positively select the desired T cells. Isolated by incubation with anti-CD28 (ie, 3x28) conjugated beads. In one embodiment, the period is about 30 minutes. In a further embodiment, the period is in the range of 30 minutes to 36 hours or more and all integer values in between. In a further embodiment, the period is at least 1, 2, 3, 4, 5, or 6 hours. In yet another embodiment, the period is 10 to 24 hours. In one preferred embodiment, the incubation time is 24 hours. Once the cells of interest have been sorted, concentrated and / or isolated, the sample can be further processed, for example, by nucleic acid extraction, barcode addition, droplet formation and analysis.

いくつかの実施形態では、生体サンプルには、血液、血漿、血清、尿、大便、痰、粘液、リンパ液、滑液、胆汁、腹水、胸膜滲出液、血清腫、唾液、脳脊髄液、房水もしくは硝子体液、または任意の体の分泌物、濾出液、浸出液(例えば、膿瘍または他の任意の感染または炎症部位から得られた体液)、または関節(例えば、正常な関節もしくは疾患、例えば関節リウマチ、変形性関節症、痛風または敗血症性関節炎などに冒された関節)から得られた体液、または皮膚もしくは粘膜表面のスワブが含まれ得るが、必ずしもこれらに限定されるわけではない。特定の実施形態では、サンプルは、ヒト患者から得られた血液、血漿、または血清であり得る。 In some embodiments, the biological sample includes blood, plasma, serum, urine, stool, sputum, mucus, lymph, synovial fluid, bile, ascites, pleural effusion, serum tumor, saliva, cerebrospinal fluid, tufts. Or vitreous fluid, or any body fluid, synovial fluid, exudate (eg, fluid obtained from an abscess or any other infected or inflamed site), or joint (eg, normal joint or disease, eg joint). It may include, but is not limited to, body fluids from (joints affected by rheumatism, osteoarthritis, gout or septic arthritis, etc.), or swabs on the surface of the skin or mucous membranes. In certain embodiments, the sample can be blood, plasma, or serum obtained from a human patient.

いくつかの実施形態では、サンプルは植物サンプルであり得る。いくつかの実施形態では、サンプルは粗サンプルであり得る。いくつかの実施形態では、サンプルは精製されたサンプルであり得る。 In some embodiments, the sample can be a plant sample. In some embodiments, the sample can be a crude sample. In some embodiments, the sample can be a purified sample.

マイクロウェルのアレイを含むマイクロ流体デバイス
マイクロ流体デバイスは、マイクロウェルの下に少なくとも1つのフローチャネルを備えたマイクロウェルのアレイを含む。特定の例示的な実施形態では、デバイスは、異なる液滴(すなわち、個々の個別のボリューム)を生成及び/またはマージするマイクロ流体デバイスである。例えば、スクリーニングされるサンプルを含む第1のセットの液滴が形成され、本明細書に記載のシステムの要素を含む第2のセットの液滴が形成されてもよい。次に、第1及び第2の液滴セットがマージされ、次に、マージ液滴セットに対して、本明細書に記載の診断方法が実行される。
Microfluidic device containing an array of microwells A microfluidic device comprises an array of microwells with at least one flow channel beneath the microwells. In certain exemplary embodiments, the device is a microfluidic device that produces and / or merges different droplets (ie, individual individual volumes). For example, a first set of droplets containing the sample to be screened may be formed and a second set of droplets containing the elements of the system described herein may be formed. Next, the first and second droplet sets are merged, and then the diagnostic method described herein is performed on the merged droplet set.

本明細書に開示されるマイクロ流体デバイスは、シリコーンベースのチップであり、ホットエンボス加工、エラストマーの成形、射出成形、LIGA、ソフトリソグラフィ、シリコン加工、及び関連する薄膜処理技術を含むがこれらに限定されない様々な技術を使用して製造することができる。マイクロ流体デバイスを製造するための適切な材料には、環状オレフィン共重合体(COC)、ポリカーボネート、ポリ(ジメチルシロキサン)(PDMS)、及びポリ(メチルアクリレート)(PMMA)が含まれるが、これらに限定されない。一実施形態では、PDMSにおけるソフトリソグラフィを使用して、マイクロ流体デバイスを調製することができる。例えば、基板内のフローチャネル、バルブ、及びフィルターの位置を定義するフォトリソグラフィを使用して型を作成することができる。基板材料を型に流し込み、硬化させてスタンプを作成する。次いで、スタンプは、ガラスなどであるがこれに限定されない固体支持体に密封される。一部のタンパク質を吸収し、特定の生物学的プロセスを阻害する可能性があるPDMSなどの一部のポリマーの疎水性のため、不動態化剤が必要になる場合がある(Schoffner et al.Nucleic Acids Research,1996,24:375-379)。適切な不動態化剤は当該技術分野で知られており、シラン、パリレン、n-ドデシル-b-D-マトシド(DDM)、プルロニック、Tween-20、他の同様の界面活性剤、ポリエチレングリコール(PEG)、アルブミン、コラーゲン、ならびに他の類似のタンパク質及びペプチドが含まれるが、これらに限定されない。 Microfluidic devices disclosed herein are silicone-based chips, including but limited to hot embossing, elastomer molding, injection molding, LIGA, soft lithography, silicon processing, and related thin film processing techniques. It can be manufactured using various techniques that are not. Suitable materials for making microfluidic devices include cyclic olefin copolymers (COCs), polycarbonates, poly (dimethylsiloxane) (PDMS), and poly (methylacrylates) (PMMA). Not limited. In one embodiment, soft lithography in PDMS can be used to prepare a microfluidic device. For example, a mold can be created using photolithography that defines the location of flow channels, valves, and filters within the substrate. The substrate material is poured into a mold and cured to create a stamp. The stamp is then sealed on a solid support such as, but not limited to, glass. Immobilization agents may be required due to the hydrophobicity of some polymers, such as PDMS, which can absorb some proteins and interfere with certain biological processes (Schoffner et al. Nucleic Acids Research, 1996, 24: 375-379). Suitable immobilizers are known in the art, such as silane, parylene, n-dodecyl-b-D-matoside (DDM), Pluronic, Tween-20, other similar surfactants, polyethylene glycol ( PEG), albumin, collagen, and other similar proteins and peptides, but not limited to these.

本発明の文脈で使用できるマイクロ流体デバイスの例は、参照により本明細書に組み込まれる、Kulesa,et al.PNAS,115,6685-6690に記載される。 Examples of microfluidic devices that can be used in the context of the present invention are incorporated herein by reference in Kulesa, et al. PNAS, 115, 6685-6690.

特定の例示的な実施形態では、デバイスは、マイクロプレートウェルなどの個々のウェルを含み得る。マイクロプレートのウェルのサイズは、標準の6、24、96、384、1536、3456、または9600サイズのウェルのサイズであってよい。特定の実施形態において、マイクロウェルの数は、40,0000超または190,000超であってよい。特定の例示的な実施形態では、本明細書に記載のシステムの要素は、配布及び使用の前に、凍結乾燥され、ウェルの表面に適用されてもよい。 In certain exemplary embodiments, the device may include individual wells, such as microplate wells. The microplate well size may be a standard 6, 24, 96, 384, 1536, 3456, or 9600 size well size. In certain embodiments, the number of microwells may be greater than 40,000 or greater than 190,000. In certain exemplary embodiments, the elements of the system described herein may be lyophilized and applied to the surface of the well prior to distribution and use.

マイクロウェルチップは、代理人整理番号52199-505P03US、または参照により本明細書に組み込まれる米国特許出願第15/559,381号に開示されているように設計することができる。一実施形態では、マイクロウェルチップは、49200個のマイクロウェルを含む約6.2×7.2cmのフォーマット、または97,194個のマイクロウェルを含む7.4×10cmの大きなフォーマットで設計することができる。マイクロウェルのアレイは、例えば、直径約50~300μm、特定の実施形態では、10%の重なりに設定された直径150μmの2つの円として成形することができる。マイクロウェルのアレイは、ウェル間の間隔が50μmの六角格子に配置することができる。場合によっては、様々な数の液滴を保持するために、マイクロウェルを他の形状、間隔、及びサイズで配置することができる。マイクロウェルチップは、いくつかの実施形態では、有利にも、顕微鏡などの画像化装置を含む標準的な実験装置で使用できるサイズである。 Microwell chips can be designed as disclosed in Agent Reference No. 52199-505P03US, or US Patent Application No. 15 / 559,381, which is incorporated herein by reference. In one embodiment, the microwell chip is designed in a format of about 6.2 x 7.2 cm containing 49,200 microwells, or a large format of 7.4 x 10 cm containing 97,194 microwells. Can be done. The array of microwells can be formed, for example, into two circles with a diameter of about 50-300 μm and, in certain embodiments, a diameter of 150 μm set to 10% overlap. The array of microwells can be arranged in a hexagonal grid with a well spacing of 50 μm. In some cases, microwells can be placed in other shapes, spacings, and sizes to hold different numbers of droplets. Microwell chips, in some embodiments, are advantageously of a size that can be used in standard experimental equipment, including imaging devices such as microscopes.

例示的な方法では、化合物を蛍光色素(例えば、Alexa Fluor555、594、647)の一意の比率で混合することができる。標的分子と色素混合物の各混合物は、液滴に乳化することができる。同様に、光学バーコードを備えた各検出CRISPR系は、液滴に乳化できる。いくつかの実施形態では、各液滴は約1nLである。次に、CRISPR検出システムの液滴と標的分子の液滴を組み合わせて、マイクロウェルチップに適用することができる。液滴は、単純な混合または他の組み合わせ方法によって組み合わせることができる。1つの例示的な実施形態において、マイクロウェルチップは、クランプまたは例えばネオジム磁石であり得る他の固定手段によって上下からクランプできる取り外し可能なスペーサーを備えた疎水性スライドガラスなどのプラットフォーム上に吊り下げられる。スペーサーによって作成されたチップとガラスの間のギャップに油をロードし、液滴のプールをチップに注入し、さらに油を注入して余分な液滴を排出することで液滴を流し続けることができる。ロードが完了すると、チップを油で洗浄し、スペーサーを取り外してマイクロウェルをスライドガラスに対して密閉し、クランプを閉じることができる。チップは、例えば落射蛍光顕微鏡で画像化することができ、液滴をマージして、例えばコロナ処理装置によって供給されるAC電場を印加することにより各マイクロウェル内の化合物を混合し、続いて所望のプロトコールに従って処理することができる。一実施形態において、マイクロウェルは、落射蛍光顕微鏡を使用して蛍光を測定しながら、37℃でインキュベートすることができる。液滴の操作に続いて、さらなる分析、処理、及び/または操作のために、本明細書に記載されるように、液滴をマイクロウェルから溶出することができる。 In an exemplary method, the compounds can be mixed in a unique ratio of fluorescent dyes (eg, Alexa Fluor 555, 594, 647). Each mixture of target molecule and dye mixture can be emulsified into droplets. Similarly, each detection CRISPR system with optical barcodes can be emulsified into droplets. In some embodiments, each droplet is about 1 nL. The droplets of the CRISPR detection system and the droplets of the target molecule can then be combined and applied to a microwell chip. The droplets can be combined by simple mixing or other combination methods. In one exemplary embodiment, the microwell tip is suspended on a platform such as a hydrophobic glass slide with removable spacers that can be clamped from above and below by a clamp or other fixing means that may be, for example, a neodymium magnet. .. It is possible to load oil into the gap between the chip and the glass created by the spacer, inject a pool of droplets into the chip, and then inject more oil to expel excess droplets to keep the droplets flowing. can. Once loading is complete, the tip can be oiled, the spacer removed, the microwell sealed against the glass slide and the clamp closed. The chip can be imaged, for example, with an epifluorescence microscope, merging the droplets and mixing the compounds in each microwell, for example by applying an AC electric field supplied by a corona processor, followed by the desired Can be processed according to the protocol of. In one embodiment, the microwells can be incubated at 37 ° C. while measuring fluorescence using an epifluorescence microscope. Following the manipulation of the droplet, the droplet can be eluted from the microwell as described herein for further analysis, processing, and / or manipulation.

開示されるデバイスは、入口及び出口ポート、または開口部をさらに含むことができ、これは、バルブ、チューブ、チャネル、チャンバー、ならびにデバイスへの流体の導入及びデバイスからの流体の抽出のためのシリンジ及び/またはポンプに接続され得る。デバイスは、マイクロ流体デバイス内の流体の方向移動を可能にする流体フローアクチュエータに接続されてもよい。アクチュエータの例には、シリンジポンプ、機械的に作動する再循環ポンプ、電気浸透圧ポンプ、バルブ、ベローズ、ダイヤフラム、または流体の移動を強制するためのバブルが含まれるが、これらに限定されない。特定の例示的な実施形態では、デバイスは、デバイスを通して流体を移動させるために協働するプログラム可能なバルブを備えたコントローラに接続されている。特定の例示的な実施形態では、デバイスは、以下でさらに詳細に議論されるコントローラに接続される。デバイスは、デバイスの入口ポートに挿入するための金属ピンで終わるチューブによって、フローアクチュエータ、コントローラ、及びサンプルローディングデバイスに接続することができる。 The disclosed device can further include inlet and outlet ports, or openings, which are valves, tubes, channels, chambers, and syringes for introducing and extracting fluid from the device. And / or can be connected to a pump. The device may be connected to a fluid flow actuator that allows the directional movement of the fluid within the microfluidic device. Examples of actuators include, but are not limited to, syringe pumps, mechanically actuated recirculation pumps, electroosmotic pumps, valves, bellows, diaphragms, or bubbles for forcing fluid movement. In certain exemplary embodiments, the device is connected to a controller with programmable valves that work together to move fluid through the device. In certain exemplary embodiments, the device is connected to a controller, which is discussed in more detail below. The device can be connected to a flow actuator, controller, and sample loading device by a tube ending with a metal pin for insertion into the device's inlet port.

本発明は、無線ラボオンチップ(LOC)診断センサーシステムとともに使用することができる(例えば、米国特許第9,470,699号「Diagnostic radio frequency identification sensors and applications thereof」を参照されたい)。特定の実施形態では、本発明は、無線デバイス(例えば、携帯電話、携帯情報端末(PDA)、タブレット)によって制御されるLOCで実行され、結果は前記デバイスに報告される。 The present invention can be used in conjunction with a radio frequency lab-on-chip (LOC) diagnostic sensor system (see, eg, US Pat. No. 9,470,699, "Radio frequency identification sensor and applications theorof"). In certain embodiments, the invention is performed in a LOC controlled by a wireless device (eg, a mobile phone, personal digital assistant (PDA), tablet) and the results are reported to said device.

無線自動識別(RFID)タグシステムには、RFIDリーダー(インテロゲータとも呼ばれる)による受信用のデータを送信するRFIDタグが含まれる。典型的なRFIDシステムでは、個々のオブジェクト(例えば、店舗の商品)には、トランスポンダーを含む比較的小さなタグが装備されている。トランスポンダーには、一意の電子製品コードが割り当てられたメモリチップがある。RFIDリーダーは、通信プロトコールを使用してタグ内のトランスポンダーをアクティブにするシグナルを発信する。したがって、RFIDリーダーは、タグに対してデータを読み書きすることができる。さらに、RFIDタグリーダーは、RFIDタグシステム用途に従ってデータを処理する。現在、パッシブ型とアクティブ型のRFIDタグが存在する。パッシブタイプのRFIDタグは、内部電源を含んでいないが、RFIDリーダーから受信した無線周波数シグナルによって電力が供給される。代替的に、アクティブ型のRFIDタグは、アクティブ型のRFIDタグがより大きな送信範囲とメモリ容量を有することを可能にする内部電源を含む。パッシブ型タグとアクティブ型タグの使用は、特定の用途に依存する。 The radio frequency identification (RFID) tag system includes an RFID tag that transmits data for reception by an RFID reader (also known as an interrogator). In a typical RFID system, individual objects (eg, store merchandise) are equipped with relatively small tags, including transponders. The transponder has a memory chip to which a unique electronic product code is assigned. The RFID reader uses a communication protocol to send a signal that activates the transponder in the tag. Therefore, the RFID reader can read and write data to and from the tag. In addition, RFID tag readers process data according to RFID tag system applications. Currently, there are passive and active RFID tags. Passive RFID tags do not contain an internal power source, but are powered by radio frequency signals received from RFID readers. Alternatively, the active RFID tag includes an internal power source that allows the active RFID tag to have a larger transmission range and memory capacity. The use of passive and active tags depends on the particular application.

ラボオンチップ(Lab-on-the chip)テクノロジーは科学文献によく記載されており、複数のマイクロ流体チャネル、入力または化学ウェルで構成される。RFID電子チップからの導電性リードを各試験ウェルに直接接続できるため、無線自動識別(RFID)タグ技術を使用してウェル内の反応を測定できる。アンテナは、電子チップの別の層に印刷またはマウントするか、デバイスの背面に直接取り付けることができる。さらに、リード、アンテナ、及び電子チップをLOCチップに埋め込むことができるため、電極または電子機器の短絡を防ぐことができる。LOCにより複雑なサンプルの分離と分析が可能になるため、このテクノロジーにより、複雑または高価なリーダーと独立してLOC試験を行うことができる。むしろ、携帯電話またはPDAなどの単純な無線デバイスを使用できる。一実施形態では、無線デバイスは、より複雑なLOC分析のためにマイクロ流体チャネルの分離及び制御も制御する。一実施形態では、LED及び他の電子測定または感知装置がLOC-RFIDチップに含まれる。理論に縛られることなく、この技術は使い捨てであり、分離と混合を必要とする複雑な試験を実験室の外で行うことを可能にする。 Lab-on-the-chip technology is well documented in the scientific literature and consists of multiple microfluidic channels, inputs or chemical wells. Conductive leads from RFID electronic chips can be connected directly to each test well, so reaction within the well can be measured using radio frequency identification (RFID) tag technology. The antenna can be printed or mounted on another layer of the electronic chip or mounted directly on the back of the device. Further, since the lead, the antenna, and the electronic chip can be embedded in the LOC chip, a short circuit of the electrode or the electronic device can be prevented. Because LOC allows for the separation and analysis of complex samples, this technology allows LOC testing to be performed independently of complex or expensive readers. Rather, simple wireless devices such as mobile phones or PDAs can be used. In one embodiment, the wireless device also controls the separation and control of microfluidic channels for more complex LOC analysis. In one embodiment, LEDs and other electronic measurement or sensing devices are included in the LOC-RFID chip. Without being bound by theory, this technique is disposable, allowing complex tests that require separation and mixing to be performed outside the laboratory.

好ましい実施形態では、LOCはマイクロ流体デバイスであり得る。LOCはパッシブ型チップであってもよく、チップは無線デバイスを介して電力供給及び制御される。特定の実施形態では、LOCは、試薬を保持するためのマイクロ流体チャネル及びサンプルを導入するためのチャネルを含む。特定の実施形態では、無線デバイスからのシグナルがLOCに電力を供給し、サンプルとアッセイ試薬の混合を活性化する。具体的には、本発明の場合、システムは、マスキング剤、CRISPRエフェクタータンパク質、及び標的分子に特異的なガイドRNAを含み得る。LOCが活性化すると、マイクロ流体デバイスはサンプルとアッセイ試薬を混合することができる。混合すると、センサーがシグナルを検出し、結果を無線デバイスに送信する。特定の実施形態において、マスキング解除剤は、導電性RNA分子である。導電性RNA分子は、導電性材料に付着することができる。導電性分子は、導電性ナノ粒子、導電性タンパク質、タンパク質もしくはラテックスに付着した金属粒子、または導電性の他のビーズであり得る。特定の実施形態において、DNAまたはRNAが使用される場合、導電性分子は、適合するDNAまたはRNA鎖に直接付着することができる。導電性分子の放出は、センサー全体で検出することができる。アッセイは一段階プロセスであり得る。 In a preferred embodiment, the LOC can be a microfluidic device. The LOC may be a passive chip, which is powered and controlled via a wireless device. In certain embodiments, the LOC comprises a microfluidic channel for holding reagents and a channel for introducing samples. In certain embodiments, a signal from the radio device powers the LOC and activates a mixture of sample and assay reagents. Specifically, in the case of the present invention, the system may include a masking agent, a CRISPR effector protein, and a guide RNA specific for the target molecule. Once the LOC is activated, the microfluidic device can mix the sample with the assay reagent. Once mixed, the sensor detects the signal and sends the result to the wireless device. In certain embodiments, the demasking agent is a conductive RNA molecule. Conductive RNA molecules can attach to conductive materials. Conductive molecules can be conductive nanoparticles, conductive proteins, metal particles attached to proteins or latex, or other conductive beads. In certain embodiments, when DNA or RNA is used, the conductive molecule can attach directly to the matching DNA or RNA strand. Emissions of conductive molecules can be detected throughout the sensor. The assay can be a one-step process.

表面積の電気伝導度を正確に測定できるため、使い捨て無線RFIDエレクトロアッセイで定量的な結果が可能である。さらに、試験領域を非常に小さくできるため、特定のエリアでより多くの試験を実行できるため、結果としてコストを節約できる。特定の実施形態において、それぞれが異なるCRISPRエフェクタータンパク質に関連する別個のセンサー及びセンサーに固定化されたガイドRNAが、複数の標的分子を検出するために使用される。理論に拘束されることなく、様々なセンサーの活性化は、無線デバイスによって区別される。 Since the electrical conductivity of the surface area can be accurately measured, quantitative results are possible with a disposable wireless RFID electroassay. In addition, the test area can be very small, allowing more tests to be performed in a particular area, resulting in cost savings. In certain embodiments, separate sensors and guide RNAs immobilized on the sensors, each associated with a different CRISPR effector protein, are used to detect multiple target molecules. Without being bound by theory, the activation of various sensors is distinguished by wireless devices.

本明細書に記載の導電性方法に加えて、使い捨てRFIDアッセイのための基本的な低コスト通信及び電力プラットフォームとしてRFIDまたはBluetoothに依存する他の方法を使用することができる。例えば、光学的手段を使用して、所与の標的分子の存在及びレベルを評価することができる。特定の実施形態において、光学センサーは、蛍光マスキング剤のマスキング解除を検出する。 In addition to the conductive methods described herein, RFID or other methods that rely on Bluetooth can be used as the basic low-cost communication and power platform for disposable RFID assays. For example, optical means can be used to assess the presence and level of a given target molecule. In certain embodiments, the optical sensor detects the unmasking of the fluorescent masking agent.

特定の実施形態では、本発明のデバイスは、アッセイの診断的読み取りのためのハンドヘルドポータブルデバイスを含むことができる(例えば、Vashist et al.,Commercial Smartphone-Based Devices and Smart Applications for Personalized Healthcare Monitoring and Management,Diagnostics 2014,4(3),104-128;mReader from Mobile Assay;及びHolomic Rapid Diagnostic Test Readerを参照されたい)。 In certain embodiments, the device of the invention can include a handheld portable device for diagnostic reading of the assay (eg, Vashist et al., Commercial Smartphone-Based Devices and Smart Applications For Personmental , Diagnostics 2014, 4 (3), 104-128; mReader from Mobile Assay; and Diagnostic Rapid Digital Test Reader).

本明細書に記載されるように、特定の実施形態は、実施形態がPOC状況及びまたはシグナルを読み取るためのより複雑な検出機器へのアクセスが制限される可能性のある資源の乏しい環境で利用される場合に、特定の付随する利点を有する比色変化による検出を可能にする。しかしながら、本明細書に開示されるポータブル実施形態は、可視範囲外のシグナルの検出を可能にするハンドヘルド分光光度計と結合することもできる。本発明と組み合わせて使用できるハンドヘルド分光光度計デバイスの例は、Das et al.“Ultra-portable,wireless smartphone spectrophotometer for rapid,non-destructive testing of fruit ripeness.”Nature Scientific Reports.2016,6:32504,DOI:10.1038/srep32504に記載される。最後に、量子ドットベースのマスキング構築物を利用する特定の実施形態では、量子ドットによって提供されるほぼ完全な量子収量のために、ハンドヘルドUV光または他の適切なデバイスの使用が首尾よく使用されてシグナルを検出することができる。 As described herein, certain embodiments are utilized in resource-poor environments where access to more complex detection devices for reading POC conditions and / or signals may be restricted. When done, it allows detection by color change with certain accompanying advantages. However, the portable embodiments disclosed herein can also be coupled with a handheld spectrophotometer that allows detection of signals outside the visible range. Examples of handheld spectrophotometer devices that can be used in combination with the present invention are described in Das et al. "Ultra-portable, wireless smartphone spectrophotometer for rapid, non-destructive testing of fruit ripens." Nature Scientific Reports. 2016, 6: 32504, DOI: 10.1038 / rep32504. Finally, in certain embodiments utilizing quantum dot-based masking constructs, the use of handheld UV light or other suitable device has been successfully used for the near-perfect quantum yield provided by quantum dots. The signal can be detected.

個々の個別のボリューム
いくつかの実施形態では、CRISPR系は、個々の個別のボリュームに含まれており、各個別のボリュームは、CRISPRエフェクタータンパク質、対応する標的分子に結合するように設計された1つ以上のガイドRNA、及びRNAベースのマスキング構築物を含む。場合によっては、これらの個々の個別のボリュームのそれぞれが液滴である。特に好ましい実施形態では、液滴は第1のセットの液滴として提供され、各液滴はCRISPR系を含む。いくつかの実施形態では、標的分子またはサンプルは個々の個別のボリュームに含まれ、各個々の個別のボリュームは標的分子を含む。場合によっては、これらの個々の個別のボリュームのそれぞれが液滴である。特に好ましい実施形態では、液滴は第2のセットの液滴として提供され、各液滴は標的分子を含む。
Individual Individual Volumes In some embodiments, the CRISPR system is contained within an individual individual volume, where each individual volume is designed to bind to the CRISPR effector protein, the corresponding target molecule. Includes one or more guide RNAs, and RNA-based masking constructs. In some cases, each of these individual individual volumes is a droplet. In a particularly preferred embodiment, the droplets are provided as a first set of droplets, each droplet comprising a CRISPR system. In some embodiments, the target molecule or sample is contained in an individual individual volume, and each individual individual volume comprises a target molecule. In some cases, each of these individual individual volumes is a droplet. In a particularly preferred embodiment, the droplets are provided as a second set of droplets, each droplet containing a target molecule.

一態様では、本明細書に開示される実施形態は、CRISPR系、対応する標的分子に結合するように設計された1つ以上のガイドRNA、マスキング構築物、及びサンプル中の標的核酸分子を増幅するための任意選択の試薬を含む核酸検出システムに向けられた第1のセットの液滴を含むことができる。特定の例示的な実施形態では、システムは、1つ以上の検出アプタマーをさらに含み得る。1つ以上の検出アプタマーは、RNAポリメラーゼ部位またはプライマー結合部位を含み得る。1つ以上の検出アプタマーは、1つ以上の標的ポリペプチドに特異的に結合し、RNAポリメラーゼ部位またはプライマー結合部位が標的ペプチドへの検出アプタマーの結合時にのみ露出するように構成される。RNAポリメラーゼ部位の露出は、テンプレートとしてアプタマー配列を使用してトリガーRNAオリゴヌクレオチドの生成を容易にする。したがって、そのような実施形態では、1つ以上のガイドRNAは、トリガーRNAに結合するように構成される。 In one aspect, the embodiments disclosed herein amplify the CRISPR system, one or more guide RNAs designed to bind to the corresponding target molecule, the masking construct, and the target nucleic acid molecule in the sample. Can include a first set of droplets directed to a nucleic acid detection system containing an optional reagent for. In certain exemplary embodiments, the system may further comprise one or more detection aptamers. One or more detection aptamers may include an RNA polymerase site or a primer binding site. One or more detection aptamers are configured to specifically bind to one or more target polypeptides and expose the RNA polymerase or primer binding sites only upon binding of the detection aptamer to the target peptide. Exposure of the RNA polymerase site facilitates the generation of triggered RNA oligonucleotides using the aptamer sequence as a template. Therefore, in such an embodiment, one or more guide RNAs are configured to bind to the trigger RNA.

「個々の個別のボリューム」は、個別のボリュームまたは個別の空間、例えばコンテナー、容器、または核酸、CRISPR検出システム、及び本明細書に開示される方法を実行するために必要な試薬の移動を防止及び/または阻害する特性によって定義できる、他の定義されたボリュームもしくは空間などであり、例えば、不透過性または半透過性であってよい、壁、例えば、ウェルの壁、チューブの壁、または液滴の表面などの物理的特性によって定義される、または、化学的、制限された拡散率、電磁的、または光照射、またはそれらの任意の組み合わせなどの他の手段によって定義される、ボリュームまたは空間である。特に好ましい実施形態では、個々の個別のボリュームは液滴である。「制限された拡散率」(例えば、拡散によって定義されたボリューム)とは、特定の分子または反応のみがアクセスできる空間を意味する。これは、拡散の制約が、拡散が1つのストリームから他のストリームへの標的分子の移動を制限する2つの平行な層ストリームの場合のように、空間またはボリュームを効果的に定義するためである。「化学的」に定義されたボリュームまたは空間とは、サイズなどの化学的または分子的特性のために特定の標的分子のみが存在できる空間を意味し、例えば、ゲルビーズが、表面電荷、マトリックスサイズ、またはビーズの内部に入る可能性のある種の選択を可能にするビーズの他の物理的特性などによって、特定の種をビーズに侵入させないようにすることができる。「電磁的に」定義されたボリュームまたは空間とは、標的分子またはそれらの支持体の電磁特性、例えば電荷または磁気特性を使用して、磁場内または磁石上で直接磁性粒子を捕捉するなど、空間内の特定の領域を定義できる空間を意味する。「光学的に」定義されたボリュームとは、可視線、紫外線、赤外線、または他の波長の光でそれを照射することによって定義できる空間の任意の領域を意味し、定義された空間またはボリューム内の標的分子のみが標識され得る。壁のない、または半透膜を使用する利点の1つは、緩衝液、化学活性化剤、またはその他の試薬などの一部の試薬が個別のボリュームの中でまたは中を通って通過し、標的分子などの他の材料が個別のボリュームまたは空間に維持され得ることである。本明細書で説明するように、液滴系は、反応の開始が望まれるまで化合物の分離を可能にする。典型的には、個別のボリュームは、標識を可能にする条件下でインデックス可能な核酸識別子で標的分子を標識するのに適した流体媒体(例えば、水溶液、油、緩衝液、及び/または細胞増殖をサポートできる媒体)を含むことになる。開示された方法で有用な例示的な個別のボリュームまたは空間には、とりわけ、液滴(例えば、マイクロ流体液滴及び/またはエマルション液滴)、ヒドロゲルビーズまたは他のポリマー構造(例えば、ポリエチレングリコールジアクリレートビーズまたはアガロースビーズ)、組織スライド(例えば、化学的、光学的、または物理的手段によって特定の領域、ボリューム、または空間が定義された固定ホルマリンパラフィン包埋組織スライド)、秩序だったアレイまたはランダムパターンで試薬を堆積することによって領域が定義された顕微鏡スライド、チューブ(遠心管、マイクロ遠心管、試験管、キュベット、コニカルチューブなど)、ボトル(ガラスボトル、プラスチックボトル、セラミックボトル、三角フラスコ、シンチレーションバイアルなど)、ウェル(プレートのウェルなど)、プレート、ピペット、またはピペットチップが含まれる。特定の例示的な実施形態では、個々の個別のボリュームは液滴である。 "Individual individual volumes" prevent the movement of individual volumes or individual spaces, such as containers, containers, or nucleic acids, CRISPR detection systems, and the reagents required to perform the methods disclosed herein. And / or other defined volume or space that can be defined by the inhibiting property, eg, impermeable or semi-permeable, such as a wall, eg, a well wall, a tube wall, or a liquid. Volume or space defined by physical properties such as the surface of the droplet, or by other means such as chemical, restricted diffusivity, electromagnetic, or light irradiation, or any combination thereof. Is. In a particularly preferred embodiment, the individual individual volumes are droplets. "Limited diffusion rate" (eg, volume defined by diffusion) means a space accessible only to a particular molecule or reaction. This is because diffusion constraints effectively define space or volume, as in the case of two parallel layered streams where diffusion limits the movement of target molecules from one stream to another. .. A volume or space as defined as "chemical" means a space in which only certain target molecules can be present due to chemical or molecular properties such as size, eg, gel beads, surface charge, matrix size, etc. Alternatively, other physical properties of the bead that allow the selection of species that may enter the inside of the bead can prevent certain species from invading the bead. An "electromagnetically" defined volume or space is a space that captures magnetic particles directly in a magnetic field or on a magnet using the electromagnetic properties of the target molecule or its support, such as charge or magnetic properties. It means a space in which a specific area can be defined. An "optically" defined volume means any area of space that can be defined by irradiating it with visible, ultraviolet, infrared, or other wavelengths of light, within the defined space or volume. Only target molecules of can be labeled. One of the advantages of using a wallless or semipermeable membrane is that some reagents, such as buffers, chemical activators, or other reagents, pass through or through individual volumes. Other materials, such as target molecules, can be maintained in separate volumes or spaces. As described herein, the droplet system allows separation of the compound until the reaction is desired to initiate. Typically, the individual volumes are suitable fluid media (eg, aqueous solutions, oils, buffers, and / or cell proliferation) suitable for labeling target molecules with indexable nucleic acid identifiers under conditions that allow labeling. Will include media that can support). Illustrative individual volumes or spaces useful in the disclosed methods include, among other things, droplets (eg, microfluidic droplets and / or emulsion droplets), hydrogel beads or other polymer structures (eg, polyethylene glycol di). Acrylic beads or agarose beads), tissue slides (eg, fixed formalin paraffin-embedded tissue slides in which specific regions, volumes, or spaces are defined by chemical, optical, or physical means), ordered arrays or random. Microscope slides, tubes (centrifugal tubes, microcentrifugal tubes, test tubes, cuvettes, conical tubes, etc.), bottles (glass bottles, plastic bottles, ceramic bottles, triangular flasks, scintillations, etc.) whose areas are defined by depositing reagents in a pattern. Includes vials, etc.), wells (plate wells, etc.), plates, pipettes, or pipette tips. In certain exemplary embodiments, the individual individual volumes are droplets.

液滴
本明細書で提供される液滴は、典型的には、油入力チャネル及び水性入力チャネルで形成される油中水型マイクロエマルションである。液滴は、当該技術分野で知られている様々な分散法によって形成することができる。1つの特定の実施形態において、油相中の多数の均一な液滴は、マイクロエマルションによって作ることができる。例示的な方法には、例えば、水相が油によって剪断され、それによって液滴が生成されるR接合形状;水流を2方向から剪断することによって液滴が生成される、流れに集中する形状;または水相が細い毛細管を通して排出され、油がポンプで送られる大きな毛細管の内側に同軸に配置された共流れ形状が含まれる。
Droplets The droplets provided herein are typically water-in-oil microemulsions formed by an oil input channel and an aqueous input channel. Droplets can be formed by various dispersion methods known in the art. In one particular embodiment, a large number of uniform droplets in the oil phase can be made by microemulsion. An exemplary method is, for example, an R-junction shape in which the aqueous phase is sheared by oil, thereby producing droplets; a flow-focused shape in which droplets are produced by shearing the water stream from two directions. It also includes a co-flow shape coaxially arranged inside a large capillary tube in which the aqueous phase is drained through a thin capillary tube and oil is pumped.

単分散の水性液滴の使用は、油中水型エマルションとしてマイクロ流体デバイスによって生成できる。一実施形態では、液滴は流動油相中に運ばれ、界面活性剤によって安定化される。一態様では、単一細胞または単一細胞小器官または単一分子(タンパク質、RNA、DNA)が、水溶液/分散液から均一な液滴にカプセル化される。関連する態様において、複数の細胞または複数の分子が、単一の細胞または単一の分子の代わりになり得る。 The use of monodisperse aqueous droplets can be produced by microfluidic devices as water-in-oil emulsions. In one embodiment, the droplets are carried into the liquid oil phase and stabilized by a surfactant. In one aspect, a single cell or organelle or single molecule (protein, RNA, DNA) is encapsulated in uniform droplets from an aqueous solution / dispersion. In a related embodiment, multiple cells or molecules can substitute for a single cell or single molecule.

1pL~10nLの範囲のボリュームの水性液滴は、個々の反応器として機能する。液滴中の10~10個の単一細胞は、1回の実行で処理及び分析できる。迅速な大規模化学スクリーニングまたは複雑な生物学的ライブラリーの同定に微小液滴を利用するには、それぞれが特定の化学化合物または生物学的プローブ細胞または目的の分子バーコードを含む異なる種の微小液滴を生成し、好ましい条件、例えば混合比、濃度、配合順序で組み合わせる必要がある。液滴の各種は、個別の入口マイクロ流体チャネルから主要なマイクロ流体チャネルの合流点に導入される。好ましくは、液滴のボリュームは、その各々が参照によりその全体が本明細書に組み込まれる米国公開第US2007/0195127号及び国際公開第WO2007/089541号に開示されるように、ある種が他の種よりも大きく、異なる速度で、通常は他の種よりも遅い速度でキャリア流体内を移動するようにする設計によって選択される。チャネルの幅と長さは、液滴の速い種が最も遅い種に追いつくように選択される。チャネルのサイズの制約により、移動の速い液滴が移動の遅い液滴を通過することが妨げられ、一連の液滴がマージゾーンに入ることになる。多段階の化学反応、生化学反応、またはアッセイ検出化学では、多くの場合、異なるタイプの種を反応に追加する前に、一定の反応時間が必要である。多段階反応は、それぞれが別のマージ点を含む、2回目、3回目、またはそれ以上の合流点でプロセスを複数回繰り返すことによって達成される。入口チャネルからの液滴の頻度が最適化された比率に一致し、種のボリュームが合わされた液滴で最適化された反応条件を提供するように適合する場合、非常に効率的で正確な反応と反応の分析が達成される。流体液滴は、液滴を含む液体の流れを変更することにより、本発明の流体システム内でスクリーニングまたは分類され得る。例えば、一組の実施形態において、流体液滴は、流体液滴を取り囲む液体を第1のチャネル、第2のチャネルなどに向けることによって誘導または分類され得る。別の組の実施形態では、流体システム内、例えば、異なるチャネル内またはチャネルの異なる部分内の圧力を制御して、流体液滴の流れを方向付けることができる。例えば、液滴は、さらなる流れの方向のための複数のオプションを含むチャネル接合部に向けられ得る(例えば、任意選択の下流フローチャネルを定義するチャネル内のブランチまたは分岐に向けられる)。1つ以上の任意選択の下流フローチャネル内の圧力を制御して、液滴をチャネルの1つに選択的に向けることができ、圧力の変化は、連続する液滴が接合部に到達するのに必要な時間のオーダーに影響を与えることができるため、連続する各液滴の下流流路を独立して制御することができる。 Aqueous droplets in volumes ranging from 1 pL to 10 nL serve as individual reactors. 104-105 single cells in a droplet can be processed and analyzed in a single run. To utilize microdroplets for rapid large-scale chemical screening or identification of complex biological libraries, microscopic species of different species, each containing a particular chemical compound or biological probe cell or molecular barcode of interest. It is necessary to generate droplets and combine them under favorable conditions such as mixing ratio, concentration and compounding order. A variety of droplets are introduced from the individual inlet microfluidic channels to the confluence of the major microfluidic channels. Preferably, the volume of the droplet is of some sort, as disclosed in US Publication No. US2007 / 0195127 and International Publication No. WO2007 / 089541, each of which is incorporated herein by reference in its entirety. It is selected by a design that allows it to move in the carrier fluid at a different rate than the species, usually at a slower rate than the other species. The width and length of the channel are chosen so that the fast droplet species catches up with the slowest species. Channel size constraints prevent fast-moving droplets from passing through slow-moving droplets, resulting in a series of droplets entering the merge zone. Multi-step chemistry, biochemical reactions, or assay detection chemistry often require a certain reaction time before adding different types of species to the reaction. The multi-step reaction is achieved by repeating the process multiple times at a second, third, or higher confluence, each containing a different merge point. Very efficient and accurate reaction if the frequency of droplets from the inlet channel matches the optimized ratio and the seed volume is adapted to provide optimized reaction conditions for the combined droplets. And reaction analysis is achieved. Fluid droplets can be screened or classified within the fluid system of the invention by altering the flow of the liquid containing the droplets. For example, in a set of embodiments, the fluid droplets can be guided or classified by directing the liquid surrounding the fluid droplets to a first channel, a second channel, and the like. In another set of embodiments, the pressure within the fluid system, eg, within different channels or within different parts of the channel, can be controlled to direct the flow of fluid droplets. For example, the droplet may be directed at a channel junction that contains multiple options for further flow directions (eg, directed at a branch or branch within the channel that defines an optional downstream flow channel). The pressure in one or more optional downstream flow channels can be controlled to selectively direct the droplet to one of the channels, and the change in pressure causes the continuous droplet to reach the junction. The downstream flow path of each successive droplet can be controlled independently because it can affect the order of time required for.

1つの構成において、液体リザーバーの膨張及び/または収縮は、例えば、流体液滴を含む液体の方向付けられた動きを引き起こすことによって、流体液滴をチャネルに誘導または分類するために使用され得る。別では、液体リザーバーの膨張及び/または収縮は、例えば本明細書に記載されるような他の流れ制御デバイス及び方法と組み合わせることができる。液体リザーバーの膨張及び/または収縮を引き起こすことができるデバイスの非限定的な例には、ピストンが含まれる。マイクロ流体チャネルを使用して液滴を処理するための重要な要素には次のものが含まれる:(1)正しい容量の液滴を生成し、(2)正しい頻度で液滴を生成し、(3)サンプル液滴の第1のストリームをサンプル液滴の第2のストリームと一緒にして、サンプル液滴の第1のストリームの頻度がサンプル液滴の第2のストリームの頻度と一致するようにする。好ましくは、ライブラリー液滴の頻度がサンプル液滴の頻度と一致するように、サンプル液滴のストリームを予め作製されたライブラリー液滴のストリームと一緒にする。一定の頻度で均一な容量の液滴を生成する方法は、当該技術分野で周知である。1つの方法は、米国公開第US2005/0172476号及び国際公開第WO2004/002627号に開示されているように、分散相流体及び非混和性キャリア流体の流体力学的集束を使用して液滴を生成することである。コンフルエンスに導入された種の1つは、予め作製された液滴のライブラリーであることが望ましく、ライブラリーは複数の反応条件を含む。例えば、ライブラリーは、細胞または酵素への影響をスクリーニングするための別個のライブラリー要素としてカプセル化された、様々な濃度の複数の異なる化合物を含み得る。あるいは、ライブラリーは、遺伝子座のコレクションの標的化増幅のための異なるライブラリー要素としてカプセル化された複数の異なるプライマー対から構成され得る。あるいは、ライブラリーは、複数の結合アッセイを実行するために異なるライブラリー要素としてカプセル化された複数の異なる抗体種を含み得る。反応条件のライブラリーの基板への導入は、ライブラリー液滴の事前に作製されたコレクションを駆動流体でバイアルから押し出すことによって達成される。駆動流体は連続流体である。駆動流体は、キャリア流体と同じ物質(例えば、フルオロカーボン油)を含むことができる。例えば、ライブラリーが、10ピコリットルの液滴で構成されている場合、1秒あたり10,000ピコリットルの速度の駆動流体でマイクロ流体基板上の入口チャネルに駆動され、したがって、液滴が合流点に入ると予想される頻度は名目上、1秒あたり1000である。ただし、実際には、液滴の間に油が詰まっており、ゆっくりと流れ出す。時間の経過とともに、ライブラリーの液滴からキャリア液が流出し、液滴の数密度(数/mL)が増加する。したがって、駆動流体の注入の単純な固定速度は、基板内のマイクロ流体チャネルへの液滴の均一な導入速度を提供しない。さらに、平均ライブラリー液滴量のライブラリー間の変動は、合流点での液滴導入の頻度のシフトをもたらす。このように、サンプルの変動と油の排出に起因する液滴の均一性の欠如は、解決すべき別の問題をもたらす。例えば、名目上の液滴量がライブラリー内で10ピコリットルであると予想されるが、ライブラリー間で9~11ピコリットルで変動する場合、10,000ピコリットル/秒の注入速度は名目上、1秒あたり900~1100液滴の頻度の範囲を生成する。つまり、チップ上で作製された液滴の分散相の組成におけるサンプル間の変動、ライブラリー液滴の数密度が時間の経過とともに増加する傾向、及び平均液滴容量のライブラリー間の変動は、一定の注入速度を使用するだけで、コンフルエンスで液滴の頻度を確実に一致させることができる範囲を厳しく制限する。さらに、これらの制限は、ボリュームを再現可能に組み合わせる範囲にも影響を与える。ポンプ流量精度の一般的な変動及びチャネル寸法の変動と組み合わさると、システムは実行ごとに補正する手段がなければ、大幅に制限される。前述の事実は、解決すべき問題を説明するだけでなく、マイクロ流体チャネル内の微小液滴に対するマイクロ流体制御を瞬時に制御する方法の必要性も示している。 In one configuration, expansion and / or contraction of the liquid reservoir can be used to guide or classify a fluid droplet into a channel, for example by causing a directed movement of the liquid, including the fluid droplet. Alternatively, the expansion and / or contraction of the liquid reservoir can be combined with other flow control devices and methods, eg, as described herein. Non-limiting examples of devices that can cause expansion and / or contraction of a liquid reservoir include a piston. Key factors for processing droplets using microfluidic channels include: (1) produce droplets of the correct volume, (2) produce droplets at the correct frequency, (3) Combine the first stream of the sample droplets with the second stream of the sample droplets so that the frequency of the first stream of the sample droplets matches the frequency of the second stream of the sample droplets. To. Preferably, the stream of sample droplets is combined with the stream of prefabricated library droplets so that the frequency of the library droplets matches the frequency of the sample droplets. Methods of producing droplets of uniform volume at a constant frequency are well known in the art. One method uses hydrodynamic focusing of dispersed phase fluids and immiscible carrier fluids to generate droplets, as disclosed in US Publications US 2005/0172476 and WO 2004/002627. It is to be. One of the species introduced into the confluence is preferably a library of pre-prepared droplets, which contains multiple reaction conditions. For example, a library may contain multiple different compounds of varying concentrations encapsulated as separate library elements for screening for effects on cells or enzymes. Alternatively, the library may consist of a plurality of different primer pairs encapsulated as different library elements for targeted amplification of a collection of loci. Alternatively, the library may include multiple different antibody species encapsulated as different library elements to perform multiple binding assays. Introduction of the reaction conditions into the substrate is accomplished by extruding a prefabricated collection of library droplets from the vial with a driving fluid. The driving fluid is a continuous fluid. The driving fluid can include the same material as the carrier fluid (eg, fluorocarbon oil). For example, if the library is composed of 10 picolitre droplets, the driving fluid at a rate of 10,000 picolitres per second is driven into the inlet channel on the microfluidic substrate, thus the droplets merge. The expected frequency of entering a point is nominally 1000 per second. However, in reality, the oil is clogged between the droplets and slowly flows out. Over time, carrier fluid will flow out of the droplets in the library, increasing the number density (number / mL) of the droplets. Therefore, the simple fixed rate of injection of the drive fluid does not provide a uniform rate of introduction of the droplet into the microfluidic channel within the substrate. In addition, variations in the average library droplet volume between libraries result in a shift in the frequency of droplet introduction at the confluence. Thus, the lack of droplet uniformity due to sample variability and oil discharge poses another problem to be solved. For example, if the nominal droplet volume is expected to be 10 picolitres within the library, but fluctuates between 9-11 picolitres between libraries, an injection rate of 10,000 picolitres / sec is nominal. Above, it produces a frequency range of 900 to 1100 droplets per second. That is, variations between samples in the composition of the dispersed phase of the droplets produced on the chip, the tendency for the number density of library droplets to increase over time, and variations between libraries in average droplet volume. Using only a constant injection rate severely limits the range in which the frequency of droplets can be reliably matched in phase. In addition, these limitations also affect the range of reproducible combinations of volumes. Combined with general variations in pump flow accuracy and variations in channel dimensions, the system is severely limited without means of compensating for each run. The above facts not only explain the problem to be solved, but also indicate the need for a method of instantaneously controlling microfluidic control for microdroplets within the microfluidic channel.

界面活性剤(複数可)と油の組み合わせを開発して、液滴の生成、保管、及び操作を容易にし、多様なライブラリーの各液滴内で独自の化学的/生化学的/生物学的環境を維持する必要がある。したがって、界面活性剤と油の組み合わせは、(1)液滴形成プロセス及びその後の収集及び保管中に制御されない凝集に対して液滴を安定化させ、(2)油相へ及び/または液滴間での任意の液滴内容物の輸送を最小限に抑え、(3)各液滴の内容物で化学的及び生物学的不活性を維持する(例えば、油水界面でのカプセル化内容物の吸着または反応がなく、液滴中の生物学的または化学的成分への悪影響がない)。液滴ライブラリーの機能と安定性に関する要件に加えて、油中界面活性剤溶液は、プラットフォームに関連する流体物理学及び材料と結合する必要がある。具体的には、油溶液は、マイクロ流体チップを構築するために使用される材料を膨潤、溶解、または劣化させてはならず、油の物理的特性(例えば、粘度、沸点など)は、プラットフォームの流れ及び動作条件に適している必要がある。界面活性剤のない油で形成された液滴は、凝集するには安定していないため、エマルションライブラリーの連続相として使用される油に界面活性剤を溶解する必要がある。界面活性剤分子は両親媒性であり、分子の一部は油溶性であり、分子の一部は水溶性である。例えば、本明細書に記載の入口モジュールにおいて、マイクロ流体チップのノズルに水-油界面が形成されると、油相に溶解した界面活性剤分子が界面に吸着する。分子の親水性部分は液滴の内部にあり、分子の親フッ素性(fluorophilic)部分は液滴の外部を修飾する。界面に界面活性剤が存在すると、液滴の表面張力が低下するため、エマルションの安定性が向上する。凝集に対して液滴を安定させることに加えて、界面活性剤は各液滴の内容物に対して不活性であるべきであり、界面活性剤はカプセル化された成分の油または他の液滴への輸送を促進してはならない。液滴ライブラリーは、単一のコレクションに一緒にプールされる多数のライブラリー要素で構成されてもよい(例えば、米国特許公開第2010002241号を参照されたい)。 Develop a combination of surfactant (s) and oil to facilitate droplet generation, storage, and manipulation, and unique chemical / biochemical / biological within each droplet of a diverse library. It is necessary to maintain the target environment. Thus, the combination of surfactant and oil stabilizes the droplet against (1) uncontrolled aggregation during the droplet formation process and subsequent collection and storage, and (2) to the oil phase and / or droplets. Minimize the transport of any droplet content between and (3) maintain chemical and biological inactivity in the content of each droplet (eg, encapsulated content at the oil-water interface). No adsorption or reaction and no adverse effects on biological or chemical components in the droplets). In addition to the functional and stability requirements of the droplet library, the surfactant solution in oil needs to be combined with the fluid physics and materials associated with the platform. Specifically, the oil solution must not swell, dissolve, or degrade the material used to build the microfluidic chip, and the physical properties of the oil (eg, viscosity, boiling point, etc.) are platform. It is necessary to be suitable for the flow and operating conditions of. Since droplets formed of oil without detergent are not stable to aggregate, it is necessary to dissolve the detergent in the oil used as the continuous phase of the emulsion library. Surfactant molecules are amphipathic, some of the molecules are oil-soluble, and some of the molecules are water-soluble. For example, in the inlet module described herein, when a water-oil interface is formed on the nozzle of a microfluidic chip, the surfactant molecules dissolved in the oil phase are adsorbed on the interface. The hydrophilic part of the molecule is inside the droplet and the fluorophilic part of the molecule modifies the outside of the droplet. The presence of a surfactant at the interface reduces the surface tension of the droplets, thus improving the stability of the emulsion. In addition to stabilizing the droplets against agglomeration, the surfactant should be inert to the contents of each droplet, and the surfactant should be the oil or other liquid of the encapsulated component. Do not facilitate transport to the drops. A droplet library may consist of a number of library elements pooled together in a single collection (see, eg, US Patent Publication No. 2010002241).

ライブラリーは、単一のライブラリー要素から1015以上のライブラリー要素まで、複雑さが異なり得る。各ライブラリー要素は、固定濃度の1つ以上の特定のコンポーネントであってもよい。要素は、細胞、オルガネラ、ウイルス、細菌、酵母、ビーズ、アミノ酸、タンパク質、ポリペプチド、核酸、ポリヌクレオチド、または小分子化学化合物であり得るが、これらに限定されない。要素には、標識などの識別子が含まれてもよい。「液滴ライブラリー」または「液滴ライブラリー(複数)」という用語は、本明細書では「エマルションライブラリー」または「エマルションライブラリー(複数)」とも呼ばれる。これらの用語は、本明細書全体で互換的に使用される。細胞ライブラリー要素には、ハイブリドーマ、B細胞、初代細胞、培養細胞株、がん細胞、幹細胞、組織から得られた細胞、または任意の他の細胞型が含まれるが、これらに限定されない。細胞ライブラリー要素は、個々の液滴に1から数十万までの多数の細胞をカプセル化することによって調製される。カプセル化された細胞の数は、通常、細胞の数密度と液滴の体積からポアソン統計によって与えられる。しかしながら、場合によっては、Edd et al.,“Controlled encapsulation of single-cells into monodisperse picolitre drops.”Lab Chip,8(8):1262-1264,2008に記載されるように、数がポアソン統計から逸脱している。細胞の個別の性質により、複数の細胞バリアントがすべて単一の開始培地に存在するライブラリーを大量に調製でき、その培地は最大で1つの細胞を含む個々の液滴カプセルに分割される。これらの個々の液滴カプセルは、次に結合またはプールされて、固有のライブラリー要素で構成されるライブラリーを形成する。カプセル化に続く、またはいくつかの実施形態では、カプセル化後の細胞分裂により、クローンライブラリー要素が生成される。 Libraries can vary in complexity, from a single library element to more than 1015 library elements. Each library element may be one or more specific components of fixed concentration. Elements can be, but are not limited to, cells, organellas, viruses, bacteria, yeasts, beads, amino acids, proteins, polypeptides, nucleic acids, polynucleotides, or small molecule chemical compounds. The element may include an identifier such as a sign. The term "droplet library" or "droplet library" is also referred to herein as "emulsion library" or "emulsion library". These terms are used interchangeably throughout this specification. Cell library elements include, but are not limited to, hybridomas, B cells, primary cells, cultured cell lines, cancer cells, stem cells, cells derived from tissues, or any other cell type. Cell library elements are prepared by encapsulating a large number of cells, ranging from one to hundreds of thousands, into individual droplets. The number of encapsulated cells is usually given by Poisson statistics from the cell number density and the volume of the droplet. However, in some cases, Edd et al. , "Controlled encapsulation of single-cells into monodisperse picolitre drops." Lab Chip, 8 (8): 1262-1264, 2008, the numbers deviate from Poisson statistics. Due to the individual nature of the cells, a large library can be prepared in which multiple cell variants are all present in a single starting medium, which medium is divided into individual droplet capsules containing up to one cell. These individual droplet capsules are then combined or pooled to form a library composed of unique library elements. Following encapsulation, or in some embodiments, cell division after encapsulation produces clonal library elements.

特定の実施形態では、ビーズベースのライブラリー要素は、所与のタイプの1つ以上のビーズを含むことができ、抗体、酵素、または他のタンパク質などの他の試薬も含むことができる。すべてのライブラリー要素が異なるタイプのビーズを含むが、同じ周囲の媒体を含む場合、ライブラリー要素はすべて、単一の開始流体から調製するか、様々な開始流体を有することができる。ゲノム改変された酵母または細菌細胞などのバリアントのコレクションから大量に調製された細胞ライブラリーの場合、ライブラリー要素は様々な開始流体から調製される。多くの場合、タンパク質のバリアントを生成するように操作された、複数の細胞または酵母または細菌で開始する場合、液滴ごとに正確に1つの細胞を持ち、ほんの少量の液滴にのみ1つを超える細胞を含むことが望ましい場合がある。場合によっては、ポアソン統計からの変動が達成され、液滴のロードが強化され、液滴ごとに正確に1つの細胞を持つ液滴が多くなり、空の液滴または1つを超える細胞を含む液滴の例外がほとんどなくなる。液滴ライブラリーの例は、ビーズ、細胞、小分子、DNA、プライマー、抗体など、様々な内容物を持つ液滴のコレクションである。より小さな液滴は、フェムトリットル(fL)ほどの容量の液滴であり、液滴ディスペンサーで特に考えられる。容量は、約5~約600fLの範囲であり得る。より大きな液滴のサイズは、直径約0.5ミクロン~500ミクロンの範囲であり、これは約1ピコリットル~1ナノリットルに相当する。しかしながら、液滴は5ミクロンと小さくても500ミクロンと大きくてもよい。好ましくは、液滴は100ミクロン未満であり、直径は約1ミクロン~約100ミクロンである。最も好ましいサイズは、直径約20~40ミクロン(10~100ピコリットル)である。液滴ライブラリーの検討された好ましい特性には、浸透圧バランス、均一サイズ、及びサイズ範囲が含まれる。本発明のエマルションライブラリー内の液滴は、少なくとも1つのフルオロ界面活性剤を含み得る非混和性油内に含まれ得る。いくつかの実施形態では、非混和性フルオロカーボン油内のフルオロ界面活性剤は、1つ以上の過フッ素化ポリエーテル(PFPE)ブロックと1つ以上のポリエチレングリコール(PEG)ブロックからなるブロック共重合体であり得る。他の実施形態では、フルオロ界面活性剤は、アミド結合基によって2つのPFPEブロックに共有結合したPEG中心ブロックからなるトリブロック共重合体である。フルオロ界面活性剤の存在(ライブラリー内の液滴の均一なサイズと同様)は、液滴の安定性と完全性を維持するために重要であり、本明細書に記載の様々な生物学的及び化学的アッセイのライブラリー内の液滴のその後の使用にも不可欠である。本発明の液滴ライブラリーで利用できる流体(例えば、水性流体、非混和性油など)及び他の界面活性剤は、本明細書でより詳細に説明される。 In certain embodiments, the bead-based library element can include one or more beads of a given type and can also include other reagents such as antibodies, enzymes, or other proteins. If all library elements contain different types of beads, but contain the same surrounding medium, then all library elements can be prepared from a single starting fluid or have different starting fluids. For cell libraries prepared in large quantities from a collection of variants such as genome-modified yeast or bacterial cells, the library elements are prepared from a variety of starting fluids. Often, when starting with multiple cells or yeast or bacteria engineered to produce a variant of the protein, have exactly one cell per droplet, one for only a few droplets. It may be desirable to include more cells. In some cases, variations from Poisson statistics have been achieved, the load of droplets has been enhanced, more droplets have exactly one cell per droplet, including empty droplets or more than one cell. There are almost no exceptions to droplets. An example of a droplet library is a collection of droplets with various contents such as beads, cells, small molecules, DNA, primers, antibodies and the like. Smaller droplets are droplets as large as femtolitre (fL) and are particularly conceivable in droplet dispensers. The capacity can be in the range of about 5 to about 600 fL. The size of the larger droplets ranges from about 0.5 micron to 500 micron in diameter, which corresponds to about 1 picolitre to 1 nanoliter. However, the droplet may be as small as 5 microns or as large as 500 microns. Preferably, the droplets are less than 100 microns and have a diameter of about 1 micron to about 100 microns. The most preferred size is about 20-40 microns (10-100 picolitres) in diameter. Preferred properties considered for the droplet library include osmotic balance, uniform size, and size range. The droplets in the emulsion library of the present invention may be contained in immiscible oils which may contain at least one fluorosurfactant. In some embodiments, the fluorosurfactant in an immiscible fluorocarbon oil is a block copolymer consisting of one or more perfluorinated polyether (PFPE) blocks and one or more polyethylene glycol (PEG) blocks. Can be. In another embodiment, the fluorosurfactant is a triblock copolymer consisting of a PEG center block covalently bonded to two PFPE blocks by an amide bond group. The presence of fluorosurfactant (similar to the uniform size of the droplets in the library) is important for maintaining the stability and completeness of the droplets and the various biological organisms described herein. And it is also essential for subsequent use of the droplets in the library of chemical assays. The fluids available in the droplet library of the invention (eg, aqueous fluids, immiscible oils, etc.) and other surfactants are described in more detail herein.

したがって、本発明は、少なくとも1つのフルオロ界面活性剤を含み得る非混和性油(例えば、フルオロカーボン油)内に複数の水性液滴を含み得るエマルションライブラリーを含み得、各液滴はサイズが均一であり、同じ水性流体を含み得、異なるライブラリー要素を含み得る。本発明はまた、異なるライブラリー要素を含み得る単一の水性流体を提供することと、各ライブラリー要素を少なくとも1つのフルオロ界面活性剤を含み得る非混和性フルオロカーボン油内の水性液滴にカプセル化することであって、ここで各液滴はサイズが均一であり、同じ水性流体を含み得、異なるライブラリー要素を含み得る、カプセル化することと、少なくとも1つのフルオロ界面活性剤を含み得る非混和性フルオロカーボン油内に水性液滴をプールし、それによりエマルションライブラリーを形成することと、を含むエマルションライブラリーを形成する方法を提供する。例えば、あるタイプのエマルションライブラリーでは、すべての異なるタイプの要素(例えば、細胞またはビーズ)を同じ媒体に含まれる単一のソースにプールすることができる。最初のプーリングの後、細胞またはビーズは液滴にカプセル化され、液滴のライブラリーが生成され、異なるタイプのビーズまたは細胞を含む各液滴は異なるライブラリー要素である。初期溶液の希釈により、カプセル化プロセスが可能になる。いくつかの実施形態では、形成される液滴は、単一の細胞またはビーズのいずれかを含むか、何も含まない、すなわち空になる。他の実施形態では、形成される液滴は、ライブラリー要素の複数のコピーを含む。カプセル化されている細胞またはビーズは、通常、同じタイプの細胞またはビーズのバリアントである。別の例では、エマルションライブラリーは、非混和性フルオロカーボン油内に複数の水性液滴を含むことができ、単一分子がカプセル化され、生成される20~60個の液滴(例えば、25、30、35、40、45、50、55、60個の液滴、またはその間の任意の整数)ごとに液滴内に単一分子が含まれるようにすることができる。分子を含む溶液を希釈して、単一分子のカプセル化が可能になるような低濃度にすることにより、単一分子をカプセル化することができる。これらのライブラリーの形成は、限界希釈に依存してもよい。 Accordingly, the present invention may include an emulsion library capable of containing a plurality of aqueous droplets in an immiscible oil (eg, fluorocarbon oil) which may contain at least one fluorosurfactant, where each droplet is uniform in size. And may contain the same aqueous fluid and may contain different library elements. The invention also provides a single aqueous fluid that may contain different library elements and encapsulates each library element in aqueous droplets in an immiscible fluorocarbon oil that may contain at least one fluorosurfactant. Where each droplet is uniform in size and may contain the same aqueous fluid, may contain different library elements, may contain encapsulation and may contain at least one fluorosurfactant. Provided are a method of pooling an aqueous droplet in an immiscible fluorocarbon oil, thereby forming an emulsion library, and forming an emulsion library containing. For example, in one type of emulsion library, all different types of elements (eg, cells or beads) can be pooled in a single source contained in the same medium. After the initial pooling, the cells or beads are encapsulated in droplets, a library of droplets is generated, and each droplet containing different types of beads or cells is a different library element. Dilution of the initial solution allows for the encapsulation process. In some embodiments, the droplets formed contain either a single cell or beads, or nothing, i.e. empty. In other embodiments, the droplets formed include multiple copies of the library elements. Encapsulated cells or beads are usually variants of the same type of cells or beads. In another example, the emulsion library can contain multiple aqueous droplets in an immiscible fluorocarbon oil, with 20-60 droplets produced by encapsulating a single molecule (eg, 25). , 30, 35, 40, 45, 50, 55, 60 droplets, or any integer in between) can be such that a single molecule is contained within the droplet. A single molecule can be encapsulated by diluting the solution containing the molecule to a low concentration that allows encapsulation of the single molecule. The formation of these libraries may depend on limiting dilution.

本発明はまた、少なくとも1つの界面活性剤、一実施形態ではフルオロ界面活性剤を含み得る油、一実施形態ではフルオロカーボン油内に、少なくとも第1の水性液滴及び少なくとも第2の水性液滴を含み得るエマルションライブラリーを提供し、少なくとも第1及び少なくとも第2の液滴はサイズが均一であり、異なる水性流体及び異なるライブラリー要素を含む。本発明はまた、少なくとも第1の要素ライブラリーを含み得る少なくとも第1の水性流体を提供することと、少なくとも第2の要素ライブラリーを含み得る少なくとも第2の水性流体を提供することと、前記少なくとも第1のライブラリーの各要素を、少なくとも1つのフルオロ界面活性剤を含み得る非混和性フルオロカーボン油内の少なくとも第1の水性液滴中にカプセル化することと、前記少なくとも第2のライブラリーの各要素を、少なくとも1つのフルオロ界面活性剤を含み得る非混和性フルオロカーボン油内の少なくとも第2の水性液滴中にカプセル化することであって、少なくとも第1及び少なくとも第2の液滴はサイズが均一であり、異なる水性流体及び異なるライブラリー要素を含み得る、カプセル化することと、少なくとも1つのフルオロ界面活性剤を含み得る非混和性フルオロカーボン油内少なくとも第1の水性液滴及び少なくとも第2の水性液滴をプールし、それによりエマルションライブラリーを形成すること、を含み得るエマルションライブラリーを形成する方法を提供する。 The present invention also comprises at least a first aqueous droplet and at least a second aqueous droplet in an oil that may contain at least one surfactant, a fluorosurfactant in one embodiment, and a fluorocarbon oil in one embodiment. Provide an emulsion library that may contain, at least the first and at least the second droplets are uniform in size and contain different aqueous fluids and different library elements. The present invention also provides at least a first aqueous fluid that may contain at least a first element library, and at least a second aqueous fluid that may contain at least a second element library. Encapsulating each element of at least the first library into at least a first aqueous droplet in an immiscible fluorocarbon oil that may contain at least one fluorosurfactant and said at least the second library. By encapsulating each element of the above in at least a second aqueous droplet in an immiscible fluorocarbon oil that may contain at least one fluorosurfactant, at least the first and at least the second droplets. At least the first aqueous droplet and at least the first in an immiscible fluorocarbon oil which is uniform in size and can contain different aqueous fluids and different library elements, which can contain encapsulation and at least one fluorosurfactant. Provided is a method of forming an emulsion library, which may include pooling the aqueous droplets of 2 and thereby forming an emulsion library.

当業者は、本発明の方法及びシステムが任意の特定のタイプのサンプルに限定される必要はなく、本発明の方法及びシステムが任意のタイプの有機、無機、または生体分子とともに使用され得ることを認識するであろう(例えば、米国特許公開第20120122714号を参照されたい)。 Those skilled in the art will appreciate that the methods and systems of the invention need not be limited to any particular type of sample and that the methods and systems of the invention can be used with any type of organic, inorganic or biomolecule. You will recognize (see, eg, US Patent Publication No. 20120122714).

特定の実施形態では、サンプルは核酸標的分子を含み得る。核酸分子は、合成されたものでも、天然に存在する供給源に由来するものでもよい。一実施形態において、核酸分子は、タンパク質、脂質、及び非鋳型核酸などの様々な他の成分を含む生体サンプルから単離され得る。核酸標的分子は、動物、植物、細菌、真菌、または任意の他の細胞生物から得られた、任意の細胞物質から得られ得る。特定の実施形態において、核酸標的分子は、単一細胞から得られてもよい。本発明で使用する生体サンプルには、ウイルス粒子または調製物が含まれ得る。核酸標的分子は、生物から直接、または生物から得られる生体サンプル、例えば、血液、尿、脳脊髄液、精液、唾液、痰、糞、及び組織から得ることができる。いかなる組織または体液標本も、本発明で使用するための核酸の供給源として使用することができる。核酸標的分子は、初代培養細胞または細胞株などの培養細胞から単離することもできる。標的核酸が得られる細胞または組織は、ウイルスまたは他の細胞内病原体に感染していてもよい。サンプルは、生物学的標本、cDNAライブラリー、ウイルス、またはゲノムDNAから抽出された全RNAであってもよい。一般に、核酸は、Maniatis,et al.,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor,N.Y.,pp.280-281(1982)に記載されるもののような様々な技術によって生体サンプルから抽出することができる。核酸分子は、一本鎖、二本鎖、または一本鎖領域(例えば、ステム構造及びループ構造)を有する二本鎖であり得る。生物学的サンプルから得られた核酸は、典型的には、分析に適した断片を生成するために断片化され得る。標的核酸は、様々な機械的、化学的及び/または酵素的方法を使用して、所望の長さに断片化または剪断され得る。DNAは、超音波処理、例えば、Covaris法、DNaseへの短時間の暴露、または1つ以上の制限酵素の混合物もしくはトランスポゼースもしくはニッキング酵素の使用によってランダムに剪断することができる。RNAは、RNase、熱+マグネシウムへの短時間の暴露、または剪断によって断片化することができる。RNAはcDNAに変換してもよい。断片化を使用する場合、RNAは断片化の前または後にcDNAに変換してもよい。一実施形態では、生体サンプルからの核酸は、超音波処理によって断片化される。別の実施形態において、核酸は、水力剪断器具によって断片化される。一般に、個々の核酸標的分子は、約40塩基から約40kbであり得る。核酸分子は、一本鎖、二本鎖、または一本鎖領域(例えば、ステム構造及びループ構造)を有する二本鎖であり得る。本明細書に記載の生体サンプルは、洗剤または界面活性剤の存在下で均質化または分画することができる。緩衝液中の洗剤の濃度は、約0.05%~約10.0%であり得る。洗剤の濃度は、最大で洗剤が溶液に溶けたままである量でよい。一実施形態において、洗剤の濃度は、0.1%~約2%である。洗剤、特に非変性の刺激の少ないものは、サンプルを可溶化するように働き得る。洗剤はイオン性でも非イオン性でもよい。非イオン性洗剤の例には、Triton(商標)Xシリーズ(Triton(商標)X-100 t-Oct-C6H4--(OCH2--CH2)xOH、x=9-10、Triton(商標)X-100R、Triton(商標)X-114 x=7-8)などのtriton、オクチルグルコシド、ポリオキシエチレン(9)ドデシルエーテル、ジジトニン、IGEPAL(商標)CA630オクチルフェニルポリエチレングリコール、n-オクチル-ベータ-D-グルコピラノシド(betaOG)、n-ドデシル-ベータ、Tween(商標)20ポリエチレングリコールソルビタンモノラウレート、Tween(商標)80ポリエチレングリコールソルビタンモノオレエート、ポリドカノール、n-ドデシルベータ-D-マルトシド(DDM)、NP-40ノニルフェニルポリエチレングリコール、C12E8(オクタエチレングリコールn-ドデシルモノエーテル)、ヘキサエチレングリコールモノ-n-テトラデシルエーテル(C14E06)、オクチル-ベータ-チオグルコピラノシド(オクチルチオグルコシド、OTG)、エマルゲン、及びポリオキシエチレン10ラウリルエーテル(C12E10)が含まれる。イオン界面活性剤(アニオン性またはカチオン性)の例には、デオキシコール酸、ドデシル硫酸ナトリウム(SDS)、N-ラウロイルサルコシン、及びセチルトリメチルアンモニウムブロミド(CTAB)が含まれる。Chaps、両性イオン3-14、及び3-[(3-コールアミドプロピル)ジメチルアンモニオ]-1-プロパンスルホン酸などの両性イオン試薬も、本発明の精製スキームで使用することができる。尿素は、別の洗剤または界面活性剤の有無にかかわらず添加できることも考えられる。溶解または均質化溶液は、還元剤などの他の薬剤をさらに含んでいてもよい。そのような還元剤の例には、ジチオスレイトール(DTT)、β-メルカプトエタノール、DTE、GSH、システイン、システアミン、トリカルボキシエチルホスフィン(TCEP)、または亜硫酸の塩が含まれる。非常に短い断片または非常に長い断片を除去するために、核酸のサイズ選択を行うことができる。核酸断片は、当該技術分野で既知の任意の適切な方法を使用して、所望の数の断片を含み得る画分に分割することができる。各断片の断片サイズを制限する適切な方法は、当該技術分野で知られている。本発明の様々な実施形態において、断片のサイズは、約10~約100Kb以上に制限される。本発明における、または本発明に関するサンプルには、個々の標的タンパク質、タンパク質複合体、翻訳修飾を伴うタンパク質、及びタンパク質/核酸複合体が含まれ得る。タンパク質の標的にはペプチドが含まれ、酵素、ホルモン、ウイルスのカプシドタンパク質などの構造成分、及び抗体も含まれる。タンパク質標的は、合成されたものでも、天然に存在する供給源に由来するものでもよい。本発明のタンパク質標的は、脂質、非鋳型核酸、及び核酸を含む様々な他の成分を含む生体サンプルから単離され得る。タンパク質標的は、動物、細菌、真菌、細胞生物、及び単一細胞から得ることができる。タンパク質標的は、生物から直接、または血液、尿、脳脊髄液、精液、唾液、痰、糞、及び組織などの体液を含む、生物から得られる生体サンプルから得ることができる。タンパク質標的は、細胞及び組織の溶解物及び生化学的画分から取得することもできる。個々のタンパク質は、単離されたポリペプチド鎖である。タンパク質複合体には、2つ以上のポリペプチド鎖が含まれる。サンプルには、リン酸化、メチオニン酸化、脱アミド化、グリコシル化、ユビキチン化、カルバミル化、s-カルボキシメチル化、アセチル化、及びメチル化を含むがこれらに限定されない翻訳後修飾を有するタンパク質が含まれ得る。タンパク質/核酸複合体には、架橋または安定なタンパク質-核酸複合体が含まれる。個々のタンパク質、タンパク質複合体、翻訳修飾を有するタンパク質、及びタンパク質/核酸複合体の抽出または単離は、当該技術分野で既知の方法を使用して行われる。 In certain embodiments, the sample may comprise a nucleic acid target molecule. Nucleic acid molecules may be synthetic or derived from naturally occurring sources. In one embodiment, nucleic acid molecules can be isolated from biological samples containing various other components such as proteins, lipids, and non-template nucleic acids. Nucleic acid target molecules can be obtained from any cellular material obtained from animals, plants, bacteria, fungi, or any other cellular organism. In certain embodiments, the nucleic acid target molecule may be obtained from a single cell. The biological sample used in the present invention may contain viral particles or preparations. Nucleic acid target molecules can be obtained directly from or from biological samples obtained from the organism, such as blood, urine, cerebrospinal fluid, semen, saliva, sputum, feces, and tissues. Any tissue or body fluid specimen can be used as a source of nucleic acid for use in the present invention. Nucleic acid target molecules can also be isolated from cultured cells such as primary cultured cells or cell lines. The cell or tissue from which the target nucleic acid is obtained may be infected with a virus or other intracellular pathogen. The sample may be a biological specimen, a cDNA library, a virus, or total RNA extracted from genomic DNA. In general, nucleic acids are described in Maniatis, et al. , Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, N. et al. Y. , Pp. It can be extracted from a biological sample by various techniques such as those described in 280-281 (1982). Nucleic acid molecules can be single-stranded, double-stranded, or double-stranded with single-stranded regions (eg, stem and loop structures). Nucleic acid obtained from a biological sample can typically be fragmented to produce fragments suitable for analysis. The target nucleic acid can be fragmented or sheared to the desired length using a variety of mechanical, chemical and / or enzymatic methods. DNA can be randomly sheared by sonication, eg, Covaris method, short exposure to DNase, or the use of a mixture of one or more restriction enzymes or a transposase or nicking enzyme. RNA can be fragmented by RNase, short exposure to heat + magnesium, or shear. RNA may be converted to cDNA. When using fragmentation, RNA may be converted to cDNA before or after fragmentation. In one embodiment, nucleic acids from biological samples are fragmented by sonication. In another embodiment, the nucleic acid is fragmented by a hydraulic shear device. In general, individual nucleic acid target molecules can be from about 40 bases to about 40 kb. Nucleic acid molecules can be single-stranded, double-stranded, or double-stranded with single-stranded regions (eg, stem and loop structures). The biological samples described herein can be homogenized or fractionated in the presence of detergents or detergents. The concentration of detergent in the buffer can be from about 0.05% to about 10.0%. The concentration of the detergent may be at most the amount at which the detergent remains dissolved in the solution. In one embodiment, the detergent concentration is 0.1% to about 2%. Detergents, especially non-denaturing, mild ones, can act to solubilize the sample. The detergent may be ionic or nonionic. Examples of nonionic detergents include Triton ™ X-series (Triton ™ X-100 t-Oct-C6H4- (OCH2-CH2) xOH, x = 9-10, Triton ™ X- 100R, Triton ™ X-114 x = 7-8) and other triton, octyl glucoside, polyoxyethylene (9) dodecyl ether, diditonin, IGEPAL ™ CA630 octylphenyl polyethylene glycol, n-octyl-beta-D -Glucopyranoside (betaOG), n-dodecyl-beta, Tween ™ 20 polyethylene glycol sorbitan monolaurate, Tween ™ 80 polyethylene glycol sorbitan monooleate, polydocanol, n-dodecyl beta-D-maltoside (DDM), NP-40 nonylphenyl polyethylene glycol, C12E8 (octaethylene glycol n-dodecyl monoether), hexaethylene glycol mono-n-tetradecyl ether (C14E06), octyl-beta-thioglucopyranoside (octylthioglucoside, OTG), emalgen, And polyoxyethylene 10 lauryl ether (C12E10). Examples of ionic surfactants (anionic or cationic) include deoxycholic acid, sodium dodecyl sulfate (SDS), N-lauroyl sarcosine, and cetyltrimethylammonium bromide (CTAB). Zwitterionic reagents such as Chaps, zwitterion 3-14, and 3-[(3-colamidepropyl) dimethylammonio] -1-propanesulfonic acid can also be used in the purification schemes of the invention. It is also conceivable that urea can be added with or without another detergent or surfactant. The lysing or homogenizing solution may further contain other agents such as reducing agents. Examples of such reducing agents include salts of dithiothreitol (DTT), β-mercaptoethanol, DTE, GSH, cysteine, cysteamine, tricarboxyethylphosphine (TCEP), or sulfite. Nucleic acid size selection can be made to remove very short or very long fragments. Nucleic acid fragments can be divided into fractions that may contain the desired number of fragments using any suitable method known in the art. Suitable methods for limiting the fragment size of each fragment are known in the art. In various embodiments of the invention, the size of the fragment is limited to about 10 to about 100 Kb and above. Samples in or in the invention may include individual target proteins, protein complexes, proteins with translational modifications, and protein / nucleic acid complexes. Protein targets include peptides, including enzymes, hormones, structural components such as viral capsid proteins, and antibodies. The protein target may be synthetic or derived from a naturally occurring source. The protein targets of the invention can be isolated from biological samples containing lipids, non-template nucleic acids, and various other components including nucleic acids. Protein targets can be obtained from animals, bacteria, fungi, cell organisms, and single cells. Protein targets can be obtained directly from the organism or from biological samples obtained from the organism, including body fluids such as blood, urine, cerebrospinal fluid, semen, saliva, sputum, feces, and tissues. Protein targets can also be obtained from cell and tissue lysates and biochemical fractions. The individual protein is an isolated polypeptide chain. The protein complex comprises two or more polypeptide chains. Samples include proteins with post-translational modifications including, but not limited to, phosphorylation, methionine oxidation, deamidation, glycosylation, ubiquitination, carbamylation, s-carboxymethylation, acetylation, and methylation. It can be. Protein / nucleic acid complexes include cross-linked or stable protein-nucleic acid complexes. Extraction or isolation of individual proteins, protein complexes, proteins with translational modifications, and protein / nucleic acid complexes is performed using methods known in the art.

したがって、本発明は、サンプル液滴を形成することを含むことができる。液滴は、非混和性のキャリア流体に囲まれた水性液滴である。そのような液滴を形成する方法は、例えばLink et al.(米国特許出願第2008/0014589号、2008/0003142号、及び2010/0137163号)、Stone et al.(米国特許第7,708,949号及び米国特許出願第2010/0172803号)、Anderson et al.(RE41,780として再発行された米国特許第7,041,481号)、及びRaindance Technologies Inc.の欧州公開第EP2047910号に示される。それぞれの内容は、参照によりその全体が本明細書に組み込まれる。本発明は、ハイスループットマイクロ流体システム内で液滴を操作するためのシステム及び方法に関してもよい。マイクロ流体液滴は、分化した細胞をカプセル化することができ、細胞は溶解され、そのmRNAは、すべて液滴の内側で、表面にバーコード化されたオリゴdTプライマーを含む捕捉ビーズ上にハイブリダイズされる。バーコードは、PEGなどの柔軟な多原子リンカーを介して捕捉ビーズに共有結合される。好ましい実施形態において、液滴は、フルオロ界面活性剤(パーフルオロオクタノールなど)の添加によって破壊され、洗浄され、収集される。次いで、逆転写(RT)反応が行われ、各細胞のmRNAが、一意のバーコードが付けられ、mRNA捕捉ビーズに共有結合された第1の鎖のcDNAに変換される。その後、テンプレートスイッチング反応を介したユニバーサルプライマーは、RNA-Seqライブラリーを調製する従来のライブラリー調製プロトコールを使用して修正される。任意の特定の細胞からのすべてのmRNAには一意のバーコードが付けられているため、単一のライブラリーの配列が決定され、コンピューターによって解決され、どのmRNAがどの細胞に由来するかを決定する。このようにして、1回の配列決定実行で、数万(またはそれ以上)の識別可能なトランスクリプトームを同時に取得できる。オリゴヌクレオチド配列は、ビーズ表面上に生成され得る。これらのサイクル中に、ビーズを合成カラムから取り出し、プールし、質量によって4つの等しい部分に等分した。次いで、これらのビーズのアリコートを別の合成カラムに入れ、dG、dC、dT、またはdAホスホラミダイトのいずれかと反応させた。他の例では、より長いジヌクレオチド、トリヌクレオチド、またはオリゴヌクレオチドが使用され、他の例では、オリゴdTテールは、特定の標的(単数または複数)、すべてまたは特定のRNA捕捉のための任意の長さのランダム配列をプライムするために遺伝子特異的オリゴヌクレオチドに置き換えられる。このプロセスを12回繰り返し、合計412=16,777,216の一意のバーコード配列を作成した。これらのサイクルの完了時に、8サイクルの縮重オリゴヌクレオチド合成をすべてのビーズで行い、続いて30サイクルのdT添加を行った。他の実施形態では、縮重合成は省略、短縮(8サイクル未満)、または延長(8サイクル超)され、他では、dT付加の30サイクルが遺伝子特異的プライマー(単一の標的もしくは多数の標的)または縮重配列に置き換えられる。上述のマイクロ流体システムは、本発明の試薬送達システムマイクロ流体ライブラリープリンターまたは液滴ライブラリー印刷システムとみなされる。サンプル流体が、溶解試薬とバーコードを含む液滴発生器から、油を含むマイクロ流体出口チャネルを通って接合部に向かって流れるときに、液滴が形成される。定義された数の液滴に対応する、ロードされた試薬エマルションの定義された体積が、キャリア流体のフローストリームにオンデマンドで分配される。サンプル流体は、典型的には、超純水(例えば、カラムクロマトグラフィーにより得られた18メガオームの抵抗)、10mMのトリスHCl及び1mMのEDTA(TE)緩衝液、リン酸緩衝生理食塩水(PBS)、または酢酸緩衝液などの水生緩衝溶液を含んでもよい。核酸分子と生理学的に適合する任意の液体または緩衝液を使用することができる。キャリア流体は、サンプル流体と混和しないものを含んでもよい。キャリア流体は、非極性溶媒、デカン(例えば、テトラデカンまたはヘキサデカン)、フルオロカーボン油、シリコーン油、炭化水素などの不活性油、または別の油(例えば、鉱油)であり得る。キャリア流体は、表面張力を低下させる薬剤(界面活性剤)などの1つ以上の添加剤を含んでもよい。界面活性剤には、Tween、Span、フルオロ界面活性剤、及び水と比べて油に可溶性である他の薬剤が含まれる。一部の用途では、サンプル流体に第2の界面活性剤を追加することで性能が向上する。界面活性剤は、例えば、交差するチャネルに液滴を押し出したり注入したりするのに必要な剪断力を減らすことにより、液滴のサイズ、流れ、均一性の制御または最適化に役立つ。これは、液滴の量と周期性、または液滴が交差するチャネルに分かれる速度または頻度に影響を与え得る。さらに、界面活性剤は、フッ素化油中の水性エマルションを合体から安定化させる働きをすることができる。液滴は、水性油界面での表面張力を低下させることによって液滴を安定化させる界面活性剤に囲まれていてもよい。担体流体に添加することができる好ましい界面活性剤には、ソルビタンモノラウレート(Span20)、ソルビタンモノパルミテート(スパン40)、ソルビタンモノステアレート(スパン60)及びソルビタンモノオレエート(スパン80)を含むソルビタンベースのカルボン酸エステル(例えば、「Span」界面活性剤、FlukaChemika)、過フッ素化ポリエーテル(例えば、DuPont Krytox 157 FSL、FSM、及び/またはFSH)などの界面活性剤が含まれるが、これらに限定されない。使用できる非イオン性界面活性剤の他の非限定的な例には、ポリオキシエチレン化アルキルフェノール(例えば、ノニル-、p-ドデシル-、及びジノニルフェノール)、ポリオキシエチレン化直鎖アルコール、ポリオキシエチレン化ポリオキシプロピレングリコール、ポリオキシエチレン化メルカプタン、長鎖カルボン酸エステル(例えば、天然脂肪酸のグリセリル及びポリグリセリルエステル、プロピレングリコール、ソルビトール、ポリオキシエチレン化ソルビトールエステル、ポリオキシエチレングリコールエステルなど)及びアルカノールアミン(例えば、ジエタノールアミン-脂肪酸縮合物及びイソプロパノールアミン-脂肪酸縮合物)が含まれる。場合によっては、マイクロ流体システムを介して単一細胞配列決定ライブラリーを作成するための装置は、一定量が経時的に注入される容量駆動型の流れを提供する。流体チャネルの圧力は、注入率とチャネルの寸法の関数である。一実施形態では、デバイスは油/界面活性剤入口;分析物の入口;フィルター、mRNA捕捉マイクロビーズ及び溶解試薬の注入口;入口を接続するキャリア流体チャネル;抵抗器;液滴のピンチオフのための狭窄;ミキサー;及び液滴用の出口を提供する。一実施形態において、本発明は、マイクロ流体システムを介して単一細胞配列決定ライブラリーを作成するための装置であって、フィルター及びキャリア流体チャネルを含むことができ、前記キャリア流体チャネルがさらに抵抗器を含むことができる、油-界面活性剤入口;フィルター及びキャリア流体チャネルを含むことができ、前記キャリア流体チャネルが抵抗器をさらに含むことができる、分析物のための入口;フィルター及びキャリア流体チャネルを含むことができ、前記キャリア流体チャネルが抵抗器をさらに含むことができる、mRNA捕捉マイクロビーズ及び溶解試薬のための入口を含むことができ、前記キャリア流体チャネルは、調整可能または所定の流量で流れるキャリア流体を有し、各前記キャリア流体チャネルは、接合部でマージし、前記接合部は、液滴用の出口を含むミキサーに接続されている、装置を提供する。したがって、単一細胞RNA-seqのためのマイクロ流体システムのマイクロ流体フロースキームを介して単一細胞配列決定ライブラリーを作成するための装置が想定されている。1つは細胞懸濁液を保有し、もう1つは一意にバーコード化されたmRNA捕捉ビーズ、溶解緩衝液、ライブラリー調製試薬を保有する2つのチャネルが接合部で出会い、液滴あたり1つの細胞及び1つのビーズの率で不活性なキャリア油にすぐに共カプセル化される。各液滴では、ビーズのバーコードタグ付きオリゴヌクレオチドをcDNAテンプレートとして使用し、各mRNAに一意の細胞固有識別子がタグ付けされる。本発明はまた、マウス及びヒト細胞の混合物のDrop-Seqライブラリーの使用を包含する。キャリア流体は、キャリア流体中の界面活性剤がチャネル壁をコーティングするように、出口チャネルを通して流されてもよい。フルオロ界面活性剤は、揮発性フッ素化溶媒中で過フッ素化ポリエーテルDuPont Krytox 157 FSL、FSM、またはFSHを水酸化アンモニウム水溶液と反応させることによって調製できる。ロータリーエバポレーターで溶媒と残留水とアンモニアを除去できる。次に、界面活性剤をフッ素化油(例えば、フロリナート(3M))に溶解し(例えば、2.5重量%)、これをキャリア流体として機能させる。試薬液滴を生成するためのサンプル流体リザーバーの活性化は、オンデマンド機能を介した動的試薬送達(例えば、コンビナトリアルバーコード化)の概念に基づく。オンデマンド機能は、本明細書に記載されるように、送達液滴を一次液滴に放出するための様々な技術的能力の1つによって提供され得る。 Therefore, the invention can include forming sample droplets. The droplet is an aqueous droplet surrounded by an immiscible carrier fluid. Methods for forming such droplets include, for example, Link et al. (US Patent Application Nos. 2008/0014589, 2008/0003142, and 2010/0137163), Stone et al. (US Pat. No. 7,708,949 and US Patent Application No. 2010/0172803), Anderson et al. (US Pat. No. 7,041,481 reissued as RE41,780), and Raindance Technologies Inc. Shown in European Publication No. EP2047910. Each content is incorporated herein by reference in its entirety. The present invention may also relate to systems and methods for manipulating droplets within a high-throughput microfluidic system. Microfluidic droplets can encapsulate differentiated cells, the cells are lysed, and their mRNAs are all hybridized inside the droplets onto capture beads containing a surface-barcoded oligo dT primer. Be soybeans. The barcode is covalently attached to the capture beads via a flexible polyatomic linker such as PEG. In a preferred embodiment, the droplets are destroyed, washed and collected by the addition of a fluorosurfactant (such as perfluorooctanol). A reverse transcription (RT) reaction is then performed to convert the mRNA of each cell into the cDNA of the first strand, covalently attached to the mRNA capture beads, with a unique barcode. The universal primer via the template switching reaction is then modified using a conventional library preparation protocol to prepare the RNA-Seq library. All mRNAs from any particular cell have a unique barcode, so a single library is sequenced and computer-resolved to determine which mRNA comes from which cell. do. In this way, tens of thousands (or more) of identifiable transcriptomes can be obtained simultaneously in a single sequence determination run. Oligonucleotide sequences can be generated on the bead surface. During these cycles, beads were removed from the synthetic column, pooled and equally divided into 4 equal parts by mass. The aliquots of these beads were then placed in another synthetic column and reacted with either dG, dC, dT, or dA phosphoramidite. In other examples, longer dinucleotides, trinucleotides, or oligonucleotides are used, in other examples the oligo dT tail is a particular target (s), any for all or a particular RNA capture. Replaced with gene-specific oligonucleotides to prime random sequences of length. This process was repeated 12 times to create a unique barcode array with a total of 4 12 = 16,777,216. At the completion of these cycles, 8 cycles of degenerate oligonucleotide synthesis were performed on all beads, followed by 30 cycles of dT addition. In other embodiments, degenerate synthesis is omitted, shortened (less than 8 cycles), or extended (more than 8 cycles), in which 30 cycles of dT addition are gene-specific primers (single target or multiple targets). ) Or is replaced by a degenerate array. The microfluidic system described above is considered to be the reagent delivery system microfluidic library printer or droplet library printing system of the present invention. Droplets are formed as the sample fluid flows from the droplet generator containing the dissolving reagent and the barcode through the microfluidic outlet channel containing the oil towards the junction. A defined volume of loaded reagent emulsion, corresponding to a defined number of droplets, is distributed on demand to the flow stream of the carrier fluid. The sample fluid is typically ultrapure water (eg, 18 megaohm resistance obtained by column chromatography), 10 mM Tris HCl and 1 mM EDTA (TE) buffer, phosphate buffered saline (PBS). ), Or may contain an aquatic buffer solution such as acetate buffer. Any liquid or buffer that is physiologically compatible with the nucleic acid molecule can be used. The carrier fluid may include one that is immiscible with the sample fluid. The carrier fluid can be a non-polar solvent, a decane (eg, tetradecane or hexadecane), a fluorocarbon oil, a silicone oil, an inert oil such as a hydrocarbon, or another oil (eg, mineral oil). The carrier fluid may contain one or more additives such as agents that reduce surface tension (surfactants). Surfactants include Tween, Span, fluorosurfactants, and other agents that are more soluble in oil than water. In some applications, the addition of a second detergent to the sample fluid will improve performance. Surfactants help control or optimize droplet size, flow, and uniformity, for example by reducing the shear forces required to push or inject droplets into intersecting channels. This can affect the volume and periodicity of the droplets, or the speed or frequency at which the droplets split into intersecting channels. Further, the surfactant can serve to stabilize the aqueous emulsion in the fluorinated oil from coalescence. The droplets may be surrounded by a surfactant that stabilizes the droplets by reducing the surface tension at the aqueous oil interface. Preferred surfactants that can be added to the carrier fluid include sorbitan monolaurate (Span 20), sorbitan monopalmitate (span 40), sorbitan monostearate (span 60) and sorbitan monooleate (span 80). Includes surfactants such as sorbitan-based carboxylic acid esters (eg, "Span" surfactants, FlukaChemika), perfluorinated polyethers (eg, DuPont Krytox 157 FSL, FSM, and / or FSH). Not limited to these. Other non-limiting examples of nonionic surfactants that can be used include polyoxyethyleneylated alkylphenols (eg, nonyl-, p-dodecyl-, and dinonylphenols), polyoxyethyleneylated linear alcohols, polyoxy. Ethylene polyoxypropylene glycol, polyoxyethylene mercaptan, long-chain carboxylic acid esters (eg, natural fatty acids glyceryl and polyglyceryl esters, propylene glycol, sorbitol, polyoxyethylene sorbitol esters, polyoxyethylene glycol esters, etc.) and alkanols. Amines (eg, diethanolamine-fatty acid condensates and isopropanolamine-fatty acid condensates) are included. In some cases, a device for creating a single cell sequencing library via a microfluidic system provides a volume driven flow in which a fixed amount is injected over time. The pressure of the fluid channel is a function of the injection rate and the dimensions of the channel. In one embodiment, the device is an oil / surfactant inlet; an inlet for an analyte; a filter, an inlet for mRNA trapping microbeads and a lysing reagent; a carrier fluid channel connecting the inlet; a resistor; for pinch-off of droplets. Provides an outlet for stenosis; mixer; and droplets. In one embodiment, the invention is a device for creating a single cell sequencing library via a microfluidic system, which may include a filter and a carrier fluid channel, wherein the carrier fluid channel further resists. An oil-surfactant inlet, which can include a vessel; an inlet for an analyte, which can include a filter and a carrier fluid channel, wherein the carrier fluid channel can further include a resistor; a filter and a carrier fluid. The carrier fluid channel can include an inlet for mRNA capture microbeads and a lysis reagent, which can include a channel, the carrier fluid channel can further include a resistor, and the carrier fluid channel can be adjustable or a predetermined flow rate. Provided is an apparatus having carrier fluids flowing in, each said carrier fluid channel merging at a junction, the junction being connected to a mixer containing an outlet for droplets. Therefore, an apparatus for creating a single cell sequencing library via a microfluidic flow scheme of a microfluidic system for single cell RNA-seq is envisioned. Two channels meet at the junction, one carrying the cell suspension and the other holding the uniquely barcoded mRNA capture beads, lysis buffer, and library preparation reagents, one per droplet. It is immediately co-encapsulated in the inert carrier oil at the rate of one cell and one bead. In each droplet, a beaded barcode-tagged oligonucleotide is used as the cDNA template and each mRNA is tagged with a unique cell-specific identifier. The invention also includes the use of a Drop-Seq library of a mixture of mouse and human cells. The carrier fluid may be flushed through the outlet channel such that the surfactant in the carrier fluid coats the channel wall. Fluorosurfactants can be prepared by reacting the perfluorinated polyether DuPont Krytox 157 FSL, FSM, or FSH in an aqueous solution of ammonium hydroxide in a volatile fluorinated solvent. The solvent, residual water and ammonia can be removed with a rotary evaporator. Next, the surfactant is dissolved in a fluorinated oil (eg, Fluorinert (3M)) (eg, 2.5% by weight) to allow it to function as a carrier fluid. Activation of the sample fluid reservoir to generate reagent droplets is based on the concept of dynamic reagent delivery via on-demand features (eg, combinatorial bar coding). The on-demand function can be provided by one of a variety of technical capabilities for ejecting a delivery droplet into a primary droplet, as described herein.

本開示及び本明細書に引用する文書及び当該技術分野の知識から、流量、チャネル長、及びチャネル形状を開発することは当業者の範囲内である。ランダムまたは指定された試薬の組み合わせを含む液滴を確立し、オンデマンドで生成し、目的のサンプル/細胞/基板を含む「反応チャンバー」液滴とマージできる。複数の一意のタグを追加の液滴に組み込み、タグを一次液滴に固有になるように設計された固体支持体に結合することにより、一次液滴がさらされる条件をコード化し、記録することができる。例えば、核酸タグを連続してライゲーションして、条件及び同じ順序を反映する配列を作成することができる。または、タグを個別に追加して、固体支持体に追加することもできる。生物情報学的に情報を記録するために使用できる動的標識システムの非限定的な例は、2012年9月21日及び2012年11月29日に出願された「Compositions and Methods for Unique Labeling of Agents」と題する米国仮特許出願に見出すことができる。このようにして、2つ以上の液滴を様々な異なる条件にさらすことができ、液滴が条件にさらされるたびに、条件をコードする核酸が、それぞれが一緒にライゲーションされた液滴に、または液滴と結合した一意の個体支持体に追加され、異なる履歴を持つ液滴が後で組み合わされても、異なる核酸を介してそれぞれの液滴の条件が利用可能なままであるようにされる。複数の条件への暴露に対する応答を評価する方法の非限定的な例は、2012年9月21日出願の米国仮特許出願、及び2015年4月17日出願の「Systems and Methods for Droplet Tagging」と題する米国特許出願第15/303874号に見出すことができる。したがって、本発明において、または本発明に関して、分子バーコード(例えば、DNAオリゴヌクレオチド、フルオロフォアなど)の動的生成が、目的の様々な化合物(siRNA、CRISPRガイドRNA、試薬など)の制御可能な送達と独立してまたはそれと協調して存在し得ることが想定されている。例えば、一意の分子バーコードを1つのノズルアレイで作成し、個々の化合物または化合物の組み合わせを別のノズルアレイで作成できる。目的のバーコード/化合物は、次いで、CRISPR検出システムを含む液滴とマージできる。送達されたバーコードと送達された下流試薬(複数可)を関連付けるために、コンピューターログファイルの形式で電子記録を保持できる。この方法論は、本明細書に開示された方法に従って、サンプルの大きな集団を効率的にスクリーニングすることを可能にする。開示された発明のデバイス及び技術は、単一細胞(または単一分子)レベルでのデータ分解を必要とする研究を費用効果の高い方法で実施する努力を容易にする。油中水型エマルションとしてマイクロ流体チップで1つずつ生成される単分散水性液滴を使用して、さらに評価するための標的分子のサンプルを含む可能性のある個々のエマルション液滴への試薬のハイスループットかつ高解像度の送達となる。 It is within the skill of ordinary skill in the art to develop flow rates, channel lengths, and channel geometries from the present disclosure and the documents cited herein and knowledge of the art. Droplets containing random or specified reagent combinations can be established, generated on demand and merged with "reaction chamber" droplets containing the desired sample / cell / substrate. Encoding and recording the conditions under which a primary droplet is exposed by incorporating multiple unique tags into additional droplets and binding the tags to a solid support designed to be unique to the primary droplet. Can be done. For example, nucleic acid tags can be continuously ligated to create sequences that reflect the conditions and the same order. Alternatively, tags can be added individually to add to the solid support. Non-limiting examples of dynamic labeling systems that can be used to record bioinformatics are the "Composions and Methods for United Labeling of" filed September 21, 2012 and November 29, 2012. It can be found in the US provisional patent application entitled "Agents". In this way, two or more droplets can be exposed to a variety of different conditions, and each time the droplet is exposed to a condition, the nucleic acid encoding the condition is added to the droplet, each ligated together. Or added to a unique individual support bound to a droplet so that the conditions of each droplet remain available via different nucleic acids even if droplets with different histories are later combined. To. Non-limiting examples of methods for assessing response to exposure to multiple conditions are the US provisional patent application filed September 21, 2012, and the "Systems and Methods for Droplet Tagging" filed April 17, 2015. It can be found in US Patent Application No. 15/303874 entitled. Thus, in the present invention or with respect to the present invention, the dynamic generation of molecular barcodes (eg, DNA oligonucleotides, fluorophores, etc.) can control various compounds of interest (siRNA, CRISPR guide RNA, reagents, etc.). It is envisioned that it may exist independently of or in conjunction with delivery. For example, unique molecular barcodes can be created in one nozzle array and individual compounds or combinations of compounds can be created in another nozzle array. The barcode / compound of interest can then be merged with the droplet containing the CRISPR detection system. Electronic records can be retained in the form of computer log files to correlate the delivered barcode with the delivered downstream reagent (s). This methodology makes it possible to efficiently screen a large population of samples according to the methods disclosed herein. The devices and techniques of the disclosed invention facilitate efforts to carry out studies that require data degradation at the single cell (or single molecule) level in a cost-effective manner. Using monodisperse aqueous droplets produced one by one on a microfluidic chip as a water-in-oil emulsion, a reagent for individual emulsion droplets that may contain a sample of the target molecule for further evaluation. High throughput and high resolution delivery.

タンパク質の検出
本明細書に開示されるシステム、デバイス、及び方法は、特異的に構成されたポリペプチド検出アプタマーの組み込みを介して、核酸の検出に加えて、ポリペプチド(または他の分子)の検出にも適合され得る。ポリペプチド検出アプタマーは、上述のマスキング構築アプタマーとは異なる。まず、アプタマーは、1つ以上の標的分子に特異的に結合するように設計されている。一実施形態では、標的分子は標的ポリペプチドである。別の例示的な実施形態では、標的分子は、標的治療分子などの標的化学化合物である。SELEXなどの所与の標的に対して特異性を有するアプタマーを設計及び選択する方法は、当該技術分野で知られている。与えられた標的に対する特異性に加えて、アプタマーはさらにRNAポリメラーゼプロモーター結合部位を組み込むように設計されている。特定の例示的な実施形態において、RNAポリメラーゼプロモーターはT7プロモーターである。アプタマー結合が標的に結合する前に、RNAポリメラーゼ部位は、RNAポリメラーゼにアクセスできないか、さもなければ認識できない。しかしながら、アプタマーは、標的の結合時にアプタマーの構造がコンフォメーション変化を受け、RNAポリメラーゼプロモーターが露出するように構成される。RNAポリメラーゼプロモーターの下流のアプタマー配列は、RNAポリメラーゼによるトリガーRNAオリゴヌクレオチドの生成のためのテンプレートとして機能する。したがって、アプタマーのテンプレート部分は、所定のアプタマー及びその標的を識別するバーコードまたは他の識別配列をさらに組み込んでもよい。次いで、上述のガイドRNAを設計して、これらの特異的なトリガーオリゴヌクレオチド配列を認識することができる。ガイドRNAのトリガーオリゴヌクレオチドへの結合は、CRISPRエフェクタータンパク質を活性化し、続けてマスキング構築物を不活性化し、本明細書に記載されるように陽性の検出可能なシグナルを生成する。
Protein Detection The systems, devices, and methods disclosed herein include the detection of nucleic acids, as well as the detection of polypeptides (or other molecules), through the incorporation of specifically constructed polypeptide detection aptamers. It can also be adapted for detection. The polypeptide detection aptamer is different from the masking construction aptamer described above. First, aptamers are designed to specifically bind to one or more target molecules. In one embodiment, the target molecule is the target polypeptide. In another exemplary embodiment, the target molecule is a target chemical compound, such as a target therapeutic molecule. Methods of designing and selecting aptamers that have specificity for a given target, such as SELEX, are known in the art. In addition to specificity for a given target, aptamers are further designed to incorporate the RNA polymerase promoter binding site. In certain exemplary embodiments, the RNA polymerase promoter is the T7 promoter. Before the aptamer binding binds to the target, the RNA polymerase site cannot access or otherwise recognize the RNA polymerase. However, the aptamer is configured so that the structure of the aptamer undergoes a conformational change upon binding of the target, exposing the RNA polymerase promoter. The aptamer sequence downstream of the RNA polymerase promoter serves as a template for the generation of triggered RNA oligonucleotides by RNA polymerase. Therefore, the template portion of the aptamer may further incorporate a barcode or other discriminant sequence that identifies a given aptamer and its target. The guide RNAs described above can then be designed to recognize these specific trigger oligonucleotide sequences. Binding of the guide RNA to the trigger oligonucleotide activates the CRISPR effector protein, subsequently inactivating the masking construct and producing a positive detectable signal as described herein.

したがって、特定の例示的な実施形態では、本明細書に開示される方法は、サンプルまたはサンプルのセットを個々の個別のボリュームのセットに分配する追加のステップであって、各個々の個別のボリュームは、ペプチド検出アプタマー、CRISPRエフェクタータンパク質、1つ以上のガイドRNA、マスキング構築物を含む、追加のステップと、検出アプタマーの1つ以上の標的分子への結合を可能にするのに十分な条件下でサンプルまたはサンプルのセットをインキュベートする追加のステップと、を含み、対応する標的へのアプタマーの結合は、RNAポリメラーゼプロモーター結合部位の露出をもたらし、トリガーRNAの合成は、RNAポリメラーゼがRNAポリメラーゼプロモーター結合部位に結合することによって開始されるようにされる。 Thus, in certain exemplary embodiments, the method disclosed herein is an additional step of distributing a sample or a set of samples to a set of individual individual volumes, each individual individual volume. Contains additional steps including peptide detection aptamer, CRISPR effector protein, one or more guide RNAs, masking constructs, and conditions sufficient to allow binding of the detection aptamer to one or more target molecules. Including an additional step of incubating a sample or set of samples, binding of the aptamer to the corresponding target results in exposure of the RNA polymerase promoter binding site, and synthesis of the trigger RNA is performed by the RNA polymerase by the RNA polymerase promoter binding site. It is made to start by binding to.

別の例示的な実施形態では、アプタマーの結合により、アプタマーが標的ポリペプチドに結合すると、プライマー結合部位が露出し得る。例えば、アプタマーは、RPAプライマー結合部位を露出させてもよい。したがって、プライマーの追加または包含は、上で概説したRPA反応などの増幅反応に供給される。 In another exemplary embodiment, aptamer binding can expose the primer binding site when the aptamer binds to the target polypeptide. For example, the aptamer may expose the RPA primer binding site. Therefore, the addition or inclusion of primers is provided for amplification reactions such as the RPA reaction outlined above.

特定の例示的な実施形態において、アプタマーは、目的の標的に結合すると、二次構造を変化させ、一本鎖DNAの新しい領域を露出させ得るコンフォメーションスイッチングアプタマーであってよい。特定の例示的な実施形態において、一本鎖DNAのこれらの新しい領域は、ライゲーション、アプタマーを伸長させ、本明細書に開示される実施形態を用いて特異的に検出され得るより長いssDNA分子を生成するための基質として使用され得る。アプタマーの設計は、グルコースなどの低エピトープ標的の検出のための三元複合体とさらに組み合わせることができる(Yang et al.2015:pubs.acs.org/doi/abs/10.1021/acs.analchem.5b01634)。コンフォメーションシフトアプタマーと対応するガイドRNA(crRNA)の例を以下に示す。

Figure 2022513602000003
In certain exemplary embodiments, the aptamer may be a conformation switching aptamer that, upon binding to a target of interest, can alter secondary structure and expose new regions of single-stranded DNA. In certain exemplary embodiments, these new regions of single-stranded DNA extend ligation, aptamers, and longer ssDNA molecules that can be specifically detected using the embodiments disclosed herein. It can be used as a substrate to produce. Aptamer designs can be further combined with ternary complexes for the detection of low epitope targets such as glucose (Yang et al. 2015: pubs.ax.org/doi/abs/10.1021/acs.analcem). .5b01634). An example of a conformation shift aptamer and a corresponding guide RNA (crRNA) is shown below.
Figure 2022513602000003

増幅
特定の例示的な実施形態において、標的RNA及び/またはDNAは、CRISPRエフェクタータンパク質を活性化する前に増幅され得る。場合によっては、標的分子を含む液滴セットの形成に先立って増幅が行われる。他の実施形態は、標的分子を含む液滴セットの形成に引き続いて増幅を実行することを可能にし、したがって、標的分子を含む液滴中に核酸増幅試薬を含み得る。任意の適切なRNAまたはDNA増幅技術を使用することができる。特定の例示的な実施形態において、RNAまたはDNA増幅は等温増幅である。特定の例示的な実施形態では、等温増幅は、核酸配列に基づく増幅(NASBA)、リコンビナーゼポリメラーゼ増幅(RPA)、ループ媒介等温増幅(LAMP)、鎖置換増幅(SDA)、ヘリカーゼ依存性増幅(HDA)、またはニッキング酵素増幅反応(NEAR)であってよい。特定の例示的な実施形態では、非等温増幅方法を使用することができ、これには、限定はされないが、PCR、多重置換増幅(MDA)、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、または分岐増幅法(RAM)が含まれ得る。いくつかの好ましい実施形態において、RNAまたはDNA増幅はRPAまたはPCRである。
Amplification In certain exemplary embodiments, the target RNA and / or DNA can be amplified prior to activating the CRISPR effector protein. In some cases, amplification is performed prior to the formation of a droplet set containing the target molecule. Other embodiments allow the formation of a droplet set containing the target molecule to be followed by amplification, and thus the nucleic acid amplification reagent may be included in the droplet containing the target molecule. Any suitable RNA or DNA amplification technique can be used. In certain exemplary embodiments, RNA or DNA amplification is isothermal amplification. In certain exemplary embodiments, the isothermal amplification is nucleic acid sequence based amplification (NASBA), recombinase polymerase amplification (RPA), loop-mediated isothermal amplification (LAMP), chain substitution amplification (SDA), helicase-dependent amplification (HDA). ), Or a nicking enzyme amplification reaction (NEAR). In certain exemplary embodiments, non-isothermal amplification methods can be used, including but not limited to PCR, multiple substitution amplification (MDA), rolling circle amplification (RCA), ligase chain reaction (LCR). ), Or a branch amplification method (RAM). In some preferred embodiments, the RNA or DNA amplification is RPA or PCR.

特定の例示的な実施形態では、RNAまたはDNA増幅はNASBAであり、RNA/DNA二本鎖を生成するための配列特異的リバースプライマーによる標的RNAの逆転写で開始される。次いで、RNase Hを使用してRNAテンプレートを分解し、T7プロモーターなどのプロモーターを含むフォワードプライマーが結合して相補鎖の伸長を開始し、二本鎖DNA産物を生成する。次いで、RNAポリメラーゼプロモーターを介したDNAテンプレートの転写により、標的RNA配列のコピーが作成される。重要なことは、新しい標的RNAのそれぞれがガイドRNAによって検出できるため、アッセイの感度がさらに向上するである。ガイドRNAによる標的RNAの結合は、CRISPRエフェクタータンパク質の活性化をもたらし、方法は上に概説したように進む。NASBA反応には、約41℃などの適度な等温条件下で進行できるという追加の利点があり、臨床検査室から遠く離れた現場での早期の直接検出のために配備されたシステムやデバイスに適している。 In certain exemplary embodiments, RNA or DNA amplification is NASBA and is initiated by reverse transcription of the target RNA with a sequence-specific reverse primer to generate the RNA / DNA double strand. RNA templates are then degraded using RNase H and forward primers containing promoters such as the T7 promoter bind to initiate complementary strand elongation to produce double-stranded DNA products. Transcription of the DNA template via the RNA polymerase promoter then makes a copy of the target RNA sequence. Importantly, each of the new target RNAs can be detected by the guide RNA, further increasing the sensitivity of the assay. Binding of the target RNA by the guide RNA results in activation of the CRISPR effector protein, and the method proceeds as outlined above. The NASBA reaction has the added benefit of being able to proceed under moderate isothermal conditions, such as about 41 ° C, making it suitable for systems and devices deployed for early direct detection in the field far from the clinical laboratory. ing.

特定の他の例示的な実施形態では、リコンビナーゼポリメラーゼ増幅(RPA)反応を使用して標的核酸を増幅することができる。RPA反応は、配列特異的プライマーを二本鎖DNAの相同配列とペアリングできるリコンビナーゼを使用する。標的DNAが存在する場合、DNA増幅が開始され、熱サイクルや化学的融解などの他のサンプル操作は必要ない。RPA増幅システム全体は、乾燥した製剤として安定しており、冷蔵せずに安全に輸送できる。RPA反応は、37~42℃の最適反応温度の等温温度で実施することもできる。配列特異的プライマーは、検出される標的核酸配列を含む配列を増幅するように設計される。特定の例示的な実施形態では、T7プロモーターなどのRNAポリメラーゼプロモーターがプライマーの1つに加えられる。これにより、標的配列及びRNAポリメラーゼプロモーターを含む増幅された二本鎖DNA産物が得られる。RPA反応後または反応中に、二本鎖DNAテンプレートからRNAを生成するRNAポリメラーゼが追加される。増幅された標的RNAは、転じて、CRISPRエフェクターシステムによって検出できる。このようにして、本明細書に開示される実施形態を使用して標的DNAを検出することができる。RPA反応は、標的RNAの増幅にも使用できる。標的RNAは、最初に逆転写酵素を使用してcDNAに変換され、続いて第2鎖DNA合成が行われ、この時点で、上で概説されたようにRPA反応が進行する。 In certain other exemplary embodiments, the recombinase polymerase amplification (RPA) reaction can be used to amplify the target nucleic acid. The RPA reaction uses a recombinase capable of pairing a sequence-specific primer with a homologous sequence of double-stranded DNA. If the target DNA is present, DNA amplification is initiated and no other sample manipulation such as thermal cycle or chemical melting is required. The entire RPA amplification system is stable as a dry formulation and can be safely transported without refrigeration. The RPA reaction can also be carried out at an isothermal temperature of the optimum reaction temperature of 37-42 ° C. Sequence-specific primers are designed to amplify the sequence containing the detected target nucleic acid sequence. In certain exemplary embodiments, an RNA polymerase promoter, such as the T7 promoter, is added to one of the primers. This gives an amplified double-stranded DNA product containing the target sequence and the RNA polymerase promoter. RNA polymerase that produces RNA from the double-stranded DNA template is added after or during the RPA reaction. The amplified target RNA, in turn, can be detected by the CRISPR effector system. In this way, the target DNA can be detected using the embodiments disclosed herein. The RPA reaction can also be used to amplify the target RNA. The target RNA is first converted to cDNA using reverse transcriptase, followed by second-strand DNA synthesis, at which point the RPA reaction proceeds as outlined above.

したがって、特定の例示的な実施形態では、本明細書に開示されるシステムは増幅試薬を含むことができる。核酸の増幅に有用な異なる成分または試薬が本明細書に記載されている。例えば、本明細書に記載の増幅試薬は、Tris緩衝液などの緩衝液を含むことができる。Tris緩衝液は、例えば、1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、11mM、12mM、13mM、14mM、15mM、25mM、50mM、75mM、1Mなどの濃度を含むが、これらに限定されない任意の濃度で、所望の用途または使用において使用され得る。当業者は、本発明で使用するためのTrisなどの緩衝液の適切な濃度を決定することができるであろう。 Thus, in certain exemplary embodiments, the systems disclosed herein can include amplification reagents. Different components or reagents useful for nucleic acid amplification are described herein. For example, the amplification reagents described herein can include buffers such as Tris buffer. The Tris buffer contains concentrations such as, for example, 1 mM, 2 mM, 3 mM, 4 mM, 5 mM, 6 mM, 7 mM, 8 mM, 9 mM, 10 mM, 11 mM, 12 mM, 13 mM, 14 mM, 15 mM, 25 mM, 50 mM, 75 mM, 1 M and the like. , Any concentration, not limited to these, can be used in the desired application or use. One of ordinary skill in the art will be able to determine the appropriate concentration of buffer such as Tris for use in the present invention.

塩化マグネシウム(MgCl)、塩化カリウム(KCl)、または塩化ナトリウム(NaCl)などの塩は、核酸断片の増幅の改善のために、PCRなどの増幅反応に含めることができる。塩濃度は特定の反応と用途に依存するが、いくつかの実施形態では、特定のサイズの核酸断片が特定の塩濃度で最適な結果をもたらし得る。より大きな産物は、望ましい結果を得るために変更された塩濃度、通常はより低い塩を必要とし得るが、より小さな産物の増幅はより高い塩濃度でより良い結果を生み出し得る。当業者は、塩の存在及び/または濃度は、塩濃度の変化とともに、生物学的または化学的反応のストリンジェンシーを変化させ得ることを理解するであろう。したがって、本明細書に記載の本発明の反応に対する適切な条件を提供する任意の塩を使用できる。 Salts such as magnesium chloride (MgCl 2 ), potassium chloride (KCl), or sodium chloride (NaCl) can be included in amplification reactions such as PCR to improve the amplification of nucleic acid fragments. The salt concentration depends on the particular reaction and application, but in some embodiments, nucleic acid fragments of a particular size may give optimal results at a particular salt concentration. Larger products may require modified salt concentrations, usually lower salts, to obtain the desired results, while amplification of smaller products may produce better results at higher salt concentrations. Those skilled in the art will appreciate that the presence and / or concentration of salt can change the stringency of biological or chemical reactions with changes in salt concentration. Therefore, any salt can be used that provides suitable conditions for the reactions of the invention described herein.

生物学的または化学的反応の他の構成要素は、細胞内の物質の分析のために細胞を破壊または溶解するための細胞溶解成分を含み得る。細胞溶解成分としては、界面活性剤、NaCl、KCl、硫酸アンモニウム[(NHSO]などの上記の塩が挙げられ得るが、これらに限定されない。本発明に適切な界面活性剤には、Triton X-100、ドデシル硫酸ナトリウム(SDS)、CHAPS(3-[(3-コールアミドプロピル)ジメチルアンモニオ]-1-プロパンスルホネート)、エチルトリメチルアンモニウムブロミド、ノニルフェノキシポリエトキシルエタノール(NP-40)が含まれ得る。界面活性剤の濃度は、特定の用途に依存してもよく、場合によっては反応に固有であってもよい。増幅反応には、100nM、150nM、200nM、250nM、300nM、350nM、400nM、450nM、500nM、550nM、600nM、650nM、700nM、750nM、800nM、850nM、900nM、950nM、1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM、150mM、200mM、250mM、300mM、350mM、400mM、450mM、500mMなどの濃度を含むが、これらに限定されない本発明に適切な任意の濃度で使用されるdNTP及び核酸プライマーが含まれ得る。同様に、本発明に従って有用なポリメラーゼは、Taqポリメラーゼ、Q5ポリメラーゼなどを含む、当該技術分野で知られており、有用な、または本発明の任意の特定のまたは一般的なポリメラーゼであり得る。 Other components of a biological or chemical reaction may include cytolytic components for disrupting or lysing cells for analysis of intracellular substances. Examples of the cytolytic component include, but are not limited to, the above-mentioned salts such as surfactants, NaCl, KCl, and ammonium sulfate [(NH 4 ) 2 SO 4 ]. Surfactants suitable for the present invention include Triton X-100, sodium dodecyl sulfate (SDS), CHAPS (3-[(3-colamidepropyl) dimethylammonio] -1-propanesulfonate), ethyltrimethylammonium bromide. , Nonylphenoxypolyethoxylethanol (NP-40) may be included. The concentration of detergent may be specific to the particular application and, in some cases, specific to the reaction. For the amplification reaction, 100 nM, 150 nM, 200 nM, 250 nM, 300 nM, 350 nM, 400 nM, 450 nM, 500 nM, 550 nM, 600 nM, 650 nM, 700 nM, 750 nM, 800 nM, 850 nM, 900 nM, 950 nM, 1 mM, 2 mM, 3 mM, 4 mM, 5 mM. , 6 mM, 7 mM, 8 mM, 9 mM, 10 mM, 20 mM, 30 mM, 40 mM, 50 mM, 60 mM, 70 mM, 80 mM, 90 mM, 100 mM, 150 mM, 200 mM, 250 mM, 300 mM, 350 mM, 400 mM, 450 mM, 500 mM, etc. , But may include dNTPs and nucleic acid primers used at any concentration suitable for the present invention. Similarly, polymerases useful in accordance with the present invention can be any particular or general polymerase known in the art and useful or of the present invention, including Taq polymerase, Q5 polymerase and the like.

いくつかの実施形態では、本明細書に記載されている増幅試薬は、ホットスタート増幅での使用に適していてもよい。いくつかの実施形態では、アダプター分子またはオリゴの二量体化を低減または排除するため、またはさもなければ不要な増幅産物またはアーティファクトを防止して、最適な所望の産物の増幅を得るために、ホットスタート増幅が有益であり得る。増幅に使用するための本明細書に記載の多くのコンポーネントは、ホットスタート増幅でも使用できる。いくつかの実施形態では、ホットスタート増幅での使用に適した試薬またはコンポーネントを、必要に応じて、1つ以上の構成コンポーネントの代わりに使用することができる。例えば、特定の温度または他の反応条件で所望の活性を示すポリメラーゼまたは他の試薬を使用することができる。いくつかの実施形態では、ホットスタート増幅での使用のために設計または最適化された試薬が使用されてもよく、例えば、ポリメラーゼは転位後または特定の温度に達した後に活性化され得る。そのようなポリメラーゼは、抗体ベースまたはアプタマーベースであり得る。本明細書に記載のポリメラーゼは当該技術分野において公知である。そのような試薬の例には、ホットスタートポリメラーゼ、ホットスタートdNTP、及び光ケージdNTPが含まれ得るが、これらに限定されない。そのような試薬は当該技術分野で知られており、入手可能である。当業者は、個々の試薬に適した最適温度を決定することができるであろう。核酸の増幅は、特定の熱サイクル機構または装置を使用して行うことができ、単一の反応または大量に行うことができるため、任意の所望の数の反応を同時に行うことができる。場合によっては、液滴内で、または液滴形成の前に、増幅を実行することができる。いくつかの実施形態では、増幅はマイクロ流体デバイスまたはロボットデバイスを使用して実行するか、手動で温度を変更して目的の増幅を達成することで実行できる。いくつかの実施形態では、特定の用途や材料に最適な反応条件を得るために、最適化が行われてもよい。当業者は、十分な増幅を得る反応条件を理解し、最適化することができるであろう。 In some embodiments, the amplification reagents described herein may be suitable for use in hot start amplification. In some embodiments, to reduce or eliminate dimerization of the adapter molecule or oligo, or to prevent unwanted amplification products or artifacts, to obtain optimal desired product amplification. Hot start amplification can be beneficial. Many of the components described herein for use in amplification can also be used in hot start amplification. In some embodiments, reagents or components suitable for use in hot start amplification can be used in place of one or more components, if desired. For example, polymerases or other reagents that exhibit the desired activity at specific temperatures or other reaction conditions can be used. In some embodiments, reagents designed or optimized for use in hot start amplification may be used, for example, the polymerase can be activated after rearrangement or after reaching a particular temperature. Such polymerases can be antibody-based or aptamer-based. The polymerases described herein are known in the art. Examples of such reagents may include, but are not limited to, hot start polymerases, hot start dNTPs, and optical cage dNTPs. Such reagents are known and available in the art. One of ordinary skill in the art will be able to determine the optimum temperature suitable for the individual reagent. Amplification of nucleic acids can be carried out using a particular thermodynamic mechanism or device and can be carried out in a single reaction or in large quantities, so that any desired number of reactions can be carried out simultaneously. In some cases, amplification can be performed within the droplet or prior to droplet formation. In some embodiments, amplification can be performed using a microfluidic device or robotic device, or by manually changing the temperature to achieve the desired amplification. In some embodiments, optimization may be performed to obtain optimal reaction conditions for a particular application or material. One of ordinary skill in the art will be able to understand and optimize the reaction conditions to obtain sufficient amplification.

場合によっては、核酸増幅試薬には、リコンビナーゼポリメラーゼ増幅(RPA)試薬、核酸配列ベース増幅(NASBA)試薬、ループ媒介等温増幅(LAMP)試薬、鎖置換増幅(SDA)試薬、ヘリカーゼ依存性増幅(HDA)試薬、ニッキング酵素増幅反応(NEAR)試薬、RT-PCR試薬、多重置換増幅(MDA)試薬、ローリングサークル増幅(RCA)試薬、リガーゼ連鎖反応(LCR)試薬、分岐増幅法(RAM)試薬、トランスポゼースベースの増幅試薬、またはプログラム可能なCRISPRニッキング増幅(PCNA)試薬が含まれる。特定の実施形態において、本発明の方法またはシステムによるDNAの検出は、検出の前に(増幅された)DNAのRNAへの転写を必要とする。 In some cases, nucleic acid amplification reagents include recombinantase polymerase amplification (RPA) reagents, nucleic acid sequence-based amplification (NASBA) reagents, loop-mediated isothermal amplification (LAMP) reagents, chain substitution amplification (SDA) reagents, and helicase-dependent amplification (HDA). ) Reagent, Nicking Enzyme Amplification Reaction (NEAR) Reagent, RT-PCR Reagent, Multiple Substitution Amplification (MDA) Reagent, Rolling Circle Amplification (RCA) Reagent, Rigase Chain Reaction (LCR) Reagent, Branch Amplification (RAM) Reagent, Transposase Includes a base amplification reagent, or a programmable CRISPR Nicking Amplification (PCNA) reagent. In certain embodiments, detection of DNA by the methods or systems of the invention requires transcription of the (amplified) DNA into RNA prior to detection.

本発明の検出方法が、核酸増幅及び検出手順を様々な組み合わせで含み得ることは明らかであろう。検出される核酸は、DNA及びRNAを含むがこれらに限定されない任意の天然に存在する核酸または合成核酸であり得、検出可能な中間産物を提供するために任意の適切な方法によって増幅され得る。中間産物の検出は、直接的または付随的活性により検出可能なシグナル部分を生成するCasタンパク質の結合及び活性化を含むがこれらに限定されない任意の適切な方法によって行うことができる。 It will be clear that the detection methods of the present invention may include nucleic acid amplification and detection procedures in various combinations. The nucleic acid detected can be any naturally occurring or synthetic nucleic acid, including but not limited to DNA and RNA, which can be amplified by any suitable method to provide a detectable intermediate product. Detection of intermediates can be carried out by any suitable method including, but not limited to, binding and activation of Cas proteins that produce detectable signaling moieties by direct or incidental activity.

検出可能な陽性シグナルの増幅及び/または増強
特定の例示的な実施形態では、検出可能な陽性シグナルをさらに増幅するさらなる改変が導入され得る。例えば、活性化CRISPRエフェクタータンパク質の付随的活性化は、二次標的または追加のガイド配列、またはその両方を生成するために使用され得る。一実施形態では、反応溶液は、高濃度でスパイクされた二次標的を含む。二次標的は、一次標的(すなわち、アッセイが検出するように設計されている標的)とは異なる場合があり、場合によっては、すべての反応ボリュームにわたって共通であり得る。二次標的のための二次ガイド配列は、例えば、RNAループを持つヘアピンなどの二次構造的特徴によって保護され、第2の標的またはCRISPRエフェクタータンパク質に結合できなくされていてもよい。活性化されたCRISPRエフェクタータンパク質による保護基の切断(すなわち、溶液中の一次標的(複数可)との複合体の形成による活性化後)及び溶液中の遊離CRISPRエフェクタータンパク質との複合体の形成及びスパイクされた二次標的からの活性化。特定の他の例示的な実施形態では、同様の概念が、二次標的配列に対する第2のガイド配列とともに使用される。二次標的配列は、二次標的上の構造的特徴または保護基により保護され得る。二次標的からの保護基の切断により、追加のCRISPRエフェクタータンパク質/第2のガイド配列/二次標的複合体が形成される。さらに別の例示的な実施形態では、一次標的(複数可)によるCRISPRエフェクタータンパク質の活性化を使用して、保護されたまたは環状化されたプライマーを切断することができ、次いで、これを放出して、本明細書に開示されるような等温増幅反応を、二次ガイド配列、二次標的配列、またはその両方をコードするテンプレート上で実行する。この増幅されたテンプレートのその後の転写により、より多くの二次ガイド配列及び/または二次標的配列が生成され、その後、追加のCRISPRエフェクタータンパク質の付随的活性化が続く。
Amplification and / or Enhancement of Detectable Positive Signals In certain exemplary embodiments, further modifications can be introduced that further amplify the detectable positive signal. For example, concomitant activation of the activated CRISPR effector protein can be used to generate secondary targets and / or additional guide sequences. In one embodiment, the reaction solution comprises a high concentration of spiked secondary targets. The secondary target can be different from the primary target (ie, the target designed to be detected by the assay) and in some cases can be common across all reaction volumes. The secondary guide sequence for the secondary target may be protected by secondary structural features such as, for example, a hairpin with an RNA loop, making it incapable of binding to the secondary target or CRISPR effector protein. Cleavage of the protecting group by the activated CRISPR effector protein (ie, after activation by forming a complex with the primary target (s) in solution) and forming a complex with the free CRISPR effector protein in solution and Activation from spiked secondary targets. In certain other exemplary embodiments, a similar concept is used with a second guide sequence for the secondary target sequence. The secondary target sequence can be protected by structural features or protecting groups on the secondary target. Cleavage of the protecting group from the secondary target forms an additional CRISPR effector protein / second guide sequence / secondary target complex. In yet another exemplary embodiment, activation of the CRISPR effector protein by the primary target (s) can be used to cleave the protected or cyclized primer, which is then released. The isothermal amplification reaction as disclosed herein is then performed on a template encoding a secondary guide sequence, a secondary target sequence, or both. Subsequent transcription of this amplified template produces more secondary guide sequences and / or secondary target sequences, followed by concomitant activation of additional CRISPR effector proteins.

方法
一態様では、本明細書に開示される実施形態は、本明細書に記載のシステムを使用して、サンプル中の標的核酸を検出する方法を対象とする。本明細書に開示される方法は、いくつかの実施形態において、第1のセットの液滴を生成するステップであって、第1のセットの液滴における各液滴は、少なくとも1つの標的分子及び光学バーコードを含む、ステップと、第2のセットの液滴を生成ステップであって、第2のセットの液滴の各液滴は、RNA標的エフェクタータンパク質及び対応する標的分子に結合するように設計された1つ以上のガイドRNA、マスキング構築物、及び任意選択で光学バーコードを含む検出CRISPR系を含む、ステップを含むことができる。第1及び第2のセットの液滴は、典型的には、第1及び第2のセットの液滴を混合または攪拌することにより、液滴のプールに組み合わされる。次いで、液滴のプールは、マイクロウェルのアレイと、マイクロウェルの下の少なくとも1つのフローチャネルとを含むマイクロ流体デバイス上に流されることができ、マイクロウェルは、少なくとも2つの液滴を捕捉するサイズに設定され、各マイクロウェルで捕捉された液滴の光学バーコードを検出し、各マイクロウェルで捕捉された液滴をマージして、各マイクロウェルで形成されたマージ液滴にし、マージ液滴の少なくともサブセットは、検出CRISPR系及び標的配列を含み、検出反応を開始して、1つ以上の時間間隔で各マージ液滴の検出可能なシグナルを測定する。
Methods In one aspect, the embodiments disclosed herein are directed to a method of detecting a target nucleic acid in a sample using the system described herein. The method disclosed herein is, in some embodiments, a step of producing a first set of droplets, where each droplet in the first set of droplets is at least one target molecule. And in the step of generating a second set of droplets, including an optical bar code, each droplet of the second set of droplets binds to the RNA target effector protein and the corresponding target molecule. The steps can include one or more guide RNAs designed for, a masking construct, and optionally a detection CRISPR system including an optical bar code. The first and second sets of droplets are typically combined into a pool of droplets by mixing or stirring the first and second sets of droplets. A pool of droplets can then be flushed onto a microfluidic device that includes an array of microwells and at least one flow channel beneath the microwells, which captures at least two droplets. Set to size, it detects the optical bar code of the droplets captured in each microwell and merges the droplets captured in each microwell into a merged droplet formed in each microwell, the merged liquid. At least a subset of the droplets comprises the detection CRISPR system and the target sequence, the detection reaction is initiated and the detectable signal of each merged droplet is measured at one or more time intervals.

液滴の生成
第1のセットの液滴の生成に関して、第1のセットの液滴を生成する一態様において、各第1の液滴は検出CRISPR系を含み、検出CRISPR系は、RNA標的エフェクタータンパク質と、対応する標的分子に結合するように設計された1つ以上のガイドRNAと、RNAベースのマスキング構築物と、任意選択の本明細書に記載の光学バーコードとを含む。特定の実施形態では、第2のセットの液滴を生成するステップにおいて、第2のセットの各液滴が、少なくとも1つの標的分子と、任意選択の本明細書で提供される光学バーコードを含む。
Droplet Generation With respect to the generation of the first set of droplets, in one aspect of generating the first set of droplets, each first droplet comprises a detection CRISPR system, the detection CRISPR system is an RNA target effector. Includes a protein, one or more guide RNAs designed to bind to the corresponding target molecule, RNA-based masking constructs, and optional optical barcodes as described herein. In certain embodiments, in the step of producing a second set of droplets, each droplet in the second set has at least one target molecule and an optional optical barcode provided herein. include.

第1のセットの液滴及び第2のセットの液滴の生成に続いて、第1のセットの液滴及び第2のセットの液滴は、液滴のプールに組み合わされる。組み合わせることは、第1及び第2のセットを組み合わせる任意の手段によって行うことができる。1つの例示的な実施形態において、液滴のセットは混合されて液滴のプールに組み合わされる。 Following the generation of the first set of droplets and the second set of droplets, the first set of droplets and the second set of droplets are combined into a pool of droplets. The combination can be done by any means of combining the first and second sets. In one exemplary embodiment, the set of droplets is mixed and combined into a pool of droplets.

液滴のプールが生成されると、液滴のプールを流すステップが実施される。液滴のプールの流れは、複数のマイクロウェルを含むマイクロ流体デバイスに液滴をロードすることによって実施される。マイクロウェルは少なくとも2つの液滴を捕捉するサイズである。任意選択で、ローディングに続いて、界面活性剤が洗い流される。 Once the droplet pool is created, the step of flushing the droplet pool is performed. The flow of a pool of droplets is carried out by loading the droplets into a microfluidic device containing multiple microwells. Microwells are sized to capture at least two droplets. Optionally, the surfactant is washed away following loading.

液滴がマイクロウェルアレイにロードされると、各マイクロウェルで捕捉された液滴の光学バーコードを検出するステップが実施される。場合によっては、光学バーコードが蛍光バーコードである場合、光学バーコードの検出は、低倍率蛍光スキャンによって実施される。光学バーコードの種類に関係なく、各液滴のバーコードは一意であるため、各液滴の内容物を識別できる。検出方法は、使用する光学バーコードのタイプに応じて選択される。次いで、各マイクロウェルに含まれる液滴がマージされる。電界を印加することにより、マージを実施することができる。マージ液滴の少なくともサブセットは、検出CRISPR系及び標的配列を含む。 Once the droplets are loaded into the microwell array, a step is performed to detect the optical barcode of the droplets captured in each microwell. In some cases, if the optical bar code is a fluorescent bar code, the detection of the optical bar code is performed by a low magnification fluorescent scan. Regardless of the type of optical barcode, the barcode of each droplet is unique, so that the contents of each droplet can be identified. The detection method is selected according to the type of optical barcode used. The droplets contained in each microwell are then merged. The merge can be performed by applying an electric field. At least a subset of the merged droplets contain the detection CRISPR system and the target sequence.

液滴のマージ後、検出反応が開始される。いくつかの実施形態では、検出反応を開始することは、マージ液滴をインキュベートすることを含む。検出反応に続いて、マージ液滴は、光学的アッセイに供される。これは、場合によっては、アッセイスコアを生成するための低倍率蛍光スキャンである。 After merging the droplets, the detection reaction begins. In some embodiments, initiating the detection reaction involves incubating the merged droplet. Following the detection reaction, the merged droplets are subjected to an optical assay. This is, in some cases, a low magnification fluorescent scan to generate an assay score.

いくつかの実施形態では、この方法は、標的分子を増幅するステップを含むことができる。標的分子の増幅は、第1のセットの液滴の生成前または生成後に行うことができる。 In some embodiments, the method can include the step of amplifying the target molecule. Amplification of the target molecule can be performed before or after the formation of the first set of droplets.

さらに別の態様において、本明細書に開示される実施形態は、ポリペプチドを検出するための方法を対象とする。ポリペプチドの検出方法は、上述の標的核酸の検出方法と同様である。しかしながら、ペプチド検出アプタマーも含まれる。ペプチド検出アプタマーは、上述のように機能し、標的ポリペプチドに結合するとトリガーオリゴヌクレオチドの生成を促進する。ガイドRNAはトリガーオリゴヌクレオチドを認識し、それによってCRISPRエフェクタータンパク質を活性化するように設計されている。活性化されたCRISPRエフェクタータンパク質によるマスキング構築物の非活性化は、検出可能な陽性シグナルのマスキング解除、放出、または生成をもたらす。 In yet another embodiment, the embodiments disclosed herein are directed to methods for detecting polypeptides. The method for detecting a polypeptide is the same as the method for detecting a target nucleic acid described above. However, peptide detection aptamers are also included. Peptide detection aptamers function as described above and, upon binding to the target polypeptide, promote the production of trigger oligonucleotides. Guide RNAs are designed to recognize trigger oligonucleotides and thereby activate CRISPR effector proteins. Deactivation of masking constructs with activated CRISPR effector proteins results in unmasking, release, or production of detectable positive signals.

レポーター構築物(蛍光タンパク質など)を利用した多重検出診断では、標的配列を迅速に検出し、薬剤耐性SNPを診断し、微生物種の菌株とサブタイプを区別できる。例えば、微生物種の1つ以上の菌株の存在についてサンプルを評価する場合、サンプルからの一連の標的分子は、第2のセットの液滴に含まれる一連のCRISPR系を利用して評価され、各CRISPR系には様々なガイドRNAが含まれる。第1のセットの液滴と第2のセットの液滴を組み合わせた後、組み合わせを迅速に繰り返し試験する。試験する各標的分子は、マイクロプレートウェルに配置される。水系及び油の入力チャネルを使用して、スクリーニング対象の標的分子を含む単分散液滴を形成することができる。次いで、標的分子の液滴がマイクロ流体デバイスにロードされる。各標的分子はバーコードで標識されている。2つ以上の液滴がマージされる場合、組み合わされた光学バーコードは、マージ液滴に存在する標的分子及び/またはCRISPR系を識別する。バーコードは、光または蛍光顕微鏡で視覚化された光学的に検出可能なバーコード、またはオフチップで検出されるオリゴヌクレオチドバーコードである。 Multiple detection diagnostics using reporter constructs (such as fluorescent proteins) can rapidly detect target sequences, diagnose drug-resistant SNPs, and distinguish between strains and subtypes of microbial species. For example, when evaluating a sample for the presence of one or more strains of a microbial species, a series of target molecules from the sample are evaluated using a series of CRISPR systems contained in a second set of droplets, each The CRISPR system contains various guide RNAs. After combining the first set of droplets and the second set of droplets, the combination is quickly and repeatedly tested. Each target molecule to be tested is placed in a microplate well. Aqueous and oil input channels can be used to form monodisperse droplets containing the target molecule to be screened. Droplets of the target molecule are then loaded onto the microfluidic device. Each target molecule is labeled with a barcode. When two or more droplets are merged, the combined optical barcode identifies the target molecule and / or the CRISPR system present in the merged droplet. Barcodes are optically detectable barcodes visualized with a light or fluorescence microscope, or oligonucleotide barcodes detected off-chip.

本明細書に記載されるように、ガイドRNAが標的とされる標的分子を含むサンプルは、1つのセットの液滴にロードされ、ガイドRNA及びCRISPR系を含む液滴(複数可)とマージされる。CRISPR系液滴に組み込まれたレポーター系は、マスキング構築物で光学的に検出可能なマーカー(蛍光タンパク質など)を発現する。液滴のセットは、エフェクタータンパク質と、対応する標的分子に結合するように設計された1つ以上のガイドRNAと、RNAベースのマスキング構築物と、を含むCRISPR系を含む。液滴がマージされた後、各マイクロウェルを光学的にスキャンして光学バーコードを読み取ることにより、各ウェル内の分子種の同一性を決定できる。レポーターシステムの光学測定は、バーコードの光学スキャンと同時に行うことができる。したがって、このコンビナトリアルスクリーニングシステムを使用すると、実験データの収集と分子種の同定を同時に行うことができる。 As described herein, a sample containing a target molecule targeted by a guide RNA is loaded into a set of droplets and merged with the droplet (s) containing the guide RNA and CRISPR system. To. The reporter system incorporated into the CRISPR system droplet expresses an optically detectable marker (such as fluorescent protein) in the masking construct. The set of droplets comprises a CRISPR system that includes an effector protein, one or more guide RNAs designed to bind to the corresponding target molecule, and an RNA-based masking construct. After the droplets have been merged, the identity of the molecular species within each well can be determined by optically scanning each microwell and reading the optical barcode. Optical measurements of the reporter system can be performed at the same time as the optical scan of the barcode. Therefore, this combinatorial screening system can be used to collect experimental data and identify molecular species at the same time.

場合によっては、マイクロ流体デバイスは、画像化の前に一定期間インキュベートされ、複数の時点で画像化され、経時的なレポーターの測定量の変化を追跡する。さらに、いくつかの実験では、マージ液滴は、オフチップ評価のためにマイクロ流体デバイスから溶出される(例えば、参照によりすべての目的のためにその全体が本明細書に組み込まれる、国際公開第WO2016/149661号を参照されたい。溶出は特に[0056]~[0059]で論じられる)。開示された処理戦略により、何百万もの液滴の並行処理は、コンビナトリアルスクリーニングに必要な規模に達する。さらに、液滴のナノリットルボリュームにより、スクリーニングに必要な化合物の消費量が削減される。本開示は、光学バーコード及び大きな固定位置空間アレイにおける液滴の並行操作を組み込んで、液滴の同一性をアッセイ結果と関連付ける。本システムの独自の利点は、2nLのアッセイ容量でスクリーニングされた化合物の使用を最小限に抑えることである。本明細書でのプラットフォームは、液滴マイクロ流体システムのハイスループットの可能性を活用し、化合物のペアの組み合わせを構築するために必要な決定論的な液体処理操作をマイクロウェルデバイスで液滴のランダムなペアの並列マージと置き換える。この方法の独自の利点は、ハイスループットで手動で操作できることと、マイクロウェルでのアッセイの小型化により、少量のサンプルを使用できることである。SHEROCK技術と組み合わせると、この方法は、より小さなサンプルサイズを利用して大規模に多重化できる強力な検出技術を提供する。 In some cases, the microfluidic device is incubated for a period of time prior to imaging and imaged at multiple time points to track changes in reporter measurements over time. In addition, in some experiments, the merged droplets are eluted from the microfluidic device for off-chip evaluation (eg, which is incorporated herein by reference in its entirety for all purposes). See WO2016 / 149661; elution is specifically discussed in [0056]-[0059]). With the disclosed processing strategies, parallel processing of millions of droplets reaches the scale required for combinatorial screening. In addition, the nanoliter volume of the droplets reduces the consumption of compounds required for screening. The present disclosure incorporates parallel manipulation of droplets in optical barcodes and large fixed position space arrays to correlate droplet identity with assay results. A unique advantage of this system is that it minimizes the use of compounds screened for 2nL assay volumes. The platform herein takes advantage of the high throughput potential of droplet microfluidic systems and performs the deterministic liquid processing operations required to build combinations of compound pairs in a microwell device. Replace with parallel merging of random pairs. The unique advantages of this method are high throughput and manual manipulation, and the miniaturization of the assay in microwells allows the use of small samples. Combined with SHEROCK technology, this method provides a powerful detection technology that can be multiplexed on a large scale utilizing smaller sample sizes.

本明細書の技法は、入力化合物のセットのすべての対の組み合わせを3つのステップで試験する処理プラットフォームを提供する。まず、標的分子がカラーバーコードと組み合わされる(2、3、4、またはそれ以上の蛍光色素の一意の比率)。標的分子は、蛍光色素(例えば、赤、緑、青など)の比率によってバーコード化され得る。サンプル処理に続いて、標的分子は、好ましくは約1ナノリットルのサイズの油滴中の水中に乳化される。いくつかの実施形態では、液滴を安定させるために界面活性剤を含ませることができる。標準的なマルチチャネルマイクロピペット技術を使用して、液滴を1つのプールに組み合わせることができる。CRISPR系、蛍光色素の比率を使用する任意選択の光学バーコード、及びRNAマスキング化合物を含む第2のセットの液滴が調製される。第1のセットと第2のセットの液滴は1つの大きなプールに混合され、その後、各マイクロウェルが2つの液滴をランダムに捕捉するように、液滴がマイクロウェルアレイにロードされる。いくつかの実施形態では、マイクロウェルの交差汚染と蒸発を制限するために、ロード後のマイクロウェルアレイをガラス基板に密閉する。場合によっては、マイクロウェルアレイは機械的クランプによってアセンブリに固定される。各液滴の内容物は、識別された第1のセット及び第2のセットの液滴と事前に混合された2、3、4、またはそれ以上の蛍光色素の一意の比率から生じる蛍光バーコードによってコード化される。低倍率(2~4倍)の落射蛍光顕微鏡は、各液滴及び/またはウェルの内容物を識別するために使用できる。次に、各ウェルの2つの液滴をマージし、高電圧AC電界を印加して液滴のマージを誘導する。マージに続いて、SHERLOCK反応が開始され、いくつかの実施形態では、サンプルが37℃でインキュベートされる。その後、アレイは、光学的表現型(例えば、陽性の蛍光)を決定し、この測定値を各ウェルで以前に識別された化合物のペアにマッピングするために画像化される。ローディング後の化合物交換を制限するマイクロウェルアレイ設計が特に好ましく、1つの例示的な方法は、液滴のローディング後にマイクロウェルアレイを機械的に密閉することである。 The techniques herein provide a processing platform for testing all pair combinations of a set of input compounds in three steps. First, the target molecule is combined with a color barcode (a unique proportion of 2, 3, 4, or more fluorescent dyes). The target molecule can be barcoded by the proportion of the fluorescent dye (eg, red, green, blue, etc.). Following sample processing, the target molecule is preferably emulsified in water in oil droplets sized to about 1 nanoliter. In some embodiments, surfactants can be included to stabilize the droplets. Droplets can be combined into a pool using standard multi-channel micropipette technology. A second set of droplets containing a CRISPR system, an optional optical barcode using a fluorescent dye ratio, and an RNA masking compound is prepared. The first and second sets of droplets are mixed into one large pool, after which the droplets are loaded into the microwell array so that each microwell randomly captures the two droplets. In some embodiments, the loaded microwell array is sealed on a glass substrate to limit cross-contamination and evaporation of the microwells. In some cases, the microwell array is secured to the assembly by mechanical clamps. The content of each droplet is a fluorescent barcode resulting from a unique proportion of 2, 3, 4, or more fluorescent dyes premixed with the identified first and second sets of droplets. Encoded by. A low magnification (2-4x) epifluorescence microscope can be used to identify the contents of each droplet and / or well. Next, the two droplets in each well are merged and a high voltage AC electric field is applied to induce the droplet merge. Following the merge, the SHERLOCK reaction is initiated and in some embodiments the sample is incubated at 37 ° C. The array is then imaged to determine the optical phenotype (eg, positive fluorescence) and map this measurement to the previously identified pair of compounds in each well. A microwell array design that limits compound exchange after loading is particularly preferred, and one exemplary method is to mechanically seal the microwell array after loading the droplets.

一態様では、本明細書に記載の実施形態は、1つ以上の核酸含有標本における核酸配列変動の多重スクリーニング方法を対象とする。核酸配列変動には、天然の配列の変動、遺伝子発現の変動、操作された遺伝的摂動、またはそれらの組み合わせが含まれ得る。核酸含有検体は、細胞性または無細胞性であり得る。核酸を含む検体は、光学バーコードを含む液滴として調製される。CRISPR検出システムと光学バーコードを含む第2のセットの液滴が調製される。場合によっては、バーコードは、光または蛍光顕微鏡で視覚化できる光学的に検出可能なバーコードであり得る。特定の例示的な実施形態では、光学バーコードは、一連の定義された色から区別可能な色のフルオロフォアまたは量子ドットのサブセットを含む。場合によっては、光学的にコード化された粒子は、各ウェル内の光学的にコード化された粒子のランダムな組み合わせをもたらす個別のボリュームにランダムに送達されてもよいし、または光学的にコード化された粒子の一意の組み合わせが各個別のボリュームに具体的に割り当てられてもよい。光学的にコード化された粒子のランダムな分布は、すべての個別のボリュームへの分布を可能にするのに十分な時間、アッセイプラットフォームをポンピング、混合、ロッキング、または攪拌することによって達成することができる。当業者は、使用されるアッセイプラットフォームに基づいて、光学的にコード化された粒子を個別のボリューム全体にランダムに分配するための適切なメカニズムを選択することができる。 In one aspect, the embodiments described herein are directed to a method of multiple screening of nucleic acid sequence variations in one or more nucleic acid-containing specimens. Nucleic acid sequence variability can include natural sequence variability, gene expression variability, engineered genetic perturbations, or combinations thereof. Nucleic acid-containing specimens can be cellular or non-cellular. Specimens containing nucleic acids are prepared as droplets containing optical barcodes. A second set of droplets containing the CRISPR detection system and optical barcodes is prepared. In some cases, the barcode can be an optically detectable barcode that can be visualized with a light or fluorescence microscope. In certain exemplary embodiments, the optical barcode comprises a subset of fluorophores or quantum dots of color distinguishable from a set of defined colors. In some cases, the optically coded particles may be randomly delivered to individual volumes resulting in a random combination of optically coded particles within each well, or optically coded. A unique combination of optics may be specifically assigned to each individual volume. Random distribution of optically coded particles can be achieved by pumping, mixing, locking, or stirring the assay platform for sufficient time to allow distribution to all individual volumes. can. One of skill in the art can select an appropriate mechanism for randomly distributing optically coded particles across individual volumes, based on the assay platform used.

次いで、光学的にコード化された粒子の観察可能な組み合わせを使用して、各個別のボリュームを識別することができる。表現型などの光学的評価は、個別のボリュームごとに、例えば蛍光顕微鏡または他の画像化デバイスで作成及び記録することができる。図13に示されるように、3つの蛍光色素、例えば、様々なレベルのAlexa Fluor 555、594、647を使用して、105個のバーコードを生成できる。第4の色素を追加して使用することができ、数百の一意のバーコードの規模に拡張することができる。同様に、5色は、色の比率を変えることで達成できる一意のバーコードの数を増やすことができる。 An observable combination of optically coded particles can then be used to identify each individual volume. Optical evaluations such as phenotypes can be created and recorded for each individual volume, for example with a fluorescence microscope or other imaging device. As shown in FIG. 13, three fluorescent dyes, such as various levels of Alexa Fluor 555, 594, 647, can be used to generate 105 barcodes. A fourth dye can be added and used and expanded to the scale of hundreds of unique barcodes. Similarly, the five colors can increase the number of unique barcodes that can be achieved by varying the color ratio.

例えば、核酸官能化粒子を固体支持体上で合成し、続いて様々なレベルで異なる比率の色素、例えばFAM、Cy3及びCy5、または3つの蛍光色素、例えばAlexa Fluor555、594、647で標識して、105個のバーコードを生成できる。 For example, nucleic acid functionalized particles are synthesized on a solid support and subsequently labeled with different proportions of dyes at various levels, such as FAM, Cy3 and Cy5, or three fluorescent dyes, such as Alexa Fluor 555, 594, 647. , 105 barcodes can be generated.

一実施形態において、各液滴または個別のボリュームで受け取られるフルオロフォアの割り当てられたまたはランダムなサブセット(複数可)は、各個別のボリュームにおける個別の光学的にコード化された粒子の観察可能なパターンを決定し、それにより、各個別のボリュームが独立して識別されることを可能にする。各個々のボリュームは、光学的にコード化された粒子を検出する適切な画像化技術で画像化される。例えば、光学的にコード化された粒子が蛍光標識されている場合、各個別のボリュームは、蛍光顕微鏡を使用して画像化される。別の例では、光学的にコード化された粒子が比色的に標識されている場合、各個別のボリュームは、各カラーラベルに固有の波長または吸収スペクトルまたは発光スペクトルに一致する1以上のフィルターを備えた顕微鏡を使用して画像化される。使用される光学システムに適合する他の検出方法、例えば、量子ドット、色素などを検出するための当該技術分野で知られている方法が意図される。各個別のボリュームについて観察された個別の光学的にコード化された粒子のパターンは、後の使用のために記録することができる。 In one embodiment, an assigned or random subset (s) of fluorophores received in each droplet or individual volume are observable of individual optically coded particles in each individual volume. The pattern is determined, thereby allowing each individual volume to be identified independently. Each individual volume is imaged with appropriate imaging techniques to detect optically coded particles. For example, if the optically coded particles are fluorescently labeled, each individual volume is imaged using a fluorescence microscope. In another example, if the optically coded particles are colorimetrically labeled, each individual volume has one or more filters that match the wavelength or absorption spectrum or emission spectrum unique to each color label. Is imaged using a microscope equipped with. Other detection methods suitable for the optical system used, such as those known in the art for detecting quantum dots, dyes, etc., are intended. The pattern of the individual optically coded particles observed for each individual volume can be recorded for later use.

さらに、液滴のマージ、及びCRISPR検出システムと標的分子とのインキュベーションに続いて、光学的評価を行うことができる。標的分子がガイド分子によって検出されると、CRISPRエフェクタータンパク質が活性化され、例えば、検出可能な陽性シグナルがマスキング解除、放出、または生成されるようにマスキング構築物を切断することにより、マスキング構築物を不活性化する。1つ以上の時間周期でマージした各液滴の検出可能なシグナルの検出及び測定を行うことができ、例えば、陽性の検出可能なシグナルが存在するとき、標的分子の存在を示す。 In addition, droplet merging and incubation of the CRISPR detection system with the target molecule can be followed by an optical evaluation. When the target molecule is detected by the guide molecule, the CRISPR effector protein is activated, eg, by cleaving the masking construct so that a detectable positive signal is unmasked, released, or generated, thereby disabling the masking construct. Activate. It is possible to detect and measure the detectable signal of each droplet merged in one or more time cycles, eg, the presence of a positive detectable signal, indicating the presence of the target molecule.

本発明のさらなる実施形態は、以下の番号の付いた項目で説明される。
1. 標的分子を検出する方法であって、
第1のセットの液滴を生成することであって、前記第1のセットの液滴中の各液滴が、Casタンパク質、対応する標的分子に結合するように設計された1つ以上のガイドRNA、マスキング構築物、及び光学バーコードを含む検出CRISPR系を含む、生成することと、
第2のセットの液滴を生成することであって、前記第2のセットの各液滴が、少なくとも1つの標的分子と、任意選択の光学バーコードを含む、前記生成することと、
前記第1のセット及び第2のセットの液滴を混合して液滴のプールとして、前記液滴のプールを、マイクロウェルのアレイ及び前記マイクロウェルの下の少なくとも1つのフローチャネルを含むマイクロ流体デバイス上に流すことであって、前記マイクロウェルが少なくとも2つの液滴を捕捉するサイズである、前記第1のセット及び第2のセットの液滴を混合して液滴のプールとして、前記液滴のプールを、マイクロウェルのアレイ及び前記マイクロウェルの下の少なくとも1つのフローチャネルを含むマイクロ流体デバイス上に流すことと、
各マイクロウェルで捕捉された前記液滴の前記光学バーコードを検出することと、
各マイクロウェルで捕捉された前記液滴をマージして、各マイクロウェルでマージ液滴を形成することであって、前記マージ液滴の少なくともサブセットは、検出CRISPR系及び標的配列を含む、前記各マイクロウェルで捕捉された前記液滴をマージして、各マイクロウェルでマージ液滴を形成することと、
前記検出反応を開始することと、
1つ以上の時間間隔で、任意選択で連続的に、各マージ液滴の検出可能なシグナルを測定することと、
を含む、前記方法。
2. 前記標的分子を増幅するステップをさらに含む、項目1に記載の方法。
3. 前記増幅することが、核酸配列ベース増幅(NASBA)、リコンビナーゼポリメラーゼ増幅(RPA)、ループ媒介等温増幅(LAMP)、鎖置換増幅(SDA)、ヘリカーゼ依存性増幅(HDA)、ニッキング酵素増幅反応(NEAR)、PCR、多重置換増幅(MDA)、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、または分岐増幅法(RAM)を含む、項目2に記載の方法。
4. 前記増幅することが、RPAまたはPCRによって実施される、項目2に記載の方法。
5. 前記標的分子が生体サンプルまたは環境サンプルに含まれる、項目1に記載の方法。
6. 前記サンプルがヒト由来である、項目5に記載の方法。
7. 前記生体サンプルが、血液、血漿、血清、尿、大便、痰、粘液、リンパ液、滑液、胆汁、腹水、胸水、漿液腫、唾液、脳脊髄液、房水もしくは硝子体液、または任意の体の分泌物、濾出液、浸出液、または関節から得られた液体、または皮膚もしくは粘膜表面のスワブである、項目5に記載の方法。
8. 前記1つ以上のガイドが、(合成)ミスマッチを含む対応する標的分子に結合するように設計されたRNAである、項目1に記載の方法。
9. 前記ミスマッチが、前記標的分子におけるSNPまたは他の単一ヌクレオチド変異の上流または下流にある、項目8に記載の方法。
10. 前記1つ以上のガイドRNAが、標的RNAもしくはDNA中の一塩基多型、またはRNA転写物のスプライスバリアントを検出するように設計されている、項目1に記載の方法。
11. 前記1つ以上のガイドRNAが、ウイルス感染における薬剤耐性SNPを検出するように設計されている、項目10に記載の方法。
12. 前記1つ以上のガイドRNAが、疾患状態に特徴的な1つ以上の標的分子に結合するように設計されている、項目1に記載の方法。
13. 前記疾患状態が、薬剤耐性または感受性遺伝子または転写物またはポリペプチドの存在または非存在によって特徴付けられる、項目12に記載の方法。
14. 前記1つ以上のガイドRNAが、1つ以上の微生物株を区別するように設計されている、項目1に記載の方法。
15. 前記疾患状態が感染症である、項目12に記載の方法。
16. 前記感染症がウイルス、細菌、真菌、原虫、または寄生虫によって引き起こされる、項目15に記載の方法。
17. 前記1つ以上のガイドRNAが、少なくとも90のガイドRNAを含む、項目15に記載の方法。
18. 前記Casタンパク質が、RNA標的タンパク質、DNA標的タンパク質、またはそれらの組み合わせである、項目1に記載の方法。
19. 前記RNA標的タンパク質が1つ以上のHEPNドメインを含む、項目18に記載の方法。
20. 前記1つ以上のHEPNドメインがRxxxxHモチーフ配列を含む、項目19に記載の方法。
21. 前記RxxxHモチーフがR{N/H/K]XH配列を含む、項目20に記載の方法。
22. Xが、R、S、D、E、Q、N、G、またはYであり、Xが独立して、I、S、T、V、またはLであり、Xが独立して、L、F、N、Y、V、I、S、D、E、またはAである、項目21に記載の方法。
23. 前記CRISPR RNA標的タンパク質がC2c2である、項目1に記載の方法。
24. 前記Casタンパク質がDNA標的タンパク質である、項目18に記載の方法。
25. 前記Casタンパク質がRuvC様ドメインを含む、項目24に記載の方法。
26. 前記DNA標的タンパク質がV型タンパク質である、項目24に記載の方法。
27. 前記DNA標的タンパク質がCas12である、項目24に記載の方法。
28. 前記Cas12がCpf1、C2c3、C2c1、またはそれらの組み合わせである、項目25に記載の方法。
29. 前記マスキング構築物がRNAベースであり、検出可能な陽性シグナルの生成を抑制する、項目1に記載の方法。
30. 前記RNAベースのマスキング構築物が、検出可能な陽性シグナルをマスキングするか、または代わりに検出可能な陰性シグナルを生成することにより、前記検出可能な陽性シグナルの生成を抑制する、項目29に記載の方法。
31. 前記RNAベースのマスキング構築物が、レポーティング構築物によってコードされる遺伝子産物の生成を抑制するサイレンシングRNAを含み、前記遺伝子産物が、発現時に検出可能な陽性シグナルを生成する、項目29に記載の方法。
32. 前記RNAベースのマスキング構築物が、前記陰性の検出可能なシグナルを生成するリボザイムであり、前記リボザイムが不活性化されたときに、前記陽性の検出可能なシグナルが生成される、項目29に記載の方法。
33. 前記リボザイムが基質を第1の色に変換し、前記リボザイムが不活性化されたときに前記基質が第2の色に変換される、項目32に記載の方法。
34. 前記RNAベースのマスキング剤がRNAアプタマーであり、及び/またはRNA係留阻害剤を含む、項目29に記載の方法。
35. 前記アプタマーまたはRNA係留阻害剤が酵素を隔離し、前記酵素が基質に作用することにより前記アプタマーまたはRNA係留阻害剤から放出されると検出可能なシグナルを生成する、項目34に記載の方法。
36. 前記アプタマーが、酵素を阻害し、前記酵素が基質からの検出可能なシグナルの生成を触媒するのを妨げる阻害アプタマーであり、または前記RNA係留阻害剤が、酵素を阻害し、前記酵素が基質からの検出可能なシグナルの生成を触媒するのを妨げる、項目34に記載の方法。
37. 前記酵素が、トロンビン、プロテインC、好中球エラスターゼ、サブチリシン、西洋ワサビペルオキシダーゼ、ベータ-ガラクトシダーゼ、または子ウシアルカリホスファターゼである、項目36に記載の方法。
38. 前記酵素がトロンビンであり、前記基質がトロンビンのペプチド基質に共有結合したパラニトロアニリド、またはトロンビンのペプチド基質に共有結合した7-アミノ-4-メチルクマリンである、項目37に記載の方法。
39. 前記アプタマーが、前記アプタマーから放出されたときに結合して検出可能なシグナルを生成する薬剤のペアを隔離する、項目34に記載の方法。
40. 前記RNAベースのマスキング構築物が、検出可能なリガンド及びマスキング成分が付着するRNAオリゴヌクレオチドを含む、項目29に記載の方法。
41. 前記RNAベースのマスキング構築物が、架橋分子によって凝集して保持されたナノ粒子を含み、前記架橋分子の少なくとも一部がRNAを含み、前記ナノ粒子が溶液中に分配されるときに前記溶液がカラーシフトを受ける、項目29に記載の方法。
42. 前記ナノ粒子がコロイド金属である、項目41に記載の方法。
43. 前記コロイド金属がコロイド金である、項目42に記載の方法。
44. 前記RNAベースのマスキング構築物が、連結分子によって1つ以上のクエンチャー分子に連結された量子ドットを含み、前記連結分子の少なくとも一部がRNAを含む、項目22に記載の方法。
45. 前記RNAベースのマスキング構築物が、挿入剤と複合したRNAを含み、前記挿入剤が前記RNAの切断時に吸光度を変化させる、項目22に記載の方法。
46. 前記挿入剤がピロニン-Yまたはメチレンブルーである、項目45に記載の方法。
47. 前記検出可能なリガンドがフルオロフォアであり、前記マスキング成分がクエンチャー分子である、項目22に記載の方法。
48. 前記光学バーコードを検出することが、各マイクロウェル内の前記液滴の光学的評価を行うことを含む、項目1に記載の方法。
49. 前記光学的評価を行うことが、各マイクロウェルの画像をキャプチャすることを含む、項目48に記載の方法。
50. 前記光学バーコードが、特定のサイズ、形状、屈折率、色、またはそれらの組み合わせの粒子を含む、項目1に記載の方法。
51. 前記粒子が、コロイド金属粒子、ナノシェル、ナノチューブ、ナノロッド、量子ドット、ヒドロゲル粒子、リポソーム、デンドリマー、または金属-リポソーム粒子を含む、項目50に記載の方法。
52. 前記光学バーコードが、光学顕微鏡法、蛍光顕微鏡法、ラマン分光法、またはそれらの組み合わせを使用して検出される、項目48に記載の方法。
53. 各光学バーコードが1つ以上の蛍光色素を含む、項目1に記載の方法。
54. 各光学バーコードが異なる比率の蛍光色素を含む、項目53に記載の方法。
55. 前記検出可能なシグナルが蛍光のレベルである、項目1に記載の方法。
56. セットカバー解決プロセスを適用するステップをさらに含む、項目1に記載の方法。
57. マイクロ流体デバイスが、少なくとも40,000個のマイクロウェルのアレイを含む、項目1に記載の方法。
58. マイクロ流体デバイスが、少なくとも190,000個のマイクロウェルのアレイを含む、項目57に記載の方法。
59. 多重検出システムであって、
RNA標的タンパク質、対応する標的分子に結合するように設計された1つ以上のガイドRNA、RNAベースのマスキング構築物、及び光学バーコードを含む検出CRISPR系と、
任意選択の1つ以上の標的分子の光学バーコードと、
マイクロウェルのアレイ、及び前記マイクロウェルの下にある少なくとも1つのフローチャネルを含むマイクロ流体デバイスであって、前記マイクロウェルが少なくとも2つの液滴を捕捉するサイズである、前記マイクロ流体デバイスと、
を含む前記多重検出システム。
60. 項目59に記載の多重検出システムを含むキット。
61. 前記第2のセットの液滴が光学バーコードを含む、項目1~58のいずれかに記載の方法。
62. 1つ以上の標的分子の光学バーコードを含む、項目59に記載の多重検出システム。
Further embodiments of the present invention are described in the following numbered items.
1. 1. A method for detecting target molecules
To generate a first set of droplets, one or more guides designed to bind each droplet in the first set of droplets to a Cas protein, a corresponding target molecule. Generating, including detection CRISPR systems including RNA, masking constructs, and optical barcodes.
To generate a second set of droplets, wherein each droplet in the second set contains at least one target molecule and an optional optical barcode.
The first set and the second set of droplets are mixed to form a pool of droplets, the pool of droplets being a microfluidic containing an array of microwells and at least one flow channel beneath the microwells. The liquid as a pool of droplets by mixing the first set and the second set of droplets, which is to be flushed onto the device and is sized for the microwells to capture at least two droplets. Drop pools are flushed onto a microfluidic device that includes an array of microwells and at least one flow channel beneath said microwells.
To detect the optical barcode of the droplet captured in each microwell,
By merging the droplets captured in each microwell to form a merged droplet in each microwell, at least a subset of the merged droplets comprises the detection CRISPR system and the target sequence. By merging the droplets captured by the microwells to form a merged droplet at each microwell,
Starting the detection reaction and
Measuring the detectable signal of each merged droplet continuously, optionally, at one or more time intervals.
The method described above.
2. 2. The method of item 1, further comprising the step of amplifying the target molecule.
3. 3. The amplification includes nucleic acid sequence-based amplification (NASBA), recombinase polymerase amplification (RPA), loop-mediated isothermal amplification (LAMP), chain substitution amplification (SDA), helicase-dependent amplification (HDA), and nicking enzyme amplification reaction (NEAR). ), PCR, Multiple Substitution Amplification (MDA), Rolling Circle Amplification (RCA), Ligase Chain Reaction (LCR), or Branch Amplification Method (RAM).
4. The method of item 2, wherein the amplification is performed by RPA or PCR.
5. The method according to item 1, wherein the target molecule is contained in a biological sample or an environmental sample.
6. 5. The method of item 5, wherein the sample is of human origin.
7. The biological sample is blood, plasma, serum, urine, stool, sputum, mucus, lymph, synovial fluid, bile, ascites, pleural effusion, serous tumor, saliva, cerebrospinal fluid, tufted or vitreous fluid, or any body fluid. 5. The method of item 5, wherein the fluid is a secretion, serum, exudate, or fluid obtained from a joint, or a swab on the surface of the skin or mucous membrane.
8. The method of item 1, wherein the one or more guides are RNA designed to bind to a corresponding target molecule, including a (synthetic) mismatch.
9. 8. The method of item 8, wherein the mismatch is upstream or downstream of an SNP or other single nucleotide mutation in the target molecule.
10. The method of item 1, wherein the one or more guide RNAs are designed to detect single nucleotide polymorphisms in the target RNA or DNA, or splicing variants of RNA transcripts.
11. 10. The method of item 10, wherein the one or more guide RNAs are designed to detect drug resistant SNPs in viral infections.
12. The method of item 1, wherein the one or more guide RNAs are designed to bind to one or more target molecules characteristic of the disease state.
13. 12. The method of item 12, wherein the disease state is characterized by the presence or absence of a drug resistance or susceptibility gene or transcript or polypeptide.
14. The method of item 1, wherein the one or more guide RNAs are designed to distinguish one or more microbial strains.
15. The method according to item 12, wherein the disease state is an infectious disease.
16. 15. The method of item 15, wherein the infection is caused by a virus, bacterium, fungus, protozoan, or parasite.
17. 15. The method of item 15, wherein the one or more guide RNAs comprise at least 90 guide RNAs.
18. The method according to item 1, wherein the Cas protein is an RNA target protein, a DNA target protein, or a combination thereof.
19. 18. The method of item 18, wherein the RNA target protein comprises one or more HEPN domains.
20. 19. The method of item 19, wherein the one or more HEPN domains comprises an RxxxxxxH motif sequence.
21. 20. The method of item 20, wherein the RxxxH motif comprises an R {N / H / K] X 1 X 2 X 3 H sequence.
22. X 1 is R, S, D, E, Q, N, G, or Y, X 2 is independent, I, S, T, V, or L, and X 3 is independent. 21. The method of item 21, wherein L, F, N, Y, V, I, S, D, E, or A.
23. The method of item 1, wherein the CRISPR RNA target protein is C2c2.
24. 18. The method of item 18, wherein the Cas protein is a DNA target protein.
25. 24. The method of item 24, wherein the Cas protein comprises a RuvC-like domain.
26. 24. The method of item 24, wherein the DNA target protein is a V-type protein.
27. 24. The method of item 24, wherein the DNA target protein is Cas12.
28. 25. The method of item 25, wherein Cas12 is Cpf1, C2c3, C2c1, or a combination thereof.
29. The method of item 1, wherein the masking construct is RNA-based and suppresses the generation of detectable positive signals.
30. 29. The method of item 29, wherein the RNA-based masking construct suppresses the generation of the detectable positive signal by masking the detectable positive signal or instead producing a detectable negative signal. ..
31. 29. The method of item 29, wherein the RNA-based masking construct comprises silencing RNA that suppresses the production of the gene product encoded by the reporting construct, wherein the gene product produces a detectable positive signal upon expression.
32. 29. The RNA-based masking construct is a ribozyme that produces the negative detectable signal, wherein the positive detectable signal is produced when the ribozyme is inactivated. Method.
33. 32. The method of item 32, wherein the ribozyme converts the substrate to a first color and the substrate is converted to a second color when the ribozyme is inactivated.
34. 29. The method of item 29, wherein the RNA-based masking agent is an RNA aptamer and / or comprises an RNA mooring inhibitor.
35. 34. The method of item 34, wherein the aptamer or RNA mooring inhibitor sequesters the enzyme and the enzyme acts on the substrate to generate a detectable signal when released from the aptamer or RNA mooring inhibitor.
36. The aptamer is an inhibitory aptamer that inhibits the enzyme and prevents the enzyme from catalyzing the generation of a detectable signal from the substrate, or the RNA mooring inhibitor inhibits the enzyme and the enzyme is from the substrate. 34. The method of item 34, which prevents catalyzing the production of a detectable signal.
37. 36. The method of item 36, wherein the enzyme is thrombin, protein C, neutrophil elastase, subtilisin, horseradish peroxidase, beta-galactosidase, or calf alkaline phosphatase.
38. 37. The method of item 37, wherein the enzyme is thrombin, the substrate being paranitroanilide covalently bound to the peptide substrate of thrombin, or 7-amino-4-methylcoumarin covalently bound to the peptide substrate of thrombin.
39. 34. The method of item 34, wherein the aptamer sequesters a pair of agents that bind when released from the aptamer to produce a detectable signal.
40. 29. The method of item 29, wherein the RNA-based masking construct comprises an RNA oligonucleotide to which a detectable ligand and masking component are attached.
41. The solution is colored when the RNA-based masking construct contains nanoparticles aggregated and retained by cross-linking molecules, at least a portion of the cross-linking molecules contains RNA, and the nanoparticles are dispensed into the solution. 29. The method of item 29, which receives a shift.
42. 41. The method of item 41, wherein the nanoparticles are colloidal metals.
43. 42. The method of item 42, wherein the colloidal metal is colloidal gold.
44. 22. The method of item 22, wherein the RNA-based masking construct comprises quantum dots linked to one or more quencher molecules by a linking molecule, wherein at least a portion of the linking molecule comprises RNA.
45. 22. The method of item 22, wherein the RNA-based masking construct comprises RNA compounded with an insert, wherein the insert changes the absorbance upon cleavage of the RNA.
46. 45. The method of item 45, wherein the insert is pyronin-Y or methylene blue.
47. 22. The method of item 22, wherein the detectable ligand is a fluorophore and the masking component is a quencher molecule.
48. The method of item 1, wherein detecting the optical barcode comprises performing an optical evaluation of the droplet in each microwell.
49. 48. The method of item 48, wherein performing the optical evaluation comprises capturing an image of each microwell.
50. The method of item 1, wherein the optical barcode comprises particles of a particular size, shape, index of refraction, color, or a combination thereof.
51. 50. The method of item 50, wherein the particles include colloidal metal particles, nanoshells, nanotubes, nanorods, quantum dots, hydrogel particles, liposomes, dendrimers, or metal-liposomal particles.
52. 48. The method of item 48, wherein the optical barcode is detected using light microscopy, fluorescence microscopy, Raman spectroscopy, or a combination thereof.
53. The method of item 1, wherein each optical barcode comprises one or more fluorescent dyes.
54. 53. The method of item 53, wherein each optical barcode comprises a different proportion of fluorescent dye.
55. The method of item 1, wherein the detectable signal is a level of fluorescence.
56. The method of item 1, further comprising the step of applying the set cover resolution process.
57. The method of item 1, wherein the microfluidic device comprises an array of at least 40,000 microwells.
58. 57. The method of item 57, wherein the microfluidic device comprises an array of at least 190,000 microwells.
59. It is a multiple detection system
A detection CRISPR system that includes RNA target proteins, one or more guide RNAs designed to bind to the corresponding target molecule, RNA-based masking constructs, and optical barcodes.
Optical barcodes of one or more target molecules of choice,
A microfluidic device comprising an array of microwells and at least one flow channel beneath the microwells, the size of which the microwells are sized to capture at least two droplets.
The multiple detection system including.
60. A kit comprising the multiplex detection system according to item 59.
61. The method of any of items 1-58, wherein the second set of droplets comprises an optical barcode.
62. 59. The multiplex detection system of item 59, comprising an optical barcode of one or more target molecules.

本発明は、特許請求の範囲に記載される本発明の範囲を限定しない、以下の実施例においてさらに説明される。 The invention is further described in the following examples, which does not limit the scope of the invention described in the claims.

例示的な方法
例示的な方法では、化合物を蛍光色素の一意の比率で混合することができる。標的分子と色素混合物の各混合物は、液滴に乳化することができる。同様に、光学バーコードを備えた各検出CRISPR系は、液滴に乳化された。いくつかの実施形態では、各液滴は約1nLである。次いで、液滴を組み合わせてマイクロウェルチップに適用することができる。簡単な混合で液滴を組み合わせることができる。例示的な一実施形態では、マイクロウェルチップは、例えばネオジム磁石などのクランプによって上下からクランプできる取り外し可能なスペーサーを備えた疎水性スライドガラスなどのプラットフォーム上に吊り下げられる。スペーサーによって作成されたチップとガラスの間のギャップに油をロードし、液滴のプールをチップに注入し、さらに油を注入して余分な液滴を排出することで液滴を流し続けることができる。ロードが完了すると、チップを油で洗浄して、遊離している界面活性剤をパージできる。スペーサーを取り外して、マイクロウェルをスライドガラスに対して密閉し、クランプを閉じることができる。次いで、チップを落射蛍光顕微鏡で画像化し、次いで、液滴をマージして、例えばコロナ処理装置によって供給されるAC電場を印加することにより各マイクロウェル内の化合物を混合する。37℃でのマイクロウェルのインキュベーションと、落射蛍光顕微鏡を使用した蛍光の測定。
Illustrative Method In the exemplary method, the compounds can be mixed in a unique ratio of fluorescent dyes. Each mixture of target molecule and dye mixture can be emulsified into droplets. Similarly, each detection CRISPR system with optical barcodes was emulsified into droplets. In some embodiments, each droplet is about 1 nL. The droplets can then be combined and applied to a microwell chip. Droplets can be combined with a simple mix. In one exemplary embodiment, the microwell tip is suspended on a platform such as a hydrophobic glass slide with removable spacers that can be clamped from above and below by a clamp such as a neodymium magnet. It is possible to load oil into the gap between the chip and the glass created by the spacer, inject a pool of droplets into the chip, and then inject more oil to expel excess droplets to keep the droplets flowing. can. Once loading is complete, the chips can be cleaned with oil to purge the free surfactant. The spacer can be removed to seal the microwell against the glass slide and close the clamp. The chips are then imaged with an epifluorescence microscope, then the droplets are merged and the compounds in each microwell are mixed, for example by applying an AC electric field supplied by a corona processing device. Microwell incubation at 37 ° C. and fluorescence measurement using an epifluorescence microscope.

プライマーの設計に関しては、ソフトウェアツールに実装された「診断ガイド設計」法を利用して、ウイルス配列に対する以下の例示的な方法を利用することができる。ウイルス配列の場合、ウイルス配列のアライメントの入力が利用され、その目的は、ガイドと標的との間のいくつかのミスマッチ(通常は1)を許容する入力配列のいくつかの所望の画分(例えば、95%)を検出する、いくつかの特定のアンプリコン長さ内にあるガイド配列のセットを見つけることである。サブタイピング(または任意の鑑別同定)にとって重要なことは、各コレクションが1つのサブタイプに固有であることを保証する様々なガイドのコレクションを設計することである。目標は、これに基づいて、診断ガイド設計(「d-g-d」)と他のツールを使用して、種同定用のアンプリコンプライマーとガイド配列を同時に設計することである。 For primer design, the following exemplary methods for viral sequences can be utilized using the "diagnostic guide design" method implemented in software tools. In the case of viral sequences, the input of viral sequence alignment is utilized and the purpose is to allow some mismatch (usually 1) between the guide and the target some desired fraction of the input sequence (eg, 1). , 95%) is to find a set of guide sequences within some specific amplicon length. Important for subtyping (or any differential identification) is to design a collection of different guides that ensure that each collection is unique to one subtype. Based on this, the goal is to simultaneously design amplicon primers and guide sequences for species identification using diagnostic guide design (“dgd”) and other tools.

必要なウイルスゲノムを組み立て、mafftを使用して種レベルでアライメントを行い、データをクラスター化して密接に関連した種を識別する。セグメント化されたウイルスを特別に扱う。各セグメントを個別に扱う。最終的に、続行するのに最適なセグメント(または2つ)を選択する。 Assemble the required viral genome, align at the species level using maft, and cluster the data to identify closely related species. Treat segmented viruses specially. Treat each segment individually. Finally, select the best segment (or two) to continue.

診断ガイド設計を使用して、推定プライマー結合部位(25mer)を同定する。カバレッジが95%で、ミスマッチが2つ以下の単一のプライマー配列を探す。 The diagnostic guide design is used to identify the putative primer binding site (25 mer). Look for a single primer sequence with 95% coverage and no more than two mismatches.

位置/ウィンドウでこのカバレッジを達成する方法がない場合は、次の位置に移動し、プライマー3を呼び出す前に、最初にゲノム全体でこれを実行する。 If there is no way to achieve this coverage at position / window, move to the next position and do this first across the genome before calling Primer 3.

80~120ヌクレオチド長のアンプリコンのプライマーペアを同定する。プライマー3を使用して25merを絞り込み、58~60Cの目標融解温度を取得する。 Identify primer pairs of amplicon with a length of 80-120 nucleotides. The primer 3 is used to narrow down 25 mer to obtain a target melting temperature of 58-60C.

SEQUENCE_PRIMER_PAIR_OK_REGION_LISTを使用して、推定アンプリコンのfwd/リバースプライマーの位置を指定する。これにより、[fwd_start、fwd_length,rev_start,rev_length]フォーマットを使用してプライマーが入る領域を入力できる。 SEQUENCE_PRIMER_PAIR_OK_REGION_LIST is used to specify the fwd / reverse primer position of the putative amplicon. This allows you to enter the region containing the primer using the [fwd_start, fwd_length, rev_start, rev_length] format.

好ましくは、PCRはより低い温度、例えば50~55Cで行うことができる。 Preferably, PCR can be performed at a lower temperature, eg 50-55C.

プライマーの二次構造が悪い場合は、廃棄する(PRIMER_MAX_SELF_ANY_TH,PRIMER_PAIR_MAX_COMPL_ANY_THを40Cに設定)。これは、デフォルト設定の47Cよりも低い値であるが、ここで優れたプライマーを得るには、ストリンジェンシーが必要である。 If the secondary structure of the primer is bad, discard it (PRIMER_MAX_SELF_ANY_TH, PRIMER_PAIR_MAX_COMPL_ANY_TH are set to 40C). This is lower than the default setting of 47C, but stringency is required to obtain good primers here.

クラスタリングデータを使用して、アンプリコンの交差反応性を確認する。これは、プライマーが避けるべき「ミスプライミングライブラリー」を可能にするプライマー3を使用して行うことができる。ここで、他の種(しかし同じクラスター内)からの配列表を入力できる。アンプリコンに固有のプライマーが含まれている可能性があるが、アッセイが非常に特異的であることを保証するために必要な、crRNAレベルでの重複が依然として存在する可能性がある。 Use clustering data to confirm the cross-reactivity of the amplicon. This can be done with primer 3 which allows for a "mispriming library" that the primer should avoid. Here you can enter a sequence listing from another species (but within the same cluster). Although the amplicon may contain primers specific to it, there may still be duplication at the crRNA level needed to ensure that the assay is very specific.

それらのアンプリコンをd-g-dに渡し、crRNAの発見を試みる。 Pass those amplicons to d-g-d and try to find crRNA.

以前と同じように、1つのミスマッチを許容する。 As before, allow one mismatch.

ウィンドウサイズはアンプリコン全体である(プライマー配列との重複なし) The window size is the entire amplicon (no overlap with the primer sequence)

クラスタリングデータを使用して差動設計を行う(おそらく、増幅されていない材料が不足している必要があるため、アンプリコン対他のアンプリコンを確認するのみである)。少なくとも4つのミスマッチを要求する(G-Uペアは含まれない)。 Make a differential design using clustering data (probably just looking at the amplicons vs. other amplicons because of the lack of unamplified material). Requires at least 4 mismatches (GU pairs not included).

crRNAが少なく、カバレッジが高く、特異的なアンプリコンの表を作成する。 Create a table of specific amplicon with low crRNA and high coverage.

現時点では、単一の「最良の」設計を準備できるが、コードを変更して、例えば各ウイルスを試験するためのいくつかの選択肢を提供するホワイトリストの作成を可能にする必要がある。20uLの反応を使用したプレート中のジカウイルスについてSHERLOCKによって分析された同じジカサンプルの感度曲線は、2nLの反応を使用した液滴中のジカウイルスのSHERLOCKアッセイと同じであり、液滴SHERLOCK(dSHERLOCK)の検出限界がプレートに匹敵することを示す。(図3)。同様に、dSHERLOCKは、プレートでのアッセイと比較した場合、一塩基多型(SNP)を同等に区別する。 At this point, we can prepare a single "best" design, but we need to modify the code to allow, for example, to create a whitelist that offers several options for testing each virus. The sensitivity curve of the same Zika sample analyzed by SHERLOCK for Zika virus in a plate using a 20 uL reaction is the same as the SHERLOCK assay for Zika virus in droplets using a 2 nL reaction and is the same as the SHERLOCK assay for droplet SHERLOCK (dSHERLOCK). ) Indicates that the detection limit is comparable to the plate. (Fig. 3). Similarly, dSHERLOCK equally distinguishes single nucleotide polymorphisms (SNPs) when compared to assay on plates.

本明細書に開示される方法及びシステムは、インフルエンザのサブタイプの多重検出に利用することができる(図5)。特に、チップ内の検出ミックスと標的のすべての組み合わせを生成するために必要な実験的努力は、ウェルプレートで対角線上の反応のみを構築するために必要な努力と同じであり、システムと方法を多数の組み合わせで分析に適用することを可能にする。チップは対角線に加えてすべての非対角線の組み合わせを自動的に構築するため、目的の製品に対する各検出ミックスの選択性の迅速な決定が達成可能である。ガイドRNAは、寄託された配列に基づいて、ウイルスの特定の一意なセグメントを標的にするように設計できる。場合によっては、より新しい配列データ、またはより一般的な配列を含むように設計に重みを付けることができる。インフルエンザHサブタイプについて図6に示すように、様々なウイルスのサブタイプに対してガイドRNAのセットを設計でき、0または1のミスマッチを持つ各サブタイプの多数のコンセンサス配列に対するガイドRNAのアライメントを提供する成功した結果が得られる。 The methods and systems disclosed herein can be utilized for multiple detection of influenza subtypes (Fig. 5). In particular, the experimental effort required to generate all combinations of detection mixes and targets in the chip is the same as the effort required to build only the diagonal response in the well plate, system and method. Allows application to analysis in many combinations. Since the chip automatically builds all off-diagonal combinations in addition to diagonal, rapid determination of the selectivity of each detection mix for the desired product is achievable. Guide RNAs can be designed to target specific unique segments of the virus based on the deposited sequence. In some cases, the design can be weighted to include newer array data, or more general arrays. As shown in FIG. 6 for influenza H subtypes, a set of guide RNAs can be designed for various viral subtypes, with guide RNA alignments for multiple consensus sequences of each subtype with a 0 or 1 mismatch. You will get the successful results you provide.

現在のシステム及び方法の他の例示的な用途には、TB(図11)及びHIV逆転写酵素における薬剤耐性突然変異の検出を含む、変異の多重検出が含まれる。ガイドRNAは、祖先対立遺伝子と派生対立遺伝子を標的とするように設計することができ、派生対立遺伝子と標的対立遺伝子の試験を一緒に使用する可能性を示す試験を行うことができる。(図10)。dSHERLOCKは、30分以内に検出される蛍光で実行できる。(図11)。 Other exemplary applications of current systems and methods include multiple detection of mutations, including detection of drug resistance mutations in TB (FIG. 11) and HIV reverse transcriptase. Guide RNAs can be designed to target ancestral alleles and derived alleles, and can be tested to show the possibility of using both derived and target allele tests together. (Fig. 10). dSHERLOCK can be performed with fluorescence detected within 30 minutes. (Fig. 11).

マイクロウェルアレイチップと液滴検出を使用してSHERLOCKを本明細書に開示する方法に組み合わせることで、バーコードの数とチップサイズを拡張して大規模な多重化を可能にする、これまでの多重検出を通じて最高のスループットを提供できる。(図12~14)。 By combining SHERLOCK with the methods disclosed herein using microwell array chips and droplet detection, the number and chip size of barcodes can be expanded to allow large-scale multiplexing. The highest throughput can be provided through multiple detection. (Figs. 12-14).

実施例1
この例では、核酸の多重評価のための組み合わせ配列反応(CARMEN)の開発と、cas13を使用したCARMEN(CARMEN-cas13)の実装について説明する。本明細書に示すように、CARMEN-cas13は、10以上の配列決定されたゲノムを持つすべてのヒト関連ウイルスについて、数十のサンプルを特異的、選択的、及び同時に試験した。さらに、CARMEN-cas13はcas13検出の感度と特異性を利用して、多様なウイルス種のすべての株を並行して識別し、薬剤耐性変異などの単一ヌクレオチドバリアントのパネルを検出する。要約すると、CARMEN-cas13は高度に多重化されたCRISPRベースの核酸検出プラットフォームであり、前例のない規模で疫学的監視を可能にする。
Example 1
In this example, the development of a combinatorial sequence reaction (CARMEN) for multiple evaluation of nucleic acids and the implementation of CARMEN (CARMEN-cas13) using cass13 will be described. As shown herein, CARMEN-cas13 specifically, selectively, and simultaneously tested dozens of samples for all human-related viruses with 10 or more sequenced genomes. In addition, CARMEN-cas13 leverages the sensitivity and specificity of cas13 detection to identify all strains of diverse viral species in parallel and detect panels of single nucleotide variants such as drug resistance mutations. In summary, CARMEN-cas13 is a highly multiplexed CRISPR-based nucleic acid detection platform that enables epidemiological monitoring on an unprecedented scale.

CARMENは、各サンプルと検出ミックスを乳化液滴に閉じ込め、マイクロウェルアレイでサンプルと検出ミックスのペアを構築することにより、従来のCRISPRベースの核酸検出を多重化アッセイに変換する(図15B、図20)。増幅されたサンプルと検出ミックスは、従来のマイクロタイタープレートで調製される。増幅された各サンプルまたは検出ミックスは、一意の光学識別子として機能する異なる蛍光カラーコードと組み合わされ、カラーコード化された溶液はフルオラス油で乳化され、1nLの液滴がもたらされる。乳化すると、すべてのサンプルと検出ミックスからの液滴を単一のチューブにプールし、1回のピペッティングステップで、ポリジメチルシロキサン(PDMS)チップに組み込まれたマイクロウェルアレイにロードする(図15B及び図20~21)。アレイ内の各マイクロウェルは、プールからランダムに2つの液滴を収容し、それにより液滴化された入力のすべてのペアの組み合わせを自発的に形成し、アレイはガラス基板に対して物理的に密閉され、各マイクロウェルを物理的に単離する。各ウェルの内容物は、蛍光顕微鏡を使用して液滴のカラーコードを評価することによって決定される。電場にさらされると、各マイクロウェルに閉じ込められた液滴ペアがマージされ、すべての検出反応が同時に開始される。蛍光顕微鏡を使用して、各検出反応を経時的にモニタリングする(図15B及び図20)。 CARMEN transforms traditional CRISPR-based nucleic acid detection into a multiplexing assay by enclosing each sample and detection mix in an emulsified droplet and constructing a pair of sample and detection mix in a microwell array (FIG. 15B, FIG. 20). The amplified sample and detection mix are prepared on a conventional microtiter plate. Each amplified sample or detection mix is combined with a different fluorescent color code that acts as a unique optical identifier, and the color coded solution is emulsified with fluorus oil to yield 1 nL droplets. Once emulsified, droplets from all samples and detection mixes are pooled in a single tube and loaded into a microwell array integrated into a polydimethylsiloxane (PDMS) chip in a single pipetting step (FIG. 15B). And FIGS. 20-21). Each microwell in the array randomly contains two droplets from the pool, thereby spontaneously forming a combination of all pairs of dropleted inputs, and the array is physically relative to the glass substrate. Each microwell is physically isolated. The content of each well is determined by evaluating the color code of the droplet using a fluorescence microscope. Upon exposure to an electric field, the droplet pairs confined in each microwell are merged and all detection reactions are initiated simultaneously. Each detection reaction is monitored over time using a fluorescence microscope (FIGS. 15B and 20).

CARMEN-cas13は、複雑なサンプル中の様々なウイルス性及び細菌性病原体を迅速に検出するために使用されている特異的高感度酵素的レポーターunLOCKing(SHERLOCK)と同じくらい感度が高く、マイクロウェルアレイごとに収集された多数のデータポイントを使用して、各実験で統計的検出力とスループットを調整できる。CARMEN-cas13は、標準的なSHERLOCK及びPCRベースのアッセイの感度に一致するアトモル感度でジカ配列を検出する(図15C及び図22)。さらに、出願人の標準チップでCARMENを実行すると、品質フィルタリング後に約10,000マイクロウェルからデータが取得され、試験ごとに数百回の技術的反復の可能性が提供される(図15C)。ブートストラップ分析は、CARMEN-Cas13が非常に一貫性があり、試験ごとに3回の技術的反復しか必要としないことを示す(図20)。チップごとに最大1,000の試験を実行すると、ペアの>X%が試験ごとに3つ以上の技術的反復液滴ペアを持つことが保証される。コンビナトリアル空間の形状(例えば、100サンプル×10検出ミックス、または10サンプル×100検出ミックス)は柔軟である。CARMENの柔軟性の1つの用途は、直交RNAポリメラーゼを含む複数の並行検出反応を評価することにより、核酸検出のダイナミックレンジを拡大することである。この原理を実証するために、直交RNAポリメラーゼプロモーターT3及びT7を使用して増幅プライマーをバーコード化し、T3またはT7RNAポリメラーゼのいずれかを含む検出反応を使用して、6桁以上の標準曲線を作成した(図23)。 CARMEN-cas13 is as sensitive as the specific sensitive enzymatic reporter unLOCKing (SHERLOCK) used to rapidly detect various viral and bacterial pathogens in complex samples, and is a microwell array. The large number of data points collected for each can be used to adjust statistical power and throughput for each experiment. CARMEN-cas13 detects deca sequences with atomor sensitivities consistent with the sensitivities of standard SHERLOCK and PCR-based assays (FIGS. 15C and 22). In addition, running CARMEN on the applicant's standard chip retrieves data from approximately 10,000 microwells after quality filtering, offering the possibility of hundreds of technical iterations per test (FIG. 15C). Bootstrap analysis shows that CARMEN-Cas13 is very consistent and requires only 3 technical iterations per test (FIG. 20). Performing up to 1,000 tests per chip ensures that> X% of pairs have 3 or more technical repeat droplet pairs per test. The shape of the combinatorial space (eg, 100 sample x 10 detection mix, or 10 sample x 100 detection mix) is flexible. One use of CARMEN's flexibility is to extend the dynamic range of nucleic acid detection by evaluating multiple parallel detection reactions involving orthogonal RNA polymerases. To demonstrate this principle, amplification primers are barcoded using the orthogonal RNA polymerase promoters T3 and T7, and a detection reaction involving either T3 or T7 RNA polymerase is used to create a standard curve of 6 digits or more. (Fig. 23).

CARMENは、定量化を超えて、前例のない規模での多重核酸検出を可能にする。この規模を示すために、次の焦点は、Cas13検出アッセイの設計に情報を提供するために、公開された10以上のゲノムを持つすべての169のヒト関連ウイルスの数十のサンプルを特異的、選択的、同時に試験できるアッセイを設計することであった(図16A、図26)。これらの種のうち39種のみがFDA承認の診断法を有するが、これは主に、そのような試験の開発と検証の労働集約的なプロセスによるものである。出願人は、これらの169のウイルス種のそれぞれを同時に識別するためのCARMENアッセイの開発に着手した。 CARMEN goes beyond quantification and enables the detection of multiple nucleic acids on an unprecedented scale. To demonstrate this scale, the next focus is to specify dozens of samples of all 169 human-related viruses with more than 10 published genomes to inform the design of the Cas13 detection assay. It was to design an assay that could be selectively and simultaneously tested (FIGS. 16A, 26). Only 39 of these species have FDA-approved diagnostics, primarily due to the labor-intensive process of developing and validating such trials. Applicants have embarked on the development of a CARMEN assay to simultaneously identify each of these 169 viral species.

ヒト関連バイローム(169サンプル×169検出ミックス=28,561試験、対照及び複製前)にまたがるアッセイを開発及び試験するための実験的努力は、以前の標準チップ及びカラーコードセットならびに他の既存の多重化システムが提供できるものよりも高いスループットを要求した。数百の入力から液滴を区別するために、出願人は、以前に報告されたカスタム粒子合成を必要とせずに、高度に多重化された正確なスペクトルコード化システム24-26用の既存の64のカラーコードセットに大幅に基づいて、4つの市販の低分子フルオロフォアの比率を使用して、1,050ソリューションベースのカラーコードのセットを開発した。1,050のカラーコードは、元のセットと同じように機能し、すべての液滴にわたる正しい液滴分類は97.8%、94%の液滴を保持した許容フィルタリング後の正しい分類は99.5%であった(図24、図16B、図38A~38G)。わずか5回の繰り返しで、誤分類された液滴が誤判定をもたらす可能性は100,000分の1となる。拡張されたカラーコードセットによって可能になるスループットに一致するように、出願人は、より大きな容量のチップ(mChip)を設計した(図25A~25G)。これは、以前の標準チップの4倍の表面積を持ち、4,000を超える堅牢で統計的に反復された試験を同時に実行できる。mChipは、標準的なウェルプレートSHERLOCK検査と比較して、検査あたりの試薬コストを300倍を超えて削減する。(表11)。 Experimental efforts to develop and test assays across human-related byloms (169 samples x 169 detection mix = 28,561 trials, controls and pre-replication) have included previous standard chips and color code sets as well as other existing multiplexings. It demanded higher throughput than what the system can provide. To distinguish droplets from hundreds of inputs, Applicants have existing for highly multiplexed and accurate spectral coding systems 24-26 without the need for previously reported custom particle synthesis. A set of 1,050 solution-based color codes was developed using the ratio of four commercially available low molecular weight fluorophores, largely based on the 64 color code sets 8 . The 1,050 color code works the same as the original set, with a correct droplet classification of 97.8% across all droplets and a correct classification after permissible filtering holding 94% droplets of 99. It was 5% (FIGS. 24, 16B, 38A-38G). With just five iterations, the chances of a misclassified droplet leading to a misjudgment are 1 in 100,000. Applicants have designed a larger capacity chip (mChip) to match the throughput enabled by the expanded color code set (FIGS. 25A-25G). It has four times the surface area of previous standard chips and can simultaneously perform over 4,000 robust and statistically repeated tests. mChip reduces reagent costs per test by more than 300 times compared to standard well plate SHERLOCK tests. (Table 11).

出願人は次に、10以上の利用可能な公開されたゲノムを有する169のヒト関連ウイルス(HAV)のすべてについて数十のサンプルを選択的かつ同時に試験し、HAVパネルに表示されるウイルスのゲノムにCATCH-dx(Metsky et al.準備中)を適用し、プライマー配列を最適化するためのプライマー327を使用して、PCRプライマープールのアンプリコンを選択するCARMEN-Cas13アッセイを設計した。CATCH-dxは、グループに配置された配列のコレクション(例えば、種内のすべての既知の配列)を受け入れる。各グループについて、CATCH-dxは、グループ内の配列に感受性があり(すなわち、配列の望ましい画分を検出し)、他のグループ内の配列を検出する可能性が低いcrRNAの最適なセットを検索する(図39A)。入力としてのウイルス種のアライメントとともに、CATCHdxを使用して、NCBI GenBankのゲノム多様性を考慮して、各セットが他の種に対して高い選択性で標的種内で高感度(90%を超える配列の検出)を提供するように、各種のcrRNA配列の小さなセットを設計した(図16C、図26、図39A~39G)。この設計は、各種のコンセンサス配列に基づいた合成標的を使用して試験され、設計に設定された各種から最適なcrRNAが試験用にコンピューターで選択された(図16B)。 Applicants then selectively and simultaneously test dozens of samples for all 169 human-related viruses (HAVs) with more than 10 available published genomes and display the viral genomes on the HAV panel. CATCH-dx (Metsky et al. In preparation) was applied to the virus, and a CARMEN- Cas13 assay was designed to select an amplicon of the PCR primer pool using the primer 327 for optimizing the primer sequence. CATCH-dx accepts a collection of sequences arranged in groups (eg, all known sequences within a species). For each group, CATCH-dx searches for the optimal set of crRNAs that are sensitive to sequences within the group (ie, detect the desired fraction of the sequence) and are unlikely to detect sequences within the other groups. (Fig. 39A). Using CATCHdx, along with virus species alignment as input, each set is highly selective (> 90%) within the target species with high selectivity for other species, taking into account the genomic diversity of NCBI GenBank. A small set of various crRNA sequences was designed to provide sequence detection) (FIGS. 16C, 26, 39A-39G). This design was tested using synthetic targets based on various consensus sequences, and the optimal crRNA from the various set in the design was computer-selected for testing (FIG. 16B).

CARMEN-cas13の大規模な多重化機能を利用して、出願人はHAVパネルを広範囲にわたって試験し、高性能を実証した。各crRNA(合計169個)を、対応するプライマープールを使用して増幅されたすべての標的に対して評価し(対照を含む合計184個のPCR産物。図16B)、8mChipで合計30,912回の試験が実施された(表1を参照)。初期の設計セットでは、148のcrRNA(87.6%)がすでに標的に対して高度に選択的であり、閾値を超えるシグナルであり、13(7.7%)は閾値を超える交差反応性を示し、8(4.7%)は閾値を超える反応性を示さなかった。性能が低下しているcrRNAに対処するために、11種のcrRNA配列が再設計され、3種のプライマー配列が再設計され、crRNAと標的の新しいストックが調製された。再設計された配列を組み込んだ第2ラウンドの試験では、評価された167のcrRNAのうち157(94%)が標的に対して高度に選択的であり、シグナルが閾値を超え、6(3.6%)が閾値を超える交差反応性を示し、4(2.4%)が閾値を超える反応性がなかった(図16C)。ラウンド1と2の結果は非常に一致していた:再設計も再希釈も行われなかった配列の97.2%が2回のラウンド間で同等に実施され、残りのアッセイの性能を変えることなく個々のcrRNAを改善できることが実証された(図40A~40E)。さらに、個々のcrRNAの性能は強力である(ラウンド1及び2のAUCの中央値はそれぞれ0.999及び0.997である)(図40A~40E)。実際、合成標的がすべてのプライマープールで増幅された場合でも、広範な交差反応性は観察されない(図41A~41F)。 Utilizing the large-scale multiplexing function of CARMEN-cas13, the applicant has extensively tested the HAV panel and demonstrated high performance. Each crRNA (total 169) was evaluated against all amplified targets using the corresponding primer pool (total 184 PCR products including controls; Figure 16B), total 30,912 times at 8 mChip. Tests were performed (see Table 1). In the initial design set, 148 crRNAs (87.6%) are already highly selective for the target and are over-threshold signals, and 13 (7.7%) are over-threshold cross-reactivity. 8 (4.7%) showed no reactivity above the threshold. To address the degraded crRNA, 11 crRNA sequences were redesigned, 3 primer sequences were redesigned, and new stocks of crRNA and targets were prepared. In a second round of study incorporating the redesigned sequence, 157 (94%) of the 167 crRNAs evaluated were highly selective for the target, the signal exceeded the threshold, and 6 (3. 6%) showed cross-reactivity above the threshold, and 4 (2.4%) did not exceed the threshold (FIG. 16C). The results for Rounds 1 and 2 were very consistent: 97.2% of the sequences that were not redesigned or rediluted were equally performed between the two rounds, altering the performance of the rest of the assay. It was demonstrated that the individual crRNA could be improved without any (FIGS. 40A-40E). In addition, the performance of the individual crRNAs is strong (median AUCs for rounds 1 and 2 are 0.999 and 0.997, respectively) (FIGS. 40A-40E). In fact, no broad cross-reactivity is observed even when the synthetic target is amplified in all primer pools (FIGS. 41A-41F).

より困難で複雑な状況でCARMENの性能を厳密に試験するために、出願人は感染が確認された16人の患者からの血漿または血清サンプルに対してHAVパネルを評価した。各臨床サンプルは未知のものとして扱われ、15のすべてのプライマープールを使用して増幅された。試験のスループットを向上させるために、その後、PCR産物を3つのセットにプールし(患者サンプルごとに5つの最終産物)、HAVパネルからのcrRNAで試験した。比較の読み取りとして、種特異的PCRプライマーを使用して2ラウンド目のPCRを実施した。CARMENとPCR増幅は、デング、ジカ、及びHIVのサンプルで100%一致した。非常に多様なウイルスであるHCVの場合、HAVパネルのHCV特異的crRNAは、4つのPCR陽性サンプルのうち2つを識別した。以下の図3のインフルエンザAサブタイピングで実証されるように、特に多様なウイルスの検出感度は、不均一な標的セットをカバーするためにcrRNAの多重化を増やすことで対処できる。さらに、CARMENの特異性は高く、交差反応性は広くない。169のcrRNAのうち3つ(1.8%)のみが、3つの多様な陰性対照(健常なヒトからプールされた血漿、血清、または尿)で予期しない反応を示し、89.6%がPCR増幅と一致した結果であった。これらの3つのcrRNAは、HAVパネルの残りの部分の性能に影響を与えることなく、分析から除外された。 To rigorously test the performance of CARMEN in more difficult and complex situations, Applicants evaluated HAV panels on plasma or serum samples from 16 confirmed infected patients. Each clinical sample was treated as unknown and amplified using all 15 primer pools. To improve test throughput, PCR products were then pooled into 3 sets (5 end products per patient sample) and tested with crRNA from the HAV panel. As a comparative reading, a second round of PCR was performed using species-specific PCR primers. CARMEN and PCR amplification were 100% consistent with dengue, deer, and HIV samples. For HCV, a highly diverse virus, HCV-specific crRNA in the HAV panel identified two of the four PCR-positive samples. Particularly diverse virus detection sensitivities can be addressed by increasing crRNA multiplexing to cover a heterogeneous target set, as demonstrated by the influenza A subtyping of FIG. 3 below. Furthermore, the specificity of CARMEN is high and the cross-reactivity is not wide. Only 3 (1.8%) of the 169 crRNAs showed unexpected reactions in 3 diverse negative controls (plasma, serum, or urine pooled from healthy humans), with 89.6% PCR. The result was consistent with amplification. These three crRNAs were excluded from the analysis without affecting the performance of the rest of the HAV panel.

症候性感染症の個々の原因を特定することに加えて、HAVパネルは、並行して多くのウイルスの監視に使用できる。ここで、HAVパネルは、患者のサブセット(TLMV:11/16患者、HPV:4/16患者)で、トルクテノ様ミニウイルス(TLMV)とヒトパピローマウイルス(HPV)の株を特定した。これらの結果は、2ラウンド目のPCRによって100%一致で確認された。これらのウイルスは一般的にヒトに感染することが知られており、無症候性であることが多く、診断されないことが多いため、多重化されたCARMENパネルを使用して二次感染または無症状感染を特定できることが実証されている。臨床環境では、HAVパネルの結果を患者の症状と統合することが解釈にとって重要であり、結果はHAVパネルのサブセットからのみ必要となり得る。したがって、HAVパネルは、エンドユーザーが様々な用途に合わせてカスタマイズできる核酸検出アッセイのモジュール式マスターセットとみなすことができる。 In addition to identifying the individual causes of symptomatic infections, the HAV panel can be used in parallel to monitor many viruses. Here, the HAV panel identified strains of torqueteno-like minivirus (TLMV) and human papillomavirus (HPV) in a subset of patients (TLMV: 11/16 patients, HPV: 4/16 patients). These results were confirmed with 100% concordance by PCR in the second round. These viruses are generally known to infect humans, are often asymptomatic, and are often undiagnosed, so secondary infections or asymptomatic using a multiplexed CARMEN panel. It has been demonstrated that the infection can be identified. In a clinical environment, integrating the results of the HAV panel with the patient's symptoms is important for interpretation, and the results may only be needed from a subset of the HAV panel. Therefore, the HAV panel can be viewed as a modular master set of nucleic acid detection assays that end users can customize for a variety of applications.

Cas13検出の特異性を利用して、出願人は、CARMEN-Cas13を使用して、多様なウイルス種の疫学的に関連するすべての血清型を並行して区別し、多様なウイルス株を並行して区別した。ウイルス種内の多様性は、検出に大きな課題をもたらす。アッセイは、株のグループ内の多くの異なる配列を正しく識別しながら、そのグループに対して選択性を維持しなければならない。ケーススタディとして、インフルエンザAウイルス(IAV)のヘマグルチニン(H)及びノイラミニダーゼ(N)サブタイプH1-H16及びN1-N9が選択された。これらの血清学的に定義されたサブタイプは、多種多様な宿主種に感染できる株で構成されており、その一部はパンデミックの可能性に関連している。並列プライマーセットで増幅するために十分に保存されているH及びNアンプリコンが同定された。サブタイプを識別するために、CATCH dxを使用して、各サブタイプ内の配列の>90%をカバーするcrRNAの特定のセットを設計した(図17A、図30、詳細は方法を参照されたい)。最適なcrRNAは、H1-16及びN1-9からの合成コンセンサス配列を使用して各セットから試験され、これらのサブタイプを容易に識別した(図17B~17C、図31)。Nサブタイピングアッセイは、各Nサブタイプ内の配列多様性の>90%を表す35個の合成配列を使用してさらに試験され、これらの配列の35個のうち32個(91.4%)が同定できたことが判定された(図32)。サブタイピングアッセイは、H1N1株及びH3N2株からの種ストック、ヒトで一般的に循環するIAVのサブタイプ、ならびに鳥のIAVサブタイプからの合成配列を使用して、検証された(図17D、表1)。これらの結果に基づいて、アッセイは、H1-16及びN1-9サブタイプの144の可能な組み合わせのいずれかを潜在的に識別できた。

Figure 2022513602000004
Taking advantage of the specificity of Cas13 detection, Applicants used CARMEN-Cas13 to distinguish all epidemiologically relevant serotypes of various viral species in parallel and to parallel various viral strains. Distinguished. Diversity within a virus species poses a major challenge for detection. The assay must maintain selectivity for that group while correctly identifying many different sequences within a group of strains. Influenza A virus (IAV) hemagglutinin (H) and neuraminidase (N) subtypes H1-H16 and N1-N9 were selected as case studies. These serologically defined subtypes consist of strains capable of infecting a wide variety of host species, some of which are associated with a pandemic potential. H and N amplicons were identified that were well conserved for amplification with the parallel primer set. To identify subtypes, CATCH dx was used to design a specific set of crRNAs covering> 90% of the sequences within each subtype (FIG. 17A, FIG. 30, see Method for details). ). Optimal crRNAs were tested from each set using synthetic consensus sequences from H1-16 and N1-9, and these subtypes were readily identified (FIGS. 17B-17C, FIG. 31). N-subtyping assays were further tested using 35 synthetic sequences representing> 90% of sequence diversity within each N-subtype, 32 of 35 (91.4%) of these sequences. Was identified (FIG. 32). Subtyping assays were validated using seed stocks from H1N1 and H3N2 strains, IAV subtypes commonly circulating in humans, and synthetic sequences from avian IAV subtypes (FIG. 17D, table). 1). Based on these results, the assay was able to potentially identify any of the possible combinations of 144 of the H1-16 and N1-9 subtypes.
Figure 2022513602000004

Cas13の絶妙な特異性により、CARMEN-cas13は、薬剤耐性を付与するものなど、臨床的に関連するウイルス変異を多重で特定できる。概念実証として、HIV逆転写酵素(RT)コード配列と一組のcrRNAをタイリングしてプライマー対を設計し、6つの一般的な薬剤耐性突然変異(DRM、図18A、表2)を同定した。これらのDRMは、アフリカ、ラテンアメリカ、及びアジアの抗ウイルス薬ナイーブ患者集団に5~15%の頻度で蔓延している。設計は、合成標的を使用して試験された設計であり、6つすべての変異を並行して同定できた(図18B、図33)。出願人は、低対立遺伝子頻度でDRMを検出するためにRTアッセイの性能をさらに分析し、1%の頻度でK103Nを検出し、10%の頻度で他のDRMを検出できた(図34)。 Due to the exquisite specificity of Cas13, CARMEN-cas13 can identify multiple clinically relevant viral mutations, such as those that confer drug resistance. As a proof of concept, a primer pair was designed by tying a set of crRNAs with an HIV reverse transcriptase (RT) coding sequence, and six common drug resistance mutations (DRM, FIG. 18A, Table 2) were identified. .. These DRMs are prevalent in African, Latin American, and Asian antiviral naive patient populations with a frequency of 5-15%. The design was tested using synthetic targets and all 6 mutations could be identified in parallel (FIG. 18B, FIG. 33). Applicants were able to further analyze the performance of the RT assay to detect DRM with low allele frequency, detect K103N at a frequency of 1%, and detect other DRM at a frequency of 10% (FIG. 34). ..

RT DRMアッセイのさらなる検証は、4人のHIV患者からの臨床血漿サンプルで行われ(図18D)、ゴールドスタンダードアプローチであるサンガー配列決定アッセイと100%の一致を示した(4人の患者のうち3人にDRMは存在しなかった。1人の患者はK103N変異を持っていた)。特に、CARMEN HIV SNPアッセイは、プライマーとcrRNAの多重化が高くなる可能性が高いため、HAVパネルまたは関連するPCRよりもHIV検出の感度が高かった。アプローチの一般化可能性を実証するために、出願人はパネルを拡大して、高所得国における最前線のHIV治療の標的であるHIVインテグラーゼのDRMの包括的なセットを含めるようにした。増幅プライマーとcrRNAは、2017年に米国国際抗ウイルス学会によって臨床的に関連があると指定された21のインテグラーゼDRMすべてを標的とするように設計された。出願人は、9つの複合合成標的のセットを試験することにより、これらの変異のすべてを首尾よく特定した(図18E、表2)。注目すべきは、これらの複合標的の4つに複数のDRMが含まれており、CARMEN-Cas13が複数のDRMの組み合わせを同時に検出する能力が確認されたことである。

Figure 2022513602000005
Further validation of the RT DRM assay was performed on clinical plasma samples from 4 HIV patients (FIG. 18D) and showed 100% agreement with the gold standard approach Sanger sequencing assay (out of 4 patients). DRM was absent in 3 patients; 1 patient had the K103N mutation). In particular, the CARMEN HIV SNP assay was more sensitive to HIV detection than the HAV panel or associated PCR because of the high likelihood of high primer and crRNA multiplexing. To demonstrate the generalizability of the approach, Applicants expanded the panel to include a comprehensive set of DRMs for HIV integrase, the front-line HIV treatment targets in high-income countries. Amplification primers and crRNA were designed to target all 21 integrase DRMs designated clinically relevant by the American International Antiviral Society in 2017. Applicants have successfully identified all of these mutations by testing a set of nine complex synthetic targets (FIG. 18E, Table 2). Notably, four of these complex targets contained multiple DRMs, confirming the ability of CARMEN-Cas13 to detect multiple DRM combinations simultaneously.
Figure 2022513602000005

考察
CARMEN-Cas13の幅広い使用(種、株、及びSNPレベルでのウイルス配列の区別)と、高度に多重化された検出パネルを迅速に開発及び検証する能力が実証されている。より一般的には、CARMEN-Cas13は、スループットを向上させ、試験ごとの試薬とサンプルの消費を減らし、より大きなダイナミックレンジでの検出を可能にすることにより、CRISPRベースの核酸検出技術を増強する(図42A~42C)。CARMENの柔軟性とハイスループットは、既存のCARMENアッセイへの新しいプライマーまたはcrRNAの追加と迅速な最適化に対応し、既知の病原体配列の大部分の検出を容易にする。さらに、病原体の検出、発見、進化のより広い文脈において、CARMENと次世代シーケンシングは互いに補完し合う:CARMENは、ウイルスの進化を追跡するためにさらに配列決定することができる感染したサンプルを迅速に特定でき、新たに特定された配列は、改善されたCRISPRベースの診断の設計に情報を提供できる。配列決定データは指数関数的に増加しているため、最終的には、リスクの高い病原体に対してほぼ完全な感度を備えたCARMENアッセイを作成できる可能性がある。将来的には、出願人は、地域特異的な検出パネルを配備して、動物の媒介者、動物のリザーバー、または症状を呈している患者を含む、選択された集団からの何千ものサンプルを試験することを想定している。このようなパネルを日常的に採用するには、ヒトのサンプルを試験するときにデータを賢明に臨床的に使用するために、慎重な解釈を必要とする。CARMENは、CRISPRベースの診断を大規模に解き放つ。これは、患者のケアと公衆衛生を改善するための日常的な包括的な疾患監視に向けた重要なステップである。
Discussion The widespread use of CARMEN-Cas13 (distinguishing viral sequences at the species, strain, and SNP level) and the ability to rapidly develop and validate highly multiplexed detection panels have been demonstrated. More generally, CARMEN-Cas13 enhances CRISPR-based nucleic acid detection techniques by improving throughput, reducing reagent and sample consumption per test, and enabling detection over a larger dynamic range. (FIGS. 42A-42C). The flexibility and high throughput of CARMEN accommodates the addition and rapid optimization of new primers or crRNAs to existing CARMEN assays, facilitating the detection of most known pathogen sequences. In addition, in the broader context of pathogen detection, detection and evolution, CARMEN and next-generation sequencing complement each other: CARMEN can rapidly sequence infected samples to further track viral evolution. The newly identified sequences can inform the design of improved CRISPR-based diagnostics. Due to the exponential growth of sequencing data, it may ultimately be possible to create a CARMEN assay with near complete sensitivity to high-risk pathogens. In the future, Applicants will deploy region-specific detection panels to sample thousands of selected populations, including animal mediators, animal reservoirs, or symptomatic patients. It is supposed to be tested. Routine adoption of such panels requires careful interpretation in order to use the data wisely and clinically when testing human samples. CARMEN unleashes CRISPR-based diagnostics on a large scale. This is an important step towards routine comprehensive disease monitoring to improve patient care and public health.

材料及び方法
HIV患者からのヒトサンプルはBoca Biolisticsから商業的に入手され、すべてのプロトコールは、マサチューセッツ工科大学(MIT)及びMITとハーバードのブロード研究所の施設内審査委員会によって承認された。
Materials and Methods Human samples from HIV patients were obtained commercially from Boca Biolitics, and all protocols were approved by the Massachusetts Institute of Technology (MIT) and the in-facility review board of the Broad Institute of MIT and Harvard.

一般的な実験手順
標的、サンプル、及びcrRNAの調製
合成標的:合成DNA標的は、Integrated DNA Technologies(IDT)からオーダーしたものでありし、ヌクレアーゼを含まない水に再懸濁した。再懸濁したDNAをマイクロリットルあたり10コピーまで連続希釈し、PCR反応への入力として使用した。
General Experimental Procedure Preparation of Targets, Samples, and CrRNA Synthetic Targets: Synthetic DNA targets were ordered from Integrated DNA Technologies (IDT) and resuspended in nuclease-free water. The resuspended DNA was serially diluted to 104 copies per microliter and used as input to the PCR reaction.

サンプル調製:インフルエンザAウイルスの種ストックとHIV臨床サンプルについては、QIAamp Viral RNA Mini Kit(QIAGEN)とキャリアRNAを製造者の使用説明書に従って使用して、RNAを140μlの入力材料から抽出した。サンプルをヌクレアーゼを含まない水60μlで溶出し、使用するまで-80℃で保存した。抽出したRNA5μlを20μlの反応で一本鎖cDNAに変換した。まず、ランダムヘキサマープライマーを70℃で7分間サンプルRNAにアニーリングし、続いてRNase H処理なしで、ランダムヘキサマープライマーとともにSuperScript IVを使用して55℃で20分間逆転写した。cDNAは、使用するまで-20℃で保存した。
crRNA調製:ウイルス検出(図15~18)のために、crRNAはSynthegoによって合成され、ヌクレアーゼを含まない水に再懸濁された。SNP検出(図18)のために、crRNA DNAテンプレートを、1×Taq反応緩衝液(New England Biolabs)中で最終濃度10μMでT7プロモーターオリゴヌクレオチドにアニーリングさせた。この手順では、95℃で5分間の最初の変性に続いて、毎分5℃で4℃までアニーリングした。SNP検出crRNAは、HiScribe T7 High Yield RNA Synthesis Kit(New England Biolabs)を使用して、アニーリングされたDNAテンプレートからインビトロで転写された。短いRNA転写物に関する製造者の使用説明書に従って、30μlの容量で転写を行った。反応物を37℃で18時間または一晩インキュベートした。転写物は、RNAClean XPビーズ(Beckman Coulter)を使用して、ビーズの反応体積に対する比率を2倍にし、1.8倍のイソプロパノールをさらに添加して、ヌクレアーゼを含まない水に再懸濁して精製した。次いで、NanoDrop One(Thermo Scientific)を使用して、またはCytation 5(Biotek Instruments)によって吸光度を測定したTake3プレート上で、インビトロで転写されたRNA生成物を定量した。Cas13aをGenscriptに記載されているように組換え発現させ、精製し、保存緩衝液(600mM NaCl、50mM Tris-HCl pH7.5、5%グリセロール、2mM DTT)に保存した。
Sample Preparation: For influenza A virus seed stock and HIV clinical samples, RNA was extracted from 140 μl of input material using QIAamp Viral RNA Mini Kit (QIAGEN) and carrier RNA according to the manufacturer's instructions. The sample was eluted with 60 μl of nuclease-free water and stored at −80 ° C. until use. 5 μl of the extracted RNA was converted to single-stranded cDNA by a reaction of 20 μl. First, random hexamer primers were annealed to sample RNA at 70 ° C. for 7 minutes, followed by reverse transcription at 55 ° C. for 20 minutes using SuperScript IV with random hexamer primers without RNase H treatment. The cDNA was stored at −20 ° C. until use.
crRNA preparation: For virus detection (FIGS. 15-18), crRNA was synthesized by Synthego and resuspended in nuclease-free water. For SNP detection (FIG. 18), the crRNA DNA template was annealed to the T7 promoter oligonucleotide at a final concentration of 10 μM in 1 × Taq reaction buffer (New England Biolabs). In this procedure, the first denaturation at 95 ° C. for 5 minutes was followed by annealing at 5 ° C. per minute to 4 ° C. SNP-detected crRNAs were transcribed in vitro from annealed DNA templates using the HiScribe T7 High Yield RNA Synthesis Kit (New England Biolabs). Transcription was performed in a volume of 30 μl according to the manufacturer's instructions for short RNA transcripts. The reaction was incubated at 37 ° C. for 18 hours or overnight. The transcript is purified by using RNAClean XP beads (Beckman Coulter), doubling the ratio of the beads to the reaction volume, adding 1.8 times more isopropanol, and resuspending in nuclease-free water. did. RNA products transcribed in vitro were then quantified using NanoDrop One (Thermo Scientific) or on Take3 plates whose absorbance was measured by Equation 5 (Biotech Instruments). Cas13a was recombinantly expressed as described in Genscript, purified and stored in storage buffer (600 mM NaCl, 50 mM Tris-HCl pH 7.5, 5% glycerol, 2 mM DTT).

核酸増幅
特に明記しない限り、増幅は、20μlの反応において、プライマープール(各プライマー150nMを含む)を使用して、Q5ホットスタートポリメラーゼ(New England Biolabs)を使用するPCRによって実施された。増幅したサンプルは、使用するまで-20℃で保存した。熱サイクル条件の詳細については、方法を参照されたい。
Nucleic Acid Amplification Unless otherwise stated, amplification was performed by PCR using a Q5 hot start polymerase (New England Biolabs) in a 20 μl reaction using a primer pool (containing 150 nM of each primer). The amplified sample was stored at −20 ° C. until use. See Methods for more information on thermal cycle conditions.

Cas13検出反応
Cas13検出反応:検出アッセイは、45nMの精製された1mM ATP、1mM GTP、1mM UTP、1mM CTP、及び0.6μl T7ポリメラーゼミックス(Lucigen)を含むヌクレアーゼアッセイ緩衝液(40mM Tris-HCl、60mM NaCl、pH7.3)中のLwaCas13a、22.5nM crRNA、500nMクエンチした蛍光RNAレポーター(RNAse Alert v2、Thermo Scientific)、2μlマウスRNase阻害剤(New England Biolabs)を用いて行った。増幅された核酸の入力は、本明細書に詳細を記載したアッセイによって変化した。検出ミックスを2.2×マスターミックスとして調製し、各液滴がカラーコード化後の2×マスターミックスと、液滴のマージ後の1×マスターミックスを含むようにした。
Cas13 detection reaction Cas13 detection reaction: The detection assay is a nuclease assay buffer containing 45 nM purified 1 mM ATP, 1 mM GTP, 1 mM UTP, 1 mM CTP, and 0.6 μl T7 polymerase mix (Lucien) (40 mM Tris-HCl, LwaCas13a in 60 mM NaCl, pH 7.3), 22.5 nM crRNA, 500 nM quenched fluorescent RNA reporter (RNAse Assay v2, Thermo Scientific), 2 μl mouse RNase inhibitor (New England Biolabs). The input of amplified nucleic acid was altered by the assay detailed herein. The detection mix was prepared as a 2.2x master mix so that each droplet contained a 2x master mix after color coding and a 1x master mix after merging the droplets.

カラーコード化、乳化、及び液滴プール化
カラーコード化:特に明記しない限り、増幅したサンプルは、13.2mM MgClを添加したヌクレアーゼを含まない水で1:10に希釈してから、カラーコード化して液滴のマージ後の最終濃度を6mMにした。検出ミックスは希釈されなかった。カラーコードストック(2μL)を96Wプレートに並べた(カラーコードの構築に関する詳細情報については、以下の方法を参照されたい)。増幅された各サンプルまたは検出ミックス(18μL)を異なるカラーコードに加え、ピペッティングによって混合した。
Color coding, emulsification, and droplet pooling Color coding: Unless otherwise stated, amplified samples are diluted 1:10 with water containing 13.2 mM MgCl 2 nuclease-free and then color coded. The final concentration after merging the droplets was 6 mM. The detection mix was not diluted. Color code stock (2 μL) was placed on a 96 W plate (see method below for more information on building color codes). Each amplified sample or detection mix (18 μL) was added to different color codes and mixed by pipetting.

乳化:カラーコード化された試薬(20μL)及びフルオラス油(3M 7500、70μL)中の2% 008-フルオロ界面活性剤(RAN Biotechnologies)を液滴生成器カートリッジ(Bio Rad)に添加し、液滴生成器(QX200、Bio Rad)を使用して試薬を液滴に乳化した。 Emulsification: 2% 008-fluorosurfactant (RAN Biotechnologies) in color coded reagent (20 μL) and fluorus oil (3M 7500, 70 μL) is added to the droplet generator cartridge (BioRad) and droplets are added. The reagent was emulsified into droplets using a generator (QX200, BioRad).

液滴プール化:各標準チップをロードするために、150μLの液滴の総液滴プール容量が使用された。各mChipをロードするために合計800μLの液滴が使用された。生産的な液滴ペアリング(増幅されたサンプル液滴+検出試薬液滴)を形成する確率を最大化するために、液滴プールの総容量の半分を標的液滴に、半分を検出試薬液滴に割り当てた。プール化するために、個々の液滴混合物を96Wプレートに並べた。マルチチャネルピペットを使用して、各液滴タイプの必要量を8つの液滴プールの1列に移し、さらにそれらを組み合わせて単一の液滴プールを作成した。プール内の液滴の配置を完全にランダム化するために、最終的な液滴プールを上下に静かにピペッティングした。 Droplet pooling: A total drop pool capacity of 150 μL droplets was used to load each standard chip. A total of 800 μL droplets were used to load each mChip. To maximize the probability of forming productive droplet pairing (amplified sample droplet + detection reagent droplet), half of the total volume of the droplet pool will be the target droplet and half will be the detection reagent solution. Assigned to the drop. Individual droplet mixtures were lined up on 96W plates for pooling. A multi-channel pipette was used to transfer the required amount of each drop type into a row of eight drop pools, which were then combined to create a single drop pool. The final droplet pool was gently pipetted up and down to completely randomize the placement of the droplets in the pool.

マイクロウェルアレイのロード、画像化、及びマージ
マイクロウェルアレイローディング(標準チップ):標準チップのロードは、前述のように実行された。簡潔に述べると、各チップをアクリル製のチップローダーに入れ、疎水性ガラスの表面から約300~500μm上にチップを吊るし、チップとガラスの間にフロースペースを作った。フロースペースは、ロードするまでフルオラス油(3M、7500)で満たされた。ロードの直前に、フルオラス油がフロースペースから排出された。1回のピペッティングステップで、液滴プールがフロースペースに追加された(図20、ステップ3)。ローダーを傾けて、マイクロウェルが液滴で満たされるまで、フロースペース内で液滴プールを移動させた。界面活性剤を含まない新鮮なフルオラス油(3M 7500)を使用してフロースペースを洗浄し(3×1mL)、フロースペースを油で満たし、ローダーをねじって閉めることによってチップをガラスに対して密封した(図20、ステップ4)。追加の油(1mL)をローディングスロットに追加し、蒸発を防ぐためにスロットを透明テープ(Scotch)で密閉した。
Microwell array loading, imaging, and merging Microwell array loading (standard chip): Standard chip loading was performed as described above. Briefly, each chip was placed in an acrylic chip loader and hung about 300-500 μm above the surface of the hydrophobic glass to create a flow space between the chip and the glass. The flow space was filled with fluorous oil (3M, 7500) until loaded. Immediately before loading, fluorous oil was drained from the flow space. In one pipetting step, a droplet pool was added to the flow space (FIG. 20, step 3). The loader was tilted to move the droplet pool within the flow space until the microwells were filled with droplets. Clean the flow space with fresh detergent-free Fluorus oil (3M 7500) (3 x 1 mL), fill the flow space with oil, and seal the chip against the glass by twisting and closing the loader. (Fig. 20, step 4). Additional oil (1 mL) was added to the loading slot and the slot was sealed with clear tape (Scotch) to prevent evaporation.

マイクロウェルアレイローディング(mChips):mChipの裏面をmChipローダーの蓋に押し付けて、チップを蓋に接着させ、マイクロウェルアレイを外に向けたままにした(図25C、中央の図)。蓋はローダーベース上に置かれ、蓋とベースの反対側の磁石が蓋とチップをベースの上に吊るされた状態で保持した(図25C、右の図、及び図25D)。ネジのウィングナットを使用して、チップの表面とベースの間のフロースペースが約300~500μmになるまで、蓋をベースに向かって押した(図25C、右の図)。フロースペースは、ロードするまでフルオラス油(3M、7500)で満たされた。ロードの直前に、フルオラス油がフロースペースから排出された。1回のピペッティングステップで、チップの端に沿ってピペッティングすることにより、液滴プールがフロースペースに追加された(図25D、ステップ3)。ローダーを傾けて、マイクロウェルが液滴で満たされるまで、フロースペース内で液滴プールを移動させた。界面活性剤を含まない新鮮なフルオラス油(3M 7500)を使用して、フロースペースを洗浄した(3×1mL)。2片のPCRフィルム(MicroAmp,Applied Biosystems)を、1片の粘着面をもう1片の端から数ミリメートル上に置くことによって接合した。PCRフィルムのシートをフルオラス油で濡らして、取っておいた。ローダーに戻る:ローダーの蓋(mChipを取り付けた状態)をベースから取り外すことができるように、ウィングナットを取り外した。mChipは、湿ったPCRフィルムのシートに対して1回の滑らかな動きで密閉された(図25D、ステップ4)。チップの端にぶら下がっている余分なPCRフィルムは、かみそりの刃で切り取った。 Microwell array loading (mChips): The back of the mChip was pressed against the lid of the mChip loader to adhere the chips to the lid and leave the microwell array facing out (FIG. 25C, center view). The lid was placed on the loader base, and magnets on the opposite side of the lid and base held the lid and chip suspended above the base (FIG. 25C, right figure, and 25D). Using the wing nut of the screw, the lid was pushed toward the base until the flow space between the surface of the tip and the base was about 300-500 μm (Fig. 25C, right figure). The flow space was filled with fluorous oil (3M, 7500) until loaded. Immediately before loading, fluorous oil was drained from the flow space. A droplet pool was added to the flow space by pipetting along the edge of the chip in a single pipetting step (FIG. 25D, step 3). The loader was tilted to move the droplet pool within the flow space until the microwells were filled with droplets. The flow space was washed (3 x 1 mL) with fresh fluorous oil (3M 7500) without surfactant. Two pieces of PCR film (MicroAmp, Applied Biosystems) were joined by placing one piece of adhesive surface a few millimeters above the other end. A sheet of PCR film was wetted with Fluorous oil and set aside. Return to loader: The wing nut was removed so that the loader lid (with the mChip attached) could be removed from the base. The mChip was sealed with a single smooth motion against a sheet of moist PCR film (FIG. 25D, step 4). The excess PCR film hanging on the edge of the chip was cut off with a razor blade.

マイクロウェルアレイの画像化、マージ、及びその後の画像化:チップをロードした後、各液滴のカラーコードを蛍光顕微鏡で識別した(図20、ステップ4)。画像化後、各マイクロウェル内の液滴ペアは、ガラスまたはPCRフィルム上にコロナ処理器の先端を通過させることによってマージされた(図20、ステップ5)。マージ液滴は、蛍光顕微鏡によってすぐに画像化され(図20、ステップ6)、その後の画像化の時点までインキュベーター(37℃)に配置する。すべての画像化は、自動ステージ(Ludl Electronics,Bio Precision 3 LM)、LED光源(Sola)、及びカメラ(Hamamatsu)を備えたNikon TI2顕微鏡で実施された。標準チップは2倍の対物レンズを使用して画像化したが、mChipには1倍の対物レンズを使用して画像化時間を短縮した。画像化中、顕微鏡のコンデンサーを後ろに傾けて、488チャネルのバックグラウンド蛍光を減らした。さらに、UVチャネル画像化を含む実験中は、天井から散乱する光からのバックグラウンド蛍光を減らすために、黒い布で顕微鏡を覆った。 Imaging, merging, and subsequent imaging of microwell arrays: After loading the chips, the color code of each droplet was identified with a fluorescence microscope (FIG. 20, step 4). After imaging, the droplet pairs in each microwell were merged by passing the tip of a corona processor onto glass or PCR film (FIG. 20, step 5). The merged droplets are immediately imaged by a fluorescence microscope (FIG. 20, step 6) and placed in an incubator (37 ° C.) until the point of subsequent imaging. All imaging was performed with a Nikon TI2 microscope equipped with an automatic stage (Ludl Electronics, Bio Precision 3 LM), LED light source (Sola), and camera (Hamamatsu). The standard chip was imaged using a 2x objective lens, but the mChip was imaged using a 1x objective lens to shorten the imaging time. During imaging, the microscope capacitor was tilted backwards to reduce background fluorescence on channel 488. In addition, during experiments involving UV channel imaging, the microscope was covered with a black cloth to reduce background fluorescence from light scattered from the ceiling.

データ分析
データ分析:画像化データは、カスタムPythonスクリプトを使用して分析された。分析は3つの部分で構成された。(1)液滴のカラーコードに基づいて各液滴の内容物の同一性を判定するマージ前の画像分析、(2)各液滴ペアの蛍光出力を決定し、それらの蛍光値をマイクロウェルの内容物にマッピングするマージ後の画像解析、(3)パート1及び2で得られたデータの統計分析。
Data analysis Data analysis: The imaged data was analyzed using a custom Python script. The analysis consisted of three parts. (1) Image analysis before merging to determine the identity of the contents of each droplet based on the color code of the droplet, (2) Determine the fluorescence output of each droplet pair and microwell their fluorescence values. Image analysis after merging that maps to the contents of (3) Statistical analysis of the data obtained in parts 1 and 2.

マージ前の画像解析:各液滴の内容物は、液滴マージ前に撮影された画像から決定された。各液滴画像からバックグラウンド画像が差し引かれ、各チャネルの強度範囲がほぼ同じになるように蛍光チャネル強度がスケーリングされた。液滴はハフ変換を使用して識別され、各液滴位置での各チャネルの蛍光強度は、局所的な畳み込み画像から決定された。クロスチャネル光ブリードの補正が適用され、すべての蛍光強度は647nm、594nm、及び555nmチャネルの合計に対して正規化された。4チャネルデータセットの場合、3色空間の分析は、正規化された強度で直接実行された。5チャネルデータセットの場合、ダウンストリーム分析のために液滴をUV強度ビンに分割した(図24)。各UVビンの3色空間を個別に分析した。各液滴の3色の強度ベクトルがユニットシンプレックスに投影され、ノイズのあるアプリケーションの密度ベースの空間クラスタリング(DBSCAN)を使用して、各カラーコードクラスターに標識を割り当てた。必要に応じて、クラスタリングの手動調整が行われた。5チャネルデータセットの場合、割り当て後にUV強度ビンを再結合して、完全なデータセットを作成した(図24)。 Image analysis before merging: The content of each droplet was determined from the images taken prior to the droplet merging. The background image was subtracted from each droplet image and the fluorescence channel intensity was scaled so that the intensity range of each channel was approximately the same. The droplets were identified using the Hough transform and the fluorescence intensity of each channel at each droplet location was determined from the local convolution image. Cross-channel optical bleed correction was applied and all fluorescence intensities were normalized to the sum of the 647 nm, 594 nm, and 555 nm channels. For 4-channel datasets, analysis of the 3-color space was performed directly with normalized intensity. For a 5-channel dataset, the droplets were split into UV intensity bins for downstream analysis (FIG. 24). The three color spaces of each UV bin were analyzed individually. A three-color intensity vector for each droplet was projected onto the unit simplex, and a marker was assigned to each color-coded cluster using density-based spatial clustering (DBSCAN) for noisy applications. Manual adjustments to clustering were made as needed. For a 5-channel dataset, the UV intensity bins were recombined after allocation to create a complete dataset (FIG. 24).

マージ後の画像解析:バックグラウンド減算、強度スケーリング、補正、及び正規化は、マージ前の分析と同様に実施された。マージ前及びマージ後の画像の画像登録に続いて、各液滴ペアの位置でのレポーターチャネルの蛍光強度が、局所的に畳み込まれた画像から決定された。各カラーコードの以前に決定された位置への蛍光レポーターチャネルの物理的なマッピングは、レポーターチャネルの蛍光シグナルを各ウェルの内容物に割り当てるのに役立った。適切なマージ後の液滴サイズ(マージされていない液滴ペアを除く)と、液滴のカラーコードとその指定されたクラスターとの近さについての品質フィルタリングが適用された(図24を参照されたい)。 Post-merging image analysis: Background subtraction, intensity scaling, correction, and normalization were performed as in the pre-merging analysis. Following image registration of the images before and after merging, the fluorescence intensity of the reporter channel at the location of each drop pair was determined from the locally convoluted image. The physical mapping of the fluorescent reporter channel to the previously determined position of each color code helped to assign the fluorescent signal of the reporter channel to the contents of each well. Quality filtering was applied for the appropriate post-merged droplet size (excluding unmerged droplet pairs) and the proximity of the droplet color code to its specified cluster (see Figure 24). sea bream).

統計学的分析:ヒートマップは、各crRNA標的ペアの蛍光値の中央値から生成された。オンターゲット及びオフターゲットのすべての液滴からの蛍光分布の受信者動作特性(ROC)曲線を計算して曲線下面積(AUC)を決定することにより、各ガイドの性能を評価した。 Statistical analysis: Heatmaps were generated from the median fluorescence of each crRNA target pair. The performance of each guide was evaluated by calculating the receiver operating characteristic (ROC) curves of the fluorescence distribution from all on-target and off-target droplets to determine the area under the curve (AUC).

実験特異的プロトコール
ジカ検出(図15C)
核酸増幅:ジカウイルス検出(図15C、図22)のために、リコンビナーゼポリメラーゼ増幅(RPA)が使用された。RPA反応は、Twist-Dx RT-RPAキットを製造者の使用説明書に従って使用して行った。プライマー濃度は480nM、MgAc濃度は17mMであった。RNAを含む増幅反応では、マウスRNase阻害剤(New England Biolabs M3014L)を最終濃度2単位/マイクロリットルで使用した。すべてのRPA反応は、特に明記しない限り、41℃で20分間インキュベートした。RPAプライマー配列はリストされている。RPA反応は、カラーコード化する前にヌクレアーゼを含まない水で1:10に希釈した。
Experiment-specific protocol deer detection (Fig. 15C)
Nucleic Acid Amplification: Recombinase polymerase amplification (RPA) was used for Zika virus detection (FIG. 15C, FIG. 22). The RPA reaction was performed using the Twist-Dx RT-RPA kit according to the manufacturer's instructions. The primer concentration was 480 nM and the MgAc concentration was 17 mM. In the RNA-containing amplification reaction, a mouse RNase inhibitor (New England Biolabs M3014L) was used at a final concentration of 2 units / microliter. All RPA reactions were incubated at 41 ° C. for 20 minutes unless otherwise stated. The RPA primer sequences are listed. The RPA reaction was diluted 1:10 with nuclease-free water prior to color coding.

Cas13検出反応:ジカ検出実験(図15C)について、検出ミックスには、液滴のマージ前に最終濃度6mMのMgClが補充された。CARMENとSHERLOCKの比較のために(図22)、検出反応の蛍光を測定するためにBiotek Cytation 5プレートリーダーを使用した。蛍光速度論は、485nmで励起し、520nmで発光するモノクロメーターを使用して、5分ごとに最大3時間読み取りを行い、モニタリングした。 Cas13 detection reaction: For the deer detection experiment (FIG. 15C), the detection mix was supplemented with MgCl 2 at a final concentration of 6 mM prior to droplet merging. For comparison of CARMEN and SHERLOCK (FIG. 22), a Biotek Cytation 5 plate reader was used to measure the fluorescence of the detection reaction. Fluorescence kinetics was monitored by reading every 5 minutes for up to 3 hours using a monochromator that was excited at 485 nm and emitted at 520 nm.

ヒト関連ウイルスパネル(図16)
核酸増幅:ヒト関連ウイルスパネルについて、増幅は、20μlの反応において、プライマープール(各プライマー150nMを含む)を使用して、Q5ホットスタートポリメラーゼ(New England Biolabs)を使用して実施された。次の熱サイクル条件が使用された。(i)98℃で2分間の初期変性、(ii)98℃で15秒、50℃で30秒、72℃で30秒を45サイクル、(iii)72℃で2分の最終伸長。
Human-related virus panel (Fig. 16)
Nucleic Acid Amplification: For human-related virus panels, amplification was performed in a 20 μl reaction using a primer pool (containing 150 nM of each primer) and a Q5 hot start polymerase (New England Biolabs). The following thermal cycle conditions were used. (I) Initial denaturation at 98 ° C. for 2 minutes, (ii) 45 cycles at 98 ° C. for 15 seconds, 50 ° C. for 30 seconds, 72 ° C. for 30 seconds, (iii) Final elongation at 72 ° C. for 2 minutes.

インフルエンザA(図17)
種ストックの情報:この研究では、3種類のインフルエンザAウイルス株に由来するウイルスの種ストックを使用した。A/Puerto Rico/8/1934(HlNl)、A/Hong Kong/l-l-MA-12/1968(H3N2)、及びA/Hong Kong/1/1968-2 mouse-adapted 21-2(H3N2).
Influenza A (Fig. 17)
Species Stock Information: This study used a seed stock of viruses derived from three influenza A virus strains. A / Puerto Rico / 8/1934 (HlNl), A / Hong Kong / l-l-MA-12 / 1968 (H3N2), and A / Hong Kong / 1 / 1968-2 mouse-adapted 21-2 (H3N2) ..

核酸増幅:インフルエンザサブタイピングパネルについて、増幅は、20μlの反応において、プライマープール(各プライマー150nMを含む)を使用して、Q5ホットスタートポリメラーゼ(New England Biolabs)を使用して実施された。次の熱サイクル条件が使用された。(i)98℃で2分間の初期変性、(ii)98℃で15秒、52℃で30秒、72℃で30秒の40サイクル、(iii)72℃で2分の最終伸長。図3Dに示す実験では、HとNの増幅反応物を一緒に希釈した。カラーコード化する前に、13.2mM MgClを補充したヌクレアーゼを含まない水でH反応物を1:10希釈し、Nを1:5希釈した。 Nucleic Acid Amplification: For influenza subtyping panels, amplification was performed in a 20 μl reaction using a primer pool (containing 150 nM of each primer) using a Q5 hot start polymerase (New England Biolabs). The following thermal cycle conditions were used. (I) Initial denaturation at 98 ° C. for 2 minutes, (ii) 40 cycles at 98 ° C. for 15 seconds, 52 ° C. for 30 seconds, 72 ° C. for 30 seconds, (iii) Final elongation at 72 ° C. for 2 minutes. In the experiment shown in FIG. 3D, the H and N amplification reactants were diluted together. Prior to color coding, the H reactant was diluted 1:10 and N was diluted 1: 5 with nuclease-free water supplemented with 13.2 mM MgCl 2 .

HIV DRM(図18)
核酸増幅:HIV DRMパネルについて、増幅は、20μlの反応において、プライマープール(各プライマー150nMを含む)を使用して、Q5ホットスタートポリメラーゼ(New England Biolabs)を使用して実施された。次の熱サイクル条件が使用された。(i)98℃で2分間の初期変性、(ii)98℃で15秒、52℃で30秒、72℃で30秒を40サイクル、(iii)72℃で2分の最終伸長。図4に示す実験では、カラーコード化する前に、13.2mM MgClを補充したヌクレアーゼを含まない水に偶数反応物と奇数反応物を一緒に1:10に希釈した。
HIV DRM (Fig. 18)
Nucleic Acid Amplification: For the HIV DRM panel, amplification was performed in a 20 μl reaction using a primer pool (including 150 nM of each primer) using a Q5 hot start polymerase (New England Biolabs). The following thermal cycle conditions were used. (I) Initial denaturation at 98 ° C. for 2 minutes, (ii) 40 cycles of 98 ° C. for 15 seconds, 52 ° C. for 30 seconds, 72 ° C. for 30 seconds, (iii) Final elongation at 72 ° C. for 2 minutes. In the experiment shown in FIG. 4, even and odd reactants were diluted 1:10 together in nuclease-free water supplemented with 13.2 mM MgCl 2 prior to color coding.

ソフトウェアと核酸配列の設計
ヒト関連ウイルスパネル設計
概要:ヒト関連ウイルスパネル配列設計戦略の概要を図26に示す。簡潔に述べると、設計パイプラインは、ウイルスゲノムセグメントのアライメント、PCRアンプリコン選択、続いて交差反応性の確認を伴うcrRNA選択で構成された。最後に、PCRプライマーを系統発生的にプールした。
Software and Nucleic Acid Sequence Design Human-Related Virus Panel Design Overview: An overview of the human-related virus panel sequence design strategy is shown in FIG. Briefly, the design pipeline consisted of viral genome segment alignment, PCR amplicon selection, followed by crRNA selection with confirmation of cross-reactivity. Finally, PCR primers were phylogenetically pooled.

ウイルスゲノムセグメントのアライメント:ウイルスゲノムネイバーはNCBIからダウンロードされた。各ウイルス種の各セグメントは、mafft v7.31を使用して次のパラメーターで整列された。--retree 1 --preservecase。アライメントは、間違った種に割り当てられた配列、逆補完された配列、または間違ったゲノムセグメントに由来する配列を削除するために精選された。整列したゲノムセグメントへのリンクは、次の場所で見つけることができる。 Viral Genome Segment Alignment: Viral Genome Neighbors were downloaded from NCBI. Each segment of each virus species was aligned with the following parameters using mafft v7.31. --Retree 1 --preservecase. Alignments were selected to remove sequences assigned to the wrong species, decomplemented sequences, or sequences derived from the wrong genomic segment. Links to aligned genomic segments can be found at:

PCRアンプリコン選択:潜在的なPCR結合部位は、20ヌクレオチドのウィンドウサイズと長さ、及びアライメント内の配列の90%のカバレッジ要件を備えたCATCH-dxを使用して識別された。(1)多様な配列を包括的に標的とする自動化された継続的なcrRNA設計。原稿準備中。2)包括的でスケーラブルなプローブ設計によるメタゲノムの配列多様性の捕捉。Nature Biotechnology(2019).) PCR amplicon selection: Potential PCR binding sites were identified using CATCH-dx with a window size and length of 20 nucleotides and a coverage requirement of 90% of the sequences in the alignment. (1) Automated continuous crRNA design that comprehensively targets diverse sequences. Manuscript is being prepared. 2) Capture of metagenomic sequence diversity by comprehensive and scalable probe design. Nature Biotechnology (2019). )

70及び200ヌクレオチドの距離内のプライマー結合部位の潜在的なペアが選択された。潜在的なプライマーペアのこれらのセットは、プライマー3 v2.4.0に入力され、適切なPCRプライマーを増幅のために設計できるかどうかを確認した。Primer3は、次のパラメーターを使用して実行された。PRIMER_TASK=generic、PRIMER_EXPLAIN_FLAG=1、PRIMER_MIN_SIZE=15、PRIMER_OPT_SIZE=18、PRIMER_MAX_SIZE=20、PRIMER_MIN_GC=30.0、PRIMER_MAX_GC=70.0、PRIMER_MAX_Ns_ACCEPTED=0、PRIMER_MIN_TM=52.0、PRIMER_OPT_TM=54.0、PRIMER_MAX_TM=56.0、PRIMER_MAX_DIFF_TM=1.5、PRIMER_MAX_HAIRPIN_TH=40.0、PRIMER_MAX_SELF_END_TH=40.0、PRIMER_MAX_SELF_ANY_TH=40.0、PRIMER_PRODUCT_SIZE_RANGE=70-200。潜在的なアンプリコンのリストは、プライマー3出力ファイルを解析し、フォワードプライマーとリバースプライマーの任意のペア間の融解温度の最大差が4℃未満である(プール内のすべてのプライマーが同様のPCR効率を持つようにする)ことを確認するためにフィルタリングすることによって生成された。潜在的なアンプリコンのこのリストは、プライマー3によって測定されるように、設計のフォワードプライマーとリバースプライマーのすべてのペア間の平均ペアワイズペナルティに基づいてスコア化された。crRNA設計には、各種から最高スコアのアンプリコンが選択された。 Potential pairs of primer binding sites within a distance of 70 and 200 nucleotides were selected. These sets of potential primer pairs were populated in Primer 3 v2.4.0 to see if suitable PCR primers could be designed for amplification. Primer3 was run using the following parameters: PRIMER_TASK = generic, PRIMER_EXPLAIN_FLAG = 1, PRIMER_MIN_SIZE = 15, PRIMER_OPT_SIZE = 18, PRIMER_MAX_SIDE = 20, PRIMER_MIN_GC = 30.0, PRIMER_MIN_GC = 30.0, PRIMER_MAX_GC = 70.0, PRIMER_MAX_GC = 70.0 56.0, PRIMER_MAX_DIFF_TM = 1.5, PRIMER_MAX_HAIRPIN_TH = 40.0, PRIMER_MAX_SELF_END_TH = 40.0, PRIMER_MAX_SELF_ANY_TH = 40.0, PRIMER_PRODUCT_SIDE_RANGE- A list of potential amplicon analyzes the Primer 3 output file and the maximum difference in melting temperature between any pair of forward and reverse primers is less than 4 ° C (all primers in the pool have similar PCR). Generated by filtering to make sure it has efficiency). This list of potential amplicon was scored based on the average pairwise penalty between all pairs of forward and reverse primers of the design, as measured by Primer 3. For the crRNA design, the highest-scoring amplicon was selected from various types.

crRNA設計:CATCH-dxと呼ばれるソフトウェアパッケージを使用して、各アンプリコンアライメントの40ntウィンドウ内の配列の90%に結合するために必要なcrRNAの最小数を決定し、ウィンドウ内で1つまでのミスマッチを許容し、G-Uペアリングを可能にした。これらのcrRNAセットは、科レベルで交差反応性について試験され、同じ科内の他の種の配列の>99%で3つ以上のミスマッチが必要となり、G-Uペアリングが可能になった。この厳格な閾値は、ヒト関連ウイルスアッセイの高い特異性を確保するために選択された。近縁のウイルス属(エンテロウイルス及びポックスウイルス)については、各種の多数のコンセンサス配列が異なる領域が選択され、多数のコンセンサスレベルで十分な配列多様性があるウィンドウでのみcrRNAが考慮された。 crRNA design: A software package called CATCH-dx is used to determine the minimum number of crRNA required to bind 90% of the sequences in a 40 nt window of each amplicon alignment and up to one in the window. It allowed mismatches and enabled GU pairing. These crRNA sets were tested for cross-reactivity at the family level, requiring 3 or more mismatches in> 99% of sequences of other species within the same family, allowing GU pairing. This strict threshold was chosen to ensure the high specificity of the human-related viral assay. For closely related viral genera (enterovirus and poxvirus), regions with different consensus sequences of various types were selected and crRNA was considered only in windows with sufficient sequence diversity at multiple consensus levels.

プライマープール化:データベースに>=10の配列を持つ少なくとも1つのセグメントを有する169種のセット用にプライマーを設計した。これ以降、ヒト関連ウイルスパネル10バージョン1またはhav10-v1と呼ばれる。マルチプレックスPCRの制限により、バージョン1の設計で169のhav10種用に設計された210のプライマーペアは、15のプライマープールに分割され、以下でより詳細に説明される。 Primer pooling: Primers were designed for a set of 169 species with at least one segment with> = 10 sequences in the database. Hereinafter referred to as human-related virus panel 10 version 1 or hav10-v1. Due to the limitations of multiplex PCR, 210 primer pairs designed for 169 hav10 species in version 1 design are divided into 15 primer pools, which are described in more detail below.

保存されたプライマープール:14種は、プライマー設計アルゴリズムとプール戦略を試験するためのパイロット実験として保存された種を選択した。これらの種は、150nMの最終濃度で単一の「保存された」プライマープールに結合された。

Figure 2022513602000006
Figure 2022513602000007
Figure 2022513602000008
Figure 2022513602000009
Figure 2022513602000010
Figure 2022513602000011
Figure 2022513602000012
Figure 2022513602000013
Figure 2022513602000014
Figure 2022513602000015
Figure 2022513602000016
Figure 2022513602000017
Figure 2022513602000018
Figure 2022513602000019
Figure 2022513602000020
Figure 2022513602000021
Figure 2022513602000022
Figure 2022513602000023
Figure 2022513602000024
Figure 2022513602000025
Figure 2022513602000026
Figure 2022513602000027
Figure 2022513602000028
Figure 2022513602000029
Figure 2022513602000030
Figure 2022513602000031
Figure 2022513602000032
Figure 2022513602000033
Figure 2022513602000034
Figure 2022513602000035
Figure 2022513602000036
Figure 2022513602000037
Figure 2022513602000038
Figure 2022513602000039
Figure 2022513602000040
Figure 2022513602000041
Figure 2022513602000042
Figure 2022513602000043
Figure 2022513602000044
Figure 2022513602000045
Figure 2022513602000046
Figure 2022513602000047
Figure 2022513602000048
Figure 2022513602000049
Figure 2022513602000050
Figure 2022513602000051
Figure 2022513602000052
Figure 2022513602000053
Figure 2022513602000054
Figure 2022513602000055
Figure 2022513602000056
Figure 2022513602000057
Figure 2022513602000058
Figure 2022513602000059
Figure 2022513602000060
Figure 2022513602000061
Figure 2022513602000062
Figure 2022513602000063
Figure 2022513602000064
Figure 2022513602000065
Figure 2022513602000066
Figure 2022513602000067
Figure 2022513602000068
Figure 2022513602000069
Figure 2022513602000070
Figure 2022513602000071
Figure 2022513602000072
Figure 2022513602000073
Figure 2022513602000074
Figure 2022513602000075
Figure 2022513602000076
Figure 2022513602000077
Figure 2022513602000078
Figure 2022513602000079
Figure 2022513602000080
Figure 2022513602000081
Figure 2022513602000082
Figure 2022513602000083
Figure 2022513602000084
Figure 2022513602000085
Figure 2022513602000086

Figure 2022513602000087
Figure 2022513602000088
Figure 2022513602000089
Conserved Primer Pools: For 14 species, conserved species were selected as pilot experiments to test primer design algorithms and pooling strategies. These seeds were bound to a single "conserved" primer pool at a final concentration of 150 nM.
Figure 2022513602000006
Figure 2022513602000007
Figure 2022513602000008
Figure 2022513602000009
Figure 2022513602000010
Figure 2022513602000011
Figure 2022513602000012
Figure 2022513602000013
Figure 2022513602000014
Figure 2022513602000015
Figure 2022513602000016
Figure 2022513602000017
Figure 2022513602000018
Figure 2022513602000019
Figure 2022513602000020
Figure 2022513602000021
Figure 2022513602000022
Figure 2022513602000023
Figure 2022513602000024
Figure 2022513602000025
Figure 2022513602000026
Figure 2022513602000027
Figure 2022513602000028
Figure 2022513602000029
Figure 2022513602000030
Figure 2022513602000031
Figure 2022513602000032
Figure 2022513602000033
Figure 2022513602000034
Figure 2022513602000035
Figure 2022513602000036
Figure 2022513602000037
Figure 2022513602000038
Figure 2022513602000039
Figure 2022513602000040
Figure 2022513602000041
Figure 2022513602000042
Figure 2022513602000043
Figure 2022513602000044
Figure 2022513602000045
Figure 2022513602000046
Figure 2022513602000047
Figure 2022513602000048
Figure 2022513602000049
Figure 2022513602000050
Figure 2022513602000051
Figure 2022513602000052
Figure 2022513602000053
Figure 2022513602000054
Figure 2022513602000055
Figure 2022513602000056
Figure 2022513602000057
Figure 2022513602000058
Figure 2022513602000059
Figure 2022513602000060
Figure 2022513602000061
Figure 2022513602000062
Figure 2022513602000063
Figure 2022513602000064
Figure 2022513602000065
Figure 2022513602000066
Figure 2022513602000067
Figure 2022513602000068
Figure 2022513602000069
Figure 2022513602000070
Figure 2022513602000071
Figure 2022513602000072
Figure 2022513602000073
Figure 2022513602000074
Figure 2022513602000075
Figure 2022513602000076
Figure 2022513602000077
Figure 2022513602000078
Figure 2022513602000079
Figure 2022513602000080
Figure 2022513602000081
Figure 2022513602000082
Figure 2022513602000083
Figure 2022513602000084
Figure 2022513602000085
Figure 2022513602000086

Figure 2022513602000087
Figure 2022513602000088
Figure 2022513602000089

多様性プライマープール:169のhav10種のうち164が3以下のプライマーペアを含む設計を有する(それらをカバーするのに全部で187のプライマー配列を必要とする:145が1つのプライマーペアを有し、15が2つのプライマーペアを有し、4が3つのプライマーペアを有する)。3つを超えるプライマーペアを必要とする種が4つあった。リンパ球性脈絡髄膜炎ウイルス(LCMV、7つのプライマーペア)、ノロウイルス(4つのプライマーペア)、ベータパピローマウイルス2(6つのプライマーペア)、及びカンディルフレボウイルス(6つのプライマーペア)。これらの4つの種は、150nMの最終濃度で単一の「多様な」プライマープールに結合された。 Diversity Primer pool: 164 of the 169 hav10 species have designs containing 3 or less primer pairs (require a total of 187 primer sequences to cover them: 145 have one primer pair). , 15 has two primer pairs and 4 has three primer pairs). There were four species that required more than three primer pairs. Lymphocytic choriomyelitis virus (LCMV, 7 primer pairs), Norovirus (4 primer pairs), Beta papillomavirus 2 (6 primer pairs), and Candiru Frevovirus (6 primer pairs). These four species were bound to a single "various" primer pool at a final concentration of 150 nM.

縮重プライマープール:169のhav10種のうち167について、CATCH-dx/プライマー3を使用して、10未満のプライマーペアでデータベース内のゲノムの90%超をカバーするプライマーセットを設計することができた。しかしながら、2つの種(サル免疫不全ウイルスとサッポロウイルス)では、コンピューター設計戦略を使用して、プライマー結合部位の十分に保存されたペアを特定することはできなかった。代わりに、広範な配列多様性を捕捉するためにいくつかの縮重塩基を使用してプライマーを設計し、アンプリコンを手動で識別した。これらのプライマーは、最終濃度600nMの「縮重」プライマープールで使用された。 Reduced Primer Pool For 167 of the 169 hav10 species, CATCH-dx / Primer 3 can be used to design primer sets that cover more than 90% of the genome in the database with less than 10 primer pairs. rice field. However, for the two species (simian immunodeficiency virus and sapovirus), computer design strategies could not be used to identify well-conserved pairs of primer binding sites. Instead, primers were designed using several degenerate bases to capture widespread sequence diversity and the amplicon was manually identified. These primers were used in a "degenerate" primer pool with a final concentration of 600 nM.

残りのプライマープール:残りの149のhav10種について、出願人はプライマーを系統発生学的にプールし、各プールが1~3のウイルス属からの種を含むようにした(詳細は表4を参照されたい)。プール4(Torque teno Leptonychotes weddellii virus-1)の1種のプライマーは、いくつかの縮重塩基を含み、手動で設計された。これらのプライマーは、最終濃度150nMで使用された。 Remaining Primer Pools: For the remaining 149 hav10 species, Applicants phylogenetically pooled the primers so that each pool contained species from 1-3 viral genera (see Table 4 for details). I want to be). One primer of pool 4 (Torque teno Leptonychotes weddellili virus-1) contained several degenerate bases and was designed manually. These primers were used at a final concentration of 150 nM.

バージョン2の再設計:hav10-v1設計を試験した後、3つのアンプリコンを再設計した。オルソヘペスウイルスA(Orthohepesvirus A)、ライノウイルスA、及びライノウイルスB。新しく設計されたプライマーを再度プールしてプール8v2及び12v2を作成し、これらのアンプリコンを標的とするように新しいcrRNA配列を設計した。hav10-v1試験の結果に基づいて、出願人は14種の既存のv1アンプリコン内でcrRNAを再設計した(表5bを参照されたい)。 Version 2 redesign: After testing the hav10-v1 design, three amplicons were redesigned. Orthohepesvirus A, rhinovirus A, and rhinovirus B. The newly designed primers were pooled again to create pools 8v2 and 12v2, and new crRNA sequences were designed to target these amplicon. Based on the results of the hav10-v1 test, Applicants redesigned the crRNA within 14 existing v1 amplicons (see Table 5b).

96Wプレートで実施された同等の実験の1回の複製には、約300プレートと1Lを超える検出ミックスが必要である。 One replication of an equivalent experiment performed on 96 W plates requires approximately 300 plates and more than 1 L of detection mix.

インフルエンザA設計
プライマー設計:Nプライマーは、単一のプール内の各サブタイプ(9プライマーペア)の多数のコンセンサス配列に基づいていた。CATCH-dxを使用して、各サブタイプ内の配列の少なくとも95%をカバーするHプライマーを設計した。合計で、1つのプールに45個のプライマー(15個のフォワードプライマー、30個のリバースプライマー)が含まれていた。

Figure 2022513602000090
Figure 2022513602000091
Figure 2022513602000092
Figure 2022513602000093
Figure 2022513602000094
Influenza A design Primer design: N primers were based on multiple consensus sequences for each subtype (9 primer pairs) in a single pool. CATCH-dx was used to design H primers that covered at least 95% of the sequences within each subtype. In total, one pool contained 45 primers (15 forward primers, 30 reverse primers).
Figure 2022513602000090
Figure 2022513602000091
Figure 2022513602000092
Figure 2022513602000093
Figure 2022513602000094

crRNA設計:少数のcrRNA配列からなるセットは、CATCH-dxを使用して個々のHまたはNサブタイプを選択的に標的にするように設計された。設計アプローチは、設計の各ラウンドに新しい機能を組み込むことにより、プロセス全体で改善された(図32)。設計の第1のラウンドでは、出願人はH crRNAのみを設計し、すべてのcrRNAがすべての配列の90%をハイブリダイズし、1つまでのミスマッチを許容することを要求した。セット内のcrRNAは、アンプリコンのどこにでも配置できる。設計の第2のラウンドでは、出願人はHとNの両方のcrRNAを設計し、配列アライメントに基づいて、セット内のcrRNAの位置を(Hの場合は91ntウィンドウ内、Nの場合は35ntウィンドウ内に)制限した。アンプリコン内のいくつかの位置では、サブタイプ間で他のものよりも保存されていた。さらに、2017年より古い配列の指数関数的減衰パラメーターを導入することにより、設計のカバレッジはより最近の年に向けて重み付けされた。第3のラウンドでは、任意の他のサブタイプ内の配列の少なくとも99%の配列にハイブリダイズするときに、すべてのcrRNAに少なくとも3つのミスマッチが必要である差動設計アプローチが実装された。第4のラウンドでは、ハイブリダイゼーションモデルが修正され、G-Uペアリングが説明され、各サブタイプの配列の95%に閾値が引き上げられ、1つまでのミスマッチが許容された。設計の各ラウンドは実験的に試験され、設計間の高性能crRNAが組み合わせて使用された。Hでは4ラウンドの設計が必要であったが、Nでは2ラウンド(ラウンド2と3)しか必要なかった。

Figure 2022513602000095
Figure 2022513602000096
Figure 2022513602000097
Figure 2022513602000098
Figure 2022513602000099
Figure 2022513602000100
Figure 2022513602000101
Figure 2022513602000102
Figure 2022513602000103
Figure 2022513602000104
Figure 2022513602000105

Figure 2022513602000106
Figure 2022513602000107
Figure 2022513602000108
Figure 2022513602000109
Figure 2022513602000110
crRNA design: A set of a small number of crRNA sequences was designed to selectively target individual H or N subtypes using CATCH-dx. The design approach has been improved throughout the process by incorporating new features into each round of design (Figure 32). In the first round of design, the applicant designed only H crRNA and required that all crRNA hybridize 90% of all sequences and allow up to one mismatch. The crRNA in the set can be placed anywhere in the amplicon. In the second round of design, the applicant designs both H and N crRNAs and, based on sequence alignment, positions the crRNAs in the set (in the 91 nt window for H, 35 nt window for N). (Inside) restricted. At some locations within the amplicon, it was more conserved among the subtypes than others. In addition, design coverage was weighted towards more recent years by introducing exponential decay parameters for arrays older than 2017. In the third round, a differential design approach was implemented in which all crRNAs require at least three mismatches when hybridizing to at least 99% of the sequences within any other subtype. In the fourth round, the hybridization model was modified to explain GU pairing, the threshold was raised to 95% of the sequences of each subtype, and up to one mismatch was allowed. Each round of design was experimentally tested and high performance crRNA between designs was used in combination. H needed a four-round design, while N needed only two rounds (rounds 2 and 3).
Figure 2022513602000095
Figure 2022513602000096
Figure 2022513602000097
Figure 2022513602000098
Figure 2022513602000099
Figure 2022513602000100
Figure 2022513602000101
Figure 2022513602000102
Figure 2022513602000103
Figure 2022513602000104
Figure 2022513602000105

Figure 2022513602000106
Figure 2022513602000107
Figure 2022513602000108
Figure 2022513602000109
Figure 2022513602000110

HIV DRMパネル設計
プライマー設計:出願人は、逆転写酵素及びインテグラーゼ遺伝子内のDRMの位置に基づいて、プライマーペアを重複する「奇数」及び「偶数」のプライマープールに分割するプライマープール化戦略を使用した。これにより、すべての変異を少なくとも1つのアンプリコンに含めることができ、増幅の間に問題は発生しなかった。プライマー配列は、primer3 v2.4.0を使用して次のパラメーターで設計された。PRIMER_PRODUCT_OPT_SIZE=150、PRIMER_MAX_GC=70、PRIMER_MIN_GC=30、PRIMER_OPT_GC_PERCENT=50、PRIMER_MIN_TM=55、PRIMER_MAX_TM=60、PRIMER_DNA_CONC=150、PRIMER_OPT_SIZE=20、PRIMER_MIN_SIZE=16、PRIMER_MAX_SIZE=29。アンプリコンの長さは、150~250ヌクレオチドの範囲であった。すべてのプライマー配列は表9にある。
HIV DRM Panel Design Primer Design: Applicants have developed a primer pooling strategy that divides primer pairs into overlapping "odd" and "even" primer pools based on the location of the DRM within the reverse transcriptase and integrase genes. used. This allowed all mutations to be included in at least one amplicon and no problems occurred during amplification. The primer sequence was designed with the following parameters using primer3 v2.4.0. PRIMER_PRODUCT_OPT_SIZE = 150, PRIMER_MAX_GC = 70, PRIMER_MIN_GC = 30, PRIMER_OPT_GC_PERCENT = 50, PRIMER_MIN_TM = 55, PRIMER_MAX_TM = 60, PRIMER_MAX_TM = 60, PRIMER_DNA_CONC = 150, PRIMER_DNA_ Amplicon lengths ranged from 150 to 250 nucleotides. All primer sequences are shown in Table 9.

crRNA設計:crRNAのペアは、3つの異なる戦略を使用してHIV DRM識別のために設計された:3位の変異と5位の合成ミスマッチ、3~5位のDRMコドンと6位の合成ミスマッチ、及び4~6位のDRMコドンと3位の合成ミスマッチ。配列は、HIVサブタイプBコンセンサス配列に基づいて、それぞれのアミノ酸に最も一般的に使用されるコドンを使用して設計された。すべての設計は実験的に試験され、最高性能の設計が最終パネルに選択された。

Figure 2022513602000111
Figure 2022513602000112
Figure 2022513602000113
Figure 2022513602000114
Figure 2022513602000115
Figure 2022513602000116
Figure 2022513602000117
Figure 2022513602000118
Figure 2022513602000119
Figure 2022513602000120
Figure 2022513602000121
Figure 2022513602000122
Figure 2022513602000123
Figure 2022513602000124
Figure 2022513602000125
Figure 2022513602000126
Figure 2022513602000127
Figure 2022513602000128
Figure 2022513602000129
Figure 2022513602000130
Figure 2022513602000131
crRNA design: crRNA pairs were designed for HIV DRM identification using three different strategies: mutation at position 3 and synthetic mismatch at position 5 and DRM codon at positions 3-5 and synthesis mismatch at position 6. , And a synthetic mismatch at position 3 with the DRM codon at positions 4-6. The sequence was designed using the most commonly used codons for each amino acid, based on the HIV subtype B consensus sequence. All designs were experimentally tested and the highest performance design was selected for the final panel.
Figure 2022513602000111
Figure 2022513602000112
Figure 2022513602000113
Figure 2022513602000114
Figure 2022513602000115
Figure 2022513602000116
Figure 2022513602000117
Figure 2022513602000118
Figure 2022513602000119
Figure 2022513602000120
Figure 2022513602000121
Figure 2022513602000122
Figure 2022513602000123
Figure 2022513602000124
Figure 2022513602000125
Figure 2022513602000126
Figure 2022513602000127
Figure 2022513602000128
Figure 2022513602000129
Figure 2022513602000130
Figure 2022513602000131

ハードウェア開発と構築
マイクロウェルアレイチップの設計と製作
マイクロウェルアレイ設計:マイクロウェルの寸法は、液滴のロード速度(ウェルが大きいほど速くなる)とマイクロウェル内の液滴と液滴の近接性(ウェルが小さいほどマージしやすい)のバランスを取るために、経験的試験によって最適化された。PCR増幅反応またはCas13検出ミックスから作製された液滴の場合、最適なウェル形状は、直径が158μmで重なりが10%の2つの円を結合することによって達成された(図21A)。各ウェル間の最小距離が37μmであると、PDMSを引き裂くことなく一貫したチップ製造が容易になった(以下のμウェルチップ製造を参照されたい)。標準チップのマイクロウェルアレイの合計は6.0×5.5cm(51,496マイクロウェル)である。ローディングスロットがマイクロウェルアレイを部分的に覆い隠し、機能的なアレイサイズを6.0×約4.5cm(約42,400マイクロウェル)に縮小した(図21B)。mChipは、177,840個のマイクロウェルを備えた12×9.1cmのマイクロウェルアレイを備える(図25A)。mChipマイクロウェルアレイは、チップの端の周りの堅牢な密閉を容易にするためにPDMSの0.1~0.3cmの境界線に囲まれている。mChipの合計寸法は、標準的な顕微鏡ステージ(16×11cmの開口部、Bio Precision LM Motorized Stage,Ludl Electronics)の領域で画像化できるウェルの数を最大化するように設計され、一方でチップが標準シリコンウエハー(15cm)を使用して製造されるようにする(図25B)。
Hardware Development and Construction Microwell Array Chip Design and Manufacture Microwell Array Design: The dimensions of the microwell are the loading speed of the droplets (the larger the wells, the faster) and the proximity of the droplets within the microwells. Optimized by empirical testing to balance (smaller wells are easier to merge). For droplets made from PCR amplification reactions or Cas13 detection mixes, optimal well shape was achieved by joining two circles with a diameter of 158 μm and an overlap of 10% (FIG. 21A). A minimum distance of 37 μm between each well facilitated consistent chip production without tearing the PDMS (see μ Well Chip Production below). The total microwell array of standard chips is 6.0 x 5.5 cm (51,496 microwells). Loading slots partially obscured the microwell array, reducing the functional array size to 6.0 x about 4.5 cm (about 42,400 microwells) (FIG. 21B). The mChip comprises a 12 x 9.1 cm microwell array with 177,840 microwells (FIG. 25A). The mChip microwell array is surrounded by a 0.1-0.3 cm border of PDMS to facilitate robust sealing around the edge of the chip. The total dimensions of the mChip are designed to maximize the number of wells that can be imaged in the area of a standard microscope stage (16 x 11 cm opening, Bio Precision LM Motorized Stage, Lud. Electronics), while the tip is It is to be manufactured using a standard silicon wafer (15 cm) (FIG. 25B).

マイクロウェルチップ製造:ポリジメチルシロキサン(PDMS)チップは、一貫したチップ寸法を達成するために、アクリル型を使用して、標準のハード及びソフトリソグラフィープラクティスに従って製造された。標準サイズのチップの製造については、以前に説明されている(PNAS#1)。mChipsの場合、150mmウエハー(WaferNet,Inc.、#S64801)をスピンコーター(Model WS-650MZ-23NPP,Laurell Technologies)で、2500rpmで、1回はアセトンで、もう1回はイソプロパノールで洗浄した。フォトレジスト(SU-8 2050,MicroChem)は、2段階のプロセスで各ウエハー上にスピンコーティングされた。(1)30秒、500rpm、加速30;(2)59秒、1285rpm、加速50。ウエハーを65℃で5分間焼き、その後95℃で18分間焼いた。1分間の冷却後、コーティングされたウエハーを適切なフォトマスクの下に置き、照射した(5×3秒、350W、モデル200、OAI)。ウエハーを再び65℃で3分間焼き、95℃で9分間焼いた。1分間冷却した後、SU-8現像液でウエハーを5分間インキュベートした。2500rpmで回転することによって現像液を除去し、アセトン及びイソプロパノール洗浄液を回転中のウエハーに直接適用して、余分な現像液とフォトレジストを除去した。各ウエハーは、光学顕微鏡下での目視検査と形状測定によって特徴寸法を測定することによって特徴付けられた(Contour GT,Bruker)。ウエハーをアクリルの型に入れ、磁石で固定した(図25B)。型からチップを製造するために、PDMSを混合して型に注ぎ、型全体を3~5分間真空下に置いた。チップの厚さが均一になるように型をアクリルの蓋で閉じ、チップを少なくとも2時間焼いた。チップを型から取り出した後、マイクロウェルアレイを保持するチップの表面と側面(ただし、マイクロウェルアレイの反対側のチップの背面ではない)を1.5μmのパリレンC(Paratronix/MicroChem,Westborough,MA)でコーティングした。チップは使用するまでビニール袋に入れて室温で保管した。 Microwell Chip Manufacturing: Polydimethylsiloxane (PDMS) chips were manufactured according to standard hard and soft lithography practices using acrylic molds to achieve consistent chip dimensions. The manufacture of standard size chips has been previously described (PNAS # 1). In the case of mChips, a 150 mm wafer (WaferNet, Inc., # S64801) was washed with a spin coater (Model WS-650MZ-23NPP, Laurell Technologies) at 2500 rpm, once with acetone and once with isopropanol. The photoresist (SU-8 2050, MicroChem) was spin-coated onto each wafer in a two-step process. (1) 30 seconds, 500 rpm, acceleration 30; (2) 59 seconds, 1285 rpm, acceleration 50. Wafers were baked at 65 ° C. for 5 minutes and then at 95 ° C. for 18 minutes. After cooling for 1 minute, the coated wafer was placed under a suitable photomask and irradiated (5 x 3 seconds, 350 W, model 200, OAI). Wafers were baked again at 65 ° C. for 3 minutes and at 95 ° C. for 9 minutes. After cooling for 1 minute, the wafer was incubated with SU-8 developer for 5 minutes. The developer was removed by rotating at 2500 rpm and the acetone and isopropanol cleaning solution was applied directly to the rotating wafer to remove excess developer and photoresist. Each wafer was characterized by measuring feature dimensions by visual inspection and shape measurement under a light microscope (Contour GT, Bruker). The wafer was placed in an acrylic mold and fixed with a magnet (Fig. 25B). To make chips from the mold, PDMS was mixed and poured into the mold and the entire mold was placed under vacuum for 3-5 minutes. The mold was closed with an acrylic lid so that the thickness of the chips was uniform, and the chips were baked for at least 2 hours. After removing the chip from the mold, the surface and sides of the chip holding the microwell array (but not the back of the chip on the opposite side of the microwell array) are 1.5 μm parilen C (Paratronix / MicroChem, Westborough, MA). ) Was coated. The chips were stored in a plastic bag at room temperature until use.

アクリルデバイスの製造(型及びローダー):標準的なチップ生産及び取り扱いのための型(PNAS#1)及びローダー(PNAS#2)は、前述のように構築された。同様の方法を使用して、mChip用の型とローダーを構築した(図25B)。簡潔に述べると、12インチ×12インチのキャストアクリルシート(1/4インチまたは1/8インチ、透明または黒)をAmazon(Small Parts,#B004N1JLI4)から購入した。型とローダーの設計はAutoCAD(AutoDesk)で作成され、部品はEpilog Fusion M2レーザーカッター(60W)を使用して切断された。アクリル部分は、ジクロロメタン(Sigma Aldrich)で濡らすことによって融合された。N42ネオジムディスク磁石(Applied Magnets,Inc.,Plano,TX)をエポキシ(Loctite,Metal/Concrete)を含むデバイスに追加した。キャップスクリュー(M4×25)、ナット(M4)、及びワッシャー(M4)は、Thorlabsから購入した。 Acrylic device manufacturing (molds and loaders): Molds (PNAS # 1) and loaders (PNAS # 2) for standard chip production and handling were constructed as described above. A mold and loader for mChip were constructed using a similar method (Fig. 25B). Briefly, a 12 "x 12" cast acrylic sheet (1/4 "or 1/8", transparent or black) was purchased from Amazon (Small Parts, # B004N1JLI4). The mold and loader design was made in AutoCAD (AutoDesk) and the parts were cut using an Epilog Fusion M2 laser cutter (60W). The acrylic moieties were fused by wetting with dichloromethane (Sigma Aldrich). N42 neodymium disk magnets (Applied Magnets, Inc., Plano, TX) were added to devices containing Loctite, Metal / Concrete. Cap screws (M4 x 25), nuts (M4), and washers (M4) were purchased from Thorlabs.

カラーコードの設計、構築、及び特性評価
カラーコード設計:カラーコードは、液滴に乳化された各試薬(例えば、検出ミックスまたは増幅されたサンプル)の光学的に一意の溶液識別子として機能する。元の64のカラーコードセットは、3つの蛍光色素の比率から作成され、3つの色素の合計濃度([染料1]+[染料2]+[染料3])が一定であり、視野全体またはチップ上の様々な場所での照明の変化を正規化するための内部対照として機能した(PNAS#1)。前述のように、64のカラーコードセットの色素の合計作業濃度は1~5μMであった(PNAS#1)。1050のカラーコードは、(1)3つの蛍光色素の合計作業濃度を20μMに増やし、210のカラーコードが3色空間で忠実に識別されるようにすること(図24A及び図24B)、及び(2)5つの濃度(0、3、7、12、または20μM)のうちの1つで第4の蛍光色素を追加して、210コードを5倍にする(図24A)ことによって設計された。この設計では、4つの色素強度のそれぞれが最初の3つの蛍光色素の合計に正規化されている。
Color Code Design, Construction, and Characteristic Evaluation Color Code Design: The color code serves as an optically unique solution identifier for each reagent emulsified in droplets (eg, detection mix or amplified sample). The original 64 color code sets were created from the proportions of the three fluorescent dyes, the total concentration of the three dyes ([Dye 1] + [Dye 2] + [Dye 3]) was constant, the entire field of view or the chip. Served as an internal control to normalize lighting changes at the various locations above (PNAS # 1). As mentioned above, the total working concentration of the dyes in the 64 color code sets was 1-5 μM (PNAS # 1). The 1050 color codes (1) increase the total working concentration of the three fluorescent dyes to 20 μM so that the 210 color codes are faithfully identified in the three color spaces (FIGS. 24A and 24B), and (FIG. 24A and 24B). 2) Designed by adding a fourth fluorescent dye at one of five concentrations (0, 3, 7, 12, or 20 μM) to multiply the 210 code by a factor of 5 (FIG. 24A). In this design, each of the four dye intensities is normalized to the sum of the first three fluorescent dyes.

カラーコード構築:標準の64のカラーコードセット(50μM原液濃度;1~5μM作業濃度)は、前述のように構築された(PNAS#1)。210のカラーコード(400μM原液濃度;20μM作業濃度)は、次のように同様の方法を使用して構築された。Alexa Fluor 647(AF647)、Alexa Fluor 594(AF594)、Alexa Fluor 555(AF555)、及びAlexa Fluor 405 NHSエステル(AF405-NHS)(Thermo Fisher)をDMSO(Sigma)で25mMに希釈した。これらの染料のモル質量は独自のものであるため、メーカーから提供された次のおおよその質量が計算に使用された。AF647:1135g/mol;AF594:1026g/mol;AF555:1135g/mol;AF405-NHS:1028g/mol。DMSO中の色素ストックをさらにDNase/RNaseを含まない水(Life Technologies)で400μmに希釈した。Alexa Fluor 405NHSエステルを室温で1時間インキュベートして、NHSエステルの加水分解を可能にし、Alexa Fluor405(AF405)を生成した。カスタムMatlabスクリプトを使用して、3色空間全体に210のカラーコードを均等に分散するために組み合わせる色素の量を計算した(表10b)。Janus Mini液体ハンドラー(Perkin Elmer)を使用して、3色染料の組み合わせ(AF647、AF594、及びAF555から作製)を96ウェルプレート(Eppendorl)中に構築した。1050のカラーコードを構築するために、AF405を5つの濃度(0、60、140、240、及び400μm)に手動で希釈し、各濃度を96ウェルプレート全体に並べた。210のカラーコード(10μL)及びAF405(10μL)のそれぞれを組み合わせて、Bravo(サプライヤー)を使用して新しい96ウェルプレートで混合した。AF647、AF594、AF555の合計の最終原液濃度は200μMであった。AF405の最終濃度は、0、30、70、120、及び200μMであった。ストックは、増幅したサンプルまたは検出ミックスへと1:10に希釈して使用した。 Color Code Construction: A standard 64 color code set (50 μM stock solution concentration; 1-5 μM working concentration) was constructed as described above (PNAS # 1). The 210 color code (400 μM stock solution concentration; 20 μM working concentration) was constructed using a similar method as follows. Alexa Fluor 647 (AF647), Alexa Fluor 594 (AF594), Alexa Fluor 555 (AF555), and Alexa Fluor 405 NHS Ester (AF405-NHS) (Thermo Fisher) were diluted 25 mM in DMSO (Sigma). Since the molar masses of these dyes are unique, the following approximate masses provided by the manufacturer were used in the calculations. AF647: 1135 g / mol; AF594: 1026 g / mol; AF555: 1135 g / mol; AF405-NHS: 1028 g / mol. The dye stock in DMSO was further diluted to 400 μm with DNase / RNase-free water (Life Technologies). The Alexa Fluor 405 NHS ester was incubated for 1 hour at room temperature to allow hydrolysis of the NHS ester to produce Alexa Fluor 405 (AF405). A custom MATLAB script was used to calculate the amount of dye to combine to evenly distribute the 210 color codes across the three color spaces (Table 10b). A combination of three color dyes (made from AF647, AF594, and AF555) was constructed in a 96-well plate (Eppendall) using a Janus Mini liquid handler (PerkinElmer). To construct the 1050 color code, AF405 was manually diluted to 5 concentrations (0, 60, 140, 240, and 400 μm) and each concentration was aligned across the 96-well plate. Each of the 210 color codes (10 μL) and AF405 (10 μL) were combined and mixed in a new 96-well plate using Bravo (supplier). The total final stock solution concentration of AF647, AF594 and AF555 was 200 μM. The final concentrations of AF405 were 0, 30, 70, 120, and 200 μM. The stock was used diluted 1:10 into an amplified sample or detection mix.

1050のカラーコードセットの特性評価:各カラーコードをLBブロス(PCR産物及び検出試薬から作られた液滴と同様のサイズの液滴を生成する培地)で1:10に希釈し、3色素の最終合計濃度を20μMにした。上述のセクションII.D.に記載されているように、各溶液を乳化して液滴にした。カラーコード戦略の忠実度は、以前に説明したように測定された[PNAS#1]。 Characteristic evaluation of 1050 color code sets: Each color code is diluted 1:10 with LB broth (a medium that produces droplets of similar size to droplets made from PCR products and detection reagents) of the three dyes. The final total concentration was 20 μM. Section II. D. Each solution was emulsified into droplets as described in. The fidelity of the color code strategy was measured as previously described [PNAS # 1].

表10a~10b 表10a及び10bにおいて、各行はカラーコードを表す。各列は、3つの染料の1つの容量(μm)を示す。各コードの総容量は50μLである。

Figure 2022513602000132
Figure 2022513602000133

Figure 2022513602000134
Figure 2022513602000135
Figure 2022513602000136
Figure 2022513602000137
Tables 10a to 10b In Tables 10a and 10b, each line represents a color code. Each column shows one volume (μm) of the three dyes. The total capacity of each cord is 50 μL.
Figure 2022513602000132
Figure 2022513602000133

Figure 2022513602000134
Figure 2022513602000135
Figure 2022513602000136
Figure 2022513602000137

3色空間での特徴付け:3色空間でのカラーコード戦略の忠実度は、以前に説明したように測定された。3色空間の各カラーコードは、3つのチップの1つに割り当てられた。任意のチップ上のカラーコード間の分離が最大になるように割り当てが行われ、各チップは1/3のカラーコード(合計70)を受け取った(図38B及び38C)。チップ1に割り当てられたカラーコードからの液滴(70の3カラーコード×5UV濃度=350液滴エマルション)をプールし、標準チップにロードした。チップ2とチップ3も同様に作製した。チップが画像化され(カラーコードの特徴付け実験ではマージが実行されなかったことに留意されたい)、各液滴はカラーコードクラスターにコンピューターによって割り当てられた。チップ1、2、及び3の実験結果は、「グラウンドトゥルース」割り当てとして機能した。次に、チップ1、2、及び3からのデータがコンピューターによって結合され、3色空間のカラーコードクラスターの密度が効果的に増加し、この密集した3色空間のカラーコードクラスターに液滴が再び割り当てられた(図38B及び38C)。最後に、スライド距離フィルターを適用してクラスターの端またはクラスター間の液滴を除去し、液滴をカラーコードクラスターに再び割り当てた(図38B及び38F)。スライド距離フィルターは、クラスター間の空間に落ちる液滴を除去するために使用される各クラスターの重心の周りの半径を指す(図38F)。半径は、より大きくても(より多くの液滴を含むため)、またはより小さくても(液滴をより厳密にフィルターで除去するため)よい。新しい割り当てを「グラウンドトゥルース」割り当てと比較して、カラーコードが3つのチップで分離されていない場合に誤分類される液滴の割合を測定した(図38C及び38D)。ここで示す作業では、スライド距離フィルターの半径は、試験データセットで少なくとも99.5%の正しい分類を達成するように設定されており、これは液滴の6%の除去に相当する。 Characteristic in 3 color spaces: The fidelity of the color code strategy in 3 color spaces was measured as previously described 8 . Each color code in the three-color space was assigned to one of the three chips. Allocations were made to maximize the separation between the color codes on any chip, and each chip received 1/3 of the color codes (70 total) (FIGS. 38B and 38C). Droplets from the color code assigned to chip 1 (70 3 color code x 5 UV concentration = 350 droplet emulsion) were pooled and loaded onto a standard chip. Chip 2 and chip 3 were also produced in the same manner. The chips were imaged (note that the merge was not performed in the color code characterization experiment) and each droplet was computer-assigned to the color code cluster. The experimental results of chips 1, 2, and 3 served as a "ground truth" assignment. The data from chips 1, 2, and 3 are then computer-combined to effectively increase the density of the color code clusters in the three color spaces, causing droplets to reappear in the dense color code clusters in the three color spaces. Assigned (FIGS. 38B and 38C). Finally, a slide distance filter was applied to remove droplets at the edges of the clusters or between clusters and reassign the droplets to the color coded clusters (FIGS. 38B and 38F). The slide distance filter points to the radius around the center of gravity of each cluster used to remove droplets falling into the space between the clusters (Fig. 38F). The radius may be larger (because it contains more droplets) or smaller (because the droplets are more strictly filtered). The new assignment was compared to the "ground truth" assignment to measure the percentage of droplets that would be misclassified if the color code was not separated by the three chips (FIGS. 38C and 38D). In the work shown here, the radius of the slide distance filter is set to achieve at least 99.5% correct classification in the test dataset, which corresponds to the removal of 6% of the droplets.

第4の色次元に沿った特性評価:第4の蛍光色素の5つの濃度は、2つのチップに分割された(チップ1:0、7、20μM;チップ2:3、12μM)(図38E)。チップ1に割り当てられた色素強度からの液滴(3UV強度×210カラーコード=620エマルション)をプールし、標準チップにロードした。チップ2は、同様の方法で調製されたが、プールされたエマルションの数が少なくなった(2UV強度×210カラーコード=420エマルション)。チップが画像化され(カラーコードの特徴付け実験ではマージが実行されなかったことに留意されたい)、各液滴はUV強度ビンにコンピューターによって割り当てられた。チップ1及び2の実験結果は、「グラウンドトゥルース」割り当てとして機能した。次に、チップ1とチップ2からのデータがコンピューターによって結合され、第4の色次元に沿ってUV強度ビンの密度が効果的に増加し、この密集した空間内のUV強度ビンに液滴が再び割り当てられた(図38E)。最後に、スライド距離フィルターを適用して強度ビンの端または強度ビン間の液滴を除去し、液滴をUV強度ビンに再び割り当てた(図38E)。新しい割り当てを「グラウンドトゥルース」割り当てと比較して、UV強度が3つのチップで分離されていない場合に誤分類される液滴の割合を測定した(図38E)。第4の色次元での分類は、フィルタリングなしで十分に高い(>99.5%の精度)ため、第4の色次元でのフィルタリングは実験データに適用されなかった。 Characterization along the 4th color dimension: 5 concentrations of the 4th fluorescent dye were divided into two chips (chips 1: 0, 7, 20 μM; chips 2: 3, 12 μM) (FIG. 38E). .. Droplets from the dye intensity assigned to chip 1 (3 UV intensity x 210 color code = 620 emulsion) were pooled and loaded onto a standard chip. Chip 2 was prepared in a similar manner, but with a smaller number of pooled emulsions (2 UV intensity x 210 color code = 420 emulsions). The chips were imaged (note that the merge was not performed in the color code characterization experiment) and each droplet was computer-assigned to a UV intensity bin. The experimental results of chips 1 and 2 served as a "ground truth" assignment. The data from Chip 1 and Chip 2 are then combined by a computer to effectively increase the density of the UV intensity bins along the fourth color dimension, causing droplets to appear in the UV intensity bins in this dense space. Reassigned (Fig. 38E). Finally, a slide distance filter was applied to remove the droplets at the ends of the intensity bins or between the intensity bins and reassign the droplets to the UV intensity bins (FIG. 38E). The new assignment was compared to the "ground truth" assignment and the percentage of droplets misclassified when the UV intensity was not separated by the three chips was measured (FIG. 38E). Filtering in the 4th color dimension was not applied to the experimental data because the classification in the 4th color dimension is high enough (> 99.5% accuracy) without filtering.

マイクロウェルアレイ統計:1つのチップで実施できる試験の数は、チップごとの生産的な液滴ペアの数と、正確なコールを行うために必要な試験ごとの反復数によって異なる。 Microwell Array Statistics: The number of tests that can be performed on a single chip depends on the number of productive drop pairs per chip and the number of iterations per test required to make an accurate call.

最初に、チップ当たりの生産的な液滴ペアの数に影響を与える因子が考慮される:標準チップのマイクロウェルアレイには、約42,000個のマイクロウェルが含まれる。経験的な観察によると、ローディング効率は約70%であり、マイクロウェルのさらに約10%がカラーコードフィルタリングによって失われる(以下を参照されたい)。最後に、確率的液滴ペアリングは、約50%の生産性の高い液滴ペア(増幅されたサンプルを含む1つの液滴と、検出ミックスを含む1つの液滴)を生成する。全体として、約10,000~14,000の液滴ペアがチップごとに有用なデータを生成する。mChipマイクロウェルアレイには約177,000個のマイクロウェルが含まれているため、チップあたり約65,000個の有用な液滴ペアが得られる。 First, factors that influence the number of productive droplet pairs per chip are considered: a standard chip microwell array contains approximately 42,000 microwells. Empirical observations show that the loading efficiency is about 70% and an additional about 10% of the microwells are lost by color code filtering (see below). Finally, probabilistic droplet pairing produces a highly productive droplet pair of about 50% (one droplet containing the amplified sample and one droplet containing the detection mix). Overall, about 10,000 to 14,000 droplet pairs produce useful data on a chip-by-chip basis. The mChip microwell array contains about 177,000 microwells, resulting in about 65,000 useful droplet pairs per chip.

次に、正確なコールチップを作製するために必要な試験ごとの反復数に影響する因子が考慮される。陽性検出反応の大部分は、バックグラウンドを上回る高いシグナルを有し、複製間の変動性がほとんどなく、カラーコード分類は非常に良好である(フィルタリング後の精度は>99.5%、図38A~38Gを参照されたい)。これは試験ごとに必要な反復数が非常に少ない可能性があることを示唆している。バックグラウンドを超えるシグナルを正しく識別するために必要な反復数の実験的測定値として、CARMEN-Cas13ジカ検出データに対してブートストラップ分析を行った(図22A~22E及び材料及び方法)。これにより、ブートストラップサンプルの>99.9%でバックグラウンドを超えるシグナルを正しくコールするのは、最低3回の反復であることが明らかになった。 Next, factors that influence the number of iterations per test required to make an accurate call chip are considered. The majority of positive detection reactions have high signals above background, little variability between replications, and very good color code classification (after filtering accuracy> 99.5%, FIG. 38A. See ~ 38G). This suggests that the number of iterations required per test may be very low. Bootstrap analysis was performed on CARMEN-Cas13 deer detection data as an experimental measure of the number of iterations required to correctly identify signals above the background (FIGS. 22A-22E and materials and methods). This revealed that> 99.9% of the bootstrap samples correctly call the signal above the background at least 3 iterations.

正確なコールを行うために必要な反復の数は、用途の種類によって異なることに留意されたい。バイナリに近い読み取りである核酸検出の場合、3回の反復で十分である。しかしながら、特定の標的と2つのcrRNAの相対反応速度を区別することに依存するSNP識別のために、ブートストラップ分析は10~15の反復が必要であることを示唆している(データ示さず)。さらに、定量的な用途では、グラウンドトゥルース値の望ましい許容範囲(例えば、5%)内の結果を得るために、多くの反復が必要になる場合がある。 Note that the number of iterations required to make an accurate call depends on the type of application. For nucleic acid detection, which is a near-binary read, three iterations are sufficient. However, bootstrap analysis suggests that 10-15 iterations are required for SNP identification that depends on distinguishing the relative kinetics of the two crRNAs from a particular target (data not shown). .. In addition, for quantitative applications, many iterations may be required to obtain results within the desired acceptable range of ground truth values (eg, 5%).

最後に、上記で決定した値を使用して、1チップで実施できる試験数の計算方法について説明する。マイクロウェルアレイ内の液滴のペアリングは確率的である。したがって、試験ごとの反復数の分布はポアソンである。ユーザーは、試験ごとの平均反復数(ポアソン分布の平均)を上下に設定して、アンダーサンプリングによる試験のドロップアウトの確率を制御できる。例えば、試験ごとに平均12回の反復を使用すると、反復回数の不足(3回未満)のために任意の試験が解釈不能になる確率は、2,000回に1回である。標準チップ(生産性が約12,000の液滴ペア)の場合、試験あたり平均12回の反復により、チップあたり1,000の試験が可能になり、ドロップアウト率はチップあたり1をはるかに下回る(2,000分の1)。約65,000の液滴ペアを生成するmChipの場合、チップあたり5,000回の試験を実施すると、1回の試験で平均14回の反復が行われ、ドロップアウトの確率が10,000分の1(チップあたり1未満)に減少する。臨床診断など、すべての試験の結果を提供することが不可欠な状況では、平均反復レベルをさらに上げて、すべての試験のサンプリングが高くなるようにすること、及びアンダーサンプリングによるドロップアウト率が無視できるほど低くなるようにすることができる。 Finally, a method of calculating the number of tests that can be performed on one chip will be described using the values determined above. The pairing of droplets in a microwell array is stochastic. Therefore, the distribution of iterations per test is Poisson. The user can set the average number of iterations per test (the average of the Poisson distribution) up or down to control the probability of test dropout due to undersampling. For example, using an average of 12 iterations per test, the probability that any test will be uninterpretable due to a lack of iterations (less than 3) is once in 2,000. For a standard chip (a pair of droplets with a productivity of about 12,000), an average of 12 iterations per test allows 1,000 tests per chip, with a dropout rate well below 1. (1 / 2,000). For an mChip that produces approximately 65,000 droplet pairs, 5,000 tests per chip will result in an average of 14 iterations per test with a 10,000 minute dropout probability. It is reduced to 1 (less than 1 per chip). In situations where it is essential to provide the results of all trials, such as clinical diagnosis, further increase the average repeat level to ensure higher sampling of all trials, and the dropout rate due to undersampling is negligible. It can be made as low as possible.

プール化中の液滴間の溶質交換の制御:液滴マイクロウェルプラットフォームにおける小分子交換の速度論は、以前に説明されている。小分子は、界面活性剤のミセルに分割され、10分未満続くプール化ステップ中に液滴間で交換されることがある。プール化中の蛍光色素の交換は無視でき、カラーコード分類を損なうことはない。液滴がマイクロウェルアレイにロードされると、PDMSマイクロウェルのパリレンコーティングされた壁がそれ以上の交換を防ぐ。好都合なことに、より大きな親水性分子または荷電分子の拡散は、小分子が液滴から出る界面活性剤依存性のメカニズムがタンパク質または核酸のエスケープを可能にすることは予想も観察もされていないため、このシステムでは問題とならない。実際、同様の油、界面活性剤、及び緩衝液(デジタル液滴PCRなど)に基づく超高感度核酸検出用の市販のシステムは十分に確立されている。 Control of solute exchange between droplets during pooling: The rate theory of small molecule exchange in the droplet microwell platform has been previously described 8 . Small molecules may be split into detergent micelles and exchanged between droplets during a pooling step that lasts less than 10 minutes. The exchange of fluorescent dyes during pooling is negligible and does not impair color code classification8. When the droplets are loaded into the microwell array, the parylene-coated wall of the PDMS microwell prevents further replacement 8 . Fortunately, the diffusion of larger hydrophilic or charged molecules has not been predicted or observed that the detergent-dependent mechanism by which small molecules emerge from the droplets allows the escape of proteins or nucleic acids. Therefore, it does not matter in this system. In fact, commercially available systems for ultrasensitive nucleic acid detection based on similar oils, detergents, and buffers (such as digital droplet PCR) are well established.

実験設計の柔軟性:チップ上の試験数は、サンプル数と検出ミックス数の積であり、ユーザーのニーズによって決定できる(例えば、10サンプル×100検出ミックス、または100サンプル×10検出ミックス)。特に、CARMENは、試験マトリックスがほぼ正方形の場合、つまり、サンプル数と検出ミックス数が両方とも高い(例えば、>10)場合に効果を発揮する。従来、このような実験を行うには、液体の取り扱い(手動またはロボットのいずれか)が複雑で時間がかかり、試薬の消費にコストがかかり(以下のコスト分析を参照)、試験のサンプルが制限される場合がある。CARMENは、小型化と液滴の自己組織化を使用してこれらの問題を回避する(本文を参照)。高いサンプルスループットのみが必要な使用の場合(多くのサンプル×1検出ミックス)では、CARMENはコストを劇的に削減する(以下を参照されたい)が、実験のセットアップは線形(サンプル×1)であるため、マルチチャネルピペットも同様に時間効率が高くなる。多重検出のみが必要な使用の場合(1サンプル×多数の検出ミックス)では、ユーザーは、アプリケーションに十分な感度があればメタゲノム配列決定を検討できるが、絶妙な感度と広範なマルチプレックスが必要な場合はCARMENが理想的であり得る。 Design of Experiment Flexibility: The number of tests on the chip is the product of the number of samples and the number of detected mixes and can be determined according to the needs of the user (eg, 10 samples x 100 detection mixes or 100 samples x 10 detection mixes). In particular, CARMEN is effective when the test matrix is approximately square, that is, when both the number of samples and the number of detected mixes are high (eg> 10). Traditionally, performing such experiments is complicated and time consuming to handle liquids (either manually or robotically), costly to consume reagents (see cost analysis below), and limit test samples. May be done. CARMEN uses miniaturization and self-organization of droplets to avoid these problems (see text). For uses where only high sample throughput is required (many samples x 1 detection mix), CARMEN can dramatically reduce costs (see below), but the experimental setup is linear (sample x 1). Therefore, the multi-channel pipette is also time efficient. For uses that require only multiple detections (1 sample x multiple detection mixes), users can consider metagenomic sequencing if the application is sufficiently sensitive, but require exquisite sensitivity and extensive multiplex. In some cases CARMEN can be ideal.

カラーコード分析:カラーコード分類は堅牢である(図38A~38G)。一連のカラーコードを作成して特徴付けた後、コードは、追加のキャリブレーションなしで各実験で冷蔵庫の外で使用される。各カラーコードを3色空間(Alexa Fluor647、594、及び555)を構成する3つの蛍光色素の合計に正規化すると、システムは蛍光画像化アーティファクトに対して堅牢になり、個別のカラーコードクラスターが容易に表示される。各クラスターは、既知の内容物を持つ液滴セットを表す(例えば、検出ミックス4からの液滴)。液滴のカラーコードがそのカラーコードクラスターの中心からのものであり得る最大距離の閾値(すなわち、距離閾値、材料と方法を参照されたい)を導入することにより、色空間の不確定なポイントが除外される。1つのカラーコードクラスターが別のクラスターと重複し始めるレアケースでは、2つの衝突しているクラスターのみが影響を受け(複製の損失があるが、ほとんどの場合解決できる)、残りのカラーコードは影響を受けない。このような衝突するカラーコードは、セット全体に悪影響を与えることなく、将来の実験から除外することができ、ユーザーはカラーコードセット全体を再作成する必要がない。 Color code analysis: Color code classification is robust (FIGS. 38A-38G). After creating and characterizing a series of color codes, the codes are used outside the refrigerator in each experiment without additional calibration. Normalizing each color code to the sum of the three fluorescent dyes that make up the three color spaces (Alexa Fluor 647, 594, and 555) makes the system robust to fluorescent imaging artifacts and facilitates individual color code clusters. Is displayed in. Each cluster represents a set of droplets with known contents (eg, droplets from detection mix 4). By introducing the maximum distance threshold (ie, distance threshold, see Materials and Methods) that the color code of a droplet can be from the center of its color code cluster, an uncertain point in the color space is created. Excluded. In rare cases where one colorcode cluster begins to overlap with another, only two conflicting clusters are affected (there is a loss of replication, but in most cases it can be resolved) and the rest of the colorcodes are affected. Do not receive. Such conflicting color codes can be excluded from future experiments without adversely affecting the entire set, and the user does not have to recreate the entire color code set.

カラーコードの誤分類による偽陰性及び偽陽性:試験の複製が十分に誤分類されると、試験の結果が変わる可能性がある。試験の蛍光値は、すべての複製の中央値である。陽性試験の中央値がバックグラウンドに低下する(すなわち、偽陰性になる)ためには、複製の大部分が、バックグラウンドより上にシグナルがない誤って分類された液滴ペア(暗い液滴ペア)である必要がある。検出マトリックスがまばらであるため、誤分類された液滴ペアが暗い液滴ペアである可能性は高くなる(ヒト関連ウイルスパネル試験では99%)。これにより、偽陽性と比較して偽陰性の確率が劇的に増加する。偽陰性の場合、液滴の誤分類率が0.005であると仮定すると(以下及び図38A~38Gを参照されたい)、液滴のペアが誤分類される確率は0.01である。5回の反復で、大部分の複製が誤分類される確率は、0.01×0.01×0.01×(5が3を選択)=100,000分の1である。反復を7回に増やすと、確率は200万分の1未満に改善される。したがって、臨床診断など、正確なコールを保証することが重要な状況では、反復数を増やして、液滴の誤分類による試験の誤コールの可能性を劇的に減らすことができる。 False Negatives and False Positives Due to Color Code Misclassification: Test results can change if test duplication is sufficiently misclassified. The fluorescence value of the test is the median of all replicas. In order for the median positive test to drop to the background (ie, false negative), the majority of replicas are misclassified droplet pairs (dark droplet pairs) with no signal above the background. ) Must be. Due to the sparse detection matrix, misclassified droplet pairs are more likely to be dark droplet pairs (99% in human-related virus panel tests). This dramatically increases the probability of false negatives compared to false positives. In the case of false negatives, assuming a droplet misclassification rate of 0.005 (see below and FIGS. 38A-38G), the probability of a droplet misclassification is 0.01. The probability that most duplicates will be misclassified in 5 iterations is 0.01 x 0.01 x 0.01 x (5 chooses 3) = 1 in 100,000. Increasing the number of iterations to seven will improve the probability to less than one in two million. Therefore, in situations where it is important to ensure accurate calls, such as in clinical diagnosis, the number of iterations can be increased to dramatically reduce the chance of false calls in the test due to droplet misclassification.

コスト及びサンプル消費分析:CARMEN-Cas13の主な利点は、Cas13検出反応を小型化することで、検査あたりの試薬とサンプルの消費を削減できることである。SHERLOCK、DETECTR、qPCR、ELISA、及びLAMPなどの従来の大容量(数十マイクロリットル)アッセイを使用して、数十のサンプルを数百の標的に対して試験する場合、試薬と消耗品のコストが支配的である。したがって、出願人は、多くの標的に対して多くのサンプルを試験するときに、これらの方法に比べてCARMENによって与えられるコスト上の利点を定量化しようとした。 Cost and sample consumption analysis: The main advantage of CARMEN-Cas13 is that the Cas13 detection reaction can be miniaturized to reduce reagent and sample consumption per test. Reagent and consumable costs when testing dozens of samples against hundreds of targets using conventional high volume (tens of microliters) assays such as SHERLOCK, DETECTR, qPCR, ELISA, and LAMP. Is dominant. Therefore, Applicants sought to quantify the cost advantages offered by CARMEN over these methods when testing many samples against many targets.

CARMEN-Cas13に関連するコストを分析するために、出願人は最初に検出試薬のみのコストを考慮し、次に追加コスト(アレイを含むプラスチック、液滴生成、及びカラーコード)を考慮した。CARMEN-Cas13は通常、1回の試験で400倍を超える検出容量を削減する(標準的な20ulの検出反応を4回反復する場合の92マイクロリットルから、平均10反復の液滴ペアを使用するCARMEN-Cas13試験を行う場合の0.2マイクロリットル未満まで)。これは、出願人がCARMEN-cas13において4倍高い濃度の蛍光切断レポーターを使用しているため、SHERLOCKと比較して300倍を超えるコスト削減をもたらした(表11を参照)。チップあたりの追加の固定コストとサンプルのカラーコード化及び乳化のコストを考慮すると、CARMEN-Cas13の試験あたりのコストは、同等のSHERLOCK試験よりも100倍を超えて安い(表11を参照)。

Figure 2022513602000138
To analyze the costs associated with CARMEN-Cas13, Applicants first considered the costs of the detection reagents only, and then the additional costs (plastic containing array, droplet formation, and color code). CARMEN-Cas13 typically reduces the detection volume by more than 400 times in a single test (from 92 microliters for 4 repeats of the standard 20 ul detection reaction to an average of 10 repeat droplet pairs. Less than 0.2 microliters when performing the CARMEN-Cas13 test). This resulted in a cost savings of over 300x compared to SHERLOCK due to the applicant's use of a 4x higher concentration fluorescent cleavage reporter in CARMEN-cas13 (see Table 11). Considering the additional fixing cost per chip and the cost of color coding and emulsification of the sample, the cost per test of CARMEN-Cas13 is more than 100 times cheaper than the equivalent SHERLOCK test (see Table 11).
Figure 2022513602000138

CARMENの装置コストは高いが、核酸検出のための他のマルチプレックス法よりも劇的に高くはなく、将来的に改善される可能性がある。蛍光読み出し(qPCR、FISH)を使用する他の多くの方法と同様に、CARMEN-Cas13は4~5チャネルで蛍光を高感度に検出する必要がある。CARMEN-Cas13では、マイクロウェルアレイからのデータ取得を容易にするために、いくつかの自動画像化機能も必要とする。マルチモードプレートリーダーまたはqPCR装置のコストは約$30,000であるが、CARMENに適した顕微鏡の費用は約$50,000である(CARMENの画像化要件による追加コスト)。これらはどちらも、ハイスループットメタゲノムシーケンシング(例えば、HiSeq、NextSeq、NovaSeq)に通常使用されるIlluminaシーケンシングマシンよりもはるかに安価である。 The equipment cost of CARMEN is high, but not dramatically higher than other multiplex methods for nucleic acid detection and may be improved in the future. Like many other methods using fluorescence readout (qPCR, FISH), CARMEN-Cas13 needs to detect fluorescence in 4-5 channels with high sensitivity. CARMEN-Cas13 also requires some automatic imaging capabilities to facilitate data acquisition from the microwell array. The cost of a multimode plate reader or qPCR device is about $ 30,000, while the cost of a microscope suitable for CARMEN is about $ 50,000 (additional cost due to CARMEN imaging requirements). Both of these are much cheaper than the Illumina sequencing machines commonly used for high-throughput metagenomic sequencing (eg, HiSeq, NextSeq, NovaSeq).

CARMENには、蛍光読み取り用の装置に加えて、液滴生成用の装置も必要とする。Bio-Rad QX200($31,000)の商用マシンを液滴生成に使用できるが、液滴生成に必要な装置は、カスタム製作の圧力マニホールドを使用することで大幅に削減でき、この圧力マニホールドは、製造に約$2,000のコストがかかる。したがって、液滴生成ハードウェアは、CARMEN技術の全体的なコストのマイナーなコンポーネントである。 CARMEN requires a device for droplet generation in addition to a device for fluorescent reading. A Bio-Rad QX200 ($ 31,000) commercial machine can be used for droplet generation, but the equipment required for droplet generation can be significantly reduced by using a custom made pressure manifold, which is a pressure manifold. It costs about $ 2,000 to manufacture. Therefore, the droplet generation hardware is a minor component of the overall cost of CARMEN technology.

人件費を定量化することは困難であるが、CARMEN-cas13に必要な人件費は、RT-qPCR、ELISA、LAMPなどの低プレックスアッセイよりも試験ごとに少なくなる。例えば、個々のmChipのセットアップ、画像化、及び分析には約8人時間かかるが、チップあたり約5,000の試験は、50を超える完全な384ウェルプレートに相当する(試験ごとに3~4の技術的反復(プレートベースのアッセイで統計的検出力を達成するために必要な数)を含む)。したがって、完全な384ウェルプレート等量ごとに必要な時間は10人分未満であり、出願人の手で、完全な384ウェルプレート1枚をセットアップするには、少なくとも1時間かかり、試薬の解凍から始まり、アッセイの開始時に終わる。さらに、CARMEN-Cas13のプロトコールは、新世代シーケンシングのライブラリー調製よりも単純であり、完了するまでより少ないステップとより少ない時間を必要とする。 Although it is difficult to quantify labor costs, the labor costs required for CARMEN-cas13 are lower per test than for low-plex assays such as RT-qPCR, ELISA, and LAMP. For example, setting up, imaging, and analyzing individual mChips takes about 8 man-hours, but about 5,000 tests per chip correspond to more than 50 complete 384-well plates (3-4 per test). Technical iterations (the number required to achieve statistical power in a plate-based assay). Therefore, the time required for each complete 384-well plate equal amount is less than 10 servings, and it takes at least 1 hour for the applicant to set up one complete 384-well plate from thawing of the reagent. It begins and ends at the beginning of the assay. In addition, the CARMEN-Cas13 protocol is simpler than new generation sequencing library preparation and requires fewer steps and less time to complete.

CARMEN-Cas13を実行するコストを他のアッセイと比較する場合、実験の規模を考慮することが重要であることに留意されたい。特に、関連するコストの多くは、チップの数、または増幅されたサンプルの数とCas13検出ミックスの数の合計に線形に比例する。そのため、CARMEN-cas13のあまり好ましくない使用ケースは、1つのサンプルで数百の潜在的なウイルスを試験することある。固定コストがかかるため、標準のマイクロタイタープレートで同じ実験を行う場合に比べて、コスト削減は小さくなる。特定のチップに新しいサンプルを追加する限界コストはわずか数ドルであるため、複数のサンプルを同時に試験すると、コストが大幅に低下する。CARMENのコンビナトリアルな性質により、多くの標的の存在について多くのサンプルを試験するコストがさらに削減される。検査あたりの試薬コストが低いという制限では、サンプルコストは、実行される試験の数ではなくサンプルの数に比例するために、サンプル処理が総コストを支配する可能性が高いことに留意されたい。したがって、CARMEN-Cas13よりもさらに高いスループットでサンプル試験を可能にするには、サンプルの収集と処理に関連するコストと労力を大幅に削減する必要がある。 It should be noted that it is important to consider the scale of the experiment when comparing the cost of performing CARMEN-Cas13 with other assays. In particular, much of the associated cost is linearly proportional to the number of chips, or the sum of the number of amplified samples and the number of Cas13 detection mixes. Therefore, a less preferred use case for CARMEN-cas13 is to test hundreds of potential viruses in a single sample. Due to the fixed cost, the cost savings are smaller than when the same experiment is performed on a standard microtiter plate. The marginal cost of adding a new sample to a particular chip is only a few dollars, so testing multiple samples at the same time can significantly reduce the cost. The combinatorial nature of CARMEN further reduces the cost of testing many samples for the presence of many targets. Note that with the low reagent cost per test limitation, sample processing is likely to dominate the total cost because sample cost is proportional to the number of samples rather than the number of tests performed. Therefore, in order to enable sample testing with even higher throughput than CARMEN-Cas13, it is necessary to significantly reduce the costs and labor associated with sample collection and processing.

最後に、患者のサンプルに対して数十または数百のSHERLOCK、DETECTR、qPCR、ELISA、またはLAMPアッセイを実行するには、非常に大量のサンプル(血液、唾液、または尿の数十ミリリットル)が必要であり、これはしばしば利用可能ではない。CARMENの場合、抽出されたRNAはPCRプールごとに最大2マイクロリットル使用され、ヒト関連ウイルスパネルの15のPCRプールで合計最大30マイクロリットルが使用される。これには、体液の合計サンプル投入量が数百マイクロリットル必要である(使用する抽出キットの種類によって異なる)。つまり、各サンプルで実行される試験の数が大幅に増加したにもかかわらず、CARMENの全体的なサンプル投入量の要件は他の方法と大きく変わらない。したがって、試薬コストの削減に加えて、CARMEN-Cas13はサンプル消費量を削減するため、より多くの試験を実行できるようになり、サンプルの取得と処理のコストが削減される。 Finally, to perform tens or hundreds of SHERLOCK, DETECTR, qPCR, ELISA, or LAMP assays on a patient's sample, a very large sample (tens of milliliters of blood, saliva, or urine) is needed. Required and this is often not available. For CARMEN, the extracted RNA is used up to 2 microliters per PCR pool, with a total of up to 30 microliters used in 15 PCR pools of the human-related virus panel. This requires a total sample input of hundreds of microliters of body fluid (depending on the type of extraction kit used). That is, despite the significant increase in the number of tests performed on each sample, CARMEN's overall sample input requirements are not significantly different from other methods. Therefore, in addition to reducing reagent costs, CARMEN-Cas13 reduces sample consumption, allowing more tests to be performed and reducing sample acquisition and processing costs.

ヒト関連ウイルスパネル
試験に最適なcrRNAの選択:何百もの合成DNA及びRNAオリゴヌクレオチドを合成するコストが高いため、出願人は、ヒト関連ウイルスパネル設計全体を実験的に試験しなかった。大多数(143)の種では、既知の配列の90%をカバーするために単一のcrRNAが必要だったため(図39A~39G)、出願人は各種について単一のcrRNAを試験することを決定した。セットに複数のcrRNAがある場合は、その種の大多数のコンセンサス配列に最も厳密に一致する配列を持つcrRNAが選択された。インフルエンザAのサブタイピングにcrRNAセットを使用した結果(図42A~42C)に基づいて、完全なcrRNAセットを使用して、設計どおりに各種の既知の配列の90%を完全にカバーできる。出願人のバーコードと多重化スキームはこれに対応でき、検出ミックスの数が増えるためにサンプルスループットが適度に低下する。
Choosing the Optimal crRNA for Human-Related Virus Panel Testing: Due to the high cost of synthesizing hundreds of synthetic DNAs and RNA oligonucleotides, Applicants did not experimentally test the entire human-related virus panel design. Since the majority (143) species required a single crRNA to cover 90% of the known sequences (FIGS. 39A-39G), Applicants decided to test a single crRNA for each variety. did. If there were multiple crRNAs in the set, the crRNA with the sequence that most closely matched the majority of the consensus sequences of that species was selected. Based on the results of using the crRNA set for subtyping influenza A (FIGS. 42A-42C), the complete crRNA set can be used to completely cover 90% of the various known sequences as designed. Applicant barcodes and multiplexing schemes can accommodate this, with moderately reduced sample throughput due to the increased number of detection mixes.

交差汚染:大規模に多重化されたウイルス検出パネルを試験する際の実際の懸念事項は、特に乳化前の、交差汚染である。CARMEN-Cas13システムの非常に高い感度は、微量の交差汚染でも広範な偽陽性結果につながる可能性があることを意味する。出願人の試験では、広範な交差反応性は観察されなかったが、crRNAと予期しない合成標的との交差反応性の例がいくつかあった。交差反応性のすべての例は、crRNAと合成標的配列を整列させることによって調査された。この分析に基づいて、これらの例の少数(4~5)は配列を介したものである可能性が高く、バージョン2の再設計で変更された。交差反応性の残りの例は、次の理由により、交差汚染が原因である可能性がある:
1. 配列を介さない交差反応の大部分は隣接するウェル間で発生し、合成標的の希釈中、または増幅反応のセットアップ中の交差汚染が原因である可能性があることを示唆している。
2. 交差反応性は、DNAまたはRNA合成中に発生した交差汚染が原因である可能性がある。ヒト関連ウイルスパネルのオリゴヌクレオチドは、96ウェルプレートで並行して商業的に合成された。次世代シーケンシングのバーコードアダプターとして使用される共合成オリゴヌクレオチドは、低頻度で交差汚染を持つことが観察されている37
Cross-contamination: A real concern when testing large-scale multiplexed virus detection panels is cross-contamination, especially before emulsification. The very high sensitivity of the CARMEN-Cas13 system means that even trace cross-contamination can lead to widespread false positive results. No widespread cross-reactivity was observed in the applicant's study, but there were some examples of cross-reactivity between crRNA and unexpected synthetic targets. All examples of cross-reactivity were investigated by aligning crRNA with synthetic target sequences. Based on this analysis, a small number (4-5) of these examples are likely to be sequence-mediated and have been modified in the version 2 redesign. The remaining examples of cross-reactivity may be due to cross-contamination for the following reasons:
1. 1. Most of the sequence-mediated cross-reactivity occurs between adjacent wells, suggesting that cross-contamination may be the cause during dilution of synthetic targets or during setup of amplification reactions.
2. 2. Cross-reactivity can be due to cross-contamination that occurs during DNA or RNA synthesis. Oligonucleotides from the human-related viral panel were synthesized commercially in parallel on 96-well plates. Co-synthetic oligonucleotides used as bar code adapters for next-generation sequencing have been observed to have infrequent cross-contamination37.

配列カバレッジ:交差反応性に加えて、配列カバレッジは設計の重要な側面である。ヒト関連ウイルスパネルは、各種の既知の配列の少なくとも90%をカバーするように設計されているが、実際のカバレッジジは、以下の理由により、これよりも多い場合も低い場合もある。
1. crRNAとプライマーは、パネル内の各種の既知の配列の少なくとも90%をカバーするように設計されているが、設計ではカバーされていないと考えられる既知の配列の5~10%を検出できる可能性もある。
2. 出願人は、crRNAとその標的の間の1ミスマッチという厳しい閾値を設定した。ミスマッチの位置によっては、かなりの切断活性がまだある可能性があり、短縮されたスペーサーは、核酸検出のために非常に活性である可能性がある
3. 一部の種では、正確な診断を設計するのに十分な配列データがない。したがって、出願人は、パネルを、10以上の利用可能なゲノム配列を持つ種に限定した。
Sequence coverage: In addition to cross-reactivity, sequence coverage is an important aspect of design. The human-related virus panel is designed to cover at least 90% of various known sequences, but the actual coverage may be higher or lower for the following reasons:
1. 1. The crRNA and primers are designed to cover at least 90% of the various known sequences in the panel, but may be able to detect 5-10% of known sequences that are not considered to be covered by the design. There is also.
2. 2. Applicants have set a tight threshold of 1 mismatch between crRNA and its targets. Depending on the location of the mismatch, there may still be significant cleavage activity, and the shortened spacers may be very active for nucleic acid detection 7 .
3. 3. For some species, there is not enough sequence data to design an accurate diagnosis. Therefore, Applicants limited the panel to species with 10 or more available genomic sequences.

同様の考慮事項は、インフルエンザサブタイピングパネルにも当てはまる。 Similar considerations apply to the influenza subtyping panel.

最後に、配列カバレッジと分析感度は異なるが、アッセイ感度に寄与する関連する考慮事項である。特定のcrRNAは、特定の分析感度(バックグラウンドを超えてその配列を検出する能力)でゲノム内の特定の配列を標的とする。アッセイの感度を高めるために、ユーザーはさらにcrRNAを追加して、病原体核酸の追加の断片を検出できるようにするか(配列カバレッジを拡大)、個々のcrRNAの性能を向上させることができる。サンプルが既知のウイルスゲノムの一部のみを保持している可能性がある場合(分解、変異などによる)、配列カバレッジを増やすためにcrRNAを多重化することは特に効果的である。 Finally, sequence coverage and analytical sensitivity are different, but are related considerations that contribute to assay sensitivity. A particular crRNA targets a particular sequence in the genome with a particular analytical sensitivity (the ability to detect that sequence across the background). To increase the sensitivity of the assay, users can add additional crRNAs to detect additional fragments of pathogen nucleic acids (increasing sequence coverage) or improve the performance of individual crRNAs. Multiplexing crRNA to increase sequence coverage is particularly effective when the sample may carry only part of a known viral genome (due to degradation, mutation, etc.).

未知サンプルの試験:この研究では、出願人は、単一のプライマープールを使用して、ヒト関連ウイルスパネルの169種のそれぞれの大多数のコンセンサス配列を持つ、169の既知の合成標的を試験し、各標的を増幅した(設計に基づく)。未知のサンプルの場合、15のプールすべてを使用して各サンプルを増幅し、検出前にプールを組み合わせるか、または個別に実行する。次の結果の可能性がある:
1. 単一のcrRNAによる選択的な識別を観察して喜ぶ可能性がある。
2. 交差反応性が観察された場合、交差反応性が発生した個々のプールを再実行できる。このような場合、重複感染の可能性を示唆する事前情報がない限り、重複感染があると想定すべきではない。
3. 結果の信頼性を高めるために、陽性対照を使用するか、またはサンプルを再試験することで、弱い反応性を説明できる場合がある。
4. 次の理由により、陽性の結果が観察されない場合がある。(1)病原体の配列が、設計でカバーされていない既知の配列の5~10%にある、(2)ウイルス力価が低すぎて検出できない、または(3)サンプルが劣化している可能性がある。
Testing unknown samples: In this study, Applicants used a single primer pool to test 169 known synthetic targets with a consensus sequence for each of the 169 species of human-related virus panels. , Each target amplified (based on design). For unknown samples, all 15 pools are used to amplify each sample and the pools are combined or run individually prior to detection. The following results are possible:
1. 1. It may be pleasing to observe selective identification by a single crRNA.
2. 2. If cross-reactivity is observed, the individual pools in which the cross-reactivity occurred can be rerun. In such cases, co-infection should not be assumed unless there is prior information suggesting the possibility of co-infection.
3. 3. To increase the reliability of the results, the weak reactivity may be explained by using a positive control or retesting the sample.
4. Positive results may not be observed for the following reasons: (1) Pathogen sequences may be in 5-10% of known sequences not covered by design, (2) virus titers may be too low to detect, or (3) samples may be degraded. There is.

以下の参照文献は実施例2に関連する。 The following references relate to Example 2.

1.Bosch,I.et al.Rapid antigen tests for dengue virus serotypes and Zika virus in patient serum.Sci.Transl.Med.9,(2017). 1. 1. Bosch, I. et al. Rapid antigen tests for dengue virus serotypes and Zika virus in patient serum. Sci. Transl. Med. 9, (2017).

2.Popowitch,E.B.,O’Neill,S.S.& Miller,M.B.Comparison of the Biofire
FilmArray RP,Genmark eSensor RVP,Luminex xTAG RVPvl,and Luminex xTAG RVP fast multiplex assays for detection of respiratory viruses.J.Clin.Microbiol.51,1528-1533(2013).
2. 2. Popowitch, E.I. B. , O'Neill, S.A. S. & Miller, M.M. B. Company of the Biofire
FilmArray RP, Genmark eSensor RVP, Luminex xTAG RVPvl, and Luminex xTAG RVP fast multiplex assay for reflection virus. J. Clin. Microbiol. 51, 1528-1533 (2013).

3.Du,Y.et al.Coupling Sensitive Nucleic Acid Amplification with Commercial Pregnancy Test Strips.Angew.Chem.Int.Ed Engl.56,992-996(2017). 3. 3. Du, Y. et al. Coupling Sensitive Nucleic Acid Amplification with Commerce Pregnancy Test Strips. Angew. Chem. Int. Ed Engl. 56,992-996 (2017).

4.Wang,D.et al.Microarray-based detection and genotyping of viral pathogens.Proc.Natl.Acad.Sci.U.S.A.99,15687-15692(2002). 4. Wang, D. et al. Microarray-based detection and genotyping of viral pathogens. Proc. Natl. Acad. Sci. U. S. A. 99,15687-15692 (2002).

5.Houldcroft,C.J.,Beale,M.A.& Breuer,J.Clinical and biological insights from viral genome sequencing.Nat.Rev.Microbiol.15,183-192(2017). 5. Holdcraft, C.I. J. , Beare, M. et al. A. & Brewer, J.M. Clinical and biological insights from viral genome sequencing. Nat. Rev. Microbiol. 15,183-192 (2017).

6.Palacios,G.et al.Panmicrobial oligonucleotide array for diagnosis of
infectious diseases.Emerg.Infect.Dis.13,73-81(2007).
6. Palacios, G.M. et al. Panmicrobial oligonucleotide array for diagnostics of
infectious diseases. Emerg. Infect. Dis. 13, 73-81 (2007).

7.Gootenberg,J.S.et al.Nucleic acid detection with CRISPR-cas13a/C2c2.Science 356,438-442(2017). 7. Gootenberg, J. Mol. S. et al. Nucleic acid detection with CRISPR-cas13a / C2c2. Science 356,438-442 (2017).

8.Kulesa,A.,Kehe,J.,Hurtado,J.E.,Tawde,P.& Blainey,P.C.Combinatorial drug discovery in nanotiter droplets.Proc.Natl.Acad.Sci.U.S.A.115,6685-6690(2018). 8. Kulesa, A. , Kehe, J.M. , Hurtado, J. et al. E. , Tawde, P.M. & Brainey, P.M. C. Combinatorial drug discovery in nanotiter drops. Proc. Natl. Acad. Sci. U. S. A. 115,6685-6690 (2018).

9.Chertow,D.S.Next-generation diagnostics with CRISPR.Science 360,381-
382(2018).
9. Cherry, D. et al. S. Next-generation diagnostics with CRISPR. Science 360,381-
382 (2018).

10.Kocak,D.D.& Gersbach,C.A.From CRISPR scissors to virus sensors.Nature 557,168-169(2018). 10. Kokak, D.I. D. & Gersbach, C.I. A. From CRISPR scissors to virus sensors. Nature 557,168-169 (2018).

11.US Food & Drug Administration、www.fda.gov.で入手可能(アクセス日:2018年11月1日) 11. US Food & Drug Assessment, www. fda. gov. Available at (Access date: November 1, 2018)

12.Brister,J.R.,Rodney Brister,J.,Ako-adjei,D.,Bao,Y.& Blinkova,O.NCBI Viral Genomes Resource.Nucleic Acids Res.43,D571-D577(2014). 12. Brister, J.M. R. , Rodney Brister, J. Mol. , Ako-adjei, D.I. , Bao, Y. & Blinkova, O.D. NCBI Visual Genomes Resource. Nucleic Acids Res. 43, D571-D577 (2014).

13.Briese,T.et al.Virome Capture Sequencing Enables Sensitive Viral Diagnosis and Comprehensive Virome Analysis.MBio 6,e01491-15(2015). 13. Briese, T.M. et al. Virome Capture Sequencing Energy Sensitive Visual Diagnosis and Comprehensive Virome Analysis. MBio 6, e01491-15 (2015).

14.Allicock,O.M.et al.BacCapSeq:a Platform for Diagnosis and Characterization of Bacterial Infections.MBio 9,(2018). 14. Allicock, O.D. M. et al. BacCapSeq: a Platform for Digital Infections and characterization of Bacterial Infections. MBio 9, (2018).

15.Chen,J.S.et al.CRISPR-Cas12a target binding unleashes indiscriminate single-stranded DNase activity.Science 360,436-139(2018). 15. Chen, J. et al. S. et al. CRISPR-Cas12a target binding unleashes indisciminate single-stranded DNase activity. Science 360, 436-139 (2018).

16.Gootenberg,J.S.et al.Multiplexed and portable nucleic acid detection platform with Cas13,Cas12a,and Csm6.Science 360,439-444(2018). 16. Gootenberg, J. Mol. S. et al. Multiplexed and portable nucleic acid detection plateform with Cas13, Cas12a, and Csm6. Science 360, 439-444 (2018).

17.Myhrvold,C.et al.Field-deployable viral diagnostics using CRISPR-Cas13.Science 360,444-448(2018). 17. Myhrvolve, C.I. et al. Field-deployable viral dynamics using CRISPR-Cas13. Science 360, 444-448 (2018).

18.Macosko,E.Z.et al.Highly Parallel Genome-wide Expression Profiling of
Individual Cells Using Nanoliter Droplets.Cell 161,1202-1214(2015).
18. Macosko, E. et al. Z. et al. Highly Parallel Genome-wide Expression Profiling of
Individual Cells Using Nanoliter Droplets. Cell 161, 1202-1214 (2015).

19.Quake,S.Solving the Tyranny of Pipetting.arXiv(2018). 19. Quake, S.A. Solving the Typitation of Pipetting. arXiv (2018).

20.Ismagilov,R.F.,Ng,J.M.,Kenis,P.J.& Whitesides,G.M.Microfluidic arrays of fluid-fluid diffusional contacts as detection elements and combinatorial tools.Anal.Chem.73,5207-5213(2001). 20. Ismagilov, R.M. F. , Ng, J. et al. M. , Kenis, P. et al. J. & Whitesides, G.M. M. Microfluidic arrays of fluid-fluid diffusion contact as detection elements and combinatorial tools. Anal. Chem. 73,5207-5213 (2001).

21.Zahn,H.et al.Scalable whole-genome single-cell library preparation without preamplification.Nat.Methods 14,167-173(2017). 21. Zahn, H. et al. et al. Scalable whole-genome single-cell library prepation without preamplifier. Nat. Methods 14, 167-173 (2017).

22.Hassibi,A.et al.Multiplexed identification,quantification and genotyping of infectious agents using a semiconductor biochip.Nat.Biotechnol.36,738-745(2018). 22. Hasshibi, A. et al. Multiplexed pathogens, quantification and genotyping of infectious agents using a semiconductor biochip. Nat. Biotechnol. 36,738-745 (2018).

23.Dunbar,S.A.Applications of Luminex xMAP technology for rapid,high-throughput multiplexed nucleic acid detection.Clin.Chim.Acta 363,71-82(2006). 23. Dunbar, S.M. A. Applications of Luminex xMAP technology for rapid, high-throughput multiplexed nucleoplexed detection. Clin. Chim. Acta 363,71-82 (2006).

24.Nguyen,H.Q.et al.Programmable Microfluidic Synthesis of Over One Thousand Uniquely Identifiable Spectral Codes.Adv Opt Mater 5,(2017). 24. Nguyen, H. et al. Q. et al. Programmable Microfluidic Synthesis of Over One Thousand United Ideal Ideal Codes. Adv Opti Mater 5, (2017).

25.Zhao,Y.et al.Microfluidic generation of multifunctional quantum dot barcode particles.J.Am.Chem.Soc.133,8790-8793(2011). 25. Zhao, Y. et al. Microfluidic generation of multifunctional quantum dot barcode parameters. J. Am. Chem. Soc. 133, 8790-8793 (2011).

26.Dunbar,S.A.& Li,D.Introduction to Luminex xMAP Technology and Applications for Biological Analysis in China.Asia Pacific Biotech News 14,26-30(2010). 26. Dunbar, S.M. A. & Li, D. Integration to Luminex xMAP Technology and Applications for Biological Analysis in China. Asia Pacific Biotechnology News 14, 26-30 (2010).

27.Untergasser,A.et al.Primer3-new capabilities and interfaces.Nucleic Acids Res.40,e!15-ell5(2012). 27. Intergasser, A.I. et al. Primer3-new capabilities and interfaces. Nucleic Acids Res. 40, e! 15-ell5 (2012).

28.Bodaghi,S.et al.Could human papillomaviruses be spread through blood? J.Clin.Microbiol.43,5428-5434(2005). 28. Bodaghi, S.A. et al. Cold human papillomaviruses be spread through blood blood? J. Clin. Microbiol. 43,5428-5434 (2005).

29.Moen,E.M.,Huang,L.& Grinde,B.Molecular epidemiology of TTV-like mini virus in Norway.Arch.Virol.147,181-185(2002). 29. Moen, E. M. , Huang, L. et al. & Grinde, B. Molecular epidemiology of TTV-like mini virus in Norway. Arch. Vilol. 147,181-185 (2002).

30.Gupta,R.K.et al.HIV-1 drug resistance before initiation or re-initiation of first-line antiretroviral therapy in low-income and middle-income countries:a systematic review and meta-regression analysis.Lancet Infect.Dis.18,346-355(2018). 30. Gupta, R.M. K. et al. HIV-1 drug response before regression or re-initiation of first-line antiretrovilal therapy in low-income and middle-income feedback. Lancet Infect. Dis. 18,346-355 (2018).

31.Wensing,A.M.et al.2017 Update of the Drug Resistance Mutations in HIV-1.Top.Antivir.Med.24,132-133(2017). 31. Wensing, A. M. et al. 2017 Update of the Drug Resistance Mutations in HIV-1. Top. Antivirus. Med. 24,132-133 (2017).

32.K.Katoh,D.M.Standley,MAFFT multiple sequence alignment software version 7:improvements in performance and usability.Mol.Biol.Evol.30,772-780(2013). 32. K. Katoh, D. M. Standard, MAFFT multiple sequence alignment software version 7: improvements in performance and usability. Mol. Biol. Evol. 30,772-780 (2013).

33.H.Li,Aligning sequence reads,clone sequences and assembly contigs with BWA-MEM(2013),(http://arxiv.org/abs/1303.3997で入手可能). 33. H. Li, Aligning sequence leads, clone sequences and assembly contigs with BWA-MEM (2013), (http://arxiv.org/abs/1303.3997).

34.J.Quick et al.,Multiplex PCR method for MiniON and Illumina sequencing of Zika and other virus genomes directly from clinical samples.Nat.Protoc.12,1261-1276(2017). 34. J. Quick et al. , Multiplex PCR method for Minion and Illumina sequencing of Zika and other viruses genomes directy from circular singles. Nat. Protocol. 12,1261-1276 (2017).

35.S.-Y.Rhee et al.,Human immunodeficiency virus reverse transcriptase and
protease sequence database.Nucleic Acids Res.31,298-303(2003).
35. S. -Y. Rhee et al. , Human immunodeficiency virus reverse transcriptase and
Protease sequence database. Nucleic Acids Res. 31,298-303 (2003).

36.J.Kehe et al.,Massively parallel screening of synthetic microbial communities.PNAS.In Press. 36. J. Kehe et al. , Massive parallel screening of synchronous microbial communities. PNAS. In Press.

37.M.A.Quail et al.,SASI-Seq:sample assurance Spike-Ins,and highly differentiating 384 barcoding for Illumina sequencing.BMC Genomics.15(2014),doi:10.1186/1471-2164-15-110. 37. M. A. Quail et al. , SASI-Seq: single assurance Spike-Ins, and highly differentialening 384 barcoding for Illumina sequencing. BMC Genomics. 15 (2014), doi: 10.1186 / 1471-2164-15-110.

実施例3:領域特異的検出パネル
このプロジェクトでは、ホンジュラスで流行しているウイルス種とウイルス株の診断パネルが開発される。並行して、出願人は、ホンジュラス国立自治州立自治大学(UNAH)と協力して、患者のサンプルを試験するために、ジカウイルスの検出とデング熱の血清型検査のための既存のCas13ベースのアッセイを展開する。UNAHでの多重化されたCas13ベースの診断用にハードウェアが配備され、この技術を使用するように協力者をトレーニングする。これらの目的が正常に完了すると、多くの風土病ウイルスが存在する国での疾病監視のための多重化されたCRISPRベースの検出技術が作成され、検証される。この研究は、病院に入院するすべての感染者が分子診断を受け、ウイルスの蔓延に関する豊富なデータセットを提供することで患者のケアを改善し、公衆衛生の取り組みに貢献する世界に向けた重要な第一歩となる。
Example 3: Region-Specific Detection Panel In this project, a diagnostic panel for virus species and strains prevalent in Honduras will be developed. In parallel, Applicants, in collaboration with the National Autonomous University of Honduras (UNAH), have an existing Cas13-based assay for Zika virus detection and dengue serotyping to test patient samples. Expand. Hardware is deployed for multiplexed Cas13-based diagnostics at UNAH and trains collaborators to use this technique. Upon successful completion of these objectives, a multiplexed CRISPR-based detection technique for disease surveillance in countries where many endemic viruses are present will be created and validated. This study is important to the world to improve patient care and contribute to public health efforts by providing a rich data set on the spread of the virus, with all infected individuals admitted to the hospital undergoing molecular diagnostics. It will be the first step.

第1の目標は、ホンジュラスで使用するCas-13ベースのウイルス診断パネルを開発することである。以前のCas13ベースのウイルス診断の利用(Myhrvold,Freije,et al.Science 2018)及びナノリットル液滴での生化学アッセイを小型化するための高度に多重化されたマイクロウェルアレイの利用(Kulesa,Keheet al.PNAS 2018)は、マイクロウェルアレイ内の液滴を使用した多重化された検出による多重化された増幅を提供する。 The first goal is to develop a Cas-13-based virus diagnostic panel for use in Honduras. Utilization of previous Cas13-based virus diagnostics (Myhrwald * , Freeje * , et al. Science 2018) and utilization of highly multiplexed microwell arrays to miniaturize biochemical assays on nanoliter droplets (Myhrvolve *, Freeje *, et al. Science 2018) Kulesa * , Kehe * et al. PNAS 2018) provides multiplexed amplification with multiplexed detection using droplets in a microwell array.

出願人は、ホンジュラスで流行していることが知られている20~30のウイルス病原体のセットを標的化する多重化増幅プライマーとcrRNAで構成される診断パネルを設計、実装、及び検証する。このパネルには、ホンジュラスではこれまで発見されていないが、検出された場合、公衆衛生に大きな影響を与える可能性のある、リスクの高いウイルス性病原体がいくつか含まれる。このような大規模なアッセイの開発は、昨年はコストと時間が法外に高くついたが、マイクロウェルアレイテクノロジーにより、Cas13検出アッセイを大規模に開発及び実行することができる。このパネルは、最初の包括的な各国固有のウイルス診断パネルになると考えられている。目標は、少なくとも20の目的のウイルスをカバーする多重化パネルの開発であり、各アッセイの検出限界はマイクロリットルあたり100コピーで、検出可能な交差反応性はなく、患者サンプル中のウイルスをマイクロリットルあたり1コピーという低濃度で検出できる、Myhrvold,Freije,et al.Science 2018に記載される方法に匹敵する感度を達成する。第2の目的では、出願人は、包括的な多重化ウイルスパネルを含む、Cas13ベースの検出技術をホンジュラスに展開する。初期の実験では、ホンジュラスでの標準的なSHERLOCKアッセイの展開に重点を置き、基礎となるCas13技術が流行しているジカウイルス及びデング熱ウイルスを高感度で検出できるようにする(1~8か月目)。多重化パネルの場合、計画ではまずブロード(1~8か月目)でアッセイを試験し、次にそれらをホンジュラス(9~12か月目)に持ち込んで疫学シーズン(通常は2月に始まる)の始まりを捉える。ハードウェアセットアップの組み立ては、出願人が既存の顕微鏡ハードウェアと同様の感度と特異性を備えたシステムを有することができるようにするために、5~8か月目にブロードで実行される。 Applicants design, implement, and validate a diagnostic panel consisting of multiplexed amplification primers and crRNA that target a set of 20-30 viral pathogens known to be endemic in Honduras. This panel contains some high-risk viral pathogens that have not been previously discovered in Honduras but, if detected, could have a significant impact on public health. Although the cost and time of developing such large-scale assays was exorbitant last year, microwell array technology allows large-scale development and execution of Cas13 detection assays. This panel is believed to be the first comprehensive country-specific virus diagnostic panel. The goal is to develop a multiplexing panel that covers at least 20 viruses of interest, with a detection limit of 100 copies per microliter for each assay, no detectable cross-reactivity, and microliters of virus in patient samples. Myhrwald * , Freeje * , et al. Can be detected at a low concentration of 1 copy per copy. Achieve sensitivity comparable to the methods described in Science 2018. For a second purpose, Applicants deploy Cas13-based detection techniques in Honduras, including a comprehensive multiplexed virus panel. Early experiments will focus on deploying a standard SHERLOCK assay in Honduras, allowing the underlying Cas13 technology to detect prevalent Zika and dengue viruses with high sensitivity (1-8 months). Eye). For multiplexed panels, the plan is to first test the assays on Broad (1-8 months) and then bring them to Honduras (9-12 months) for the epidemiological season (usually starting in February). Capture the beginning of. The assembly of the hardware setup is performed broadly at 5-8 months to allow the applicant to have a system with the same sensitivity and specificity as existing microscope hardware.

第2の目的は、ホンジュラスのジカ熱とデング熱に対してCas13ベースのウイルス診断を展開する既存の取り組みから利益を得るであろう。パイロット研究が進行中である。この目的を達成することで、ホンジュラスで従来型及び多重化されたCRISPRベースの診断の広範なデモンストレーションが可能になり、世界中のウイルス監視のためのCRISPRベースの診断の使用を主導することができる。 A second objective would benefit from existing efforts to develop Cas13-based viral diagnostics for Honduras' Zika and Dengue fever. Pilot research is underway. Achieving this goal will enable extensive demonstration of conventional and multiplexed CRISPR-based diagnostics in Honduras and lead the use of CRISPR-based diagnostics for virus monitoring worldwide. ..

潜在的な設計上の課題には、ウイルスごとの感度の変動やウイルス種間の交差反応性が含まれるが、マイクロウェルアレイを利用する本明細書に開示されている方法では、わずか1日または2日でアッセイ試験の1サイクルを行うことができるため、このプロジェクト中にアッセイを迅速に最適化できる。数十のサンプル(50~100)の分析により、診断パネルを使用して十分に研究されていないウイルスを検出することが期待される。しかしながら、十分に研究されていないウイルスがどの程度観察されるかは、未解決の研究課題である。有利なことに、本明細書に開示されるアプローチは、マイクロウェルアレイ内の液滴を開発して使用し、自動ステージを備えた4色蛍光顕微鏡は、ブロードで組み立てられ、試験され、ホンジュラスに展開される。この方法では、マイクロウェルアレイ内の液滴の画像化に必要な蛍光感度と空間分解能を実現するノーフリル顕微鏡を使用できるため、コストを削減しながらハードウェアの堅牢性を最大化できる。
***
Potential design challenges include virus-specific sensitivity variations and cross-reactivity between virus species, but with the methods disclosed herein utilizing microwell arrays, only one day or One cycle of assay testing can be performed in two days, allowing rapid optimization of the assay during this project. Analysis of dozens of samples (50-100) is expected to detect under-researched viruses using diagnostic panels. However, the extent to which under-researched viruses are observed remains an unresolved research topic. Advantageously, the approach disclosed herein develops and uses droplets in a microwell array, and a four-color fluorescence microscope with an automatic stage is broadly assembled, tested, and in Honduras. Be expanded. This method allows the use of a No Frills microscope that provides the fluorescence sensitivity and spatial resolution required for imaging droplets in a microwell array, thus maximizing hardware robustness while reducing costs.
***

本発明の記載された方法、医薬組成物、及びキットの様々な改変及び変形は、本発明の範囲及び趣旨から逸脱することなく、当業者には明らかであろう。本発明を特定の実施形態に関連して説明してきたが、さらなる改変が可能であり、特許請求される本発明はそのような特定の実施形態に過度に限定されるべきではないことが理解されるであろう。実際、当業者にとって明らかな、本発明を実施するための記載されたモードの様々な改変は、本発明の範囲内にあることを意図している。本出願は、一般に、本発明の原理に従い、本発明が属する技術分野の既知の慣習の範囲内であり、本明細書上記の本質的な特徴に適用することができる本開示からのそのような逸脱を含む、本発明のあらゆる変形、使用、または適応を包含することを意図している。 Various modifications and variations of the methods, pharmaceutical compositions, and kits described in the present invention will be apparent to those skilled in the art without departing from the scope and gist of the present invention. Although the invention has been described in the context of particular embodiments, it is understood that further modifications are possible and that the claimed invention should not be overly limited to such particular embodiments. Will be. In fact, the various modifications of the described modes for carrying out the invention, which are apparent to those of skill in the art, are intended to be within the scope of the invention. This application is generally within the bounds of known practice in the art to which the invention belongs, in accordance with the principles of the invention, as such from the present disclosure as applicable to the essential features described above. It is intended to embrace any modification, use, or adaptation of the invention, including deviations.

Claims (62)

標的分子を検出する方法であって、
第1のセットと第2のセットの液滴を組み合わせて液滴プールとすることであって、前記第1のセットの液滴は、Casタンパク質、対応する標的分子に結合するように設計された1つ以上のガイド分子、マスキング構築物、及び光学バーコードを含む検出CRISPR系を含み、前記第2のセットの液滴はサンプル及び任意選択で光学バーコードを含む、前記第1のセットと第2のセットの液滴を組み合わせて液滴プールとすることと、
前記液滴プールを、マイクロウェルのアレイ及び前記マイクロウェルの下の少なくとも1つのフローチャネルを含むマイクロ流体デバイス上に流すことであって、前記マイクロウェルが少なくとも2つの液滴を捕捉するサイズである、前記流すことと、
各マイクロウェルで捕捉された前記液滴の前記光学バーコードを検出することと、
各マイクロウェルで捕捉された前記液滴をマージして、各マイクロウェルでマージ液滴を形成することであって、前記マージ液滴の少なくともサブセットは、検出CRISPR系及び標的配列を含む、前記各マイクロウェルで捕捉された前記液滴をマージして、各マイクロウェルでマージ液滴を形成することと、
検出反応を開始することと、
1つ以上の時間間隔で、任意選択で連続的に、各マージ液滴の検出可能なシグナルを測定することと、
を含む、前記方法。
A method for detecting target molecules
The first set and the second set of droplets are combined into a droplet pool, wherein the first set of droplets is designed to bind to the Cas protein, the corresponding target molecule. The first set and the second set include a detection CRISPR system comprising one or more guide molecules, a masking construct, and an optical bar code, wherein the second set of droplets comprises a sample and optionally an optical bar code. To make a droplet pool by combining the droplets of the set of
The droplet pool is flown onto a microfluidic device comprising an array of microwells and at least one flow channel beneath the microwells, the size of which the microwells capture at least two droplets. , The above-mentioned flow and
To detect the optical barcode of the droplet captured in each microwell,
By merging the droplets captured in each microwell to form a merged droplet in each microwell, at least a subset of the merged droplets comprises the detection CRISPR system and the target sequence. By merging the droplets captured by the microwells to form a merged droplet at each microwell,
To start the detection reaction and
Measuring the detectable signal of each merged droplet continuously, optionally, at one or more time intervals.
The method described above.
前記標的分子を増幅するステップをさらに含む、請求項1に記載の方法。 The method of claim 1, further comprising the step of amplifying the target molecule. 前記増幅することが、核酸配列ベース増幅(NASBA)、リコンビナーゼポリメラーゼ増幅(RPA)、ループ媒介等温増幅(LAMP)、鎖置換増幅(SDA)、ヘリカーゼ依存性増幅(HDA)、ニッキング酵素増幅反応(NEAR)、PCR、多重置換増幅(MDA)、ローリングサークル増幅(RCA)、リガーゼ連鎖反応(LCR)、または分岐増幅法(RAM)を含む、請求項2に記載の方法。 The amplification includes nucleic acid sequence-based amplification (NASBA), recombinase polymerase amplification (RPA), loop-mediated isothermal amplification (LAMP), chain substitution amplification (SDA), helicase-dependent amplification (HDA), and nicking enzyme amplification reaction (NEAR). ), PCR, Multiple Substitution Amplification (MDA), Rolling Circle Amplification (RCA), Ligase Chain Reaction (LCR), or Branch Amplification Method (RAM). 前記増幅することが、RPAまたはPCRによって実施される、請求項2に記載の方法。 The method of claim 2, wherein the amplification is performed by RPA or PCR. 前記標的分子が生体サンプルまたは環境サンプルに含まれる、請求項1に記載の方法。 The method of claim 1, wherein the target molecule is included in a biological sample or an environmental sample. 前記サンプルがヒト由来である、請求項5に記載の方法。 The method of claim 5, wherein the sample is of human origin. 前記生体サンプルが、血液、血漿、血清、尿、大便、痰、粘液、リンパ液、滑液、胆汁、腹水、胸水、漿液腫、唾液、脳脊髄液、房水もしくは硝子体液、または任意の体の分泌物、濾出液、浸出液、または関節から得られた液体、または皮膚もしくは粘膜表面のスワブである、請求項5に記載の方法。 The biological sample is blood, plasma, serum, urine, stool, sputum, mucus, lymph, synovial fluid, bile, ascites, pleural effusion, serous tumor, saliva, cerebrospinal fluid, tufted or vitreous fluid, or any body fluid. 5. The method of claim 5, wherein the fluid is a secretion, serum, exudate, or fluid obtained from a joint, or a swab on the surface of the skin or mucous membrane. 前記1つ以上のガイドが、(合成)ミスマッチを含む対応する標的分子に結合するように設計されたRNAである、請求項1に記載の方法。 The method of claim 1, wherein the one or more guides are RNA designed to bind to a corresponding target molecule, including a (synthetic) mismatch. 前記ミスマッチが、前記標的分子におけるSNPまたは他の単一ヌクレオチド変異の上流または下流にある、請求項8に記載の方法。 The method of claim 8, wherein the mismatch is upstream or downstream of an SNP or other single nucleotide mutation in the target molecule. 前記1つ以上のガイドRNAが、標的RNAもしくはDNA中の一塩基多型、またはRNA転写物のスプライスバリアントを検出するように設計されている、請求項1に記載の方法。 The method of claim 1, wherein the one or more guide RNAs are designed to detect single nucleotide polymorphisms in the target RNA or DNA, or splicing variants of RNA transcripts. 前記1つ以上のガイドRNAが、ウイルス感染における薬剤耐性SNPを検出するように設計されている、請求項10に記載の方法。 10. The method of claim 10, wherein the one or more guide RNAs are designed to detect drug resistant SNPs in viral infections. 前記1つ以上のガイドRNAが、疾患状態に特徴的な1つ以上の標的分子に結合するように設計されている、請求項1に記載の方法。 The method of claim 1, wherein the one or more guide RNAs are designed to bind to one or more target molecules characteristic of the disease state. 前記疾患状態が、薬剤耐性または感受性遺伝子または転写物またはポリペプチドの存在または非存在によって特徴付けられる、請求項12に記載の方法。 12. The method of claim 12, wherein the disease state is characterized by the presence or absence of a drug resistance or susceptibility gene or transcript or polypeptide. 前記1つ以上のガイドRNAが、1つ以上の微生物株を区別するように設計されている、請求項1に記載の方法。 The method of claim 1, wherein the one or more guide RNAs are designed to distinguish one or more microbial strains. 前記疾患状態が感染症である、請求項12に記載の方法。 12. The method of claim 12, wherein the disease state is an infectious disease. 前記感染症がウイルス、細菌、真菌、原虫、または寄生虫によって引き起こされる、請求項15に記載の方法。 15. The method of claim 15, wherein the infection is caused by a virus, bacterium, fungus, protozoan, or parasite. 前記1つ以上のガイドRNAが、少なくとも90のガイドRNAを含む、請求項15に記載の方法。 15. The method of claim 15, wherein the one or more guide RNAs comprises at least 90 guide RNAs. 前記CRISPRタンパク質が、RNA標的タンパク質、DNA標的タンパク質、またはそれらの組み合わせである、請求項1に記載の方法。 The method of claim 1, wherein the CRISPR protein is an RNA target protein, a DNA target protein, or a combination thereof. 前記RNA標的タンパク質が1つ以上のHEPNドメインを含む、請求項18に記載の方法。 18. The method of claim 18, wherein the RNA target protein comprises one or more HEPN domains. 前記1つ以上のHEPNドメインがRxxxxHモチーフ配列を含む、請求項19に記載の方法。 19. The method of claim 19, wherein the one or more HEPN domains comprises an RxxxxxxH motif sequence. 前記RxxxHモチーフがR{N/H/K]XH配列を含む、請求項20に記載の方法。 20. The method of claim 20, wherein the RxxxH motif comprises an R {N / H / K] X 1 X 2 X 3 H sequence. が、R、S、D、E、Q、N、G、またはYであり、Xが独立して、I、S、T、V、またはLであり、Xが独立して、L、F、N、Y、V、I、S、D、E、またはAである、請求項21に記載の方法。 X 1 is R, S, D, E, Q, N, G, or Y, X 2 is independent, I, S, T, V, or L, and X 3 is independent. 21. The method of claim 21, wherein L, F, N, Y, V, I, S, D, E, or A. 前記CRISPR RNA標的タンパク質がC2c2である、請求項1に記載の方法。 The method of claim 1, wherein the CRISPR RNA target protein is C2c2. 前記CRISPRタンパク質がDNA標的タンパク質である、請求項18に記載の方法。 18. The method of claim 18, wherein the CRISPR protein is a DNA target protein. 前記CRISPRタンパク質がRuvC様ドメインを含む、請求項24に記載の方法。 24. The method of claim 24, wherein the CRISPR protein comprises a RuvC-like domain. 前記DNA標的タンパク質がV型タンパク質である、請求項24に記載の方法。 24. The method of claim 24, wherein the DNA target protein is a V-type protein. 前記DNA標的タンパク質がCas12である、請求項24に記載の方法。 24. The method of claim 24, wherein the DNA target protein is Cas12. 前記Cas12がCpf1、C2c3、C2c1、またはそれらの組み合わせである、請求項25に記載の方法。 25. The method of claim 25, wherein Cas12 is Cpf1, C2c3, C2c1, or a combination thereof. 前記マスキング構築物がRNAベースであり、検出可能な陽性シグナルの生成を抑制する、請求項1に記載の方法。 The method of claim 1, wherein the masking construct is RNA-based and suppresses the generation of detectable positive signals. 前記RNAベースのマスキング構築物が、検出可能な陽性シグナルをマスキングするか、または代わりに検出可能な陰性シグナルを生成することにより、前記検出可能な陽性シグナルの生成を抑制する、請求項29に記載の方法。 29. The RNA-based masking construct suppresses the generation of the detectable positive signal by masking the detectable positive signal or instead producing a detectable negative signal. Method. 前記RNAベースのマスキング構築物が、レポーティング構築物によってコードされる遺伝子産物の生成を抑制するサイレンシングRNAを含み、前記遺伝子産物が、発現時に前記検出可能な陽性シグナルを生成する、請求項29に記載の方法。 29. Claim 29, wherein the RNA-based masking construct comprises silencing RNA that suppresses the production of the gene product encoded by the reporting construct, wherein the gene product produces the detectable positive signal upon expression. Method. 前記RNAベースのマスキング構築物が、前記陰性の検出可能なシグナルを生成するリボザイムであり、前記リボザイムが不活性化されたときに、前記陽性の検出可能なシグナルが生成される、請求項29に記載の方法。 29. The RNA-based masking construct is a ribozyme that produces the negative detectable signal, and when the ribozyme is inactivated, the positive detectable signal is produced. the method of. 前記リボザイムが基質を第1の色に変換し、前記リボザイムが不活性化されたときに前記基質が第2の色に変換される、請求項32に記載の方法。 32. The method of claim 32, wherein the ribozyme converts the substrate to a first color and the substrate is converted to a second color when the ribozyme is inactivated. 前記RNAベースのマスキング剤がRNAアプタマーであり、及び/またはRNA係留阻害剤を含む、請求項29に記載の方法。 29. The method of claim 29, wherein the RNA-based masking agent is an RNA aptamer and / or comprises an RNA mooring inhibitor. 前記アプタマーまたはRNA係留阻害剤が酵素を隔離し、前記酵素が基質に作用することにより前記アプタマーまたはRNA係留阻害剤から放出されると検出可能なシグナルを生成する、請求項34に記載の方法。 34. The method of claim 34, wherein the aptamer or RNA mooring inhibitor sequesters the enzyme and acts on the substrate to generate a detectable signal when released from the aptamer or RNA mooring inhibitor. 前記アプタマーが、酵素を阻害し、前記酵素が基質からの検出可能なシグナルの生成を触媒するのを妨げる阻害アプタマーであり、または前記RNA係留阻害剤が、酵素を阻害し、前記酵素が基質からの検出可能なシグナルの生成を触媒するのを妨げる、請求項34に記載の方法。 The aptamer is an inhibitory aptamer that inhibits the enzyme and prevents the enzyme from catalyzing the generation of a detectable signal from the substrate, or the RNA mooring inhibitor inhibits the enzyme and the enzyme is from the substrate. 34. The method of claim 34, which prevents catalyzing the production of a detectable signal. 前記酵素が、トロンビン、プロテインC、好中球エラスターゼ、サブチリシン、西洋ワサビペルオキシダーゼ、ベータ-ガラクトシダーゼ、または子ウシアルカリホスファターゼである、請求項36に記載の方法。 36. The method of claim 36, wherein the enzyme is thrombin, protein C, neutrophil elastase, subtilisin, horseradish peroxidase, beta-galactosidase, or calf alkaline phosphatase. 前記酵素がトロンビンであり、前記基質がトロンビンのペプチド基質に共有結合したパラニトロアニリド、またはトロンビンのペプチド基質に共有結合した7-アミノ-4-メチルクマリンである、請求項37に記載の方法。 37. The method of claim 37, wherein the enzyme is thrombin, the substrate being paranitroanilide covalently bound to the peptide substrate of thrombin, or 7-amino-4-methylcoumarin covalently bound to the peptide substrate of thrombin. 前記アプタマーが、前記アプタマーから放出されたときに結合して検出可能なシグナルを生成する薬剤のペアを隔離する、請求項34に記載の方法。 34. The method of claim 34, wherein the aptamer sequesters a pair of agents that bind when released from the aptamer to produce a detectable signal. 前記RNAベースのマスキング構築物が、検出可能なリガンド及びマスキング成分が付着するRNAオリゴヌクレオチドを含む、請求項29に記載の方法。 29. The method of claim 29, wherein the RNA-based masking construct comprises an RNA oligonucleotide to which a detectable ligand and masking component are attached. 前記RNAベースのマスキング構築物が、架橋分子によって凝集して保持されたナノ粒子を含み、前記架橋分子の少なくとも一部がRNAを含み、前記ナノ粒子が溶液中に分配されるときに前記溶液がカラーシフトを受ける、請求項29に記載の方法。 The solution is colored when the RNA-based masking construct contains nanoparticles aggregated and retained by cross-linking molecules, at least a portion of the cross-linking molecules contains RNA, and the nanoparticles are dispensed into the solution. 29. The method of claim 29, which receives a shift. 前記ナノ粒子がコロイド金属である、請求項41に記載の方法。 41. The method of claim 41, wherein the nanoparticles are colloidal metals. 前記コロイド金属がコロイド金である、請求項42に記載の方法。 42. The method of claim 42, wherein the colloidal metal is colloidal gold. 前記RNAベースのマスキング構築物が、連結分子によって1つ以上のクエンチャー分子に連結された量子ドットを含み、前記連結分子の少なくとも一部がRNAを含む、請求項22に記載の方法。 22. The method of claim 22, wherein the RNA-based masking construct comprises quantum dots linked to one or more quencher molecules by a linking molecule, wherein at least a portion of the linking molecule comprises RNA. 前記RNAベースのマスキング構築物が、挿入剤と複合したRNAを含み、前記挿入剤が前記RNAの切断時に吸光度を変化させる、請求項22に記載の方法。 22. The method of claim 22, wherein the RNA-based masking construct comprises RNA compounded with an insert, wherein the insert changes the absorbance upon cleavage of the RNA. 前記挿入剤がピロニン-Yまたはメチレンブルーである、請求項45に記載の方法。 45. The method of claim 45, wherein the insert is pyronin-Y or methylene blue. 前記検出可能なリガンドがフルオロフォアであり、前記マスキング成分がクエンチャー分子である、請求項22に記載の方法。 22. The method of claim 22, wherein the detectable ligand is a fluorophore and the masking component is a quencher molecule. 前記光学バーコードを検出することが、各マイクロウェル内の前記液滴の光学的評価を行うことを含む、請求項1に記載の方法。 The method of claim 1, wherein detecting the optical barcode comprises performing an optical evaluation of the droplet in each microwell. 前記光学的評価を行うことが、各マイクロウェルの画像をキャプチャすることを含む、請求項48に記載の方法。 48. The method of claim 48, wherein performing the optical evaluation comprises capturing an image of each microwell. 前記光学バーコードが、特定のサイズ、形状、屈折率、色、またはそれらの組み合わせの粒子を含む、請求項1に記載の方法。 The method of claim 1, wherein the optical barcode comprises particles of a particular size, shape, index of refraction, color, or a combination thereof. 前記粒子が、コロイド金属粒子、ナノシェル、ナノチューブ、ナノロッド、量子ドット、ヒドロゲル粒子、リポソーム、デンドリマー、または金属-リポソーム粒子を含む、請求項50に記載の方法。 50. The method of claim 50, wherein the particles include colloidal metal particles, nanoshells, nanotubes, nanorods, quantum dots, hydrogel particles, liposomes, dendrimers, or metal-liposomal particles. 前記光学バーコードが、光学顕微鏡法、蛍光顕微鏡法、ラマン分光法、またはそれらの組み合わせを使用して検出される、請求項48に記載の方法。 48. The method of claim 48, wherein the optical barcode is detected using light microscopy, fluorescence microscopy, Raman spectroscopy, or a combination thereof. 各光学バーコードが1つ以上の蛍光色素を含む、請求項1に記載の方法。 The method of claim 1, wherein each optical barcode comprises one or more fluorescent dyes. 各光学バーコードが異なる比率の蛍光色素を含む、請求項53に記載の方法。 53. The method of claim 53, wherein each optical barcode comprises a different proportion of fluorescent dye. 前記検出可能なシグナルが蛍光のレベルである、請求項1に記載の方法。 The method of claim 1, wherein the detectable signal is a level of fluorescence. セットカバー解決プロセスを適用するステップをさらに含む、請求項1に記載の方法。 The method of claim 1, further comprising the step of applying a set cover resolution process. 前記マイクロ流体デバイスが、少なくとも40,000個のマイクロウェルのアレイを含む、請求項1に記載の方法。 The method of claim 1, wherein the microfluidic device comprises an array of at least 40,000 microwells. 前記マイクロ流体デバイスが、少なくとも190,000個のマイクロウェルのアレイを含む、請求項57に記載の方法。 57. The method of claim 57, wherein the microfluidic device comprises an array of at least 190,000 microwells. 多重検出システムであって、
Casタンパク質、対応する標的分子に結合するように設計された1つ以上のガイドRNA、RNAベースのマスキング構築物、及び光学バーコードを含む検出CRISPR系と、
任意選択の1つ以上の標的分子の光学バーコードと、
マイクロウェルのアレイ、及び前記マイクロウェルの下にある少なくとも1つのフローチャネルを含むマイクロ流体デバイスであって、前記マイクロウェルが少なくとも2つの液滴を捕捉するサイズである、前記マイクロ流体デバイスと、
を含む前記多重検出システム。
It is a multiple detection system
A detection CRISPR system that includes a Cas protein, one or more guide RNAs designed to bind to the corresponding target molecule, RNA-based masking constructs, and optical barcodes.
Optical barcodes of one or more target molecules of choice,
A microfluidic device comprising an array of microwells and at least one flow channel beneath the microwells, the size of which the microwells are sized to capture at least two droplets.
The multiple detection system including.
請求項59に記載の多重検出システムを含むキット。 A kit comprising the multiplex detection system of claim 59. 前記第2のセットの液滴が光学バーコードを含む、請求項1~58のいずれかに記載の方法。 The method of any of claims 1-58, wherein the second set of droplets comprises an optical barcode. 1つ以上の標的分子の光学バーコードを含む、請求項59に記載の多重検出システム。 59. The multiplex detection system of claim 59, comprising an optical barcode of one or more target molecules.
JP2021526645A 2018-11-14 2019-11-14 Droplet diagnostic system and method based on CRISPR system Pending JP2022513602A (en)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201862767070P 2018-11-14 2018-11-14
US62/767,070 2018-11-14
US201962841812P 2019-05-01 2019-05-01
US62/841,812 2019-05-01
US201962871056P 2019-07-05 2019-07-05
US62/871,056 2019-07-05
PCT/US2019/061577 WO2020102610A1 (en) 2018-11-14 2019-11-14 Crispr system based droplet diagnostic systems and methods

Publications (2)

Publication Number Publication Date
JP2022513602A true JP2022513602A (en) 2022-02-09
JPWO2020102610A5 JPWO2020102610A5 (en) 2022-11-15

Family

ID=68916540

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021526645A Pending JP2022513602A (en) 2018-11-14 2019-11-14 Droplet diagnostic system and method based on CRISPR system

Country Status (12)

Country Link
US (1) US20220073987A1 (en)
EP (1) EP3880817A1 (en)
JP (1) JP2022513602A (en)
KR (1) KR20210104698A (en)
CN (1) CN113474456A (en)
AU (1) AU2019379160A1 (en)
BR (1) BR112021009425A2 (en)
CA (1) CA3119972A1 (en)
IL (1) IL283210A (en)
MX (1) MX2021005701A (en)
SG (1) SG11202105083XA (en)
WO (1) WO2020102610A1 (en)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7276141B2 (en) * 2017-11-29 2023-05-18 ソニーグループ株式会社 Sign selection support system, sign selection support device, sign selection support method, and sign selection support program
US20210050116A1 (en) 2019-07-23 2021-02-18 The Broad Institute, Inc. Health data aggregation and outbreak modeling
US20220228150A1 (en) * 2020-03-17 2022-07-21 Gowtham THAKKU Crispr system high throughput diagnostic systems and methods
CN111500771B (en) * 2020-04-20 2021-03-23 上海国际旅行卫生保健中心(上海海关口岸门诊部) Primer group and kit for detecting novel coronavirus SARS-CoV-2
US20230227901A1 (en) * 2020-06-26 2023-07-20 The Regents Of The University Of California Selective Addition of Reagents to Droplets
CN111778318B (en) * 2020-07-10 2023-01-10 清华大学深圳国际研究生院 Method and system for detecting nucleic acid molecules based on CRISPR/Cas system
US20220027795A1 (en) * 2020-07-27 2022-01-27 Recursion Pharmaceuticals, Inc. Techniques for training a classifier to detect executional artifacts in microwell plates
KR20220059418A (en) * 2020-11-02 2022-05-10 주식회사 이지다이아텍 Microparticle probe for nucleic acid separation and detection for multiplexed diagnosis
US20220145382A1 (en) * 2020-11-09 2022-05-12 Genvida Technology Company Limited Precise and Programmable DNA Nicking System and Methods
CN114634974A (en) * 2020-12-16 2022-06-17 佳能医疗系统株式会社 Nucleic acid detection system, nucleic acid detection system array, nucleic acid detection method, and method for screening candidate guide nucleic acids
GB2603567A (en) * 2021-02-03 2022-08-10 D Silver Joshua Viral load tester and applications thereof
CN112980924B (en) * 2021-02-10 2023-07-25 华南师范大学 Amplification-free DNA single-molecule quantitative detection method, kit and buffer solution
CN113249443B (en) * 2021-05-20 2023-06-16 中国科学技术大学 Amplification detection method of prefabricated amplification unit based on DNA self-assembly
KR20240028464A (en) * 2021-07-02 2024-03-05 더 제이. 데이비드 글래드스톤 인스티튜트, 어 테스터멘터리 트러스트 이스타빌리쉬드 언더 더 윌 오브 제이. 데이비드 글래드스톤 Kinetic barcoding to enhance specificity of CRISPR/CAS reactions
CN113791207A (en) * 2021-08-06 2021-12-14 南方科技大学 High-sensitivity immunoassay method and application thereof
WO2023059935A1 (en) * 2021-10-10 2023-04-13 Celldom, Inc. Fluorescent barcoding of microparticles
US20230167485A1 (en) * 2021-11-29 2023-06-01 Microsoft Technology Licensing, Llc Multiplex assay for nucleic acid detection
CN114632558B (en) * 2021-12-17 2023-08-18 上海交通大学医学院附属仁济医院 Microfluidic chip and preparation method and application thereof
WO2023122648A1 (en) * 2021-12-23 2023-06-29 Mammoth Biosciences, Inc. Devices, systems, and methods for detecting target nucleic acids
CN114540547A (en) * 2022-02-25 2022-05-27 南方科技大学 Amplification-free nucleic acid detection method and application thereof
CN114540548A (en) * 2022-02-28 2022-05-27 贵州安康医学检验中心有限公司 Gold nano biosensor based on multi-cross constant temperature amplification
CN114807316B (en) * 2022-03-11 2023-02-03 北京科技大学 RNA quantitative detection method without nucleic acid amplification visualization
WO2023227943A1 (en) * 2022-05-26 2023-11-30 New York University In Abu Dhabi Corporation Electrokinetic microfluidic concentrator chip device and method of use
CN114958780B (en) * 2022-06-06 2023-04-25 西南民族大学 Bovine Aichivirus D virus isolate and application thereof
WO2023244069A1 (en) * 2022-06-16 2023-12-21 주식회사 이지다이아텍 Diagnostic microparticle probe comprising magnetic particle and inactivated genetic scissors, and multi-diagnostic system and method involving probe
KR20240020320A (en) * 2022-08-04 2024-02-15 한국생명공학연구원 Naked eye detection method for RdRp variation of SARS-CoV-2
WO2024072775A1 (en) * 2022-09-26 2024-04-04 The Johns Hopkins University Devices and systems for dna capture
CN116087069B (en) * 2023-04-10 2023-08-08 苏州药明康德新药开发有限公司 Method for detecting histone methylation and acetylation modification level of specific cell population based on flow cytometry

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS501A (en) 1973-04-28 1975-01-06
US5944710A (en) 1996-06-24 1999-08-31 Genetronics, Inc. Electroporation-mediated intravascular delivery
US5869326A (en) 1996-09-09 1999-02-09 Genetronics, Inc. Electroporation employing user-configured pulsing scheme
GB9710049D0 (en) 1997-05-19 1997-07-09 Nycomed Imaging As Method
JP4303418B2 (en) 1997-10-24 2009-07-29 ライフ テクノロジーズ コーポレーション Recombination cloning using nucleic acids with recombination sites
JP2006507921A (en) 2002-06-28 2006-03-09 プレジデント・アンド・フェロウズ・オブ・ハーバード・カレッジ Method and apparatus for fluid dispersion
AU2003256857A1 (en) 2002-08-08 2004-02-25 Dharmacon, Inc. Short interfering rnas having a hairpin structure containing a non-nucleotide loop
US7041481B2 (en) 2003-03-14 2006-05-09 The Regents Of The University Of California Chemical amplification based on fluid partitioning
CA2554007C (en) 2004-01-27 2013-03-26 Altivera L.L.C. Diagnostic radio frequency identification sensors and applications thereof
US20100137163A1 (en) 2006-01-11 2010-06-03 Link Darren R Microfluidic Devices and Methods of Use in The Formation and Control of Nanoreactors
EP2263787A3 (en) 2006-01-27 2012-02-22 President and Fellows of Harvard College Fluidic droplet coalescence
WO2007133710A2 (en) 2006-05-11 2007-11-22 Raindance Technologies, Inc. Microfluidic devices and methods of use thereof
WO2008149176A1 (en) 2007-06-06 2008-12-11 Cellectis Meganuclease variants cleaving a dna target sequence from the mouse rosa26 locus and uses thereof
JP5546112B2 (en) 2008-07-07 2014-07-09 キヤノン株式会社 Ophthalmic imaging apparatus and ophthalmic imaging method
EP2454371B1 (en) 2009-07-13 2021-01-20 Somagenics, Inc. Chemical modification of small hairpin rnas for inhibition of gene expression
CN102939377B (en) 2010-04-26 2016-06-08 桑格摩生物科学股份有限公司 Use Zinc finger nuclease to carry out genome editor to Rosa site
EP3447155A1 (en) 2010-09-30 2019-02-27 Raindance Technologies, Inc. Sandwich assays in droplets
WO2014047561A1 (en) * 2012-09-21 2014-03-27 The Broad Institute Inc. Compositions and methods for labeling of agents
EP2898071A4 (en) 2012-09-21 2016-07-20 Broad Inst Inc Compositions and methods for long insert, paired end libraries of nucleic acids in emulsion droplets
MX2015007550A (en) 2012-12-12 2017-02-02 Broad Inst Inc Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications.
WO2014143158A1 (en) 2013-03-13 2014-09-18 The Broad Institute, Inc. Compositions and methods for labeling of agents
WO2016149661A1 (en) 2015-03-18 2016-09-22 The Broad Institute, Inc. Massively parallel on-chip coalescence of microemulsions
US20180142236A1 (en) 2015-05-15 2018-05-24 Ge Healthcare Dharmacon, Inc. Synthetic single guide rna for cas9-mediated gene editing
US9790490B2 (en) * 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
US20190046985A1 (en) * 2015-09-17 2019-02-14 The Regents Of The University Of California Droplet-trapping devices for bioassays and diagnostics
US11788083B2 (en) 2016-06-17 2023-10-17 The Broad Institute, Inc. Type VI CRISPR orthologs and systems
PT3551753T (en) * 2016-12-09 2022-09-02 Harvard College Crispr effector system based diagnostics
AU2018346530A1 (en) * 2017-10-04 2020-04-30 Massachusetts Institute Of Technology CRISPR effector system based diagnostics
CN111836903A (en) * 2017-12-22 2020-10-27 博德研究所 Multiple diagnostics based on CRISPR effector systems

Also Published As

Publication number Publication date
SG11202105083XA (en) 2021-06-29
CN113474456A (en) 2021-10-01
KR20210104698A (en) 2021-08-25
AU2019379160A1 (en) 2021-06-24
WO2020102610A1 (en) 2020-05-22
CA3119972A1 (en) 2020-05-22
MX2021005701A (en) 2021-09-23
EP3880817A1 (en) 2021-09-22
BR112021009425A2 (en) 2021-11-23
IL283210A (en) 2021-06-30
US20220073987A1 (en) 2022-03-10

Similar Documents

Publication Publication Date Title
JP2022513602A (en) Droplet diagnostic system and method based on CRISPR system
US11898142B2 (en) Multi-effector CRISPR based diagnostic systems
JP7228514B2 (en) CRISPR effector system-based diagnostics
WO2020124050A1 (en) Tiled assays using crispr-cas based detection
US20210108267A1 (en) Crispr effector system based multiplex diagnostics
JP2020513815A (en) Diagnostic method for virus detection based on clustered short repeat palindrome effector system
EP3746568A1 (en) Crispr effector system based diagnostics
CA3076518A1 (en) Crispr effector system based diagnostics
US20240102115A1 (en) Crispr effector system based diagnostics for virus detection
US20220228150A1 (en) Crispr system high throughput diagnostic systems and methods
WO2020072816A1 (en) Crispr effector system based diagnostics for hemorrhagic fever detection
JP2022507573A (en) Multiplexing of highly evolving virus variants with SHERLOCK
De Rop et al. HyDrop: droplet-based scATAC-seq and scRNA-seq using dissolvable hydrogel beads
US20220243264A1 (en) Systems and methods for amplifying rna
Wang Droplet microfluidics for high-throughput single-cell analysis
WO2024036319A2 (en) Multiplexed nucleic acid detection and modification systems and methods of use

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221104

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231024

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240528