JP2018535689A - ガイド核酸を作製および使用するための方法および組成物 - Google Patents

ガイド核酸を作製および使用するための方法および組成物 Download PDF

Info

Publication number
JP2018535689A
JP2018535689A JP2018529124A JP2018529124A JP2018535689A JP 2018535689 A JP2018535689 A JP 2018535689A JP 2018529124 A JP2018529124 A JP 2018529124A JP 2018529124 A JP2018529124 A JP 2018529124A JP 2018535689 A JP2018535689 A JP 2018535689A
Authority
JP
Japan
Prior art keywords
sequence
collection
dna
nucleic acid
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018529124A
Other languages
English (en)
Other versions
JP2018535689A5 (ja
JP6995751B2 (ja
Inventor
ステファン ビー. グーギュッチョン,
ステファン ビー. グーギュッチョン,
Original Assignee
アーク バイオ, エルエルシー
アーク バイオ, エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アーク バイオ, エルエルシー, アーク バイオ, エルエルシー filed Critical アーク バイオ, エルエルシー
Publication of JP2018535689A publication Critical patent/JP2018535689A/ja
Publication of JP2018535689A5 publication Critical patent/JP2018535689A5/ja
Priority to JP2021103316A priority Critical patent/JP2021141904A/ja
Application granted granted Critical
Publication of JP6995751B2 publication Critical patent/JP6995751B2/ja
Priority to JP2024030061A priority patent/JP2024051149A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/115Aptamers, i.e. nucleic acids binding a target molecule specifically and with high affinity without hybridising therewith ; Nucleic acids binding to non-nucleic acids, e.g. aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/70Vectors containing special elements for cloning, e.g. topoisomerase, adaptor sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

任意の供給源核酸から、ガイド核酸(gNA)、gNAをコードする核酸、gNAの収集物、およびgNAの収集物をコードする核酸を作製するための方法および組成物が、本明細書に提供される。種々の適用において、その結果生じたgNA、gNAをコードする核酸、gNAの収集物、およびgNAの収集物をコードする核酸を使用するための方法および組成物も、本明細書に提供される。このようなgNAおよびその収集物は、目的の標的配列の枯渇、分配、捕捉または濃縮、ゲノムワイド標識、ゲノムワイド編集、ゲノムワイド機能的スクリーニング、およびゲノムワイド調節を含む、種々の適用に有用である。

Description

相互参照
本出願は、2015年12月7日に出願された米国仮出願番号第62/264,262号、および2016年2月23日に出願された米国仮出願番号第62/298,963号の利益を主張しており、これら仮出願の各々は、その全体が参考として本明細書によって援用される。
配列表の参照による援用
本願は、電子フォーマットの配列表と共に出願されている。この配列表は、2016年12月5日に作成された、サイズが816,451バイトの、750592000340SeqList.txtという表題のファイルとして提供されている。配列表の電子フォーマットの情報は、その全体が参照により本明細書に組み込まれる。
背景
RNAに由来するcDNAライブラリー等、ヒト臨床DNA試料および試料ライブラリーは、情報価値が殆どなく配列決定コストを増加させる、非常に豊富な配列を含有する。このような所望されない配列を枯渇させる方法(例えば、ハイブリダイゼーション捕捉による)が開発されたが、このような方法は時間がかかることが多く、非効率的であり得る。
ガイド核酸(gNA)媒介性ヌクレアーゼ系(ガイドRNA(gRNA)媒介性Cas系等)は、任意の標的DNAを効率的に枯渇させることができるが、非常に多い数の特異なDNA分子の標的化された枯渇は実現不可能である。例えば、ヒト血液に由来する配列決定ライブラリーは、>99%ヒトゲノムDNAを含有し得る。ヒト血液中を循環する感染病原体を検出するために、このゲノムDNAを枯渇させようと、gRNA媒介性Cas9系に基づく方法を使用するということは、30〜50塩基対(bp)毎にgRNAが存在し、標的DNAが見逃されないことを確実にするために、極めて多い数のgRNA(約1千万〜1億個のgRNA)を必要とするであろう。非常に多数のgRNAが計算によって予測され、次いで化学合成され得るが、これは法外に高いコストがかかる。
したがって、当技術分野には、例えば、その配列に関する予備知識なしで、目的のDNAからの所望されないDNA配列のゲノムワイド枯渇を可能にする、任意のDNAをgNA(例えば、gRNA)ライブラリーへと変換する、対費用効果の高い方法を提供する必要がある。この必要に取り組む方法および組成物が、本明細書に提供される。
任意の供給源核酸からgNAおよびgNAの収集物(collection)を生成するための組成物および方法が、本明細書に提供される。例えば、gRNAおよびgRNAの収集物は、ゲノムDNA等、供給源DNAから生成することができる。斯かるgNAおよびその収集物は、目的の標的配列の枯渇、分配、捕捉または濃縮、ゲノムワイド標識、ゲノムワイド編集、ゲノムワイド機能的スクリーニング、およびゲノムワイド調節を含む、種々の適用に有用である。
一つの態様では、本明細書に記載されている本発明は、核酸の収集物であって、収集物中の複数の核酸が、調節領域を含む第1のセグメントと、標的化配列をコードする第2のセグメントと、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードする第3のセグメントとを含み、収集物中の核酸の少なくとも10%のサイズが変動する、核酸の収集物を提供する。別の態様では、本明細書に記載されている本発明は、核酸の収集物であって、収集物中の複数の核酸が、調節領域を含む第1のセグメントと;標的化配列をコードする第2のセグメントであって、そのサイズが21bpを超える第2のセグメントと;核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードする第3のセグメントとを含む、核酸の収集物を提供する。一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質が、CRISPR/Cas系タンパク質である。一部の実施形態では、第2のセグメントのサイズが、核酸の収集物にわたって15〜250bp変動する。一部の実施形態では、収集物中の第2のセグメントの少なくとも10%が、21bpを超える。一部の実施形態では、第2のセグメントのサイズが、20bpではない。一部の実施形態では、第2のセグメントのサイズが、21bpではない。一部の実施形態では、核酸の収集物が、DNAの収集物である。一部の実施形態では、第2のセグメントが、一本鎖DNAである。一部の実施形態では、第3のセグメントが、一本鎖DNAである。一部の実施形態では、第2のセグメントが、二本鎖DNAである。一部の実施形態では、第3のセグメントが、二本鎖DNAである。一部の実施形態では、調節領域が、転写因子に結合することができる領域である。一部の実施形態では、調節領域が、プロモーターを含む。一部の実施形態では、プロモーターが、T7、SP6およびT3からなる群から選択される。一部の実施形態では、標的化配列が、哺乳動物ゲノム、真核生物ゲノム、原核生物ゲノムまたはウイルスゲノムへと向けられている。一部の実施形態では、標的化配列が、反復性または豊富なDNAへと向けられている。一部の実施形態では、標的化配列が、ミトコンドリアDNA、リボソームDNA、Alu DNA、セントロメアDNA、SINE DNA、LINE DNAまたはSTR DNAへと向けられている。一部の実施形態では、第2のセグメントの配列が、表3および/または表4から選択される。一部の実施形態では、収集物が、少なくとも10個の特異な核酸分子を含む。一部の実施形態では、標的化配列が、PAM配列に対し5’にあるヌクレオチドの配列の反対の鎖に対し少なくとも80%相補的である。一部の実施形態では、収集物が、生物のゲノムにわたって約10,000bpまたはそれ未満毎の間隔にある目的の配列に向けられた標的化配列を含む。一部の実施形態では、PAM配列が、AGG、CGGまたはTGGである。一部の実施形態では、PAM配列が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2およびCm5からなる群から選択されるCRISPR/Cas系タンパク質に特異的である。一部の実施形態では、第3のセグメントが、gRNAステムループ配列をコードするDNAを含む。一部の実施形態では、第3のセグメントの配列が、配列、GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号1)を含むRNAをコードするか、または配列、GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC(配列番号2)を含むRNAをコードする。一部の実施形態では、第3のセグメントの配列が、crRNAおよびtracrRNAをコードする。一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質が、細菌種に由来する。一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質が、古細菌種に由来する。一部の実施形態では、CRISPR/Cas系タンパク質が、I型、II型またはIII型タンパク質である。一部の実施形態では、CRISPR/Cas系タンパク質が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、Cm5、dCas9およびcas9ニッカーゼからなる群から選択される。一部の実施形態では、第3のセグメントが、Cas9結合配列をコードするDNAを含む。一部の実施形態では、収集物の複数の第3のセグメントが、第1の核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードし、収集物の複数の第3のセグメントが、第2の核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードする。一部の実施形態では、収集物の第3のセグメントが、複数の異なる核酸ガイド化ヌクレアーゼ系タンパク質の複数の異なる結合配列の複数の異なる結合配列をコードする。
別の態様では、本明細書に記載されている本発明は、標的化配列を含む第1のRNAセグメントと;核酸ガイド化ヌクレアーゼ系タンパク質結合配列を含む第2のRNAセグメントとを含むガイドRNA(gRNA)の収集物であって、収集物中のgRNAの少なくとも10%のサイズが変動する、収集物を提供する。一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質が、CRISPR/Cas系タンパク質である。一部の実施形態では、第1のセグメントのサイズが、gRNAの収集物にわたって15〜250bp変動する。一部の実施形態では、収集物中の第1のセグメントの少なくとも10%が、21bpを超える。一部の実施形態では、第1のセグメントのサイズが、20bpではない。一部の実施形態では、第1のセグメントのサイズが、21bpではない。一部の実施形態では、標的化配列が、哺乳動物ゲノム、真核生物ゲノム、原核生物ゲノムまたはウイルスゲノムへと向けられている。一部の実施形態では、標的化配列が、反復性または豊富なDNAへと向けられている。一部の実施形態では、標的化配列が、ミトコンドリアDNA、リボソームDNA、Alu DNA、セントロメアDNA、SINE DNA、LINE DNAまたはSTR DNAへと向けられている。一部の実施形態では、第1のセグメントの配列が、表3および/または表4から選択される配列によってコードされるRNAである。一部の実施形態では、収集物は、少なくとも10個の特異なgRNAを含む。一部の実施形態では、gRNAは、シトシン、グアニンおよびアデニンを含む。一部の実施形態では、gRNAのサブセットは、チミンをさらに含む。一部の実施形態では、gRNAのサブセットは、ウラシルをさらに含む。一部の実施形態では、第1のセグメントは、目的の標的ゲノム配列に対し少なくとも80%相補的である。一部の実施形態では、標的化配列は、PAM配列に対し5’にあるヌクレオチドの配列の反対の鎖に対し少なくとも80%相補的である。一部の実施形態では、PAM配列が、AGG、CGGまたはTGGである。一部の実施形態では、PAM配列が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2およびCm5からなる群から選択されるCRISPR/Cas系タンパク質に特異的である。一部の実施形態では、第2のセグメントが、gRNAステムループ配列を含む。一部の実施形態では、第3のセグメントが、gRNAステムループ配列をコードするDNAを含む。一部の実施形態では、第3のセグメントの配列が、配列GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号1)を含むか、または配列GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC(配列番号2)を含む。一部の実施形態では、第2のセグメントが、crRNAおよびtracrRNAを含む。一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質が、細菌種に由来する。一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質が、古細菌種に由来する。一部の実施形態では、CRISPR/Cas系タンパク質が、I型、II型またはIII型タンパク質である。一部の実施形態では、CRISPR/Cas系タンパク質が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、Cm5、dCas9およびcas9ニッカーゼからなる群から選択される。一部の実施形態では、第2のセグメントが、Cas9結合配列を含む。一部の実施形態では、収集物中のgRNAの少なくとも10%は、その5’末端側の端の配列が変動する。一部の実施形態では、収集物は、生物のゲノムにわたって10,000bpまたはそれ未満毎の間隔にある目的の配列に向けられた標的化配列を含む。一部の実施形態では、収集物の複数の第2のセグメントは、第1の核酸ガイド化ヌクレアーゼ系タンパク質結合配列を含み、収集物の複数の第2のセグメントは、第2の核酸ガイド化ヌクレアーゼ系タンパク質結合配列を含む。一部の実施形態では、収集物の第2のセグメントは、複数の異なる核酸ガイド化ヌクレアーゼ系タンパク質の複数の異なる結合配列を含む。一部の実施形態では、収集物の複数のgRNAは、基材に付着されている。一部の実施形態では、収集物の複数のgRNAは、標識を含む。一部の特定の実施形態では、収集物の複数のgRNAは、異なる標識を含む。
別の態様では、本明細書に記載されている本発明は、調節領域を含む第1のセグメントと;標的化配列をコードする第2のセグメントであって、標的化配列が30bpを超える、第2のセグメントと;核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードする核酸をコードする第3のセグメントとを含む核酸を提供する。一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質が、CRISPR/Cas系タンパク質である。一部の実施形態では、核酸がDNAである。一部の実施形態では、第2のセグメントが、一本鎖DNAである。一部の実施形態では、第3のセグメントが、一本鎖DNAである。一部の実施形態では、第2のセグメントが、二本鎖DNAである。一部の実施形態では、第3のセグメントが、二本鎖DNAである。一部の実施形態では、調節領域が、転写因子に結合することができる領域である。一部の実施形態では、調節領域が、プロモーターを含む。一部の実施形態では、プロモーターが、T7、SP6およびT3からなる群から選択される。一部の実施形態では、標的化配列が、哺乳動物ゲノム、真核生物ゲノム、原核生物ゲノムまたはウイルスゲノムへと向けられている。一部の実施形態では、標的化配列が、豊富なまたは反復性DNAへと向けられている。一部の実施形態では、標的化配列が、ミトコンドリアDNA、リボソームDNA、Alu DNA、セントロメアDNA、SINE DNA、LINE DNAまたはSTR DNAへと向けられている。一部の実施形態では、第2のセグメントの配列が、表3および/または表4から選択される。一部の実施形態では、標的化配列が、PAM配列に対し5’にあるヌクレオチドの配列の反対の鎖に対し少なくとも80%相補的である。一部の実施形態では、目的の標的ゲノム配列が、PAM配列の5’上流にある。一部の実施形態では、PAM配列が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2およびCm5からなる群から選択されるCRISPR/Cas系タンパク質に特異的である。一部の実施形態では、第3のセグメントが、gRNAステムループ配列をコードするDNAを含む。一部の実施形態では、第3のセグメントが、gRNAステムループ配列をコードするDNAを含む。一部の実施形態では、第3のセグメントの配列が、配列、GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号1)を含むRNAをコードするか、または配列、GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC(配列番号2)を含むRNAをコードする。一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質が、細菌種に由来する。一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質が、古細菌種に由来する。一部の実施形態では、CRISPR/Cas系タンパク質が、I型、II型またはIII型タンパク質である。一部の実施形態では、CRISPR/Cas系タンパク質が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、Cm5、dCas9およびcas9ニッカーゼからなる群から選択される。一部の実施形態では、第3のセグメントが、Cas9結合配列をコードするDNAを含む。
別の態様では、本明細書に記載されている本発明は、標的化配列を含む第1のセグメントであって、そのサイズが30bpを超える第1のセグメントと;核酸ガイド化ヌクレアーゼ系タンパク質結合配列を含む第2のセグメントとを含むガイドRNAを提供する。一部の実施形態では、核酸ガイド化ヌクレアーゼは、CRISPR/Cas系タンパク質である。一部の実施形態では、gRNAは、アデニン、グアニンおよびシトシンを含む。一部の実施形態では、gRNAは、チミンをさらに含む。一部の実施形態では、gRNAは、ウラシルをさらに含む。一部の実施形態では、第1のRNAセグメントのサイズは、30〜250bpの間である。一部の実施形態では、標的化配列は、哺乳動物ゲノム、真核生物ゲノム、原核生物ゲノムまたはウイルスゲノムへと向けられている。一部の実施形態では、標的化配列は、反復性または豊富なDNAへと向けられている。一部の実施形態では、標的化配列が、ミトコンドリアDNA、リボソームDNA、Alu DNA、セントロメアDNA、SINE DNA、LINE DNAまたはSTR DNAへと向けられている。一部の実施形態では、第1のセグメントは、目的の標的ゲノム配列に対し少なくとも80%相補的である。一部の実施形態では、標的化配列は、PAM配列に対し5’にあるヌクレオチドの配列の反対の鎖に対し少なくとも80%相補的である。一部の実施形態では、第2のセグメントは、gRNAステムループ配列を含む。一部の実施形態では、第2のセグメントの配列が、GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号1)を含むか、または配列GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC(配列番号2)を含む。一部の実施形態では、第3のセグメントの配列が、crRNAおよびtracrRNAを含む。一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質が、細菌種に由来する。一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質が、古細菌種に由来する。一部の実施形態では、CRISPR/Cas系タンパク質が、I型、II型またはIII型タンパク質である。一部の実施形態では、CRISPR/Cas系タンパク質が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、Cm5、dCas9およびcas9ニッカーゼからなる群から選択される。一部の実施形態では、第2のセグメントが、Cas9結合配列である。
別の態様では、本発明は、核酸ガイド化ヌクレアーゼ系タンパク質と、標的化配列を含む第1のセグメントであって、そのサイズが30bpを超える第1のセグメント;および核酸ガイド化ヌクレアーゼ系タンパク質結合配列を含む第2のセグメントを含むガイドRNAとを含む複合体を提供する。
別の態様では、本明細書に記載されている本発明は、試料における標的化された配列の枯渇および分配、非宿主核酸についての試料の濃縮、または試料における標的化された核酸の連続的な枯渇のための方法であって、試料から抽出された核酸を提供するステップと;(i)本明細書に提供されているgRNAの収集物のうち任意の1種;および(ii)核酸ガイド化ヌクレアーゼ系タンパク質を含む複数の複合体と試料とを接触させるステップとを含む方法を提供する。一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質は、CRISPR/Cas系タンパク質である。一部の実施形態では、CRISPR/Cas系タンパク質は、Cas9タンパク質である。
別の態様では、本発明は、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAにライゲートされた標的化配列をコードするDNAをそれぞれ含む核酸の収集物を作製する方法であって、(a)PAM配列に対し5’にある目的の配列および反対の鎖におけるその逆相補的配列をそれぞれ含む二本鎖DNA分子を提供するステップと、(b)二本鎖DNA分子において酵素消化反応を実行するステップであって、切断が、PAM配列および/または反対の鎖におけるその逆相補的配列に生成されるが、二本鎖DNAからPAM配列および/または反対の鎖におけるその逆相補的配列を完全に除去しないステップと、(c)認識配列を含むアダプタをステップbの結果生じたDNA分子にライゲートするステップと、(d)ステップcの認識配列を認識する制限酵素とステップcのDNA分子とを接触させるステップであって、それによって、PAM配列に対してすぐ接して5’にある平滑末端化された二本鎖切断を含むDNA断片を生成し、それによって、PAM配列および酵素認識部位を含有するアダプタを除去するステップと、(e)ステップdの結果生じた二本鎖DNA断片を、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAとライゲートするステップであって、それによって、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAにライゲートされた標的化配列をコードするDNAをそれぞれ含む複数のDNA断片を生成するステップとを含む方法を提供する。一部の実施形態では、核酸ガイド化ヌクレアーゼが、CRISPR/Cas核酸ガイド化ヌクレアーゼ系タンパク質である。一部の実施形態では、収集物の出発DNA分子が、PAM配列に対し5’にある目的の配列の上流の調節配列をさらに含む。一部の実施形態では、調節配列が、プロモーターを含む。一部の実施形態では、プロモーターが、T7、Sp6またはT3配列を含む。一部の実施形態では、二本鎖DNA分子が、ゲノムDNA、インタクトなDNAまたは剪断されたDNAである。一部の実施形態では、ゲノムDNAが、ヒト、マウス、鳥類、魚類、植物、昆虫、細菌またはウイルスのものである。一部の実施形態では、標的化配列をコードするDNAセグメントが、少なくとも22bpである。一部の実施形態では、標的化配列をコードするDNAセグメントが、15〜250bpのサイズ範囲である。一部の実施形態では、PAM配列が、AGG、CGGまたはTGGである。一部の実施形態では、PAM配列が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2およびCm5からなる群から選択されるCRISPR/Cas系タンパク質に特異的である。一部の実施形態では、ステップ(b)が、(1)CCD部位において一本鎖にニックを作製することができる酵素とDNA分子とを接触させるステップであって、それによって、目的の配列およびそれに続くHGG配列をそれぞれ含む複数のニック二本鎖DNA分子を生成し、DNA分子が、CCD部位においてニックを入れられるステップと、(2)エンドヌクレアーゼとニック二本鎖DNA分子とを接触させるステップであって、それによって、目的の配列およびそれに続くHGG配列をそれぞれ含む複数の二本鎖DNA断片を生成し、HGGおよび/またはCCD配列由来の残っているヌクレオチドが取り残されるステップとをさらに含む。一部の実施形態では、ステップ(d)が、ステップ(c)の認識配列を認識する制限酵素により切断する前のステップ(c)由来の、アダプタがライゲートされたDNA断片のPCR増幅をさらに含み、PCR後に、認識配列が、PAM配列の3’に位置し、調節配列が、PAM配列の5’遠位端に位置する。一部の実施形態では、ステップ(b)の酵素反応が、Nt.CviPII酵素およびT7エンドヌクレアーゼI酵素の使用を含む。一部の実施形態では、ライゲートされるべき前記アダプタが、オーバーハングを含まない場合、ステップ(c)が、T4 DNAポリメラーゼによる平滑末端反応をさらに含む。一部の実施形態では、ステップ(c)の前記アダプタが、(1)前記アダプタがY字型であり、オーバーハングを含む場合、一方の鎖に制限酵素認識配列を、他方の鎖に調節配列を含む二本鎖である;または(2)前記アダプタがY字型でない場合、両方の鎖にパリンドローム酵素認識配列を有する、のいずれかである。一部の実施形態では、ステップ(d)の制限酵素が、MlyIである。一部の実施形態では、ステップ(d)の制限酵素が、BaeIである。一部の実施形態では、ステップ(d)が、XhoI酵素とDNA分子とを接触させるステップをさらに含む。一部の実施形態では、ステップ(e)において、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAが、配列GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号1)を含むRNAをコードするか、または配列GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC(配列番号2)を含むRNAをコードする。一部の実施形態では、目的の標的化された配列が、生物のゲノムにわたって10,000bpまたはそれ未満毎の間隔にある。
別の態様では、本発明は、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAにライゲートされた標的化配列をコードするDNAをそれぞれ含む核酸の収集物を作製する方法であって、(a)目的の配列、NGG部位およびその相補体CCN部位をそれぞれ含む複数の二本鎖DNA分子を提供するステップと、(b)CCN部位において一本鎖にニックを作製することができる酵素と前記分子とを接触させるステップであって、それによって、前記NGG部位に対して5’に目的の配列をそれぞれ含む複数のニック二本鎖DNA分子を生成し、前記DNA分子が、前記CCD部位にニックを入れられるステップと、(c)エンドヌクレアーゼと前記ニック二本鎖DNA分子とを接触させるステップであって、それによって、目的の配列をそれぞれ含む複数の二本鎖DNA断片を生成し、前記断片が、末端オーバーハングを含むステップと、(d)5’から3’のエキソヌクレアーゼ活性がない酵素と前記二本鎖DNA断片とを接触させるステップであって、前記二本鎖DNA断片を平滑末端化し、それによって、目的の配列をそれぞれ含む複数の平滑末端化二本鎖断片を生成するステップと、(e)末端NGG部位を切断する酵素とステップdの前記平滑末端化二本鎖断片とを接触させるステップと、(f)ステップeの結果生じた二本鎖DNA断片を、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAとライゲートするステップであって、それによって、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAにライゲートされた標的化配列をそれぞれ含む複数のDNA断片を生成するステップとを含む方法を提供する。一部の実施形態では、核酸ガイド化ヌクレアーゼが、CRISPR/Cas系タンパク質である。一部の実施形態では、複数の二本鎖DNA分子が、NGG部位の5’上流に調節配列を有する。一部の実施形態では、調節配列が、T7、SP6またはT3配列を含む。一部の実施形態では、NGG部位が、AGG、CGGまたはTGGを含み、CCN部位が、CCT、CCGまたはCCAを含む。一部の実施形態では、目的の配列をそれぞれ含む複数の二本鎖DNA分子が、ゲノムDNAの剪断された断片を含む。一部の実施形態では、ゲノムDNAが、哺乳動物、原核生物、真核生物、鳥類、細菌またはウイルスのものである。一部の実施形態では、ステップ(a)における複数の二本鎖DNA分子が、少なくとも500bpである。一部の実施形態では、ステップbにおける前記酵素が、Nt.CviPII酵素である。一部の実施形態では、ステップcにおける酵素が、T7エンドヌクレアーゼIである。一部の実施形態では、ステップdにおける酵素が、T4 DNAポリメラーゼである。一部の実施形態では、ステップfにおいて、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAが、配列GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号1)を含むRNAをコードするか、または配列GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC(配列番号2)を含むRNAをコードする。一部の実施形態では、ステップeが、MlyI認識部位を保有するアダプタをライゲートするステップと、MlyI酵素により消化するステップとを追加で含む。一部の実施形態では、目的の配列が、ゲノムにわたって、10,000bpまたはそれ未満毎の間隔にある。
別の態様では、本発明は、標的化配列をコードするDNAおよび核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAをそれぞれ含む核酸の収集物を作製する方法であって、(a)NGGおよびCCN部位を含む複数の目的の配列を含むゲノムDNAを提供するステップと、(b)前記ゲノムDNAにニックを作製することができる酵素と前記ゲノムDNAとを接触させるステップであって、それによって、CCN部位にニックを入れられたニックゲノムDNAを生成するステップと、(c)エンドヌクレアーゼと前記ニックゲノムDNAとを接触させるステップであって、それによって、オーバーハングを有する二本鎖DNA断片を生成するステップと、(d)ステップc由来のオーバーハングを有する前記DNAをY字型アダプタにライゲートステップであって、これによって、前記NGG部位の3’のみに制限酵素認識配列を、前記目的の配列の5’に調節配列を導入するステップと、(e)前記酵素認識配列を保有する前記アダプタと共に前記NGG部位を切断除去する酵素とステップd由来の産物とを接触させるステップと、(f)ステップeの結果生じた二本鎖DNA断片を、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAとライゲートするステップであって、それによって、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAにライゲートされた目的の配列をそれぞれ含む複数のDNA断片を生成するステップとを含む方法を提供する。一部の実施形態では、核酸ガイド化ヌクレアーゼが、CRISPR/Cas系タンパク質である。一部の実施形態では、NGG部位が、AGG、CGGまたはTGGを含み、CCN部位が、CCT、CCGまたはCCAを含む。一部の実施形態では、調節配列が、プロモーター配列を含む。一部の実施形態では、プロモーター配列が、T7、SP6またはT3配列を含む。一部の実施形態では、DNA断片が、ゲノムDNAの剪断された断片である。
一部の実施形態では、ゲノムDNAが、哺乳動物、原核生物、真核生物またはウイルスのものである。一部の実施形態では、断片が、少なくとも200bpである。一部の実施形態では、ステップbにおける前記酵素が、Nt.CviPII酵素である。一部の実施形態では、ステップcにおける前記酵素が、T7エンドヌクレアーゼIである。一部の実施形態では、ステップdが、前記アダプタがライゲートされたDNAのPCR増幅をさらに含む。一部の実施形態では、ステップfにおいて、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードする前記DNAが、配列、GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号1)を含むRNAをコードするか、または配列、GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC(配列番号2)を含むRNAをコードする。一部の実施形態では、ステップeにおいてNGG部位を除去する前記酵素が、MlyIである。一部の実施形態では、収集物の前記目的の標的が、ゲノムにわたって、10,000bpまたはそれ未満毎の間隔にある。
別の態様では、本発明は、本明細書における実施形態に記載されている、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAにライゲートされた標的化配列をコードするDNAをそれぞれ含む核酸の収集物を作製する方法の実施に有用なキットおよび/または試薬を提供する。
別の態様では、本明細書に記載されている本発明は、核酸の収集物を含むキットであって、収集物中の複数の核酸が、調節領域を含む第1のセグメントと;標的化配列をコードする第2のセグメントと;CRISPR/Cas系タンパク質結合配列をコードする第3のセグメントとを含み、収集物中の核酸の少なくとも10%のサイズが変動する、キットを提供する。
別の態様では、本明細書に記載されている本発明は、核酸の収集物を含むキットであって、収集物中の複数の核酸が、調節領域を含む第1のセグメントと;標的化配列をコードする第2のセグメントであって、そのサイズが21bpを超える第2のセグメントと;CRISPR/Cas系タンパク質結合配列をコードする第3のセグメントとを含む、キットを提供する。
別の態様では、本明細書に記載されている本発明は、標的化配列を含む第1のRNAセグメントと;CRISPR/Cas系タンパク質結合配列を含む第2のRNAセグメントとを含むガイドRNAの収集物を含むキットであって、収集物中のgRNAの少なくとも10%のサイズが変動する、キットを提供する。
別の態様では、本明細書に記載されている本発明は、ガイド核酸の収集物を作製する方法であって、a.供給源試料における豊富な細胞を得るステップと、b.前記豊富な細胞から核酸を収集するステップと、c.前記核酸からガイド核酸(gNA)の収集物を調製するステップとを含む方法を提供する。一部の実施形態では、前記豊富な細胞が、前記供給源試料における1または複数の最も豊富な細菌種由来の細胞を含む。一部の実施形態では、前記豊富な細胞が、2以上の種由来の細胞を含む。一部の実施形態では、前記豊富な細胞が、ヒト細胞を含む。一部の実施形態では、前記豊富な細胞が、動物細胞を含む。一部の実施形態では、前記豊富な細胞が、植物細胞を含む。一部の実施形態では、前記豊富な細胞が、細菌細胞を含む。一部の実施形態では、前記方法は、gNAの前記ライブラリーと核酸ガイド化ヌクレアーゼとを接触させるステップであって、核酸ガイド化ヌクレアーゼ−gNA複合体を形成するステップをさらに含む。一部の実施形態では、前記方法は、前記核酸ガイド化ヌクレアーゼ−gNA複合体を使用するステップをさらに含み、標的部位において標的核酸を切断し、前記gNAが、前記標的部位に対して相補的である。一部の実施形態では、前記標的核酸が、前記供給源試料に由来する。一部の実施形態では、前記標的核酸の種が、前記供給源試料の種と同じである。一部の実施形態では、前記標的核酸の前記種および前記供給源試料の前記種が、ヒトである。一部の実施形態では、前記標的核酸の前記種および前記供給源試料の前記種が、動物である。一部の実施形態では、前記標的核酸の前記種および前記供給源試料の前記種が、植物である。
別の態様では、本明細書に記載されている本発明は、標的化配列をそれぞれ含む核酸の収集物を作製する方法であって、a.供給源DNAを得るステップと、b.ニッキング酵素認識部位においてニッキング酵素により前記供給源DNAにニックを入れるステップであって、これによって、近位ニックに二本鎖切断を生成するステップと、c.前記二本鎖切断のオーバーハングを修復するステップであって、これによって、(i)標的化配列および(ii)前記ニッキング酵素認識部位を含む二本鎖断片を生成するステップとを含む方法を提供する。別の態様では、本明細書に記載されている本発明は、標的化配列をそれぞれ含む核酸の収集物を作製する方法であって、a.供給源DNAを得るステップと、b.ニッキング酵素認識部位においてニッキング酵素により前記供給源DNAにニックを入れるステップであって、これによって、ニックを生成するステップと、c.前記ニックから新しい鎖を合成するステップであって、これにより、標的化配列を含む前記供給源DNAの一本鎖断片を生成するステップとを含む方法を提供する。一部の実施形態では、この方法は、前記一本鎖断片から前記標的化配列を含む二本鎖断片を生成するステップをさらに含む。一部の実施形態では、前記二本鎖断片を生成するステップが、ランダムプライミングおよび伸長を含む。一部の実施形態では、前記ランダムプライミングが、ランダムn−mer領域およびプロモーター領域を含むプライマーにより行われる。一部の実施形態では、前記ランダムn−mer領域が、ランダムヘキサマー領域である。一部の実施形態では、前記ランダムn−mer領域が、ランダムオクタマー領域である。一部の実施形態では、前記プロモーター領域が、T7プロモーター領域である。一部の実施形態では、この方法は、ヌクレアーゼ認識部位を含むヌクレアーゼ認識部位核酸を前記二本鎖断片にライゲートするステップをさらに含む。一部の実施形態では、前記ヌクレアーゼ認識部位が、前記ニッキング酵素認識部位の長さに等しい前記ヌクレアーゼ認識部位からの距離において切断するヌクレアーゼに対応する。一部の実施形態では、前記ヌクレアーゼ認識部位が、MlyI認識部位である。一部の実施形態では、前記ヌクレアーゼ認識部位が、BaeI認識部位である。一部の実施形態では、この方法は、前記ヌクレアーゼにより前記二本鎖断片を消化するステップをさらに含み、これによって、前記二本鎖断片から前記ニッキング酵素認識部位を除去する。一部の実施形態では、この方法は、前記二本鎖断片を、核酸ガイド化ヌクレアーゼ系タンパク質認識部位を含む核酸ガイド化ヌクレアーゼ系タンパク質認識部位核酸にライゲートするステップをさらに含む。一部の実施形態では、前記核酸ガイド化ヌクレアーゼ系タンパク質認識部位が、ガイドRNAステムループ配列を含む。一部の実施形態では、前記ヌクレアーゼ認識部位が、前記標的化配列の長さに等しい前記ヌクレアーゼ認識部位からの距離において切断するヌクレアーゼに対応する。一部の実施形態では、前記標的化配列の前記長さが、20塩基対である。一部の実施形態では、前記ヌクレアーゼ認識部位が、MmeI認識部位である。一部の実施形態では、この方法は、前記ヌクレアーゼにより前記二本鎖断片を消化するステップをさらに含む。一部の実施形態では、前記ヌクレアーゼ認識部位が、前記標的化配列の長さプラス前記ニッキング酵素認識部位の長さに等しい前記ヌクレアーゼ認識部位からの距離において切断するヌクレアーゼに対応する。一部の実施形態では、前記標的化配列の前記長さプラス前記ニッキング酵素認識部位の長さが、23塩基対である。一部の実施形態では、前記ヌクレアーゼ認識部位が、EcoP15I認識部位である。一部の実施形態では、この方法は、前記ヌクレアーゼにより前記二本鎖断片を消化するステップをさらに含む。一部の実施形態では、この方法は、前記二本鎖断片を、核酸ガイド化ヌクレアーゼ系タンパク質認識部位を含む核酸ガイド化ヌクレアーゼ系タンパク質認識部位核酸にライゲートするステップをさらに含む。一部の実施形態では、前記核酸ガイド化ヌクレアーゼ系タンパク質認識部位が、ガイドRNAステムループ配列を含む。
別の態様では、本明細書に記載されている本発明は、本明細書に記載されている態様の方法を実施するための、あらゆる必須の試薬および説明書を含むキットを提供する。
図1は、ゲノムDNAからgRNAの収集物(gRNAライブラリー)を生成するための例示的なスキームを図解する。
図2は、ゲノムDNAからgRNAの収集物(gRNAライブラリー)を生成するための別の例示的なスキームを図解する。
図3は、DNAをニッキングし、その後にポリメラーゼ処理して平滑末端を生成するための例示的なスキームを図解する。
図4は、3種のアダプタを使用した、gNAのライブラリーの逐次生成のための例示的なスキームを図解する。
図5は、1種のアダプタおよび1種のオリゴ(oligo)を使用した、gNAのライブラリーの逐次生成のための例示的なスキームを図解する。
図6は、ニッキング酵素媒介性DNA増幅(NEMDA)を使用した、平滑末端を有するDNA断片の大規模プールの生成のための例示的なスキームを図解する。
図7は、ニッキング酵素媒介性DNA増幅(NEMDA)を使用した、gNAの大規模プールの生成のための例示的なスキームを図解する。
発明の詳細な説明
当技術分野には、種々の下流適用のための多数の多様なガイド核酸(gNA)(例えば、gRNA、gDNA)を生成するための、拡大縮小が可能な(scalable)低コストアプローチの必要がある。
本明細書で特に定義されない限り、本明細書で使用される全ての専門用語および科学用語は、この発明が属する分野の当業者が一般に理解するのと同じ意味を有する。本明細書に記載されるそれらに類似するまたは同等であるいかなる方法および材料も本発明の実施または試験で使用することができるが、好ましい方法および材料を記載する。
数値範囲は、その範囲を規定する数を含む。
本明細書を解釈する目的で、次の定義が適用されるが、適切であれば、単数形で使用されている用語は、複数形も含み、その逆もまた真であり得る。下に示す任意の定義が、参照により本明細書に組み込まれる任意の文書と矛盾する場合、示されている定義が優先されるものとする。
本明細書で使用するように、単数形である「1つの(a)」、「1つの(an)」および「その(the)」は、他に断りがなければ、複数形の参照を含む。
本明細書に記載されている本発明の態様および実施形態が、「を含む」、「からなる」および「から本質的になる」態様および実施形態を含むことが理解される。
本明細書で使用する用語「約」は、当技術分野の当業者には直ちに分かる、それぞれの値の通常の誤差範囲を指す。本明細書における、「約」によるある値またはパラメータの参照は、当該値またはパラメータそれ自体を対象とする実施形態を含む(および記載する)。
本明細書で使用する用語「核酸」は、1個または複数の核酸サブユニットを含む分子を指す。核酸は、アデノシン(A)、シトシン(C)、グアニン(G)、チミン(T)およびウラシル(U)、ならびにこれらの改変バージョンから選択される1個または複数のサブユニットを含むことができる。核酸は、デオキシリボ核酸(DNA)、リボ核酸(RNA)、これらの組合せまたは誘導体を含む。核酸は、一本鎖および/または二本鎖であってよい。
核酸は、「ヌクレオチド」を含み、これは、本明細書で使用するように、プリンおよびピリミジン塩基、ならびにこれらの改変バージョンを含有する部分を含むことが意図される。そのような改変には、メチル化されたプリンまたはピリミジン、アシル化されたプリンまたはピリミジン、アルキル化されたリボースまたは他の複素環が含まれる。さらに、用語「ヌクレオチド」または「ポリヌクレオチド」にはハプテンまたは蛍光標識を含有する部分が含まれ、従来のリボースおよびデオキシリボース糖だけでなく、他の糖も同様に含有することができる。改変ヌクレオシド、改変ヌクレオチドまたは改変ポリヌクレオチドには、例えば、ヒドロキシル基の1つまたは複数がハロゲン原子または脂肪族基で置き換えられるか、エーテル、アミンなどとして官能基化される、糖部分の改変も含まれる。
用語「核酸」および「ポリヌクレオチド」は、本明細書において互換的に使用される。ポリヌクレオチドは、ヌクレオチド、例えばデオキシリボヌクレオチドまたはリボヌクレオチドで構成される、任意の長さ、例えば、約2塩基より大きい、約10塩基より大きい、約100塩基より大きい、約500塩基より大きい、1000塩基より大きい、最高約10,000またはそれより多くの塩基の核酸ポリマーを記載するために使用され、酵素的または合成的に生成することができ(例えば、米国特許第5,948,902号およびその中の引用文献に記載されるPNA)、それは2つの天然に存在する核酸のそれに類似した配列特異的方法で天然に存在する核酸とハイブリダイズすることができ、例えば、ワトソン−クリック型塩基対形成相互作用に関与することができる。天然に存在するヌクレオチドには、グアニン、シトシン、アデニンおよびチミン(それぞれG、C、AおよびT)が含まれる。DNAおよびRNAはデオキシリボースおよびリボース糖骨格をそれぞれ有するが、PNAの骨格は、ペプチド結合によって連結されている反復するN−(2−アミノエチル)−グリシン単位で構成される。PNAでは、様々なプリンおよびピリミジン塩基がメチレンカルボニル結合によって骨格に連結される。しばしばアクセス不可能なRNAと呼ばれるロックト核酸(LNA)は、改変RNAヌクレオチドである。LNAヌクレオチドのリボース部分は、2’酸素および4’炭素を接続する余分の橋で改変される。橋は3’−エンド(北(North))コンフォメーションでリボースを「ロック」し、それはA形二重鎖でしばしば見出される。所望のときはいつでも、LNAヌクレオチドがオリゴヌクレオチドのDNAまたはRNA残基と混合していてもよい。用語「非構造化核酸」または「UNA」は、低い安定性で互いに結合する非天然ヌクレオチドを含有する核酸である。例えば、非構造化核酸は、G’残基およびC’残基を含有することができ、ここで、これらの残基は、低い安定性で互いと塩基対を形成するが、天然に存在するCおよびGの残基とそれぞれ塩基対を形成する能力を保持する、GおよびCの天然に存在しない形、すなわち類似体に対応する。非構造化核酸は米国特許出願公開第20050233340号に記載され、それはUNAの開示のために参照により本明細書に組み込まれる。
本明細書で使用するように、用語「オリゴヌクレオチド」は、ヌクレオチドの一本鎖多量体を表す。
特に明記しない限り、核酸は左から右に5’から3’の向きで記述される。アミノ酸配列は、左から右にそれぞれアミノからカルボキシの向きで記述される。
本明細書で使用するように、用語「切断する」は、二本鎖DNA分子の両方の鎖における2つの隣接したヌクレオチドの間のホスホジエステル結合を切断し、それによってDNA分子において二本鎖切断をもたらす反応を指す。
本明細書で使用する用語「ニッキング」は、二本鎖DNA分子の一方の鎖のみにおける2個の隣接するヌクレオチドの間のホスホジエステル結合を切断し、これにより、DNA分子の一方の鎖における切断をもたらす反応を指す。
本明細書で使用するように、用語「切断部位」は、二本鎖DNA分子が切断された部位を指す。
「核酸ガイド化ヌクレアーゼ−gNA複合体」は、核酸ガイド化ヌクレアーゼタンパク質とガイド核酸(gNA、例えばgRNAまたはgDNA)とを含む複合体を指す。例えば、「Cas9−gRNA複合体」は、Cas9タンパク質とガイドRNA(gRNA)とを含む複合体を指す。核酸ガイド化ヌクレアーゼは、野生型核酸ガイド化ヌクレアーゼ、触媒活性がない核酸ガイド化ヌクレアーゼまたは核酸ガイド化ヌクレアーゼであるニッカーゼを非限定的に含む、任意のタイプの核酸ガイド化ヌクレアーゼであってよい。
用語「核酸ガイド化ヌクレアーゼ関連ガイドNA」は、ガイド核酸(ガイドNA)を指す。核酸ガイド化ヌクレアーゼ関連ガイドNAは、単離された核酸として、または核酸ガイド化ヌクレアーゼ−gNA複合体、例えばCas9−gRNA複合体の一部として存在することができる。
用語「捕捉」および「濃縮」は、本明細書で互換的に使用され、目的の配列、目的の標的化部位、目的外の配列または目的外の標的化部位を含有する核酸領域を選択的に単離するプロセスを指す。
用語「ハイブリダイゼーション」は、当技術分野で公知のように、核酸鎖が塩基対形成を通して相補鎖と結合するプロセスを指す。その2つの配列が中等度から高いストリンジェンシーのハイブリダイゼーションおよび洗浄条件の下でお互いと特異的にハイブリダイズするならば、核酸は参照核酸配列と「選択的にハイブリダイゼーションが可能である」と考えられる。中等度および高いストリンジェンシーのハイブリダイゼーション条件は公知である(例えば、Ausubelら、Short Protocols in Molecular Biology、第3版、Wiley & Sons1995年およびSambrookら、Molecular Cloning: A Laboratory Manual、第3版、2001年、Cold Spring Harbor、N.Y.を参照)。高ストリンジェンシー条件の1つの例は、50%ホルムアミド、5×SSC、5×デンハルト液、0.5%SDSおよび100μg/mlの変性担体DNA中で約42℃でのハイブリダイゼーション、続いて、室温での2×SSCおよび0.5%SDSにおける2回の洗浄と42℃での0.1×SSCおよび0.5%SDSにおける2回の追加の洗浄を含む。
本明細書で使用する用語「二重鎖」または「二重鎖の(duplexed)」は、塩基対を形成した、すなわち一緒にハイブリダイズした2つの相補的ポリヌクレオチドを記載する。
本明細書で使用するように用語「増幅する」は、鋳型として標的核酸を使用して標的核酸の1つまたは複数のコピーを生成することを指す。
本明細書で使用するように、用語「ゲノム領域」は、ゲノム、例えば動物または植物のゲノム、例えばヒト、サル、ラット、魚類または昆虫または植物のゲノムの領域を指す。ある特定の場合には、本明細書に記載される方法で使用されるオリゴヌクレオチドは、参照ゲノム領域、すなわち、公知のヌクレオチド配列のゲノム領域、例えば、その配列は例えばNCBIのGenbankデータベースまたは他のデータベースに寄託される染色体領域を使用して設計することができる。
本明細書で使用するように、用語「ゲノム配列」は、ゲノムに存在する配列を指す。RNAはゲノムから転写されるので、この用語は、生物体の核ゲノムに存在する配列、ならびにそのようなゲノムから転写されるRNA(例えば、mRNA)のcDNAコピーに存在する配列を包含する。
本明細書で使用するように、用語「ゲノム断片」は、ゲノム、例えば動物または植物のゲノム、例えばヒト、サル、ラット、魚類または昆虫または植物のゲノムの領域を指す。ゲノム断片は、染色体全体または染色体の断片であってもよい。ゲノム断片は、アダプタでライゲートされても(この場合、それは断片の片方もしくは両方の末端に、または分子の少なくとも5’末端にライゲートされたアダプタを有する)、またはアダプタでライゲートされなくてもよい。
ある特定の場合には、本明細書に記載される方法で使用されるオリゴヌクレオチドは、参照ゲノム領域、すなわち、公知のヌクレオチド配列のゲノム領域、例えば、その配列は例えばNCBIのGenbankデータベースまたは他のデータベースに寄託される染色体領域を使用して設計することができる。そのようなオリゴヌクレオチドは、試験ゲノムを含有する試料を使用するアッセイにおいて用いることができ、ここで試験ゲノムはオリゴヌクレオチドのための結合部位を含有する。
本明細書で使用するように、用語「ライゲートする」は、第1のDNA分子の5’末端の末端ヌクレオチドと第2のDNA分子の3’末端の末端ヌクレオチドとの、酵素によって触媒される結合を指す。
2つの核酸が「相補的である」場合は、核酸のうち1つの各塩基は他の核酸の中の対応するヌクレオチドと塩基対を形成する。用語「相補的な」および「完全に相補的な」は、本明細書において同義的に使用される。
本明細書で使用するように、用語「分離する」は、2つのエレメントの(例えば、サイズまたは親和性等による)物理的分離、ならびに1つのエレメントが分解し、他はインタクトなまま残ることを指す。例えば、切断された標的化配列を含む核酸を分離するために、サイズ排除を用いることができる。
細胞では、DNAは通常二本鎖の形態で存在し、このように、本明細書において「トップ」および「ボトム」鎖と呼ばれる2つの相補的な核酸鎖を有する。ある特定の場合には、染色体領域の相補鎖は、「プラス」および「マイナス」鎖、「第1」および「第2」の鎖、「コード」および「非コード」鎖、「ワトソン」および「クリック」鎖または「センス」および「アンチセンス」鎖と呼ぶことができる。トップまたはボトム鎖への鎖の割り当ては恣意的であり、いかなる特定の配向、機能または構造も意味しない。それらが共有結合するまで、第1および第2の鎖は別個の分子である。記載の容易さのために、トップおよびボトム鎖が共有結合している二本鎖核酸の「トップ」および「ボトム」鎖は、「トップ」および「ボトム」鎖としてなお記載される。言い換えると、この開示のために、二本鎖DNAのトップおよびボトム鎖は分離された分子である必要はない。いくつかの例示的な哺乳動物の染色体領域(例えば、BAC、アセンブリー、染色体等)の第1の鎖のヌクレオチド配列が公知であり、例えば、NCBIのGenbankデータベースに見出すことができる。
本明細書で使用する用語「トップ鎖」は、核酸の両方の鎖でなく核酸のいずれかの鎖を指す。オリゴヌクレオチドまたはプライマーが「トップ鎖だけに」結合またはアニールするとき、それは1つの鎖だけに結合し、他には結合しない。本明細書で使用する用語「ボトム鎖」は、「トップ鎖」に相補的である鎖を指す。オリゴヌクレオチドが「1本の鎖だけに」結合またはアニールするとき、それは1本の鎖だけ、例えば第1または第2の鎖だけに結合し、他の鎖には結合しない。オリゴヌクレオチドが二本鎖DNAの両方の鎖に結合またはアニールする場合は、オリゴヌクレオチドは2つの領域を有することができ、第1の領域は二本鎖DNAのトップ鎖とハイブリダイズし、第2の領域は二本鎖DNAのボトム鎖とハイブリダイズする。
用語「二本鎖DNA分子」は、トップおよびボトム鎖が共有結合していない二本鎖DNA分子、ならびにトップおよびボトム鎖が共有結合している二本鎖DNA分子の両方を指す。二本鎖DNAのトップおよびボトム鎖は、ワトソン−クリック相互作用により互いと塩基対を形成する。
本明細書で使用するように、用語「変性する」は、適する変性条件に二重鎖を置くことによる、核酸二重鎖の塩基対の少なくとも一部の分離を指す。変性条件は、当技術分野で周知である。一実施形態では、核酸二重鎖を変性させるために、二重鎖を二重鎖のTより上の温度に曝露させ、それによって二重鎖の1本の鎖を他から解放することができる。ある特定の実施形態では、適する時間(例えば、少なくとも30秒から30分まで)、少なくとも90℃の温度にそれを曝露させることによって、核酸を変性させることができる。ある特定の実施形態では、二重鎖の塩基対を完全に分離するために、完全変性条件を使用することができる。他の実施形態では、二重鎖のある特定の部分の塩基対を分離するために(例えば、A−T塩基対が濃縮された領域は分離することができ、G−C塩基対が濃縮された領域は対を形成したままでいることができる)、部分的変性条件(例えば、完全変性条件より低い温度による)を使用することができる。核酸は、化学的に変性させることもできる(例えば、尿素またはNaOHを使用する)。
本明細書で使用するように、用語「遺伝子型決定」は、核酸配列の任意のタイプの分析を指し、配列決定、多型(SNP)分析および再配列を同定するための分析を含む。
本明細書で使用するように、用語「配列決定」は、ポリヌクレオチドの連続するヌクレオチドの同一性が得られる方法を指す。
用語「次世代配列決定」は、いわゆる並行化された合成による配列決定またはライゲーションによる配列決定プラットホーム、例えば、Illumina、Life TechnologiesおよびRoche等によって現在用いられるものを指す。次世代配列決定方法は、ナノポア配列決定方法または電子検出に基づく方法、例えば、Life Technologiesによって商品化されたIon Torrent技術を含むこともできる。
用語「相補的DNA」またはcDNAは、RNAの(ランダムヘキサマーまたはオリゴdTプライマーなどのプライマーを使用した)逆転写と、続くRNaseHによるRNAの消化およびDNAポリメラーゼによる合成による第2の鎖の合成によってRNA試料から生成された二本鎖DNA試料を指す。
用語「RNAプロモーターアダプタ」は、バクテリオファージRNAポリメラーゼ、例えば、バクテリオファージT3、T7、SP6などからのRNAポリメラーゼのためのプロモーターを含有するアダプタである。
用語の他の定義は、明細書全体で出現することがある。
本明細書に記載されている構造的および機能的特徴のいずれかに関して、これらの特徴を決定する方法は、当技術分野で公知である。
ガイド核酸(gNA)
任意の核酸供給源から得ることができるガイド核酸(gNA)が、本明細書に提供される。gNAは、ガイドRNA(gRNA)またはガイドDNA(gDNA)であってよい。核酸供給源は、DNAまたはRNAであってよい。単一の生物由来のDNA、または複数の生物由来のDNAの混合物、または複数の種由来のDNAの混合物、または臨床試料由来のDNA、または法医学的試料由来のDNA、または環境試料由来のDNA、またはメタゲノムDNA試料(例えば、2以上の生物種を含有する試料)由来のDNAを含む、任意の供給源核酸からgNAを生成するための方法が、本明細書に提供される。任意の供給源DNAの例は、任意のゲノム、任意のゲノム断片、cDNA、合成DNAまたはDNA収集物(例えば、SNP収集物、DNAライブラリー)を非限定的に含む。本明細書に提供されているgNAは、ゲノムワイド適用に使用することができる。
一部の実施形態では、gNAは、ゲノム配列(例えば、ゲノムDNA)に由来する。一部の実施形態では、gNAは、哺乳動物ゲノム配列に由来する。一部の実施形態では、gNAは、真核生物ゲノム配列に由来する。一部の実施形態では、gNAは、原核生物ゲノム配列に由来する。一部の実施形態では、gNAは、ウイルスゲノム配列に由来する。一部の実施形態では、gNAは、細菌ゲノム配列に由来する。一部の実施形態では、gNAは、植物ゲノム配列に由来する。一部の実施形態では、gNAは、微生物ゲノム配列に由来する。一部の実施形態では、gNAは、寄生生物、例えば、真核寄生生物由来のゲノム配列に由来する。
一部の実施形態では、gNAは、反復性DNAに由来する。一部の実施形態では、gNAは、豊富なDNAに由来する。一部の実施形態では、gNAは、ミトコンドリアDNAに由来する。一部の実施形態では、gNAは、リボソームDNAに由来する。一部の実施形態では、gNAは、セントロメアDNAに由来する。一部の実施形態では、gNAは、Aluエレメントを含むDNA(Alu DNA)に由来する。一部の実施形態では、gNAは、長鎖散在核要素を含むDNA(LINE DNA)に由来する。一部の実施形態では、gNAは、短鎖散在核要素を含むDNA(SINE DNA)に由来する。一部の実施形態では、豊富なDNAは、リボソームDNAを含む。一部の実施形態では、豊富なDNAは、宿主DNA(例えば、宿主ゲノムDNAまたは全宿主DNA)を含む。一例では、宿主DNA(例えば、ヒト、動物、植物)を枯渇させて、存在する他のDNA(例えば、細菌、ウイルスまたは他のメタゲノムDNA)のより容易な解析を可能にするために、gNAは、宿主DNAに由来し得る。別の例では、gNAは、メタゲノム試料中の1または複数の最も豊富な細菌種等、混合試料中の1または複数の最も豊富な型(例えば、種)に由来し得る。1または複数の最も豊富な型(例えば、種)は、2、3、4、5、6、7、8、9、10または10を超える最も豊富な型(例えば、種)を含むことができる。最も豊富な型は、最も豊富な界、門(phylumまたはdivision)、綱、目、科、属、種または他の分類であり得る。最も豊富な型は、上皮細胞、骨細胞、筋肉細胞、血液細胞、脂肪細胞または他の細胞型等、最も豊富な細胞型であり得る。最も豊富な型は、非がん性細胞であり得る。最も豊富な型は、がん性細胞であり得る。最も豊富な型は、動物、ヒト、植物、真菌、細菌またはウイルスであり得る。gNAは、ヒトDNAおよび1または複数の最も豊富な細菌種のDNAの両方に由来等、試料中の宿主および1または複数の最も豊富な非宿主型(例えば、種)の両方に由来し得る。一部の実施形態では、豊富なDNAは、試料中のより豊富な方のまたは最も豊富な細胞由来のDNAを含む。例えば、特異的な試料のため、非常に豊富な細胞を抽出することができ、そのDNAを使用して、gNAを生成することができる;このようなgNAを使用して、枯渇ライブラリーを生成し、本来の試料に適用して、低存在量標的の配列決定または検出を可能にまたは増強することができる。
一部の実施形態では、gNAは、短い末端反復(STR)を含むDNAに由来する。
一部の実施形態では、gNAは、ゲノムの領域を含むゲノム断片、または全ゲノムそれ自体に由来する。一実施形態では、ゲノムはDNAゲノムである。別の実施形態では、ゲノムはRNAゲノムである。
一部の実施形態では、gNAは、真核生物または原核生物の生物体;哺乳動物の生物体または非哺乳動物の生物体;動物または植物;細菌またはウイルス;動物寄生生物;または病原体に由来する。
一部の実施形態では、gNAは、任意の哺乳動物の生物体に由来する。一実施形態では、哺乳動物はヒトである。別の実施形態では、哺乳動物は畜産動物、例えばウマ、ヒツジ、ウシ、ブタまたはロバである。別の実施形態では、哺乳動物の生物体は、家庭用ペット、例えばネコ、イヌ、スナネズミ、マウス、ラットである。別の実施形態では、哺乳動物はサルの一種である。
一部の実施形態では、gNAは、任意のトリまたは鳥類の生物体に由来する。鳥類の生物体には、ニワトリ、シチメンチョウ、カモおよびガチョウが限定されずに含まれる。
一部の実施形態では、gNAは、植物に由来する。一実施形態では、植物は、イネ、トウモロコシ、コムギ、バラ、ブドウ、コーヒー、果実、トマト、ジャガイモまたはワタである。
一部の実施形態では、gNAは、細菌の種に由来する。一実施形態では、細菌は、結核を引き起こす細菌である。
一部の実施形態では、gNAは、ウイルスに由来する。
一部の実施形態では、gNAは、真菌類の種に由来する。
一部の実施形態では、gNAは、藻類の種に由来する。
一部の実施形態では、gNAは、任意の哺乳動物寄生生物に由来する。
一部の実施形態では、gNAは、任意の哺乳動物寄生生物に由来する。一実施形態では、寄生生物は虫である。別の実施形態では、寄生生物は、マラリアを引き起こす寄生生物である。別の実施形態では、寄生生物は、リーシュマニア症を引き起こす寄生生物である。別の実施形態では、寄生生物はアメーバである。
一部の実施形態では、gNAは、核酸標的に由来する。企図される標的は、病原体;一塩基多型(SNP)、挿入、欠失、タンデム反復もしくは転座;ヒトSNPもしくはSTR;潜在的な毒素;または動物、真菌および植物を非限定的に含む。一部の実施形態では、gRNAは、病原体に由来し、病原体特異的gNAである。
一部の実施形態では、本発明のガイドNAは、15〜250bpである標的化配列を含む、第1のNAセグメントと;核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質結合配列を含む、第2のNAセグメントとを含む。一部の実施形態では、標的化配列は、21bpを超える、22bpを超える、23bpを超える、24bpを超える、25bpを超える、26bpを超える、27bpを超える、28bpを超える、29bpを超える、30bpを超える、40bpを超える、50bpを超える、60bpを超える、70bpを超える、80bpを超える、90bpを超える、100bpを超える、110bpを超える、120bpを超える、130bpを超える、140bpを超える、またはさらには150bpを超える。例示的な実施形態では、標的化配列は、30bpを超える。一部の実施形態では、本発明の標的化配列は、サイズが30〜50bpに及ぶ。一部の実施形態では、本発明の標的化配列は、サイズが30〜75bpに及ぶ。一部の実施形態では、本発明の標的化配列は、サイズが30〜100bpに及ぶ。例えば、標的化配列は、少なくとも15bp、20bp、25bp、30bp、35bp、40bp、45bp、50bp、55bp、60bp、65bp、70bp、75bp、80bp、85bp、90bp、95bp、100bp、110bp、120bp、130bp、140bp、150bp、160bp、170bp、180bp、190bp、200bp、210bp、220bp、230bp、240bpまたは250bpであり得る。特定の実施形態では、標的化配列は、少なくとも22bpである。特定の実施形態では、標的化配列は、少なくとも30bpである。
一部の実施形態では、標的特異的gNAは、核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質によって認識され得る、PAM配列に対し5’にある標的化された核酸配列の反対の鎖における領域と相補的な核酸配列を含むことができる。一部の実施形態では、標的化された核酸配列は、PAM配列に対しすぐ接して5’にある。特異的な実施形態では、標的核酸における領域と相補的なgNAの核酸配列は、15〜250bpである。特異的な実施形態では、標的核酸における領域と相補的なgNAの核酸配列は、22、23、24、25、30、35、40、45、50、60、70、75、80、90または100bpである。
一部の特定の実施形態では、標的化配列は、20bpではない。一部の特定の実施形態では、標的化配列は、21bpではない。
一部の実施形態では、gNAは、任意のプリンまたはピリミジン(および/またはこれらの改変バージョン)を含む。一部の実施形態では、gNAは、アデニン、ウラシル、グアニンおよびシトシン(および/またはこれらの改変バージョン)を含む。一部の実施形態では、gNAは、アデニン、チミン、グアニンおよびシトシン(および/またはこれらの改変バージョン)を含む。一部の実施形態では、gNAは、アデニン、チミン、グアニン、シトシンおよびウラシル(および/またはこれらの改変バージョン)を含む。
一部の実施形態では、gNAは、標識を含むか、標識に付着されるか、または標識され得る。一部の実施形態では、gNAは、標識にさらに付着されることができる部分を含む。標識は、酵素、酵素基質、抗体、抗原結合性断片、ペプチド、発色団、発光団(lumiphore)、フルオロフォア、色素原、ハプテン、抗原、放射性同位元素、磁性粒子、金属ナノ粒子、酸化還元活性マーカー基(酸化還元反応を起こすことができる)、アプタマー、結合ペアの一方のメンバー、FRETペアのメンバー(ドナーまたはアクセプターフルオロフォアのいずれか)およびこれらの組合せを非限定的に含む。
一部の実施形態では、gNAは、基材に付着されている。基材は、ガラス、プラスチック、シリコン、シリカベースの材料、官能化ポリスチレン、官能化ポリエチレングリコール、官能化有機ポリマー、ニトロセルロースまたはナイロン膜、紙、綿および合成に適した材料でできていてよい。基材は、平坦である必要はない。一部の実施形態では、基材は、2次元アレイである。一部の実施形態では、2次元アレイは、平坦である。一部の実施形態では、2次元アレイは、平坦でなく、例えば、アレイは、波状アレイである。基材は、球形(例えば、ビーズ)を含む任意の型の形状を含む。基材に付着される材料は、基材の任意の部分に付着されてよい(例えば、多孔性基材材料の内側部分に付着されてよい)。一部の実施形態では、基材は、3次元アレイ、例えば、マイクロスフェアである。一部の実施形態では、マイクロスフェアは、磁性である。一部の実施形態では、マイクロスフェアは、ガラスである。一部の実施形態では、マイクロスフェアは、ポリスチレンでできている。一部の実施形態では、マイクロスフェアは、シリカベースである。一部の実施形態では、基材は、内側表面を有するアレイであり、例えば、ストロー、チューブ、キャピラリー、円柱状またはマイクロ流体チャンバーアレイである。一部の実施形態では、基材は、複数のストロー、キャピラリー、チューブ、シリンダーまたはチャンバーを含む。
gNAをコードする核酸
gNA(例えば、gRNAまたはgDNA)をコードする核酸も、本明細書に提供される。一部の実施形態では、コードするとは、gNAが、gNA(例えば、gRNA)をコードする核酸の転写に起因することを意味する。一部の実施形態では、コードするとは、核酸が、gNA(例えば、gRNA)の転写のための鋳型であることを意味する。一部の実施形態では、コードするとは、gNAが、gNAをコードする核酸の逆転写に起因することを意味する。一部の実施形態では、コードするとは、核酸が、gNAの逆転写のための鋳型であることを意味する。一部の実施形態では、コードするとは、gNAが、gNAをコードする核酸の増幅に起因することを意味する。一部の実施形態では、コードするとは、核酸が、gNAの増幅のための鋳型であることを意味する。
一部の実施形態では、gNAをコードする核酸は、調節領域を含む第1のセグメントと;標的化配列を含む第2のセグメントであって、15bp〜250bpに及び得る第2のセグメントと;核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質結合配列をコードする核酸を含む第3のセグメントとを含む。
一部の実施形態では、gNAをコードする核酸は、DNAを含む。一部の実施形態では、第1のセグメントは、二本鎖DNAである。一部の実施形態では、第1のセグメントは、一本鎖DNAである。一部の実施形態では、第2のセグメントは、一本鎖DNAである。一部の実施形態では、第3のセグメントは、一本鎖DNAである。一部の実施形態では、第2のセグメントは、二本鎖DNAである。一部の実施形態では、第3のセグメントは、二本鎖DNAである。
一部の実施形態では、gNAをコードする核酸は、RNAを含む。
一部の実施形態では、gNAをコードする核酸は、DNAおよびRNAを含む。
一部の実施形態では、調節領域は、転写因子に結合することができる領域である。一部の実施形態では、調節領域は、プロモーターを含む。一部の実施形態では、プロモーターは、T7、SP6およびT3からなる群から選択される。
gNAの収集物
gNAの収集物(ライブラリーと互換的に称される)が、本明細書に提供される。
本明細書で使用するように、gNAの収集物は、少なくとも10個の特異なgNAを含有するgNAの混合物を意味する。一部の実施形態では、gNAの収集物は、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも1010個の特異なgNAを含有する。一部の実施形態では、gNAの収集物は、総計で少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも1010個のgNAを含有する。
一部の実施形態では、gNAの収集物は、標的化配列を含む第1のNAセグメントと;核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質結合配列を含む第2のNAセグメントとを含み、収集物中のgNAの少なくとも10%のサイズが変動する。一部の実施形態では、第1および第2のセグメントは、5’から3’への順序である。
一部の実施形態では、第1のセグメントのサイズは、gNAの収集物にわたって15〜250bp、または30〜100bp、または22〜30bp、または15〜50bp、または15〜75bp、または15〜100bp、または15〜125bp、または15〜150bp、または15〜175bp、または15〜200bp、または15〜225bp、または15〜250bp、または22〜50bp、または22〜75bp、または22〜100bp、または22〜125bp、または22〜150bp、または22〜175bp、または22〜200bp、または22〜225bp、または22〜250bp変動する。
一部の実施形態では、収集物中の第1のセグメントの少なくとも10%、または少なくとも15%、または少なくとも(at last)20%、または少なくとも25%、または少なくとも30%、または少なくとも35%、または少なくとも40%、または少なくとも45%、または少なくとも50%、または少なくとも55%、または少なくとも60%、または少なくとも65%、または少なくとも70%、または少なくとも75%、または少なくとも80%、または少なくとも85%、または少なくとも90%、または少なくとも95%、または100%は、21bpを超える。
一部の実施形態では、収集物中の第1のセグメントの少なくとも10%、または少なくとも15%、または少なくとも(at last)20%、または少なくとも25%、または少なくとも30%、または少なくとも35%、または少なくとも40%、または少なくとも45%、または少なくとも50%、または少なくとも55%、または少なくとも60%、または少なくとも65%、または少なくとも70%、または少なくとも75%、または少なくとも80%、または少なくとも85%、または少なくとも90%、または少なくとも95%、または100%は、25bpを超える。
一部の実施形態では、収集物中の第1のセグメントの少なくとも10%、または少なくとも15%、または少なくとも(at last)20%、または少なくとも25%、または少なくとも30%、または少なくとも35%、または少なくとも40%、または少なくとも45%、または少なくとも50%、または少なくとも55%、または少なくとも60%、または少なくとも65%、または少なくとも70%、または少なくとも75%、または少なくとも80%、または少なくとも85%、または少なくとも90%、または少なくとも95%、または100%は、30bpを超える。
一部の実施形態では、収集物中の第1のセグメントの少なくとも10%、または少なくとも15%、または少なくとも(at last)20%、または少なくとも25%、または少なくとも30%、または少なくとも35%、または少なくとも40%、または少なくとも45%、または少なくとも50%、または少なくとも55%、または少なくとも60%、または少なくとも65%、または少なくとも70%、または少なくとも75%、または少なくとも80%、または少なくとも85%、または少なくとも90%、または少なくとも95%、または100%は、15〜50bpである。
一部の実施形態では、収集物中の第1のセグメントの少なくとも10%、または少なくとも15%、または少なくとも(at last)20%、または少なくとも25%、または少なくとも30%、または少なくとも35%、または少なくとも40%、または少なくとも45%、または少なくとも50%、または少なくとも55%、または少なくとも60%、または少なくとも65%、または少なくとも70%、または少なくとも75%、または少なくとも80%、または少なくとも85%、または少なくとも90%、または少なくとも95%、または100%は、30〜100bpである。
一部の特定の実施形態では、第1のセグメントのサイズは、20bpではない。
一部の特定の実施形態では、第1のセグメントのサイズは、21bpではない。
一部の実施形態では、gRNAの収集物中のgNAおよび/またはgNAの標的化配列は、特異な5’端を含む。一部の実施形態では、gNAの収集物は、収集物のメンバーにわたる、標的化配列の5’端の配列に可変性を呈する。一部の実施形態では、gNAの収集物は、収集物のメンバーにわたる、標的化配列の5’端の配列に少なくとも5%または少なくとも10%または少なくとも15%または少なくとも20%または少なくとも25%または少なくとも30%または少なくとも35%または少なくとも40%または少なくとも45%または少なくとも50%または少なくとも55%または少なくとも60%または少なくとも65%または少なくとも70%の可変性または少なくとも75%可変性を呈する。
一部の実施形態では、gNA標的化配列の3’端は、任意のプリンまたはピリミジン(および/またはこれらの改変バージョン)であってよい。一部の実施形態では、gNA標的化配列の3’端は、アデニンである。一部の実施形態では、gNA標的化配列の3’端は、グアニンである。一部の実施形態では、gNA標的化配列の3’端は、シトシンである。一部の実施形態では、gNA標的化配列の3’端は、ウラシルである。一部の実施形態では、gNA標的化配列の3’端は、チミンである。一部の実施形態では、gNA標的化配列の3’端は、シトシンではない。
一部の実施形態では、gNAの収集物は、標的化されたDNAと塩基対形成することができる標的化配列を含み、目的の標的は、目的のゲノムにわたって、少なくとも1bp毎の、少なくとも2bp毎の、少なくとも3bp毎の、少なくとも4bp毎の、少なくとも5bp毎の、少なくとも6bp毎の、少なくとも7bp毎の、少なくとも8bp毎の、少なくとも9bp毎の、少なくとも10bp毎の、少なくとも11bp毎の、少なくとも12bp毎の、少なくとも13bp毎の、少なくとも14bp毎の、少なくとも15bp毎の、少なくとも16bp毎の、少なくとも17bp毎の、少なくとも18bp毎の、少なくとも19bp毎の、20bp、少なくとも25bp毎の、少なくとも30bp毎の、少なくとも40bp毎の、少なくとも50bp毎の、少なくとも100bp毎の、少なくとも200bp毎の、少なくとも300bp毎の、少なくとも400bp毎の、少なくとも500bp毎の、少なくとも600bp毎の、少なくとも700bp毎の、少なくとも800bp毎の、少なくとも900bp毎の、少なくとも1000bp毎の、少なくとも2500bp毎の、少なくとも5000bp毎の、少なくとも10,000bp毎の、少なくとも15,000bp毎の、少なくとも20,000bp毎の、少なくとも25,000bp毎の、少なくとも50,000bp毎の、少なくとも100,000bp毎の、少なくとも250,000bp毎の、少なくとも500,000bp毎の、少なくとも750,000bp毎のまたはさらには少なくとも1,000,000bp毎の間隔にある。
一部の実施形態では、gNAの収集物は、標的化配列を含む第1のNAセグメントと;核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質結合配列を含む第2のNAセグメントとを含み、収集物中のgNAは、核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)のタンパク質メンバーに対し様々な特異性を有する種々の第2のNAセグメントを有することができる。例えば、本明細書に提供されているgNAの収集物は、その第2のセグメントが、第1の核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質に特異的な核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質結合配列を含むメンバーを含むことができ;また、その第2のセグメントが、第2の核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質に特異的な核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質結合配列を含むメンバーも含み、この場合、第1および第2の核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質は、同じものではない。一部の実施形態では、本明細書に提供されているgNAの収集物は、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19またはさらには少なくとも20種の核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質に対する特異性を呈するメンバーを含む。特異的な一実施形態では、本明細書に提供されているgNAの収集物は、Cas9タンパク質、ならびにCpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2およびCm5からなる群から選択される別のタンパク質に対する特異性を呈するメンバーを含む。
一部の実施形態では、収集物の複数のgNAメンバーは、標識に付着されるか、標識を含むか、または標識され得る。一部の実施形態では、gNAは、標識にさらに付着されることができる部分を含む。標識は、酵素、酵素基質、抗体、抗原結合性断片、ペプチド、発色団、発光団、フルオロフォア、色素原、ハプテン、抗原、放射性同位元素、磁性粒子、金属ナノ粒子、酸化還元活性マーカー基(酸化還元反応を起こすことができる)、アプタマー、結合ペアの一方のメンバー、FRETペアのメンバー(ドナーまたはアクセプターフルオロフォアのいずれか)およびこれらの組合せを非限定的に含む。
一部の実施形態では、収集物の複数のgNAメンバーは、基材に付着される。基材は、ガラス、プラスチック、シリコン、シリカベースの材料、官能化ポリスチレン、官能化ポリエチレングリコール、官能化有機ポリマー、ニトロセルロースまたはナイロン膜、紙、綿、および合成に適した材料でできていてよい。基材は、平坦である必要はない。一部の実施形態では、基材は、2次元アレイである。一部の実施形態では、2次元アレイは、平坦である。一部の実施形態では、2次元アレイは、平坦でなく、例えば、アレイは、波状アレイである。基材は、球形(例えば、ビーズ)を含む任意の型の形状を含む。基材に付着される材料は、基材の任意の部分に付着されてよい(例えば、多孔性基材材料の内側部分に付着されてよい)。一部の実施形態では、基材は、3次元アレイ、例えば、マイクロスフェアである。一部の実施形態では、マイクロスフェアは、磁性である。一部の実施形態では、マイクロスフェアは、ガラスである。一部の実施形態では、マイクロスフェアは、ポリスチレンでできている。一部の実施形態では、マイクロスフェアは、シリカベースである。一部の実施形態では、基材は、内側表面を有するアレイであり、例えば、ストロー、チューブ、キャピラリー、円柱状またはマイクロ流体チャンバーアレイである。一部の実施形態では、基材は、複数のストロー、キャピラリー、チューブ、シリンダーまたはチャンバーを含む。
gNAをコードする核酸の収集物
gNA(例えば、gRNAまたはgDNA)をコードする核酸の収集物(ライブラリーと互換的に称される)が、本明細書に提供される。一部の実施形態では、コードするとは、gNAが、gNAをコードする核酸の転写に起因することを意味する。一部の実施形態では、コードするとは、核酸が、gNAの転写のための鋳型であることを意味する。
本明細書で使用するように、gNAをコードする核酸の収集物は、少なくとも10個の特異な(unique)核酸を含有する核酸の混合物を意味する。一部の実施形態では、gNAをコードする核酸の収集物は、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも1010個の特異なgNAをコードする核酸を含有する。一部の実施形態では、gNAをコードする核酸の収集物は、総計で少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも10、少なくとも1010個の、gNAをコードする核酸を含有する。
一部の実施形態では、gNAをコードする核酸の収集物は、調節領域を含む第1のセグメントと;標的化配列を含む第2のセグメントと;核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質結合配列をコードする核酸を含む第3のセグメントとを含み、収集物中の核酸の少なくとも10%のサイズが変動する。
一部の実施形態では、第1、第2および第3のセグメントは、5’から3’への順序である。
一部の実施形態では、gNAをコードする核酸は、DNAを含む。一部の実施形態では、第1のセグメントは、一本鎖DNAである。一部の実施形態では、第1のセグメントは、二本鎖DNAである。一部の実施形態では、第2のセグメントは、一本鎖DNAである。一部の実施形態では、第3のセグメントは、一本鎖DNAである。一部の実施形態では、第2のセグメントは、二本鎖DNAである。一部の実施形態では、第3のセグメントは、二本鎖DNAである。
一部の実施形態では、gNAをコードする核酸は、RNAを含む。
一部の実施形態では、gNAをコードする核酸は、DNAおよびRNAを含む。
一部の実施形態では、調節領域は、転写因子に結合することができる領域である。一部の実施形態では、調節領域は、プロモーターを含む。一部の実施形態では、プロモーターは、T7、SP6およびT3からなる群から選択される。
一部の実施形態では、収集物中の第2のセグメント(標的化配列)のサイズは、gNAの収集物にわたって15〜250bp、または30〜100bp、または22〜30bp、または15〜50bp、または15〜75bp、または15〜100bp、または15〜125bp、または15〜150bp、または15〜175bp、または15〜200bp、または15〜225bp、または15〜250bp、または22〜50bp、または22〜75bp、または22〜100bp、または22〜125bp、または22〜150bp、または22〜175bp、または22〜200bp、または22〜225bp、または22〜250bp変動する。
一部の実施形態では、収集物中の第2のセグメントの少なくとも10%、または少なくとも15%、または少なくとも(at last)20%、または少なくとも25%、または少なくとも30%、または少なくとも35%、または少なくとも40%、または少なくとも45%、または少なくとも50%、または少なくとも55%、または少なくとも60%、または少なくとも65%、または少なくとも70%、または少なくとも75%、または少なくとも80%、または少なくとも85%、または少なくとも90%、または少なくとも95%、または100%は、21bpを超える。
一部の実施形態では、収集物中の第2のセグメントの少なくとも10%、または少なくとも15%、または少なくとも(at last)20%、または少なくとも25%、または少なくとも30%、または少なくとも35%、または少なくとも40%、または少なくとも45%、または少なくとも50%、または少なくとも55%、または少なくとも60%、または少なくとも65%、または少なくとも70%、または少なくとも75%、または少なくとも80%、または少なくとも85%、または少なくとも90%、または少なくとも95%、または100%は、25bpを超える。
一部の実施形態では、収集物中の第2のセグメントの少なくとも10%、または少なくとも15%、または少なくとも(at last)20%、または少なくとも25%、または少なくとも30%、または少なくとも35%、または少なくとも40%、または少なくとも45%、または少なくとも50%、または少なくとも55%、または少なくとも60%、または少なくとも65%、または少なくとも70%、または少なくとも75%、または少なくとも80%、または少なくとも85%、または少なくとも90%、または少なくとも95%、または100%は、30bpを超える。
一部の実施形態では、収集物中の第2のセグメントの少なくとも10%、または少なくとも15%、または少なくとも(at last)20%、または少なくとも25%、または少なくとも30%、または少なくとも35%、または少なくとも40%、または少なくとも45%、または少なくとも50%、または少なくとも55%、または少なくとも60%、または少なくとも65%、または少なくとも70%、または少なくとも75%、または少なくとも80%、または少なくとも85%、または少なくとも90%、または少なくとも95%、または100%は、15〜50bpである。
一部の実施形態では、収集物中の第2のセグメントの少なくとも10%、または少なくとも15%、または少なくとも(at last)20%、または少なくとも25%、または少なくとも30%、または少なくとも35%、または少なくとも40%、または少なくとも45%、または少なくとも50%、または少なくとも55%、または少なくとも60%、または少なくとも65%、または少なくとも70%、または少なくとも75%、または少なくとも80%、または少なくとも85%、または少なくとも90%、または少なくとも95%、または100%は、30〜100bpである。
一部の特定の実施形態では、第2のセグメントのサイズは、20bpではない。
一部の特定の実施形態では、第2のセグメントのサイズは、21bpではない。
一部の実施形態では、gNAの収集物中のgNAおよび/またはgNAの標的化配列は、特異な5’端を含む。一部の実施形態では、gNAの収集物は、収集物のメンバーにわたる、標的化配列の5’端の配列に可変性を呈する。一部の実施形態では、gNAの収集物は、収集物のメンバーにわたる、標的化配列の5’端の配列に少なくとも5%または少なくとも10%または少なくとも15%または少なくとも20%または少なくとも25%または少なくとも30%または少なくとも35%または少なくとも40%または少なくとも45%または少なくとも50%または少なくとも55%または少なくとも60%または少なくとも65%または少なくとも70%の可変性または少なくとも75%可変性を呈する。
一部の実施形態では、核酸の収集物は、標的化配列を含み、目的の標的は、目的のゲノムにわたって、少なくとも1bp毎の、少なくとも2bp毎の、少なくとも3bp毎の、少なくとも4bp毎の、少なくとも5bp毎の、少なくとも6bp毎の、少なくとも7bp毎の、少なくとも8bp毎の、少なくとも9bp毎の、少なくとも10bp毎の、少なくとも11bp毎の、少なくとも12bp毎の、少なくとも13bp毎の、少なくとも14bp毎の、少なくとも15bp毎の、少なくとも16bp毎の、少なくとも17bp毎の、少なくとも18bp毎の、少なくとも19bp毎の、20bp、少なくとも25bp毎の、少なくとも30bp毎の、少なくとも40bp毎の、少なくとも50bp毎の、少なくとも100bp毎の、少なくとも200bp毎の、少なくとも300bp毎の、少なくとも400bp毎の、少なくとも500bp毎の、少なくとも600bp毎の、少なくとも700bp毎の、少なくとも800bp毎の、少なくとも900bp毎の、少なくとも1000bp毎の、少なくとも2500bp毎の、少なくとも5000bp毎の、少なくとも10,000bp毎の、少なくとも15,000bp毎の、少なくとも20,000bp毎の、少なくとも25,000bp毎の、少なくとも50,000bp毎の、少なくとも100,000bp毎の、少なくとも250,000bp毎の、少なくとも500,000bp毎の、少なくとも750,000bp毎のまたはさらには少なくとも1,000,000bp毎の間隔にある。
一部の実施形態では、gNAをコードする核酸の収集物は、核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質結合配列をコードする第3のセグメントを含み、収集物中のこのセグメントは、核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)のタンパク質メンバーに対するその特異性が変動する。例えば、本明細書に提供されているgNAをコードする核酸の収集物は、その第3のセグメントが、第1の核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質に特異的な核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質結合配列をコードするメンバーを含むことができ;また、その第3のセグメントが、第2の核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質に特異的な核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質結合配列をコードするメンバーも含み、この場合、第1および第2の核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質は、同じものではない。一部の実施形態では、本明細書に提供されているgNAをコードする核酸の収集物は、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19またはさらには少なくとも20種の核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質に対する特異性を呈するメンバーを含む。特異的な一実施形態では、本明細書に提供されているgNAをコードする核酸の収集物は、Cas9タンパク質、ならびにCpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2およびCm5からなる群から選択される別のタンパク質に対する特異性を呈するメンバーを含む。
目的の配列
濃縮、枯渇、捕捉、分配、標識、調節および編集を非限定的に含む種々の適用のため、試料における目的の配列の標的化に使用することができる、任意の供給源DNA(例えば、ゲノムDNA、cDNA、人工DNA、DNAライブラリー)に由来するgNAおよびgNAの収集物が、本明細書に提供される。gNAは、目的の配列へと向けられた標的化配列を含む。
一部の実施形態では、目的の配列は、ゲノム配列(ゲノムDNA)である。一部の実施形態では、目的の配列は、哺乳動物ゲノム配列である。一部の実施形態では、目的の配列は、真核生物ゲノム配列である。一部の実施形態では、目的の配列は、原核生物ゲノム配列である。一部の実施形態では、目的の配列は、ウイルスゲノム配列である。一部の実施形態では、目的の配列は、細菌ゲノム配列である。一部の実施形態では、目的の配列は、植物ゲノム配列である。一部の実施形態では、目的の配列は、微生物ゲノム配列である。一部の実施形態では、目的の配列は、寄生生物、例えば、真核寄生生物由来のゲノム配列である。一部の実施形態では、目的の配列は、宿主ゲノム配列(例えば、マイクロバイオーム(microbiome)、寄生生物または病原体の宿主生物)である。一部の実施形態では、目的の配列は、豊富なゲノム配列(例えば、試料中の1または複数の最も豊富な種のゲノム由来の配列)である。
一部の実施形態では、目的の配列は、反復性DNAを含む。一部の実施形態では、目的の配列は、豊富なDNAを含む。一部の実施形態では、目的の配列は、ミトコンドリアDNAを含む。一部の実施形態では、目的の配列は、リボソームDNAを含む。一部の実施形態では、目的の配列は、セントロメアDNAを含む。一部の実施形態では、目的の配列は、Aluエレメントを含むDNA(Alu DNA)を含む。一部の実施形態では、目的の配列は、長鎖散在核要素(LINE DNA)を含む。一部の実施形態では、目的の配列は、短鎖散在核要素(SINE DNA)を含む。一部の実施形態では、豊富なDNAは、リボソームDNAを含む。
一部の実施形態では、目的の配列は、一塩基多型(SNP)、短いタンデム反復(STR)、がん遺伝子、挿入、欠失、構造的変種、エクソン、遺伝的突然変異または調節領域を含む。
一部の実施形態では、目的の配列は、ゲノムの領域を含むゲノム断片、または全ゲノムそれ自体であり得る。一実施形態では、ゲノムはDNAゲノムである。別の実施形態では、ゲノムはRNAゲノムである。
一部の実施形態では、目的の配列は、真核生物または原核生物の生物体;哺乳動物の生物体または非哺乳動物の生物体;動物または植物;細菌またはウイルス;動物寄生生物;または病原体からである。
一部の実施形態では、目的の配列は、任意の哺乳動物の生物体からである。一実施形態では、哺乳動物はヒトである。別の実施形態では、哺乳動物は畜産動物、例えばウマ、ヒツジ、ウシ、ブタまたはロバである。別の実施形態では、哺乳動物の生物体は、家庭用ペット、例えばネコ、イヌ、スナネズミ、マウス、ラットである。別の実施形態では、哺乳動物はサルの一種である。
一部の実施形態では、目的の配列は、任意のトリまたは鳥類の生物体からである。鳥類の生物体には、ニワトリ、シチメンチョウ、カモおよびガチョウが限定されずに含まれる。
一部の実施形態では、目的の配列は、植物からである。一実施形態では、植物は、イネ、トウモロコシ、コムギ、バラ、ブドウ、コーヒー、果実、トマト、ジャガイモまたはワタである。
一部の実施形態では、目的の配列は、細菌の種からである。一実施形態では、細菌は、結核を引き起こす細菌である。
一部の実施形態では、目的の配列は、ウイルスからである。
一部の実施形態では、目的の配列は、真菌類の種からである。
一部の実施形態では、目的の配列は、藻類の種からである。
一部の実施形態では、目的の配列は、任意の哺乳動物寄生生物からである。
一部の実施形態では、目的の配列は、任意の哺乳動物寄生生物から得られる。一実施形態では、寄生生物は虫である。別の実施形態では、寄生生物は、マラリアを引き起こす寄生生物である。別の実施形態では、寄生生物は、リーシュマニア症を引き起こす寄生生物である。別の実施形態では、寄生生物はアメーバである。
一部の実施形態では、目的の配列は、病原体からである。
標的化配列
本明細書で使用するように、標的化配列は、gNAを試料中の目的の配列に向ける配列である。例えば、標的化配列は、特定の目的の配列を標的とし、例えば、標的化配列は、目的のゲノム配列を標的とする。
標的化配列を含むセグメントを含むgNAおよびgNAの収集物が、本明細書に提供される。標的化配列をコードするセグメントを含むgNAをコードする核酸およびgNAをコードする核酸の収集物も、本明細書に提供される。
一部の実施形態では、標的化配列は、DNAを含む。
一部の実施形態では、標的化配列は、RNAを含む。
一部の実施形態では、標的化配列は、RNAを含み、RNAが、チミンの代わりにウラシルを含むことを除いて、目的の配列におけるPAM配列に対し5’にある配列に対し、少なくとも70%配列同一性、少なくとも75%配列同一性、少なくとも80%配列同一性、少なくとも85%配列同一性、少なくとも90%配列同一性、少なくとも95%配列同一性を共有する、または100%配列同一性を共有する。一部の実施形態では、PAM配列は、AGG、CGGまたはTGGである。
一部の実施形態では、標的化配列は、DNAを含み、目的の配列におけるPAM配列に対し5’にある配列に対し、少なくとも70%配列同一性、少なくとも75%配列同一性、少なくとも80%配列同一性、少なくとも85%配列同一性、少なくとも90%配列同一性、少なくとも95%配列同一性を共有する、または100%配列同一性を共有する。
一部の実施形態では、標的化配列は、RNAを含み、PAM配列に対し5’にあるヌクレオチドの配列の反対の鎖に対し相補的である。一部の実施形態では、標的化配列は、PAM配列に対し5’にあるヌクレオチドの配列の反対の鎖に対し、少なくとも70%相補的、少なくとも75%相補的、少なくとも80%相補的、少なくとも85%相補的、少なくとも90%相補的、少なくとも95%相補的である、または100%相補的である。一部の実施形態では、PAM配列は、AGG、CGGまたはTGGである。
一部の実施形態では、標的化配列は、DNAを含み、PAM配列に対し5’にあるヌクレオチドの配列の反対の鎖に対し相補的である。一部の実施形態では、標的化配列は、PAM配列に対し5’にあるヌクレオチドの配列の反対の鎖に対し、少なくとも70%相補的、少なくとも75%相補的、少なくとも80%相補的、少なくとも85%相補的、少なくとも90%相補的、少なくとも95%相補的である、または100%相補的である。一部の実施形態では、PAM配列は、AGG、CGGまたはTGGである。
一部の実施形態では、gRNAの標的化配列をコードするDNAは、PAM配列に対し5’にあるヌクレオチドの配列の反対の鎖に対し、少なくとも70%配列同一性、少なくとも75%配列同一性、少なくとも80%配列同一性、少なくとも85%配列同一性、少なくとも90%配列同一性、少なくとも95%配列同一性を共有する、または100%配列同一性を共有する。一部の実施形態では、PAM配列は、AGG、CGGまたはTGGである。
一部の実施形態では、gRNAの標的化配列をコードするDNAは、PAM配列に対し5’にあるヌクレオチドの配列の反対の鎖に対し相補的であり、目的の配列におけるPAM配列に対し5’にある配列に対し、少なくとも70%相補的、少なくとも75%相補的、少なくとも80%相補的、少なくとも85%相補的、少なくとも90%相補的、少なくとも95%相補的である、または100%相補的である。一部の実施形態では、PAM配列は、AGG、CGGまたはTGGである。
核酸ガイド化ヌクレアーゼ系タンパク質
核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質結合配列を含むセグメントを含む、gNAおよびgNAの収集物が、本明細書に提供される。核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質結合配列をコードするセグメントを含む、gNAをコードする核酸およびgNAをコードする核酸の収集物も、本明細書に提供される。核酸ガイド化ヌクレアーゼ系は、RNAガイド化ヌクレアーゼ系であってよい。核酸ガイド化ヌクレアーゼ系は、DNAガイド化ヌクレアーゼ系であってよい。
本開示の方法は、核酸ガイド化ヌクレアーゼを利用し得る。本明細書で使用する場合、「核酸ガイド化ヌクレアーゼ」は、DNA、RNAまたはDNA/RNAハイブリッドを切断し、特異性を付与するために1つまたは複数の核酸ガイド核酸(gNA)を使用する任意のヌクレアーゼである。核酸ガイド化ヌクレアーゼには、CRISPR/Cas系タンパク質ならびに非CRISPR/Cas系タンパク質が含まれる。
本明細書で提供される核酸ガイド化ヌクレアーゼは、DNAによって誘導されるDNAヌクレアーゼ;DNAによって誘導されるRNAヌクレアーゼ;RNAによって誘導されるDNAヌクレアーゼ;またはRNAによって誘導されるRNAヌクレアーゼであってよい。ヌクレアーゼはエンドヌクレアーゼであり得る。ヌクレアーゼは、エキソヌクレアーゼであり得る。一実施形態では、核酸ガイド化ヌクレアーゼは、核酸ガイド化DNAエンドヌクレアーゼである。一実施形態では、核酸ガイド化ヌクレアーゼは、核酸ガイド化RNAエンドヌクレアーゼである。
核酸ガイド化ヌクレアーゼ系タンパク質結合配列は、核酸ガイド化ヌクレアーゼ系の任意のタンパク質メンバーに結合する核酸配列である。例えば、CRISPR/Cas系タンパク質結合配列は、CRISPR/Cas系の任意のタンパク質メンバーに結合する核酸配列である。
一部の実施形態では、核酸ガイド化ヌクレアーゼは、CASクラスI I型、CASクラスI III型、CASクラスI IV型、CASクラスII II型およびCASクラスII V型からなる群から選択される。一部の実施形態では、CRISPR/Cas系タンパク質は、CRISPR I型系、CRISPR II型系およびCRISPR III型系由来のタンパク質を含む。一部の実施形態では、核酸ガイド化ヌクレアーゼは、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、Cm5、Csf1、C2c2およびNgAgoからなる群から選択される。
一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質(例えば、CRISPR/Cas系タンパク質)は、任意の細菌または古細菌種由来であってよい。
一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質(例えば、CRISPR/Cas系タンパク質)は、Streptococcus pyogenes、Staphylococcus aureus、Neisseria meningitidis、Streptococcus thermophiles、Treponema denticola、Francisella tularensis、Pasteurella multocida、Campylobacter jejuni、Campylobacter lari、Mycoplasma gallisepticum、Nitratifractor salsuginis、Parvibaculum lavamentivorans、Roseburia intestinalis、Neisseria cinerea、Gluconacetobacter diazotrophicus、Azospirillum、Sphaerochaeta globus、Flavobacterium columnare、Fluviicola taffensis、Bacteroides coprophilus、Mycoplasma mobile、Lactobacillus farciminis、Streptococcus pasteurianus、Lactobacillus johnsonii、Staphylococcus pseudintermedius、Filifactor alocis、Legionella pneumophila、Suterella wadsworthensisまたはCorynebacter diphtheria由来の核酸ガイド化ヌクレアーゼ系タンパク質(例えば、CRISPR/Cas系タンパク質)由来であるまたはこれに由来する。
一部の実施形態では、核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質の例は、天然に存在するまたは操作されたバージョンであってよい。
一部の実施形態では、天然に存在する核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質は、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2およびCm5を含む。斯かるタンパク質の操作されたバージョンを用いることもできる。
一部の実施形態では、核酸ガイド化ヌクレアーゼ系(例えば、CRISPR/Cas系)タンパク質の操作された例は、触媒活性がない核酸ガイド化ヌクレアーゼ系タンパク質を含む。用語「触媒活性がない」は一般に、失活したヌクレアーゼ(例えば、HNHおよびRuvCヌクレアーゼ)を有する核酸ガイド化ヌクレアーゼ系タンパク質を指す。斯かるタンパク質は、任意の核酸における標的部位に結合することができる(標的部位が、ガイドNAによって決定される場合)が、このタンパク質は、標的核酸(例えば、二本鎖DNA)を切断するまたはこれにニックを入れることができない。一部の実施形態では、核酸ガイド化ヌクレアーゼ系の触媒活性がないタンパク質は、触媒活性がないCas9(dCas9)等、触媒活性がないCRISPR/Cas系タンパク質である。したがって、dCas9は、混合物を非結合核酸およびdCas9結合断片へと分離することを可能にする。一実施形態では、dCas9/gRNA複合体は、gRNA配列によって決定される標的に結合する。結合したdCas9は、他のマニピュレーションを進める間、Cas9による切断を防止することができる。別の実施形態では、dCas9は、トランスポサーゼ等、別の酵素に融合して、該酵素の活性を特異的部位へと標的化することができる。天然に存在する触媒活性がない核酸ガイド化ヌクレアーゼ系タンパク質を用いることもできる。
一部の実施形態では、核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質の操作された例は、核酸ガイド化ニッカーゼ(例えば、Casニッカーゼ)も含む。核酸ガイド化ニッカーゼは、単一の不活性触媒ドメインを含有する、核酸ガイド化ヌクレアーゼ系タンパク質の改変バージョンを指す。一実施形態では、核酸ガイド化ニッカーゼは、Cas9ニッカーゼ等、Casニッカーゼである。Cas9ニッカーゼは、単一の不活性触媒ドメイン、例えば、RuvC−またはHNH−ドメインのいずれかを含有することができる。1個のみの活性ヌクレアーゼドメインにより、Cas9ニッカーゼは、標的DNAの一方の鎖のみを切断し、一本鎖切断または「ニック」を作製する。どちらの突然変異体が使用されるかに応じて、ガイドNAハイブリダイズ鎖または非ハイブリダイズ鎖を切断することができる。反対の鎖を標的とする2個のgNAに結合した核酸ガイド化ニッカーゼは、標的二本鎖DNAに二本鎖切断を作製するであろう。この「二重ニッカーゼ」戦略は、両方の核酸ガイド化ヌクレアーゼ/gNA(例えば、Cas9/gRNA)複合体が、二本鎖切断が形成される前に、部位に特異的に結合することを必要とするため、切断の特異性を増加させることができる。天然に存在するニッカーゼ核酸ガイド化ヌクレアーゼ系タンパク質を用いることもできる。
一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質の操作された例は、核酸ガイド化ヌクレアーゼ系融合タンパク質も含む。例えば、核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質は、別のタンパク質、例えば、活性化因子、リプレッサー、ヌクレアーゼ、蛍光分子、放射性タグまたはトランスポサーゼに融合されてよい。
一部の実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質結合配列は、gNA(例えば、gRNA)ステムループ配列を含む。
一部の実施形態では、gNA(例えば、gRNA)ステムループ配列をコードする二本鎖DNA配列は、一方の鎖に次のDNA配列(5’>3’、GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT)(配列番号3)を、他方の鎖にその逆相補的DNA(5’>3’、AAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC)(配列番号4)を含む。
一部の実施形態では、gNA(例えば、gRNA)ステムループ配列をコードする一本鎖DNA配列は、次のDNA配列:(5’>3’、AAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC)(配列番号4)を含み、この一本鎖DNAは、転写鋳型として働く。
一部の実施形態では、gNA(例えば、gRNA)ステムループ配列は、次のRNA配列:(5’>3’、GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU)(配列番号1)を含む。
一部の実施形態では、gNA(例えば、gRNA)ステムループ配列をコードする二本鎖DNA配列は、一方の鎖に次のDNA配列(5’>3’、GTTTTAGAGCTATGCTGGAAACAGCATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTC)(配列番号5)を、他方の鎖にその逆相補的DNA(5’>3’、GAAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATGCTGTTTCCAGCATAGCTCTAAAAC)(配列番号6)を含む。
一部の実施形態では、gNA(例えば、gRNA)ステムループ配列をコードする一本鎖DNA配列は、次のDNA配列:(5’>3’、GAAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATGCTGTTTCCAGCATAGCTCTAAAAC)(配列番号6)を含み、この一本鎖DNAは、転写鋳型として働く。
一部の実施形態では、gNA(例えば、gRNA)ステムループ配列は、次のRNA配列:(5’>3’、GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC)(配列番号2)を含む。
一部の実施形態では、調節領域を含む第1のセグメントと;標的化配列をコードする第2のセグメントと;核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質結合配列をコードする核酸を含む第3のセグメントとを含むgNA(例えば、gRNA)をコードする核酸が、本明細書に提供されている。一部の実施形態では、第3のセグメントは、転写後に、NA(例えば、RNA)ステムループ配列を生じる、単一の転写構成成分を含む。一部の実施形態では、gNA(例えば、gRNA)ステムループ配列をコードする単一の転写構成成分を含む第3のセグメントは、二本鎖であり、一方の鎖に次のDNA配列(5’>3’、GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT)(配列番号3)を、他方の鎖にその逆相補的DNA(5’>3’、AAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC)(配列番号4)を含む。一部の実施形態では、gNA(例えば、gRNA)ステムループ配列をコードする単一の転写構成成分を含む第3のセグメントは、一本鎖であり、次のDNA配列:(5’>3’、AAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC)(配列番号4)を含み、この一本鎖DNAは、転写鋳型として働く。一部の実施形態では、単一の転写構成成分からの転写後に、その結果生じるgNA(例えば、gRNA)ステムループ配列は、次のRNA配列:(5’>3’、GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU)(配列番号1)を含む。一部の実施形態では、gNA(例えば、gRNA)ステムループ配列をコードする単一の転写構成成分を含む第3のセグメントは、二本鎖であり、一方の鎖に次のDNA配列(5’>3’、GTTTTAGAGCTATGCTGGAAACAGCATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTC)(配列番号5)を、他方の鎖にその逆相補的DNA(5’>3’、GAAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATGCTGTTTCCAGCATAGCTCTAAAAC)(配列番号6)を含む。一部の実施形態では、gNA(例えば、gRNA)ステムループ配列をコードする単一の転写構成成分を含む第3のセグメントは、一本鎖であり、次のDNA配列:(5’>3’、GAAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATGCTGTTTCCAGCATAGCTCTAAAAC)(配列番号6)を含み、この一本鎖DNAは、転写鋳型として働く。一部の実施形態では、単一の転写構成成分からの転写後に、生じたgRNAステムループ配列は、次のRNA配列:(5’>3’、GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC)(配列番号2)を含む。一部の実施形態では、第3のセグメントは、転写後のcrRNAおよびtracrRNAをコードする2個のサブセグメントを含む。一部の実施形態では、crRNAは、N20、およびtracrRNAとハイブリダイズすることができる余分な配列を含まない。一部の実施形態では、crRNAは、tracrRNAとハイブリダイズすることができる余分な配列を含む。一部の実施形態では、2個のサブセグメントは、独立して転写される。一部の実施形態では、2個のサブセグメントは、単一の単位として転写される。一部の実施形態では、crRNAをコードするDNAは、N標的GTTTTAGAGCTATGCTGTTTTG(配列番号7)を含み、式中、N標的は、標的化配列を表す。一部の実施形態では、tracrRNAをコードするDNAは、配列、GGAACCATTCAAAACAGCATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT(配列番号8)を含む。
一部の実施形態では、調節領域を含む第1のセグメントと;標的化配列をコードする第2のセグメントと;核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質結合配列をコードする核酸を含む第3のセグメントとを含むgNA(例えば、gRNA)をコードする核酸が、本明細書に提供されている。一部の実施形態では、第3のセグメントは、転写後に、核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質に結合することができるgRNAステムループ配列を生じるDNA配列を含む。一実施形態では、DNA配列は、二本鎖であってよい。一部の実施形態では、第3のセグメント二本鎖DNAは、一方の鎖に次のDNA配列(5’>3’、GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT)(配列番号3)を、他方の鎖にその逆相補的DNA(5’>3’、AAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC)(配列番号4)を含む。一部の実施形態では、第3のセグメント二本鎖DNAは、一方の鎖に次のDNA配列(5’>3’、GTTTTAGAGCTATGCTGGAAACAGCATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTC)(配列番号5)を、他方の鎖にその逆相補的DNA(5’>3’、GAAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATGCTGTTTCCAGCATAGCTCTAAAAC)(配列番号6)を含む。一実施形態では、DNA配列は、一本鎖であってよい。一部の実施形態では、第3のセグメント一本鎖DNAは、次のDNA配列(5’>3’、AAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC)(配列番号4)を含み、この一本鎖DNAは、転写鋳型として働く。一部の実施形態では、第3のセグメント一本鎖DNAは、次のDNA配列(5’>3’、GAAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATGCTGTTTCCAGCATAGCTCTAAAAC)(配列番号6)を含み、この一本鎖DNAは、転写鋳型として働く。一部の実施形態では、第3のセグメントは、転写後に、第2のRNA配列とハイブリッドを形成することができる第1のRNA配列を生じるDNA配列を含み、このハイブリッドは、CRISPR/Cas系タンパク質結合が可能である。一部の実施形態では、第3のセグメントは、一方の鎖にDNA配列:(5’>3’、GTTTTAGAGCTATGCTGTTTTG)(配列番号9)を、他方の鎖にその逆相補的DNA配列:(5’>3’、CAAAACAGCATAGCTCTAAAAC)(配列番号10)を含む二本鎖DNAである。一部の実施形態では、第3のセグメントは、(5’>3’、CAAAACAGCATAGCTCTAAAAC)(配列番号10)のDNA配列を含む一本鎖DNAである。一部の実施形態では、第2のセグメントおよび第3のセグメントは共に、crRNA配列をコードする。一部の実施形態では、gRNAをコードする核酸の第3のセグメントによってコードされる第1のRNA配列とハイブリッドを形成することができる第2のRNA配列は、tracrRNAである。一部の実施形態では、tracrRNAは、配列(5’>3’、GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU)(配列番号11)を含む。一部の実施形態では、tracrRNAは、(5’>3’、GGAACCATTCAAAACAGCATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT)(配列番号8)の配列を含む二本鎖DNAによってコードされ、任意選択で、その5’端において調節配列と融合される。一部の実施形態では、調節配列は、転写因子が結合し得る。一部の実施形態では、調節配列は、プロモーターである。一部の実施形態では、調節配列は、(5’>3’、GCCTCGAGCTAATACGACTCACTATAGAG)(配列番号12)の配列を含むT7プロモーターである。
一部の実施形態では、調節領域を含む第1のセグメントと;標的化配列をコードする第2のセグメントと;核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質結合配列をコードする核酸を含む第3のセグメントとを含むgNAをコードする核酸が、本明細書に提供されている。一部の実施形態では、第3のセグメントは、転写後切断後に、第1のRNAセグメントおよび第2のRNAセグメントを生じる、RNA配列をコードする。一部の実施形態では、第1のRNAセグメントは、crRNAを含み、第2のRNAセグメントは、tracrRNAを含み、これらは、ハイブリッドを形成し、共に、核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質結合をもたらすことができる。一部の実施形態では、第3のセグメントは、第1のRNAセグメントおよび第2のRNAセグメントの転写単位の間にスペーサーをさらに含み、このスペーサーは、酵素切断部位を含む。
一部の実施形態では、標的化配列を含む第1のNAセグメントと、核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質結合配列を含む第2のNAセグメントとを含むgNA(例えば、gRNA)が、本明細書に提供されている。一部の実施形態では、第1のセグメントのサイズは、30bpを超える。一部の実施形態では、第2のセグメントは、gRNAステムループ配列を含む単一のセグメントを含む。一部の実施形態では、gRNAステムループ配列は、次のRNA配列:(5’>3’、GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU)(配列番号1)を含む。一部の実施形態では、gRNAステムループ配列は、次のRNA配列:(5’>3’、GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC)(配列番号2)を含む。一部の実施形態では、第2のセグメントは、2個のサブセグメントを含み、第1のRNAサブセグメント(crRNA)は第2のRNAサブセグメント(tracrRNA)とハイブリッドを形成し、これらは共に、核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質結合を向けるように作用する。一部の実施形態では、第2のサブセグメントの配列は、GUUUUAGAGCUAUGCUGUUUUGを含む。一部の実施形態では、第1のRNAセグメントおよび第2のRNAセグメントは共に、crRNA配列を形成する。一部の実施形態では、第2のRNAセグメントとハイブリッドを形成するであろう他のRNAは、tracrRNAである。一部の実施形態では、tracrRNAは、5’>3’、GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号11)の配列を含む。
CRISPR/Cas系核酸ガイド化ヌクレアーゼ
一部の実施形態では、CRISPR/Cas系タンパク質が、本明細書に提供されている実施形態において使用される。一部の実施形態では、CRISPR/Cas系タンパク質は、CRISPR I型系、CRISPR II型系およびCRISPR III型系由来のタンパク質を含む。
一部の実施形態では、CRISPR/Cas系タンパク質は、任意の細菌または古細菌種に由来し得る。
一部の実施形態では、CRISPR/Cas系タンパク質は、単離される、組換えにより産生されるか、または合成による。
一部の実施形態では、CRISPR/Cas系タンパク質は、Streptococcus pyogenes、Staphylococcus aureus、Neisseria meningitidis、Streptococcus thermophiles、Treponema denticola、Francisella tularensis、Pasteurella multocida、Campylobacter jejuni、Campylobacter lari、Mycoplasma gallisepticum、Nitratifractor salsuginis、Parvibaculum lavamentivorans、Roseburia intestinalis、Neisseria cinerea、Gluconacetobacter diazotrophicus、Azospirillum、Sphaerochaeta globus、Flavobacterium columnare、Fluviicola taffensis、Bacteroides coprophilus、Mycoplasma mobile、Lactobacillus farciminis、Streptococcus pasteurianus、Lactobacillus johnsonii、Staphylococcus pseudintermedius、Filifactor alocis、Legionella pneumophila、Suterella wadsworthensisまたはCorynebacter diphtheriaからであるか、またはこれらに由来するCRISPR/Cas系タンパク質に由来する。
一部の実施形態では、CRISPR/Cas系タンパク質の例は、天然に存在し得るか、または操作されたバージョンであってよい。
一部の実施形態では、天然に存在するCRISPR/Cas系タンパク質は、CASクラスIタイプI、IIIもしくはIV、またはCASクラスIIタイプIIもしくはVに属することができ、Cas9、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、Cmr5、Csf1、C2c2およびCpf1を含むことができる。
例示的な実施形態では、CRISPR/Cas系タンパク質は、Cas9を含む。
「CRISPR/Cas系タンパク質−gNA複合体」は、CRISPR/Cas系タンパク質およびガイドNA(例えば、gRNAまたはgDNA)を含む複合体を指す。gNAがgRNAである場合、gRNAは2つの分子、すなわち標的とハイブリダイズし、配列特異性を提供する1つのRNA(「crRNA」)、およびcrRNAとハイブリダイズすることが可能である1つのRNA「tracrRNA」で構成することができる。あるいは、ガイドRNAは、crRNAおよびtracrRNA配列を含有する単一の分子(すなわち、gRNA)であってよい。
CRISPR/Cas系タンパク質は、野生型CRISPR/Cas系タンパク質と少なくとも60%同一(例えば、少なくとも70%、少なくとも80%または90%同一、少なくとも95%同一または少なくとも98%同一、または少なくとも99%同一)であってよい。CRISPR/Cas系タンパク質は、野生型CRISPR/Cas系タンパク質の全ての機能、または、結合活性、ヌクレアーゼ活性およびヌクレアーゼ活性を含む機能のうち1つもしくは一部だけを有することができる。
用語「CRISPR/Cas系タンパク質関連ガイドNA」は、ガイドNAを指す。CRISPR/Cas系タンパク質関連ガイドNAは、単離されたNAとして、またはCRISPR/Cas系タンパク質−gNA複合体の一部として存在することができる。
Cas9
一部の実施形態では、CRISPR/Cas系タンパク質、核酸ガイド化ヌクレアーゼは、Cas9であるかまたはそれを含む。本発明のCas9は、単離されるか、組換えで生成されるか、または合成のものであってよい。
本明細書の実施形態において使用することができるCas9タンパク質の例は、F.A. Ran、L. Cong、W.X. Yan、D. A. Scott、J.S. Gootenberg、A.J. Kriz、B. Zetsche、O. Shalem、X. Wu、K.S. Makarova、E.V. Koonin、P.A. SharpおよびF. Zhang;「In vivo genome editing using Staphylococcus aureus Cas9」、Nature520巻、186〜191頁(2015年4月9日)doi:10.1038/nature14299、に見出すことができ、それは参照により本明細書に組み込まれる。
一部の実施形態では、Cas9は、Streptococcus pyogenes、Staphylococcus aureus、Neisseria meningitidis、Streptococcus thermophiles、Treponema denticola、Francisella tularensis、Pasteurella multocida、Campylobacter jejuni、Campylobacter lari、Mycoplasma gallisepticum、Nitratifractor salsuginis、Parvibaculum lavamentivorans、Roseburia intestinalis、Neisseria cinerea、Gluconacetobacter diazotrophicus、Azospirillum、Sphaerochaeta globus、Flavobacterium columnare、Fluviicola taffensis、Bacteroides coprophilus、Mycoplasma mobile、Lactobacillus farciminis、Streptococcus pasteurianus、Lactobacillus johnsonii、Staphylococcus pseudintermedius、Filifactor alocis、Legionella pneumophila、Suterella wadsworthensisまたはCorynebacter diphtheriaに由来するII型CRISPR系である。
一部の実施形態では、Cas9は、S.pyogenesに由来するII型CRISPR系であり、PAM配列は、標的特異的ガイド配列の3’末端に直に位置するNGGである。例示的な細菌種からのII型CRISPR系のPAM配列は、以下を含むこともできる:Streptococcus pyogenes(NGG)、Staph aureus(NNGRRT)、Neisseria meningitidis(NNNNGA
TT)、Streptococcus thermophilus(NNAGAA)およびTreponema denticola(NAAAAC)、これらは全て本発明から逸脱することなく使用可能である。
例示的な一実施形態では、Cas9配列は、例えば、細菌で発現させ、組換え6Hisタグ付きタンパク質を精製するために、PCRによって再増幅され、次にpET30(EMD biosciencesから)にクローニングされる、pX330プラスミド(Addgeneから入手可能)から得ることができる。
「Cas9−gNA複合体」は、Cas9タンパク質およびガイドNAを含む複合体を指す。Cas9タンパク質は、野生型Cas9タンパク質と、例えばStreptococcus pyogenesのCas9タンパク質と少なくとも60%同一(例えば、少なくとも70%、少なくとも80%、または90%同一、少なくとも95%同一、または少なくとも98%同一、または少なくとも99%同一)であってよい。Cas9タンパク質は、野生型Cas9タンパク質の全ての機能、または、結合活性、ヌクレアーゼ活性およびヌクレアーゼ活性を含む機能のうち1つもしくは一部だけを有することができる。
用語「Cas9関連ガイドNA」は、前記のようなガイドNAを指す。Cas9関連ガイドNAは、単離されて、またはCas9−gNA複合体の一部として存在することができる。
非CRISPR/Cas系の核酸ガイド化ヌクレアーゼ
一部の実施形態では、非CRISPR/Cas系タンパク質が、本明細書で提供される実施形態で使用される。
一部の実施形態では、非CRISPR/Cas系タンパク質は、任意の細菌または古細菌種からのものであってよい。
一部の実施形態では、非CRISPR/Cas系タンパク質は、単離されるか、組換えで生成されるか、または合成のものである。
一部の実施形態では、非CRISPR/Cas系タンパク質は、Aquifex aeolicus、Thermus thermophilus、Streptococcus pyogenes、Staphylococcus aureus、Neisseria meningitidis、Streptococcus thermophiles、Treponema denticola、Francisella tularensis、Pasteurella multocida、Campylobacter jejuni、Campylobacter lari、Mycoplasma gallisepticum、Nitratifractor salsuginis、Parvibaculum lavamentivorans、Roseburia intestinalis、Neisseria cinerea、Gluconacetobacter diazotrophicus、Azospirillum、Sphaerochaeta globus、Flavobacterium columnare、Fluviicola taffensis、Bacteroides coprophilus、Mycoplasma mobile、Lactobacillus farciminis、Streptococcus pasteurianus、Lactobacillus johnsonii、Staphylococcus pseudintermedius、Filifactor alocis、Legionella pneumophila、Suterella wadsworthensis、Natronobacterium gregoryiまたはCorynebacter diphtheriaからのものであるかまたはそれに由来する。
一部の実施形態では、非CRISPR/Cas系タンパク質は、天然に存在するものまたは操作されたバージョンであってよい。
一部の実施形態では、天然に存在する非CRISPR/Cas系タンパク質は、NgAgo(Natronobacterium gregoryiからのアルゴノート)である。
「非CRISPR/Cas系タンパク質−gNA複合体」は、非CRISPR/Cas系タンパク質およびガイドNA(例えば、gRNAまたはgDNA)を含む複合体を指す。gNAがgRNAである場合、gRNAは2つの分子、すなわち標的とハイブリダイズし、配列特異性を提供する1つのRNA(「crRNA」)、およびcrRNAとハイブリダイズすることが可能である1つのRNA「tracrRNA」で構成することができる。あるいは、ガイドRNAは、crRNAおよびtracrRNA配列を含有する単一の分子(すなわち、gRNA)であってよい。
非CRISPR/Cas系タンパク質は、野生型非CRISPR/Cas系タンパク質と少なくとも60%同一(例えば、少なくとも70%、少なくとも80%、または90%同一、少なくとも95%同一、または少なくとも98%同一、または少なくとも99%同一)であってよい。非CRISPR/Cas系タンパク質は、野生型非CRISPR/Cas系タンパク質の全ての機能、または、結合活性、ヌクレアーゼ活性およびヌクレアーゼ活性を含む機能のうち1つもしくは一部だけを有することができる。
用語「非CRISPR/Cas系タンパク質関連ガイドNA」は、ガイドNAを指す。非CRISPR/Cas系タンパク質関連ガイドNAは、単離されたNAとして、または非CRISPR/Cas系タンパク質−gNA複合体の一部として存在することができる。
触媒活性がない核酸ガイド化ヌクレアーゼ
一部の実施形態では、核酸ガイド化ヌクレアーゼの操作された例には、触媒活性がない核酸ガイド化ヌクレアーゼ(CRISPR/Cas系の核酸ガイド化ヌクレアーゼまたは非CRISPR/Cas系の核酸ガイド化ヌクレアーゼ)が含まれる。用語「触媒活性がない」は、不活性化ヌクレアーゼ、例えば、不活性化HNHおよびRuvCヌクレアーゼを有する核酸ガイド化ヌクレアーゼを一般的に指す。そのようなタンパク質は任意の核酸中の標的部位に結合することができるが(標的部位はガイドNAによって決定される)、タンパク質は核酸を切断することもニックを入れることもできない。
したがって、触媒活性がない核酸ガイド化ヌクレアーゼは、未結合の核酸および触媒活性がない核酸ガイド化ヌクレアーゼに結合した断片への混合物の分離を可能にする。例示的な一実施形態では、dCas9/gRNA複合体はgRNA配列によって決定される標的に結合する。dCas9結合はCas9による切断を阻止できるが、他の操作は進行する。
別の実施形態では、触媒活性がない核酸ガイド化ヌクレアーゼは、トランスポザーゼなどの別の酵素に融合させて、その酵素の活性を特異的部位に標的化させることができる。
一部の実施形態では、触媒活性がない核酸ガイド化ヌクレアーゼは、dCas9、dCpf1、dCas3、dCas8a〜c、dCas10、dCse1、dCsy1、dCsn2、dCas4、dCsm2、dCm5、dCsf1、dC2C2またはdNgAgoである。
例示的な一実施形態では、触媒活性がない核酸ガイド化ヌクレアーゼタンパク質は、dCas9である。
核酸ガイド化ヌクレアーゼであるニッカーゼ
一部の実施形態では、核酸ガイド化ヌクレアーゼの操作された例には、核酸ガイド化ヌクレアーゼであるニッカーゼ(ニッカーゼ−核酸ガイド化ヌクレアーゼと互換的に呼ばれる)が含まれる。
一部の実施形態では、核酸ガイド化ヌクレアーゼの操作された例には、単一の不活性触媒ドメインを含有する、CRISPR/Cas系ニッカーゼまたは非CRISPR/Cas系ニッカーゼが含まれる。
一部の実施形態では、核酸ガイド化ヌクレアーゼであるニッカーゼは、Cas9ニッカーゼ、Cpf1ニッカーゼ、Cas3ニッカーゼ、Cas8a〜cニッカーゼ、Cas10ニッカーゼ、Cse1ニッカーゼ、Csy1ニッカーゼ、Csn2ニッカーゼ、Cas4ニッカーゼ、Csm2ニッカーゼ、Cm5ニッカーゼ、Csf1ニッカーゼ、C2C2ニッカーゼまたはNgAgoニッカーゼである。
一実施形態では、核酸ガイド化ヌクレアーゼであるニッカーゼは、Cas9ニッカーゼである。
一部の実施形態では、核酸ガイド化ヌクレアーゼであるニッカーゼは、標的配列に結合するために使用することができる。1つの活性ヌクレアーゼドメインだけのため、核酸ガイド化ヌクレアーゼであるニッカーゼは、標的DNAの1本の鎖だけを切断し、一本鎖切断または「ニック」を生成する。どの変異体が使用されるかによって、ガイドNAとハイブリダイズした鎖またはハイブリダイズしていない鎖を切断することができる。反対側の鎖を標的にする2つのgNAに結合した核酸ガイド化ヌクレアーゼであるニッカーゼは、核酸において二本鎖切断を起こすことができる。この「二重ニッカーゼ」戦略は、両方の核酸ガイド化ヌクレアーゼ/gNA複合体が、二本鎖切断が形成される前の部位で特異的に結合することを必要とするので、切断特異性を増加させる。
例示的な実施形態では、Cas9ニッカーゼは、標的配列に結合するために使用することができる。用語「Cas9ニッカーゼ」は、単一の不活性触媒ドメイン、すなわち、RuvC−またはHNH−ドメインを含有する、Cas9タンパク質の改変バージョンを指す。1つの活性ヌクレアーゼドメインだけのため、Cas9ニッカーゼは、標的DNAの1本の鎖だけを切断し、一本鎖切断または「ニック」を生成する。どの変異体が使用されるかによって、ガイドRNAとハイブリダイズした鎖またはハイブリダイズしていない鎖を切断することができる。反対側の鎖を標的にする2つのgRNAに結合したCas9ニッカーゼは、DNAにおいて二本鎖切断を起こす。この「二重ニッカーゼ」戦略は、両方のCas9/gRNA複合体が、二本鎖切断が形成される前の部位で特異的に結合することを必要とするので、切断特異性を増加することができる。
DNAの捕捉は、核酸ガイド化ヌクレアーゼであるニッカーゼを使用して実行することができる。例示的な一実施形態では、核酸ガイド化ヌクレアーゼであるニッカーゼは二本鎖核酸の1本の鎖を切断し、二本鎖の領域はメチル化ヌクレオチドを含む。
解離可能および耐熱性の核酸ガイド化ヌクレアーゼ
一部の実施形態では、耐熱性の核酸ガイド化ヌクレアーゼが本明細書で提供される方法で使用される(耐熱性のCRISPR/Cas系の核酸ガイド化ヌクレアーゼまたは耐熱性の非CRISPR/Cas系の核酸ガイド化ヌクレアーゼ)。そのような実施形態では、反応温度が上昇し、タンパク質の解離を誘導する。反応温度は低下し、さらなる切断された標的配列の生成を可能にする。一部の実施形態では、少なくとも75℃で少なくとも1分の間維持されるとき、耐熱性の核酸ガイド化ヌクレアーゼは、少なくとも50%の活性、少なくとも55%の活性、少なくとも60%の活性、少なくとも65%の活性、少なくとも70%の活性、少なくとも75%の活性、少なくとも80%の活性、少なくとも85%の活性、少なくとも90%の活性、少なくとも95%の活性、少なくとも96%の活性、少なくとも97%の活性、少なくとも98%の活性、少なくとも99%の活性または100%の活性を維持する。一部の実施形態では、耐熱性の核酸ガイド化ヌクレアーゼは、少なくとも75℃で、少なくとも80℃で、少なくとも85℃で、少なくとも90℃で、少なくとも91℃で、少なくとも92℃で、少なくとも93℃で、少なくとも94℃で、少なくとも95℃、96℃で、少なくとも97℃で、少なくとも98℃で、少なくとも99℃で、または少なくとも100℃で少なくとも1分の間維持されるとき、少なくとも50%の活性を維持する。一部の実施形態では、耐熱性の核酸ガイド化ヌクレアーゼは、少なくとも75℃で少なくとも1分、2分、3分、4分または5分の間維持されるとき、少なくとも50%の活性を維持する。一部の実施形態では、耐熱性の核酸ガイド化ヌクレアーゼは、温度を上昇させ、25℃〜50℃に低下させたとき、少なくとも50%の活性を維持する。一部の実施形態では、温度は、25℃に、30℃に、35℃に、40℃に、45℃に、または50℃に低下させられる。例示的な一実施形態では、耐熱性酵素は、95℃で1分間の後に少なくとも90%の活性を保持する。
一部の実施形態では、耐熱性の核酸ガイド化ヌクレアーゼは、耐熱性Cas9、耐熱性Cpf1、耐熱性Cas3、耐熱性Cas8a〜c、耐熱性Cas10、耐熱性Cse1、耐熱性Csy1、耐熱性Csn2、耐熱性Cas4、耐熱性Csm2、耐熱性Cm5、耐熱性Csf1、耐熱性C2C2または耐熱性NgAgoである。
一部の実施形態では、耐熱性CRISPR/Cas系タンパク質は、耐熱性Cas9である。
耐熱性の核酸ガイド化ヌクレアーゼは、単離すること、例えば、高温菌Streptococcus thermophilusおよびPyrococcus furiosusのゲノムにおける配列相同性によって同定することができる。核酸ガイド化ヌクレアーゼ遺伝子は、発現ベクターに次にクローニングすることができる。例示的な一実施形態では、耐熱性のCas9タンパク質は単離される。
別の実施形態では、耐熱性の核酸ガイド化ヌクレアーゼは、非耐熱性の核酸ガイド化ヌクレアーゼのin vitro進化によって得ることができる。核酸ガイド化ヌクレアーゼの配列は、その耐熱性を改善するために変異誘発させられ得る。
gNAの収集物を作製する方法
任意の供給源核酸(例えば、DNA)からの多数の多様なgRNA、gNAの収集物の生成を可能にする方法が、本明細書に提供される。本明細書に提供されている方法は、消化、ライゲーション、伸長、オーバーハングを埋めること、転写、逆転写、増幅を非限定的に含む、酵素による方法を用いることができる。
一般に、本方法は、核酸(例えば、DNA)を提供するステップと;PAM配列由来の残っているヌクレオチド配列が残るような仕方で、核酸におけるPAM配列の部分で切断する第1の酵素(または第1の酵素の組合せ)を用いるステップと;PAM配列を排除するための距離に制限酵素IIS型部位(その認識モチーフの外側だがその近傍を切断する酵素)が位置しているアダプタをライゲートするステップと;第2のIIS型酵素(または第2の酵素の組合せ)を用いるステップであって、アダプタと共にPAM配列を排除するステップと;核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系のタンパク質メンバーによって認識され得る配列、例えば、gRNAステムループ配列を融合させるステップとを含むことができる。一部の実施形態では、PAM配列由来の残っているヌクレオチド配列が残り、PAM配列に対しすぐ接して5’にあるヌクレオチド配列が、単にPAM配列に対し5’にあるシトシンを有するものではなく、例えば、単にC/NGGまたはC/TAG等であるものではなく、任意のプリンまたはピリミジンであり得るような仕方で、第1の酵素反応は、PAM配列の部分を切断する。
表1は、異なる制限酵素を使用して、任意の供給源核酸(例えば、DNA)をgNA(例えば、gRNA)の収集物へと変換するための例示的な戦略/プロトコールを示す。
表2は、異なる制限酵素を使用して、任意の供給源核酸(例えば、DNA)をgNA(例えば、gRNA)の収集物へと変換するためのさらなる例示的な戦略/プロトコールを示す。
本明細書に記載されている組成物および方法の例示的な適用は、図1、図2、図3、図4、図5、図6および図7に提示されている。これらの図面は、ゲノムDNA(例えば、ヒトゲノムDNA)等、インプット核酸(例えば、DNA)からgNAライブラリー(例えば、gRNAライブラリー)を構築する方法を含む、本発明の非限定的な例示的な実施形態を描写する。
図1において、出発材料は、断片化されたゲノムDNA(例えば、ヒト)または他の供給源DNAであってよい。このような断片は、ライブラリーを構築する前に平滑末端化される(101)。T7プロモーターアダプタが、平滑末端化されたDNA断片にライゲートされ(102)、次いでこれはPCR増幅される。次に、Nt.CviPIIを使用して、CCD配列に対しすぐ接して5’に、PCR産物の一方の鎖にニックを生成する(103)。T7エンドヌクレアーゼIは、反対の鎖において、ニックの1、2または3bp 5’を切断する(104)。その結果生じるDNA断片は、DNA断片の末端にHGG配列を残しつつ、T4 DNAポリメラーゼにより平滑末端化される(105)。その結果生じるDNAは、ビーズにおいて浄化および回収される。MlyI認識部位を保有するアダプタが、HGG配列のすぐ接して3’に、平滑末端化されたDNA断片にライゲートされる(106)。MlyIは、HGG配列に対しすぐ接して5’に平滑末端切断を生成し、アダプタ配列と共にHGGを除去する(107)。その結果生じるDNA断片は、再度ビーズにおいて浄化および回収される。次に、gRNAステムループ配列が、MlyIによって切断された平滑末端にライゲートされ、ヒトゲノムを網羅するgRNAライブラリーを形成する(108)。次に、このDNAライブラリーは、PCR増幅され、ビーズにおいて浄化され、in vitro転写の準備が整う。
図2において、出発材料は、インタクトなゲノムDNA(例えば、ヒト)または他の供給源DNAであってよい(201)。Nt.CviPIIおよびT7エンドヌクレアーゼIを使用して、ヒトゲノムDNAの各鎖にニックを生成し、より小型のDNA断片をもたらす(202)。200〜600bpのDNA断片が、ビーズにおいてサイズ選択され、次いで、5’にGGオーバーハングを保有するY字型アダプタとライゲートされる。Y字型アダプタの一方の鎖は、MlyI認識部位を含有し、他方の鎖は、突然変異したMlyI部位およびT7プロモーター配列を含有する(203)。これらの特色のため、PCR増幅後に、T7プロモーター配列は、HGG配列の遠位端にあり、MlyI配列は、HGGの後端(rear end)にある(204)。MlyIによる消化は、HGG配列のすぐ接して5’に切断を生成する(205)。MlyIは、HGG配列に対しすぐ接して5’に平滑末端切断を生成し、アダプタ配列と共にHGGを除去する(206)。次に、gRNAステムループ配列が、MlyIによって切断された平滑末端にライゲートされ、ヒトゲノムを網羅するgRNAライブラリーを形成する。次に、このDNAライブラリーは、PCR増幅され、ビーズにおいて浄化され、in vitro転写の準備が整う。
図3において、例えば、ニッキング酵素により、供給源DNA(例えば、ゲノムDNA)にニックを入れることができる(301)。場合によっては、ニッキング酵素は、3個またはそれよりも少ない塩基の長さである認識部位を有することができる。場合によっては、CCD(式中、Dは、C以外の塩基を表す)の配列を認識し、そこにニックを入れることができるCviPIIが使用される。ニックは、ガイドRNA N20配列を得るために使用され得る、配列(より太い線によって表す)を含有する領域を囲む近位であってよい。ニックが近位である場合、二本鎖切断が生じ、5’または3’オーバーハングをもたらすことができる(302)。これらのオーバーハングは、例えば、ポリメラーゼ(例えば、T4ポリメラーゼ)により修復され得る。場合によっては、例えば5’鎖がある場合、修復は、相補鎖の合成を含むことができる。場合によっては、例えば3’鎖がある場合、修復は、オーバーハングの除去を含むことができる。修復は、N20ガイド配列と、ニック認識配列に相補的な配列(例えば、HGG、式中、Hは、G以外の塩基を表す)を含む平滑末端をもたらすことができる。
図4において、例えば、図3の終わりから続けて、所望の切断を可能にするために、アダプタの異なる組合せがDNAにライゲートされ得る。この部位から3塩基対を切断するヌクレアーゼ酵素の認識部位を有するアダプタ(例えば、MlyI)が、ライゲートされてよく(401)、該部位における消化を使用して、HGG配列等、余剰の配列を除去することができる(402)。この部位から20塩基対を切断するヌクレアーゼの認識部位を有するアダプタ(例えば、MmeI)(403)。これらのアダプタは、後に第1の認識部位(例えば、BsaXI)を除去するためにこの部位から適正な数のヌクレオチドを切断するヌクレアーゼの第2の認識部位を含んでいてもよい。第1の酵素を使用して、20ヌクレオチドを切り出し、これにより、N20配列を維持することができる(404)。次に、プロモーターアダプタ(例えば、T7)をN20配列の隣にライゲートすることができる(405)。次に、第2の認識部位(例えば、BsaXI)に対応するヌクレアーゼを使用して、20ヌクレオチドを切断する部位のためのアダプタを除去することができる(例えば、MmeI)(406)。最後に、ガイドRNAステムループ配列アダプタは、N20配列にライゲートして(407)、ガイドRNA生成に備えることができる。
あるいは、図5に示すプロトコールは、図3に示すもの等のプロトコールの終わりに続くことができる。この部位から25ヌクレオチドを切断するヌクレアーゼ酵素の認識部位を有するアダプタ(例えば、EcoP15I)を、DNAにライゲートすることができる(501)。このようなアダプタは、後に第1の認識部位(例えば、BaeI)およびHGG等の任意の他の余剰の配列を除去するためにこの部位から適正な数のヌクレオチドを切断するヌクレアーゼの第2の認識部位を含んでいてもよい。次に、第1の認識部位(例えば、EcoP15I)に対応する酵素を使用して、N20配列の後を切断することができる(502)。次に、プロモーターアダプタ(例えば、T7)を、N20配列の隣にライゲートすることができる(503)。次に、第2の認識部位(例えば、BaeI)に対応する酵素を使用して、認識部位および残っている任意の配列(例えば、HGG)を除去することができる(504)。最後に、ガイドRNAステムループ配列アダプタを、N20配列にライゲートすることができる(例えば、一本鎖ライゲーションによって)(505)。
図3に示すもの等のプロトコールの代替として、図6に示すプロトコールを、図4または図5に示すもの等のプロトコールの調製において使用することができる。ニッキング酵素(例えば、CviPII)によってニックを導入することができる(601)。場合によっては、ニック認識部位は、3個またはそれよりも少ない塩基の長さである。場合によっては、CCDの配列を認識し、そこにニックを入れることができるCviPIIが使用される。次に、ポリメラーゼ(例えば、Bst大断片DNAポリメラーゼ)を使用して、古い鎖を置換しつつ、ニックから開始する新しいDNA鎖を合成することができる(602)。DNA合成により、ニックが塞がれ、再度ニックを入れるために利用することができる(603)。ニッキングおよび合成のその後のサイクルを使用して、大量の標的配列を得ることができる(604)。例えば、ランダムプライミングおよび伸長によって、標的配列のこれらの一本鎖コピーを二本鎖にすることができる。次に、図4または図5に示すもの等、本明細書に開示されている方法によって、N20配列を含むこれらの二本鎖核酸をさらに処理することができる。
図3または図6に示すもの等のプロトコールの別の代替として、図7に示すプロトコールを、図4または図5に示すもの等のプロトコールの調製において使用することができる。ニッキング酵素(例えば、CviPII)によってニックを導入することができる(701)。場合によっては、ニッキング酵素認識部位は、3個またはそれよりも少ない塩基の長さである。場合によっては、CCDの配列を認識し、そこにニックを入れることができるCviPIIが使用される。次に、ポリメラーゼ(例えば、Bst大断片DNAポリメラーゼ)を使用して、古い鎖を置換しつつ、ニックから開始する新しいDNA鎖を合成することができる(例えば、ニッキングエンドヌクレアーゼ媒介性鎖置換DNA増幅(NEMDA))。反応パラメータを調整して、生成される一本鎖DNAのサイズを制御することができる。例えば、ニッカーゼ:ポリメラーゼ比(例えば、CviPII:Bts大断片ポリメラーゼ比)を調整することができる。反応温度を調整することもできる。次に、プロモーター(例えば、T7プロモーター)(702)に続いてランダムn−mer(例えば、ランダム6−mer、ランダム8−mer)(703)を(5’>3’方向で)有するオリゴヌクレオチドを付加することができる(704)。ランダムn−mer領域は、以前に生成された一本鎖DNAの領域に結合することができる。例えば、結合は、高温で変性させ、続いて急速にクールダウンさせることにより行うことができ、これにより、ランダムn−mer領域に、NEMDAによって生成された一本鎖DNAに結合させることができる。場合によっては、DNAは、98℃で7分間変性され、次いで10℃まで急速にクールダウンされる。伸長および/または増幅を使用して、二本鎖DNAを生成することができる。例えば、酵素により(例えば、20℃におけるDNAポリメラーゼI処理によって)、平滑末端を生成することができる。これは、プロモーター(例えば、T7プロモーター)で終わる一端と、任意のニッキング酵素認識部位(例えば、任意のCCD部位)で終わる他端とをもたらすことができる。次に、例えば、サイズ選択(例えば、ゲル精製、キャピラリー電気泳動または他の断片分離技法による)によって、このような断片を精製することができる。場合によっては、標的断片は、約50塩基対の長さである(アダプタ配列(例えば、T7アダプタ)+標的N20配列+ニッキング酵素認識部位または相補体(例えば、HGG))。次に、断片は、適切な距離を切断してニッキング酵素認識部位を除去するヌクレアーゼのヌクレアーゼ認識部位を含むアダプタにライゲートすることができる(705)。例えば、3ヌクレオチド長のニッキング酵素認識部位(例えば、CviPIIのCCD)のため、BaeIを使用することができる。次に、適切なヌクレアーゼ(例えば、BaeI)を使用して、ヌクレアーゼ認識部位およびニッキング酵素認識部位を除去することができる(706)。次に、残る核酸配列(例えば、N20部位)は、ガイドRNAのための最終ステムループ配列にライゲートすることができる(707)。増幅(例えば、PCR)を行うことができる。ガイドRNAを生成することができる。
一部の実施形態では、核酸ガイド化ヌクレアーゼ(例えば、Cas9)標的配列を含む核酸ガイド化ヌクレアーゼ(例えば、Cas9)タンパク質を向かわせるために使用することができる、ヒトミトコンドリアDNA(mtDNA)を標的とするgNA(例えば、gRNA)の収集物が作製される。一部の実施形態では、このgNA(例えば、gRNA)の収集物の標的化配列は、表3(NGG配列がプラス鎖に存在する場合)および表4(NGG配列がマイナス鎖に存在する場合)の右から2番目の段に提示されている少なくとも20nt配列を含むDNA配列によってコードされる。一部の実施形態では、ヒトミトコンドリアDNAに対する特異性を有する、本明細書に提供されているgRNA核酸の収集物は、複数のメンバーを含み、メンバーは、表3の右の段から2番目の段および/または表4の右から2番目の段に提示されている複数の標的化配列を含む。





























































































適用
本明細書に提供されるgNA(例えば、gRNA)およびgNA(例えば、gRNA)の収集物は、目的の標的配列の枯渇、分配、捕捉または濃縮;ゲノムワイド標識;ゲノムワイド編集;ゲノムワイド機能スクリーニング;およびゲノムワイド調節を含む、種々の適用に有用である。
一実施形態では、gNAは、宿主由来の生体試料における宿主核酸に対して選択的であるが、宿主由来の試料における非宿主核酸に対して選択的ではない。一実施形態では、gNAは、宿主由来の生体試料由来の非宿主核酸に対して選択的であるが、試料における宿主核酸に対して選択的ではない。一実施形態では、gNAは、宿主由来の生体試料における宿主核酸および非宿主核酸のサブセットの両方に対して選択的である。例えば、複合生体試料が、宿主核酸および2以上の非宿主生物由来の核酸を含む場合、gRNAは、非宿主種のうち2以上に対して選択的であってよい。斯かる実施形態では、gNAは、目的外の配列を連続的に枯渇または分配するために使用される。例えば、ヒト由来の唾液は、ヒトDNAと共に、2以上の細菌種のDNAを含有するが、未知の病原生物のゲノム材料を含有する場合もある。斯かる実施形態では、ヒトDNAおよび公知細菌へと向けられたgNAを使用して、ヒトDNAおよび公知細菌のDNAを連続的に枯渇させ、これにより、未知の病原生物のゲノム材料を含む試料をもたらすことができる。
例示的な実施形態では、gNAは、宿主由来の生体試料から得られるヒト宿主DNAに対して選択的であるが、試料から同様に得られる未知の病原体(単数または複数)由来のDNAとハイブリダイズしない。
一部の実施形態では、gNAは、試料における標的化された配列の枯渇および分配、非宿主核酸についての試料の濃縮、または試料における標的化された核酸の連続的な枯渇に有用であり、これらの方法は、試料から抽出された核酸を提供するステップと;(i)本明細書に記載されているgNAの収集物のうち任意の1種、および(ii)核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質を含む複数の複合体と試料とを接触させるステップとを含む。
一部の実施形態では、gNAは、試料における標的化された配列の枯渇および分配方法であって、試料から抽出された核酸を提供するステップであって、抽出された核酸が、枯渇および分配の一方のための目的の配列および標的化された配列を含むステップと;核酸ガイド化ヌクレアーゼ系タンパク質が、試料における核酸を切断する条件下で、(i)本明細書に提供されているgNAの収集物;および(ii)核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質を含む複数の複合体と試料とを接触させるステップとを含む方法に有用である。
一部の実施形態では、gNAは、非宿主核酸についての試料の濃縮であって、宿主核酸および非宿主核酸を含む試料を提供するステップと;核酸ガイド化ヌクレアーゼ系タンパク質が、試料における宿主核酸を切断する条件下で、(i)宿主核酸へと向けられた標的化配列を含む本明細書に提供されているgNAの収集物;および(ii)核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質を含む複数の複合体と試料とを接触させ、これにより、宿主核酸の試料を枯渇させ、非宿主核酸の濃縮を可能にするステップとを含む濃縮に有用である。
一部の実施形態では、gNAは、試料における標的化された核酸の連続的な枯渇のための一方法であって、宿主核酸および非宿主核酸を含む宿主由来の生体試料を提供するステップであって、非宿主核酸が、少なくとも1つの公知非宿主生物由来の核酸および未知の非宿主生物由来の核酸を含むステップと;(i)宿主核酸へと向けられた本明細書に提供されているgNAの収集物;および(ii)核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質を含む複数の複合体を提供するステップと;宿主核酸における標的化された配列にハイブリダイズするように構成されたgNA−核酸ガイド化ヌクレアーゼ系タンパク質複合体(例えば、gRNA−CRISPR/Cas系タンパク質複合体)と生体試料由来の核酸とを混合するステップであって、複合体の少なくとも一部分が、宿主核酸における標的化された配列にハイブリダイズし、宿主核酸の少なくとも一部分が切断されるステップと;少なくとも1つの公知非宿主核酸における標的化された配列にハイブリダイズするように構成されたgNA−核酸ガイド化ヌクレアーゼ系タンパク質複合体と生体試料由来の残る核酸とを混合するステップであって、複合体の少なくとも一部分が、少なくとも1つの非宿主核酸における標的化された配列にハイブリダイズし、非宿主核酸の少なくとも一部分が切断されるステップと;未知の非宿主生物から残る核酸を単離し、さらなる解析に備えるステップとを含む方法に有用である。
一部の実施形態では、本明細書で生成されるgNAは、細胞集団におけるゲノムワイドまたは標的化された機能的スクリーニングの実行に使用される。斯かる実施形態では、in vitro転写されたgNA(例えば、gRNA)のライブラリーまたはgNAをコードするベクターは、gNA指向性の核酸ガイド化ヌクレアーゼ系タンパク質編集が、ゲノム全体にわたる配列またはゲノムの特異的領域に対して達成され得るような仕方で、核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質と共に、トランスフェクションまたは当技術分野で公知の他の実験室技法により細胞集団に導入することができる。一実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質は、DNAとして導入され得る。一実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質は、mRNAとして導入され得る。一実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質は、タンパク質として導入され得る。例示的な一実施形態では、核酸ガイド化ヌクレアーゼ系タンパク質は、Cas9である。
一部の実施形態では、本明細書で生成されるgNAは、目的の核酸配列の選択的な捕捉および/または濃縮に使用される。例えば、一部の実施形態では、本明細書で生成されるgNAは、複数の核酸を含む試料を提供するステップと;(i)本明細書に提供されているgNAの収集物;および(ii)核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質を含む複数の複合体と試料とを接触させるステップとを含む、標的核酸配列の捕捉に使用される。目的の配列が捕捉されると、さらにこれをライゲートして、例えば、配列決定ライブラリーを作製することができる。
一部の実施形態では、本明細書で生成されるgNAは、(a)複数の核酸断片を含む試料を提供するステップと;(b)(i)本明細書に提供されているgNAの収集物;および(ii)核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質−ニッカーゼ(例えば、Cas9−ニッカーゼ)を含む複数の複合体と試料とを接触させるステップであって、gNAが、核酸断片における標的化された目的の部位に対して相補的であり、これにより、標的化された目的の部位に複数のニック核酸断片を生成するステップと;(c)ニック部位において核酸合成を開始させることができる酵素および標識されたヌクレオチドと複数のニック核酸断片とを接触させるステップであって、これにより、標的化された目的の部位に標識されたヌクレオチドを含む複数の核酸断片を生成するステップとを含む、標的化された目的の部位における標識されたヌクレオチドの導入に使用される。
一部の実施形態では、本明細書で生成されるgNAは、(a)複数のアダプタライゲート核酸を含む試料を提供するステップであって、核酸が、一端において第1のアダプタにライゲートされ、他端において第2のアダプタにライゲートされているステップと;(b)複数の活性がない核酸ガイド化ヌクレアーゼ−gNA複合体(例えば、dCas9−gRNA複合体)を含むgNAの収集物と試料とを接触させるステップであって、活性がない核酸ガイド化ヌクレアーゼ(例えば、dCas9)が、トランスポサーゼに融合されており、gNAが、核酸のサブセットに含有される標的化された目的の部位に対して相補的であり、活性がない核酸ガイド化ヌクレアーゼ−gNAトランスポサーゼ複合体(例えば、dCas9−gRNAトランスポサーゼ複合体)が、複数の第3のアダプタをロードされており、一端に第1または第2のアダプタのいずれかを、他端に第3のアダプタを含む複数の核酸断片を生成するステップとを含む、目的の標的核酸配列の捕捉に使用される。一実施形態では、本方法は、第1または第2のアダプタおよび第3のアダプタ特異的PCRを使用して、ステップ(b)の産物を増幅するステップをさらに含む。
一部の実施形態では、本明細書で生成されるgNAは、細胞集団におけるゲノムワイドまたは標的化された活性化または抑圧の実行に使用される。斯かる実施形態では、in vitro転写されたgNA(例えば、gRNA)のライブラリーまたはgNAをコードするベクターは、gNA指向性の触媒活性がない核酸ガイド化ヌクレアーゼ系タンパク質媒介性の活性化または抑圧が、ゲノム全体にわたる配列においてまたはゲノムの特異的領域に対して達成され得るような仕方で、活性化因子またはリプレッサードメインに融合された触媒活性がない核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質(触媒活性がない核酸ガイド化ヌクレアーゼ系タンパク質−融合タンパク質)と共に、トランスフェクションまたは当技術分野で公知の他の実験室技法により、細胞集団に導入され得る。一実施形態では、触媒活性がない核酸ガイド化ヌクレアーゼ系タンパク質−融合タンパク質は、DNAとして導入され得る。一実施形態では、触媒活性がない核酸ガイド化ヌクレアーゼ系タンパク質−融合タンパク質は、mRNAとして導入され得る。一実施形態では、触媒活性がない核酸ガイド化ヌクレアーゼ系タンパク質−融合タンパク質は、タンパク質として導入され得る。一部の実施形態では、gNAまたはgNAをコードする核酸の収集物は、2種以上の核酸ガイド化ヌクレアーゼ系タンパク質に対する特異性を呈する。例示的な一実施形態では、触媒活性がない核酸ガイド化ヌクレアーゼ系タンパク質は、dCas9である。
一部の実施形態では、収集物は、Cas9、ならびにCpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2およびCm5からなる群から選択される1種または複数のCRISPR/Cas系タンパク質に対する特異性を有するgRNAまたはgRNAをコードする核酸を含む。一部の実施形態では、収集物は、例えば、異なるゲノムまたはゲノムの部分の標識および/または可視化における使用のための、異なる染色体領域の標識および/または可視化における使用のための、またはゲノムへのウイルス遺伝子/ゲノムの組込みの標識および/または可視化における使用のための、異なるフルオロフォアに融合された、触媒活性がない様々なCRISPR/Cas系タンパク質に対する特異性を有するgRNAまたはgRNAをコードする核酸を含む。
一部の実施形態では、gNA(またはgNAをコードする核酸)の収集物は、異なる核酸ガイド化ヌクレアーゼ(例えば、CRISPR/Cas)系タンパク質に対する特異性を有し、例えば、異なる種に由来する異なる目的の配列を標的とする。例えば、第1の種由来のゲノムを標的とする、gNA(または斯かるgNAをコードする核酸の集団から転写される)の収集物由来のgNAの第1のサブセットは、先ず、第1の核酸ガイド化ヌクレアーゼ系タンパク質メンバー(または操作されたバージョン)と混合することができ;第2の種由来のゲノムを標的とする、gNA(または斯かるgNAをコードする核酸の集団から転写される)の収集物由来のgNAの第2のサブセットは、第2の異なる核酸ガイド化ヌクレアーゼ系タンパク質メンバー(または操作されたバージョン)と混合することができる。一実施形態では、異なる目的の標的化された配列、例えば、異なる種のゲノムまたはある一種の異なる染色体が、異なる蛍光標識によって標識され得るように、核酸ガイド化ヌクレアーゼ系タンパク質は、異なるフルオロフォアと融合された、触媒活性がないバージョン(例えば、dCas9)であってよい。例えば、異なる染色体領域は、遺伝的転座の可視化のため、異なるgRNA標的化dCas9−フルオロフォアによって標識することができる。例えば、異なるウイルスゲノムは、宿主ゲノムへの異なるウイルスゲノムの組込みの可視化のため、異なるgRNA標的化dCas9−フルオロフォアによって標識することができる。別の実施形態では、異なる目的の標的化された配列、例えば、ゲノムの異なる染色体が、差次的に調節され得るように、核酸ガイド化ヌクレアーゼ系タンパク質は、活性化または抑圧ドメインのいずれかと融合されたdCas9であってよい。別の実施形態では、異なる目的の標的化された配列、例えば、試料混合物内の異なるDNA配列が、差次的に単離され得るように、核酸ガイド化ヌクレアーゼ系タンパク質は、異なる抗体によって認識され得る異なるタンパク質ドメインと融合されたdCas9であってよい。
本発明の例示的組成物
一実施形態では、核酸断片、ニッカーゼ核酸ガイド化ヌクレアーゼ−gNA複合体および標識ヌクレオチドを含む組成物が本明細書で提供される。例示的な一実施形態では、核酸断片、ニッカーゼCas9−gRNA複合体および標識ヌクレオチドを含む組成物が本明細書で提供される。そのような実施形態では、核酸はDNAを含むことができる。ヌクレオチドは、例えばビオチンで標識することができる。ヌクレオチドは、抗体−コンジュゲート対の一部であってよい。
一実施形態では、核酸断片および触媒活性がない核酸ガイド化ヌクレアーゼ−gNA複合体を含む組成物であって、触媒活性がない核酸ガイド化ヌクレアーゼはトランスポザーゼに融合されている、組成物が本明細書で提供される。例示的な一実施形態では、DNA断片およびdCas9−gRNA複合体を含む組成物であって、dCas9はトランスポザーゼに融合されている、組成物が本明細書で提供される。
一実施形態では、メチル化ヌクレオチドを含む核酸断片、ニッカーゼ核酸ガイド化ヌクレアーゼ−gNA複合体、およびメチル化されていないヌクレオチドを含む組成物が本明細書で提供される。例示的な一実施形態では、メチル化ヌクレオチドを含むDNA断片、ニッカーゼCas9−gRNA複合体およびメチル化されていないヌクレオチドを含む組成物が本明細書で提供される。
一実施形態では、核酸ガイド化DNAエンドヌクレアーゼと複合体を形成したgDNAが本明細書で提供される。例示的な実施形態では、核酸ガイド化DNAエンドヌクレアーゼは、NgAgoである。
一実施形態では、核酸ガイド化RNAエンドヌクレアーゼと複合体を形成したgDNAが本明細書で提供される。
一実施形態では、核酸ガイド化DNAエンドヌクレアーゼと複合体を形成したgRNAが本明細書で提供される。
一実施形態では、核酸ガイド化RNAエンドヌクレアーゼと複合体を形成したgRNAが本明細書で提供される。一実施形態では、核酸ガイド化RNAエンドヌクレアーゼは、C2c2を含む。
キットおよび製造品
本願は、アダプタ、gNA(例えば、gRNA)、gNA収集物(例えば、gRNA収集物)、gNA収集物をコードする核酸分子その他に限定されない、本明細書に記載されている組成物のうち任意の1種または複数を含むキットを提供する。
例示的な一実施形態では、キットは、gRNAのライブラリーとなるように転写することができるDNA分子の収集物を含み、gRNAは、ヒトゲノムまたは他の供給源のDNA配列へと標的化される。
一実施形態では、キットは、gNAの収集物を含み、gNAは、ヒトゲノムまたは他の供給源のDNA配列へと標的化される。
一部の実施形態では、本明細書に記載されているgNAをコードする核酸の収集物のいずれかを含むキットが、本明細書に提供される。一部の実施形態では、本明細書に記載されているgNAの収集物のいずれかを含むキットが、本明細書に提供される。
本願は、本明細書に記載されているgNAおよびgNAをコードする核酸の収集物を作製する方法を実施するための、あらゆる必須の試薬および説明書も提供する。一部の実施形態では、本明細書に記載されている個々のgNAおよびgNAの収集物を作製する方法を実施するための、あらゆる必須の試薬および説明書を含むキットが、本明細書に提供される。
本明細書で生成されるgNA収集物と試料とを接触させる前後の情報をモニターするためのコンピュータソフトウェアも、本明細書に提供されている。例示的な一実施形態では、ソフトウェアは、オフターゲット標的化が生じないこと確実にするために、gNA収集物を提供する前後の試料における非標的配列の存在量を算出および報告することができ、ソフトウェアは、試料へとgNA収集物を提供する前後の標的配列の存在量を比較することにより、標的化された枯渇/濃縮/捕捉/分配/標識/調節/編集の有効性をチェックすることができる。
以下の実施例は例示目的のために含まれ、本発明の範囲を限定するものではない。
(実施例1)
T7プロモーターヒトDNAライブラリーからのgRNAライブラリーの構築
T7プロモーターライブラリー構築
S2 Covaris超音波処理器(Covaris)を8サイクル使用して、ヒトゲノムDNA(400ng)を断片化して、200〜300bpの長さの断片を得た。NEBNext End Repair Module(NEB)を使用して、断片化されたDNAを修復し、25℃で30分間インキュベートし、次いで75℃で20分間熱失活させた。T7プロモーターアダプタを作製するために、オリゴT7−1(5’GCCTCGAGC*T*A*ATACGACTCACTATAGAG3’、*は、ホスホロチオエート骨格連結を表示)(配列番号4397)およびT7−2(配列5’Phos−CTCTATAGTGAGTCGTATTA3’)(配列番号4398)を15μMで混合し、98℃で3分間加熱し、次いで30℃までゆっくり冷却した(0.1℃/分)。次に、T7プロモーター平滑アダプタ(総計15pmol)を、平滑末端化されたヒトゲノムDNA断片に添加し、Blunt/TAリガーゼマスターミックス(NEB)と共に25℃で30分間インキュベートした(図1中の(2))。10サイクルのPCR(98℃で20秒間、63℃で20秒間、72℃で35秒間)のため、Hi−Fidelity 2×マスターミックス(NEB)を使用して、2μMオリゴT7−1によりライゲーションを増幅した。アガロースゲル電気泳動において少量のアリコートを泳動することにより、増幅を検証した。PCR増幅された産物は、製造業者の説明書に従って0.6×AxyPrepビーズ(Axygen)を使用して回収し、15μLの10mMトリス−HCl、pH8に再懸濁した。
DNAの消化
PCR増幅されたT7プロモーターDNA(消化につき総計2μg)を、10μLのNEBバッファー2(50mM NaCl、10mMトリス−HCl、pH7.9、10mM MgCl、100μg/mL BSA)における0.1μLのNt.CviPII(NEB)により10分間37℃で消化し(図1中の(3))、次に、75℃で20分間熱失活させた。さらなる10μLのNEBバッファー2と1μLのT7エンドヌクレアーゼI(NEB)を反応液に添加し、37℃で20分間インキュベートした(図1中の(4))。DNAの酵素消化をアガロースゲル電気泳動によって検証した。製造業者の説明書に従って、0.6×AxyPrepビーズ(Axygen)を添加することにより、消化されたDNAを回収し、15μLの10mMトリス−HCl、pH8に再懸濁した。
アダプタのライゲーションおよびHGGの除去
次に、T4 DNAポリメラーゼ(NEB)を20分間25℃で使用して、DNAを平滑末端化し、続いて熱失活を75℃で20分間行った(図1中の(5))。
MlyIアダプタを作製するために、オリゴMlyI−1(配列5’>3’、5’Phos−GGGACTCGGATCCCTATAGTGATACAAAGACGATGACGACAAGCG)(配列番号4399)およびMlyI−2(配列5’>3’、TCACTATAGGGATCCGAGTCCC)(配列番号4400)を15μMで混合し、98℃で3分間加熱し、次いで30℃までゆっくり冷却した(0.1℃/分)。次に、MlyIアダプタ(総計15pmol)を、T4 DNAポリメラーゼ平滑末端化DNAに添加し、Blunt/TAリガーゼマスターミックス(NEB)と共に25℃で30分間インキュベートした(図1中の(6))。ライゲーションを75℃で20分間熱失活させ、次に、HGGモチーフが排除できるように、MlyIおよびXhoI(NEB)により1時間37℃で消化した(図1中の(7))。次に、0.8×AxyPrepビーズ(Axygen)を使用して、消化物を浄化し、DNAを10μLの10mMトリス−Cl、pH8に再懸濁した。
StlgRアダプタを作製するために、オリゴstlgR(配列5’>3’、5’Phos−GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGGATCCGATGC)(配列番号4401)およびstlgRev(配列5’>3’、GGATCCAAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC)(配列番号4402)を15μMで混合し、98℃で3分間加熱し、次いで60℃までゆっくり冷却した(0.1℃/分)。StlgRアダプタ(総計5pmol)を、HGG除去DNA断片に添加し、Blunt/TAリガーゼマスターミックス(NEB)と共に25℃で30分間インキュベートした(図1中の(8))。次に、2μMの両方のオリゴT7−1およびgRU(配列5’>3’、AAAAAAAGCACCGACTCGGTG)(配列番号4403)を使用して、ライゲーションをHi−Fidelity 2×マスターミックス(NEB)と共にインキュベートし、20サイクルのPCR(98℃で20秒間、60℃で20秒間、72℃で35秒間)を使用して増幅させた。アガロースゲル電気泳動において少量のアリコートを泳動することにより、増幅を検証した。PCR増幅された産物は、製造業者の説明書に従って0.6×AxyPrepビーズ(Axygen)を使用して回収し、15μLの10mMトリス−HCl、pH8に再懸濁した。
in vitro転写
次に、HiScribe T7 In Vitro転写キット(NEB)を使用して、PCR産物のT7/gRU増幅されたライブラリーを、in vitro転写のための鋳型として使用した。製造業者の説明書に従って、500〜1000ngの鋳型を一晩37℃でインキュベートした。ガイドライブラリーをgRNAへと転写するために、次のin vitro転写反応混合物をアセンブルした:10μLの精製されたライブラリー(ほぼ500ng)、6.5μLのHO、2.25μLのATP、2.25μLのCTP、2.25μLのGTP、2.25μLのUTP、2.25μLの10×反応バッファー(NEB)および2.25μLのT7 RNAポリメラーゼミックス。反応液を37℃で24時間インキュベートし、次いで、RNAクリーンアップ(cleanup)キット(Life Technologies)を使用して精製し、100μLのRNaseフリーの水により溶出し、定量化し、使用まで−20℃で貯蔵した。
(実施例2)
インタクトなヒトゲノムDNAからのgRNAライブラリーの構築
DNAの消化
ヒトゲノムDNA(図2中の(1);消化につき総計20μg)を、40μLのNEBバッファー2(50mM NaCl、10mMトリス−HCl、pH7.9、10mM MgCl、100μg/mL BSA)における0.1μLのNt.CviPII(NEB)により10分間37℃で消化し、次いで75℃で20分間熱失活させた。さらなる40μLのNEBバッファー2および1μLのT7エンドヌクレアーゼI(NEB)を反応液に添加し、37℃で20分間インキュベーションを行った(例えば、図2中の(2))。アガロースゲル電気泳動によって、少量のアリコートによりゲノムDNAの断片化を検証した。0.3×AxyPrepビーズ(Axygen)を添加し、25℃で5分間インキュベートし、磁気スタンドにおいてビーズを捕捉し、上清を新しいチューブに移すことにより、200〜600bpの間のDNA断片を回収した。600bpを下回るDNA断片は、このビーズ/DNA比ではビーズに結合せず、上清中に残る。次に、0.7×AxyPrepビーズ(Axygen)を上清に添加し(これは、200bpよりも長い全DNA分子に結合し得る)、5分間結合させた。ビーズを磁気スタンドにおいて捕捉し、80%エタノールで2回洗浄し、風乾した。次に、DNAを15μLの10mMトリス−HCl、pH8に再懸濁した。Qbitアッセイ(Life Technologies)を使用して、DNA濃度を決定した。
アダプタのライゲーション
T7/MlyIアダプタを作製するために、オリゴMlyI−1(配列5’>3’、5’Phos−GGGGGACTCGGATCCCTATAGTGATACAAAGACGATGACGACAAGCG)(配列番号4404)およびT7−7(配列5’>3’、GCCTCGAGC*T*A*ATACGACTCACTATAGGGATCCAAGTCCC、*は、ホスホロチオエート骨格連結を表示)(配列番号4405)を15μMで混合し、98℃で3分間加熱し、次いで30℃までゆっくり冷却した(0.1℃/分)。次に、Blunt/TAリガーゼマスターミックス(NEB)を25℃で30分間使用して、精製された、Nt.CviPII/T7エンドヌクレアーゼI消化DNA(100ng)を、15pmolのT7/MlyIアダプタにライゲートした(図2中の(3))。次に、Hi−Fidelity 2×マスターミックス(NEB)、ならびに2μMの両方のオリゴT7−17(GCCTCGAGC*T*A*ATACGACTCACTATAGGG、*は、ホスホロチオエート骨格連結を表示)(配列番号4406)およびFlag(配列5’>3’、CGCTTGTCGTCATCGTCTTTGTA)(配列番号4407)を使用して、10サイクルのPCR(98℃で20秒間、60℃で20秒間、72℃で35秒間)によってライゲーションを増幅した。PCR増幅は、DNAの収量を増加させ、使用したY字型アダプタの性質を考慮すると、常に、HGG部位に対し遠位に付加されたT7プロモーターと、HGGモチーフの隣に付加されたMlyI部位をもたらした(図2中の(4))。
次に、PCR産物をMlyIおよびXhoI(NEB)により1時間37℃で消化し、75℃で20分間熱失活させた(図2中の(5))。その後に、Blunt/TAリガーゼマスターミックス(NEB)を25℃で30分間使用して、5pmolのアダプタStlgR(実施例1における)をライゲートした(図2中の(6))。次に、Hi−Fidelity 2×マスターミックス(NEB)、2μMの両方のオリゴT7−7およびgRU(実施例1における)ならびに20サイクルのPCR(98℃で20秒間、60℃で20秒間、72℃で35秒間)を使用したPCRによって、ライゲーションを増幅した。アガロースゲル電気泳動において少量のアリコートを泳動することにより、増幅を検証した。PCR増幅された産物は、製造業者の説明書に従って0.6×AxyPrepビーズ(Axygen)を使用して回収し、15μLの10mMトリス−HCl、pH8に再懸濁した。
次に、実施例1に記載されている通り、試料をin vitro転写反応のための鋳型として使用した。
(実施例3)
CviPIIによる直接的切断
30μgのヒトゲノムDNAを、2ユニットのNtCviPII(New England Biolabs)により1時間37℃で消化し、続いて、75℃で20分間熱失活を行った。断片分析計装置(Advanced Analytical)を使用して、断片のサイズを200〜1,000塩基対であると検証した。100ユニットのT4 DNAポリメラーゼ(New England Biolabs)、100μM dNTPを添加し、12℃で30分間インキュベートすることにより、5’または3’突出末端(例えば、図3に示す通り)を平滑末端に変換した。次に、PCRクリーンアップキット(Zymo)を使用して、DNAを回収し、20μL溶出バッファー中に溶出した。次に、DNAを、MlyIアダプタ(例えば、実施例4を参照)またはBaeI/EcoP15Iアダプタ(例えば、実施例4を参照)またはBaeI/EcoP15Iアダプタ(例えば、実施例5を参照)にライゲートした。
(実施例4)
MlyIアダプタの使用
40μLの水において2μモルのMlyI Ad1およびMly Ad2を組み合わせることにより、アダプタMlyIを作製した。40μLの水において2μモルのオリゴBsMm−Ad1および2μモルのオリゴBsMm−Ad2を組み合わせることにより、アダプタBsaXI/MmeIを作製した。100μLの水において1.5μモルのT7−Ad1およびT7−Ad2オリゴを組み合わせることにより、T7アダプタを作製した。100μLの水において1.5μモルのgR−topおよびgR−botオリゴを組み合わせることにより、ステムループアダプタを作製した。全ての事例において、混合後に、アダプタを98℃で3分間加熱し、次いでサーマルサイクラーにおいて1℃/分の冷却速度で室温まで冷却した。
次に、blunt/TAライゲーションマスターミックス(New England Biolabs)を室温で30分間使用して、CCD平滑末端を含有するDNA(先のセクションから)を50pモルのアダプタMlyIにライゲートした。次に、0.6×Kapa SPRIビーズ(Kapa Biosystems)と共に5分間インキュベートし、ビーズを磁気ラックにより捕捉し、80%エタノールで2回洗浄し、ビーズを5分間風乾し、最後にDNAを50μLのバッファー4(50mM酢酸カリウム、20mMトリス酢酸塩、10mM酢酸マグネシウム、100μg/mL BSA、pH7.9)に再懸濁することにより、DNAを回収した。これらのステップは、小型の(<100ヌクレオチド)DNAおよびMlyIアダプタ二量体を排除する。
次に、20ユニットのMlyI(New England Biolabs)を添加し、37℃で1時間インキュベートすることにより、精製されたDNAを消化して、アダプタ由来の配列およびCCD(および相補的HGG)モチーフの両方を排除した。0.6×Kapa SPRIビーズ(Kapa Biosystems)と共に5分間インキュベートし、ビーズを磁気ラックにより捕捉し、80%エタノールで2回洗浄し、ビーズを5分間風乾し、最後にDNAを30μLのバッファー4に再懸濁することにより、消化物からDNAを回収した。
次に、blunt/TAライゲーションマスターミックス(New England Biolabs)を室温で30分間使用して、精製されたDNAを50pモルのアダプタBsaXI/MmeIにライゲートした。次に、0.6×Kapa SPRIビーズ(Kapa Biosystems)と共に5分間インキュベートし、ビーズを磁気ラックにより捕捉し、80%エタノールで2回洗浄し、ビーズを5分間風乾し、最後にDNAを50μLのバッファー4(50mM酢酸カリウム、20mMトリス酢酸塩、10mM酢酸マグネシウム、100μg/mL BSA、pH7.9)に再懸濁することにより、DNAを回収した。次に、20ユニットのMmeI(New England Biolabs)および40pmol/μLのSAM(S−アデノシルメチオニン)を添加して37℃で1時間放置し、続いて75℃で20分間熱失活させることにより、DNAを消化した。次に、blunt/TAライゲーションマスターミックス(New England Biolabs)を室温で30分間使用して、DNAを30pモルのT7アダプタにライゲートした。次に、PCRクリーンアップキット(Zymo)を使用してDNAを回収し、20μLのバッファー4中に溶出し、次いで20ユニットのBsaXIにより1時間37℃で消化した。15pモルのステムループアダプタを添加し、blunt/TAライゲーションマスターミックス(New England Biolabs)を室温で30分間使用することにより、ガイドRNAステムループ配列を付加した。次に、PCRクリーンアップキット(Zymo)を使用してDNAを回収し、20μLの溶出バッファー中に溶出し、HiFidelity 2×マスターミックス(New England Biolabs)を使用してPCR増幅した。プライマーT7−Ad1およびgRU(配列5’>3’、AAAAAAGCACCGACTCGGTG)(配列番号4419)を使用して、次の設定(98℃で3分間;98℃で20秒間、60℃で30秒間、72℃で20秒間を30サイクル)により増幅した。PCRアンプリコンは、PCRクリーンアップキットを使用してクリーンアップし、DNA配列決定によって検証し、次いで、in vitro転写反応のための鋳型として使用して、ガイドRNAを生成した。
(実施例5)
BaeI/EcoP15Iアダプタの使用
40μLの水において2μモルのBE Ad1およびBE Ad2を組み合わせることにより、アダプタBaeI/EcoP15Iを作製した。100μLの水において1.5μモルのT7−Ad3およびT7−Ad4オリゴを組み合わせることにより、T7−Eアダプタを作製した。全ての事例において、混合後に、アダプタを98℃で3分間加熱し、次いでサーマルサイクラーにおいて1℃/分の冷却速度で室温まで冷却した。
次に、blunt/TAライゲーションマスターミックス(New England Biolabs)を室温で30分間使用して、CCD平滑末端を含有するDNA(先のセクションから)を50pモルのアダプタBaeI/EcoP15Iにライゲートした。次に、0.6×Kapa SPRIビーズ(Kapa Biosystems)と共に5分間インキュベートし、ビーズを磁気ラックにより捕捉し、80%エタノールで2回洗浄し、ビーズを5分間風乾し、最後にDNAを50μLのバッファー4(50mM酢酸カリウム、20mMトリス酢酸塩、10mM酢酸マグネシウム、100μg/mL BSA、pH7.9)に再懸濁することにより、DNAを回収した。次に、回収されたDNAを20ユニットのPmeIにより30分間37℃で消化し;次いで、1.2×Kapa SPRIビーズ(Kapa Biosystems)と共に5分間インキュベートし、ビーズを磁気ラックにより捕捉し、80%エタノールで2回洗浄し、ビーズを5分間風乾し、最後にDNAを50μLのバッファー4に再懸濁することにより、DNAを回収した。これらのステップは、小型の(<100ヌクレオチド)DNAおよびBaeI/EcoP15Iアダプタ多量体を排除する。
次に、20ユニットのEcoP15I(New England Biolabs)および1mM ATPを添加して37℃で1時間放置し、続いて75℃で20分間熱失活させることにより、DNAを消化した。次に、blunt/TAライゲーションマスターミックス(New England Biolabs)を室温で30分間使用して、DNAを30pモルのT7−Eアダプタにライゲートした。次に、PCRクリーンアップキット(Zymo)を使用してDNAを回収し、20μLのバッファー4中に溶出した。
次に、20ユニットのBaeI(New England Biolabs)、40pmol/μLのSAM(S−アデノシルメチオニン)を添加し、37℃で1時間インキュベートすることにより、精製されたDNAを消化して、アダプタ由来の配列およびCCD(および相補的HGG)モチーフの両方を排除した。次に、PCRクリーンアップキット(Zymo)を使用してDNAを回収し、20μLの溶出バッファー中に溶出した。
次に、20μLのssライゲーションバッファー(10mMビス−トリス−プロパン−HCl、10mM MgCl、1mM DTT、2.5mM MnCl、pH7、25℃で)における20ユニットのリガーゼ、20pmolのstlgRオリゴを添加し、65℃で1時間インキュベートし、続いて90℃で5分間熱失活させることにより、熱安定性5’AppDNA/RNAリガーゼ(New England Biolabs)を使用して、回収されたDNAをstlgRオリゴにライゲートした。次に、HiFidelity 2×マスターミックス(New England Biolabs)を使用して、DNA産物をPCR増幅した。プライマーT7−Ad3およびgRU(配列5’>3’、AAAAAAGCACCGACTCGGTG)(配列番号4419)を使用して、次の設定(98℃で3分間;98℃で20秒間、60℃で30秒間、72℃で20秒間を30サイクル)により増幅した。PCRアンプリコンは、PCRクリーンアップキットを使用してクリーンアップし、DNA配列決定によって検証し、次いで、in vitro転写反応のための鋳型として使用して、ガイドRNAを生成した。
(実施例6)
NEMDA方法
50ngのヒトゲノムDNAを使用して、NEMDA(ニッキングエンドヌクレアーゼ媒介性DNA増幅)を実行した。0.3mM dNTP、40ユニットのBst大断片DNAポリメラーゼおよび0.1ユニットのNtCviPII(New England Biolabs)を補充した100μLのサーモ(thermo)ポリメラーゼバッファー(20mMトリス−HCl、10mM (NHSO、10mM KCl、6mM MgSO、0.1%Triton(登録商標)X−100、pH8.8)において、DNAをサーマルサイクラーにおいて55℃で45分間、続いて65℃で30分間、最後に80℃で20分間インキュベートした。
次に、200pモルのT7−RND8オリゴ(配列5’>3’、gcctcgagctaatacgactcactatagagnnnnnnnn)(配列番号4420)を補充した300μLのバッファー4でDNAを希釈し、98℃で10分間煮沸し、続いて10℃まで5分間急速に冷却した。次に、反応液に、40ユニットのE.coli DNAポリメラーゼIおよび0.1mM dNTP(New England Biolabs)を補充し、室温で20分間インキュベートし、続いて75℃で20分間熱失活させた。次に、PCRクリーンアップキット(Zymo)を使用してDNAを回収し、30μLの溶出バッファー中に溶出した。
次に、blunt/TAライゲーションマスターミックス(New England Biolabs)を室温で30分間使用して、DNAを50pモルのアダプタBaeI/EcoP15Iにライゲートした。次に、0.6×Kapa SPRIビーズ(Kapa Biosystems)と共に5分間インキュベートし、ビーズを磁気ラックにより捕捉し、80%エタノールで2回洗浄し、ビーズを5分間風乾し、最後にDNAを50μLのバッファー4(50mM酢酸カリウム、20mMトリス酢酸塩、10mM酢酸マグネシウム、100μg/mL BSA、pH7.9)に再懸濁することにより、DNAを回収した。次に、回収されたDNAを20ユニットのPmeIにより30分間37℃で消化し;次いで、1.2×Kapa SPRIビーズ(Kapa Biosystems)と共に5分間インキュベートし、ビーズを磁気ラックにより捕捉し、80%エタノールで2回洗浄し、ビーズを5分間風乾し、最後にDNAを50μLのバッファー4に再懸濁することにより、DNAを回収した。これらのステップは、小型の(<100ヌクレオチド)DNAおよびBaeI/EcoP15Iアダプタ多量体を排除する。
次に、20ユニットのBaeI(New England Biolabs)、40pmol/μLのSAM(S−アデノシルメチオニン)を添加し、37℃で1時間インキュベートすることにより、精製されたDNAを消化して、アダプタ由来の配列およびCCD(および相補的HGG)モチーフの両方を排除した。次に、PCRクリーンアップキット(Zymo)を使用してDNAを回収し、20μLの溶出バッファー中に溶出した。
次に、20μLのssライゲーションバッファー(10mMビス−トリス−プロパン−HCl、10mM MgCl、1mM DTT、2.5mM MnCl、pH7、25℃で)における20ユニットのリガーゼ、20pmolのstlgRオリゴを添加し、65℃で1時間インキュベートし、続いて90℃で5分間熱失活させることにより、熱安定性5’AppDNA/RNAリガーゼ(New England Biolabs)を使用して、回収されたDNAをstlgRオリゴにライゲートした。次に、HiFidelity 2×マスターミックス(New England Biolabs)を使用して、DNA産物をPCR増幅した。プライマーT7−Ad3(配列5’>3’、gcctcgagctaatacgactcactatagag)(配列番号12)およびgRU(配列5’>3’、AAAAAAGCACCGACTCGGTG)(配列番号4419)を使用して、次の設定(98℃で3分間;98℃で20秒間、60℃で30秒間、72℃で20秒間を30サイクル)により増幅した。PCRアンプリコンは、PCRクリーンアップキットを使用してクリーンアップし、DNA配列決定によって検証し、次いで、in vitro転写反応のための鋳型として使用して、ガイドRNAを生成した。

Claims (235)

  1. 核酸の収集物であって、前記収集物中の複数の前記核酸が、
    a.調節領域を含む第1のセグメントと、
    b.標的化配列をコードする第2のセグメントと、
    c.核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードする第3のセグメントと
    を含み、前記収集物中の前記核酸の少なくとも10%のサイズが変動する、核酸の収集物。
  2. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、CRISPR/Cas系タンパク質である、請求項1に記載の収集物。
  3. 前記第2のセグメントのサイズが、前記核酸の収集物にわたって15〜250bp変動する、請求項1に記載の収集物。
  4. 前記収集物中の前記第2のセグメントの少なくとも10%が、21bpを超える、請求項1に記載の収集物。
  5. 前記第2のセグメントのサイズが、20bpではない、請求項1に記載の収集物。
  6. 前記第2のセグメントのサイズが、21bpではない、請求項1に記載の収集物。
  7. 前記核酸の収集物が、DNAの収集物である、請求項1に記載の収集物。
  8. 前記第2のセグメントが、一本鎖DNAである、請求項7に記載の収集物。
  9. 前記第3のセグメントが、一本鎖DNAである、請求項7に記載の収集物。
  10. 前記第2のセグメントが、二本鎖DNAである、請求項7に記載の収集物。
  11. 前記第3のセグメントが、二本鎖DNAである、請求項7に記載の収集物。
  12. 前記調節領域が、転写因子に結合することができる領域である、請求項1に記載の収集物。
  13. 前記調節領域が、プロモーターを含む、請求項1に記載の収集物。
  14. 前記プロモーターが、T7、SP6およびT3からなる群から選択される、請求項13に記載の収集物。
  15. 前記標的化配列が、哺乳動物ゲノム、真核生物ゲノム、原核生物ゲノムまたはウイルスゲノムへと向けられている、請求項1に記載の収集物。
  16. 前記標的化配列が、反復性または豊富なDNAへと向けられている、請求項1に記載の収集物。
  17. 前記標的化配列が、ミトコンドリアDNA、リボソームDNA、Alu DNA、セントロメアDNA、SINE DNA、LINE DNAまたはSTR DNAへと向けられている、請求項1に記載の収集物。
  18. 前記第2のセグメントの配列が、表3および/または表4から選択される、請求項1に記載の収集物。
  19. 少なくとも10個の特異な核酸分子を含む、請求項1に記載の収集物。
  20. 前記標的化配列が、PAM配列に対し5’にあるヌクレオチドの配列の反対の鎖に対し少なくとも80%相補的である、請求項1に記載の収集物。
  21. 生物のゲノムにわたって約10,000bpまたはそれ未満毎の間隔にある目的の配列に向けられた標的化配列を含む、請求項1に記載の収集物。
  22. 前記PAM配列が、AGG、CGGまたはTGGである、請求項20に記載の収集物。
  23. 前記PAM配列が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2およびCm5からなる群から選択されるCRISPR/Cas系タンパク質に特異的である、請求項20に記載の収集物。
  24. 前記第3のセグメントが、gRNAステムループ配列をコードするDNAを含む、請求項1に記載の収集物。
  25. 前記第3のセグメントの配列が、配列、GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号1)を含むRNAをコードするか、または配列、GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC(配列番号2)を含むRNAをコードする、請求項1に記載の収集物。
  26. 前記第3のセグメントの配列が、crRNAおよびtracrRNAをコードする、請求項1に記載の収集物。
  27. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、細菌種に由来する、請求項1に記載の収集物。
  28. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、古細菌種に由来する、請求項1に記載の収集物。
  29. 前記CRISPR/Cas系タンパク質が、I型、II型またはIII型タンパク質である、請求項2に記載の収集物。
  30. 前記CRISPR/Cas系タンパク質が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、Cm5、dCas9およびcas9ニッカーゼからなる群から選択される、請求項2に記載の収集物。
  31. 前記第3のセグメントが、Cas9結合配列をコードするDNAを含む、請求項1に記載の収集物。
  32. 前記収集物の複数の第3のセグメントが、第1の核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードし、前記収集物の複数の前記第3のセグメントが、第2の核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードする、請求項1に記載の収集物。
  33. 前記収集物の前記第3のセグメントが、複数の異なる核酸ガイド化ヌクレアーゼ系タンパク質の複数の異なる結合配列をコードする、請求項1に記載の収集物。
  34. 核酸の収集物であって、前記収集物中の複数の前記核酸が、
    a.調節領域を含む第1のセグメントと、
    b.標的化配列をコードする第2のセグメントであって、そのサイズが21bpを超える第2のセグメントと、
    c.核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードする第3のセグメントと
    を含む、核酸の収集物。
  35. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、CRISPR/Cas系タンパク質である、請求項34に記載の収集物。
  36. 前記収集物中の前記核酸の少なくとも10%のサイズが変動する、請求項34に記載の収集物。
  37. 前記第2のセグメントのサイズが、前記核酸の収集物にわたって22〜250bp変動する、請求項34に記載の収集物。
  38. 前記収集物中の前記第2のセグメントの少なくとも10%が、30bpを超える、請求項34に記載の収集物。
  39. 前記核酸の収集物が、DNAの収集物である、請求項34に記載の収集物。
  40. 前記第2のセグメントが、一本鎖DNAである、請求項39に記載の収集物。
  41. 前記第3のセグメントが、一本鎖DNAである、請求項39に記載の収集物。
  42. 前記第2のセグメントが、二本鎖DNAである、請求項39に記載の収集物。
  43. 前記第3のセグメントが、二本鎖DNAである、請求項39に記載の収集物。
  44. 前記調節領域が、転写因子に結合することができる領域である、請求項34に記載の収集物。
  45. 前記調節領域が、プロモーターを含む、請求項34に記載の収集物。
  46. 前記プロモーターが、T7、SP6およびT3からなる群から選択される、請求項45に記載の収集物。
  47. 前記標的化配列が、哺乳動物ゲノム、真核生物ゲノム、原核生物ゲノムまたはウイルスゲノムへと向けられている、請求項34に記載の収集物。
  48. 前記標的化配列が、反復性または豊富なDNAへと向けられている、請求項34に記載の収集物。
  49. 前記標的化配列が、ミトコンドリアDNA、リボソームDNA、Alu DNA、セントロメアDNA、SINE DNA、LINE DNAまたはSTR DNAへと向けられている、請求項34に記載の収集物。
  50. 前記第2のセグメントの配列が、表3および/または表4から選択される、請求項34に記載の収集物。
  51. 少なくとも10個の特異な核酸分子を含む、請求項34に記載の収集物。
  52. 生物のゲノムにわたって約10,000bpまたはそれ未満毎の間隔にある目的の配列に向けられた標的化配列を含む、請求項33に記載の収集物。
  53. 前記標的化配列が、PAM配列に対し5’にあるヌクレオチドの配列の反対の鎖に対し少なくとも80%相補的である、請求項34に記載の収集物。
  54. 前記PAM配列が、AGG、CGGまたはTGGである、請求項53に記載の収集物。
  55. 前記PAM配列が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2およびCm5からなる群から選択されるCRISPR/Cas系タンパク質に特異的である、請求項53に記載の収集物。
  56. 前記第3のセグメントが、gRNAステムループ配列をコードするDNAを含む、請求項34に記載の収集物。
  57. 前記第3のセグメントが、配列、GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号1)を含むRNAをコードするか、または配列、GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC(配列番号2)を含むRNAをコードする、請求項34に記載の収集物。
  58. 前記第3のセグメントが、crRNAおよびtracrRNAをコードする、請求項34に記載の収集物。
  59. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、細菌種に由来する、請求項34に記載の収集物。
  60. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、古細菌種に由来する、請求項34に記載の収集物。
  61. 前記CRISPR/Cas系タンパク質が、I型、II型またはIII型タンパク質である、請求項35に記載の収集物。
  62. 前記CRISPR/Cas系タンパク質が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、Cm5、dCas9およびcas9ニッカーゼからなる群から選択される、請求項35に記載の収集物。
  63. 前記第3のセグメントが、Cas9結合配列をコードするDNAを含む、請求項34に記載の収集物。
  64. 前記収集物の複数の第3のセグメントが、第1の核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードし、前記収集物の複数の前記第3のセグメントが、第2の核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードする、請求項34に記載の収集物。
  65. 前記収集物の前記第3のセグメントが、複数の異なる核酸ガイド化ヌクレアーゼ系タンパク質の複数の異なる結合配列をコードする、請求項34に記載の収集物。
  66. a.標的化配列を含む第1のRNAセグメントと、
    b.核酸ガイド化ヌクレアーゼ系タンパク質結合配列を含む第2のRNAセグメントと
    を含むガイドRNA(gRNA)の収集物であって、前記収集物中の前記gRNAの少なくとも10%のサイズが変動する、ガイドRNA(gRNA)の収集物。
  67. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、CRISPR/Cas系タンパク質である、請求項66に記載の収集物。
  68. 前記第1のセグメントのサイズが、前記gRNAの収集物にわたって15〜250bp変動する、請求項66に記載の収集物。
  69. 前記収集物中の前記第1のセグメントの少なくとも10%が、21bpを超える、請求項66に記載の収集物。
  70. 前記第1のセグメントのサイズが、20bpではない、請求項66に記載の収集物。
  71. 前記第1のセグメントのサイズが、21bpではない、請求項66に記載の収集物。
  72. 前記標的化配列が、哺乳動物ゲノム、真核生物ゲノム、原核生物ゲノムまたはウイルスゲノムへと向けられている、請求項66に記載の収集物。
  73. 前記標的化配列が、反復性または豊富なDNAへと向けられている、請求項66に記載の収集物。
  74. 前記標的化配列が、ミトコンドリアDNA、リボソームDNA、Alu DNA、セントロメアDNA、SINE DNA、LINE DNAまたはSTR DNAへと向けられている、請求項66に記載の収集物。
  75. 前記第1のセグメントの配列が、表3および/または表4から選択される配列によってコードされるRNAである、請求項66に記載の収集物。
  76. 少なくとも10個の特異なgRNAを含む、請求項66に記載の収集物。
  77. 前記gRNAが、シトシン、グアニンおよびアデニンを含む、請求項66に記載の収集物。
  78. 前記gRNAのサブセットが、チミンをさらに含む、請求項77に記載の収集物。
  79. 前記gRNAのサブセットが、ウラシルをさらに含む、請求項77に記載の収集物。
  80. 前記第1のセグメントが、目的の標的ゲノム配列に対し少なくとも80%相補的である、請求項66に記載の収集物。
  81. 前記標的化配列が、PAM配列に対し5’にあるヌクレオチドの配列の反対の鎖に対し少なくとも80%相補的である、請求項66に記載の収集物。
  82. 前記PAM配列が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2およびCm5からなる群から選択されるCRISPR/Cas系タンパク質に特異的である、請求項66に記載の収集物。
  83. 前記第2のセグメントが、gRNAステムループ配列を含む、請求項66に記載の収集物。
  84. 前記第2のセグメントの配列が、GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号1)を含むか、またはGUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC(配列番号2)を含む、請求項66に記載の収集物。
  85. 前記第2のセグメントが、crRNAおよびtracrRNAを含む、請求項66に記載の収集物。
  86. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、細菌種に由来する、請求項66に記載の収集物。
  87. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、古細菌種に由来する、請求項66に記載の収集物。
  88. 前記CRISPR/Cas系タンパク質が、I型、II型またはIII型タンパク質である、請求項67に記載の収集物。
  89. 前記CRISPR/Cas系タンパク質が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、Cm5、dCas9およびcas9ニッカーゼならびにそれらの操作されたバージョンからなる群から選択される、請求項67に記載の収集物。
  90. 前記第2のセグメントが、Cas9結合配列を含む、請求項66に記載の収集物。
  91. 前記収集物中の前記gRNAの少なくとも10%が、それらの5’末端の配列が変動する、請求項66に記載の収集物。
  92. 生物のゲノムにわたって10,000bpまたはそれ未満毎の間隔にある目的の配列に向けられた標的化配列を含む、請求項66に記載の収集物。
  93. 前記収集物の複数の第2のセグメントが、第1の核酸ガイド化ヌクレアーゼ系タンパク質結合配列を含み、前記収集物の複数の前記第2のセグメントが、第2の核酸ガイド化ヌクレアーゼ系タンパク質結合配列を含む、請求項66に記載の収集物。
  94. 前記収集物の前記第2のセグメントが、複数の異なる核酸ガイド化ヌクレアーゼ系タンパク質の複数の異なる結合配列を含む、請求項66に記載の収集物。
  95. 前記収集物の複数の前記gRNAが、基材に付着された、請求項66に記載の収集物。
  96. 前記収集物の複数の前記gRNAが、標識を含む、請求項66に記載の収集物。
  97. 前記収集物の前記複数のgRNAが、異なる標識を含む、請求項96に記載の収集物。
  98. a.調節領域を含む第1のセグメントと、
    b.標的化配列をコードする第2のセグメントであって、前記標的化配列が、30bpを超える、第2のセグメントと、
    c.核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードする核酸をコードする第3のセグメントと
    を含む核酸。
  99. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、CRISPR/Cas系タンパク質である、請求項98に記載の核酸。
  100. DNAである、請求項98に記載の核酸。
  101. 前記第2のセグメントが、一本鎖DNAである、請求項98に記載の核酸。
  102. 前記第3のセグメントが、一本鎖DNAである、請求項98に記載の核酸。
  103. 前記第2のセグメントが、二本鎖DNAである、請求項98に記載の核酸。
  104. 前記第3のセグメントが、二本鎖DNAである、請求項98に記載の核酸。
  105. 前記調節領域が、転写因子に結合することができる領域である、請求項98に記載の核酸。
  106. 前記調節領域が、プロモーターを含む、請求項98に記載の核酸。
  107. 前記プロモーターが、T7、SP6およびT3からなる群から選択される、請求項106に記載の収集物。
  108. 前記標的化配列が、哺乳動物ゲノム、真核生物ゲノム、原核生物ゲノムまたはウイルスゲノムへと向けられている、請求項98に記載の核酸。
  109. 前記標的化配列が、豊富なまたは反復性DNAへと向けられている、請求項98に記載の核酸。
  110. 前記標的化配列が、ミトコンドリアDNA、リボソームDNA、Alu DNA、セントロメアDNA、SINE DNA、LINE DNAまたはSTR DNAへと向けられている、請求項98に記載の核酸。
  111. 前記標的化配列が、PAM配列に対し5’にあるヌクレオチドの配列の反対の鎖に対し少なくとも80%相補的である、請求項98に記載の収集物。
  112. 目的の標的ゲノム配列が、PAM配列の5’上流にある、請求項111に記載の核酸。
  113. 前記PAM配列が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2およびCm5からなる群から選択されるCRISPR/Cas系タンパク質に特異的である、請求項112に記載の核酸。
  114. 前記第3のセグメントが、gRNAステムループ配列をコードするDNAを含む、請求項98に記載の核酸。
  115. 前記第3のセグメントの配列が、配列、GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号1)を含むRNAをコードするか、または配列、GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC(配列番号2)を含むRNAをコードする、請求項98に記載の核酸。
  116. 前記第3のセグメントが、crRNAおよびtracrRNAをコードする、請求項98に記載の核酸。
  117. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、細菌種に由来する、請求項98に記載の核酸。
  118. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、古細菌種に由来する、請求項98に記載の核酸。
  119. 前記CRISPR/Cas系タンパク質が、I型、II型またはIII型タンパク質である、請求項99に記載の核酸。
  120. 前記CRISPR/Cas系タンパク質が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、Cm5、dCas9およびcas9ニッカーゼからなる群から選択される、請求項99に記載の核酸。
  121. 前記第3のセグメントが、Cas9結合配列をコードするDNAを含む、請求項98に記載の核酸。
  122. a.標的化配列を含む第1のセグメントであって、そのサイズが30bpを超える第1のセグメントと
    b.核酸ガイド化ヌクレアーゼ系タンパク質結合配列を含む第2のセグメントと
    を含むガイドRNA。
  123. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、CRISPR/Cas系タンパク質である、請求項122に記載のガイドRNA。
  124. アデニン、グアニンおよびシトシンを含む、請求項122に記載のガイドRNA。
  125. チミンをさらに含む、請求項123に記載のガイドRNA。
  126. ウラシルをさらに含む、請求項123に記載のガイドRNA。
  127. 前記第1のRNAセグメントのサイズが、30〜250bpの間である、請求項122に記載のガイドRNA。
  128. 前記標的化配列が、哺乳動物ゲノム、真核生物ゲノム、原核生物ゲノムまたはウイルスゲノムへと向けられている、請求項122に記載のガイドRNA。
  129. 前記標的化配列が、反復性または豊富なDNAへと向けられている、請求項122に記載のガイドRNA。
  130. 前記標的化配列が、ミトコンドリアDNA、リボソームDNA、Alu DNA、セントロメアDNA、SINE DNA、LINE DNAまたはSTR DNAへと向けられている、請求項122に記載のガイドRNA。
  131. 前記第1のセグメントが、目的の標的ゲノム配列に対し少なくとも80%相補的である、請求項122に記載のガイドRNA。
  132. 前記標的化配列が、PAM配列に対し5’にあるヌクレオチドの配列の反対の鎖に対し少なくとも80%相補的である、請求項122に記載のガイドRNA。
  133. 前記第2のセグメントが、gRNAステムループ配列を含む、請求項122に記載のガイドRNA。
  134. 前記第2のセグメントの配列が、GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号1)を含むか、またはGUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC(配列番号2)を含む、請求項122に記載のガイドRNA。
  135. 前記第2のセグメントの配列が、crRNAおよびtracrRNAを含む、請求項122に記載のガイドRNA。
  136. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、細菌種に由来する、請求項122に記載のガイドRNA。
  137. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、古細菌種に由来する、請求項122に記載のガイドRNA。
  138. 前記CRISPR/Cas系タンパク質が、I型、II型またはIII型タンパク質である、請求項123に記載のガイドRNA。
  139. 前記CRISPR/Cas系タンパク質が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、Cm5、dCas9およびcas9ニッカーゼ、ならびにそれらの操作されたバージョンからなる群から選択される、請求項123に記載のガイドRNA。
  140. 前記第2のセグメントが、Cas9結合配列である、請求項122に記載のガイドRNA。
  141. Cas9タンパク質と、請求項122に記載のgRNAとを含む複合体。
  142. 試料における標的化された配列の枯渇および分配、非宿主核酸についての試料の濃縮、または試料における標的化された核酸の連続的な枯渇のための方法であって、
    a.試料から抽出された核酸を提供するステップと、
    b.(i)請求項66に記載のgRNAの収集物、および(ii)核酸ガイド化ヌクレアーゼ系タンパク質を含む複数の複合体と前記試料とを接触させるステップと
    を含む方法。
  143. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、CRISPR/Cas系タンパク質を含む、請求項142に記載の方法。
  144. 前記CRISPR/Cas系タンパク質が、Cas9を含む、請求項143に記載の方法。
  145. 核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAにライゲートされた標的化配列をコードするDNAをそれぞれ含む核酸の収集物を作製する方法であって、
    a.PAM配列に対し5’にある目的の配列および反対の鎖におけるその逆相補的配列をそれぞれ含む二本鎖DNA分子を提供するステップと、
    b.前記二本鎖DNA分子において酵素消化反応を実行するステップであって、切断が、前記PAM配列および/または反対の鎖におけるその逆相補的配列に生成されるが、前記二本鎖DNAから前記PAM配列および/または反対の鎖におけるその逆相補的配列を完全に除去しないステップと、
    c.認識配列を含むアダプタをステップ(b)の結果生じたDNA分子にライゲートするステップと、
    d.ステップ(c)の前記認識配列を認識する制限酵素とステップ(c)の前記DNA分子とを接触させるステップであって、それによって、前記PAM配列に対してすぐ接して5’にある平滑末端化された二本鎖切断を含むDNA断片を生成し、それによって、前記PAM配列および酵素認識部位を含有する前記アダプタを除去するステップと、
    e.ステップ(d)の結果生じた二本鎖DNA断片を、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAとライゲートするステップであって、それによって、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAにライゲートされた標的化配列をコードするDNAをそれぞれ含む複数のDNA断片を生成するステップと
    を含む方法。
  146. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、CRISPR/Cas系タンパク質である、請求項145に記載の方法。
  147. 前記収集物の出発DNA分子が、前記PAM配列に対し5’にある前記目的の配列の上流の調節配列をさらに含む、請求項145に記載の方法。
  148. 前記調節配列が、プロモーターを含む、請求項146に記載の方法。
  149. 前記プロモーターが、T7、Sp6またはT3配列を含む、請求項148に記載の方法。
  150. 前記二本鎖DNA分子が、ゲノムDNA、インタクトなDNAまたは剪断されたDNAである、請求項145に記載の方法。
  151. 前記ゲノムDNAが、ヒト、マウス、鳥類、魚類、植物、昆虫、細菌またはウイルスである、請求項150に記載の方法。
  152. 標的化配列をコードするDNAセグメントが、少なくとも22bpである、請求項145に記載の方法。
  153. 標的化配列をコードするDNAセグメントが、15〜250bpのサイズ範囲である、請求項145に記載の方法。
  154. 前記PAM配列が、AGG、CGGまたはTGGである、請求項145に記載の方法。
  155. 前記PAM配列が、Cas9、Cpf1、Cas3、Cas8a〜c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2およびCm5からなる群から選択されるCRISPR/Cas系タンパク質に特異的である、請求項145に記載の方法。
  156. ステップ(b)が、(1)CCD部位において一本鎖にニックを作製することができる酵素と前記DNA分子とを接触させるステップであって、それによって、目的の配列およびそれに続くHGG配列をそれぞれ含む複数のニック二本鎖DNA分子を生成し、前記DNA分子が、前記CCD部位においてニックを入れられるステップと、(2)エンドヌクレアーゼと前記ニック二本鎖DNA分子とを接触させるステップであって、それによって、目的の配列およびそれに続くHGG配列をそれぞれ含む複数の二本鎖DNA断片を生成し、HGGおよび/またはCCD配列由来の残っているヌクレオチドが取り残されるステップとをさらに含む、請求項145に記載の方法。
  157. ステップ(d)が、ステップ(c)の前記認識配列を認識する前記制限酵素により切断する前のステップ(c)由来の、前記アダプタがライゲートされたDNA断片のPCR増幅をさらに含み、PCR後に、前記認識配列が、前記PAM配列の3’に位置し、調節配列が、前記PAM配列の5’遠位端に位置する、請求項145に記載の方法。
  158. ステップ(b)の酵素反応が、Nt.CviPII酵素およびT7エンドヌクレアーゼI酵素の使用を含む、請求項145に記載の方法。
  159. ライゲートされるべき前記アダプタが、オーバーハングを含まない場合、ステップ(c)が、T4 DNAポリメラーゼによる平滑末端反応をさらに含む、請求項145に記載の方法。
  160. ステップ(c)の前記アダプタが、(1)前記アダプタがY字型であり、オーバーハングを含む場合、一方の鎖に制限酵素認識配列を、他方の鎖に調節配列を含む二本鎖である;または(2)前記アダプタがY字型でない場合、両方の鎖にパリンドローム酵素認識配列を有する、のいずれかである、請求項145に記載の方法。
  161. ステップ(d)の前記制限酵素が、MlyIである、請求項145に記載の方法。
  162. ステップ(d)が、XhoI酵素と前記DNA分子とを接触させるステップをさらに含む、請求項145に記載の方法。
  163. ステップ(e)において、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードする前記DNAが、配列、GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号1)を含むRNAをコードするか、または配列、GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC(配列番号2)を含むRNAをコードする、請求項145に記載の方法。
  164. 前記目的の標的化された配列が、生物のゲノムにわたって10,000bpまたはそれ未満毎の間隔にある、請求項145に記載の方法。
  165. 核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAにライゲートされた標的化配列をコードするDNAをそれぞれ含む核酸の収集物を作製する方法であって、
    a.目的の配列、NGG部位およびその相補体CCN部位をそれぞれ含む複数の二本鎖DNA分子を提供するステップと、
    b.CCN部位において一本鎖にニックを作製することができる酵素と前記分子とを接触させるステップであって、それによって、前記NGG部位に対して5’に目的の配列をそれぞれ含む複数のニック二本鎖DNA分子を生成し、前記DNA分子が、前記CCD部位にニックを入れられるステップと、
    c.エンドヌクレアーゼと前記ニック二本鎖DNA分子とを接触させるステップであって、それによって、目的の配列をそれぞれ含む複数の二本鎖DNA断片を生成し、前記断片が、末端オーバーハングを含むステップと、
    d.5’から3’のエキソヌクレアーゼ活性がない酵素と前記二本鎖DNA断片とを接触させるステップであって、前記二本鎖DNA断片を平滑末端化し、それによって、目的の配列をそれぞれ含む複数の平滑末端化二本鎖断片を生成するステップと、
    e.末端NGG部位を切断する酵素とステップdの前記平滑末端化二本鎖断片とを接触させるステップと、
    f.ステップeの結果生じた二本鎖DNA断片を、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAとライゲートするステップであって、それによって、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAにライゲートされた標的化配列をそれぞれ含む複数のDNA断片を生成するステップと
    を含む方法。
  166. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、CRISPR/Cas系タンパク質である、請求項165に記載の方法。
  167. 前記複数の二本鎖DNA分子が、前記NGG部位の5’上流に調節配列を有する、請求項165に記載の方法。
  168. 調節配列が、T7、SP6またはT3配列を含む、請求項166に記載の方法。
  169. NGG部位が、AGG、CGGまたはTGGを含み、CCN部位が、CCT、CCGまたはCCAを含む、請求項153に記載の方法。
  170. 目的の配列をそれぞれ含む前記複数の二本鎖DNA分子が、ゲノムDNAの剪断された断片を含む、請求項165に記載の方法。
  171. 前記ゲノムDNAが、哺乳動物、原核生物、真核生物、鳥類、細菌またはウイルスである、請求項170に記載の方法。
  172. ステップ(a)における前記複数の二本鎖DNA分子が、少なくとも500bpである、請求項165に記載の方法。
  173. ステップbにおける前記酵素が、Nt.CviPII酵素である、請求項165に記載の方法。
  174. ステップcにおける前記酵素が、T7エンドヌクレアーゼIである、請求項165に記載の方法。
  175. ステップdにおける前記酵素が、T4 DNAポリメラーゼである、請求項165に記載の方法。
  176. ステップfにおいて、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードする前記DNAが、配列、GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号1)を含むRNAをコードするか、または配列、GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC(配列番号2)を含むRNAをコードする、請求項165に記載の方法。
  177. 前記ステップeが、MlyI認識部位を保有するアダプタをライゲートするステップと、MlyI酵素により消化するステップとを追加で含む、請求項165に記載の方法。
  178. 前記目的の配列が、ゲノムにわたって、10,000bpまたはそれ未満毎の間隔にある、請求項165に記載の方法。
  179. 標的化配列をコードするDNAおよび核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAをそれぞれ含む核酸の収集物を作製する方法であって、
    a.NGGおよびCCN部位を含む複数の目的の配列を含むゲノムDNAを提供するステップと、
    b.前記ゲノムDNAにニックを作製することができる酵素と前記ゲノムDNAとを接触させるステップであって、それによって、CCN部位にニックを入れられたニックゲノムDNAを生成するステップと、
    c.エンドヌクレアーゼと前記ニックゲノムDNAとを接触させるステップであって、それによって、オーバーハングを有する二本鎖DNA断片を生成するステップと、
    d.ステップc由来のオーバーハングを有する前記DNAをY字型アダプタにライゲートステップであって、これによって、前記NGG部位の3’のみに制限酵素認識配列を、前記目的の配列の5’に調節配列を導入するステップと、
    e.前記酵素認識配列を保有する前記アダプタと共に前記NGG部位を切断除去する酵素とステップd由来の産物とを接触させるステップと、
    f.ステップeの結果生じた二本鎖DNA断片を、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAとライゲートするステップであって、それによって、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードするDNAにライゲートされた目的の配列をそれぞれ含む複数のDNA断片を生成するステップと
    を含む方法。
  180. 前記核酸ガイド化ヌクレアーゼ系タンパク質が、CRISPR/Cas系タンパク質である、請求項179に記載の方法。
  181. 前記NGG部位が、AGG、CGGまたはTGGを含み、CCN部位が、CCT、CCGまたはCCAを含む、請求項179に記載の方法。
  182. 前記調節配列が、プロモーター配列を含む、請求項179に記載の方法。
  183. 前記プロモーター配列が、T7、SP6またはT3配列を含む、請求項182に記載の方法。
  184. 前記DNA断片が、ゲノムDNAの剪断された断片である、請求項179に記載の方法。
  185. 前記ゲノムDNAが、哺乳動物、原核生物、真核生物またはウイルスである、請求項179に記載の方法。
  186. 前記断片が、少なくとも200bpである、請求項179に記載の方法。
  187. ステップbにおける前記酵素が、Nt.CviPII酵素である、請求項179に記載の方法。
  188. ステップcにおける前記酵素が、T7エンドヌクレアーゼIである、請求項179に記載の方法。
  189. ステップdが、前記アダプタがライゲートされたDNAのPCR増幅をさらに含む、請求項179に記載の方法。
  190. ステップfにおいて、核酸ガイド化ヌクレアーゼ系タンパク質結合配列をコードする前記DNAが、配列、GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号1)を含むRNAをコードするか、または配列、GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUUC(配列番号2)を含むRNAをコードする、請求項179に記載の方法。
  191. ステップeにおいてNGG部位を除去する前記酵素が、MlyIである、請求項179に記載の方法。
  192. 前記収集物の前記目的の標的が、ゲノムにわたって、10,000bpまたはそれ未満毎の間隔にある、請求項179に記載の方法。
  193. 請求項1に記載の核酸の収集物を含むキット。
  194. 請求項34に記載の核酸の収集物を含むキット。
  195. 請求項66に記載のガイドRNAの収集物を含むキット。
  196. ガイド核酸の収集物を作製する方法であって、
    a.供給源試料における豊富な細胞を得るステップと、
    b.前記豊富な細胞から核酸を収集するステップと、
    c.前記核酸からガイド核酸(gNA)の収集物を調製するステップと
    を含む方法。
  197. 前記豊富な細胞が、前記供給源試料における1または複数の最も豊富な細菌種由来の細胞を含む、請求項196に記載の方法。
  198. 前記豊富な細胞が、2以上の種由来の細胞を含む、請求項196に記載の方法。
  199. 前記豊富な細胞が、ヒト細胞を含む、請求項196に記載の方法。
  200. 前記豊富な細胞が、動物細胞を含む、請求項196に記載の方法。
  201. 前記豊富な細胞が、植物細胞を含む、請求項196に記載の方法。
  202. 前記豊富な細胞が、細菌細胞を含む、請求項196に記載の方法。
  203. gNAの前記ライブラリーと核酸ガイド化ヌクレアーゼとを接触させるステップであって、核酸ガイド化ヌクレアーゼ−gNA複合体を形成するステップをさらに含む、請求項196に記載の方法。
  204. 前記核酸ガイド化ヌクレアーゼ−gNA複合体を使用するステップをさらに含み、標的部位において標的核酸を切断し、前記gNAが、前記標的部位に対して相補的である、請求項203に記載の方法。
  205. 前記標的核酸が、前記供給源試料に由来する、請求項204に記載の方法。
  206. 前記標的核酸の種が、前記供給源試料の種と同じである、請求項204に記載の方法。
  207. 前記標的核酸の前記種および前記供給源試料の前記種が、ヒトである、請求項206に記載の方法。
  208. 前記標的核酸の前記種および前記供給源試料の前記種が、動物である、請求項206に記載の方法。
  209. 前記標的核酸の前記種および前記供給源試料の前記種が、植物である、請求項206に記載の方法。
  210. 標的化配列をそれぞれ含む核酸の収集物を作製する方法であって、
    a.供給源DNAを得るステップと、
    b.ニッキング酵素認識部位においてニッキング酵素により前記供給源DNAにニックを入れるステップであって、これによって、近位ニックに二本鎖切断を生成するステップと、
    c.前記二本鎖切断のオーバーハングを修復するステップであって、これによって、(i)標的化配列および(ii)前記ニッキング酵素認識部位を含む二本鎖断片を生成するステップと
    を含む方法。
  211. 標的化配列をそれぞれ含む核酸の収集物を作製する方法であって、
    a.供給源DNAを得るステップと、
    b.ニッキング酵素認識部位においてニッキング酵素により前記供給源DNAにニックを入れるステップであって、これによって、ニックを生成するステップと、
    c.前記ニックから新しい鎖を合成するステップであって、これにより、標的化配列を含む前記供給源DNAの一本鎖断片を生成するステップと
    を含む方法。
  212. 前記一本鎖断片から前記標的化配列を含む二本鎖断片を生成するステップをさらに含む、請求項211に記載の方法。
  213. 前記二本鎖断片を生成するステップが、ランダムプライミングおよび伸長を含む、請求項212に記載の方法。
  214. 前記ランダムプライミングが、ランダムn−mer領域およびプロモーター領域を含むプライマーにより行われる、請求項213に記載の方法。
  215. 前記ランダムn−mer領域が、ランダムヘキサマー領域である、請求項214に記載の方法。
  216. 前記ランダムn−mer領域が、ランダムオクタマー領域である、請求項214に記載の方法。
  217. 前記プロモーター領域が、T7プロモーター領域である、請求項214に記載の方法。
  218. ヌクレアーゼ認識部位を含むヌクレアーゼ認識部位核酸を前記二本鎖断片にライゲートするステップをさらに含む、請求項210または212に記載の方法。
  219. 前記ヌクレアーゼ認識部位が、前記ニッキング酵素認識部位の長さに等しい前記ヌクレアーゼ認識部位からの距離において切断するヌクレアーゼに対応する、請求項218に記載の方法。
  220. 前記ヌクレアーゼ認識部位が、MlyI認識部位である、請求項219に記載の方法。
  221. 前記ヌクレアーゼ認識部位が、BaeI認識部位である、請求項219に記載の方法。
  222. 前記ヌクレアーゼにより前記二本鎖断片を消化するステップをさらに含み、これによって、前記二本鎖断片から前記ニッキング酵素認識部位を除去する、請求項219に記載の方法。
  223. 前記二本鎖断片を、核酸ガイド化ヌクレアーゼ系タンパク質認識部位を含む核酸ガイド化ヌクレアーゼ系タンパク質認識部位核酸にライゲートするステップをさらに含む、請求項222に記載の方法。
  224. 前記核酸ガイド化ヌクレアーゼ系タンパク質認識部位が、ガイドRNAステムループ配列を含む、請求項223に記載の方法。
  225. 前記ヌクレアーゼ認識部位が、前記標的化配列の長さに等しい前記ヌクレアーゼ認識部位からの距離において切断するヌクレアーゼに対応する、請求項218に記載の方法。
  226. 前記標的化配列の前記長さが、20塩基対である、請求項225に記載の方法。
  227. 前記ヌクレアーゼ認識部位が、MmeI認識部位である、請求項225に記載の方法。
  228. 前記ヌクレアーゼにより前記二本鎖断片を消化するステップをさらに含む、請求項225に記載の方法。
  229. 前記ヌクレアーゼ認識部位が、前記標的化配列の長さプラス前記ニッキング酵素認識部位の長さに等しい前記ヌクレアーゼ認識部位からの距離において切断するヌクレアーゼに対応する、請求項218に記載の方法。
  230. 前記標的化配列の前記長さプラス前記ニッキング酵素認識部位の長さが、23塩基対である、請求項229に記載の方法。
  231. 前記ヌクレアーゼ認識部位が、EcoP15I認識部位である、請求項229に記載の方法。
  232. 前記ヌクレアーゼにより前記二本鎖断片を消化するステップをさらに含む、請求項229に記載の方法。
  233. 前記二本鎖断片を、核酸ガイド化ヌクレアーゼ系タンパク質認識部位を含む核酸ガイド化ヌクレアーゼ系タンパク質認識部位核酸にライゲートするステップをさらに含む、請求項212に記載の方法。
  234. 前記核酸ガイド化ヌクレアーゼ系タンパク質認識部位が、ガイドRNAステムループ配列を含む、請求項233に記載の方法。
  235. 請求項145、165、179、196、210または211に記載の方法を実施するための、あらゆる必須の試薬および説明書を含むキット。
JP2018529124A 2015-12-07 2016-12-07 ガイド核酸を作製および使用するための方法および組成物 Active JP6995751B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021103316A JP2021141904A (ja) 2015-12-07 2021-06-22 ガイド核酸を作製および使用するための方法および組成物
JP2024030061A JP2024051149A (ja) 2015-12-07 2024-02-29 ガイド核酸を作製および使用するための方法および組成物

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562264262P 2015-12-07 2015-12-07
US62/264,262 2015-12-07
US201662298963P 2016-02-23 2016-02-23
US62/298,963 2016-02-23
PCT/US2016/065420 WO2017100343A1 (en) 2015-12-07 2016-12-07 Methods and compositions for the making and using of guide nucleic acids

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021103316A Division JP2021141904A (ja) 2015-12-07 2021-06-22 ガイド核酸を作製および使用するための方法および組成物

Publications (3)

Publication Number Publication Date
JP2018535689A true JP2018535689A (ja) 2018-12-06
JP2018535689A5 JP2018535689A5 (ja) 2020-01-16
JP6995751B2 JP6995751B2 (ja) 2022-02-04

Family

ID=59013518

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2018529124A Active JP6995751B2 (ja) 2015-12-07 2016-12-07 ガイド核酸を作製および使用するための方法および組成物
JP2021103316A Withdrawn JP2021141904A (ja) 2015-12-07 2021-06-22 ガイド核酸を作製および使用するための方法および組成物
JP2024030061A Pending JP2024051149A (ja) 2015-12-07 2024-02-29 ガイド核酸を作製および使用するための方法および組成物

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2021103316A Withdrawn JP2021141904A (ja) 2015-12-07 2021-06-22 ガイド核酸を作製および使用するための方法および組成物
JP2024030061A Pending JP2024051149A (ja) 2015-12-07 2024-02-29 ガイド核酸を作製および使用するための方法および組成物

Country Status (8)

Country Link
US (2) US10787662B2 (ja)
EP (2) EP3386550B1 (ja)
JP (3) JP6995751B2 (ja)
CN (1) CN109310784B (ja)
AU (1) AU2016365720B2 (ja)
CA (1) CA3006781A1 (ja)
DK (1) DK3386550T3 (ja)
WO (1) WO2017100343A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL3105328T3 (pl) 2014-02-11 2020-10-19 The Regents Of The University Of Colorado, A Body Corporate Umożliwiana przez CRISPR multipleksowa modyfikacja genomu
CN109310784B (zh) 2015-12-07 2022-08-19 阿克生物公司 用于制备和使用指导核酸的方法和组合物
AU2017280353B2 (en) 2016-06-24 2021-11-11 Inscripta, Inc. Methods for generating barcoded combinatorial libraries
US20200190508A1 (en) * 2017-06-07 2020-06-18 Arc Bio, Llc Creation and use of guide nucleic acids
IT201700067084A1 (it) * 2017-06-16 2018-12-16 Univ Degli Studi Di Palermo Metodo in vitro per l’arricchimento in sequenze genomiche bersaglio mediante sistema CRISPR-Cas
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
EP3640333A4 (en) * 2017-07-14 2020-12-30 Cure Genetics Co., Ltd GENE EDITING SYSTEM AND GENE EDITING METHOD
EP3673054A4 (en) 2017-08-22 2021-06-02 Napigen, Inc. MODIFICATION OF THE GENOME OF ORGANITES USING POLYNUCLEOTID-GUIDED ENDONUCLEASE
EP3794130A4 (en) 2018-05-16 2022-07-27 Synthego Corporation METHODS AND SYSTEMS FOR DESIGN AND USE OF GUIDE RNA
CA3101648A1 (en) 2018-06-07 2019-12-12 Arc Bio, Llc Compositions and methods for making guide nucleic acids
KR102200109B1 (ko) * 2018-09-12 2021-01-08 한국과학기술정보연구원 표적 서열 증폭용 올리고 뉴클레오타이드 및 이를 이용한 표적 서열의 증폭 방법
EP4296373A3 (en) 2018-10-04 2024-01-24 Arc Bio, LLC Normalization controls for managing low sample inputs in next generation sequencing
ES2969026T3 (es) 2019-03-18 2024-05-16 Regeneron Pharma Plataforma de detección de abandonos CRISPR/CAS para revelar vulnerabilidades genéticas asociadas con la agregación de tau
WO2020190932A1 (en) 2019-03-18 2020-09-24 Regeneron Pharmaceuticals, Inc. Crispr/cas screening platform to identify genetic modifiers of tau seeding or aggregation
EP3953471A4 (en) * 2019-04-09 2023-02-01 Arc Bio, LLC COMPOSITIONS AND METHODS OF DEPLETION BASED ON NUCLEOTIDE MODIFICATION
JP2022536606A (ja) 2019-06-14 2022-08-18 リジェネロン・ファーマシューティカルズ・インコーポレイテッド タウオパチーのモデル
CN114293264A (zh) * 2021-12-21 2022-04-08 翌圣生物科技(上海)股份有限公司 酶法靶序列随机sgRNA文库的制备方法
CN114277447A (zh) * 2021-12-21 2022-04-05 翌圣生物科技(上海)股份有限公司 靶序列随机sgRNA全覆盖组的制备方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012522489A (ja) * 2009-03-09 2012-09-27 ニユー・イングランド・バイオレイブス・インコーポレイテツド 酵素を使用するdnaにおけるランダム二本鎖切断
WO2015050501A1 (en) * 2013-10-03 2015-04-09 Agency For Science, Technology And Research Amplification paralleled library enrichment
WO2015089473A1 (en) * 2013-12-12 2015-06-18 The Broad Institute Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8476011B1 (en) 1996-06-18 2013-07-02 Bp Corporation North America Inc. Construction and use of catalogued nucleic acid libraries that contain advantageously adjusted representations of defined components
US5948902A (en) 1997-11-20 1999-09-07 South Alabama Medical Science Foundation Antisense oligonucleotides to human serine/threonine protein phosphatase genes
US20050233340A1 (en) 2004-04-20 2005-10-20 Barrett Michael T Methods and compositions for assessing CpG methylation
US8323930B2 (en) 2007-07-28 2012-12-04 Dna Twopointo, Inc. Methods, compositions and kits for one-step DNA cloning using DNA topoisomerase
US8029993B2 (en) 2008-04-30 2011-10-04 Population Genetics Technologies Ltd. Asymmetric adapter library construction
EP2393940B1 (en) 2009-02-03 2014-12-17 New England Biolabs, Inc. Generation of random double-strand breaks in dna using enzymes
US9689012B2 (en) 2010-10-12 2017-06-27 Cornell University Method of dual-adapter recombination for efficient concatenation of multiple DNA fragments in shuffled or specified arrangements
DK2500436T3 (en) 2011-03-17 2016-08-29 Pasteur Institut A method, probe and kit for in situ hybridization of DNA and use thereof
PT2800811T (pt) 2012-05-25 2017-08-17 Univ California Métodos e composições para modificação de adn alvo dirigida por arn e para modulação dirigida por arn de transcrição
WO2013188522A2 (en) * 2012-06-12 2013-12-19 Genentech, Inc. Methods and compositions for generating conditional knock-out alleles
CA2879018A1 (en) 2012-07-13 2014-01-16 X-Chem, Inc. Dna-encoded libraries having encoding oligonucleotide linkages not readable by polymerases
CA2897390A1 (en) * 2013-01-10 2014-07-17 Ge Healthcare Dharmacon, Inc. Templates, libraries, kits and methods for generating molecules
CN103233028B (zh) * 2013-01-25 2015-05-13 南京徇齐生物技术有限公司 一种无物种限制无生物安全性问题的真核生物基因打靶方法及螺旋结构dna序列
US9234213B2 (en) * 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
WO2014165549A1 (en) 2013-04-01 2014-10-09 University Of Florida Research Foundation, Incorporated Determination of methylation state and chromatin structure of target genetic loci
US11414695B2 (en) * 2013-05-29 2022-08-16 Agilent Technologies, Inc. Nucleic acid enrichment using Cas9
CA2913236A1 (en) 2013-06-07 2014-12-11 Keygene N.V. Method for targeted sequencing
CN105637097A (zh) 2013-08-05 2016-06-01 特韦斯特生物科学公司 从头合成的基因文库
MX2016002118A (es) 2013-08-22 2016-06-28 Du Pont Modificacion del genoma de plantas por medio del uso de sistemas de ácido ribonucléico (arn) guía/ endonucleasa cas y metodos de uso.
US10822606B2 (en) * 2013-09-27 2020-11-03 The Regents Of The University Of California Optimized small guide RNAs and methods of use
WO2015050919A1 (en) 2013-10-01 2015-04-09 Life Technologies Corporation Systems and methods for detecting structural variants
CA2939621C (en) * 2014-02-13 2019-10-15 Takara Bio Usa, Inc. Methods of depleting a target molecule from an initial collection of nucleic acids, and compositions and kits for practicing the same
WO2015131101A1 (en) * 2014-02-27 2015-09-03 Monsanto Technology Llc Compositions and methods for site directed genomic modification
WO2015173436A1 (en) 2014-05-16 2015-11-19 Vrije Universiteit Brussel Genetic correction of myotonic dystrophy type 1
US20160053304A1 (en) 2014-07-18 2016-02-25 Whitehead Institute For Biomedical Research Methods Of Depleting Target Sequences Using CRISPR
US10435685B2 (en) * 2014-08-19 2019-10-08 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
JP6947638B2 (ja) 2014-12-20 2021-10-13 アーク バイオ, エルエルシー Crispr/cas系タンパク質を使用する核酸の標的化枯渇、富化および分割のための組成物および方法
ES2955957T3 (es) 2015-01-28 2023-12-11 Caribou Biosciences Inc Polinucleótidos de ADN/ARN híbridos CRISPR y procedimientos de uso
WO2016123243A1 (en) * 2015-01-28 2016-08-04 The Regents Of The University Of California Methods and compositions for labeling a single-stranded target nucleic acid
CN107250383B (zh) 2015-02-17 2022-09-06 深圳华大智造科技股份有限公司 使用受控的链置换的dna序列测定
US20160362680A1 (en) 2015-05-15 2016-12-15 Nugen Technologies, Inc. Compositions and methods for negative selection of non-desired nucleic acid sequences
US11279926B2 (en) 2015-06-05 2022-03-22 The Regents Of The University Of California Methods and compositions for generating CRISPR/Cas guide RNAs
CA2995983A1 (en) 2015-08-19 2017-02-23 Arc Bio, Llc Capture of nucleic acids using a nucleic acid-guided nuclease-based system
CA3001314A1 (en) 2015-10-08 2017-04-13 President And Fellows Of Harvard College Multiplexed genome editing of retroviral elements
JP2018532419A (ja) 2015-11-09 2018-11-08 イフォム・フォンダツィオーネ・イスティトゥート・フィルチ・ディ・オンコロジア・モレコラーレ CRISPR−Cas sgRNAライブラリー
CN109310784B (zh) 2015-12-07 2022-08-19 阿克生物公司 用于制备和使用指导核酸的方法和组合物
JP2019506875A (ja) 2016-02-23 2019-03-14 アーク バイオ, エルエルシー 標的検出のための方法および組成物
US20200190508A1 (en) 2017-06-07 2020-06-18 Arc Bio, Llc Creation and use of guide nucleic acids

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012522489A (ja) * 2009-03-09 2012-09-27 ニユー・イングランド・バイオレイブス・インコーポレイテツド 酵素を使用するdnaにおけるランダム二本鎖切断
WO2015050501A1 (en) * 2013-10-03 2015-04-09 Agency For Science, Technology And Research Amplification paralleled library enrichment
WO2015089473A1 (en) * 2013-12-12 2015-06-18 The Broad Institute Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
NATURE (2014) VOL.509, PP.487-491, METHODS, EXTENDED DATA FIGURE 1-10, JPN6021001958, ISSN: 0004430201 *
NATURE BIOTECHNOLOGY (2014) VOL.32, NO.3, PP.267-273, ONLINE METHODS, JPN6021001953, ISSN: 0004430199 *
NATURE COMMUNICATIONS (2015) VOL.6, NO.8083, PP.1-7, JPN6021001956, ISSN: 0004430200 *
SCIENTIFIC REPORTS (2015) VOL.5, NO.14987, PP.1-10, JPN6021001960, ISSN: 0004430202 *

Also Published As

Publication number Publication date
US20190270984A1 (en) 2019-09-05
EP3386550A1 (en) 2018-10-17
AU2016365720A1 (en) 2018-06-14
JP2024051149A (ja) 2024-04-10
JP6995751B2 (ja) 2022-02-04
US20210207130A1 (en) 2021-07-08
EP3871695A1 (en) 2021-09-01
CN109310784A (zh) 2019-02-05
US10787662B2 (en) 2020-09-29
CA3006781A1 (en) 2017-06-15
CN109310784B (zh) 2022-08-19
DK3386550T3 (da) 2021-04-26
WO2017100343A1 (en) 2017-06-15
AU2016365720B2 (en) 2020-11-26
EP3386550B1 (en) 2021-01-20
EP3386550A4 (en) 2019-09-18
JP2021141904A (ja) 2021-09-24

Similar Documents

Publication Publication Date Title
JP6995751B2 (ja) ガイド核酸を作製および使用するための方法および組成物
US11692213B2 (en) Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using CRISPR/Cas system proteins
US20240132872A1 (en) Capture of nucleic acids using a nucleic acid-guided nuclease-based system
JP7282692B2 (ja) ガイド核酸の作製および使用

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191202

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210122

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210408

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210622

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211118

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211215

R150 Certificate of patent or registration of utility model

Ref document number: 6995751

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150