JP2022511633A - エンドヌクレアーゼ保護による標的化濃縮 - Google Patents

エンドヌクレアーゼ保護による標的化濃縮 Download PDF

Info

Publication number
JP2022511633A
JP2022511633A JP2021521506A JP2021521506A JP2022511633A JP 2022511633 A JP2022511633 A JP 2022511633A JP 2021521506 A JP2021521506 A JP 2021521506A JP 2021521506 A JP2021521506 A JP 2021521506A JP 2022511633 A JP2022511633 A JP 2022511633A
Authority
JP
Japan
Prior art keywords
nucleic acid
sequence
target nucleic
grna
acid fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021521506A
Other languages
English (en)
Inventor
ステファン ジョン ホワイト,
ルネ コルネリス ヨセフス ホジャーズ,
Original Assignee
キージーン ナムローゼ フェンノートシャップ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by キージーン ナムローゼ フェンノートシャップ filed Critical キージーン ナムローゼ フェンノートシャップ
Publication of JP2022511633A publication Critical patent/JP2022511633A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本発明は、核酸サンプルから標的核酸断片を濃縮するための方法であって、核酸サンプルを、第1及び第2のRNA誘導型又はDNA誘導型エンドヌクレアーゼ複合体、好ましくは第1及び第2のgRNA-CAS複合体で切断し、それにより、標的核酸断片と少なくとも1つの非標的核酸断片を生成するステップを含む方法に関する。生成された断片を続いてエキソヌクレアーゼと接触させ、エキソヌクレアーゼは非標的核酸断片のみを消化する。本発明は、さらに、アダプター連結した標的核酸断片を調製するための、及び標的核酸断片を配列決定するための濃縮された標的核酸断片の使用に関する。【選択図】 なし

Description

本発明は、例えば、遺伝子研究におけるさらなる分析又はプロセシング用のライブラリーを調製するための、遺伝子研究の分野、より詳細には、標的化核酸単離の分野におけるものである。核酸サンプルの複雑性を低減するか、又は核酸サンプル内の標的核酸を濃縮するための新しい方法及び組成物が開示されている。
遺伝子研究の重要な要素は、規定のDNA遺伝子座の配列分析である。これは、公知のバリアントの遺伝子型を判定するか、又は配列の変化若しくはバリアントを特定するためのものであり得る。このような分析は、多くの場合、多重方式で行う必要があり、例えば、特定の遺伝子座のセットを多数のサンプルで分析する必要がある。これを行うための理想的なアッセイは、スクリーニングすることが必要とされるサンプル及び遺伝子座の数に関して柔軟であり、精度が高く、様々なシーケンスプラットフォームに適しているものである。濃縮ステップは含むが、理想的には増幅がないアッセイを提供する試みが行われてきた。例えば、米国特許出願公開第2014/0134610号には、II型制限酵素を使用してサンプル中の核酸を断片化した後、保護アダプターを連結し、続いてエキソヌクレアーゼを使用して捕捉されていない核酸のすべてを分解することによる、複雑性の低減方法が記載されている。国際公開第2016/028887号では、この方法が、プログラム可能なエンドヌクレアーゼ、すなわち、サンプルの核酸を断片化するためのCRISPR-エンドヌクレアーゼを使用することによって改良されている。
CRISPR(クラスター化した規則的な配置の短い回文配列リピート)は、複数の短い直接配列リピートを含む遺伝子座であり、配列決定された細菌の40%及び配列決定された古細菌の90%で確認されている。CRISPRリピートは、遺伝的病原体、例えばバクテリオファージ及びプラスミドに対して獲得された細菌免疫のシステムを形成する。細菌が病原体により攻撃された場合、病原体のゲノムの小さな断片がCRISPR関連タンパク質(Cas)によってプロセシングされ、CRISPRリピート間の細菌ゲノムに組み込まれる。次いで、CRISPR遺伝子座は転写され、プロセシングされて、病原体ゲノムと同一の約30bpの配列を含む、いわゆるcrRNAを形成する。これらのRNA分子は、その後、感染の際に病原体を認識するベースを形成し、病原体ゲノムの直接消化を介して病原体の遺伝要素のサイレンシングをもたらす。Casタンパク質であるCas9は、ストレプトコッカス・ピオゲネス(S.pyogenes)のII型CRISPR-Casシステムの必須成分であり、crRNAと、crRNAにより規定されるゲノムの位置にDNA二本鎖切断(DSB)を導入することによって、分解のため侵入病原性DNAを標的とするトランス活性化crRNA(tracrRNA)と呼ばれる第2のRNAと組み合わされた場合にエンドヌクレアーゼを形成する。このII型CRISPR-Cas9システムは、二本鎖切断の標的化導入及びその後の内因性修復メカニズムの活性化によって、目的の部位の真核生物ゲノムに修飾を導入することができる、生化学における便利で有効なツールであることが証明されている。Jinekら(2012,Science 337:816~820)は、crRNA及びtracrRNAの必須配列を単一RNA分子に結合させることにより生成される単鎖キメラRNA(単一ガイドRNA、sRNA、sgRNA)が、Cas9との組合せで機能性エンドヌクレアーゼを形成できることを証明した。多くの様々なCRISPR-Casシステムが異なる細菌種から同定されている(Zetscheら 2015 Cell 163, 759~771;Kimら 2017, Nat. Commun. 8, 1~7;Ranら 2015. Nature 520, 186~191)。RNAガイドを使用してエンドヌクレアーゼを核酸分子の特定の位置に向けるCRISPR-CASシステムに加えて、DNAガイド又はRNAガイドを使用する他のエンドヌクレアーゼが当技術分野では公知である(Doxzenら 2017, PLOS ONE 12(5):e0177097; Kayaら 2016, PNAS vol.113 no.15, 4057~4062)。
核酸の複雑性を低減するための柔軟で精度の高い方法が当技術分野において依然として強く求められている。当技術分野では、例えば、遺伝子研究におけるその後の分析又はプロセシングのために、1つ又は複数の標的核酸断片についてサンプルを濃縮する汎用的な方法が特に必要とされている。
以下で詳細に説明されている本発明は、下流のプロセシング及び/又は分析のための高度に単純化されたライブラリーの調製方法を可能にする。
第1の態様では、本発明は、核酸分子を含むサンプルから標的核酸断片を濃縮するための方法であって、標的核酸断片が目的の配列を含み、方法が
a)目的の配列を含む核酸分子を含むサンプルを提供するステップと;
b)少なくとも第1及び第2のRNA又はDNA誘導型エンドヌクレアーゼ複合体で核酸分子を切断し、それにより、目的の配列を含む標的核酸断片及び少なくとも1つの非標的核酸断片を生成するステップと;
c)ステップb)で得られた切断された核酸分子をエキソヌクレアーゼと接触させ、エキソヌクレアーゼが少なくとも1つの非標的核酸断片を消化できるようにするステップと;
d)任意選択で、ステップc)で得られた消化物から目的の配列を含む標的核酸断片を精製するステップと
を含む、方法に関する。
好ましくは、RNA又はDNA誘導型エンドヌクレアーゼ複合体は、gRNA-CAS複合体である。したがって、好ましくは、本発明は、核酸分子を含むサンプルからの標的核酸断片を濃縮するための方法であって、標的核酸断片が目的の配列を含み、方法が、
a)目的の配列を含む核酸分子を含むサンプルを提供するステップと;
b)少なくとも第1及び第2のgRNA-CAS複合体で核酸分子を切断し、それにより、目的の配列を含む標的核酸断片及び少なくとも1つの非標的核酸断片を生成するステップと;
c)ステップb)で得られた切断された核酸分子をエキソヌクレアーゼと接触させ、エキソヌクレアーゼが少なくとも1つの非標的核酸断片を消化できるようにするステップと;
d)任意選択で、ステップc)で得られた消化物から目的の配列を含む標的核酸断片を精製するステップと
を含む、方法に関する。
好ましくは、ステップb)は、第1及び第2のgRNA-CAS複合体と核酸分子を一緒に約1分~約18時間、好ましくは約60分間、約10~90℃、好ましくは約37℃でインキュベートすることによって実施される。
好ましくは、ステップc)は、切断された核酸分子をエキソヌクレアーゼと約1分~約12時間、好ましくは30分間、約10~90℃、好ましくは約37℃でインキュベートすることによって実施される。
好ましくは、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、Cas9タンパク質を含む。
好ましくは、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、sgRNAを含む。
好ましくは、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、別個の分子としてのcrRNA及びtracrRNAを含む。
好ましくは、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、DSBを誘導することができる。
好ましくは、第1及び第2のgRNA-CAS複合体の両方がDSBを誘導することができる。
好ましくは、ステップb)において、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは核酸分子の1つの鎖をニック導入し、その核酸分子は、前記第1又は第2のgRNA-CAS複合体によってニック導入された位置の実質的に相補的位置で相補鎖をニック導入する少なくとも第3のgRNA-CAS複合体と接触される。
第2の態様では、本発明は、核酸分子を含むサンプルからアダプター連結標的核酸断片を調製するための方法であって、標的核酸断片が目的の配列を含み、方法が、
a)目的の配列を含む核酸分子を含むサンプルを提供するステップと;
b)少なくとも第1及び第2のgRNA-CAS複合体で核酸分子を切断し、それにより、目的の配列を含む標的核酸断片及び少なくとも1つの非標的核酸断片を生成するステップと;
c)ステップb)で得られた切断された核酸分子をエキソヌクレアーゼと接触させ、エキソヌクレアーゼが少なくとも1つの非標的核酸断片を消化できるようにするステップと;
d)任意選択で、ステップc)で得られた消化物から目的の配列を含む標的核酸断片を精製するステップと;
e)アダプターを標的核酸断片に連結させるステップと
を含む、方法に関する。
好ましくは、アダプターは、配列アダプターである。
第3の態様では、本発明は、核酸分子を含むサンプルから標的核酸断片を配列決定するための方法であって、標的核酸断片は目的の配列を含み、方法が、
a)目的の配列を含む核酸分子を含むサンプルを提供するステップと;
b)少なくとも第1及び第2のgRNA-CAS複合体で核酸分子を切断し、それにより、目的の配列を含む標的核酸断片及び少なくとも1つの非標的核酸断片を生成するステップと;
c)ステップb)で得られた切断された核酸分子をエキソヌクレアーゼと接触させ、エキソヌクレアーゼが少なくとも1つの非標的核酸断片を消化できるようにするステップと;
d)任意選択で、ステップc)で得られた消化物から目的の配列を含む標的核酸断片を精製するステップと;
e)任意選択で、アダプターを標的核酸断片に連結させるステップと;
f)少なくとも1つの標的核酸断片を配列決定するステップと
を含む、方法に関する。
好ましくは、本明細書で定義した方法は、複数の核酸サンプルに対して並行して実施される。
好ましくは、核酸分子は、ゲノムDNAである。
好ましくは、核酸分子は、植物、動物、ヒト又は微生物から得られる核酸分子である。
第4の態様では、本発明は、
本明細書で定義した少なくとも第1及び第2のgRNA-CAS複合体と、
エキソヌクレアーゼと
を含む、核酸分子からの標的核酸断片を濃縮するためのキットオブパーツに関する。
第5の態様では、本発明は、核酸分子から少なくとも1つの標的核酸断片を濃縮するための、本明細書で定義した第1及び第2のgRNA-CAS複合体、又は本明細書で定義したキットオブパーツの使用に関する。
定義
本発明の方法、組成物、使用及び他の態様に関する各種用語は、本明細書及び特許請求の範囲の全体にわたって使用される。そのような用語には、特段の明示のない限り、本発明が関係する技術分野における通常の意味が付与されるものとする。他の詳細に定義された用語は、本明細書で提供された定義と一致する方法で解釈されるものとする。本明細書に記載のものと類似の又は同等の任意の方法及び材料を本発明の試験の実施において使用することができ、好ましい材料及び方法は本明細書に記載されている。
本発明の方法において使用される従来の技術を実施する方法は、当業者には明らかである。分子生物学、生化学、計算化学、細胞培養、組換えDNA、バイオインフォマティクス、ゲノミクス、配列決定及び関連する分野における従来の技術の実施は、当業者には周知であり、例えば、以下の文献:Sambrookら、Molecular Cloning. A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y., 1989; Ausubelら、Current Protocols in Molecular Biology, John Wiley & Sons, New York, 1987及び定期的更新;並びにthe series Methods in Enzymology, Academic Press, San Diegoで論じられている。
「A」、「an」、及び「the」:これらの単数形の用語は、文脈で特に明示されていない限り、複数の指示物を含む。したがって、例えば、「細胞(a cell)」への言及は、2つ以上の細胞の組合せなどを含む。
本明細書で使用される場合、用語の「約」とは、わずかな変動を記載及び説明するために使用される。例えば、この用語は、±10%以下、例えば、±5%以下、±4%以下、±3%以下、±2%以下、±1%以下、±0.5%以下、±0.1%、又は±0.05%以下を意味し得る。さらに、量、比率、及び他の数値が本明細書において範囲形式で示されている場合がある。そのような範囲形式は、便宜的且つ簡潔にするために使用されており、範囲の制限として明示的に示した数値を含むように柔軟に理解されるべきであるが、あたかも各数値及び部分的範囲が明示的に示されているように、その範囲内に含まれるすべての個々の数値又は部分的範囲もまた含むように理解されたい。例えば、約1~約200の範囲の比は、約1~約200の明示的に記載された範囲を含むが、約2、約3、及び約4などの個々の比、並びに約10~約50、約20~約100などの部分的範囲も含むものと理解されたい。
本明細書で使用される場合、用語の「アダプター」とは、好ましくは限定された長さ、例えば約10~約200、若しくは約10~約100塩基を有するか、又は約10~約80、若しくは約10~約50、若しくは約10~約30塩基対の長さを有する、他の核酸の末端に、例えば、二本鎖DNA分子の一方の鎖又は両方の鎖に結合され得る、好ましくは連結され得る一本鎖、二本鎖、部分的二本鎖、Y字型又はヘアピン核酸分子であり、好ましくは化学的に合成される。アダプターの二本鎖構造は、相互に塩基対を形成する2つの別個のオリゴヌクレオチド分子によって、又は単一オリゴヌクレオチド鎖のヘアピン構造によって形成され得る。明らかなように、アダプターの結合可能な末端は、制限酵素及び/又はプログラム可能なヌクレアーゼによる切断で生じるオーバーハングと互換性があるように、任意選択で連結可能であるように設計することができるか、非鋳型伸長反応の付加(例えば、3’-A付加)の後に生成されたオーバーハングと互換性があるように設計することができるか、又は平滑末端を有し得る。
「及び/又は」:用語の「及び/又は」とは、1つ又は複数の記載した事例が単独で、又は記載した事例の少なくとも1つと組み合わせて、記載したすべての事例に至るまで起こり得る状況を意味する。
核酸又は核酸反応に関して使用される「増幅」とは、特定の核酸、例えば、標的核酸又はタグ付き核酸などのコピーを作製するin vitroの方法を意味する。核酸を増幅する多数の方法が当技術分野では公知であり、増幅反応には、ポリメラーゼ連鎖反応、リガーゼ連鎖反応、鎖置換増幅反応、ローリングサークル増幅反応、転写介在増幅法、例えばNASBA(例えば、米国特許第5,409,818号)、ループ介在増幅法(例えば、米国特許第6,410,278号に記載されているようなループ形成配列を使用する「LAMP」増幅)、及び等温増幅反応が含まれる。増幅される核酸は、DNA若しくはRNA、又は修飾されたDNA及び/若しくはRNAを含む、DNAとRNAの混合物を含むか、それらからなるか、又はそれらに由来するDNAであり得る。1つ又は複数の核酸分子の増幅から生じる産物(すなわち「増幅産物」)は、出発核酸がDNA、RNA、又はその両方であるかどうかにかかわらず、DNA若しくはRNAのいずれか、又はDNA及びRNAのヌクレオシド若しくはヌクレオチドの両方の混合物であり得、又はそれらは修飾されたDNA若しくはRNAのヌクレオシド若しくはヌクレオチドを含み得る。
「コピー」とは、限定するものではないが、特定の配列に対して完全な配列相補性又は完全な配列同一性を有する配列であり得る。或いは、コピーは、必ずしもこの特定の配列に対して完全な配列相補性又は同一性を有するわけではなく、例えば、ある程度の配列変異は許容される。例えば、コピーは、ヌクレオチド類似体、例えば、デオキシイノシン若しくはデオキシウリジン、意図的な配列改変(例えば、特定の配列にハイブリダイズ可能であるが相補的ではない配列を含むプライマーを介して導入される配列改変)、及び/又は増幅中に生じる配列エラーを含み得る。
用語の「相補性」とは、本明細書では、完全に相補的な鎖(例えば、第2の鎖又は逆鎖)に対する配列の配列同一性として定義される。例えば、100%相補的(又は完全に相補的)である配列は、本明細書では、相補鎖と100%の配列同一性を有するものと理解され、例えば、80%相補的である配列は、本明細書では、(完全に)相補的な鎖に対して80%の配列同一性を有するものと理解される。
「含む」:この用語は、包括的で制限はなく、排他的ではないと解釈される。詳しくは、この用語及びその変化形は、指定した特徴、ステップ、又は構成要素が含まれることを意味する。これらの用語は、他の特徴、ステップ、又は構成要素の存在を排除するものと解釈されるべきではない。
「構築物」又は「核酸構築物」又は「ベクター」:これは、組換えDNA技術の使用によって得られる人工核酸分子を意味し、多くの場合、構築物に含まれるDNA領域を宿主細胞で発現させる目的で、外因性DNAを宿主細胞に送達するために使用され得る。構築物のベクター骨格は、例えば、(キメラ)遺伝子が組み込まれているプラスミドであってもよく、又は適切な転写調節配列が既に存在している場合(例えば(誘導性)プロモーター)、所望のヌクレオチド配列(例えばコード配列)のみが転写調節配列の下流に組み込まれる。ベクターは、分子クローニングにおけるそれらの使用を容易にするために、さらなる遺伝要素、例えば、選択可能なマーカー、複数のクローニング部位などを含むことができる。
本明細書で使用される場合、用語の「二本鎖」及び「二重鎖」とは、塩基対を形成する、すなわち、一緒にハイブリダイズする2つの相補ポリヌクレオチドを述べている。相補ヌクレオチド鎖は、当技術分野では逆相補としても公知である。
用語の「有効量」とは、本明細書で使用される場合、所望の生物学的効果を誘発するのに十分である生物学的活性剤の量を意味する。例えば、いくつかの実施形態では、エキソヌクレアーゼの有効量は、保護されていない核酸の切断を誘導するのに十分なエキソヌクレアーゼの量を意味することができる。当業者には明らかであるように、薬剤の有効量は、様々な要因、例えば使用される薬剤、薬剤が使用される条件、及び所望の生物学的効果、例えば、検出されるヌクレアーゼ切断の程度などに応じて変動し得る。
「例示的」:この用語は「例、事例、又は実例として有用である」ことを意味し、本明細書で開示されている他の構成を排除するものと解釈されるべきではない。
「発現」:これは、適切な調節領域、特にプロモーターに作動可能に連結されているDNA領域が、次にタンパク質又はペプチドに翻訳され得るRNAに転写されるプロセスを意味する。
「ガイド配列」とは、本明細書では、RNA又はDNA誘導型エンドヌクレアーゼをRNA又はDNA分子中の特定の部位に向ける配列として理解されたい。gRNA-CAS複合体の文脈において、「ガイド配列」は、本明細書では、gRNA-CAS複合体を二重鎖DNA中の特定の部位に標的化するために必要とされる、sgRNA又はcrRNAのセクションとしてさらに理解されたい。
gRNA-CAS複合体は、本明細書では、CRISPR-エンドヌクレアーゼ又はCRISPR-ヌクレアーゼとも呼ばれ、ガイドRNAと複合体化又はハイブリダイズされ、そのガイドRNAはcrRNA及び/又はtracrRNA、又はsgRNAであり得る、CASタンパク質であると理解されたい。
「同一性」及び「類似性」は、公知の方法により容易に算出することができる。「配列同一性」及び「配列類似性」は、グローバル又はローカルアラインメントアルゴリズムを使用し、2つの配列の長さに応じて、2つのペプチド配列又は2つのヌクレオチド配列のアラインメントによって決定することができる。同様の長さの配列は、好ましくは、配列を全長にわたり最適に整列するグローバルアラインメントアルゴリズム(例えば、Needleman Wunsch)を使用して整列されるが、実質的に異なる長さの配列は、好ましくは、ローカルアライメントアルゴリズム(例えば、Smith Waterman)を使用して整列される。配列は、(例えば、デフォルトパラメータを使用してプログラムGAP又はBESTFITにより最適に整列される場合に)、(下記で定義した)配列同一性の少なくとも特定のパーセンテージを共有する場合、「実質的に同一の」又は「本質的に類似の」と呼ばれ得る。GAPは、Needleman及びWunschのグローバルアライメントアルゴリズムを使用して、2つの配列をその全長(完全長)にわたり整列し、一致の数を最大化し、ギャップの数を最小化する。グローバルアライメントは、2つの配列が類似の長さを有する場合に配列の同一性を決定するのに適切に使用される。一般的には、GAPデフォルトパラメータは、ギャップ作成ペナルティ(gap creation penalty)=50(ヌクレオチド)/8(タンパク質)及びギャップ伸長ペナルティ(gap extension penalty)=3(ヌクレオチド)/2(タンパク質)とともに使用される。ヌクレオチドの場合、使用されるデフォルトスコアリングマトリックスはnwsgapdnaであり、タンパク質の場合、デフォルトスコアリングマトリックスはBlosum62である(Henikoff&Henikoff、1992、PNAS 89、915~919)。配列アラインメント及び配列同一性パーセンテージのスコアは、コンピュータープログラム、例えば、Accelrys Inc., 9685 Scranton Road, San Diego, CA 92121-3752 USAから入手可能なGCG Wisconsin Package、バージョン10.3を使用し、又はオープンソースソフトウェア、例えば、上記のGAPと同じパラメータを使用するか、若しくはデフォルト設定を使用するEmbossWIN バージョン2.10.0のプログラム「needle」(グローバルNeedleman Wunschアルゴリズムを使用)若しくは「water」(ローカルSmith Watermanアルゴリズムを使用)を使用して決定することができる(「needle」及び「water」の両方、並びにタンパク質アラインメント及びDNAアライメントの両方において、デフォルトギャップ作成ペナルティは10.0であり、デフォルトギャップ伸長ペナルティは0.5である;デフォルトスコアリングマトリックスは、タンパク質についてはBlosum62であり、DNAについてはDNAFullである)。配列が実質的に異なる全長を有する場合は、ローカルアラインメント、例えばSmith Watermanアルゴリズムを使用するものが好ましい。
或いは、類似性又は同一性のパーセンテージは、アルゴリズム、例えばFASTA、BLASTなどを使用して、公共データベースに対して検索することにより決定することができる。したがって、本発明の核酸配列及びタンパク質配列は、「クエリ配列」としてさらに使用することができ、例えば、他のファミリーメンバー又は関連配列を同定するために、公共データベースに対して検索を実施することができる。このような検索は、Altschulら (1990) J. Mol. Biol. 215:403~10のBLASTn及びBLASTxプログラム(バージョン2.0)を使用して実施することができる。BLASTヌクレオチド検索は、NBLASTプログラム、スコア=100、ワード長=12を用いて実施し、本発明の核酸分子に相同なヌクレオチド配列を得ることができる。BLASTタンパク質検索は、BLASTxプログラム、スコア=50、ワード長=3を用いて実施し、本発明のタンパク質分子に相同なアミノ酸配列を得ることができる。比較の目的でギャップを加えたアライメントを得るには、Altschulら, (1997) Nucleic Acids Res. 25(17): 3389~3402に記載のように、Gapped BLASTを利用することができる。BLAST及びGapped BLASTのプログラムを利用する場合、それぞれのプログラムのデフォルトパラメータ(例えば、BLASTx及びBLASTn)を使用することができる。http://www.ncbi.nlm.nih.gov/の米国国立バイオテクノロジー情報センター(National Center for Biotechnology Information)のホームページを参照されたい。
用語の「ヌクレオチド」には、限定するものではないが、グアニン、シトシン、アデニン、及びチミン(それぞれ、G、C、A及びT)を含む、天然に存在するヌクレオチドが含まれる。用語の「ヌクレオチド」とは、公知のプリン塩基及びピリミジン塩基だけでなく、修飾された他の複素環式塩基も含むそれらの部分を含むことをさらに意図する。そのような修飾には、メチル化されたプリン又はピリミジン、アシル化されたプリン又はピリミジン、アルキル化されたリボース又は他の複素環が含まれる。さらに、用語の「ヌクレオチド」には、ハプテン又は蛍光標識を含み、従来のリボース及びデオキシリボース糖だけでなく、他の糖も同様に含み得るそれらの部分が含まれる。修飾されたヌクレオシド又はヌクレオチドはまた、糖部分の修飾を含み、例えば、1つ若しくは複数のヒドロキシル基がハロゲン原子若しくは脂肪族基で置き換えられているか、又はエーテル、アミンなどとして官能基化されている。
用語の「核酸」、「ポリヌクレオチド」及び「核酸分子」とは、本明細書では互換的に使用され、ヌクレオチド、例えば、デオキシリボヌクレオチド又はリボヌクレオチドからなる任意の長さのポリマー、例えば、約2塩基より大きく、約10塩基より大きく、約100塩基より大きく、約500塩基より大きく、1000塩基より大きく、最大約10,000又はそれ以上の塩基のポリマーのことを記述し、酵素的又は合成的に生成され得る(例えば、米国特許第5,948,902号及び本明細書で引用されている参考文献に記載されているPNA)。核酸は、天然に存在する2つの核酸の配列に類似する配列特異的な方法で天然に存在する核酸とハイブリダイズすることができ、例えば、ワトソン-クリック型塩基対形成の相互作用に関与し得る。さらに、核酸及びポリヌクレオチドは、細胞、組織、及び/又は体液から単離することができる(また任意選択で、断片化することができる)。核酸は、例えば、ゲノムDNA(gDNA)、ミトコンドリア、無細胞DNA(cfDNA)、ライブラリー由来のDNA及び/又はライブラリー由来のRNAであり得る。
本明細書で使用される場合、用語の「核酸サンプル」又は「核酸を含むサンプル」とは、核酸を含む任意のサンプルを示し、サンプルは、典型的には、必ずではないが、液体の形態中に、1つ又は複数の目的の標的ヌクレオチド配列を含む材料又は材料の混合物に関する。本発明の方法において出発物質として使用される核酸サンプルは、任意の供給源、例えば、全ゲノム、染色体のコレクション、単一の染色体、1つ又は複数の染色体又は転写された遺伝子に由来する1つ又は複数の領域からのものであってもよく、生物学的供給源又は実験的供給源、例えば、核酸ライブラリーから直接精製され得る。核酸サンプルは、ヒト若しくは他の種(例えば、植物、細菌、真菌、藻類、古細菌など)であり得る同じ個体から、又は同じ種の異なる個体から、又は異なる種の異なる個体から得ることができる。例えば、核酸サンプルは、細胞、組織、生検、体液、ゲノムDNAライブラリー、cDNAライブラリー及び/又はRNAライブラリー由来のものであり得る。
用語の「目的の配列」、「目的の標的ヌクレオチド配列」及び「標的配列」とは、本明細書では互換的に使用され、限定するものではないが、細胞内に好ましくは存在する任意の遺伝子配列、例えば、遺伝子、遺伝子の一部、又は遺伝子内の若しくは遺伝子に隣接する非コード配列などを含む。目的の標的配列は、染色体、エピソーム、オルガネラゲノム、例えば、ミトコンドリアゲノム若しくは葉緑体ゲノム、又は遺伝物質の本体とは独立して存在することができる遺伝物質、例えば、感染ウイルスゲノム、プラスミド、エピソーム、トランスポゾンなどに存在し得る。目的の配列は、遺伝子のコード配列内、転写された非コード配列内、例えば、リーダー配列、トレーラー配列又はイントロン内にあり得る。前記の目的の核酸配列は、二本鎖核酸又は一本鎖核酸に存在し得る。
目的の配列は、限定するものではないが、多型、例えばSNPを有するか、又は有することが疑われる配列であり得る。
本明細書で使用される場合、用語の「オリゴヌクレオチド」とは、ヌクレオチドの、好ましくは約2~200ヌクレオチド、又は最大500ヌクレオチドの長さの一本鎖多量体を意味する。オリゴヌクレオチドは合成であってもよく、又は酵素的に作製されてもよく、いくつかの実施形態では、約10~50ヌクレオチドの長さである。オリゴヌクレオチドは、リボヌクレオチド単量体(すなわち、オリゴリボヌクレオチドであり得る)又はデオキシリボヌクレオチド単量体を含み得る。オリゴヌクレオチドは、例えば、約10~20、20~30、30~40、40~50、50~60、60~70、70~80、80~100、100~150、150~200、又は約200~250ヌクレオチドの長さであり得る。
「植物」:これは、植物細胞、植物プロトプラスト、植物が再生され得る植物細胞組織培養物、植物カルス、植物塊、及び植物又は植物の一部、例えば胚、花粉、胚珠、種子、葉、花、枝、果実、穀粒、穂、穂軸、殻、茎、根、根端、葯、粒などの無傷の植物細胞を含む。植物の非限定的な例としては、作物及び栽培植物、例えば、大麦、キャベツ、キャノーラ、キャッサバ、カリフラワー、チコリ、ワタ、キュウリ、ナス、ブドウ、トウガラシ、レタス、トウモロコシ、メロン、アブラナ、ジャガイモ、カボチャ、米、ライムギ、モロコシ、カボチャ、サトウキビ、テンサイ、ヒマワリ、ピーマン、トマト、スイカ、小麦、及びズッキーニなどが挙げられる。
「プロトスペーサー配列」は、ガイドRNA、より詳しくはcrRNA、又はsgRNAの場合にはガイドRNAのcrRNA部分内のガイド配列に認識又はハイブリダイズされ得るものであり、標的配列の中に、標的配列に、又は標的配列の近くに位置する配列である。
「エンドヌクレアーゼ」は、その標的部位又は認識部位に結合した際、二重鎖DNAのうちの少なくとも1つの鎖又はRNA分子の鎖を加水分解する酵素である。エンドヌクレアーゼは、本明細書では、部位特異的エンドヌクレアーゼと理解されたく、用語の「エンドヌクレアーゼ」及び「ヌクレアーゼ」は、本明細書では互換的に使用される。制限エンドヌクレアーゼは、本明細書では、二重鎖の両鎖を同時に加水分解し、DNAに二本鎖切断を導入するエンドヌクレアーゼとして理解されたい。「ニッキング」エンドヌクレアーゼは、二重鎖の1つの鎖のみを加水分解し、切断されるというよりはむしろ「切れ目が入れられた」DNA分子を生成するエンドヌクレアーゼである。
「エキソヌクレアーゼ」は、本明細書では、ポリヌクレオチドの末端(エキソ)から1つ又は複数のヌクレオチドを切断する任意の酵素として定義される。
「複雑性を低減すること」又は「複雑性の低減」とは、本明細書では、複雑な核酸サンプル、例えば、ゲノムDNAに由来するサンプル、リキッドバイオプシーに由来するcfDNA、単離されたRNAサンプルなどの低減として理解するものとする。複雑性の低減は、複雑な出発物質内に含まれる1つ若しくは複数の特定の標的配列若しくは標的核酸断片(本明細書では標的断片ともいう)の濃縮、及び/又はサンプルのサブセットの生成をもたらし、そのサブセットは、複雑な出発物質内に含まれる1つ若しくは複数の特定の標的配列若しくは断片を含むか、又はそれらからなり、一方、非標的配列又は断片は、出発物質中の、すなわち複雑性の低減前の非標的配列又は断片の量と比較して、量が少なくとも20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%又は99%低減する。複雑性の低減は、一般に、さらなる分析ステップ又は方法ステップ、例えば、増幅、バーコード、シーケンシング、エピジェネティック変化の決定などの前に実施される。好ましくは、複雑性の低減は、再現可能な複雑性の低減であり、これは、同じサンプルの複雑性が同じ方法を使用して低減される場合、ランダムな複雑性の低減とは対照的に、同じか又は少なくとも同等のサブセットが得られることを意味する。複雑性の低減方法の例としては、例えば、AFLP(登録商標)(Keygene N.V., the Netherlands;例えば、欧州特許第0534858号を参照されたい)、任意プライムPCR増幅、キャプチャープローブハイブリダイゼーション、Dongにより記載されている方法(例えば、国際公開第03/012118号、国際公開第00/24939号を参照されたい)、及び指標付け連結(Unrau P.及びDeugau K.V.(1994) Gene 145:163~169)、国際公開第2006/137733号;国際公開第2007/037678号;国際公開第2007/073165号;国際公開第2007/073171号、米国特許出願公開第2005/260628号、国際公開第03/010328号、米国特許出願公開第2004/10153号に記載されている方法、ゲノム分割(例えば、国際公開第2004/022758号を参照されたい)、遺伝子発現連続分析(SAGE;例えば、Velculescuら,1995,上記を参照、及びMatsumuraら,1999,The Plant Journal, vol.20(6):719~726を参照されたい)及びSAGEの変法(例えば、Powell,1998,Nucleic Acids Research, vol.26(14):3445~3446;並びにKenzelmann及びMuhlemann,1999,Nucleic Acids Research,vol.27(3):917~918を参照されたい)、MicroSAGE(例えば、Datsonら,1999,Nucleic Acids Research,vol.27(5):1300~1307を参照されたい)超並列シグネチャーシーケンシング(Massively Parallel Signature Seguencing)(MPSS;例えば、Brennerら,2000,Nature Biotechnology,vol.18:630~634、及びBrennerら,2000,PNAS,vol.97(4):1665~1670を参照されたい)、自己サブトラクト型cDNAライブラリー(Lavederら,2002,Nucleic Acids Research,vol.30(9):e38)、リアルタイム多重連結依存プローブ増幅(RT-MLPA;例えば、Elderingら,2003,vol.31(23):el53を参照されたい)、高カバー率発現プロファイリング(HiCEP;例えば、Fukumuraら,2003,Nucleic Acids Research,vol.31(16):e94を参照されたい)、Rothら(Rothら,2004,Nature Biotechnology,vol.22(4):418~426)に開示されているユニバーサルマイクロアレイシステム、トランスクリプトームサブトラクション法(例えば、Liら, Nucleic Acids Research,vol.33(16):el36を参照されたい)、及び断片ディスプレイ(例えば、Metsisら,2004,Nucleic Acids Research,vol.32(16):el27を参照されたい)が挙げられる。
「配列」又は「ヌクレオチド配列」:これは、核酸の又は核酸内のヌクレオチドの順序を意味する。言い換えると、核酸のヌクレオチドの任意の順序は、配列又は核酸配列と呼ぶことができる。例えば、標的配列は、DNA二重鎖の一本鎖に含まれるヌクレオチドの順序である。
用語の「配列決定」とは、本明細書で使用される場合、ポリヌクレオチドの少なくとも10個の連続するヌクレオチドの同一性(例えば、少なくとも20個、少なくとも50個、少なくとも100個、又は少なくとも200個以上の連続するヌクレオチドの同一性)が得られる方法を意味する。用語の「次世代配列決定」とは、例えば、現在Illumina、Life Technologies、PacBio及びRocheなどによって採用されているような、いわゆる並列化された合成による配列決定又はライゲーションプラットフォームによる配列決定を意味する。次世代配列決定法には、Oxford Nanopore Technologiesによって商品化されたようなナノポア配列決定法、又はLife Technologiesによって商品化されたIon Torrentテクノロジーなどの電子検出ベースの方法も含まれ得る。
「標的核酸断片」又は「標的断片」は、好ましくはさらなる分析又は行為、例えば、限定するものではないが、コピー、増幅、配列決定及び/又は核酸調査のための他の手順などの対象である、目的の配列を含むか又はそれからなる、核酸の一本鎖又は二本鎖の小さいストレッチ若しくは長いストレッチ、又は選択された部分であり得る。複雑性を低減する前に、標的核酸断片は、より大きな核酸分子内に、例えば、分析しようとするサンプルに存在するより大きな核酸分子内に含まれるのが好ましい。
目的の配列は、サンプル核酸内の任意の配列、例えば、遺伝子、遺伝子複合体、遺伝子座、偽遺伝子、調節領域、高度反復性領域、多型領域、又はそれらの一部であり得る。目的の配列はまた、表現型又は疾患を示す遺伝的変異又はエピジェネティック変異を含む領域であってもよい。いくつかの態様では、目的の1つ若しくは複数の配列を含むか、又はそれからなる標的核酸断片のセットは、濃縮されるように選択される。任意選択で、そのようなセットは、構造的又は機能的に関連する標的核酸断片からなる。1つ又は複数の標的断片は、限定するものではないが、DNA、RNA、BNA(架橋核酸)、LNA(ロックド核酸)、PNA(ペプチド核酸)、モルホリノ核酸、グリコール核酸、スレオス核酸、メチル化DNAなどのエピジェネティックに修飾されたヌクレオチド、並びにそれらの模倣体及び組合せを含む、天然及び非天然両方の人工又は非標準のヌクレオチドを含み得る。好ましくは、目的の配列は、二重鎖DNAの一本鎖DNA鎖のヌクレオチド(すなわちポリヌクレオチド)の小さい連続ストレッチ又はより長い連続ストレッチであり、前記二重鎖DNAは、前記二重鎖DNAの相補鎖の標的配列に相補的な配列をさらに含む。目的の配列及びその相補鎖からなる二重鎖DNAもまた、本明細書では、標的核酸断片二重鎖DNAと呼ばれる。好ましくは、前記二重鎖DNAは、ゲノムDNA(gDNA)及び/又は無細胞DNA(cfDNA)である。
ラムダDNAにおけるPciI制限エンドヌクレアーゼ認識部位とCas9 sgRNAの位置を示す図である。断片サイズは、Cas9を使用して標的化される断片と同様に示されている。 消化されたDNAサンプルの電気泳動分析を示す図である。A)Cas9標的と保護なしのPciIで消化されたラムダDNA。B)Cas9標的と保護のあるPciIで消化されたラムダDNA。 消化されたDNAサンプルの電気泳動分析を示す図である。A)Cas9標的と保護なしのPciIで消化されたラムダDNA。B)Cas9標的と保護のあるPciIで消化されたラムダDNA。 それぞれが5.1~5.6kbpのサイズで、1406個のsgRNAのプールを有する、423ゲノム遺伝子座を標的とするCas9を使用して消化されたメロンDNAのFEMTO Pulse(Advanced Analytical)分析を示す図である。sgRNAは、標的遺伝子座に隣接する配列で設計されている。実際の標的化領域の全長は約5.5kbpである。約6.4kbpのサイズの明確なピークが見られる。サイズが不正確であるため、サイズの長さにおける違いは正常である。左側の第1のレーンは消化されたメロンDNAであり、第2のレーンはマーカーである。 サイズ選択されたDNAのFEMTO Pulse(Advanced Analytical)分析を示す図である。図3に示したサンプルから、Sage Science BluePippinを使用して、2.5kbp~10kbpの範囲の断片を選択する。左側の第1のレーンは消化され、サイズ選択されたメロンDNAであり、第2のレーンはマーカーである。 濃縮プロトコル後に得られた読み取りがマッピングされたメロンVedrantaisゲノムの領域をIGV視覚化した図である。灰色のボックスは、2つの標的遺伝子座(上側)の相対的読み取りカバレッジを示し、マッピングされた読み取りを下に示す。標的化遺伝子座は、マッピングされた読み取りの下に黒いバーとして示されている。これらの黒いバーの下に、これらの遺伝子座に使用されたsgRNAの位置を黒線で示している。濃縮された読み取りが選択されたsgRNA位置から始まり、標的化遺伝子座を完全にカバーしていることを示している。
本発明者らは、機能性gRNA-CAS複合体が、切断された断片に対して思いがけない保護効果を有することを発見した。実際、切断後、切断された断片がエキソヌクレアーゼ切断から保護されているように思われた。理論に縛られることを望むものではないが、この保護は、エキソヌクレアーゼ処理中に切断された断片の末端に結合したままの複合体に起因し得る。したがって、本発明の方法は、意外にも、例えば、保護アダプターの連結が、本明細書に開示されている増幅不要の標的濃縮法には必要でないことを示す。
第1の態様では、核酸分子を含むサンプルから少なくとも1つの標的核酸断片を濃縮するための方法が提供される。好ましくは、標的核酸断片は、目的の配列を含む。好ましくは、前記核酸断片は、本明細書で以下に詳述されている濃縮ステップの前にサンプルに存在する核酸分子内に含まれる。したがって、好ましくは、標的核酸断片は、サンプルの核酸分子の断片である。
好ましくは、本発明は、核酸分子を含むサンプルからの標的核酸断片を濃縮するための方法であって、標的核酸断片が目的の配列を含み、方法が、
a)目的の配列を含む核酸分子を含むサンプルを提供するステップと;
b)少なくとも第1及び第2のRNA又はDNA誘導型エンドヌクレアーゼ複合体で核酸分子を切断し、それにより、目的の配列を含む標的核酸断片及び少なくとも1つの非標的核酸断片を生成するステップと;
c)ステップb)で得られた切断された核酸分子をエキソヌクレアーゼと接触させ、エキソヌクレアーゼが少なくとも1つの非標的核酸断片を消化できるようにするステップと;
d)任意選択で、ステップc)で得られた消化物から目的の配列を含む標的核酸断片を精製するステップと
を含む、方法に関する。
好ましくは、ステップb)におけるRNA又はDNA誘導型エンドヌクレアーゼ複合体は、gRNA-CAS複合体、gRNA-アルゴノート複合体、及びgDNA-アルゴノート複合体のうちの少なくとも1つである。好ましくは、ステップb)におけるRNA又はDNA誘導型エンドヌクレアーゼ複合体は、gRNA-CAS複合体である。
好ましくは、ステップc)において、少なくとも第1及び第2のgRNA-CAS複合体は、標的核酸断片に結合している。
好ましくは、ステップc)において、少なくとも第1及び第2のgRNA-CAS複合体は、ステップc)の間、又はステップc)の少なくとも一部の間、標的核酸断片に結合したままである。
好ましくは、ステップc)において、標的核酸断片は、エキソヌクレアーゼによって消化されず、すなわち、ステップc)において、標的核酸断片は、エキソヌクレアーゼ消化から保護される。
好ましくは、ステップc)において、1つ又は複数の非標的核酸断片のみがエキソヌクレアーゼによって消化される。
ステップb)において、核酸分子は、少なくとも第1及び第2のgRNA-CAS複合体で切断される。任意選択で、ステップb)は、核酸分子を第1及び第2のgRNA-CAS複合体と接触させるステップと、複合体が核酸分子を切断できるようにするステップでさらに明示され得る。したがって、一実施形態では、ステップb)は、以下のようにさらに明示することができる:
b1)核酸分子を少なくとも第1及び第2のgRNA-CAS複合体と接触させ、第1の複合体のgRNAは、前記第1の複合体を目的の配列の上流にある配列に誘導し、第2の複合体のgRNAは、前記第2の複合体を目的の配列の下流にある配列に誘導する、
b2)第1及び第2のgRNA-CAS複合体が核酸分子を切断できるようにし、少なくとも1つの切断された核酸分子は標的核酸断片であり、少なくとも1つの、好ましくは2つの切断された核酸分子(複数可)は非標的核酸断片(複数可)である。
本発明者らは、驚いたことに、ステップbの消化物にエキソヌクレアーゼを添加することにより、標的核酸断片を保護するためのさらなる手段を行うことなく、目的の前記断片が濃縮されることを見出した。言い換えると、驚いたことに、例えば不活性アダプターの連結によるさらなる保護は、エキソヌクレアーゼ分解からの標的核酸断片(複数可)の保護に必要ではない。したがって、本発明の方法は、好ましくは、エキソヌクレアーゼ処理のステップの前に、標的核酸断片、又は標的核酸断片の末端を保護するさらなるステップを含まない。好ましい実施形態では、本明細書で定義した方法は、エキソヌクレアーゼ処理の前に、保護アダプターを付加することは含まない。この文脈では、保護アダプターは、エキソヌクレアーゼ消化のため、にアダプターに捕捉される標的核酸断片を保護するように特別に設計されたアダプターと本明細書では理解するものとする。
そのようなアダプターは、化学的部分若しくは保護基(例えばホスホロチオエート)を含むことによって、或いは末端ヌクレオチドの欠如(ヘアピン若しくはステムループアダプター、又は環化可能なアダプター)のいずれかによって、エキソヌクレアーゼによる分解から保護することが好ましい。
本発明の方法は、例えば、核酸サンプルを濃縮するため、好ましくは、前記サンプル内の1つ又は複数の標的核酸断片の下流の処理又は分析を容易にするためのものである。この濃縮は、本発明の方法のステップa)において出発物質として使用される核酸サンプルの複雑性の低減、及び/又は本発明の方法のステップa)における出発物質として使用される核酸サンプルの1つ若しくは複数の標的核酸断片のサブセットの生成をもたらす。
したがって、本発明の第1の態様はまた、少なくとも、
i)上記で定義したステップa)~c)及び任意選択でステップd)を含む、目的の配列を含む核酸サンプルの複雑性を低減するための方法;
ii)上記で定義したステップa)~c)及び任意選択でステップd)を含む、核酸サンプルのサブセットを提供するための方法であって、前記サブセットが1つ又は複数の標的核酸断片を含む、方法;並びに
iii)上記で定義したステップa)~c)及び任意選択でステップd)を含む、目的の配列を含む核酸分子から前記目的の配列を含む断片、すなわち標的核酸断片を単離又は取得するための方法
を提供する。
核酸サンプルの複雑性を低減することにより、核酸配列決定用途において、とりわけ標的核酸断片が、例えば、限定するものではないがゲノムなどの複雑なサンプル内のマイナー種であるようなサンプルにおいて特定の有用性が確認される。濃縮又は複雑性の低減により、複雑なサンプルの大部分が配列決定前に除かれるので、生成される配列決定データのコストが大幅に削減され、一方、標的核酸断片は選択的に保持され、それによって目的の配列から生成される配列読み取りのパーセンテージが高くなる。
好ましい実施形態では、本明細書の方法によって生成される濃縮された標的核酸断片は、単一分子リアルタイム配列決定反応、例えば、Pacific Biosciences、Menlo Park、Calif.のSMRT(登録商標)シーケンシングで使用される。他の配列決定技術、例えば、ナノポアシーケンシング(例えば、Oxford Nanopore)、Solexa(登録商標)シーケンシング(Illumina)、tSMS(商標)シーケンシング(Helicos)、Ion Torrent(登録商標)シーケンシング(Life Technologies)、パイロシーケンシング(例えば、Roche/454製)、SOLiD(登録商標)シーケンシング(Life Technologies)、マイクロアレイシーケンシング(例えば、Affymetrix製)、Sangerシーケンシングなどの使用も考えられる。好ましくは、配列決定法は、長いテンプレート分子、例えば、>1000~10,000塩基以上を配列決定することが可能である。好ましくは、配列決定法は、例えば、配列決定反応の動力学をモニターすることによって、配列決定反応中の塩基修飾を検出することが可能である。好ましくは、配列決定法は、例えばリアルタイムで、単一テンプレート分子の配列を分析することができる。本発明の複雑性を低減する方法から有利性を享受するさらなる用途には、限定するものではないが、クローニング、増幅、診断、予後診断、セラノスティックス、遺伝子スクリーニングなどが含まれ、任意選択で、多型検出を行うもの、例えば限定するものではないが、がんの診断検査が含まれる。任意選択で、本明細書の方法によって生成される濃縮された核酸は、DNAメチル化などのエピジェネティックな多様性を評価するためのアッセイにおいて使用される。DNAメチル化は、当技術分野で公知の任意の適切なアッセイ、例えば、配列決定と組み合わせたバイサルファイト変換アッセイなどを使用して評価することができる。バイサルファイト処理としても知られるバイサルファイト変換は、非メチル化シトシンを脱アミノ化してDNA中にウラシルを生成するために使用され、これがDNAメチル化状態を評価するために下流の適用で使用される。メチル化されたシトシンは、ウラシルへの変換から保護されているため、直接配列決定を使用して、非メチル化シトシン及び5-メチルシトシンの位置を一塩基分解能で決定することができる。或いは、又はさらに、非増幅及び任意選択で非修飾のDNAを分析する場合には、DNA修飾を配列決定データから直接検出することができ、特定のアッセイを追加する必要がない。非増幅及び非修飾DNAにおけるDNA修飾の検出の例は、Pacific BiosciencesのSMRTシーケンシング技術の使用である。この方法は、したがって、検出された変異又は診断をヒト対象に報告するステップをさらに含んでいてもよい。この方法は、したがって、本発明の方法を使用して得られた知見を含む報告を作成するステップをさらに含んでいてもよい。
少なくとも第1及び第2のgRNA-CAS複合体は、それぞれがガイドRNAと複合体を形成しているCRISPR関連(CAS)タンパク質、又はCRISPR-ヌクレアーゼとして本明細書では理解されたい。CRISPR-ヌクレアーゼは、ヌクレアーゼドメインと、ガイドRNAと相互作用する少なくとも1つのドメインとを含む。ガイドRNAと複合体を形成する場合、CRISPR-ヌクレアーゼは、ガイドRNAによって特定の核酸配列に誘導される。ガイドRNAは、CRISPR-ヌクレアーゼと、並びに特定の標的核酸配列と相互作用することにより、ガイド配列を介して特定の核酸配列を含む部位に方向づけられると、CRISPR-ヌクレアーゼは標的部位に切断を導入することができる。好ましくは、CRISPR-ヌクレアーゼは、ヌクレアーゼの一方のドメイン又は両方のドメインがそれぞれ触媒的に活性である場合、標的部位に一本鎖切断又は二本鎖切断を導入することができる。当業者は、それがCRISPRヌクレアーゼと組み合わされた場合に、核酸分子の所定の部位に一本鎖切断又は二本鎖切断の導入を達成するようにガイドRNAを設計する方法について十分に承知している。
CRISPR-ヌクレアーゼは、一般的に6つの主要な型(I型~VI型)に分類することができ、これらはコア要素の内容及び配列に基づき、さらに亜型に分類される(Makarovaら,2011,Nat Rev Microbiol 9:467~77、及びWrightら,2016,Cell 164(1-2):29~44)。一般に、CRISPR-CASシステム複合体の2つの重要な要素は、CRISPR-ヌクレアーゼ及びcrRNAである。CrRNAは、インベーダーDNAに由来するスペーサー配列が点在している短い反復配列からなる。CASタンパク質は、様々な活性、例えばヌクレアーゼ活性を有する。したがって、gRNA-CAS複合体は、特定の配列を標的とするメカニズム、並びにその配列に対するある特定の酵素活性を提供する。
I型CRISPR-CASシステムは、典型的には、ヘリカーゼ活性とDNase活性を別々に有するCas3タンパク質を含む。例えば、1-E型システムでは、crRNAは、Cascadeと呼ばれるマルチサブユニットエフェクター複合体(抗ウイルス防御のCRISPR関連複合体)に組み込まれ(Brounsら,2008,Science 321:960~4)、これが二重鎖DNAに特異的に結合し、Cas3タンパク質による分解を誘発する(Sinkunasら,2011,EMSO J 30:1335~1342;Beloglazovaら,2011,EMBO J 30:616~627)。
II型CRISPR-CASシステムは、crRNAを生成し、二重鎖DNAを特異的に切断することが可能な、単一タンパク質(約160KDa)であるシグネチャーCas9タンパク質を含む。Cas9タンパク質は、典型的には2つのヌクレアーゼドメインを含んでおり、アミノ末端近くのRuvC様ヌクレアーゼドメインと、タンパク質の中央付近のHNH(又はMcrA様)ヌクレアーゼドメインである。Cas9タンパク質のそれぞれのヌクレアーゼドメインは、二重らせんの一本鎖を切断することに特化されている(Jinekら,2012,Science 337(6096):816~821)。Cas9タンパク質は、II型CRISPR/-CASシステムのCASタンパク質の一例であり、crRNA及びトランス活性化crRNA(tracrRNA)と呼ばれる第2のRNAと組み合わせた場合、エンドヌクレアーゼを形成し、これが侵入してきた病原体DNAを標的化し、crRNAによって定められた病原体ゲノム上の位置にDNA二本鎖切断(DSB)を導入することにより分解する。Jinekら(2012,Science 337:816~820)は、crRNAとtracrRNAの必須部分を融合することによって生成される一本鎖キメラガイドRNA(本明細書では「sgRNA」)が、Cas9タンパク質と組み合わせて機能的なエンドヌクレアーゼを形成することができることを示した。
III型CRISPR-CASシステムは、ポリメラーゼ及びRAMPモジュールを含む。III型システムは、亜型のIII-AとIII-Bにさらに分けることができる。III-A型CRISPR-CASシステムは、プラスミドを標的とすることが明らかになっており、III-A型システムのポリメラーゼ様タンパク質は、DNAの特異的切断に関与している(Marraffini及びSontheimer,2008,Science 322:1843~1845)。III-B型CRISPR-CASシステムはまた、RNAを標的とすることが明らかになっている(Haleら,2009,Cell 139:945~956)。
IV型CRISPR-CASシステムは、カスケード様複合体の一部を形成することが示されている特性決定されていないタンパク質であるCsf1が含まれるが、これらのシステムは、多くの場合、関連するCRISPRアレイを有していない単離されたcas遺伝子として確認されている。
V型CRISPR-CASシステムである、Prevotella由来のクラスター化した規則的な配置の短い回文配列リピート(Clustered Regularly Interspaced Short Palindromic Repeats)及びFrancisella 1又はCRISPR/Cpf1が最近報告されている。Cpf1遺伝子はCRISPR遺伝子座と関係しており、crRNAを使用してDNAを標的とするエンドヌクレアーゼをコードしている。Cpf1はCas9よりも小さく単純なエンドヌクレアーゼであり、CRISPR-Cas9システムの制限のいくつかを克服し得る。Cpf1は、tracrRNAを欠失している単一RNA-誘導型エンドヌクレアーゼであり、Tリッチプロトスペーサー隣接モチーフを利用する。Cpf1は、互い違いのDNA二本鎖切断を介してDNAを切断する(Zetscheら(2015) Cell 163(3):759~771)。V型CRISPR-CASシステムは、好ましくは、Cpf1、C2c1及びC2c3のうちの少なくとも1つを含む。
VI型CRISPR-CASシステムは、RNaseA活性を含むCas13aタンパク質を含み得る。標的核酸断片がRNAである場合、本発明の方法の少なくとも第1及び第2のgRNA-CAS複合体は、Cas13a、例えば限定するものではないが、例えばGootenbergら,Science.2017 Apr 28;356(6336):438~442に記載されているような、レプトトリキア・ワディ(Leptotreichia wadee)由来のCas13a(LwCas13a)又はレプトトリキア・シャーイイ(Leptotrichia shahii)由来のCas13a(LshCas13a)を含み得る。
本発明の方法の第1及び第2のgRNA-CAS複合体は、本明細書で上記に定義した任意のCRISPR-ヌクレアーゼを含み得る。好ましくは、本発明の方法の第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、II型CRISPR-ヌクレアーゼ、例えばCas9(例えば、配列番号2によってコードされている配列番号1のタンパク質、若しくは配列番号19のタンパク質)、又はV型CRISPR-ヌクレアーゼ、例えばCpf1(例えば、配列番号4によってコードされている配列番号3のタンパク質)又はMad7(例えば、配列番号20若しくは21のタンパク質)、又は、好ましくはその全長にわたって前記タンパク質に対して少なくとも約70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、若しくは99%の配列同一性を有する、それらに由来するタンパク質を含む。
好ましくは、本発明の方法の第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、II型CRISPR-ヌクレアーゼ、好ましくはCas9ヌクレアーゼを含む。
当業者は、CRISPR-ヌクレアーゼを含むCRISPR-CASシステムの様々な成分を調製する方法を知っている。従来技術において、その設計及び使用に関する多数の報告を利用することができる。例えば、ガイドRNAの設計及びCASタンパク質(ストレプトコッカス・ピオゲネス(S.pyogenes)から最初に得られた)との併用に関するHaeusslerらによる最近の概説(J Genet Genomics.(2016)43(5):239~50.doi:10.1016/j.jgg.2016.04.008.)又はLeeら(Plant Biotechnology Journal(2016)14(2)448~462)による概説を参照されたい。
一般に、CRISPRヌクレアーゼ、例えばCas9は、2つの触媒的に活性なヌクレアーゼドメインを含む。例えば、Cas9タンパク質は、RuvC様ヌクレアーゼドメイン及びHNH様ヌクレアーゼドメインを含み得る。RuvCドメイン及びHNHドメインは一緒に機能し、両方とも一本鎖を切断し、DNAに二本鎖切断を行う(Jinekら,Science,337:816~821)。デッド型CRISPR-ヌクレアーゼは、いずれのヌクレアーゼドメインも切断活性を示さないような修飾を含む。本発明の方法で使用される第1及び第2のgRNA-CAS複合体のうちの少なくとも1つのCRISPR-ヌクレアーゼは、ヌクレアーゼドメインの1つが変異したことにより、もはや機能せず(すなわち、ヌクレアーゼ活性がない)、それによりニッカーゼを生成する、CRISPR-ヌクレアーゼのバリアントであり得る。例は、D10A変異又はH840A変異のいずれかを有するSpCas9バリアントである。好ましくは、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つのヌクレアーゼは、デッド型ヌクレアーゼではない。好ましくは、第1のgRNA-CAS複合体のCRISPR-ヌクレアーゼは、ニッカーゼ又は(エンド)ヌクレアーゼのいずれかである。好ましくは、第2のgRNA-CAS複合体のCRISPR-ヌクレアーゼは、ニッカーゼ又は(エンド)ヌクレアーゼのいずれかである。
本発明の方法の少なくとも第1及び第2のgRNA-CAS複合体は、Cas9タンパク質若しくはバリアント全体を含み得るか、又はそれからなり得るか、又はそれらの断片を含み得る。好ましくは、そのような断片は、crRNA及びtracrRNA又はsgRNAに結合するが、ヌクレアーゼ活性に必要とされる1つ又は複数の残基を欠失し得る。
好ましくは、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、Cas9タンパク質を含む。任意選択で、本発明の方法の第1及び第2のgRNA-CAS複合体の両方がCas9タンパク質を含む。Cas9タンパク質は、細菌のストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のもの(SpCas9; NCBI Reference Sequence NC_017053.1; UniProtKB-Q99ZW2)、ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)由来のもの(UniProtKB-A0A178TEJ9)、コリネバクテリウム・アルサラス(Corynebacterium ulcerous)由来のもの(NCBI Refs: NC_015683.1, NC_017317.1);コリネバクテリウム・ジフテリエ(Corynebacterium diphtheria)由来のもの(NCBI Refs: NC_016782.1, NC_016786.1);スピロプラズマ・シルフィディコーラ(Spiroplasma syrphidicola)由来のもの(NCBI Ref: NC_021284.1);プレボテラ・インターメディア(Prevotella intermedia)由来のもの(NCBI Ref: NC_017861.1);スピロプラズマ・タイワネンス(Spiroplasma taiwanense)由来のもの(NCBI Ref: NC_021846.1);ストレプトコッカス・イニエ(Streptococcus iniae)由来のもの(NCBI Ref: NC_021314.1);ベルリエラ・バルティカ(Belliella baltica)由来のもの(NCBI Ref: NC_018010.1);シクロフレキサス・トルキスル(Psychroflexus torquisl)由来のもの(NCBI Ref: NC_018721.1);ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)由来のもの(NCBI Ref: YP_820832.1);リステリア・イノキュア(Listeria innocua)由来のもの(NCBI Ref: NP_472073.1);カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のもの(NCBI Ref: YP_002344900.1);又はナイセリア・メニンギティディス(Neisseria meningitidis)由来のもの(NCBI Ref: YP_002342100.1)であり得る。SpCas9に相同な不活性化HNH又はRuvCドメインを有する、これらからのCas9バリアント例えばSpCas9_D10A若しくはSpCas9_H840A、又はSpCas9タンパク質のD10若しくはH840に対応する位置に同等の置換を有し、ニッカーゼを生じさせるCas9が包含される。
好ましい実施形態によれば、プログラム可能なヌクレアーゼは、Cpf1、例えばアシダミノコッカス属の種(Acidaminococcus sp);UniProtKB-U2UMQ6に由来し得る。バリアントは、RuvC又はNUCドメインがもはやヌクレアーゼ活性を有していない、不活性化RuvC又はNUCドメインを有するCpf1ニッカーゼであり得る。当業者は、当技術分野で利用可能な技術、例えば、部位特異的突然変異誘発、PCR媒介突然変異誘発、及び不活性化RuvC又はNUCドメインなどの不活性化ヌクレアーゼを可能にする全遺伝子合成などについて十分に知っている。不活性NUCドメインを有するCpf1ニッカーゼの例は、Cpf1R1226Aである(Gaoら Cell Research(2016)26:901~913、Yamanoら Cell(2016)165(4):949~962を参照されたい)。このバリアントにおいては、NUCドメインでアルギニンがアラニン(R1226A)へ変換されており、NUCドメインが不活性化される。
少なくとも第1及び第2のgRNA-CAS複合体は、プロトスペーサー配列とも呼ばれる核酸サンプル中の規定部位に複合体を方向づけるCRISPR-ヌクレアーゼ関連ガイドRNAをさらに含む。ガイドRNAは、好ましくは、核酸分子内の目的の配列の近くに、その配列に、又はその配列内にあり、sgRNA、又はcrRNAとtracrRNAの組合せ(例えば、Cas9の場合)、又はcrRNAのみ(例えば、Cpf1の場合)であってもよい、gRNA-CAS複合体をプロトスペーサー配列に標的化するためのガイド配列を含む。任意選択で、1つ以上のタイプのガイドRNAを同一の実験において使用することができ、例えば、2つ以上の異なる目的の配列を対象とするか、又は同じ目的の配列でさえも対象とすることできる。
目的の配列は、少なくとも第1及び第2のgRNA-CAS複合体で切断する前に、核酸サンプル中に存在することを本明細書では理解されたい。核酸サンプルの切断は、少なくとも2つ以上の核酸断片をもたらし、少なくとも1つの核酸断片は標的核酸断片であり、少なくとも1つの核酸断片は非標的核酸断片である。標的核酸断片は、目的の配列を含むか、又はその配列からなる。したがって、核酸サンプルを切断する前に、標的核酸断片が核酸サンプル内に含まれており、標的核酸断片が切断の際に核酸サンプルから放出されることは当業者にとっては明白である。本発明者らは、gRNA-CAS複合体によって切断された核酸断片が消化、好ましくはエキソヌクレアーゼ消化から保護されることを発見した。
本発明の方法は、第1のgRNA-CAS複合体のgRNAが前記第1の複合体を核酸サンプル中の配列に誘導することにより、第1のgRNA-CAS複合体が目的の配列の上流で核酸サンプルを切断し、第2の複合体のgRNAが第2のgRNA-CAS複合体を核酸サンプル中の配列に誘導することにより、第2のgRNA-CAS複合体が目的の配列の下流で核酸サンプルを切断することを必要とする。
好ましくは、gRNA-CAS複合体は、プロトスペーサー配列内の核酸を切断するCRISPR-ヌクレアーゼを含む。好ましいCRISPR-ヌクレアーゼは、Cas9である。
第1のgRNA-CAS複合体が結合しているプロトスペーサー配列は、標的核酸断片及び/又は非標的核酸断片中の配列であり得る。同様に、第2のgRNA-CAS複合体が結合しているプロトスペーサー配列は、標的核酸断片及び/又は非標的核酸断片中の配列であり得る。好ましくは、プロトスペーサー配列は、標的核酸断片及び非標的核酸断片とオーバーラップする配列であり、すなわち、プロトスペーサー配列内にあるgRNA-CAS複合体の切断部位である。
好ましくは、プロトスペーサー配列の位置は、本発明の方法で使用されるCRISPRヌクレアーゼに依存する。非限定的な例として、CRISPR-ヌクレアーゼSpCAS9は、プロトスペーサー配列内の核酸を切断する。したがって、CAS9が本発明の方法において使用される場合、好ましくは、プロトスペーサー配列は、標的核酸断片に部分的に位置し、また非標的断片に部分的に位置しており、すなわち、プロトスペーサー配列は、標的核酸断片と非標的核酸断片との間でオーバーラップしている。したがって、好ましくは、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つのgRNAのガイド配列は、
A)標的核酸断片に含まれるプロトスペーサー配列;
B)非標的核酸断片に含まれるプロトスペーサー配列:及び、
C)標的核酸断片と非標的核酸断片との間でオーバーラップするプロトスペーサー配列
からなる群から選択されるプロトスペーサー配列にハイブリダイズすることができる。
A)一実施形態では、第1のgRNA-CAS複合体及び第2のgRNA-CAS複合体のうちの少なくとも1つのgRNAのガイド配列は、標的核酸断片の配列であるか、若しくはその配列の一部である配列、又は例えば核酸断片が二本鎖の場合には、反対側の鎖にあるそれらの相補的な配列にハイブリダイズすることが可能である。言い換えると、この実施形態では、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つによって標的化されるプロトスペーサー配列は、標的核酸断片の配列であるか、又はその配列中に位置する。好ましくは、少なくとも第1のgRNA-CAS複合体によって標的化されるプロトスペーサー配列は、標的核酸断片の配列又はその相補的な配列の5’末端であるか、又はそれらに隣接して位置しており、好ましくは、少なくとも第2のgRNA-CAS複合体によって標的化されるプロトスペーサー配列は、標的核酸断片の配列又はその相補的な配列の3’末端であるか、又はそれらに隣接して位置している。隣接は、直接隣接していてもよく、好ましくは、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、500若しくは1000の連続したヌクレオチド以下の距離であってもよい。ヌクレオチドの数は、本発明の方法において使用されるCRISPR-ヌクレアーゼに依存し得る。
B)一実施形態では、第1のgRNA-CAS複合体及び第2のgRNA-CAS複合体のうちの少なくとも1つのgRNAのガイド配列は、非標的核酸断片、又は核酸サンプルが二本鎖核酸である場合には、反対側の鎖にあるそれらの相補的な配列を形成するか、又はその一部を形成する配列にハイブリダイズすることが可能である。言い換えると、この実施形態では、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つによって標的化されるプロトスペーサー配列は、切断後に標的核酸断片を形成する配列に実質的に隣接して、又は直接隣接して位置する。好ましくは、第1のgRNA-CAS複合体によって標的化されるプロトスペーサー配列は、断片が核酸サンプル中に存在する場合は標的核酸断片、又はその相補的配列の5’末端に実質的に隣接し、好ましくは直接隣接する。好ましくは、第2のgRNA-CAS複合体によって標的化とされるプロトスペーサー配列は、断片が核酸サンプル中に存在する場合には標的核酸断片、又はその相補的な配列の3’末端に隣接するか、又は直接隣接する。好ましくは、プロトスペーサー配列と、核酸サンプル中の標的核酸断片の配列のそれぞれの5’末端又は3’末端との間の距離は、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90又は100の連続したヌクレオチド以下である。ヌクレオチドの数は、本発明の方法で使用されるCRISPRヌクレアーゼに依存し得る。
C)好ましい実施形態では、第1のgRNA-CAS複合体及び第2のgRNA-CAS複合体のうちの少なくとも1つのガイド配列は、非標的核酸断片と標的核酸断片との間でオーバーラップする配列にハイブリダイズすることが可能である。好ましくは、少なくとも第1又は第2のgRNA-CAS複合体のガイド配列は、非標的核酸断片の3’末端と標的核酸断片の5’末端との間でオーバーラップする配列にハイブリダイズすることが可能である。好ましくは、少なくとも第1又は第2のgRNA-CAS複合体のガイド配列は、非標的核酸断片の5’末端と標的核酸断片の3’末端との間でオーバーラップする配列にハイブリダイズすることが可能である。言い換えると、この実施形態では、好ましくは、少なくとも第1又は第2のgRNA-CAS複合体によって標的化されるプロトスペーサー配列は、前記断片が核酸サンプル中に存在する場合、すなわち核酸サンプルの切断前、非標的核酸断片の3’末端と標的核酸断片の5’末端との間でオーバーラップする。
非限定的な例として、SpCas9は、位置3と位置4の間の20ntプロトスペーサー配列内で切断し得る。結果として、その3’末端で標的核酸断片は3ntのプロトスペーサー配列を含むことができ、その5’末端で非標的核酸断片は17ntのプロトスペーサー配列を含むことができる。同様に、プロトスペーサー配列が相補鎖上にある場合、その3’末端で標的核酸断片は17ntのプロトスペーサー配列を含むことができ、その5’末端で非標的核酸断片は3ntのプロトスペーサー配列を含むことができる。したがって、プロトスペーサー配列が連続する20ヌクレオチドである例では、プロトスペーサー配列の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18又は19ヌクレオチドは、非標的核酸断片の3’末端に存在することができ、プロトスペーサー配列のそれぞれ19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2又は1ヌクレオチドは、本発明の方法で使用されるCRISPR-ヌクレアーゼの型に応じて、標的配列の5’末端に存在することができる。
好ましくは、少なくとも第1又は第2のgRNA-CAS複合体によって標的化されるプロトスペーサー配列は、前記断片が核酸サンプルに存在する場合、すなわち核酸サンプルの切断前、非標的核酸断片の5’末端と標的核酸断片の3’末端との間でオーバーラップする。プロトスペーサー配列が20ヌクレオチドである非限定的な例として、プロトスペーサー配列の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18又は19ヌクレオチドは、非標的核酸断片の5’末端に存在することができ、プロトスペーサー配列のそれぞれ19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、又は1ヌクレオチドは、本発明の方法で使用されるCRISPR-ヌクレアーゼの型に応じて、標的配列の3’末端に存在することができる。
好ましい実施形態では、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、標的核酸断片内の配列に結合する。好ましくは、第1及び第2のgRNA-CAS複合体の両方が標的核酸断片内の配列に結合する。
或いは、又はさらに、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、非標的核酸断片内の配列に結合する。好ましくは、第1及び第2のgRNA-CAS複合体の両方が非標的核酸断片内の配列に結合する。
或いは、又はさらに、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、標的核酸断片と非標的核酸断片との間でオーバーラップする配列に結合する。好ましくは、第1及び第2のgRNA-CAS複合体の両方が標的核酸断片と非標的核酸断片との間でオーバーラップする配列に結合する。
好ましい実施形態では、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、切断後、標的核酸断片のそれぞれ5’末端又は3’末端に結合したままである。好ましくは、少なくとも1つのgRNA-CAS複合体は、標的核酸断片の5’末端に結合したままであり、1つのgRNA-CAS複合体は、切断後、標的核酸断片の3’末端に結合したままである。別の表現をすると、好ましくは、標的核酸断片の両側に隣接するgRNA-CAS複合体である。
gRNA-CAS複合体には、プロトスペーサー配列とは別に、認識用のプロトスペーサー隣接モチーフ(PAM)配列が必要であるため、使用されるgRNA-CAS複合体に応じて、標的化プロトスペーサー配列がそのようなPAM配列に隣接するようにgRNAを設計する必要がある。PAM配列はCRISPR/Casエンドヌクレアーゼ活性にとって不可欠であり、比較的短く、したがって、通常、ある程度の長さの任意の所定の配列に複数回存在する。例えば、ストレプトコッカス・ピオゲネスCas9タンパク質のPAMモチーフはNGGであり、これにより確実に、任意の所定のゲノム配列について複数のPAMモチーフが存在し、多くの異なるガイドRNAが設計され得る。さらに、同一の二本鎖配列の反対鎖を標的とするガイドRNAも設計され得る。PAMに直接隣接する配列がガイドRNAに組み込まれる。これは、使用されているCRISPR-CAS複合体に応じて長さが異なり得る。例えば、Cas9sgRNA中の標的配列の最適な長さは20ntである。使用されるCRISPR/Casエンドヌクレアーゼに応じて、複合体はその後、PAMから様々な距離で両方のDNA鎖においてニックを誘発する。例えば、ストレプトコッカス・ピオゲネスCas9タンパク質は、PAM配列の3bp上流の両DNA鎖にニックを導入し、平滑DNA DSBを生成する。例えば使用されるgRNA-CAS複合体に応じて、核酸サンプルの切断に使用されるPAM部位は、生成された標的核酸断片又は生成された非標的核酸断片のいずれかに存在し得る。
好ましくは、核酸サンプル中の目的の配列は、好ましくは目的の配列の末端近くに、本明細書で定義した複合体のCRISPRシステムヌクレアーゼと相互作用することが公知であるPAM配列に隣接されているか、又はそのPAM配列を含む(例えば、Ranら 2015,Nature 520:186~191を参照されたい)。さらに、又は或いは、PAM配列は、好ましくは、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つによって標的化されるプロトスペーサー配列に隣接する。
例えば、前記CRISPR-ヌクレアーゼがストレプトコッカス・ピオゲネス(S.pyogenes)Cas9である場合、PAM配列は5’-NGG-3’の配列を有し得る。例えば、ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)T12 Cas9(例えば、国際公開第2016/198361号を参照されたい)については、PAM配列は、5’-NNNNCNNA-3’の配列を有し得る。Cas9エンドヌクレアーゼについてのさらに公知であるPAM配列は次のとおりである:IIA型5’-NGGNNNN-3’(ストレプトコッカス・ピオゲネス)、5’-NNGTNNN-3’(ストレプトコッカス・パスツリアヌス(Streptococcus pasteurianus))、5’-NNGGAAN-3’(ストレプトコッカス・サーモフィルス(Streptococcus thermophilus))、5’-NNGGGNN-3’(スタフィロコッカス・アウレウス(Staphylococcus aureus))、及びIIC型5’-NGGNNNN-3’(コリネバクテリウム・ジフテリエ(Corynebacterium difteriae)、5’-NNGGGTN-3’(カンピロバクター・ラリ(Campylobacter lari))、5’-NNNCATN-3’(パルビバクラム・ラバメンティボランス(Parvobaculum lavamentivorans))及び5’-NNNNGTA-3’(ナイセリア・シネレア(Neiseria cinerea))。当業者は、したがって、サンプルの核酸から標的配列を断片化するためにgRNAを設計することができる。
gRNA-CAS複合体でgRNAとして使用するためのcrRNA及びtracrRNAとして適切な分子は、当技術分野においては周知である(例えば、国際公開第2013142578号、及びJinekら,Science(2012)337,816~821を参照されたい)。
一実施形態では、crRNAの少なくとも1つは、目的の配列、好ましくは本明細書で定義した目的の配列にハイブリダイズすることができる配列、又はその近くでハイブリダイズすることができる配列を含む。したがって、好ましくは、crRNAの少なくとも1つは、目的の配列中の配列に完全に相補的であるヌクレオチド配列を含んでおり、すなわち、目的の配列はプロトスペーサー配列を含む。
一実施形態では、crRNAの少なくとも1つは、目的の配列、好ましくは本明細書で定義した目的の配列の相補体にハイブリダイズすることができる配列、又はその相補体の近くでハイブリダイズすることができる配列を含む。したがって、好ましくは、crRNAの少なくとも1つは、目的の配列と、又は目的の配列の一部と、完全な配列同一性を有するヌクレオチド配列を含む。
好ましくは、1つ又は複数のcrRNAはまた、tracrRNAと複合体を形成することも可能である。本発明の方法で使用されるcrRNAの少なくとも1つは、非修飾ヌクレオチド又は天然に存在するヌクレオチドを含み得るか、又はそれからなり得る。或いは、又はさらに、少なくとも1つのcrRNAは、修飾ヌクレオチド又は天然に存在しないヌクレオチドを含み得るか、又はそれからなり得、好ましくは、そのような化学修飾されたヌクレオチドは、分解からcrRNAを保護するためのものである。一実施形態では、本発明の方法で使用される少なくとも2つの、又はすべてのcRNAは、修飾ヌクレオチド又は天然に存在しないヌクレオチドを含み得るか、又はそれからなり得る。
本発明の一実施形態では、少なくとも1つのcrRNAは、リボヌクレオチド及び非リボヌクレオチドを含む。少なくとも1つのcrRNAは、1つ又は複数のリボヌクレオチドと1つ又は複数のデオキシリボヌクレオチドを含むことができる。
少なくとも1つのcrRNAは、1つ又は複数の天然に存在しないヌクレオチド又はヌクレオチド類似体、例えば、ホスホロチオエート結合を有するヌクレオチド、リボース環の2’炭素と4’炭素の間にメチレン架橋を含むロックド核酸(LNA)ヌクレオチド、架橋核酸(BNA)、2’-O-メチル類似体、2’-デオキシ類似体、2’-フルオロ類似体又はそれらの組合せを含むことができる。修飾ヌクレオチドは、限定するものではないが、2-アミノプリン、5-ブロモ-ウリジン、プソイドウリジン、イノシン、及び7-メチルグアノシンからなる群から選択される修飾塩基を含み得る。
少なくとも1つのcrRNAは、1つ又は複数の末端ヌクレオチドで、2’-O-メチル(M)、2’-O-メチル3’ホスホロチオエート(MS)、2’-O-メチル3’チオPACE(ホスホノアセテート)(MSP)、又はそれらの組合せを組み込むことにより化学的に修飾することができる。そのような化学的に修飾されたcrRNAは、未修飾のcrRNAと比較して、増加した安定性及び/又は増加した活性を含み得る。(Hendelら, 2015, Nat Biotechnol.33(9);985~989)。特定の実施形態では、少なくとも1つのcrRNAは、プロトスペーサー配列にハイブリダイズする領域内のリボヌクレオチドを含む。本発明の一実施形態では、デオキシリボヌクレオチド及び/又はヌクレオチド類似体は、操作されたcrRNA構造に組み込まれ得、例えば、限定するものではないが、プロトスペーサー配列にハイブリダイズする配列、tracrRNAと相互作用する配列、又はこれらの配列の間に組み込まれ得る。
或いは、又はさらに、化学的に修飾されたヌクレオチドは、プロトスペーサー配列にハイブリダイズする配列の5’及び/又は3’に位置し得る。化学的に修飾された配列は、tracrRNAと相互作用する配列の5’及び/又は3’にさらに位置し得る。
好ましい実施形態では、crRNAのうちの少なくとも1つの長さは、少なくとも約15、20、25、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、65、70、75、80、85、90、95、100又はそれ以上のヌクレオチドの長さであり得る。いくつかの好ましい実施形態では、crRNAのうちの少なくとも1つは、約75、50、45、40、35、30、25又は約20ヌクレオチド未満の長さである。好ましくは、本発明の方法で使用されるcrRNAの長さは、約20~100、25~80、30~60、又は約35~50ヌクレオチドの長さである。
プロトスペーサー配列に相補的であるcrRNA配列の部分は、プロトスペーサー配列とハイブリダイズし、複合体化されたヌクレアーゼが直接、配列特異的に結合するように、プロトスペーサー配列との十分な相補性を有するように設計されている。プロトスペーサー配列は、好ましくは、プロトスペーサー隣接モチーフ(PAM)配列に隣接しており、このPAM配列は、本明細書で定義したRNA-誘導型CRISPRシステムヌクレアーゼ複合体のCRISPRヌクレアーゼと相互作用し得る。例えば、CRISPRヌクレアーゼがストレプトコッカス・ピオゲネスCas9である場合、PAM配列は、好ましくは5’-NGG-3’であり、ここで、NはT、G、A又はCのいずれか1つであり得る。当業者は、任意の所望の配列にハイブリダイズするために、好ましくは、配列を任意の所望のプロトスペーサー配列に少なくとも部分的に相補的であるように操作することによって、任意の所望の配列を標的とするようにcrRNAを操作することが可能である。好ましくは、crRNA配列の部分とその対応するプロトスペーサー配列との間の相補性は、適切なアラインメントアルゴリズムを使用して最適に整列される場合、少なくとも約70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は100%である。プロトスペーサー配列に相補的であるcrRNA配列の部分は、少なくとも約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75、又はそれ以上のヌクレオチドの長さであり得る。いくつかの好ましい実施形態では、DNA標的配列に相補的な配列は、約75、50、45、40、35、30、25、20ヌクレオチド未満の長さである。好ましくは、DNA配列に相補的な配列の長さは、少なくとも17ヌクレオチドである。好ましくは、相補的crRNA配列は、約10~30ヌクレオチドの長さであるか、約17~25ヌクレオチドの長さであるか、又は約15~21ヌクレオチドの長さである。好ましくは、プロトスペーサー配列に相補的であるcrRNAの部分は、15、16、17、18、19、20、21、22、23、24又は25ヌクレオチドの長さであり、好ましくは20又は21ヌクレオチドであり、好ましくは20ヌクレオチドである。
tracrRNAと相互作用するcrRNAの部分は、tracrRNAにハイブリダイズし、複合体化されたヌクレアーゼをプロトスペーサー配列に方向づけるように、tracrRNAと十分に相補的であるように設計されている。好ましくは、crRNA配列のこの部分とtracrRNAのその対応する部分との間の相補性は、適切なアラインメントアルゴリズムを使用して最適に整列される場合、少なくとも約50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は100%である。tracrRNAと相互作用するcrRNAの部分は、好ましくは、少なくとも約5、10、15、20、22、25、30、35、40、45又はそれ以上のヌクレオチドの長さである。いくつかの好ましい実施形態では、tracrRNAと相互作用するcrRNAの部分は、約60、55、50、45、40、35、30又は35ヌクレオチド未満の長さである。好ましくは、tracrRNAと相互作用するcrRNAの部分は、約5~40、10~35、15~30、20~28ヌクレオチドの長さである。好ましくは、tracrRNAと相互作用する部分の長さは、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34又は35ヌクレオチドである。
一実施形態では、本発明の方法で使用される少なくとも第1及び第2のgRNA-Cas複合体は、それぞれ、第1及び第2のcrRNAを含む。しかし、第1及び第2のgRNA-CAS複合体は、同じtracrRNAを含んでいてもよい。
好ましくは、tracrRNAは、本明細書で定義した複合体のCRISPRシステムヌクレアーゼと相互作用することができる1つ又は複数の構造モチーフを含む。好ましくは、tracrRNAはまた、本明細書で定義したcrRNAと相互作用することが可能である。tracrRNAとcrRNAは、crRNAとtracrRNAの間の塩基対形成を介してハイブリダイズし得る。tracrRNAは、好ましくは、CRISPRシステムヌクレアーゼ及びcrRNAと複合体を形成することが可能である。crRNAは、tracrRNAと複合体を形成することが可能であり、標的配列とハイブリダイズすることにより、ヌクレアーゼを標的配列に向けることができる。
tracrRNAは、1つ又は複数のステムループ構造、例えば、1、2、3又はそれ以上のステムループ構造を含み得る。
tracrRNAは、非修飾ヌクレオチド又は天然に存在するヌクレオチドを含み得るか、又はそれからなり得る。或いは、又はさらに、tracrRNAは、修飾ヌクレオチド又は天然に存在しないヌクレオチドを含み得るか、又はそれからなり得、好ましくは、そのような化学修飾されたヌクレオチドは、分解からtracrRNAを保護するためのものである。
本発明の一実施形態では、tracrRNAは、リボヌクレオチド及び非リボヌクレオチドを含む。tracrRNAは、1つ又は複数のリボヌクレオチドと1つ又は複数のデオキシリボヌクレオチドを含むことができる。
tracrRNAは、1つ又は複数の天然に存在しないヌクレオチド又はヌクレオチド類似体、例えば、ホスホロチオエート結合を有するヌクレオチド、リボース環の2’炭素と4’炭素の間にメチレン架橋を含むロックド核酸(LNA)ヌクレオチド、架橋核酸(BNA)、2’-O-メチル類似体、2’-デオキシ類似体、2’-フルオロ類似体又はそれらの組合せを含むことができる。修飾ヌクレオチドは、限定するものではないが、2-アミノプリン、5-ブロモ-ウリジン、プソイドウリジン、イノシン、及び7-メチルグアノシンからなる群から選択される修飾塩基を含み得る。
tracrRNAは、1つ又は複数の末端ヌクレオチドで、2’-O-メチル(M)、2’-O-メチル3’ホスホロチオエート(MS)、2’-O-メチル3’チオPACE(ホスホノアセテート)(MSP)、又はそれらの組合せを組み込むことにより化学的に修飾することができる。そのような化学的に修飾されたtracrRNAは、未修飾のtracrRNAと比較して、増加した安定性及び/又は増加した活性を含み得る。(Hendelら, 2015, Nat Biotechnol.33(9);985~989)。特定の実施形態では、tracrRNAは、crRNAと相互作用する領域内のリボヌクレオチドを含む。
本発明の一実施形態では、デオキシリボヌクレオチド及び/又はヌクレオチド類似体は、操作されたtracrRNA構造に組み込まれ得、例えば、限定するものではないが、crRNAと相互作用する配列に、CRISPRシステムヌクレアーゼと相互作用する配列に、又はこれらの配列の間に組み込まれ得る。
或いは、又はさらに、化学的に修飾されたヌクレオチドは、crRNAと相互作用する配列の5’及び/又は3’に位置し得る。化学的に修飾された配列は、CRISPRシステムヌクレアーゼと相互作用する配列の5’及び/又は3’にさらに位置し得る。
好ましい実施形態では、tracrRNAの長さは、少なくとも約25、30、35、40、45、50、55、60、65、70、72、75、80、85、90、95、100、110、120、130、140、150又はそれ以上のヌクレオチドの長さであり得る。いくつかの好ましい実施形態では、tracrRNAは、約200、180、160、140、120、100、95、90、85、80又は75ヌクレオチド未満の長さである。好ましくは、tracrRNAの長さは、約30~120、40~100、50~90、又は約60~80ヌクレオチドの長さである。
CRISPRシステムヌクレアーゼと相互作用するtracrRNA配列の部分は、複合体化されたヌクレアーゼを標的配列に向けるのに十分であるように設計されている。CRISPRシステムヌクレアーゼと相互作用するtracrRNA配列の部分は、少なくとも約20、25、30、35、40、45、50、55、60、65、70、72、75、80、85、90、95、100又はそれ以上のヌクレオチドの長さであり得る。いくつかの好ましい実施形態では、CRISPRシステムヌクレアーゼと相互作用する配列は、約120、100、80、72、70、60、55、50、45、40、30又は20ヌクレオチド未満の長さである。好ましくは、CRISPRシステムヌクレアーゼと相互作用するtracrRNA配列の部分は、約20~90、30~85、35~80、40~75又は50~72ヌクレオチドの長さである。好ましくは、CRISPRシステムヌクレアーゼと相互作用するtracrRNAの部分は、約40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74又は76ヌクレオチドの長さである。
crRNAと相互作用するtracrRNAの部分は、crRNAにハイブリダイズし、複合体化されたヌクレアーゼを標的配列に向けるように、crRNAに十分に相補的であるように設計されている。好ましくは、tracrRNA配列のこの部分とcrRNAのその対応する部分との間の相補性は、適切なアラインメントアルゴリズムを使用して最適に整列される場合、少なくとも約50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は100%である。crRNAと相互作用するtracrRNAの部分は、好ましくは、少なくとも約5、10、15、20、22、25、30、35、40、45又はそれ以上のヌクレオチドの長さである。いくつかの好ましい実施形態では、crRNAと相互作用するtracrRNAの部分は、約60、55、50、45、40、35、30又は35ヌクレオチド未満の長さである。好ましい実施形態では、crRNAと相互作用するtracrRNAの部分は、約5~40、10~35、15~30、20~28ヌクレオチドの長さである。好ましくは、crRNAと相互作用する部分の長さは、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34又は35ヌクレオチドである。
好ましくは、crRNA及びtracrRNAは、一緒に連結されてsgRNAを形成する。crRNA及びtracrRNAは、当技術分野で公知の任意の従来の方法を使用して、連結させることができ、好ましくは共有結合させることができる。crRNA及びtracrRNAの共有結合は、例えば、参照により本明細書に組み込まれる、Jinekら(上掲)及び国際公開第13/176772号に記載されている。crRNA及びtracrRNAは、例えば、リンカーヌクレオチドを使用して、又はcrRNAの3’末端及びtracrRNAの5’末端の直接共有結合を介して、共有結合され得る。好ましくは、少なくとも第1及び第2のgRNA-CAS複合体のgRNAは、核酸サンプルを少なくとも第1及び第2のgRNA-CAS複合体とインキュベートする際に、核酸サンプル由来の核酸内に含まれる標的核酸断片が前記核酸から切り出される用に設計される。さらに、好ましくは、第1のgRNAは、第1のgRNA-CAS複合体が、核酸サンプルの切断後に標的核酸断片に結合するように設計される。さらに、好ましくは、第2のgRNAは、第2のgRNA-CAS複合体が、核酸サンプルの切断後に標的核酸断片に結合するように設計される。好ましくは、核酸サンプル中に存在する場合の標的核酸断片は、少なくとも1つの非標的核酸断片に隣接している。好ましくは、核酸サンプル中に存在する場合の標的核酸断片は、両側に非標的核酸断片が隣接しており、すなわち、1つの非標的核酸断片は、標的核酸断片の5’に直接存在しており、1つの非標的核酸断片は、標的核酸断片の3’に直接存在している。
好ましくは、本発明の方法の第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、CRISPR-ヌクレアーゼ、好ましくはCas9を標的核酸断片中の配列に標的化するためのsgRNAを含む。任意選択で、本発明の方法の第1及び第2のgRNA-CAS複合体の両方は、それぞれの第1又は第2のgRNA-CAS複合体を標的核酸断片中の配列に標的化するためのsgRNAを含む。好ましくは、本発明の方法の第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、CRISPR-ヌクレアーゼ、好ましくはCas9を、断片が核酸サンプル内に含まれている場合に標的核酸断片に隣接する、好ましくは直接隣接する配列に標的化するためのsgRNAを含む。任意選択で、本発明の方法の第1及び第2のgRNA-CAS複合体の両方は、それぞれの第1又は第2のgRNA-CAS複合体を、標的配列が核酸サンプルに含まれている場合の標的核酸断片に隣接する、好ましくは直接隣接する配列に標的化するためのsgRNAを含む。
好ましくは、本発明の方法の第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、CRISPR-ヌクレアーゼ、好ましくはCas9を、断片が核酸サンプル内に含まれる場合に、標的核酸断片と非標的核酸断片との間でオーバーラップする配列に標的化するためのsgRNAを含む。任意選択で、本発明の方法の第1及び第2のgRNA-CAS複合体の両方は、それぞれの第1又は第2のgRNA-CAS複合体を、標的核酸が核酸サンプルに含まれている場合の標的核酸断片と非標的核酸断片との間でオーバーラップする配列に標的化するためのsgRNAを含む。任意選択で、本発明の方法の第1及び第2のgRNA-CAS複合体の両方は、それぞれの第1又は第2のgRNA-CAS複合体を、それぞれ標的核酸断片の5’末端と非標的核酸断片の3’末端との間でオーバーラップする配列に、及び標的核酸が核酸サンプルに含まれる場合、標的核酸断片の3’末端と非標的核酸断片の5’末端との間でオーバーラップする配列に標的化するためのsgRNAを含む。
或いは、本発明の方法の第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、CRISPR-ヌクレアーゼ、好ましくはCas9を、核酸サンプル中の配列に、すなわち、標的核酸断片に存在する又は非標的核酸断片に存在するプロトスペーサー配列に標的化するためのデュアルガイドRNAを含む。デュアルガイドRNA(dgRNA)は、別個の、しかし好ましくはハイブリダイズした分子としてのcrRNA及びtracrRNAを含むか、又はそれらからなるものとして本明細書では理解されたい。任意選択で、本発明の方法の第1及び第2のgRNA-CAS複合体の両方は、それぞれの第1又は第2のgRNA-CAS複合体をプロトスペーサー配列に標的化するためのdgRNAを含む。
好ましくは、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、二本鎖切断(DSB)を誘導することが可能である。好ましくは、第1及び第2のgRNA-CAS複合体の両方は、核酸サンプルで二本鎖切断(DSB)を誘導することが可能である。
或いは、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つは、本明細書では第1又は第2のgRNA-CAS-ニッカーゼ複合体として示されるニッカーゼであり、これは二重鎖DNAの一本鎖のみをニック導入することが可能である。本発明のそのような実施形態では、ステップb)において、第1又は第2のgRNA-CAS-ニッカーゼ複合体によってニック導入された実質的に相補的な位置で二重鎖DNAの相補鎖にニック導入することが可能な、追加の、すなわち第3のgRNA-CAS複合体が加えられる。実質的に相補的な位置のニック導入により、好ましくは、二本鎖、すなわち、核酸サンプルに平滑な又は互い違いの切断が生じる。
非限定的な例として、例えば第3のgRNA-CAS-ニッカーゼのプロトスペーサー配列は、好ましくは、第1のgRNA-CAS-ニッカーゼ複合体によって標的化されるプロトスペーサー配列に相補的な相補鎖の配列であるか、又は相補鎖の上流方向若しくは下流方向にシフトされた約1、2、3、4、5、6、7、8、9、10、15、20、25、若しくは30ヌクレオチド内の配列である。例えば、第1のgRNA-CAS複合体がgRNA-CAS-ニッカーゼ複合体である場合、第3のgRNA-CAS-ニッカーゼ複合体をステップbで追加することができ、前記第1及び第3のgRNA-CAS-ニッカーゼ複合体によって目的の配列の一方の側で二本鎖切断が誘導され、これは正確に反対の位置が前記第1及び第3の複合体によってニック導入される場合には平滑末端であり得、又は前記第1及び第3の複合体によってニック導入される位置が正確に反対でない場合には互い違いであり得る。同様に、例えば前記第1及び第3のgRNA-CAS-ニッカーゼ複合体に加えて、第2の及びさらなる、例えば第4のgRNA-CAS-ニッカーゼ複合体の両方の使用は、本発明の方法のステップb)で得られる標的核酸断片の2つの平滑末端又は互い違いの末端をもたらし得る。いくつかの事例では、本発明の方法のステップbによって生成される標的核酸断片の一端又は両端に互い違いの末端を生成することが、例えば、その後の方向づけられたアダプター連結の場合、望ましいこともあり得る。
本発明の方法のステップb)は、少なくとも第1及び第2のgRNA-CAS複合体と核酸サンプルを一緒に、gRNA-CAS複合体が少なくとも一本鎖切断を、任意選択で二本鎖切断を誘導するのに適した条件及び時間で、例えば、限定するものではないが、本明細書で提供した実施例で詳述した条件で、インキュベートすることによって実施することができる。任意選択で、インキュベーションは、約1分~約18時間、好ましくは約60分、約10~90℃で、好ましくは約37℃で実施される。
本発明者らは、gRNA-CAS複合体によって切断された標的核酸断片がエキソヌクレアーゼ処理から保護されていることを見出した。したがって、核酸から標的核酸断片を切り出した直後に、エキソヌクレアーゼを加えて1つ又は複数の非標的核酸を消化することができる。標的核酸断片は分解から保護されるが、非保護断片は分解され、標的断片の濃縮又は複雑性の低減がもたらされる。したがって、本発明の方法は、目的の部分を取り出す代わりに、核酸サンプルの望ましくない(非標的)部分を除くアプローチを取っており、それにより、複雑な親和性選択スキームを回避する。
エキソヌクレアーゼは、エキソヌクレアーゼI、III、V、VII、VIII、若しくは関連する酵素、又はそれらの任意の組合せであり得る。エキソヌクレアーゼIIIは、ニックを認識し、ssDNAのピースが形成されるまでニックをギャップまで伸長する。エキソヌクレアーゼVIIは、このssDNAを分解することができる。エキソヌクレアーゼIもまた、ssDNAを分解する。ExoIII及びExoVIIは、本発明の方法のステップc)において使用するためのエキソヌクレアーゼの好ましい組合せである。
エキソヌクレアーゼVは、ssDNAとdsDNAを3’から5’と5’から3’の両方の方向に分解することが可能である。したがって、好ましい実施形態では、本発明の方法のステップc)におけるエキソヌクレアーゼは、ssDNA及びdsDNAを3’から5’と5’から3’の両方の方向に分解することが可能なエキソヌクレアーゼであり、好ましくはエキソヌクレアーゼVである。
非標的配列を分解するための方法に関するさらなる情報は、すべての目的のためにその全体が参照により本明細書に組み込まれる、米国特許出願公開第2014/0134610号で提供されている。
さらに、エンドヌクレアーゼ、すなわち制限酵素は、本発明の方法のステップc)のエキソヌクレアーゼ消化と一緒に、その前に、その後に、又はそれらの任意の組合せのいずれかで、非保護断片の分解に使用することができる。本発明の方法で使用するための制限酵素は、好ましくは、本発明の方法を使用して濃縮される1つ又は複数の目的の標的配列に応じて選択され、好ましくは、1つ又は複数の制限酵素は、目的の1つ又は複数の標的配列内に存在する認識部位は有してないが、好ましくは、サンプルの核酸の残りの部分に、すなわち1つ又は複数の非標的核酸断片に1つ又は複数の位置に存在する認識部位を有するはずであることを本明細書では理解されたい。本発明の方法のステップc)のエキソヌクレアーゼ処理の前、又はさらにステップb)の切断反応の前に制限酵素消化を行う利点は、そのような消化により、gRNA-CAS複合体によって保護されていない場合、ステップc)においてエキソヌクレアーゼによってより容易に消化される断片が得られることである。
ステップc)、及び任意選択のエンドヌクレアーゼステップは、エキソヌクレアーゼ(及び任意選択でエンドヌクレアーゼ)が実質的にすべての非保護断片を分解するのに十分な条件及び時間で、例えば限定するものではないが、本明細書に記載した実施例に詳述されている条件で実施される。好ましくは、ステップc)は、エキソヌクレアーゼ(任意選択でエンドヌクレアーゼ)がすべての非保護断片を分解するのに十分な条件及び時間で実施される。ステップc)は、好ましくは、約1分~約12時間、好ましくは30分間、約10~90℃、好ましくは約37℃で実施される。
ステップc)の後、エキソヌクレアーゼ、及び任意選択のエンドヌクレアーゼは、例えば限定するものではないが、プロテイナーゼ、例えばプロテイナーゼK処理、又は熱による不活性化のうちの少なくとも1つによって不活性化することができる。そのような技術は当技術分野においては標準であり、当業者は、エキソヌクレアーゼ及び任意選択でエンドヌクレアーゼを不活性化する方法を明快に理解している。好ましい不活性化ステップは、サンプルを約50~90℃、好ましくは約75℃の温度で、約1~120分間、好ましくは約10分間、加熱することである。好ましくは、不活性化ステップは、本発明の方法のステップc)とステップd)の間である。
本発明の方法のステップc)の後、1つ又は複数の標的核酸断片で濃縮されたサンプルは、精製ステップ、例えばAMPureビーズベースの精製プロセスにかけられ、複合体、酵素、遊離ヌクレオチド、可能性のある遊離アダプター、及び可能性のある小さな非標的核酸断片が除去され得る。標的核酸断片は、精製後に回収され、さらなるプロセシング及び/又は分析、例えば単一分子配列決定などに供することができる。
本発明の方法は、サイズ選択ステップをさらに含み得る。任意選択で、サイズ選択ステップは、本発明の方法のステップb)の前、ステップb)とc)の間、又はステップc)の後に実施される。
標的核酸断片の長さは変わり得るが、好ましくは、少なくとも200、500、1000、3000、5000、7000、10,000、15,000、又は20,000塩基(少なくとも100,000塩基以下)の長さである。長さは、主として目的の使用に応じて決まり、いくつかの任意の実施形態では、使用される特定の配列決定技術の平均の読み取りの長さに基づく。
有効量の成分が本発明の方法において使用されることを本明細書では理解されたい。例えば、ステップb)で添加される少なくとも第1及び第2のgRNA-CAS複合体は、サンプル中の1つ又は複数の核酸分子の切断を誘導するのに十分な量で提供される。さらに、ステップc)で添加されるエキソヌクレアーゼは、サンプル又は出発物質内の非標的核酸断片の少なくとも約75%、80%、85%、90%、95%、又は100%を分解するのに十分な量で適用される。
本発明の方法は、好ましくは本明細書で定義したステップc)の後に、1つ又は複数の精製ステップを含み得る。任意選択の精製ステップは、プロテイナーゼK処理である。或いは、又はさらに、前記精製は、
I.ステップ(c)の後に得られる消化された核酸サンプルを、1つ又は複数の標的核酸断片に特異的且つ効果的に結合する1つ又は複数の固体支持体に曝露させるステップと;任意選択で、
II.1つ又は複数の固体支持体を洗浄し、1つ又は複数の固体支持体から標的核酸断片を溶出させるステップ
を含み得る。
1つ又は複数の固体支持体は、限定するものではないが、Ampureビーズであり得る。精製後、少なくとも1つの単離された標的核酸断片が得られるので、本明細書で定義した方法はまた、核酸サンプルから1つ又は複数の標的核酸断片を単離するための方法と考えることができる。
本発明の方法は、1つ又は複数の標的核酸断片を配列決定するステップが続き得る。本明細書で定義した方法はまた、したがって、核酸サンプルから1つ又は複数の標的核酸断片を配列決定するための方法と考えることもできる。
任意選択で、本発明の方法は、増幅ステップをさらに含む。好ましくは、この増幅は、エキソヌクレアーゼ処理後、すなわち、本明細書で定義したステップc)の後に実施される。増幅は、PCRによって、又は当技術分野で公知の任意の増幅方法によって実施することができる。
本発明の方法はまた、1つ又は複数のアダプターを標的核酸断片に連結するステップを含み得る。好ましくは、そのようなアダプター連結は、本明細書で定義したステップc)の後に実施される。これらの1つ又は複数のアダプターは、好ましくは、制限部位ドメイン、捕捉ドメイン、配列決定プライマー結合部位、増幅プライマー結合部位、検出ドメイン、バーコード配列、転写プロモータードメイン及びPAM配列、又はそれらの任意の組合せからなる群から選択される機能性ドメインを含み得る。バーコードは、限定するものではないが、サンプルバーコード、又は固有分子識別子(unique molecular identifier、UMI)であり得る。
特に好ましい実施形態では、1つ又は複数のアダプターは、配列決定アダプターであり、例えば、Roche 454A及び454Bシーケンシング、ILLUMINA(商標) SOLEXA(商標)シーケンシング、Applied BiosystemsのSOLID(商標)シーケンシング、Pacific BiosciencesのSMRT(商標)シーケンシング、Pollonator Polonyシーケンシング、Oxford Nanopore Technologies又はComplete Genomicsシーケンシングを可能にする機能性ドメインを含む。
アダプター設計に応じて、アダプターは、一本鎖、二本鎖、部分的二本鎖、Y字型、ヘアピンアダプター又は環化可能なアダプターであり得る。任意選択で、1つ又は複数のアダプターを使用することができる。任意選択で、2つのアダプターの1つ又は複数のセットを使用することができ、セットの第1のアダプターは、標的核酸断片の5’末端側で連結されることを目的とし、セットの第2のアダプターは、標的核酸断片の3’末端側で連結されることを目的とする。好ましくは、セット内の第1及び第2のアダプターはそれぞれ、適合性プライマー結合配列を含むことによって、アダプター連結断片は、適合性プライマー対を使用して増幅されるか、又は配列決定される状態にある。
好ましい実施形態では、本発明の方法は、増幅ステップ及び/又はクローニングステップを含まない。エピジェネティックな情報(例えば、5-mC、6-mAなど)がアンプリコンで失われるので、増幅ステップの減少は有益である。さらなる増幅は、アンプリコンに多様性を導入することができ(例えば、増幅中のエラーを介して)、その結果、それらのヌクレオチド配列は元のサンプルを反映しない。同様に、標的領域の別の生物へのクローニングは、多くの場合、元のサンプル核酸中に存在する修飾が維持されないため、好ましい実施形態では、さらなる分析のために濃縮される標的配列は、典型的には、本明細書の方法では増幅及び/又はクローニングされない。
ステムループアダプター又はヘアピンアダプターは一本鎖であるが、それらの末端は相補的であり、その結果、アダプターはそれ自体で折り返され、二本鎖部分と一本鎖ループが生じる。ステムループアダプターは、直鎖状の二本鎖核酸の末端に連結され得る。例えば、ステムループアダプターが二本鎖標的核酸断片の末端に結合されることにより、末端ヌクレオチドがない場合(例えば、ポリメラーゼ及びリガーゼをそれぞれ使用して、任意のギャップが埋められ、連結される)、得られた分子は、末端ヌクレオチドを欠失し、代わりに両端に一本鎖ループを有する。
標的核酸断片は、環化可能なアダプターに連結され得る。この点において、標的配列を含む断片は、断片のいずれかの側の適合性構造の自己環化によって環化され得るか(これは、アダプター連結から、若しくは連結されたアダプターの制限酵素消化の結果として生じ得る)、又は所望の断片の末端に相補的なセレクタープローブへのハイブリダイゼーションによって環化され得る。伸長及び連結の最終ステップは、共有結合で閉じた環状の、任意選択で二本鎖のポリヌクレオチドを生成する。
核酸サンプルが少なくとも1つの標的核酸断片を含むことを本明細書では理解されたい。別の表現をすると、核酸サンプルは、したがって、1、2、3、4、5、6、7、8、9、10又はそれ以上の標的核酸断片、例えば、少なくとも約50、100、150、200、250、300、350、400、450、500、750、1000又はそれ以上の標的核酸断片を含み得るが、好ましくは、サンプル内のそれぞれの標的核酸断片は別個の配列を有する。本発明の方法は、核酸サンプルからのこれらの標的核酸断片の同時濃縮を提供することができる。したがって、任意選択で、本発明の方法のステップb)において、少なくとも第1及び第2のgRNA-CAS複合体の複数のセットが、核酸サンプルから複数の標的核酸断片を濃縮、単離又は配列決定するために加えられる。好ましくは、第1及び第2のgRNA-CAS複合体のこれらの複数のセットは、同じCRISPR-ヌクレアーゼを含み得るが、それらのgRNAが異なっていてもよい。例えば、それぞれの標的核酸断片について、2つの別個のgRNA分子を使用することができ、例えば、1つのgRNAが第1のgRNA-CAS複合体に組み込まれ、別のgRNAが第2のgRNA-CAS複合体に組み込まれる。例えば、少なくとも約50、100、150、200、250、300、350、400、450、500、750、1000又はそれより多くの標的核酸断片、好ましくは、少なくとも約50、100、150、200、250、300、350、400、450、500、750、1000又はそれより多くのセットのgRNA分子、好ましくは、少なくとも約100、200、300、400、500、600、700、800、900、1000、1500、2000又はそれより多くの異なるgRNA分子が本発明の方法において使用され得る。
任意選択で、本発明の方法は多重化され、すなわち、複数の核酸サンプルに対して、例えば、少なくとも約10、20、30、40、50、60、70、80、90、100、500、1000又はそれより多くの核酸サンプルに対して同時に適用される。この方法は、複数のサンプルに対して並行して実施することができ、「並行して」とは、実質的に同時にと本明細書では理解するものとするが、それぞれのサンプルは個別の反応チューブ又は容器で処理される。さらに、又は或いは、本発明の方法の1つ又は複数のステップは、プールされたサンプルに対して実施することができる。濃縮、単離及び/又は配列決定された断片を元のサンプルまで遡るために、サンプルをプールする前に、断片を識別子でタグ付けすることができる。そのような識別子は、任意の検出可能な実体、例えば限定するものではないが、放射性標識又は蛍光標識であり得るが、好ましくは定義された長さの、特定のヌクレオチド配列又はヌクレオチド配列の組合せであるのが好ましい。さらに、又は或いは、サンプルは、独創的なプーリング戦略、例えば限定するものではないが、2D及び3Dプーリング戦略を使用してプールすることができ、それによって、プール後、各サンプルは、少なくとも2つ又は3つのプールにそれぞれ含まれる。特定の標的断片は、特定の濃縮、単離、及び/又は配列決定された標的断片を含むそれぞれのプールの座標を使用することによって、元のサンプルまで遡ることができる。
本発明の方法の核酸サンプルは、任意の供給源、例えば、ヒト、動物、植物、微生物由来のものであってよく、細胞の内因性又は外因性のあらゆる種類のもの、例えば、ゲノムDNA、染色体DNA、人工染色体、プラスミドDNA、又はエピソームDNA、cDNA、RNA、ミトコンドリア、又はBAC若しくはYACなどの人工ライブラリーであってもよい。DNAは、核DNA又はオルガネラDNAであり得る。好ましくは、DNAは染色体DNAであり、好ましくは細胞に内因性である。
さらなる態様では、本発明は、本明細書で上記に定義した方法のためのキットオブパーツを提供する。好ましくは、前記キットは、
本明細書で定義した少なくとも第1及び第2のgRNA-CAS複合体を含む1つ又は複数のバイアル;
CRISPR-CASタンパク質と複合体を形成してgRNA-CAS複合体を形成するための少なくとも第1及び第2のgRNAを含む1つ又は複数のバイアルと、前記CRISPR-CASタンパク質を含むさらなるバイアル;
非標的核酸を分解するための1つ又は複数のエキソヌクレアーゼを含むさらなるバイアル;並びに、
任意選択で、非標的核酸を分解するための1つ又は複数の制限酵素を含むバイアル
のうちの少なくとも1つを含む。
任意選択で、キットは、本明細書で定義した1つ又は複数のアダプターを、本明細書の上記で示した1つ又は複数のバイアル又は別個のバイアルのいずれかとともに、さらに含む。好ましくは、キットは、本明細書で定義した1つ又は複数のgRNAを含む少なくとも2、4、10、20、30、又は50個のバイアルを含む。好ましくは、キット内のいずれかのバイアルの容量は、100mL、50mL、20mL、10mL、5mL、4mL、3mL、2mL、又は1mLを超えない。
試薬は、凍結乾燥された形態で存在していてもよく、又は適切な緩衝液中に存在していてもよい。キットはまた、本発明を実施するのに必要な任意の他の構成要素、例えば、緩衝液、ピペット、マイクロタイタープレート、及び書面の説明書を含むことができる。本発明のキットのためのそのような他の構成要素は、当業者には公知である。
最後に、核酸サンプルから少なくとも1つの標的核酸断片を濃縮するための、少なくとも第1及び第2のgRNA-CAS複合体、又は本明細書で定義したキットオブパーツの使用が提供される。さらに特に、エキソヌクレアーゼ分解から標的核酸断片を保護するための少なくとも第1及び第2のgRNA-CAS複合体の使用が提供される。
実施例1
材料及び方法
合計3μgのラムダDNA(配列番号5、GenBankアクセッション番号J02459.1)(300ng/μlの10μl)を、制限エンドヌクレアーゼPciI(New England Biolabs)を使用し、以下の成分、2μlの10xNEB 3.1バッファー(New England Biolabs)、3μlのPciIエンドヌクレアーゼ(10U/ml)、及び5μlのヌクレアーゼフリーの水を加えて消化した。得られた20μlの反応混合物を37℃で1時間インキュベートし、その後、酵素を80℃で20分間のインキュベーションによって不活性化した。ラムダDNAの2つのPciI認識部位の概要を図1に示す。
PciI制限化ラムダDNAの2つの特定の部位は、Cas9とこれらの標的化部位に対して設計された2つのsgRNAを使用して標的化した。第1のsgRNA(sgRNA9)は配列番号13を有し、配列番号14を有するプロトスペーサー配列を標的とする。第2のsgRNA(sgRNA13)は配列番号15を有し、配列番号16を有するプロトスペーサー配列を標的とする。反応条件は以下のとおりであった:20μlのPciI制限化ラムダDNA(上記参照)、1μlの10xNEB 3.1バッファー、3μlの0.3mM sgRNA9、3μlの0.3μM sgRNA13、1.8μlのCas9タンパク質(New England Biolabs)及び1.2μlのヌクレアーゼフリーの水。30μlの反応混合物を37℃で1時間インキュベートした。
非保護断片をエキソヌクレアーゼVとのインキュベーションによって除去した。これについては、12.5μlのCas9反応物に、以下の成分、1.75μlの10xNEB 3.1バッファー、3.0μlの10mM ATP(New England Biolabs)、1.0μlの10U/μl ExoVエキソヌクレアーゼ(New England Biolabs)及び11.75μlのヌクレアーゼフリーの水を加えた。得られた30μLの反応混合物を、37℃で30分間インキュベートした。タンパク質を75℃で10分間インキュベーションすることにより不活性化した。
以下の対照反応を実施した:
1.ラムダDNAの制限のみ。これについては、上記のPciI制限反応のみを実施した。
2.PciI制限化ラムダDNAのエキソヌクレアーゼVとのインキュベーション。これについては、ラムダDNAのPciI制限後、以下の成分、1.0μlの10xNEB 3.1バッファー、3.0μlの10mM ATP、1.0μlの10U/μl ExoVエキソヌクレアーゼ及び5.0μlのヌクレアーゼフリーの水を添加した。30.0μlの反応混合物を、37℃で30分間インキュベートした。エキソヌクレアーゼ酵素を75℃で10分間インキュベーションすることにより不活性化した。
すべてのサンプルは、Ampure XP溶液(Beckman Coultier、Brea、CA、USA)を使用し、ビーズのサンプルに対する比を0.8倍にして精製した。結合後、ビーズを70%エタノールで2回洗浄し、結合したDNAを10μlのヌクレアーゼフリーの水で溶出した。溶出したDNAを、FEMTO Pulse(Advanced Analytical)を使用して分析した。
結果
FEMTO Pulse分析の結果を図2に示す:まとめると;
PciI制限酵素で消化したラムダDNAは、約600bp(配列番号6)~約9,000bp(配列番号8)~約40,000bp(配列番号7)の長さを有する、予測された断片を示した。
PciI制限酵素で消化し、その後ExoVエキソヌクレアーゼとインキュベーションしたラムダDNAは断片が残っていないことを示し、このことはエキソヌクレアーゼ保護がないことを示唆している。
PciI制限酵素で消化し、Cas9をsgRNA9及び13とともに使用して標的したラムダDNAは、約600bp(配列番号6)~約9,000bp(2x)(配列番号11及び12)~約10,000bp(配列番号10)~約20,000bp(配列番号9)の長さを有する、予測された断片を示した。配列番号9の最後の(3’)約500bpは配列番号17に示し、配列番号11の最初の(5’)約500bpは配列番号18に示している。配列番号10は、その5’末端に配列番号14のプロトスペーサー部分と、その3’末端に配列番号16のプロトスペーサー部分を含む。
PciI制限酵素で消化し、Cas9をsgRNA9及び13とともに使用して標的し、続いてExoVエキソヌクレアーゼとインキュベートしたラムダDNAは、驚いたことに、約10,000bpの長さの断片を示した(配列番号10)。
結論
CRISPR-システムヌクレアーゼ複合体は、DNAをエキソヌクレアーゼの分解から保護することができる。
実施例2
材料、方法及び結果
作物DNAで本方法を調査するために、メロンVedrantaisのゲノムDNAの423遺伝子座を標的とするようにsgRNAを設計し、これらの標的はそれぞれ5.1~5.9kbpの長さを有する。それぞれの標的については、少なくとも2つのsgRNAの組が、それぞれの標的に隣接する500bpの上流領域と下流領域の両方を標的とするように設計されており、それぞれのsgRNAは、ゲノム内に特有の20ntの長さのガイド配列を含む。
合計48の反応物は、2.5μlの10xNEB 3.1バッファー(New England Biolabs Inc.)、0.18μlの16.58μM sgRNAミックス、0.15μlの20μM S.ピオゲネスCas9ヌクレアーゼ(New England Biolabs Inc.)及び13.17μlのヌクレアーゼフリーの水からなる総量25μlの中に、それぞれ9μlの115.6ng/μl(=約1μg)のメロンVedrantaisDNAを含む。
メロンVedrantaisDNA(9μl)を加える前に、反応混合物(16μl)を10分間、室温でプレインキュベートした。25μlの反応物を、37℃で1時間インキュベートした。非保護断片を、エキソヌクレアーゼVとのインキュベーションによって除去した。これについては、25μlのCas9反応物を分割し、各12.5μlに、以下の成分、2μlの10xNEB 3.1バッファー、2.0μlの50mM ATP(New England Biolabs Inc.)、2.5μlの10U/μlエキソヌクレアーゼVエキソヌクレアーゼ(New England Biolabs Inc.)及び1μlのヌクレアーゼフリーの水を加えた。得られた20μlの反応混合物を37℃で60分間インキュベートした。タンパク質を、70℃で30分間インキュベーションすることによって不活性化した。ペプチド結合を加水分解するため、1μlの20mg/mlプロテイナーゼK(Roche)を20μlの反応混合物に加え、室温で10分間インキュベートした。
すべてのサンプルを、Ampure PBビーズ溶液(Pacific Biosciences)を使用し、ビーズのサンプルに対する比を0.45倍にして精製した。すべての96反応の反応混合物をプールした。磁石に結合させた後、ビーズを70%エタノールで2回洗浄した。ビーズを1分間乾燥させ、結合したDNAを50μlのヌクレアーゼフリーの水で溶出させた。溶出したDNAを、FEMTO Pulse(Advanced Analytical)を使用して分析した。結果を図3に示す。
溶出したDNAを、BluePippin(Sage Science)を使用してサイズ選択する(2.5kbp~10kbp)。単離マトリックスのBluePippin Dye Free 0.75%アガロースゲルカセットを使用した。サイズ選択された生成物を、QIAquick PCR Purificationキット(Qiagen)を使用して精製する。精製されたDNAを10μlのヌクレアーゼフリーの水で溶出させた。溶出したDNAを、FEMTO Pulse(Advanced Analytical)を使用して分析した。結果を図4に示す。
溶出したDNAを、Oxford Nanopore MinlONシステムを使用して、配列決定用のシーケンスライブラリー調製に使用した。ライブラリー調製及び配列決定は、メーカーの仕様に従って実施した。
得られた配列読み取りはメーカーの設定を使用して品質フィルタリングされ、それにパスした読み取りをメロンVedrantaisの全ゲノム参照配列に対してマッピングした。読み取りのマッピングについては、minimap2.11-r797を標準設定で使用した。マッピングした読み取りから、単一のマッピング位置を有するものだけをさらなる分析に使用した。得られたマッピングした読み取りを、IGVソフトウェア(Broad Institute)を使用して視覚化した。図5に、約47kbp離れているゲノム内の2つの標的に関するこのようなマップを提供する。視覚化においては、標的化遺伝子座と、その遺伝子座を標的とするために使用されるsgRNAの位置も示している。
結論
CRISPR-システムヌクレアーゼ複合体は、DNAをエキソヌクレアーゼ分解から保護することができ、それによって目的の標的化領域のDNAが濃縮される。

Claims (17)

  1. 核酸分子を含むサンプルから標的核酸断片を濃縮するための方法であって、標的核酸断片が目的の配列を含み、方法が、
    a)目的の配列を含む核酸分子を含むサンプルを提供するステップと;
    b)少なくとも第1及び第2のgRNA-CAS複合体で核酸分子を切断し、それにより、エキソヌクレアーゼ切断から保護される目的の配列を含む標的核酸断片及び少なくとも1つの非標的核酸断片を生成するステップと;
    c)ステップb)で得られた切断された核酸分子をエキソヌクレアーゼと接触させ、エキソヌクレアーゼが少なくとも1つの非標的核酸断片を消化できるようにするステップと;
    d)任意選択で、ステップc)で得られた消化物から目的の配列を含む標的核酸断片を精製するステップと
    を含む、方法。
  2. ステップc)におけるエキソヌクレアーゼ消化の前に、標的核酸断片、又は標的核酸断片の末端を保護するさらなるステップを含まない、請求項1に記載の方法。
  3. i)ステップb)が、第1及び第2のgRNA-CAS複合体と核酸分子を一緒に約1分~約18時間、好ましくは約60分間、約10~90℃、好ましくは約37℃でインキュベートすることによって実施されること;
    ii)ステップc)が、切断された核酸分子をエキソヌクレアーゼとともに約1分~約12時間、好ましくは30分間、約10~90℃、好ましくは約37℃でインキュベートすることによって実施されること
    のうちの少なくとも1つである、請求項1又は2に記載の方法。
  4. 第1及び第2のgRNA-CAS複合体のうちの少なくとも1つがCas9タンパク質を含む、請求項1~3のいずれか一項に記載の方法。
  5. 第1及び第2のgRNA-CAS複合体のうちの少なくとも1つがsgRNAを含む、請求項1~4のいずれか一項に記載の方法。
  6. 第1及び第2のgRNA-CAS複合体のうちの少なくとも1つが別個の分子としてcrRNA及びtracrRNAを含む、請求項1~5のいずれか一項に記載の方法。
  7. 第1及び第2のgRNA-CAS複合体のうちの少なくとも1つがDSBを誘導することができる、請求項1~6のいずれか一項に記載の方法。
  8. 第1及び第2のgRNA-CAS複合体の両方がDSBを誘導することができる、請求項1~7のいずれか一項に記載の方法。
  9. ステップb)において、第1及び第2のgRNA-CAS複合体のうちの少なくとも1つが核酸分子の1つの鎖をニック導入し、核酸分子が、前記第1又は第2のgRNA-CAS複合体によってニック導入された位置の実質的に相補的位置で相補鎖をニック導入する少なくとも第3のgRNA-CAS複合体と接触される、請求項1~8のいずれか一項に記載の方法。
  10. 核酸分子を含むサンプルからアダプター連結標的核酸断片を調製するための方法であって、標的核酸断片が目的の配列を含み、方法が、
    a)目的の配列を含む核酸分子を含むサンプルを提供するステップと;
    b)少なくとも第1及び第2のgRNA-CAS複合体で核酸分子を切断し、それにより、目的の配列を含む標的核酸断片及び少なくとも1つの非標的核酸断片を生成するステップと;
    c)ステップb)で得られた切断された核酸分子をエキソヌクレアーゼと接触させ、エキソヌクレアーゼが少なくとも1つの非標的核酸断片を消化できるようにするステップと;
    d)任意選択で、ステップc)で得られた消化物から目的の配列を含む標的核酸断片を精製するステップと;
    e)アダプターを標的核酸断片に連結させるステップと
    を含む、方法。
  11. アダプターが配列アダプターである、請求項10に記載の方法。
  12. 核酸分子を含むサンプルから標的核酸断片を配列決定するための方法であって、標的核酸断片が目的の配列を含み、方法が、
    a)目的の配列を含む核酸分子を含むサンプルを提供するステップと;
    b)少なくとも第1及び第2のgRNA-CAS複合体で核酸分子を切断し、それにより、目的の配列を含む標的核酸断片及び少なくとも1つの非標的核酸断片を生成するステップと;
    c)ステップb)で得られた切断された核酸分子をエキソヌクレアーゼと接触させ、エキソヌクレアーゼが少なくとも1つの非標的核酸断片を消化できるようにするステップと;
    d)任意選択で、ステップc)で得られた消化物から目的の配列を含む標的核酸断片を精製するステップと;
    e)任意選択で、アダプターを標的核酸断片に連結させるステップと;
    f)少なくとも1つの標的核酸断片を配列決定するステップと
    を含む、方法。
  13. 複数の核酸サンプルに対して並行して実施される、請求項1~12のいずれか一項に記載の方法。
  14. 核酸分子がゲノムDNAである、請求項1~13のいずれか一項に記載の方法。
  15. 核酸分子が植物、動物、ヒト又は微生物から得られる核酸分子である、請求項1~14のいずれか一項に記載の方法。
  16. 請求項1~15のいずれか一項で定義した少なくとも第1及び第2のgRNA-CAS複合体と、
    エキソヌクレアーゼと
    を含む、核酸分子から標的核酸断片を濃縮するためのキットオブパーツ。
  17. 核酸分子から少なくとも1つの標的核酸断片を濃縮するための、請求項1~15のいずれか一項に記載の第1及び第2のgRNA-CAS複合体、又は請求項16に記載のキットオブパーツの使用。
JP2021521506A 2018-11-28 2019-11-27 エンドヌクレアーゼ保護による標的化濃縮 Pending JP2022511633A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18208936 2018-11-28
EP18208936.7 2018-11-28
PCT/EP2019/082791 WO2020109412A1 (en) 2018-11-28 2019-11-27 Targeted enrichment by endonuclease protection

Publications (1)

Publication Number Publication Date
JP2022511633A true JP2022511633A (ja) 2022-02-01

Family

ID=64745851

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021521506A Pending JP2022511633A (ja) 2018-11-28 2019-11-27 エンドヌクレアーゼ保護による標的化濃縮

Country Status (7)

Country Link
US (1) US20220033879A1 (ja)
EP (1) EP3887538A1 (ja)
JP (1) JP2022511633A (ja)
CN (1) CN113166798A (ja)
AU (1) AU2019390691A1 (ja)
CA (1) CA3117768A1 (ja)
WO (1) WO2020109412A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022112316A1 (en) 2020-11-24 2022-06-02 Keygene N.V. Targeted enrichment using nanopore selective sequencing
CN113667718B (zh) * 2021-08-25 2023-11-28 山东舜丰生物科技有限公司 利用双链核酸检测器进行靶核酸检测的方法
CN116240200A (zh) * 2022-07-01 2023-06-09 中国科学院基础医学与肿瘤研究所(筹) 一种基于可编程核酸酶的超灵敏目标核酸富集检测方法
CN117551746A (zh) * 2023-12-01 2024-02-13 北京博奥医学检验所有限公司 一种检测目标核酸及其邻近区域核酸序列的方法

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1340807C (en) 1988-02-24 1999-11-02 Lawrence T. Malek Nucleic acid amplification process
CZ291877B6 (cs) 1991-09-24 2003-06-18 Keygene N.V. Způsob amplifikace přinejmenším jednoho restrikčního fragmentu z výchozí DNA a způsob přípravy sestavy amplifikovaných restrikčních fragmentů
US5948902A (en) 1997-11-20 1999-09-07 South Alabama Medical Science Foundation Antisense oligonucleotides to human serine/threonine protein phosphatase genes
EP1124990B1 (en) 1998-10-27 2006-01-18 Affymetrix, Inc. Complexity management and analysis of genomic dna
EP1873260B1 (en) 1998-11-09 2009-03-18 Eiken Kagaku Kabushiki Kaisha Process for synthesizing nucleic acid
US6958225B2 (en) 1999-10-27 2005-10-25 Affymetrix, Inc. Complexity management of genomic DNA
US6756501B2 (en) 2001-07-10 2004-06-29 E. I. Du Pont De Nemours And Company Manufacture of 3-methyl-tetrahydrofuran from alpha-methylene-gamma-butyrolactone in a single step process
US6872529B2 (en) 2001-07-25 2005-03-29 Affymetrix, Inc. Complexity management of genomic DNA
CA2496517A1 (en) 2002-09-05 2004-03-18 Plant Bioscience Limited Genome partitioning
CN102925561B (zh) 2005-06-23 2015-09-09 科因股份有限公司 用于多态性的高通量鉴定和检测的策略
ATE453728T1 (de) 2005-09-29 2010-01-15 Keygene Nv Screening mutagenisierter populationen mit hohem durchsatz
WO2007073171A2 (en) 2005-12-22 2007-06-28 Keygene N.V. Improved strategies for transcript profiling using high throughput sequencing technologies
EP3404114B1 (en) 2005-12-22 2021-05-05 Keygene N.V. Method for high-throughput aflp-based polymorphism detection
US9528107B2 (en) 2012-01-31 2016-12-27 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
EP4289948A3 (en) 2012-05-25 2024-04-17 The Regents of the University of California Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription
CN106232814B (zh) * 2014-02-13 2021-05-11 宝生物工程(美国)有限公司 从核酸的初始集合中耗尽靶分子的方法、以及用于实践其的组合物和试剂盒
CN112941065A (zh) * 2014-07-21 2021-06-11 亿明达股份有限公司 使用crispr-cas系统的多核苷酸富集
EP3183367B1 (en) 2014-08-19 2019-06-26 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
US10435685B2 (en) * 2014-08-19 2019-10-08 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
CN107406875B (zh) * 2014-12-20 2021-12-07 阿克生物公司 使用CRISPR/Cas系统蛋白靶向消减、富集、和分割核酸的组合物及方法
GB201510296D0 (en) 2015-06-12 2015-07-29 Univ Wageningen Thermostable CAS9 nucleases
AU2016326711B2 (en) * 2015-09-24 2022-11-03 Editas Medicine, Inc. Use of exonucleases to improve CRISPR/Cas-mediated genome editing
CN109477137B (zh) * 2016-05-11 2023-05-30 伊鲁米那股份有限公司 使用argonaute系统的多核苷酸富集和扩增
CN108064305B (zh) * 2017-03-24 2021-10-08 清华大学 可编程的溶瘤病毒疫苗系统及其应用
EP3950957A1 (en) * 2017-08-08 2022-02-09 Depixus In vitro isolation and enrichment of nucleic acids using site-specific nucleases

Also Published As

Publication number Publication date
WO2020109412A1 (en) 2020-06-04
US20220033879A1 (en) 2022-02-03
AU2019390691A1 (en) 2021-05-13
CA3117768A1 (en) 2020-06-04
EP3887538A1 (en) 2021-10-06
CN113166798A (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
US11795501B2 (en) Methods for next generation genome walking and related compositions and kits
JP2022511633A (ja) エンドヌクレアーゼ保護による標的化濃縮
JP7460539B2 (ja) 核酸を結合、修飾、および切断する物質の基質選択性および部位のためのin vitroでの高感度アッセイ
US20220389416A1 (en) COMPOSITIONS AND METHODS FOR CONSTRUCTING STRAND SPECIFIC cDNA LIBRARIES
EP4095259A1 (en) Method of nucleic acid enrichment using site-specific nucleases followed by capture
WO2019030306A1 (en) ISOLATION AND IN VITRO ENRICHMENT OF NUCLEIC ACIDS USING SITE-SPECIFIC NUCLEASES
US11401543B2 (en) Methods and compositions for improving removal of ribosomal RNA from biological samples
JP2020524491A (ja) ガイド核酸の作製および使用
US11091791B2 (en) Methods for hybridization based hook ligation
US11371095B2 (en) High-throughput method for characterizing the genome-wide activity of editing nucleases in vitro (Change-Seq)
EP3844302A1 (en) Optimization of in vitro isolation of nucleic acids using site-specific nucleases
US11661624B2 (en) Methods of identifying and characterizing gene editing variations in nucleic acids
US20220333100A1 (en) Ngs library preparation using covalently closed nucleic acid molecule ends
US11987837B2 (en) Nucleic acid sequence enrichment by defined nucleic acid-directed endonuclease digestion
US20240002904A1 (en) Targeted enrichment using nanopore selective sequencing
US20220145359A1 (en) Methods for targeted depletion of nucleic acids
JP2023543602A (ja) 標的化された配列付加
유지현 Versatile application of the CRISPR-Cas system to various organisms

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20210531

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231017

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240305