JP2023543602A - 標的化された配列付加 - Google Patents

標的化された配列付加 Download PDF

Info

Publication number
JP2023543602A
JP2023543602A JP2023519825A JP2023519825A JP2023543602A JP 2023543602 A JP2023543602 A JP 2023543602A JP 2023519825 A JP2023519825 A JP 2023519825A JP 2023519825 A JP2023519825 A JP 2023519825A JP 2023543602 A JP2023543602 A JP 2023543602A
Authority
JP
Japan
Prior art keywords
nucleic acid
sequence
target nucleic
strand
acid fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023519825A
Other languages
English (en)
Inventor
ルネ コルネリス ヨセフス ホジャーズ,
ステファン ジョン ホワイト,
テオドルス フランク マリア ルーロフス,
Original Assignee
キージーン ナムローゼ フェンノートシャップ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by キージーン ナムローゼ フェンノートシャップ filed Critical キージーン ナムローゼ フェンノートシャップ
Publication of JP2023543602A publication Critical patent/JP2023543602A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/48Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving transferase
    • C12Q1/485Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving transferase involving kinase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

本発明は、部位特異的ヌクレアーゼ及び逆転写酵素の組合せを使用して標的核酸断片を標識する方法に関する。標識化は、標的核酸断片の少なくとも1つの遊離3’末端への特定のヌクレオチド配列の付加を結果としてもたらす。本発明は、標的核酸断片の配列を決定する方法、並びに本発明の方法における使用のための構築物及びキットにさらに関する。【選択図】 図1

Description

本発明は、遺伝子研究の分野にあり、より詳細には、例えば遺伝子研究におけるさらなる分析又は処理のためのライブラリー調製のための、標的化された核酸単離の分野にある。核酸試料の複雑性低減又は核酸試料内の標的核酸の富化のための新たな方法及び組成物が開示される。
遺伝子研究の意義深い構成要素は、定義されたDNA座位の配列分析である。これは、既知のバリアントを遺伝子型判定するか、又は配列変化若しくはバリアントを同定することであり得る。そのような分析は多くの場合にマルチプレックスの文脈において行われる必要があり、例えば、特有の座位のセットが多数の試料において分析される必要がある。これを行うための理想的なアッセイは、スクリーニングされる必要がある試料及び座位の数に関して柔軟であり、非常に正確であり、異なるシークエンシングプラットフォームに適する。理想的には増幅なしの富化ステップを含むアッセイを提供する試みが行われてきた。例えば、米国特許出願公開第2014/0134610号は、II型制限酵素を使用して試料中の核酸を断片化し、続いて保護的なアダプターをライゲートし、その後にエキソヌクレアーゼを使用してすべての捕捉されなかった核酸を分解する複雑性低減方法を記載している。国際公開第2016/028887号において、この方法は、試料中の核酸を断片化するためにプログラム可能なエンドヌクレアーゼ、すなわちCRISPR-エンドヌクレアーゼを使用することにより補正されている。
CRISPR(クラスター化規則的間隔短鎖回文反復配列)は、複数の短いダイレクトリピートを含有する座位であり、シークエンシングされた細菌の40%及びシークエンシングされた古細菌の90%において見出されている。CRISPRリピートは、遺伝学的病原体、例えばバクテリオファージ及びプラスミドに対する獲得された細菌免疫のシステムを形成する。細菌が病原体に負荷された場合に、病原体のゲノムの小片はCRISPR関連タンパク質(CAS)によりプロセシングされ、細菌ゲノム中にCRISPRリピートの間で組み込まれる。CRISPR座位は次に転写及びプロセシングされて、病原体のゲノムと同一のおよそ30bpの配列を含むいわゆるcrRNAを形成する。これらのRNA分子は、その後の感染時の病原体の認識のための基礎を形成し、病原体のゲノムの直接的な消化を通じて病原体の遺伝子エレメントのサイレンシングをもたらす。CASタンパク質Cas9は、S.ピオゲネス(S.pyogenes)からのII型CRISPR-CASシステムの必須の構成要素であり、トランス活性化crRNA(tracrRNA)と称される第2のRNAと共にcrRNAと組み合わせられた場合に、エンドヌクレアーゼを形成する。この複合体は、crRNAにより定義されるゲノム中の位置におけるDNA二本鎖切断(DSB)の導入により分解のために侵入性病原体DNAを標的化する。このII型CRISPR-Cas9システムは、二本鎖切断の標的化された導入及び内因性修復機構のその後の活性化を介して、目的の部位において真核ゲノム中に改変を導入することが可能である、生化学における簡便及び有効なツールであることが証明されている。Jinekら(2012、Science 337:816~820頁)は、crRNA及びtracrRNAの必須の配列を単一のRNA分子中に組み合わせることにより生成される単鎖キメラRNA(シングルガイドRNA、sRNA、sgRNA)は、Cas9と組み合わせて機能的なエンドヌクレアーゼを形成できることを実証した。それ以来、多くの異なるCRISPR-CASシステムが異なる細菌種から同定されている(Zetscheら、2015 Cell 163、759~771頁;Kimら、2017、Nat.Commun.8、1~7頁;Ranら、2015.Nature 520、186~191頁)。
エンドヌクレアーゼを核酸分子中の特定の位置に方向付けるためにRNAガイドが使用されるCRISPR-CASシステムの他に、DNA又はRNAガイドを使用する他のエンドヌクレアーゼが当技術分野において公知である(Doxzenら、2017、PLOS ONE 12(5):e0177097;Kayaら、2016、PNAS vol.113 no.15、4057~4062頁)。
最近、CRISPRシステムは、「プライム編集」と呼ばれるプロセスにおいてDNAを特異的に編集するために使用された(Anzalone AVら、Nature.2019;576(7785):149~157頁)。操作された逆転写酵素に融合された触媒的に不具合のあるCas9エンドヌクレアーゼを使用して、予め決定されたゲノム位置において特異的な編集を行うことができた。
核酸複雑性低減のための多用途の及び正確な方法に対する強い必要性が依然として当技術分野において存在する。特に、例えば遺伝子研究におけるその後の分析又は処理のための、核酸分子の柔軟な及び有効な標識化を可能とする方法に対する必要性が当技術分野において存在する。
以下に詳細に記載される本発明は、下流の処理及び/又は分析のためのライブラリー調製の多用途の方法を可能とする。
本発明は、以下の実施形態において要約され得る:
実施形態1.標的核酸断片を標識する方法であって、標的核酸断片が第1の鎖及び相補的な第2の鎖を含み、標的核酸断片が目的の配列を含み、方法が、
a)二本鎖核酸分子を含む試料を提供するステップであり、二本鎖核酸分子が目的の配列を含む、ステップ;
b)二本鎖核酸分子を部位特異的ヌクレアーゼと接触させて二本鎖切断を生成するステップであり、二本鎖切断が標的核酸断片の第1の鎖の遊離3’末端を結果としてもたらす、ステップ;並びに
c)切断された核酸分子を逆転写酵素及び鋳型RNA分子と接触させ、それにより、1つ又は複数のヌクレオチドで標的核酸断片の第1の鎖の遊離3’末端を標識するステップ
を含み、
任意選択でステップb)における部位特異的ヌクレアーゼ及びステップc)における逆転写酵素が別々の実体である、方法。
実施形態2.方法が、
d)二本鎖核酸分子を第2の部位特異的ヌクレアーゼと接触させて第2の二本鎖切断を生成するステップであり、第2の二本鎖切断が標的核酸断片の第2の鎖の遊離3’末端を結果としてもたらす、ステップをさらに含み、好ましくはステップd)がステップb)と同時に行われる、実施形態1に記載の方法。
実施形態3.方法が、
e)標的核酸断片を逆転写酵素及び第2の鋳型RNA分子と接触させ、それにより、1つ又は複数のヌクレオチドで遊離3’末端において標的核酸断片の第2の鎖を標識するステップをさらに含み、好ましくはステップe)がステップc)と同時に行われる、実施形態2に記載の方法。
実施形態4.ステップb)及び/又はステップd)における部位特異的ヌクレアーゼが、好ましくはCas9又はCpf1ヌクレアーゼのうちの少なくとも1つを含む、CRISPR-ヌクレアーゼ複合体である、先行する実施形態のいずれか1つに記載の方法。
実施形態5.CRISPR-ヌクレアーゼ複合体がcrRNA及び任意選択でtracrRNAを含む、実施形態4に記載の方法。
実施形態6.ステップc)の鋳型RNA分子が、標的核酸断片の第1の鎖の3’末端における配列にアニールできるその3’末端における配列を含み、任意選択で鋳型RNA分子の3’末端における配列が、ステップb)における部位特異的ヌクレアーゼのcrRNAの配列に部分的に又は全体的に相補的である、実施形態4又は5に記載の方法。
実施形態7.ステップe)の鋳型RNA分子が、標的核酸断片の第2の鎖の3’末端における配列にアニールできるその3’末端における配列を含み、任意選択で鋳型RNA分子の3’末端における配列が、ステップd)における部位特異的ヌクレアーゼのcrRNAの配列に部分的に又は全体的に相補的である、実施形態4~6のいずれか1つに記載の方法。
実施形態8.鋳型RNA及びcrRNA、及び任意選択でtracrRNAが別々のRNA分子である、実施形態4~7のいずれか1つに記載の方法。
実施形態9.第1の鎖を伸長するヌクレオチドの配列が、標的核酸断片の第2の鎖を伸長するヌクレオチドの配列とは異なり、好ましくは第1及び第2の鎖を伸長する1つ又は複数のヌクレオチドが、90%、80%、60%より低い、又は40%より低いヌクレオチド配列同一性を有する、先行する実施形態のいずれか1つに記載の方法。
実施形態10.方法が、
f)第1のオリゴヌクレオチドを、標的核酸断片の第1の鎖の標識された3’末端にアニールするステップであり、任意選択で鋳型RNA及びcrRNAが、第1のオリゴヌクレオチドをアニールする前に分解される、ステップ
をさらに含む、先行する実施形態のいずれか1つに記載の方法。
実施形態11.第1の鎖の標識された3’末端にアニールするオリゴヌクレオチドが、通常のハイブリダイズ条件下で第2の鎖の、任意選択で標識された3’末端にアニールすることが可能でない、実施形態10に記載の方法。
実施形態12.ステップf)が、第2のオリゴヌクレオチドを、第2の鎖の標識された3’末端にアニールすることをさらに含み、好ましくは第2の鎖の標識された3’末端にアニールするオリゴヌクレオチドが、通常のハイブリダイズ条件下で第1の鎖の、任意選択で標識された3’末端にアニールすることが可能でない、実施形態10又は11のいずれか1つに記載の方法。
実施形態13.方法が、
g)(1つ又は複数の)アニールされたオリゴヌクレオチドをライゲート及び/又は充填するステップ
をさらに含む、実施形態10~12のいずれか1つに記載の方法。
実施形態14.第1及び第2のオリゴヌクレオチドのうちの少なくとも1つが、UMI、バーコード及びプライマー結合部位のうちの少なくとも1つを含む、実施形態10~13のいずれか1つに記載の方法。
実施形態15.1つ又は複数の標的核酸断片をシークエンシングする、好ましくはディープシークエンシングする方法であって、
(i)実施形態1~14のいずれか1つに定義される1つ又は複数の標識された標的核酸断片を得るステップ;
(ii)任意選択で1つ又は複数の標識された標的核酸断片を増幅する、好ましくは選択的に増幅するステップ;及び
(iii)任意選択で増幅された1つ又は複数の標的核酸断片の配列の少なくとも部分を決定するステップ
を含む、方法。
実施形態16.1つ又は複数の標的核酸断片が1つ又は複数の核酸試料から得られ、任意選択で1つ又は複数の標的核酸断片がステップ(i)の後及び/又はステップ(ii)の後にプールされる、実施形態15に記載の方法。
実施形態17.実施形態1~14のいずれか1つに記載の方法により得ることが可能である標識された標的核酸断片又は実施形態15若しくは16に記載の方法により得ることが可能であるディープシークエンシングライブラリー。
実施形態18.実施形態1~16のいずれか1つに記載の方法における使用のための、部位特異的ヌクレアーゼ並びに逆転写酵素及び鋳型RNA分子のうちの少なくとも1つをコードする構築物。
実施形態19.crRNA及び任意選択でtracrRNAをさらにコードする、実施形態18に記載の構築物。
実施形態20.実施形態1~16のいずれか1つに記載の方法における使用のための、少なくとも第1、第2及び第3の構成要素を含むパーツのキットであって、
第1の構成要素が、部位特異的ヌクレアーゼ、又はそれをコードする構築物、及び任意選択でcrRNA、tracrRNA及びsgRNAのうちの少なくとも1つ、又はそれをコードする構築物であり;
第2の構成要素が、逆転写酵素、又はそれをコードする構築物であり;
第3の構成要素が、鋳型RNA分子、又はそれをコードする構築物である、キット。
実施形態21.キットが、第4、第5、第6及び第7の構成要素のうちの少なくとも1つをさらに含み、
第4の構成要素が、実施形態10~14のいずれか1つに定義される1つ又は複数のオリゴヌクレオチドであり、1つ又は複数のオリゴヌクレオチドが、UMI、バーコード及びプライマー結合部位のうちの少なくとも1つを任意選択で含み;
第5の構成要素が、実施形態15に定義される標識された標的核酸断片の増幅のための1つ又は複数のプライマーであり;
第6の構成要素が、標識された標的核酸断片の非選択的な増幅のための1つ又は複数のプライマーであり;
第7の構成要素が、標的核酸断片のサブセットの選択的な増幅のための1つ又は複数のプライマーである、実施形態20に記載のパーツのキット。
本発明の一実施形態の概略図。ステップ1)標的化された位置、ステップ2)Cas9結合、ステップ3)Cas9 DNA切断、ステップ4)Cas9結合及びアダプターRNA(本明細書において鋳型RNAとしてさらに指し示される)アニーリング、ステップ5)アニールしたRNAの逆転写、並びにステップ6)RNA分解(及びそのためCas9及びRT放出)。DNAアダプターのアニーリングは、ステップ7A)DNAアダプターアニーリング並びにステップ7B)DNAアダプター充填及びライゲーションを含んでもよい。代替的に、DNAアダプターのアニーリングは、ステップ7)DNAアダプターアニーリング及びライゲーションを含んでもよい。 本発明の一実施形態の概略図。ステップ1)標的化された位置、ステップ2)Cas9結合、ステップ3)Cas9 DNA切断、ステップ4)Cas9結合及びアダプターRNA(本明細書において鋳型RNAとしてさらに指し示される)アニーリング、ステップ5)アニールしたRNAの逆転写、並びにステップ6)RNA分解(及びそのためCas9及びRT放出)。DNAアダプターのアニーリングは、ステップ7A)DNAアダプターアニーリング並びにステップ7B)DNAアダプター充填及びライゲーションを含んでもよい。代替的に、DNAアダプターのアニーリングは、ステップ7)DNAアダプターアニーリング及びライゲーションを含んでもよい。 本発明の一実施形態の概略図。ステップ1)標的化された位置、ステップ2)Cas9結合、ステップ3)Cas9 DNA切断、ステップ4)Cas9結合及びアダプターRNA(本明細書において鋳型RNAとしてさらに指し示される)アニーリング、ステップ5)アニールしたRNAの逆転写、並びにステップ6)RNA分解(及びそのためCas9及びRT放出)。DNAアダプターのアニーリングは、ステップ7A)DNAアダプターアニーリング並びにステップ7B)DNAアダプター充填及びライゲーションを含んでもよい。代替的に、DNAアダプターのアニーリングは、ステップ7)DNAアダプターアニーリング及びライゲーションを含んでもよい。 A)ラムダゲノムの5043~6074位の配列(配列番号8)、B)上:Cas9での制限、標識化及びオリゴヌクレオチドのアニーリング後に得られた断片、(配列番号:9~24)。下:増幅後に得られた断片の長さ、異なる断片のサイズ及びプライマー配列が指し示されている。 A)ラムダゲノムの5043~6074位の配列(配列番号8)、B)上:Cas9での制限、標識化及びオリゴヌクレオチドのアニーリング後に得られた断片、(配列番号:9~24)。下:増幅後に得られた断片の長さ、異なる断片のサイズ及びプライマー配列が指し示されている。 指し示される断片の増幅後の予想された(A)及び得られた(B)結果。 指し示される断片の増幅後の予想された(A)及び得られた(B)結果。
[定義]
本発明の方法、組成物、使用及び他の態様に関する様々な用語が本明細書及び特許請求の範囲の全体を通じて使用される。そのような用語は、他に指し示されなければ、本発明が関する技術分野におけるそれらの普通の意味を与えられるべきである。他の特に定義される用語は、本明細書において提供される定義と合致する方式において解釈されるべきである。本明細書に記載されるものと類似又は同等の任意の方法及び材料が本発明の試験のための実施において使用され得るが、好ましい材料及び方法が本明細書に記載される。
本発明の方法において使用される従来技術を実行する方法は当業者に明らかであろう。分子生物学、生化学、計算化学、細胞培養、組換えDNA、バイオインフォマティクス、遺伝学、シークエンシング及び関連分野における従来技術の実施は当業者に周知であり、例えば、以下の参考文献:Sambrookら、Molecular Cloning. A Laboratory Manual、2nd Edition、Cold Spring Harbor Laboratory Press、Cold Spring Harbor、N.Y.、1989;Ausubelら、Current Protocols in Molecular Biology、John Wiley&Sons、New York、1987及び定期的な更新;並びにシリーズMethods in Enzymology、Academic Press、San Diegoにおいて議論されている。
「a」、「an」、及び「the」:これらの単数形の用語は、内容がそうでないことを明確に規定しなければ、複数の指示対象を含む。そのため、例えば、「細胞」(a cell)への言及は、2つ又はより多くの細胞の組合せを含む、などである。
本明細書において使用される場合、「約」という用語は、小さい変動を記載及び説明するために使用される。例えば、該用語は、±10%未満又は±10%、例えば±5%未満若しくは±5%、±4%未満若しくは±4%、±3%未満若しくは±3%、±2%未満若しくは±2%、±1%未満若しくは±1%、±0.5%未満若しくは±0.5%、±0.1%未満若しくは±0.1%、又は±0.05%未満若しくは±0.05%を指すことができる。追加的に、量、比、及び他の数値は、範囲の形式において本明細書において提示される場合がある。そのような範囲の形式は、簡便性及び簡潔性のために使用されていることが理解されるべきであり、範囲の限度として明示的に指定される数値を柔軟に含むが、各々の数値及び部分的範囲が明示的に指定されているかのようにその範囲内に包含されるすべての個々の数値又は部分的範囲もまた含むことが理解されるべきである。例えば、約1~約200の範囲内の比は、約1及び約200の明示的に記載される限度を含むが、個々の比、例えば約2、約3、及び約4、並びに部分的範囲、例えば約10~約50、及び約20~約100なども含むことが理解されるべきである。
「及び/又は」:「及び/又は」という用語は、記載されるケースの1つ又は複数が、単独で、又は、記載されるケースのすべてを用いるまで、記載されるケースの少なくとも1つと組み合わせて、起こり得る状況を指す。
本明細書において使用される場合、「アダプター」という用語は、他の核酸の末端に、例えば、二本鎖DNA分子の単一の鎖又は両方の鎖に、取り付けられ得る、好ましくはライゲートされ得る、一本鎖、二本鎖、部分二本鎖、Y形状又はヘアピン核酸分子であって、好ましくは限られた長さ、例えば、約10~約200、又は約10~約100塩基、又は約10~約80、又は約10~約50、又は約10~約30塩基対の長さを有し、好ましくは化学的に合成されるものである。アダプターの二本鎖構造は、互いと塩基対合した2つの別個のオリゴヌクレオチド分子により、又は単一のオリゴヌクレオチド鎖のヘアピン構造により形成されてもよい。明らかなように、アダプターの取付け可能な末端は、制限酵素及び/若しくはプログラム可能なヌクレアーゼによる切断により作られるオーバーハングと適合性であるように、及び任意選択で該オーバーハングにライゲートできるように設計されてもよいか、非鋳型伸長反応(例えば本明細書において定義されている方法を使用する)の付加後に作り出されるオーバーハングと適合性であるように設計されてもよいか、又は平滑末端を有してもよい。任意選択で、全体的に又は部分的に二本鎖のアダプターはオーバーハングを含み、好ましくはオーバーハングは3’オーバーハングである。好ましくは、末端ヌクレオチドの前にホスホロチオエート結合がある。任意選択で、オーバーハングを含む鎖に対して反対の鎖は、5’リン酸化されている。
核酸又は核酸反応に関して使用される「増幅」は、特定の核酸、例えば標的核酸断片又は標的核酸断片中に含まれる目的の配列のコピーを作るin vitro方法を指す。核酸を増幅する多数の方法が当技術分野において公知であり、増幅反応は、ポリメラーゼ連鎖反応、リガーゼ鎖反応、鎖置換増幅反応、ローリングサークル増幅反応、転写媒介性増幅方法、例えばNASBA(例えば、米国特許第5,409,818号)、ループ媒介性増幅方法(例えば、米国特許第6,410,278号に記載されている、例えば、ループ形成配列を使用する「LAMP」増幅)及び等温増幅反応を含む。増幅される核酸は、修飾されたDNA及び/又はRNAを含む、DNA又はRNA又はDNA及びRNAの混合物を含むか、それからなるか、又はそれに由来するDNAであり得る。1つ若しくは複数の核酸分子の増幅の結果としてもたらされる生成物(すなわち、「増幅生成物」)は、出発核酸がDNA、RNA又は両方のいずれであれ、DNA若しくはRNA、若しくはDNA及びRNAヌクレオシド若しくはヌクレオチドの両方の混合物のいずれかであり得るか、又は該生成物は、修飾されたDNA若しくはRNAヌクレオシド若しくはヌクレオチドを含むことができる。
コピー」は、特定の配列に対して完全な配列相補性又は完全な配列同一性を有する配列であり得るが、これに限定されない。代替的に、コピーは、この特定の配列に対して完璧な配列相補性又は同一性を必ずしも有さず、例えばある特定の程度の配列バリエーションが許容される。例えば、コピーは、ヌクレオチドアナログ、例えばデオキシイノシン若しくはデオキシウリジン、意図的な配列変更(例えば特定の配列に対してハイブリダイズされ得るが相補的でない配列を含むプライマーを通じて導入される配列変更)、及び/又は増幅の間に起こる配列エラーを含むことができる。
相補性」という用語は、完全に相補的な鎖(例えば第2の、又は逆転した、鎖)に対する配列の配列同一性として本明細書において定義される。例えば、100%相補的な(又は完全に相補的な)配列は、相補鎖と100%の配列同一性を有するとして本明細書において理解され、例えば80%相補的な配列は、(完全に)相補的な鎖に対して80%の配列同一性を有するとして本明細書において理解される。
含む」:この用語は、包含的及びオープンエンドであり、排他的でないとして解釈される。特に、該用語及びそのバリエーションは、指定される特徴、ステップ又は構成要素が含まれることを意味する。これらの用語は、他の特徴、ステップ又は構成要素の存在を除外すると解釈されるべきではない。
構築物」又は「核酸構築物」又は「ベクター」:これは、組換えDNA技術の使用の結果としてもたらされる、人間により作られた核酸分子であって、多くの場合に構築物上に含まれるDNA領域の宿主細胞中での発現の目的と共に、外因性DNAを宿主細胞中に送達するために使用され得るものを指す。構築物のベクター骨格は、例えば、(キメラ)遺伝子が組み込まれるか、又は、好適な転写調節配列(例えば(誘導性)プロモーター)が既に存在する場合に、所望されるヌクレオチド配列(例えば、コーディング配列)のみが転写調節配列の下流に組み込まれるプラスミドであってもよい。ベクターは、分子クローニングにおけるそれらの使用を促すためのさらなる遺伝子エレメント、例えば、選択マーカー及びマルチプルクローニングサイトなどを含んでもよい。
二本鎖」及び「二重鎖」という用語は、本明細書において使用される場合、塩基対合した、すなわち、ハイブリダイズして一緒になった、2つの相補的なポリヌクレオチドを記載する。相補的なヌクレオチド鎖はまた、逆相補体として当技術分野において公知である。
有効量」という用語は、本明細書において使用される場合、所望される生物学的効果を誘発するために十分な生物活性剤の量を指す。例えば、一部の実施形態において、部位特異的ヌクレアーゼの有効量は、二本鎖核酸分子の切断を誘導するために十分なヌクレアーゼの量を指すことができる。当業者により理解されるように、剤の有効量は、様々な要因、例えば使用されている剤、剤が使用される条件、及び所望される生物学的効果、例えば検出されるべき切断の程度に依存して変動し得る。
例示的」:この用語は、「例、事例、又は実例として役立つ」ことを意味し、本明細書に開示される他の構成を除外するとして解釈されるべきではない。
発現」:これは、適切な調節領域、特にはプロモーターに作動可能に連結された、DNA領域がRNAに転写され、該RNAが次いでタンパク質又はペプチドに翻訳され得るプロセスを指す。
ガイド配列」は、RNA又はDNAにガイドされるエンドヌクレアーゼをRNA又はDNA分子中の特定の部位に方向付ける配列として本明細書において理解されるべきである。gRNA-CAS複合体の文脈において、「ガイド配列」は、二重鎖DNA中の特定の部位にgRNA-CAS複合体を標的化するために要求されるsgRNA又はcrRNAの区画として本明細書においてさらに理解されるべきである。
gRNA-CAS複合体」は、ガイドRNAに複合体化又はハイブリダイズされた、CRISPR-エンドヌクレアーゼ又はCRISPR-ヌクレアーゼとも命名される、CASタンパク質として本明細書において理解されるべきであり、ガイドRNAは、crRNA及び/若しくはtracrRNA、又はsgRNAであってもよい。
同一性」及び「類似性」は、公知の方法により容易に算出され得る。「配列同一性」及び「配列類似性」は、2つの配列の長さに依存して、大域又は局所アライメントアルゴリズムを使用する2つのペプチド又は2つのヌクレオチド配列のアライメントにより決定され得る。類似した長さの配列は、好ましくは、最適には全長にかけて配列をアライメントする大域アライメントアルゴリズム(例えばNeedleman Wunsch)を使用してアライメントされ、実質的に異なる長さの配列は、好ましくは、局所アライメントアルゴリズム(例えばSmith Waterman)を使用してアライメントされる。配列は次に、それらが(例えばプログラムGAP又はBESTFITによりデフォルトのパラメーターを使用して最適にアライメントされた場合に)少なくともある特定の最小パーセンテージの配列同一性(以下において定義される)を共有する場合に、「実質的に同一の」又は「本質的に類似の」として言及され得る。配列同一性のパーセントは、好ましくは、シークエンス・アナリシス・ソフトウェア・パッケージ(Sequence Analysis Software Package)(商標)(Version 10;Genetics Computer Group、Madison、Wis.)の「BESTFIT」又は「GAP」プログラムを使用して決定される。GAPは、Needleman及びWunschの大域アライメントアルゴリズム(Needleman及びWunsch、Journal of Molecular Biology 48:443~453頁、1970)を使用して、それらの全体の長さ(全長)にかけて2つの配列をアライメントして、マッチの数を最大化し、及びギャップの数を最小化する。大域アライメントは、好適には、2つの配列が類似した長さを有する場合に配列同一性を決定するために使用される。一般に、GAPのデフォルトのパラメーターが使用され、これはギャップ生成ペナルティ=50(ヌクレオチド)/8(タンパク質)及びギャップ伸長ペナルティ=3(ヌクレオチド)/2(タンパク質)を用いる。ヌクレオチドのために使用されるデフォルトのスコアリングマトリックスはnwsgapdnaであり、タンパク質のために使用されるデフォルトのスコアリングマトリックスはBlosum62である(Henikoff及びHenikoff、1992、PNAS 89、915~919頁)。配列アライメント及び配列同一性パーセンテージのスコアは、コンピュータプログラム、例えばAccelrys Inc.、9685 Scranton Road、San Diego、CA 92121-3752 USAから入手可能なGCG Wisconsin Package、Version 10.3を使用して、又はオープンソースソフトウェア、例えばEmbossWIN version 2.10.0におけるプログラム「needle」(大域的なNeedleman Wunschアルゴリズムを使用する)若しくは「water」(局所的なSmith Watermanアルゴリズムを使用する)を使用して、上記のGAPについてと同じパラメーターを使用して、又はデフォルトの設定(「needle」及び「water」の両方について、並びにタンパク質及びDNAの両方のアライメントについて、デフォルトのギャップオープニングペナルティは10.0、デフォルトのギャップ伸長ペナルティは0.5であり;デフォルトのスコアリングマトリックスはタンパク質についてはBlosum62、DNAについてはDNAFullである)を使用して決定されてもよい。「BESTFIT」は、Smith及びWatermanの局所相同性アルゴリズム(Smith及びWaterman、Advances in Applied Mathematics、2:482~489頁、1981、Smithら、Nucleic Acids Research 11:2205~2220頁、1983)を使用して2つの配列の間の類似性の最良のセグメントの最適なアライメントを行い、ギャップを挿入してマッチの数を最大化する。配列が実質的に異なる全体的長さを有する場合、局所アライメント、例えばSmith Watermanアルゴリズムを使用するものが好ましい。
本明細書において使用される場合、「配列同一性」は、2つの最適にアライメントされたポリヌクレオチド又はペプチド配列が、構成要素、例えば、ヌクレオチド又はアミノ酸のアライメントのウィンドウの全体を通じて不変である程度を指す。試験配列及び参照配列のアライメントされたセグメントについての「同一性比率」は、2つのアライメントされた配列により共有される同一の構成要素の数を、参照配列セグメント中の構成要素の総数、すなわち、参照配列全体又は参照配列のより小さい定義された部分で割ったものである。「同一性パーセント」は同一性比率に100を掛けたものである。
配列同一性を決定する有用な方法はまた、Guide to Huge Computers、Martin J.Bishop編、Academic Press、San Diego、1994、並びにCarillo,H.及びLipton,D.、Applied Math(1988)48:1073において開示されている。より詳細には、配列同一性を決定するための好ましいコンピュータプログラムは、National Center Biotechnology Information(NCBI)、the National Library of Medicine、National Institute of Health、Bethesda、Md.20894から公開されているBasic Local Alignment Search Tool(BLAST)プログラムを含む;BLAST Manual、Altschulら、NCBI、NLM、NIH;Altschulら、J.Mol.Biol.215:403~410頁(1990)を参照;バージョン2.0又はより高いバージョンのBLASTプログラムは、アライメント中へのギャップ(欠失及び挿入)の導入を許容し;ペプチド配列については、BLASTXが配列同一性を決定するために使用可能であり;ポリヌクレオチド配列については、BLASTNが配列同一性を決定するために使用可能である。
代替的に、類似性又は同一性パーセンテージは、アルゴリズム、例えばFASTA、BLASTなどを使用して、公的なデータベースに対して検索を行うことにより決定されてもよい。そのため、本発明の核酸及びタンパク質配列は、公的なデータベースに対して検索を行って、例えば、他のファミリーメンバー又は関連配列を同定するための、「クエリ配列」としてさらに使用され得る。そのような検索は、Altschulら、(1990) J.Mol.Biol.215:403~10頁のBLASTn及びBLASTxプログラム(バージョン2.0)を使用して行われ得る。BLASTヌクレオチド検索は、本発明の核酸分子に相同的なヌクレオチド配列を得るために、BLASTnプログラム、期待閾値=0.05、ワードサイズ=28を用いて行われ得る。BLASTタンパク質検索は、本発明のタンパク質分子に相同的なアミノ酸配列を得るために、BLASTxプログラム、期待閾値=0.05、ワードサイズ=6を用いて行われ得る。比較目的のためにギャップ付きアライメントを得るために、Altschulら、(1997) Nucleic Acids Res.25(17):3389~3402頁に記載されるようにGapped BLASTが利用され得る。BLAST及びGapped BLASTプログラムを利用する場合、それぞれのプログラム(例えば、BLASTx及びBLASTn)のデフォルトのパラメーターが使用され得る。http://www.ncbi.nlm.nih.gov/におけるthe National Center for Biotechnology Informationのホームページを参照。
ナノポア選択的シークエンシング」は、ナノポアシークエンシング技術、例えばOxford Nanopore又はOnteraからのものを使用し、及び流れるナノポア電流シグナル又は塩基コールを参照配列に対してマッピングして非標的配列を拒絶する、リアルタイムでの単一の分子の選択的なシークエンシングとして本明細書において理解されるべきである。生成されているデータに応答して、シークエンサーは、核酸のシークエンシングを遂行するように操作されるか、又は中止して、非標的分子を排出するために十分なある特定の短い時間的期間にわたり特有のポアにわたる電圧の極性を逆転させることによりシークエンシングポアから核酸を除去し、ナノポアを新たなシークエンシングリードのために利用可能とすることを決定する。Nanopore選択的シークエンシング方法の例は、Payneら、2020(Nanopore adaptive sequencing for mixed samples, whole exome capture and targeted panels、February 3、2020;DOI:10.1101/2020.02.03.926956)及びKovakaら、2020(Targeted nanopore sequencing by real-time mapping of raw electrical signal with UNCALLED、February 3、2020;doi:10.1101/2020.02.03.931923)(これらは参照により本明細書に組み込まれる)において記載されている。
ヌクレオチド」という用語は、グアニン、シトシン、アデニン及びチミン(それぞれG、C、A及びT)を含む、天然に存在するヌクレオチドを含むが、これらに限定されない。「ヌクレオチド」という用語は、公知のプリン及びピリミジン塩基だけでなく、修飾されている他の複素環式塩基も含有する部分を含むことがさらに意図される。そのような修飾は、メチル化されたプリン又はピリミジン、アシル化されたプリン又はピリミジン、アルキル化されたリボース又は他の複素環を含む。追加的に、「ヌクレオチド」という用語は、ハプテン又は蛍光標識を含有する部分を含み、従来のリボース及びデオキシリボース糖だけでなく、他の糖も含有することができる。修飾ヌクレオシド又はヌクレオチドはまた、糖部分上の修飾を含み、例えば、ヒドロキシル基の1つ若しくは複数はハロゲン原子若しくは脂肪族基で置き換えられているか、又はエーテル若しくはアミンなどとして官能化されている。
核酸」、「ポリヌクレオチド」及び「核酸分子」という用語は、本明細書において交換可能に使用され、ヌクレオチド、例えば、デオキシリボヌクレオチド又はリボヌクレオチドから構成される任意の長さ、例えば、約2塩基より長い、約10塩基より長い、約100塩基より長い、約500塩基より長い、1000塩基より長い、最大約10,000又はより多くの塩基のポリマーを記載し、酵素的に又は合成的に生成されてもよい(例えば、米国特許第5,948,902号及び該文献において参照される参考文献に記載されているPNA)。核酸は、2つの天然に存在する核酸の方式に類似した配列特異的な方式において天然に存在する核酸とハイブリダイズしてもよく、例えば、ワトソン-クリック塩基対合相互作用に参加することができる。追加的に、核酸及びポリヌクレオチドは、細胞、組織及び/又は体液から単離(及び任意選択でその後に断片化)されてもよい。核酸は、例えば、ゲノムDNA(gDNA)、ミトコンドリア、セルフリーDNA(cfDNA)、ライブラリーからのDNA及び/又はライブラリーからのRNAであり得る。
核酸試料」又は「二本鎖核酸分子を含む試料」という用語は、本明細書において使用される場合、核酸分子を含有する任意の試料を表し、試料は、1つ又は複数の目的のヌクレオチド配列を含有する、必ずしもそうではないが、典型的には液体形態の、材料又は材料の混合物に関する。本発明の方法において出発材料として使用される核酸試料は、任意の供給源からのもの、例えば、全ゲノム、染色体のコレクション、単一の染色体、1つ若しくは複数の染色体からの1つ若しくは複数の領域又は転写された遺伝子であり得、直接的に生物学的な供給源から又は実験室供給源、例えば、核酸ライブラリーから精製されてもよい。核酸試料は、ヒト若しくは他の種(例えば、植物、細菌、真菌、藻類、古細菌など)であり得る同じ個体から、又は同じ種の異なる個体、若しくは異なる種の異なる個体から得られ得る。例えば、核酸試料は、細胞、組織、生検、体液、ゲノムDNAライブラリー、cDNAライブラリー及び/又はRNAライブラリーからのものであってもよい。
目的の配列」という用語は、好ましくは細胞内に存在する任意の遺伝子配列、例えば遺伝子、遺伝子の部分、又は遺伝子内の若しくはそれに隣接する非コーディング配列などを含むが、これらに限定されない。目的の標的配列は、染色体、エピソーム、オルガネラゲノム、例えばミトコンドリア若しくは葉緑体ゲノム又は遺伝材料の主体部とは独立的に存在することができる遺伝材料、例えば感染性ウイルスゲノム、プラスミド、エピソーム、トランスポゾンなどに存在してもよい。目的の配列は、遺伝子のコーディング配列内、転写される非コーディング配列内、例えば、リーダー配列、トレイラー配列又はイントロン内などにあってもよい。目的の前記配列は、二本又は一本鎖核酸分子中に存在してもよい。核酸配列は好ましくは二本鎖核酸分子中に存在する。目的の配列は、多型、例えばSNPを有するか、又は有することが疑われる配列であり得るが、これに限定されない。一部の実施形態において、目的の配列は、アレルバリアント、又はその逆相補体である。目的の配列は、試料核酸内の任意の配列、例えば、遺伝子、遺伝子複合体、座位、偽遺伝子、調節領域、高度反復領域、多型領域、又はこれらの部分であってもよい。目的の配列はまた、表現型又は疾患を指し示す遺伝子又はエピジェネティックバリエーションを含む領域であってもよい。好ましくは、目的の配列は、二重鎖DNAの一本鎖DNA鎖のヌクレオチドの小さい又はより長い連続するストレッチ(すなわちポリヌクレオチド)であり、前記二重鎖DNAは、前記二重鎖DNAの相補鎖中の標的配列に相補的な配列をさらに含む。目的の配列及びその相補鎖からなる二重鎖DNAもまた、本明細書において標的核酸断片と命名される。
標的核酸断片」は、好ましくはさらなる分析又は行為、以下に限定されないが例えばコピー生成、増幅、シークエンシング及び/又は核酸監視のための他の手順の目的のための、目的の配列を含むか又はからなる、好ましくは二本鎖の、核酸分子の小さい若しくはより長いストレッチ、又は選択された部分であってもよい。切断前に、標的核酸断片は、好ましくは、より大きい核酸分子内、例えば分析されるべき試料中に存在するより大きい核酸分子内に含まれる。標的核酸断片は好ましくは第1の鎖及び相補的な第2の鎖を含む。一部の態様において、1つ又は複数の目的の配列を含むか又はからなる標的核酸断片のセットは、富化されるために選択される。任意選択で、そのようなセットは、構造的に又は機能的に関連する標的核酸断片からなる。標的核酸断片、又は断片は、DNA、RNA、BNA(ブリッジド核酸)、LNA(ロックド核酸)、PNA(ペプチド核酸)、モルホリノ核酸、グリコール核酸、トレオース核酸、エピジェネティックに修飾されたヌクレオチド、例えばメチル化DNA、並びにこれらの模倣物及び組合せを含むが、これらに限定されない、天然及び非天然の両方の、人工的な、又は非標準的なヌクレオチドを含むことができる。好ましくは、標的核酸断片はゲノムDNA(gDNA)及び/又はセルフリーDNA(cfDNA)である。
オリゴヌクレオチド」という用語は、本明細書において使用される場合、好ましくは約2~200ヌクレオチド、又は最大500ヌクレオチドの長さの、ヌクレオチドの一本鎖多量体を表す。オリゴヌクレオチドは合成であってもよいか、又は酵素的に作られてもよく、一部の実施形態において、約10~50ヌクレオチドの長さである。オリゴヌクレオチドは、リボヌクレオチド単量体(すなわち、オリゴリボヌクレオチドであってもよい)又はデオキシリボヌクレオチド単量体を含有してもよい。オリゴヌクレオチドは、例えば、約10~20、20~30、30~40、40~50、50~60、60~70、70~80、80~100、100~150、150~200、又は約200~250ヌクレオチドの長さであってもよい。
植物」:これは、植物細胞、植物プロトプラスト、植物がそれから再生され得る植物細胞組織培養物、植物カルス、植物クランプ、並びに植物又は植物の部分、例えば胚、花粉、胚珠、種子、葉、花、枝、果実、仁、穂、穂軸、皮、柄、根、根端、葯、及び粒などにあるインタクトな植物細胞を含む。植物の非限定的な例は、作物及び栽培植物、例えばオオムギ、キャベツ、キャノーラ、キャッサバ、カリフラワー、チコリ、ワタ、キュウリ、ナス、ブドウ、トウガラシ、レタス、メイズ、メロン、アブラナ、ジャガイモ、カボチャ、コメ、ライ、ソルガム、カボチャ属植物(squash)、サトウキビ、テンサイ、ヒマワリ、アマトウガラシ、トマト、スイカ、コムギ、及びズッキーニを含む。
プロトスペーサー配列」は、ガイドRNA内のガイド配列、より詳細にはcrRNA、又は、sgRNAの場合、ガイドRNAのcrRNA部分により認識されるか、又はそれにハイブリダイズし得る、標的核酸断片の中、その位置、又はその近くに位置する配列である。
エンドヌクレアーゼ」は、その標的又は認識部位への結合で、二重鎖DNAの少なくとも1つの鎖又はRNA分子の鎖を加水分解する酵素である。エンドヌクレアーゼは、部位特異的エンドヌクレアーゼとして本明細書において理解されるべきであり、「エンドヌクレアーゼ」及び「ヌクレアーゼ」という用語は本明細書において交換可能に使用される。制限エンドヌクレアーゼは、二重鎖の両方の鎖を同時に加水分解してDNA中に二本鎖切断を導入するエンドヌクレアーゼとして本明細書において理解されるべきである。「ニック形成」エンドヌクレアーゼは、二重鎖の1つの鎖のみを加水分解して、切断ではなく「ニック形成」(nicked)されたDNA分子を生成するエンドヌクレアーゼである。
エキソヌクレアーゼ」は、ポリヌクレオチドの末端(エキソ)から1つ又は複数のヌクレオチドを切断する任意の酵素として本明細書において定義される。
複雑性を低減させる」又は「複雑性低減」は、複雑な核酸試料、例えばゲノムDNAに由来する試料、液体生検に由来するcfDNA、及び単離されたRNA試料などの低減として本明細書において理解されるべきである。複雑性の低減は、複雑な出発材料内に含まれる1つ若しくは複数の特定の標的配列及び/若しくは標的核酸断片の富化、並びに/又は、非標的配列又は断片の量が、出発材料、すなわち複雑性低減の前の材料中の非標的配列又は断片の量と比較して少なくとも20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%又は99%低減されながらの、複雑な出発材料内に含まれる1つ若しくは複数の特定の標的配列若しくは断片を含むか若しくはからなる試料のサブセットの生成を結果としてもたらす。複雑性の低減は、さらなる分析又は方法ステップ、例えば増幅、バーコード付加、シークエンシング、エピジェネティックなバリエーションの決定などの前に一般に行われる。好ましくは、複雑性低減は、再現性のある複雑性低減であり、これは、同じ試料が同じ方法を使用して複雑性において低減される場合に、ランダムな複雑性低減とは対照的に、同じ、又は少なくとも同等の、サブセットが得られることを意味する。複雑性低減方法の例は、例えばAFLP(登録商標)(Keygene N.V.、the Netherlands;例えば、EP 0 534 858を参照)、任意プライムPCR増幅、捕捉プローブハイブリダイゼーション、Dong(例えば、国際公開第03/012118号、国際公開第00/24939号を参照)により記載された方法及びインデックス化連結(Unrau P.及びDeugau K.V.(1994) Gene 145:163~169頁)、国際公開第2006/137733号;国際公開第2007/037678号;国際公開第2007/073165号;国際公開第2007/073171号、米国特許出願公開第2005/260628号、国際公開第03/010328号、米国特許出願公開第2004/10153号に記載されている方法、ゲノムポーショニング(genome portioning)(例えば国際公開第2004/022758号を参照)、遺伝子発現連続分析(SAGE;例えばVelculescuら、1995を参照、上記、及びMatsumuraら、1999、The Plant Journal、vol.20(6):719~726頁を参照)並びにSAGEの改変(例えばPowell、1998、Nucleic Acids Research、vol.26(14):3445~3446頁;並びにKenzelmann及びMuhlemann、1999、Nucleic Acids Research、vol.27(3):917~918頁を参照)、MicroSAGE(例えばDatsonら、1999、Nucleic Acids Research、vol.27(5):1300~1307頁を参照)、超並列シグネチャーシークエンシング(Massively Parallel Signature Seguencing)(MPSS;例えばBrennerら、2000、Nature Biotechnology、vol.18:630~634頁及びBrennerら、2000、PNAS、vol.97(4):1665~1670頁を参照)、セルフサブトラクテッドcDNAライブラリー(self-subtracted cDNA libraries)(Lavederら、2002、Nucleic Acids Research、vol.30(9):e38)、リアルタイムマルチプレックスライゲーション依存性プローブ増幅(RT-MLPA;例えばElderingら、2003、vol.31(23):el53を参照)、高カバレッジ発現プロファイリング(HiCEP;例えばFukumuraら、2003、Nucleic Acids Research、vol.31(16):e94を参照)、Rothら(Rothら、2004、Nature Biotechnology、vol.22(4):418~426頁)において開示されているユニバーサルマイクロアレイシステム、トランスクリプトームサブトラクション方法(例えばLiら、Nucleic Acids Research、vol.33(16):el36を参照)、並びに断片ディスプレイ(例えばMetsisら、2004、Nucleic Acids Research、vol.32(16):el27を参照)を含む。
配列」又は「ヌクレオチド配列」:これは、核酸の、又は核酸内の、ヌクレオチドの順序を指す。換言すれば、核酸中のヌクレオチドの任意の順序は、配列又は核酸配列として参照され得る。例えば、標的配列は、DNA二重鎖の単一の鎖中に含まれるヌクレオチドの順序である。
シークエンシング」という用語は、本明細書において使用される場合、ポリヌクレオチドの少なくとも10個の連続するヌクレオチドの素性(identity)(例えば、少なくとも20、少なくとも50、少なくとも100又は少なくとも200又はより多くの連続するヌクレオチドの素性)が得られる方法を指す。「次世代シークエンシング」、「ディープシークエンシング」又は「ハイスループットシークエンシング」という用語は、本明細書において交換可能に使用されることがあり、いわゆる並列化シークエンシングバイシンセシス(parallelized sequencing-by-synthesis)又はシークエンシングバイライゲーション(sequencing-by-ligation)プラットフォーム、例えば、Illumina、Life Technologies、PacBio及びRocheなどにより現行で用いられているものを指す。次世代シークエンシング方法はまた、ナノポアシークエンシング方法、例えばOxford Nanopore Technologiesにより商業化されているもの、又は電子検出ベースの方法、例えばLife Technologiesにより商業化されているIon Torrent技術を含むことができる。好ましくは、次世代シークエンシング方法は、ナノポアシークエンシング方法、好ましくはナノポア選択的シークエンシング方法である。
固有分子識別物」又は「UMI」は、核酸分子に特異的な、例えば各々の単一のポリヌクレオチドのために独特の、実質的に独特の、好ましくは完全に独特の、タグ(例えばバーコード)である。「UMI」という用語は、ポリヌクレオチドの配列情報及び物理的ポリヌクレオチドそれ自体の両方を指すために本明細書において使用される。UMIは、約2~100個のヌクレオチド塩基又はより多くの長さの範囲内であり得、好ましくは約4~16ヌクレオチド塩基の長さを有する。UMIは、連続する配列であり得るか、又はいくつかのサブユニットに分割されていてもよい。これらのサブユニットの各々は、別々のオリゴヌクレオチド及び/又はアダプター中に存在してもよい。これらのサブユニットは、単一のポリヌクレオチドのために実質的に独特のタグ、好ましくは完全に独特のタグを生成するために好ましくは一緒に使用される。例えば、ポリヌクレオチドが2つのオリゴヌクレオチドにより隣接される断片である場合、これらの2つのオリゴヌクレオチドの各々はUMIのサブユニットを含んでもよい。ポリヌクレオチドが2つのオリゴヌクレオチドのライゲーション生成物である場合、これらの2つのオリゴヌクレオチドの各々はUMIのサブユニットを含んでもよい。コンセンサス配列を得るために、本発明の方法において得られた配列リードは、2つのUMIサブユニットの各々の情報に基づいてグループ化されてもよい。好ましくはUMIは2つ又はより多くの連続する同一の塩基を含有しない。さらには、少なくとも2つ、好ましくは少なくとも3つの塩基のUMIの間に好ましくは差異が存在する。UMIは、ランダムな、疑似ランダムな若しくは部分的にランダムな、又は非ランダムなヌクレオチド配列を有してもよい。UMIは、リードの由来となる起源分子を独特に同定するために使用され得るので、増幅されたポリヌクレオチドのリードは、各々の起源ポリヌクレオチドからの単一のコンセンサス配列にコラプス(collapsed)され得る。UMIは、完全に又は実質的に独特であってもよい。完全に独特は、本発明の方法において提供されるあらゆるポリヌクレオチドが、本発明の方法におけるさらなるポリヌクレオチド中に含まれるすべての他のタグとは異なる独特のタグを含むこととして本明細書において理解されるべきである。実質的に独特は、本発明の方法、生成物、組成物又はキットにおいて提供される各々のポリヌクレオチドがランダムなUMIを含むが、これらのポリヌクレオチドの低いパーセンテージが同じUMIを含んでもよいこととして本明細書において理解されるべきである。好ましくは、同じUMIを用いて目的の配列を含む正確な同じ分子にタグ付加する可能性がごくわずかである場合に、実質的に固有の分子識別物が使用される。好ましくは、UMIは、特定の目的の配列に関して完全に独特である。UMIは、好ましくは、この独特性を確実にするために十分な長さを有する。一部の実施態様において、各々のDNA分子がシークエンシングプロセスの間に独特に同定されることを確実にするために、より低い独特性の分子識別物(すなわち、上に指示されるように、実質的に独特の識別物)は他の同定技術と組み合わせて使用され得る。例えば、本発明のUMIは、異なる目的の配列が同じ又は類似したUMIに連結され得るようにより低い独特性であってもよい。後者の場合、UMIの配列情報の組合せは、目的の配列の配列情報と共に、起源となるポリヌクレオチドの同定を可能とする。UMIは、好ましくは、単一のクラスターからのすべてのリードが単一の分子に由来していると同定されることを決定するために使用される。
UMIは、特定の核酸分子を同定するために役立つ特定の種類のバーコードとして考えられ得る。例えば標的断片及び/又は試料の種類を同定するためにさらなるバーコードが役立ち得る。UMIのように、バーコードは、UMIについて本明細書において指し示されるものと類似した構造的特徴を有するヌクレオチドの定義された数及び配列のストレッチとして考えられ得る。バーコードが試料バーコードである場合、試料の各々のバーコード付加された核酸分子又は標的断片は同じバーコードを含んでもよい。バーコードが標的断片バーコードである場合、任意選択で、数多くの異なる試料中に存在し得る各々の特定の種類の標的断片は、同じ標的断片バーコードを用いてバーコード付加され得ると共に、各々の試料内で、異なる標的断片は、異なる標的断片バーコードを用いてバーコード付加され得る。そのような標的断片バーコードは、例えば本明細書に記載されるような方法により試料を処理した後にシークエンシングした後の配列データの容易なクラスタリングを可能とする。特定の標的断片の配列をそれらの起源となる試料に割り当てる脱マルチプレックスを可能とするために、バーコード付加される標的断片は、好ましくは、試料バーコード及び標的断片バーコードの両方を用いてバーコード付加される。
[詳細な説明]
本発明者らは、標的核酸断片が目的の配列を含んでもよい、標的核酸断片の標識化のための多用途の方法を発見した。より詳細には、本発明の方法において、標的核酸分子は、1つ又は両方の側において特定のヌクレオチド配列を用いて標識される。この新たに付加されたヌクレオチド配列はその後に、さらなる下流のプロセスにおいて、例えば特異的に付加された配列にプライマーをアニールするために、又は追加の配列、例えばディープシークエンシングのためのアダプター配列を標的核酸断片に連結させるために使用され得る。標的核酸断片のみへのアダプター配列の連結は、標的核酸断片の選択的なシークエンシングを結果としてもたらす。同様に、標識された核酸断片への保護的なアダプターのアニーリング及びその後のエキソヌクレアーゼ保護は、試料中の標的核酸断片の富化を結果としてもたらす。本明細書において以下に詳述されている方法はしたがってまた、
i)標的核酸断片の富化方法;
ii)標的核酸断片を伸長する方法;
iii)ライブラリー調製方法;
iv)シークエンシング、好ましくは2方向性シークエンシング及び/又はコンビナトリアルバーコードシークエンシングの方法;並びに
v)標的核酸断片を増幅する、好ましくは選択的に増幅する方法
のうちの少なくとも1つであり得る。
第1の態様において、本発明は、標的核酸断片を標識する方法であって、標的核酸断片が第1の鎖及び相補的な第2の鎖を含む、方法に関する。好ましくは、標的核酸断片は目的の配列を含む。方法は、好ましくは、
a)二本鎖核酸分子を含む試料を提供するステップであり、二本鎖核酸分子が目的の配列を含む、ステップ;
b)二本鎖核酸分子を部位特異的ヌクレアーゼと接触させて二本鎖切断を生成するステップであり、二本鎖切断が標的核酸断片の第1の鎖の遊離3’末端を結果としてもたらす、ステップ;並びに
c)切断された二本鎖核酸分子をDNAポリメラーゼ及び鋳型分子、好ましくは逆転写酵素及び鋳型RNA分子と接触させ、それにより1つ又は複数のヌクレオチドで標的核酸断片の第1の鎖の遊離3’末端を標識するステップ
を含む。
任意選択で、ステップb)における部位特異的ヌクレアーゼ及びステップc)における逆転写酵素は別々の実体である。例示的な実施形態は図1に図式的に描写されている。
本発明の方法はin vitro方法であり得る。
任意選択で、本発明の方法は、複数の標的核酸断片の並列の又はその後の標識化を結果としてもたらす。好ましくは、本発明の方法は、1つ又は複数の核酸試料からの複数の標的核酸断片の標識化を含む。そのような方法は、下流の処理、例えばシークエンシングのために核酸ライブラリーを調製する方法と考えられ得る。
本発明の文脈における「標識化」という用語は、標的核酸断片への1つ又は複数のヌクレオチドの付加として理解されるべきである。これらの新たに付加されるヌクレオチドは、好ましくは、予め決定された配列において付加される。この配列は、好ましくは、本明細書において定義されている鋳型RNA分子の配列の部分に相補的である。標識の配列は、好ましくは、鋳型RNA分子の5’末端に位置する配列に相補的である。好ましくは、本発明の方法は、標的核酸断片の少なくとも1つの末端に少なくとも1つのヌクレオチドを付加することができる。好ましくは、本発明の方法は、標的核酸断片の少なくとも1つ又は両方の末端に少なくとも約1、2、5、10、15、20、25、30個又はより多くのヌクレオチドを付加することができる。任意選択で、本発明の方法は、標的核酸断片の少なくとも1つ又は両方の末端に約10~150、11~100、12~90、13~80、14~70、15~60、16~50、17~25、18~150、19~100、20~90、21~80、22~70、23~60又は約24~50個のヌクレオチドを付加することができる。
試料の提供 - ステップa)
本発明の方法のステップa)において試料が提供され、試料は二本鎖核酸分子を含む。二本鎖DNA分子は好ましくは標的核酸断片を含み、標的核酸断片は好ましくは目的の配列を含む。好ましくは、二本鎖核酸分子はそのため目的の配列を含む。
本発明の方法の核酸試料は、任意の供給源、例えばヒト、動物、植物、微生物、細菌、ウイルスからのものであってもよく、任意の種類のもの、例えば細胞に対して内因性又は外因性のもの、例えばゲノムDNA、染色体DNA、人工染色体、プラスミドDNA、又はエピソームDNA、cDNA、RNA、ミトコンドリアのもの、又は人工ライブラリーのもの、例えばBAC若しくはYACなどであってもよい。DNAは核又はオルガネラDNAであってもよい。好ましくは、DNAは染色体DNA、好ましくは細胞に対して内因性の染色体DNAである。
ステップa)の二本鎖核酸は、好ましくは生物学的供給源から、単離及び/又は精製されてもよい。任意選択で、ステップa)の二本鎖核酸は合成によるものである。任意選択で、ステップa)の二本鎖核酸は合成DNA、任意選択でRNAから逆転写された一本鎖又は二本鎖DNAである。
ステップa)の二本鎖核酸分子は、ウイルス又は生きた生物、例えば生きたヒト、動物又は植物を起源としてもよい。任意選択で、前記二本鎖核酸は、ウイルス又は生きた生物から単離及び/又は精製される。ウイルス又は生きた生物からの、任意選択で単離及び/又は精製された、核酸は、その後に増幅及び/又は逆転写されて合成DNAを結果としてもたらしてもよい。ステップa)の試料は、単一細胞、単一細胞のコレクション、組織(の部分)、臓器及び/又は流体(の部分)を起源としてもよい。細胞から単離された二本鎖核酸は、細胞を溶解するステップを含む方法により得られてもよい。ステップa)の二本鎖核酸分子は、したがって、溶解された細胞の二本鎖核酸分子であってもよい。ステップa)の二本鎖核酸分子は細胞外二本鎖核酸であってもよい。
好ましくは、試料がヒト又は動物起源の場合、前記試料は、非侵襲的な又は最小の侵襲性の方法により得られる。
核酸試料は少なくとも1つの標的核酸断片を含むことが本明細書において理解される。換言すれば、核酸試料はそのため、1、2、3、4、5、6、7、8、9、10個又はより多くの標的核酸断片、例えば少なくとも約50、100、150、200、250、300、350、400、450、500、750、1000個又はより多くの標的核酸断片を含んでもよく、好ましくは試料内の各々の標的核酸断片は別個の目的の配列を有する。
試料内の単一の二本鎖核酸分子は少なくとも1つの標的核酸断片を含み、少なくとも1つの標的核酸断片は目的の配列を含むことが本明細書においてさらに理解される。換言すれば、単一の二本鎖核酸分子は、1、2、3、4、5、6、7、8、9、10個又はより多くの標的核酸断片、例えば少なくとも約50、100、150、200、250、300、350、400、450、500、750、1000個又はより多くの標的核酸断片を含んでもよく、好ましくは二本鎖核酸分子内の各々の標的核酸断片は別個の目的の配列を有する。
二本鎖DNA分子の切断 - ステップb)及びステップd)
本発明の方法のステップb)において、二本鎖核酸分子は、二本鎖切断を生成するために部位特異的ヌクレアーゼと接触させる。そのため二本鎖切断は特異的な位置において生成される。好ましくは二本鎖切断は、目的の配列の近傍にある位置において生成される。好ましくは、生成される二本鎖切断は、目的の配列のすぐ隣に位置する。二本鎖切断は、目的の配列の上流又は下流において生成されてもよく、標的核酸断片の遊離3’又は5’末端を結果としてもたらすことができる。二本鎖切断は、標的核酸断片の第1の鎖の遊離3’末端を生成する。標的核酸断片の第1の鎖のこの遊離3’末端は、標的核酸断片の上又は下の鎖の遊離3’末端であり得ることが本明細書において理解される。部位特異的ヌクレアーゼは、少なくとも本明細書においてさらに定義されているその後の標識化ステップの全体を通じて目的の配列を含む切断された核酸分子の部分に結合したままであるように設計されてもよい。好ましくは、部位特異的ヌクレアーゼは、少なくともステップc)の全体を通じて標的核酸断片に結合したままであるように設計される。好ましくは、部位特異的ヌクレアーゼは、標識されるべき部位に位置したままであるように設計される。
ステップb)と同時に又はステップb)の後に、二本鎖核酸分子は、第2の二本鎖切断を生成するために第2の部位特異的ヌクレアーゼと接触させ得る。本発明の方法はそのため、第2の二本鎖切断を生成するために二本鎖核酸分子を第2の部位特異的ヌクレアーゼと接触させるステップd)を含んでもよい。好ましくは、第2の二本鎖切断は、標的核酸断片の第2の鎖の遊離3’末端を結果としてもたらす。
好ましくは、ステップd)はステップb)と同時に行われる。ステップd)は、ステップb)の後、及びステップc)の前に行われてもよい。代替的に又は追加的に、ステップd)はステップc)の後に行われてもよい。
好ましくは、この第2の二本鎖切断は、目的の配列の近傍にある位置において生成される。好ましくは、第2の生成された二本鎖切断は、目的の配列のすぐ隣に位置する。二本鎖切断は、目的の配列の上流又は下流において生成されてもよく、標的核酸断片の遊離3’又は5’末端を結果としてもたらすことができる。二本鎖切断は標的核酸断片の第2の鎖の遊離3’末端を生成する。標的核酸断片の第2の鎖のこの遊離3’末端は、標的核酸断片の上又は下の鎖の遊離3’末端であり得ることが本明細書において理解される。
2つの二本鎖切断が生成される場合、第1の二本鎖切断は標的核酸断片の第1の鎖の3’末端を生成してもよく、第2の二本鎖切断は標的核酸断片の第1の鎖の5’末端を生成してもよい。2つの二本鎖切断が生成される場合、第1の二本鎖切断は標的核酸断片の第2の鎖の5’末端を生成してもよく、第2の二本鎖切断は標的核酸断片の第2の鎖の3’末端を生成してもよい。
切断ステップb)、及び任意選択で切断ステップd)は、好ましくは、部位特異的ヌクレアーゼが二本鎖核酸分子に特異的に結合してそれを切断できる実験条件下で、すなわち部位特異的ヌクレアーゼが特異的な酵素活性を示す実験条件下で行われる。そのような実験条件は当業者に周知であり、及び/又は任意の従来の手段を使用して決定され得る。当業者に公知のように、これらの実験条件は部位特異的ヌクレアーゼの種類に依存し得る。実験条件は、以下の実験セクションに記載される条件と同じ又は類似したものであり得る。
目的の配列は部位特異的ヌクレアーゼ(複数可)での切断前に二本鎖核酸分子中に存在することが本明細書において理解される。核酸分子の切断は、少なくとも2つ又はより多くの核酸断片を結果としてもたらし、少なくとも1つの核酸断片は標的核酸断片である。他の生成される核酸断片もまた、標的核酸断片であり得るか、若しくはそれを含んでもよいか、又は非標的核酸断片である。標的核酸断片は、目的の配列を含むか又はからなる。それゆえ、二本鎖核酸分子を切断する前に、標的核酸断片は二本鎖核酸分子内に包含され、標的核酸断片は少なくとも1つの部位特異的エンドヌクレアーゼでの切断で二本鎖核酸分子から放出されることは当業者に明らかである。
第1の、及び任意選択の第2の、二本鎖切断を生成する部位特異的ヌクレアーゼは、CRISPR-ヌクレアーゼ複合体、核酸-アルゴノート複合体、ジンクフィンガーヌクレアーゼ、TALEN及びメガヌクレアーゼからなる群から選択され得る。好ましくは、ステップb)及び/又はステップd)における部位特異的ヌクレアーゼはCRISPR-ヌクレアーゼ複合体である。
CRISPR-ヌクレアーゼ複合体
本発明による使用のためのCRISPR-ヌクレアーゼ複合体、又は複合体は、ガイドRNAと複合体化したCRISPR関連(CAS)タンパク質、又はCRISPR-ヌクレアーゼとして本明細書において理解されるべきである。
CRISPR-ヌクレアーゼは、ヌクレアーゼドメイン、及びガイドRNAと相互作用する少なくとも1つのドメインを含む。ガイドRNAと複合体化した場合、CRISPR-ヌクレアーゼは、ガイドRNAにより特定の核酸配列に方向付けられる。ガイドRNAは、CRISPR-ヌクレアーゼの他に、特定の標的核酸配列と相互作用し、その結果、ガイド配列を介して特定の核酸配列を含む部位に一旦方向付けられると、CRISPR-ヌクレアーゼは標的部位において切断を導入することができる。好ましくは、CRISPR-ヌクレアーゼは、ヌクレアーゼの1つ又は両方のドメインが触媒的に活性である場合に、標的部位においてそれぞれ一本鎖又は二本鎖切断を導入することができる。CRISPR-ヌクレアーゼと組み合わせられた場合に、ガイドRNAが核酸分子中の予め定義された部位において一本鎖又は二本鎖切断の導入をもたらす方式においてガイドRNAを設計する方法を当業者はよく認識している。好ましくは、CRISPR-ヌクレアーゼは二本鎖切断(double-stranded beak)の導入をもたらす。
CRISPR-ヌクレアーゼは、コアエレメント含有量及び配列に基づいて、サブタイプにさらに分けられる6つの主要なタイプ(I~VI型)に一般にカテゴライズされ得る(Makarovaら、2011、Nat Rev Microbiol 9:467~77頁及びWrightら、2016、Cell 164(1-2):29~44頁)。一般に、CRISPR-CASシステム複合体の2つの鍵となるエレメントはCRISPR-ヌクレアーゼ及びガイドRNAである。
II型CRISPR-CASシステムは、二重鎖DNAを特異的に切断することが可能であるシグネチャーCas9タンパク質、単一タンパク質(約160KDa)を含む。Cas9タンパク質は、典型的には、2つのヌクレアーゼドメイン、アミノ末端の近くのRuvC様ヌクレアーゼドメイン及びタンパク質の中央の近くのHNH(又はMcrA様)ヌクレアーゼドメインを含有する。Cas9タンパク質の各々のヌクレアーゼドメインは、二重らせんの1つの鎖を切断するために専門化されている(Jinekら、2012、Science 337(6096):816~821頁)。Cas9タンパク質はII型CRISPR/-CASシステムのCASタンパク質の例であり、crRNA、及びトランス活性化crRNA(tracrRNA)と称される第2のRNAと組み合わせられた場合に、CRISPR-ヌクレアーゼ複合体を形成する。crRNA及びtracrRNAは一緒になってガイドRNAとして機能する。CRISPR-ヌクレアーゼ複合体は、crRNAにより定義されるゲノム中の位置においてDNA二本鎖切断(DSB)を導入する。crRNA及びtracrRNAの必須の部分を融合することにより生成される単鎖キメラガイドRNA(「sgRNA」)は、Cas9タンパク質と組み合わせて機能的なCRISPR-ヌクレアーゼ複合体を形成できることをJinekら(2012、Science 337:816~820頁)は実証した。
V型CRISPR-CASシステムは、プレボテラ(Prevotella)及びフランシセラ(Francisella)1からのClustered Regularly Interspaced Short Palindromic Repeat又はCRISPR/Cpf1を含む。Cpf1遺伝子は、CRISPR座位と関連付けられ、crRNAを使用してDNAを標的化するエンドヌクレアーゼをコードする。Cpf1は、Cas9よりも小さい及び単純なエンドヌクレアーゼである。Cpf1は、tracrRNAを欠いたシングルRNAにガイドされるエンドヌクレアーゼであり、好ましくはTリッチプロトスペーサー隣接モチーフを利用する。Cpf1は、スタッガードDNA二本鎖切断を介してDNAを切断する(Zetscheら、(2015) Cell 163(3):759~771頁)。V型CRISPR-CASシステムは、好ましくは、Cpf1、C2c1及びC2c3のうちの少なくとも1つを含む。
本発明の方法における使用のためのCRISPR-ヌクレアーゼ複合体、又は複合体は、二本鎖切断を生成することが可能である任意のCRISPR-ヌクレアーゼを含んでもよい。好ましくは、本発明の方法における使用のためのCRISPR-ヌクレアーゼ複合体、又は複合体は、II型CRISPR-ヌクレアーゼ、例えば、Cas9(例えば、配列番号2によりコードされる、配列番号1のタンパク質、若しくは配列番号3のタンパク質)若しくはV型CRISPR-ヌクレアーゼ、例えばCpf1(例えば、配列番号5によりコードされる、配列番号4のタンパク質)若しくはMad7(例えば配列番号6若しくは7のタンパク質)、又は前記タンパク質に対してその全長にかけて好ましくは少なくとも約70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、若しくは99%の配列同一性を有する、これらに由来するタンパク質を含む。好ましくは本発明の方法での使用のためのCRISPR-ヌクレアーゼ複合体、又は複合体は、II型CRISPR-ヌクレアーゼ、好ましくはCas9ヌクレアーゼを含む。
CRISPR-ヌクレアーゼ複合体の異なる構成要素を調製する方法は当業者に公知である。先行技術において、多数の報告がその設計及び使用に関して利用可能である。例えば、ガイドRNAの設計及びCASタンパク質(S.ピオゲネスから元々は得られた)とのその併用に関するHaeusslerら(J Genet Genomics.(2016)43(5):239~50頁.doi:10.1016/j.jgg.2016.04.008)による総説、又はLeeら(Plant Biotechnology Journal(2016)14(2) 448~462頁)による総説を参照。
好ましくは、CRISPR-ヌクレアーゼ、例えばCas9は、2つの触媒的に活性のヌクレアーゼドメインを含む。例えば、Cas9タンパク質は、RuvC様ヌクレアーゼドメイン及びHNH様ヌクレアーゼドメインを含むことができる。RuvC及びHNHドメインは一緒に働き、両方とも単一の鎖を切断して、DNA中に二本鎖切断を作る。(Jinekら、Science、337:816~821頁)。
不活性(dead)CRISPR-ヌクレアーゼは、ヌクレアーゼドメインのいずれも切断活性を示さないような改変を含む。本発明の方法における使用のためのCRISPR-ヌクレアーゼは、ヌクレアーゼドメインのうちの1つがもはや機能的でなく(すなわち、ヌクレアーゼ活性が存在しない)、それによりニッカーゼを作り出すように突然変異しているCRISPR-ヌクレアーゼのバリアントであってもよい。例は、D10A又はH840Aのいずれかの突然変異を有するSpCas9バリアントである。好ましくは、CRISPR-ヌクレアーゼ複合体のヌクレアーゼは不活性ヌクレアーゼではない。好ましくは、CRISPR-ヌクレアーゼ複合体、又は複合体のCRISPR-ヌクレアーゼは、ニッカーゼ又は(エンド)ヌクレアーゼのいずれか、好ましくは(エンド)ヌクレアーゼである。本発明の方法において使用されるCRISPR-ヌクレアーゼ複合体、又は複合体は、Cas9タンパク質全体を含んでもよいか、又はその機能性断片を含んでもよい。
好ましくはCRISPR-ヌクレアーゼはCas9又はCpf1ヌクレアーゼ、好ましくはCas9ヌクレアーゼを含む。好ましくは、本発明における使用のためのCRISPR-ヌクレアーゼ複合体、又は複合体はCas9タンパク質を含む。Cas9タンパク質は、細菌ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)(SpCas9;NCBI参照配列NC_017053.1;UniProtKB - Q99ZW2)、ゲオバシラス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)(UniProtKB - A0A178TEJ9)、コリネバクテリウム・ウルセラス(Corynebacterium ulcerous)(NCBI参照:NC_015683.1、NC_017317.1);コリネバクテリウム・ジフテリア(Corynebacterium diphtheria)(NCBI参照:NC_016782.1、NC_016786.1);スピロプラズマ・シルフィジコラ(Spiroplasma syrphidicola)(NCBI参照:NC_021284.1);プレボテラ・インテルメディア(Prevotella intermedia)(NCBI参照:NC_017861.1);スピロプラズマ・タイワネンセ(Spiroplasma taiwanense)(NCBI参照:NC_021846.1);ストレプトコッカス・イニアエ(Streptococcus iniae)(NCBI参照:NC_021314.1);ベリエラ・バルティカ(Belliella baltica)(NCBI参照:NC_018010.1);サイクロフレクサス・トルクイスル(Psychroflexus torquisl)(NCBI参照:NC_018721.1);ストレプトコッカス・サーモフィラス(Streptococcus thermophilus)(NCBI参照:YP_820832.1);リステリア・イノキュア(Listeria innocua)(NCBI参照:NP_472073.1);カンピロバクター・ジェジュニ(Campylobacter jejuni)(NCBI参照:YP_002344900.1);又はネイセリア・メニンギチジス(Neisseria meningitidis)(NCBI参照:YP_002342100.1)に由来してもよい。包含されるのは、SpCas9に対してホモログの不活性化されたHNH若しくはRuvCドメインを有するこれらからのCas9バリアント、例えばSpCas9_D10A若しくはSpCas9_H840A、又はニッカーゼにする、SpCas9タンパク質中のD10若しくはH840に対応する位置における同等の置換を有するCas9である。好ましくは、本発明の方法における使用のためのCas9タンパク質は(エンド)ヌクレアーゼである。
プログラム可能なヌクレアーゼは、Cpf1、例えば、アシッドアミノコッカス属菌(Acidaminococcus sp)からのCpf1;UniProtKB - U2UMQ6に由来してもよい。バリアントは、RuvC又はNUCドメインがもはやヌクレアーゼ活性を有しない、不活性化されたRuvC又はNUCドメインを有するCpf1ニッカーゼであってもよい。当業者は、不活性化されたヌクレアーゼ、例えば不活性化されたRuvC又はNUCドメインを可能とする当技術分野において利用可能な技術、例えば部位特異的突然変異誘発、PCR媒介突然変異誘発、及び全遺伝子合成をよく認識している。不活性NUCドメインを有するCpf1ニッカーゼの例はCpf1 R1226Aである(Gaoら、Cell Research(2016)26:901~913頁、Yamanoら、Cell(2016)165(4):949~962頁を参照)。このバリアントにおいて、NUCドメインを不活性化する、NUCドメイン中のアルギニンからアラニンへの(R1226A)変換がある。好ましくはCpf1タンパク質は、不活性化されたCpf1タンパク質ではない。好ましくは、本発明における使用のためのCpf1タンパク質は(エンド)ヌクレアーゼである。
本発明の方法は、核酸試料からのこれらの標的核酸断片の同時の富化を提供し得る。したがって任意選択で、本発明の方法のステップb)において、複数のCRISPR-ヌクレアーゼ複合体が、核酸試料からの複数の標的核酸断片の富化、単離又はシークエンシングのために加えられる。好ましくは、これらの複数のCRIRPR-ヌクレアーゼ複合体は同じCRISPR-ヌクレアーゼを含んでもよいが、それらのガイドRNAにおいて異なってもよい。例えば、各々の標的核酸断片のために、2つの別個のガイドRNA分子が使用されてもよく、例えば1つのガイドRNAは第1のCRISPR-ヌクレアーゼ複合体に組み込まれ、別のガイドRNAは第2のCRISPR-ヌクレアーゼ複合体に組み込まれる。例えば少なくとも約50、100、150、200、250、300、350、400、450、500、750、1000個又はより多くの標的核酸断片のために、好ましくは少なくとも約50、100、150、200、250、300、350、400、450、500、750、1000個又はより多くの、ガイドRNA分子のセット、好ましくは少なくとも約100、200、300、400、500、600、700、800、900、1000、1500、2000個又はより多くの異なるガイドRNA分子が本発明の方法において使用されてもよい。
ガイドRNA
本発明の方法における使用のためのCRISPR-ヌクレアーゼ複合体、又は複合体は、プロトスペーサー配列とも命名される、二本鎖核酸分子中の定義された標的部位に複合体を方向付けるCRISPR-ヌクレアーゼ関連ガイドRNAをさらに含む。ガイドRNAは、二本鎖核酸分子中の目的の配列の好ましくは近くに、該配列に又は該配列内にあるプロトスペーサー配列にCRISPR-ヌクレアーゼ複合体を標的化するためのガイド配列を含み、sgRNA又はcrRNAとtracrRNAとの組合せ(例えばCas9のため)又はcrRNAのみ(例えばCpf1の場合)であってもよい。本発明の方法における使用のためのCRISPR-ヌクレアーゼ複合体はそのためガイドRNAを含んでもよく、ガイドRNAはcrRNAとtracrRNAとの組合せであり、及び好ましくは(エンド)ヌクレアーゼはCas9である。crRNA及びtracrRNAは任意選択でsgRNA(シングルガイドRNA)になるように組み合わせられる。代替的に、本発明の方法における使用のためのCRISPR-ヌクレアーゼ複合体は、ガイドRNAを含んでもよく、ガイドRNAはcrRNAであり、及び好ましくは(エンド)ヌクレアーゼはCpf1である。
「ガイドRNA」という用語はそのため、二本鎖DNA分子内の特定のヌクレオチド配列に(エンド)ヌクレアーゼを方向付けるRNA分子、又はRNA分子の組合せを指すことが本明細書において理解される。Cas9(エンド)ヌクレアーゼの場合、「ガイドRNA」という用語はそのため、crRNAとtracrRNAとの組合せのみ、又はシングルガイドRNAのみが意図されることが文脈から明らかである場合を除いて、crRNAとtracrRNAとの組合せの他に、シングルガイドRNA(sgRNA)の両方を包含する。Cpf1(エンド)ヌクレアーゼの場合、「ガイドRNA」という用語はcrRNAを指す。
任意選択で、1つより多くの種類のガイドRNAが同じ方法において使用されてもよく、これは例えば2つ若しくはより多くの異なる目的の配列を目的としているか、又は同じ目的の配列の2つの異なる位置を目的としており、例えば同じ目的の配列の上流の配列及び下流の配列を目的としている。非限定的な例として、第1のガイドRNAは、核酸分子が目的の配列の上流で切断されるように二本鎖核酸中の配列に第1のCRISPR-ヌクレアーゼ複合体をガイドしてもよく、及び第2のガイドRNAは、核酸分子が目的の配列の下流で切断されるように二本鎖核酸中の別の配列に第2のCRISPR-ヌクレアーゼ複合体をガイドしてもよい。
好ましくは、CRISPR-ヌクレアーゼ複合体は、プロトスペーサー配列内で核酸を切断するCRISPR-ヌクレアーゼを含む。好ましいCRISPR-ヌクレアーゼはCas9である。
CRISPR-ヌクレアーゼ複合体におけるgRNA(ガイドRNA)としての使用のためのcrRNA及びtracrRNAとして好適な分子は当技術分野において周知である(例えば、国際公開第2013142578号及びJinekら、Science(2012)337、816~821頁を参照)。
本発明の方法における使用のためのガイドRNAのうちの少なくとも1つは、目的の配列、好ましくは本明細書において定義されている目的の配列に又はその近くにハイブリダイズすることができる配列を含んでもよい。好ましくは、ガイドRNAのうちの少なくとも1つは、目的の配列中の配列に完全に相補的なヌクレオチド配列を含み、すなわち目的の配列はプロトスペーサー配列を含む。
代替的に又は追加的に、本発明の方法における使用のためのガイドRNAのうちの少なくとも1つは、目的の配列、好ましくは本明細書において定義されている目的の配列の相補体に又はその近くにハイブリダイズすることができる配列を含んでもよい。好ましくは、ガイドRNAのうちの少なくとも1つは、目的の配列と、又はその部分と完全な配列同一性を有するヌクレオチド配列を含む。
プロトスペーサー配列に相補的なcrRNA配列の部分は、プロトスペーサー配列とハイブリダイズするためにプロトスペーサー配列と十分な相補性を有するように、及び複合体化したヌクレアーゼの配列特異的な結合を指令するように設計される。プロトスペーサー配列は、好ましくは、プロトスペーサー隣接モチーフ(PAM)配列に隣接し、PAM配列は、本明細書において定義されているRNAにガイドされるCRISPRシステムヌクレアーゼ複合体のCRISPRヌクレアーゼと相互作用し得る。例えば、CRISPRヌクレアーゼがS.ピオゲネスCas9である場合、PAM配列は好ましくは5’-NGG-3’であり、Nは、T、G、A又はCのうちのいずれか1つであり得る。当業者は、好ましくは配列を操作して、任意の所望されるプロトスペーサー配列にハイブリダイズするために該プロトスペーサー配列に少なくとも部分的に相補的となるようにすることにより、crRNAを操作して任意の所望される配列を標的化させることができる。好ましくは、crRNA配列の部分とその対応するプロトスペーサー配列との間の相補性は、好適なアライメントアルゴリズムを使用して最適にアライメントされた場合に、少なくとも約70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%又は100%である。プロトスペーサー配列に相補的なcrRNA配列の部分は、少なくとも約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75個、又はより多くのヌクレオチドの長さであってもよい。一部の好ましい実施形態において、DNA標的配列に相補的な配列は、約75、50、45、40、35、30、25、20個未満のヌクレオチドの長さである。好ましくは、DNA配列に相補的な配列の長さは少なくとも17ヌクレオチドである。好ましくは相補的なcrRNA配列は約10~30ヌクレオチドの長さ、約17~25ヌクレオチドの長さ又は約15~21ヌクレオチドの長さである。好ましくはプロトスペーサー配列に相補的なcrRNAの部分は、15、16、17、18、19、20、21、22、23、24又は25ヌクレオチドの長さ、好ましくは20又は21ヌクレオチド、好ましくは20ヌクレオチドである。
好ましくは、crRNA及びtracrRNAが別々の分子であり、方法が、核酸分子中に2つの二本鎖切断を生成するためにステップb)及びステップd)を含む実施形態において、第1及び第2のCRISPR-ヌクレアーゼ複合体は、それぞれ第1及び第2のcrRNAを含んでもよく、第1及び第2のcrRNAは同一の配列を有しない。好ましくは、第1及び第2のcrRNAは異なるプロトスペーサー配列を認識する。第1及び第2のCRISPR-ヌクレアーゼ複合体はしかしながら、同一の又はほぼ同一の配列を有するtracrRNAを含んでもよい。
好ましくは、crRNA及びtracrRNAは一緒になるように連結されてsgRNAを形成する。crRNA及びtracrRNAは、当技術分野において公知の任意の従来の方法を使用して連結され得る、好ましくは共有結合的に連結され得る。crRNA及びtracrRNAの共有結合性連結は、例えばJinekら(上掲)及び国際公開第13/176772号(参照により本明細書に組み込まれる)に記載されている。crRNA及びtracrRNAは、例えばリンカーヌクレオチドを使用して又はcrRNAの3’末端とtracrRNAの5’末端との直接的な共有結合性連結を介して、共有結合的に連結され得る。
好ましくは、CRISPRヌクレアーゼ複合体、又は複合体のガイドRNAは、CRISPR-ヌクレアーゼ複合体、又は複合体との核酸試料のインキュベーションで、核酸試料からの核酸分子内に含まれる標的核酸断片が前記核酸分子から切除されるように設計される。追加的に、好ましくは第1のガイドRNAは、第1のCRISPR-ヌクレアーゼ複合体が核酸分子の切断後に標的核酸断片に結合したままとなるように設計される。追加的に好ましくは任意選択の第2のガイドRNAは、第2のCRISPR-ヌクレアーゼ複合体が核酸分子の第2の切断後に標的核酸断片に結合したままとなるように設計される。
二本鎖核酸分子中に存在する場合の標的核酸断片は、少なくとも1つの非標的核酸断片により隣接され得る。二本鎖核酸分子中に存在する場合の標的核酸断片は、両側において非標的核酸断片に隣接されていてもよく、すなわち1つの非標的核酸断片が標的核酸断片の直接的に上流に存在してもよく、及び1つの非標的核酸断片が標的核酸断片の直接的に下流に存在してもよい。
本発明の方法のステップb)及びd)は、CRISPR-ヌクレアーゼ複合体、又は複合体、及び核酸試料を一緒に、CRISPR-ヌクレアーゼ複合体、又は複合体が二本鎖切断を誘導するために好適な条件及び時間、例えば、以下に限定されないが、本明細書において提供される実施例において詳述される条件においてインキュベートすることにより行われてもよい。任意選択で、インキュベーションは、約1分~約18時間、好ましくは約60分、約10~90℃、好ましくは約37℃で行われる。
二本鎖切断を生成する部位特異的ヌクレアーゼがアルゴノートである場合、本明細書に詳述されている「ガイドRNA」という用語はガイド核酸に置き換えられてもよく、ガイド核酸は、好ましくは、低分子RNA又は低分子DNAガイドのうちの少なくとも1つである。核酸アルゴノート複合体はそのため、好ましくはガイド核酸-アルゴノート複合体、好ましくはガイドRNA-アルゴノート複合体及びガイドDNA-アルゴノート複合体のうちの少なくとも1つである。
標的核酸断片の遊離3’末端の標識化 - ステップc)及びe)
二本鎖核酸分子の切断は標的核酸断片の遊離3’末端を生成する。この遊離3’末端はその後に、1つ又は複数のヌクレオチドで標識又は「伸長」が可能であり、好ましくは標的核酸断片の3’末端を伸長するヌクレオチドは、予め決定された配列を有する。1つ又は複数のヌクレオチドでの標的核酸断片の3’末端の標識化のステップは、好ましくは、切断された二本鎖核酸分子を逆転写酵素及び鋳型RNA分子と接触させることにより行われる。逆転写酵素は、核酸断片の遊離3’末端を伸長するための鋳型として鋳型RNAを使用し、それにより、鋳型RNA分子に相補的な1つ又は複数のヌクレオチドを3’末端に付加する。換言すれば、逆転写酵素はそのため、鋳型RNAの部分を逆に転写する。
方法は、標的核酸断片をDNAポリメラーゼ及び第2の鋳型分子と、好ましくは逆転写酵素及び第2の鋳型RNA分子と接触させ、それにより、1つ又は複数のヌクレオチドで標的核酸断片の第2の鎖を遊離3’末端において標識するステップe)を含んでもよく、好ましくはステップe)はステップc)と同時に行われる。
好ましくは、ステップd)の第2の部位特異的ヌクレアーゼは、少なくとも本明細書においてさらに定義されているその後の標識化ステップの全体を通じて目的の配列を含む切断された核酸分子の部分に結合したままであるように設計されてもよい。好ましくは、ステップd)の部位特異的ヌクレアーゼは、少なくともステップe)の全体を通じて標的核酸断片に結合したままであるように設計される。好ましくは、部位特異的ヌクレアーゼは、標識されるべき部位に位置したままであるように設計される。
標識化ステップc)、及び任意選択でステップe)は、好ましくは、逆転写酵素が鋳型RNA分子を逆転写できる実験条件下で、すなわち逆転写酵素が酵素活性を示す実験条件下で行われる。そのような実験条件は当業者に周知であり、及び/又は任意の従来の手段を使用して決定され得る。当業者に公知のように、これらの実験条件は逆転写酵素の種類に依存し得る。実験条件は、以下の実験セクションに記載される条件と同じ又は類似したものであり得る。これらの実験条件は、好ましくは、少なくともヌクレオチド、好ましくは天然に存在するヌクレオチドの存在を含み、好ましくはこれらの実験条件は、dNTP、好ましくはアデニン、グアニン、シトシン及びチミジン及び任意選択でウラシルのうちの少なくとも1つの存在を含む。
本発明の方法はそのため、切断された標的核酸分子を逆転写酵素及び鋳型RNA分子と接触させ、それにより、1つ又は複数のヌクレオチドで標的核酸断片の第1の鎖の遊離3’末端を標識するステップc)を含んでもよい。ステップc)と同時に又はステップc)の後に、方法は、標的核酸断片をDNAポリメラーゼ及び第2の鋳型分子、好ましくは逆転写酵素及び第2の鋳型RNA分子と接触させ、それにより、1つ又は複数のヌクレオチドで標的核酸断片の第2の鎖を遊離3’末端において標識するステップe)をさらに含んでもよい。好ましくは、前記ステップe)はステップc)と同時に行われる。第1及び第2の鎖の両方を標識することにより、標的核酸断片のいずれかの側において2つの標識を有する二本鎖断片が得られる。
ステップc)は好ましくはステップa)の後及びステップb)の後に行われる。任意選択でステップc)はステップd)の後に行われる。ステップe)は好ましくはステップd)の後に行われる。そのため本発明の方法において、二本鎖核酸分子は、最初にすべての所望される(例えば1つ又は複数の)位置において切断されてもよく、続いて切断された分子をRNA鋳型分子及び逆転写酵素と接触させてもよい。代替的に、切断ステップ及び標識化ステップは交互の様式で行われてもよい。
本発明の方法はそのため、以下のステップの順序を含んでもよい:
ステップa)、b)及びc)
ステップa)、b)、c)、及びd)
ステップa)、b)、c)、d)及びe)
ステップa)、b)、d)c)及びe)
ステップb)及びステップc)の接触は逐次的に及び同時に行われてもよい。換言すれば、ステップb)及びc)の反応成分は、反応混合物に逐次的に及び同時に加えられてもよいが、ステップb)の部位特異的ヌクレアーゼは遊離3’末端をステップc)の鋳型RNAが結合するために接近可能とするために役立ち得るので、部位特異的ヌクレアーゼは、好ましくは、本発明の方法のステップc)の全体を通じて存在し、標的断片に結合したままであるべきである。任意選択のステップd)は、後のステージにおいて別々に又はステップb)及びc)と同時に行われてもよい。
両方の側における標的断片の標識化の場合、本発明の方法はステップd)及びe)を含む。ステップd)及びステップe)の接触は逐次的に及び同時に行われてもよい。換言すれば、ステップd)及びe)の反応成分は反応混合物に逐次的に及び同時に加えられてもよいが、ステップd)の部位特異的ヌクレアーゼは遊離3’末端をステップe)の鋳型RNAが結合するために接近可能にするために役立ち得るので、前記複合体は、好ましくは、本発明の方法のステップe)の全体を通じて存在し、標的断片に結合したままであるべきである。
好ましい実施形態において、両方の側における標的断片の標識化の場合、ステップb)、c)、d)及びe)の反応成分はすべて反応混合物に同時に加えられてもよい。
二本鎖切断の生成及び標識化が同時に行われる場合、好ましくは前記反応容器内の実験条件は、部位特異的ヌクレアーゼによる切断及びDNAポリメラーゼによる標識化の両方を可能とするようなものである。
本明細書に詳述されるように、本発明は、ステップf)及びg)のうちの少なくとも1つをさらに含んでもよく、並びに/又はステップ(i)、(ii)及び(iii)のうちの少なくとも1つをさらに含んでもよい。
好ましくは、標的核酸断片の第1の鎖の遊離3’末端及び第2の鎖の遊離3’末端は、1つ又は複数のヌクレオチドの付加により伸長される。第1の鎖を伸長する1つ又は複数のヌクレオチドの配列は、標的核酸断片の第2の鎖を伸長するヌクレオチドの配列と同一又はほぼ同一であり得る。第1及び第2の鎖を伸長する1つ又は複数のヌクレオチドは、20%、30%、40%、50%、60%、70%、80%、90%、95%より高い又は100%のヌクレオチド配列同一性を有してもよい。
好ましくは、第1の鎖を伸長する1つ又は複数のヌクレオチドの配列は、標的核酸断片の第2の鎖を伸長するヌクレオチドの配列とは異なる。好ましくは、第1及び第2の鎖を伸長する1つ又は複数のヌクレオチドは、98%、95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%より低い又はさらには10%より低いヌクレオチド配列同一性を有する。
第1の鎖の遊離3’末端を伸長するヌクレオチドの数は、標的核酸断片の第2の鎖の遊離3’末端を伸長するヌクレオチドの数と同一であり得る。代替的に、第1の鎖の遊離3’末端を伸長するヌクレオチドの数は、標的核酸断片の第2の鎖の遊離3’末端を伸長するヌクレオチドの数とは異なる。第1の鎖を伸長するヌクレオチドの数及び第2の鎖を伸長するヌクレオチドの数は、少なくとも約1、2、4、6、8、10、20個又はより多くのヌクレオチドだけ異なってもよい。
標的核酸断片の第1及び/又は第2の鎖を伸長する1つ又は複数のヌクレオチドの配列は、機能性ドメインを含んでもよく、該機能性ドメインは、好ましくは、制限部位ドメイン、捕捉ドメイン、シークエンシングプライマー結合部位、増幅プライマー結合部位、検出ドメイン、バーコード配列、転写プロモータードメイン及びPAM配列、又はこれらの任意の組合せからなる群から選択される。バーコードは、試料バーコード、アレル特異的識別物、座位特異的識別物又は固有分子識別物(UMI)であり得るが、これらに限定されない。例えば特定の標的核酸の2つのアレルバリアントが試料中に存在する可能性があり、鋳型RNA分子がそれらのうちの1つのみにアニールすることにより1つ又は複数の多型の間での識別が可能である場合、このRNA分子内の任意のバーコードはアレル特異的識別物として役立ち得る。
本発明の方法は、本明細書において定義されているステップe)を含んでもよく、該ステップe)において、結果としてもたらされた標的核酸断片は標的核酸断片のいずれかの側において標識される。第1の鎖の3’末端における標識(第1の標識)は機能性ドメインを含んでもよい。代替的に又は追加的に、第2の鎖の3’末端における標識(第2の標識)は機能性ドメインを含んでもよい。第1及び第2の標識中に位置する機能性ドメインは、同じ機能性ドメイン又は異なる機能性ドメインであってもよい。例えば、標的核酸断片の第1の鎖の3’末端における標識は第1のプライマー結合部位を含んでもよく、及び前記標的核酸断片の第2の鎖の3’末端における標識は第2のプライマー結合部位を含んでもよい。前記第1及び第2のプライマー結合部位は、それぞれ第1及び第2の増幅プライマーにアニールするため、並びに/又はそれぞれ第1及び第2のシークエンシングプライマーにアニールするための配列を含んでもよい。前記第1の(増幅及び/又はシークエンシング)プライマーはリバースプライマーとして指し示されてもよく、並びに前記第2の(増幅及び/又はシークエンシング)プライマーはフォワードプライマーとして指し示されてもよい。結果としてもたらされる二重標識された核酸断片の鎖のうちの少なくとも1つ、又は好ましくは両方は、増幅及び/又はシークエンシングのための鋳型分子として使用されてもよい。例えば第1及び第2の標識された鎖は2方向性シークエンシングのために使用されてもよい。
追加的に又は代替的に、標的核酸断片の第1の鎖の3’末端における標識は第1のバーコードを含んでもよく、及び前記標的核酸断片の第2の鎖における標識は第2のバーコードを含んでもよい。第1及び/又は第2のバーコードは任意選択で第1及び/又は第2のUMIである。例えば国際公開第2011/155833号(参照により本明細書に組み込まれる)に記載されるように、これらの2つのバーコードは一緒になって、コンビナトリアルバーコード又はコンビナトリアル配列バーコードを形成してもよい。簡潔に述べれば、これらの2つのバーコードの組み合わせられた配列(すなわちコンビナトリアルバーコード又はコンビナトリアル配列バーコード)は識別物として使用される。任意選択で、これらの2つのバーコードの組み合わせられた配列は試料識別物として使用される。任意選択で、これらの2つのバーコードの組み合わせられた配列は、特定の標的核酸断片の識別物として使用される。
任意選択で、第1及び第2の標識のうちの少なくとも1つは、1つより多くのバーコード及び/又は1つより多くのUMIを含む。
任意選択で、標的核酸断片の第1の鎖の3’末端における標識は第1のバーコード及び第1のプライマー結合部位を含んでもよく、並びに前記標的核酸断片の第2の鎖における標識は第2のバーコード及び第2のプライマー結合部位を含んでもよい。好ましくは、プライマー結合部位はシークエンシングプライマー結合部位である。2方向性シークエンシングのその後のステップの場合、標識された核酸断片の第1の一本鎖鋳型は、5’から3’方向に、目的の配列、第1のバーコード及び第1のシークエンシングプライマー結合部位を含んでもよい。標識された核酸断片の第2の一本鎖鋳型は、5’から3’方向に、目的の配列、第2のバーコード及び第2のシークエンシングプライマー結合部位を含んでもよい。第1及び第2のプライマー結合部位は、結果としてもたらされる標識された断片のバーコード及び目的の配列の両方が、独立したプライマー事象を使用して各々の一本鎖鋳型からシークエンシングされるように位置し、すなわちリバースプライマーは第1の鎖の第1のバーコード及び目的の配列をシークエンシングするために使用されてもよく、並びにフォワードプライマーは第2の鎖の第2のバーコード及び目的の配列をシークエンシングするために使用されてもよい。
標的核酸断片の第1の鎖の3’末端における標識は第1のバーコード及び第1の増幅プライマー結合部位を含んでもよく、並びに前記標的核酸断片の第2の鎖における標識は第2のバーコード及び第2の増幅プライマー結合部位を含んでもよい。任意選択で、標識はシークエンシングプライマー結合部位を含んでもよい。標識された核酸断片の第1の一本鎖鋳型は、5’から3’方向に、目的の配列、第1のバーコード、任意選択の第1のシークエンシングプライマー結合部位、及び増幅プライマー結合部位を含んでもよい。標識された核酸断片の任意選択の第2の一本鎖鋳型は、5’から3’方向に、目的の配列、第2のバーコード、任意選択の第2のシークエンシングプライマー結合部位、及び増幅プライマー結合部位を含んでもよい。好ましくは、プライマー結合部位は、標的核酸断片のバーコード及び配列の両方が、独立したプライマー事象を使用して増幅されるように位置し、すなわちリバースプライマーは第1の鎖の第1のバーコード及び目的の配列を増幅するために使用されてもよく、並びにフォワードプライマーは第2の鎖の第2のバーコード及び(相補的な)目的の配列を増幅するために使用されてもよい。
本明細書において指し示されている実施形態の標識された標的核酸断片を生成するために、ステップc)及び任意選択でステップe)の鋳型RNA分子は、然るべく特異的に設計される。本発明の方法がハイスループットの方式において複数の試料に対して行われる場合、好ましくは各々の試料の各々の標的断片は、特定の試料バーコードを含む標識で標識され、その結果、下流の処理のために、異なる試料からの標識された標的断片は、一緒にプール及び処理が可能であると共に、シークエンシング後にそれぞれの配列はそのそれぞれの起源となる試料に割り当てられ得る。そのような試料バーコードに追加的に又は代替的に、標識は、特定の標的断片の同定のためのUMI及び/又はバーコードをさらに含んでもよい。
逆転写酵素(RT)
第1及び/又は第2の鎖の遊離3’末端を標識するタンパク質は、二本鎖DNA分子の3’末端を伸長することが可能である任意の組換えタンパク質であってもよい。好ましくは、そのようなタンパク質はDNAポリメラーゼである。
ポリメラーゼは、野生型ポリメラーゼ、機能性断片、突然変異体、バリアント、及び切断されたバリアントなどであってもよい。ポリメラーゼは、真核、原核、古細菌、若しくはウイルス生物からの野生型ポリメラーゼを含んでもよく、並びに/又はポリメラーゼは、遺伝子操作、突然変異誘発及び定向進化ベースの方法のうちの少なくとも1つにより改変されていてもよい。
DNAポリメラーゼは、DNA依存性及び/又はRNA依存性DNAポリメラーゼであってもよい。本発明は任意の特定のRNA依存性DNAポリメラーゼ又は任意の特定のDNA依存性DNAポリメラーゼに限定されないことを当業者は理解する。本明細書において定義されている「RNA依存性DNAポリメラーゼ」又は「逆転写酵素」という用語は、「逆転写酵素」という用語が意図されることがその文脈から明確である場合を除いて、「DNA依存性DNAポリメラーゼ」という用語に置き換えられ得る。同様に「鋳型RNA分子」という用語は、DNA依存性DNAポリメラーゼと組み合わせて使用される場合に、「鋳型DNA分子」に置き換えられ得る。
任意選択でステップc)及び/又はステップe)において2、3、4個又はより多くのDNAポリメラーゼの組合せが使用され得る。
ポリメラーゼは、好ましくは、「鋳型依存性」ポリメラーゼ(すなわち、鋳型鎖のヌクレオチド塩基の順序に基づいてヌクレオチド鎖を合成するポリメラーゼ)である。DNAポリメラーゼはDNA依存性DNAポリメラーゼであってもよい。好ましいDNA依存性DNAポリメラーゼは鎖置換活性を含まない。鎖置換活性を欠いたDNAポリメラーゼは、第1及び/又は第2の鎖の3’末端を標識し得るが、提供される鋳型DNA分子を伸長することはできないか、又は実質的にできない。DNA依存性DNAポリメラーゼは鎖置換活性を天然に欠いていてもよいか、又は鎖置換活性を欠くように改変されてもよい。鎖置換活性を欠いた好ましいDNA依存性DNAポリメラーゼは、T4、T7及びTaq DNAポリメラーゼのうちの少なくとも1つである。
ポリメラーゼは、T7 DNAポリメラーゼ、T5 DNAポリメラーゼ、T4 DNAポリメラーゼ、Klenow断片DNAポリメラーゼ、及びDNAポリメラーゼIIIなどのうちの少なくとも1つを含んでもよい。ポリメラーゼは熱安定性であってもよく、並びに/又はTaq、Tne、Tma、Pfu、Tfl、Tth、Stoffel断片、VENT(登録商標)及びDEEPVENT(登録商標)DNAポリメラーゼ、KOD、Tgo、JDE3、並びにこれらの突然変異体、バリアント及び誘導体を含んでもよい(例えば米国特許第5,436,149号;米国特許第4,889,818号;米国特許第4,965,185号;米国特許第5,079,352号;米国特許第5,614,365号;米国特許第5,374,553号;米国特許第5,270,179号;米国特許第5,047,342号;米国特許第5,512,462号;国際公開第92/06188号;国際公開第92/06200号;国際公開第96/10640号;Barnes,W.M.、Gene 112:29~35頁(1992);Lawyer,E.C.ら、PGR Meth. Appl.2:275~287頁(1993);Elaman,J.-Mら、Nuc. Acids Res.22(15):3259~3260頁(1994)を参照;これらの各々は参照により組み込まれる)。
任意選択で、DNAポリメラーゼは3’エキソヌクレアーゼ活性を欠いている。DNAポリメラーゼはバクテリオファージからのものであり得る。バクテリオファージDNAポリメラーゼは一般に5’→3’エキソヌクレアーゼ活性を欠いているが、これはこの活性が別々のポリペプチドによりコードされるためである。好適なDNAポリメラーゼの例は、T4、T7、及びphi29 DNAポリメラーゼである。
代替的に又は追加的に、DNAポリメラーゼは古細菌ポリメラーゼである。古細菌において同定されている2つの異なるクラスのDNAポリメラーゼがある:1.ファミリーB/pol I型(パイロコッカス・フリオサス(Pyrococcus furiosus)からのPfuのホモログ)及び2.pol II型(P.フリオサスDP1/DP2 2サブユニットポリメラーゼのホモログ)。両方のクラスからのDNAポリメラーゼは、関連付けられる5’→3’エキソヌクレアーゼ活性を天然に欠いていること及び3’→5’エキソヌクレアーゼ(プルーフリーディング)活性を有することが示されている。好適なDNAポリメラーゼ(pol I又はpol II)は、所望されるアッセイ温度に類似した最適増殖温度を有する古細菌に由来することができる。
熱安定性古細菌DNAポリメラーゼは、パイロコッカス(Pyrococcus)種(フリオサス(furiosus)、種GB-D、オエシー(woesii)、アビシー(abysii)、ホリコシー(horikoshii));サーモコッカス(Thermococcus)種(コダカラエンシス(kodakaraensis) KODl、リトラリス(litoralis)、種9 degrees North-7、種JDE-3、ゴルゴナリウス(gorgonarius))、パイロディクティウム・オカルタム(Pyrodictium occultum)、及びアーケオグロブス・フルギダス(Archaeoglobus fulgidus)から単離され得る。
DNAポリメラーゼは真正細菌種から得られてもよい。3つのクラスの真正細菌DNAポリメラーゼ、pol I、II、及びIIIがある。Pol I DNAポリメラーゼファミリーの酵素は5’→3’エキソヌクレアーゼ活性を有し、ある特定のメンバーはまた3’→5’エキソヌクレアーゼ活性を呈する。Pol II DNAポリメラーゼは5’→3’エキソヌクレアーゼ活性を天然に欠いているが、3’→5’エキソヌクレアーゼ活性を呈する。Pol III DNAポリメラーゼは、細胞の主要な複製性DNAポリメラーゼであり、複数のサブユニットから構成される。pol III触媒サブユニットは5’→3’エキソヌクレアーゼ活性を欠いているが、一部の場合において、3’→5’エキソヌクレアーゼ活性が同じポリペプチド中に位置する。
様々な商業的に入手可能なPol I DNAポリメラーゼがあり、その一部は、5’→3’エキソヌクレアーゼ活性を低減又は消失させるために改変されている。
好適な熱安定性pol I DNAポリメラーゼは、サーマス(Thermus)種及びサーモトガ・マリティマ(Thermotoga maritima)、例えばサーマス・アクアティカス(Thermus aquaticus)(Taq)、サーマス・サーモフィラス(Thermus thermophilus)(Tth)及びサーモトガ・マリティマ(Thermotoga maritima)(Tma UlTma)を含む、様々な好熱性真正細菌から単離され得る。
好ましいDNA依存性DNAポリメラーゼは原核性又は真核性DNA依存性DNAポリメラーゼであってもよい。好ましい原核性DNA依存性DNAポリメラーゼは、Pol I、Pol II及びPol IIIからなる群から選択される。好ましい真核性DNA依存性DNAポリメラーゼは、Pol a、Pol b、Pol g、Pol d、Pol e、及びPol zからなる群から選択される。
好ましくは、DNAポリメラーゼはRNA依存性DNAポリメラーゼ又は「逆転写酵素」である。本発明は、任意の種類の特有の逆転写酵素(RT)に限定されない。特に、逆転写酵素は、二本鎖DNA分子の3’末端を伸長することが可能である任意の天然に存在する又は組換えタンパク質であってもよい。逆転写酵素は、好ましくは、鋳型RNAを使用してヌクレオチドの特有の配列を分子の3’末端に付加する、すなわちRNA依存性DNAポリメラーゼである。逆転写酵素は、例えばBaranauskasら(Protein Eng Des Sel、2012;25(10):657~68頁);Arezi B及びHogrefe H(Nucleic Acids Res、2009;37(2):473~81頁)に記載されている、増加した忠実性、熱安定性、処理能力及びDNA-RNA基質親和性のうちの少なくとも1つを有するように改変された天然に存在するタンパク質、並びに/又は、例えばKotewiczら(Nucleic Acids Res、1988;16(1):265~277頁)に記載されている、リボヌクレアーゼH活性を欠いた逆転写酵素であってもよい。本発明における使用のための逆転写酵素は中温性又は好熱性であってもよい。
本発明の方法における使用のための逆転写酵素は、ウイルス、好ましくはレトロウイルスに由来してもよい。逆転写酵素は、Superscript II逆転写酵素、Maxima逆転写酵素、Protoscript II逆転写酵素、モロニーマウス白血病ウイルス逆転写酵素(MMLV-RT)、HighScriber逆転写酵素、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、ヒト免疫不全ウイルス1型逆転写酵素、ヒトT細胞白血病ウイルス1型逆転写酵素(HTLV-1-RT)、ウシ白血病ウイルス逆転写酵素(BLV-RT)及びラウス肉腫ウイルス逆転写酵素(RSV-RT)からなる群から選択されてもよい。好ましくは、逆転写酵素は、M-MLV RT(モロニーマウス白血病ウイルスに由来する)、HIV-1 RT(ヒト免疫不全ウイルス1型に由来する)、AMV RT(トリ骨髄芽球症ウイルスに由来する)、これらのバリアント、及びこれらの操作されたバージョンからなる群から選択される。逆転写酵素は、1つ又は複数の点突然変異を有するMMLV-RTであってもよい。好ましいMMLV-RT点突然変異は、例えばAnzaloneら(上掲)に記載されている、D200N、L603W、T330P、T306K及びW313Fからなる群から選択されてもよい。
任意選択で、逆転写酵素は、サッカロミセス(Saccharomyces)を含む、酵母、ニューロスポラ(Neurospora)、ドロソフィラ(Drosophila);霊長動物;及び齧歯動物から得ることが可能である。例えば、Weissら、米国特許第4,663,290号(1987);Gerard,G.R.、DNA:271~79頁(1986);Kotewicz,M.L.ら、Gene 35:249~58頁(1985);Tanese,N.ら、Proc.Natl.Acad.Sci.(USA):4944~48頁(1985);Roth,M.J.ら、J.Biol.Chem.260:9326~35頁(1985);Michel,F.ら、Nature 316:641~43頁(1985);Akins,R.A.ら、Cell 47:505~16頁(1986)、EMBO J.4:1267~75頁(1985);及びFawcett,D.F.、Cell 47:1007~15頁(1986)(これらの各々は参照により本明細書に全体が組み込まれる)を参照。
本発明における使用のための例示的な逆転写酵素は、以下を含むが、これらに限定されない:モロニーマウス白血病ウイルス(M-MLV);ヒト免疫不全ウイルス(HIV)逆転写酵素、及び、ラウス肉腫ウイルス(RSV)逆転写酵素を含むがこれに限定されない、トリ肉腫-白血症ウイルス(ASLV)逆転写酵素。トリ骨髄芽球症ウイルス(AMV)逆転写酵素、トリ赤芽球症ウイルス(AEV)、ヘルパーウイルスMCAV逆転写酵素、トリ骨髄球腫症ウイルスMC29ヘルパーウイルスMCAV逆転写酵素。トリ細網内皮症ウイルス(REV-T)ヘルパーウイルスREV-A逆転写酵素、トリ肉腫Vims UR2ヘルパーウイルスUR2AV逆転写酵素。トリ肉腫ウイルスY73ヘルパーウイルスYAV逆転写酵素、ラウス関連ウイルス(RAV)逆転写酵素、骨髄芽球症関連ウイルス(MAV)逆転写酵素、ネコ白血病ウイルス逆転写酵素、カリフラワーモザイクウイルス逆転写酵素、クレブシエラ(Klebsiella)肺炎逆転写酵素、エシェリヒア・コリ(Escherichia Coli)逆転写酵素、バシラス・サブチリス(Bacillus Subtilis)逆転写酵素、ユーバクテリウム・レクタレ(Eubacterium Rectale)逆転写酵素及びゲオバチラス・ステアロサーモフィラス(Geobacillus stearothermophilus)逆転写酵素。
逆転写酵素は、野生型逆転写酵素のバリアントであってもよく、これは好ましくは、1つ又は複数の酵素活性(例えば、RNA依存性DNAポリメラーゼ活性、RNase H活性、若しくはDNA/RNAハイブリッド結合活性)及び/又は酵素特性(例えば、熱安定性、処理能力、若しくは忠実性)に影響するか又はそれを変化させる突然変異を含む。追加的に又は代替的に、逆転写酵素(RT)は、RTをほぼ安定にする、凝集(aggregration)する傾向をより低くする、並びに/又は精製及び/若しくは検出、及び/若しくは他の特性若しくは特徴の改変を促す1つ又は複数の突然変異を含んでもよい。
好ましくは逆転写酵素は高い忠実性を有し、好ましくは、合成される15,000個のヌクレオチド中で1個未満のエラーであるエラー率を有する。
方法における使用のためのCRISPR-ヌクレアーゼ、好ましくは本明細書において定義されているCRISPR-ヌクレアーゼ、及び逆転写酵素、好ましくは本明細書において定義されている逆転写酵素は別々の実体であってもよい、すなわち別々のタンパク質であることが本明細書において理解される。代替的に、本発明の方法において使用されるCRISPR-ヌクレアーゼ及び逆転写酵素、好ましくは本明細書において定義されているCRISPRヌクレアーゼ及び/又は逆転写酵素は、融合して一緒になっている、すなわち融合タンパク質を構成する。好ましくは、逆転写酵素は、好ましくはCRISPRヌクレアーゼと逆転写酵素との間のリンカー、好ましくは柔軟性リンカーを使用して、CRISPR-ヌクレアーゼのC末端に融合している。
鋳型RNA分子
鋳型RNA分子は、逆転写酵素が標的核酸断片の遊離3’末端を標識することを可能にする任意のRNA分子であり得る。この目的のために、鋳型RNA分子は、逆転写酵素を標的核酸断片の遊離3’末端に方向付けてもよく、好ましくは遊離3’末端への追加のヌクレオチドの付加のための鋳型として機能する。
鋳型RNA分子のサイズは様々であり得、標的核酸断片の3’末端に付加されるヌクレオチドの数に依存し得る。鋳型RNA分子のサイズは、好ましくは、約5~500nt、10~250nt、15~200nt、20~150nt、25~100nt、又は約30~50ntである。鋳型RNA分子のサイズは、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40個又はより多くのヌクレオチドであり得る。
本発明の方法における使用のための鋳型RNAは好ましくは結合ドメイン及び鋳型ドメインを含む。鋳型RNA分子は、結合ドメイン及び鋳型ドメインからなるものであってもよい。好ましくは、結合ドメインは鋳型RNA分子の3’末端に位置し、及び鋳型ドメインは鋳型RNA分子の5’末端に位置する。
結合ドメインは二本鎖核酸分子に結合又は「ハイブリダイズ」し、逆転写酵素を標的核酸断片の遊離3’末端に方向付けることができる。結合ドメインのサイズは、鋳型ドメインのサイズに等しいか、又は実質的に等しいものであり得る。鋳型RNAの結合ドメインは、好ましくは、鋳型RNAを二本鎖核酸分子にハイブリダイズさせるために十分な数のヌクレオチドを含む。結合ドメインのサイズは、好ましくは、約5~200nt、8~100nt、10~50nt、12~50nt、14~30nt、又は約15~20ntである。鋳型RNA分子の結合ドメインのサイズは、好ましくは、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25個又はより多くのヌクレオチドである。鋳型RNA分子の結合ドメインは、好ましくは、標的核酸断片の第1又は第2の鎖の3’末端における配列にアニールできる配列を含む。それゆえ、結合ドメインのヌクレオチド配列は好ましくは標的核酸断片中の配列に相補的である。ヌクレオチド配列は、好ましくは、標的核酸断片の遊離3’末端の上流に位置する、好ましくはすぐ上流に位置する配列に相補的である。好ましくは、結合ドメインのヌクレオチド配列は、標的核酸の遊離3’末端の上流に位置する、好ましくはすぐ上流に位置する配列に少なくとも60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%又は100%相補的である。換言すれば、標的核酸断片の第1の鎖の遊離3’末端を標識するために使用される鋳型RNA分子の結合ドメインは、好ましくは、標的核酸断片の第2の鎖の生成される5’末端のすぐ3’に位置する配列と少なくとも60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%又は100%の配列同一性を有する配列を含む。代替的に又は追加的に、標的核酸断片の第2の鎖の遊離3’末端を標識するために使用される鋳型RNA分子の結合ドメインは、好ましくは、標的核酸断片の第1の鎖の生成される5’末端のすぐ3’に位置する配列と少なくとも60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%又は100%の配列同一性を有する配列を含む。標的RNA分子の結合ドメインのヌクレオチド配列は、crRNA中の配列に部分的に又は完全に相補的な配列を含んでもよい。結合ドメインは、本明細書において定義されているCRISPR-ヌクレアーゼ複合体をガイドするために使用されるcrRNAの配列に部分的に又は全体的に相補的な約10、11、12、13、14、15、16、17、18、19又は20個のヌクレオチドの配列を含んでもよい。鋳型RNAの結合ドメインにより結合又は「標的化」され得る配列は、二本鎖核酸分子中に1回存在してもよい。代替的に、配列は、少なくとも2、3、4、5、10回又はより多くの回数存在してもよい。
結合ドメインに加えて、鋳型RNA分子はまた、好ましくは、結合ドメインに隣接する、好ましくは直接的に隣接する鋳型ドメインを含む。鋳型ドメインは、逆転写酵素のための鋳型として機能することにより標的核酸断片の遊離3’末端における1つ又は複数のヌクレオチドの付加を補助する。鋳型ドメインの配列は、そのため、標的核酸断片の遊離3’末端に付加されるヌクレオチドの配列及び数を決定する。新たに付加されるヌクレオチドの配列は、鋳型ドメインの配列の逆相補体であってもよい。鋳型ドメインのサイズは、好ましくは、約1~200nt、5~100nt、10~50nt、12~40nt、14~30nt、又は約15~20ntである。鋳型RNA分子の鋳型ドメインのサイズは、好ましくは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25個又はより多くのヌクレオチドである。RNA分子の鋳型ドメインは、好ましくはシークエンシングプライマー結合部位、増幅プライマー結合部位、バーコード及びUMI、又はこれらの組合せからなる群から選択される、機能性ドメインを含むか又はからなるものであってもよい。鋳型ドメインはシークエンシングプライマー結合部位及びバーコードを含んでもよい。代替的に又は追加的に、鋳型ドメインは、バーコード及びUMIのうちの少なくとも1つに加えて、増幅プライマー結合部位及びシークエンシングプライマー結合部位のうちの少なくとも1つを含んでもよい。好ましくは(増幅及び/又はシークエンシング)プライマー結合部位は、鋳型RNAの鋳型ドメイン中のバーコードの5’に位置する。好ましくは(増幅及び/又はシークエンシング)プライマー結合部位は、鋳型RNAの鋳型ドメイン中のUMIの5’に位置する。好ましくは、鋳型ドメインは、5’から3’方向に、増幅プライマー結合部位、シークエンシングプライマー結合部位並びにバーコード及び/又はUMIを含む。
鋳型RNAは、5’から3’方向に以下の順序のエレメント:(増幅及び/又はシークエンシング)プライマー結合部位、バーコード、並びに結合ドメインを含んでもよく、プライマー結合部位及びバーコードは鋳型ドメイン中に含まれる。
代替的に又は追加的に、鋳型RNAは、5’から3’方向に以下の順序のエレメント:(増幅及び/又はシークエンシング)プライマー結合部位、UMI、並びに結合ドメインを含んでもよく、プライマー結合部位及びUMIは鋳型ドメイン中に含まれる。
鋳型RNA分子及びガイドRNAは別々の実体であってもよい。好ましくは、鋳型RNA及びcrRNA、及び任意選択でtracrRNAは別々のRNA分子である。非限定的な例として、核酸分子を含む複数の試料がステップa)において提供され、ステップb)において、同じガイドRNAを使用することにより二本鎖切断が各々の核酸分子中の同じ位置において生成される。ステップd)において複数の試料はその後に複数の鋳型RNA分子により接触されてもよく、例えば各々の鋳型RNA分子は各々の核酸分子の遊離3’末端において独特の標識を生成する。
代替的に、鋳型RNA分子及びガイドRNA分子は共有結合しており、すなわち単一のRNA分子を形成する。好ましくは、鋳型RNA分子はRNA分子の3’末端に位置し、及びガイドRNAはRNA分子の5’末端に位置する。鋳型RNAは、単一の分子中のガイドRNAに直接的に隣接して位置してもよい。代替的に、鋳型RNAは、1つ又は複数の、天然に存在する又は天然に存在しない、ヌクレオチドによりガイドRNAから分離されていてもよい。
任意選択で、複数の試料は、好ましくは別々の反応容器中で、ステップa)~e)において並列で処理される。
RNA分子の化学修飾
本発明の方法において使用されるRNA分子は、ガイドRNA及び鋳型RNAのうちの少なくとも1つを含む。ガイドRNAは、sgRNA、crRNA及びtracrRNAのうちの少なくとも1つを含んでもよい。鋳型RNAはガイドRNAに融合していてもよい。
本発明の方法において使用されるRNA分子のうちの少なくとも1つは、修飾されていない又は天然に存在するヌクレオチドを含むか又はからなるものであってもよい。任意選択で、本発明の方法において使用されるすべてのRNA分子は、修飾されていない又は天然に存在するヌクレオチドを含むか又はからなるものであってもよい。
代替的に又は追加的に、本発明の方法において使用されるRNA分子のうちの少なくとも1つは、修飾された又は天然に存在しないヌクレオチドを含むか又はからなるものであってもよい。任意選択で、本発明の方法において使用されるすべてのRNA分子は、修飾された又は天然に存在しないヌクレオチドを含むか又はからなるものであってもよい。そのような化学的に修飾されたヌクレオチドは、好ましくは、RNA分子、又は分子を分解から保護する。任意選択で、RNA分子のうちの少なくとも1つは、すなわち少なくともガイドRNA及び鋳型RNAのうちの少なくとも1つは、リボヌクレオチド及び非リボヌクレオチドを含む。RNA分子のうちの少なくとも1つは、1つ又は複数のリボヌクレオチド及び1つ又は複数のデオキシリボヌクレオチドを含んでもよい。
任意選択で、RNA分子のうちの少なくとも1つは、すなわち少なくともガイドRNA及び鋳型RNAのうちの少なくとも1つは、1つ又は複数の天然に存在しないヌクレオチド又はヌクレオチドアナログ、例えばホスホロチオエート連結を有するヌクレオチド、リボース環の2’炭素と4’炭素との間にメチレンブリッジを含むロックド核酸(LNA)ヌクレオチド、ブリッジド核酸(BNA)、2’-O-メチルアナログ、2’-デオキシアナログ、2’-フルオロアナログ又はこれらの組合せを含む。修飾されたヌクレオチドは、2-アミノプリン、5-ブロモ-ウリジン、シュードウリジン、イノシン、及び7-メチルグアノシンからなる群から選択されるが、これらに限定されない、修飾された塩基を含んでもよい。
RNA分子のうちの少なくとも1つ、すなわちガイドRNA及び鋳型RNAのうちの少なくとも1つは、1つ又は複数の末端ヌクレオチドにおける2’-O-メチル(M)、2’-O-メチル3’ホスホロチオエート(MS)、2’-O-メチル3’チオPACE(ホスホノアセテート)(MSP)、又はこれらの組合せの組込みにより化学的に修飾されていてもよい。そのような化学的に修飾されたRNAは、非修飾のRNAと比較して増加した安定性及び/又は増加した活性を含むことができる。(Hendelら、2015、Nat Biotechnol.33(9);985~989頁)。本発明の一実施形態において、デオキシリボヌクレオチド及び/又はヌクレオチドアナログは、操作されたRNA構造中に組み込まれ得る。
一実施形態において、第1の及び任意選択で第2の標識された鎖は、前記標識(複数可)がさらなる処理、例えば増幅及び/又はシークエンシングのために要求される機能性ドメイン、例えば増幅及び/又はシークエンシングプライマー結合部位を含む場合にそのようなさらなる処理、例えば増幅及び/又はシークエンシングのための鋳型(複数可)として直接的に役立ち得る。別の実施形態において、前記第1の及び任意選択で第2の標識された鎖は、以下において本明細書にさらに指し示されているさらなる処理、例えば増幅及び/又はシークエンシングのためにそのような機能性ドメインを導入するために最初に伸長及び/又はアニールされる。任意選択の実施形態において、標識された鎖は、機能的なエレメント、例えばUMI及び/又は(試料)バーコードを含む1つ又は複数のテイルドプライマーを使用して増幅される。追加的に又は代替的に、前記1つ又は複数のテイルドプライマーは、結果としてもたらされる(バーコード付加された)アンプリコンをシークエンシングするために1つ又は複数のシークエンシングプライマー結合部位を含んでもよい。
オリゴヌクレオチドのアニーリング - ステップf)
本発明の方法は、生成された標識をさらに伸長するステップを含んでもよい。そのような伸長は、そのため、標的核酸断片に取り付けられた標識のサイズをさらに増加させてもよい。好ましくは、このさらなる伸長ステップは、本明細書に詳述されているステップc)及び/又はステップe)において生成された標識を使用する。
このステップは任意の特定の方法に限定されず、当業者は、標的核酸断片をさらに伸長する任意の従来の方法を使用することができる。好ましくは、このさらなる伸長ステップは、
i)標的核酸断片を増幅することであって、増幅プライマーのうちの少なくとも1つが、生成された標識に少なくとも部分的にアニールする、増幅すること;及び
ii)標的核酸断片の鎖の標識された3’末端にオリゴヌクレオチドをアニールすること
のうちの少なくとも1つを含んでもよい。
標的核酸断片をさらに伸長する前に、RNA分子、例えば鋳型RNA及び/又はガイドRNAは分解されてもよい。そのため標的核酸断片の標識をさらに伸長する前に、鋳型RNA及びガイドRNAのうちの少なくとも1つは分解されてもよい。本発明は任意の特定のRNA分解ステップに限定されず、当業者は、RNAを分解するために任意の従来の手段を使用することができる。RNAは、好ましくは、リボヌクレアーゼ(RNAse)、好ましくはエンドヌクレアーゼ、以下に限定されないが例えばRNAse Hを使用して分解される。好ましくは、RNAはRNAse Hを使用して分解される。RNA分解は、好ましくは、RNAseがガイドRNA及び鋳型RNAのうちの少なくとも1つを分解することが可能である実験条件下で、すなわちRNAseが酵素活性を示す実験条件下で行われる。そのような実験条件は当業者に周知であり、及び/又は任意の従来の手段を使用して決定され得る。当業者に公知のように、これらの実験条件はRNAseの種類に依存し得る。実験条件は、以下の実験セクションに記載される条件と同じ又は類似したものであり得る。
核酸断片の増幅のためのプライマーは、標識の少なくとも部分にのみハイブリダイズし得るか、又はプライマーのうちの少なくとも1つは、標識の少なくとも部分及び標的核酸断片の1つ若しくは複数のヌクレオチドの両方にハイブリダイズし得る。それゆえ、プライマーのうちの少なくとも1つは選択的な増幅のために使用されてもよい。
任意選択で、増幅プライマーのうちの少なくとも1つは、好ましくは制限部位ドメイン、捕捉ドメイン、シークエンシングプライマー結合部位、増幅プライマー結合部位、検出ドメイン、バーコード配列、転写プロモータードメイン及びPAM配列、又はこれらの任意の組合せからなる群から選択される、機能性ドメインを含んでもよい。バーコードは試料バーコードであり得るが、これに限定されない。
標識は、第1のオリゴヌクレオチドを、標的核酸断片の第1の鎖の標識された3’末端にアニールすることによりステップf)において伸長されてもよい。オリゴヌクレオチドは、好ましくは、標的核酸断片の第1の鎖の標識された3’末端に特異的にハイブリダイズする。ステップf)は、第2の鎖の標識された3’末端に第2のオリゴヌクレオチドをアニールすることをさらに含んでもよい。例えば第1の鎖の3’末端における標識の配列が第2の鎖の3’末端における標識のヌクレオチド配列に同一、又はほぼ同一である場合に、同じオリゴヌクレオチドは、第1の鎖の3’末端における標識及び第2の鎖の3’末端における標識の両方にアニールし得る。代替的に、第1の鎖の標識された3’末端にアニールするオリゴヌクレオチドは、通常のハイブリダイズ条件下で第2の鎖の、任意選択で標識された3’末端にアニールすることが可能でない。同様に、第2の鎖の標識された3’末端にアニールするオリゴヌクレオチドは、通常のハイブリダイズ条件下で第1の鎖の、任意選択で標識された3’末端にアニールすることが可能でない。そのため好ましくは、異なるオリゴヌクレオチドが標的核酸断片の各々の側においてアニールされ得るような程度まで第1の鎖の3’末端における標識の配列は第2の鎖の3’末端における標識のヌクレオチド配列とは異なる。そのため生成された標識の配列を変更することにより、特異的なオリゴヌクレオチドは標的核酸断片にアニールすることができる。
第1の鎖の標識された3’末端にアニールするオリゴヌクレオチドの配列は、第2の鎖の標識された3’末端にアニールするオリゴヌクレオチドの配列と同一であってもよい。この実施形態において、第1の鎖の3’末端を伸長する標識の配列はそのため、第2の鎖の3’末端を伸長する標識の配列と好ましくは同一、又はほぼ同一である。
任意選択で、第1の鎖の標識された3’末端にアニールするオリゴヌクレオチドの配列は、生成された標識にアニールできるオリゴヌクレオチドの部分の例外と共に、第2の鎖の標識された3’末端にアニールするオリゴヌクレオチドの配列と同一であってもよい。この実施形態において、第1の鎖の3’末端を伸長する標識の配列はそのため、第2の鎖の3’末端を伸長する標識の配列とは異なる。
代替的に、第1の鎖の3’末端において標識を伸長する配列及び第2の鎖の3’末端において標識を伸長する配列は1つ又は複数のヌクレオチドで異なる。
例えば、各々のDNA試料の特異的な標識を設計すること、並びに/又は各々の標的核酸断片の特異的な標識、及び/若しくは単一の標的核酸断片の各々の部位の特異的な標識、例えば第1の鎖の3’末端において生成される特異的な標識及び単一の標的核酸断片の相補鎖の3’末端において生成される別の標識を作り出すことが可能であることが本明細書において理解される。それゆえ、本明細書に詳述されている方法は、生成された標識が実験の特定の必要性に直接的にカスタマイズされ得る多用途のプラットフォームを提供する。
本発明の方法における使用のためのオリゴヌクレオチドは、好ましくは、ステップc)及び/又はステップe)において生成された標識にハイブリダイズ又は「アニール」できる少なくとも1つのドメインを有する。このドメインは、好ましくは、鋳型RNA分子の鋳型ドメインと同じ、又は実質的に同じ、配列を有する。任意選択で、オリゴヌクレオチドは、標識にハイブリダイズ又はアニールする前記ドメインからなる。代替的に、オリゴヌクレオチドは、好ましくは制限部位ドメイン、捕捉ドメイン、シークエンシングプライマー結合部位、増幅プライマー結合部位、検出ドメイン、バーコード配列、転写プロモータードメイン及びPAM配列、又はこれらの任意の組合せからなる群から選択される、さらなる機能性ドメイン又は「テイル」を含む。好ましくは、オリゴヌクレオチドは、UMI、バーコード及びプライマー結合部位のうちの少なくとも1つを含む。バーコードは、試料バーコード、又は固有分子識別物(UMI)であり得るが、これらに限定されない。前記さらなる機能性ドメイン又は「テイル」は、ステップc)及び/又はステップe)において生成された標識にハイブリダイズ又はアニールしないオリゴヌクレオチドの部分として本明細書において理解されるべきである。任意選択で、第1及び第2のオリゴヌクレオチドは機能性ドメインを含む。第1及び第2のオリゴヌクレオチド中に位置する機能性ドメイン(複数可)は、同じ機能性ドメイン又は異なる機能性ドメインであってもよい。機能性ドメイン及びこれらのドメインの位置は、第1及び第2の標識中に任意選択で位置する機能性ドメインについて本明細書において上記されたものと同じであってもよい。非限定的な例として、第1及び第2のオリゴヌクレオチド中に位置する機能性ドメインは、増幅及び/又はシークエンシングのために使用されてもよく、例えば第1のオリゴヌクレオチド中に位置するバーコード及び第2のヌクレオチド中に位置するバーコードは一緒になってコンビナトリアルバーコードを形成してもよい。
任意選択で、標識にハイブリダイズ又はアニールするドメインは、一本鎖標識の長さと同じ長さを有する。標識へのオリゴヌクレオチドのアニーリングはそのため二本鎖標識を結果としてもたらす。
任意選択で、標識にハイブリダイズ又はアニールするドメインは、一本鎖標識の長さよりも長い1つ又は複数のヌクレオチドである。標識へのオリゴヌクレオチドのアニーリングは、1つ又は複数のヌクレオチドの一本鎖オーバーハング、好ましくはA-又はT-オーバーハングを結果としてもたらす。同様に、オリゴヌクレオチドは、一本鎖標識よりも短い1つ又は複数のヌクレオチドであってもよい。標識へのオリゴヌクレオチドのアニーリングは、反対鎖の1つ又は複数のヌクレオチドの一本鎖オーバーハング、好ましくはA-又はT-オーバーハングを結果としてもたらす。
任意選択で、標識にハイブリダイズ又はアニールするドメインは、標識よりも実質的に短く、充填又はPCR反応が、二本鎖標識を生成するために使用される。
好ましくは、オリゴヌクレオチドは、一本鎖アダプター、好ましくは本明細書において上記に定義されているアダプターである。アニールされたオリゴヌクレオチドは、部分的に又は全体的に二本鎖の配列に変換され得る。前記二本鎖配列は二本鎖アダプターであり得る。アダプターは、シークエンシングアダプターであってもよいか、又はそれにライゲートされてもよく、例えばRoche 454A及び454Bシークエンシング、ILLUMINA(商標)SOLEXA(商標)シークエンシング、Applied BiosystemsのSOLID(商標)シークエンシング、Pacific BiosciencesのSMRT(商標)シークエンシング、Pollonator Polonyシークエンシング、Oxford Nanopore Technologies又はComplete Genomicsシークエンシングを可能とする機能性ドメインを含む。
任意選択で、生成された1つ又は複数の標識にアニールするオリゴヌクレオチドは、部分的に又は全体的に二本鎖の構造を有することができ、例えばヘアピン又はステムループ構造を形成する。
代替的に又は追加的に、部分的に又は全体的に二本鎖の核酸分子は、生成された1つ又は複数の標識にアニールされてもよい。そのような二本鎖核酸は、二本鎖アダプター、又はクローニングプラスミドであってもよい。二本鎖アダプター又はクローニングプラスミドは、好ましくは、生成された標識にハイブリダイズできる一本鎖オーバーハングを含む。オーバーハングは好ましくは3’-オーバーハングである。二本鎖アダプター、又はクローニングプラスミドの他の末端、好ましくは5’末端は、好ましくは、生成された標識にハイブリダイズすることができない。追加的に又は代替的に、二本鎖アダプター、又はクローニングプラスミドの他の末端、好ましくは5’末端は、二本鎖アダプター若しくはクローニングプラスミドの3’末端にライゲートされることができず、及び/又は別のアダプターにライゲートされることができない。換言すれば、好ましくは二本鎖アダプターのオーバーハングは、アダプター-アダプター-ライゲーションを回避するように設計される。好ましくは、二本鎖アダプター、又はクローニングプラスミドは、生成された標識にライゲートされ得る3’末端、及び平滑末端であるか、又は単一ヌクレオチドオーバーハング、例えばA-オーバーハングを含む5’末端を含む。3’末端におけるオーバーハングは第1の鎖の3’-オーバーハングであってもよい。5’末端におけるオーバーハングは第2の鎖の3’-オーバーハングであってもよい。
オリゴヌクレオチドは、エキソヌクレアーゼ消化から保護する1つ又は複数の化学的部分を含んでもよい。そのような部分は、好ましくは、オリゴヌクレオチドの5’末端部分中に存在する。そのような保護的な部分は、ヌクレアーゼから保護することが当技術分野において公知である、ホスホロチオエートであってもよい。例えば5’末端におけるホスホロチオエートは、5’-3’エキソヌクレアーゼ、例えばT7又はラムダエキソヌクレアーゼによるエキソヌクレアーゼ分解を予防する。オリゴヌクレオチドの5’末端は、少なくとも1、2、3、4、5、6、7、8、9又は10個のホスホロチオエート(PS)結合を含んでもよい。PS結合は、オリゴヌクレオチドのリン酸骨格中の非ブリッジ形成性酸素を硫黄原子で代用し、これはヌクレオチド間連結をヌクレアーゼ分解に対して抵抗性とする。代替的に又は追加的に、1つ又は複数の化学的部分は、ステップc)及び/又はステップe)の間に標識中に組み込まれてもよく、前記化学的部分はエキソヌクレアーゼ消化から核酸を保護する。
本発明の方法はそのため、エキソヌクレアーゼ処理のステップをさらに含んでもよい。好ましくはエキソヌクレアーゼ処理は、アニールされたオリゴヌクレオチド及び/又は標識がエキソヌクレアーゼ消化から保護する1つ又は複数の化学的部分を含む場合に本発明の方法において含まれてもよい。代替的に又は追加的に、エキソヌクレアーゼ処理ステップは、ステップc)における逆転写の後及び/又はステップe)の後に含まれてもよい。代替的に又は追加的に、エキソヌクレアーゼステップは、ステップb)における二本鎖核酸分子の切断の後及び/又はステップd)の後に含まれてもよい。好ましくはエキソヌクレアーゼはエキソヌクレアーゼ処理後に不活性化される。非限定的な例として、熱安定性Cas9がステップb)及び/又はステップd)において使用されてもよく、これは好ましくは60℃~75℃の温度において安定なままである。その後のエキソヌクレアーゼ処理ステップは、上昇した温度において不安定な、例えば60℃~75℃の温度において不安定なエキソヌクレアーゼを用いて行われてもよい。好適な温度、例えば室温でのエキソヌクレアーゼ処理後に、温度は、エキソヌクレアーゼを不活性化するが(依然として結合した)熱安定性Cas9を不活性化しないように上昇されてもよく、例えば温度を60℃~75℃に上昇させてもよい。エキソヌクレアーゼを不活性化した後に、その後の逆転写酵素ステップが行われてもよい。
ライゲーション及び/又は充填反応 - ステップg)
本発明の方法は、アニールされたオリゴヌクレオチド(複数可)を標的核酸断片にライゲートする及び/又は一本鎖オーバーハング(複数可)を充填するステップg)をさらに含んでもよい。そのような一本鎖オーバーハング(複数可)は、標的核酸断片の遊離3’末端における標識の付加に起因して及び/又は生成された標識への一本鎖オリゴヌクレオチドのアニーリングに起因して生成されてもよい。
ライゲーションステップは、任意の従来の手段を使用して行われ得る。オリゴヌクレオチドは、任意の従来のリガーゼ酵素を使用して標的核酸断片にライゲートされてもよい。
ライゲーションステップg)は、好ましくは、リガーゼ酵素が、アニールされたオリゴヌクレオチド(複数可)を標的核酸断片にライゲートすることが可能である実験条件下で、すなわちリガーゼが酵素活性を示す実験条件下で行われる。そのような実験条件は当業者に周知であり、及び/又は任意の従来の手段を使用して決定され得る。当業者に公知のように、これらの実験条件はリガーゼの種類に依存し得る。実験条件は、以下の実験セクションに記載される条件と同じ又は類似したものであり得る。
一本鎖オリゴヌクレオチドが、第1の鎖の3’末端において生成された標識にアニールされる場合、オリゴヌクレオチドは第2の鎖の5’末端にライゲートされる。同様に、一本鎖オリゴヌクレオチドが第2の鎖の3’末端において生成された標識にアニールされる場合、オリゴヌクレオチドは第1の鎖の5’末端にライゲートされる。
充填反応、すなわち二本鎖DNA分子を生成する充填反応は、任意の従来の手段を使用して、例えばDNAポリメラーゼを使用して行われ得る。
ステップg)における充填反応は、好ましくは、ポリメラーゼが、アニールされたオリゴヌクレオチド(複数可)により生成された一本鎖オーバーハングを充填することが可能である実験条件下で、すなわちポリメラーゼが酵素活性を示す実験条件下で行われる。そのような実験条件は当業者に周知であり、及び/又は任意の従来の手段を使用して決定され得る。当業者に公知のように、これらの実験条件はポリメラーゼの種類に依存し得る。実験条件は、以下の実験セクションに記載される条件と同じ又は類似したものであり得る。これらの実験条件は、好ましくは、少なくともヌクレオチド、好ましくは天然に存在するヌクレオチドの存在を含み、好ましくはこれらの実験条件は、dNTP、好ましくはアデニン、グアニン、シトシン及びチミジン及び任意選択でウラシルのうちの少なくとも1つの存在を含む。
好ましくは、ライゲーション及び充填ステップは、例えば、DNA修復ミックス、以下に限定されないが例えばNEBNext(登録商標)FFPE DNA Repair mixを使用することにより、単一の反応中に組み合わせられてもよい。
標識にアニール及びライゲートされた一本鎖オリゴヌクレオチド又は少なくとも部分的に二本鎖の核酸は、標的核酸断片のその後の増幅のためにプライマー結合部位を含んでもよい。
代替的に又は追加的に、標識にアニール及びライゲートされたオリゴヌクレオチドは、充填されて二本鎖配列を形成してもよい。代替的に、部分的に又は全体的に二本鎖の核酸分子は、生成された標識にアニール及びライゲートされてもよい。標識を伸長する、任意選択で二本鎖の、配列はアダプターであってもよい。
「伸長された標識」は、本明細書において定義されているステップf)及びg)の後に得ることが可能である標的核酸断片を伸長する配列として本明細書において理解される。文脈に依存して、「標識」という用語はそのため、ステップc)及び/又はステップe)の後に得ることが可能である標識、並びにステップf)及びg)の後に得ることが可能である標識を含むことができる。その後のステップh)においてシークエンシングアダプターは、伸長された標識にライゲートされてもよい。当技術分野において公知の任意の従来のシークエンシングアダプターは、本発明における使用のために好適であり得る。好ましくは、シークエンシングアダプターは、伸長された1つ又は複数の標識の遊離3’及び/又は遊離5’末端にライゲートされ得る末端を含む。シークエンシングアダプターはそのため、好ましくは、伸長された1つ又は複数の標識の遊離3’及び/又は遊離5’末端に適合性の末端を含む。シークエンシングアダプターは、1つ又は複数のヌクレオチドの平滑末端又は一本鎖オーバーハングを含んでもよい。非限定的な例として、伸長された標識の遊離末端が3’-Aオーバーハングを含む場合、シークエンシングアダプターは好ましくは3’-Tオーバーハングを含む。シークエンシングアダプターは、伸長された標識の遊離末端と適合性の1つの末端、並びに伸長された標識及びシークエンシングアダプターのうちの少なくとも1つにライゲートされ得ない1つの末端を含んでもよい。
一実施形態において、任意選択で伸長された、標識は、プロテロメラーゼ認識配列、好ましくはTelNプロテロメラーゼ認識配列を含む。
プロテロメラーゼ認識配列は、DNA鋳型中のその存在が、プロテロメラーゼの酵素活性による閉じた直鎖状DNAへのその変換を可能とする任意のDNA配列である。換言すれば、プロテロメラーゼ認識配列は、共有結合的に閉じた直鎖状DNAを形成するためのプロテロメラーゼによる二本鎖DNAの切断及び再ライゲーションのために要求される。典型的には、プロテロメラーゼ認識配列は、完璧なパリンドローム配列、すなわち2回回転対称性を有する二本鎖DNA配列を含む。
完璧な逆位反復の長さは、特有の生物に依存して異なる。ボレリア・ブルグドルフェリ(Borrelia burgdorferi)において、完璧な逆位反復は14塩基対の長さである。様々な中温性バクテリオファージにおいて、完璧な逆位反復は22塩基対又はより大きい長さである。また、一部の場合、例えばE.コリN15において、中心の完璧な逆位パリンドロームは逆位反復配列により隣接され、すなわちより大きい完璧でない逆位パリンドロームの部分を形成する。
本発明において使用されているプロテロメラーゼ認識配列は、好ましくは、少なくとも14塩基対の長さの二本鎖パリンドローム(完璧な逆位反復)配列を含む。
好ましい完璧な逆位反復配列は、配列NCATNNTANNCGNNTANNATGN(配列番号37)及びそのバリアントを含む。この配列は22塩基コンセンサス配列である。例えば国際公開第2010/086626号に開示されるように、完璧な逆位反復の塩基対はある特定の位置において保存されていると共に、配列における柔軟性は他の位置において可能である。そのため好ましくは、この配列は、本発明の方法におけるプロテロメラーゼとの使用のための完璧な逆位反復配列のための最小コンセンサス配列である。プロテロメラーゼ認識配列は、国際公開第2010/086626号(参照により本明細書に組み込まれる)に記載されている配列を有してもよい。
好ましくは、プロテロメラーゼ認識配列は、配列番号38と少なくとも80%、85%、90%、95%、96%、97%、98%、99%又は100%の配列同一性を有する。配列番号38の配列:
5'-TATCAGCACACAATTGCCCATTATACGCGCGTATAATGGACTATTGTGTGCTGATA-3'
好ましくは、プロテロメラーゼは、認識配列中の28~29位において、任意選択で伸長された、標識を切断し、切断された末端を閉じる。
任意選択で伸長された、標識に導入されたプロテロメラーゼ認識部位がある場合、方法は、標識された標的核酸断片をプロテロメラーゼ、好ましくはTeINプロテロメラーゼと接触させて、末端を切断し及び切断された末端を共有結合的に閉じて、閉じた末端を含む標的核酸断片を結果としてもたらすステップをさらに含んでもよい。
一実施形態において、標的核酸断片は、プロテロメラーゼ認識部位を有する単一の標識、すなわち第1の鎖の3’末端のみにおける又は第2の鎖の3’末端のみにおける標識を含む。二本鎖標識を生成した後に、プロテロメラーゼは標的核酸断片の1つの末端を切断し、及び閉じる。任意選択で標識された、標的核酸断片の他の末端は開いたままである。非限定的な例として、シークエンシングアダプターは、この開いた末端にアニール及び/又はライゲートされ得る。
別の実施形態において、標的核酸断片は、3’末端における標識及び5’末端における標識を含み、両方の標識はプロテロメラーゼ認識部位を含む。二本鎖標識の生成後に、プロテロメラーゼは、標的核酸断片の両方の末端を切断し、及び閉じることができる。閉じた核酸断片はエキソヌクレアーゼ分解から保護される。
本発明における使用のための好ましいプロテロメラーゼはバクテリオファージプロテロメラーゼである。プロテロメラーゼは、ハロモナス・アクアマリナ(Halomonas aquamarina)からのphiHAP-1、エルシニア・エンテロリティカ(Yersinia enterolytica)からのPY54、クレブシエラ・オキシトカ(Klebsiella oxytoca)からのphiKO2、ビブリオ(Vibrio)属菌からのVP882及びエシェリヒア・コリからのNl 5、又はこれらのいずれかのバリアントからなる群から選択され得る。プロテロメラーゼは、国際公開第2010/086626号(参照により本明細書に組み込まれる)に開示されているアミノ酸配列を有してもよい。
バクテリオファージNl 5(TeIN)プロテロメラーゼ又はそのバリアントの使用は特に好ましい。好ましいプロテロメラーゼは、配列番号39と少なくとも80%、85%、90%、95%、96%、97%、98%、99%又は100%の配列同一性の配列を有する。バリアントは、そのホモログ又は突然変異体を含む。突然変異体は、ネイティブな配列に関して切断、置換又は欠失を含む。バリアントは、好ましくは、本明細書において上記されているプロテロメラーゼ認識配列を含む鋳型から閉じた直鎖状DNAを生成する。
任意選択で、試料は、標識された標的核酸断片をプロテロメラーゼと接触させた後にエキソヌクレアーゼに曝露される。閉じた標的核酸断片はエキソヌクレアーゼ消化から保護され、閉じていない非標的核酸断片は分解される。
本発明の方法は、標的核酸断片、任意選択でそのサブセットが、第1のプログラム可能なヌクレアーゼ又は第1の制限エンドヌクレアーゼにより切断され、好ましくはプログラム可能なヌクレアーゼがRNAにガイドされるCRISPRヌクレアーゼであり、任意選択でアダプターがライゲート又はアニールされる開いた核酸断片を得るステップをさらに含んでもよい。
シークエンシング方法 - ステップ(i)、(ii)及び(iii)
さらなる態様において、本発明の方法は、1つ又は複数の標的核酸断片をシークエンシングする方法に関する。シークエンシング方法は好ましくはディープシークエンシング方法である。シークエンシング方法は、好ましくは、
本明細書において定義されている1つ又は複数の標識された標的核酸断片を得るステップ;及び
1つ又は複数の標的核酸断片の配列の少なくとも部分を決定するステップ
を少なくとも含む。
一実施形態において、1つ又は複数の標的核酸断片をシークエンシングする方法は、
(i)a)二本鎖核酸分子を含む試料を提供するステップであり、二本鎖核酸分子が目的の配列を含む、ステップ;
b)二本鎖核酸分子を部位特異的ヌクレアーゼと接触させて二本鎖切断を生成するステップであり、二本鎖切断が標的核酸断片の第1の鎖の遊離3’末端を結果としてもたらす、ステップ;
c)切断された核酸分子を逆転写酵素及び鋳型RNA分子と接触させ、それにより、1つ又は複数のヌクレオチドで標的核酸断片の第1の鎖の遊離3’末端を標識するステップであり、任意選択でステップb)における部位特異的ヌクレアーゼ及びステップc)における逆転写酵素が別々の実体である、ステップ
により1つ又は複数の標識された標的核酸断片を得るステップ;並びに
(iii)1つ又は複数の標的核酸断片の配列の少なくとも部分を決定するステップ
を含む。
それゆえ、ステップ(i)における標識された標的核酸断片は、本明細書に詳述されている少なくともステップa)、b)及びc)を行うことにより得られてもよい。ステップ(i)の標識された標的核酸断片は、
ステップa)、b)、及びc);
ステップa)、b)、c)、d)及びe);
ステップa)、b)、d)、c)及びe);
ステップa)、b)、c);f)、及び任意選択でステップg)
ステップa)、b)、c)、d)及びe);f)、及び任意選択でステップg);並びに/又は
ステップa)、b)、d)、c)及びe);f)、及び任意選択でステップg)
を行うことにより得られてもよい。
ステップb)及びd)は実質的に同時に行われてもよく、並びに/又はステップc)及びe)は実質的に同時に行われてもよいことが本明細書においてさらに理解される。
ステップ(i)において得られる標識された標的核酸断片はそのため、標識された標的核酸断片にアニールされた1つ又は複数のオリゴヌクレオチドを含んでもよい。追加的に、これらのアニールされたオリゴヌクレオチドは、任意選択で標的核酸断片にライゲートされていてもよく、及び/又は二本鎖とされていてもよい。本明細書に詳述されるように、オリゴヌクレオチドは一本鎖又は二本鎖アダプターであってもよい。
シークエンシング方法は、1つ又は複数の標的核酸断片の配列の少なくとも部分を決定するステップをさらに含む。ステップ(i)において得られる標的核酸断片(複数可)は、単分子、リアルタイムシークエンシング反応、例えば、Pacific Biosciences、Menlo Park、CalifからのSMRT(登録商標)Sequencingにおいて使用されてもよい。他のシークエンシング技術の使用もまた想定され、これは例えば、ナノポアシークエンシング(例えば、Oxford Nanopore又はOnteraからのもの)、Solexa(登録商標)シークエンシング(Illumina)、tSMS(商標)シークエンシング(Helicos)、Ion Torrent(登録商標)シークエンシング(Life Technologies)、パイロシークエンシング(例えば、Roche/454からのもの)、SOLiD(登録商標)シークエンシング(Life Technologies)、マイクロアレイシークエンシング(例えば、Affymetrixからのもの)、Sangerシークエンシング、DNB seq(商標)(MGI Tech Co.,Ltd)などがある。シークエンシング方法は、例えば、>200nt又はより多くをシークエンシングすることが可能であり得る。シークエンシング方法は、長い鋳型分子、例えば、>1000~10,000塩基又はより多くをシークエンシングすることが可能であり得る。シークエンシング方法は、例えば、シークエンシング反応の動態をモニターすることにより、シークエンシング反応の間に塩基修飾を検出することが可能であり得る。シークエンシング方法は、例えば、リアルタイムで、単一の鋳型分子の配列を分析してもよい。好ましい実施形態において、調製された核酸分子ライブラリーは、ナノポア選択的シークエンシングによりシークエンシングされる。ナノポア選択的シークエンシングにおいて、リアルタイムシークエンシングの間に、生成されたデータ(直接的な電流シグナル又はこれらの電流シグナルから翻訳された塩基コールのいずれか)は1つ又は複数の参照配列(複数可)と比較される。標的配列のヌクレオチドのセット数又はシグナルの量が参照配列と整合している場合、シークエンシングは進行され、そうでない場合、電流は逆転され、それにより、核酸はポアから除去され、ポアは新たな核酸のシークエンシングのために利用可能とされる。ヌクレオチドのセット数は、核酸リードの少なくとも最初の50、60、70、80、90、100、150、200、250、300、350、400、450、又は500ヌクレオチドであってもよい。1つ又は複数の参照配列は数多くの異なる配列であってもよい。好ましくは、参照配列は、本発明の方法のステップa)~c)、並びに任意選択でステップd)及びe)において得られる標的核酸断片の配列に対して少なくとも50、60、70、80、90、92、93、94、95、96、97、98、99又は100%同一である。一実施形態において、参照配列は、本発明の方法のステップa)~c)、並びに任意選択でステップd)及びe)において得られる標的核酸断片の1つ又は複数の配列の特定のサブセットに対して少なくとも50、60、70、80、90、92、93、94、95、96、97、98、99又は100%同一である。ナノポア選択的シークエンシングにより特定のサブセットを選択的にシークエンシングすることの利益の1つは、異なるシークエンシングランにおいて、異なるサブセットが、調製された核酸分子ライブラリーを使用してシークエンシングされ得ることである。
本発明のシークエンシング方法は、1つ又は複数の標識された標的核酸断片を増幅する、好ましくは選択的に増幅するステップ(ii)をさらに含んでもよい。
ステップ(ii)における増幅反応は、好ましくは、(DNA)ポリメラーゼが1つ又は複数の標識された標的核酸断片を増幅することが可能である実験条件下で、すなわちポリメラーゼが酵素活性を示す実験条件下で行われる。そのような実験条件は当業者に周知であり、及び/又は任意の従来の手段を使用して決定され得る。当業者に公知のように、これらの実験条件はポリメラーゼの種類に依存し得る。これらの実験条件は、好ましくは、少なくともヌクレオチド、好ましくは天然に存在するヌクレオチドの存在を含み、好ましくはこれらの実験条件は、dNTP、好ましくはアデニン、グアニン、シトシン及びチミジン及び任意選択でウラシルのうちの少なくとも1つの存在を含む。
増幅は、標識にのみアニールする及び/又はアニールされたオリゴヌクレオチドの少なくとも部分にのみアニールする1つ又は複数のプライマーを使用して行われ得る。追加的に又は代替的にプライマーのうちの少なくとも1つは、標的核酸断片中に存在するヌクレオチドにアニールできる、すなわち選択的な増幅のための、1つ又は複数のヌクレオチドをその3’末端において含んでもよい。それゆえ後者の場合、プライマーのうちの少なくとも1つは、標的核酸断片中に存在する配列にアニールできるその3’末端における1つ又は複数のヌクレオチドに加えて、標識にアニールできる及び/又はアニールされたオリゴヌクレオチドの少なくとも部分にアニールできる配列を含んでもよい。追加的に又は代替的に、プライマー対のプライマーのうちの1つは、標的核酸断片中に存在する配列にのみアニールしてもよく、すなわちいわゆる「ネステッド」プライマーである。
任意選択でプライマー対のプライマーのうちの少なくとも1つは、好ましくは制限部位ドメイン、捕捉ドメイン、シークエンシングプライマー結合部位、増幅プライマー結合部位、検出ドメイン、バーコード配列、転写プロモータードメイン及びPAM配列、又はこれらの任意の組合せからなる群から選択される、機能性ドメインを含む。バーコードは試料バーコードであり得るが、これに限定されない。
1つ又は複数の標的核酸断片をシークエンシングする方法はしたがって、
(i)a)二本鎖核酸分子を含む試料を提供するステップであり、二本鎖核酸分子が目的の配列を含む、ステップ;
b)二本鎖核酸分子を部位特異的ヌクレアーゼと接触させて二本鎖切断を生成するステップであり、二本鎖切断が標的核酸断片の第1の鎖の遊離3’末端を結果としてもたらす、ステップ;
c)切断された核酸分子を逆転写酵素及び鋳型RNA分子と接触させ、それにより、1つ又は複数のヌクレオチドで標的核酸断片の第1の鎖の遊離3’末端を標識するステップであり、任意選択でステップb)における部位特異的ヌクレアーゼ及びステップc)における逆転写酵素が別々の実体である、ステップ;
d)任意選択で二本鎖核酸分子を第2の部位特異的ヌクレアーゼと接触させて第2の二本鎖切断を生成するステップであり、第2の二本鎖切断が標的核酸断片の第2の鎖の遊離3’末端を結果としてもたらし、好ましくはステップd)がステップb)と同時に行われる、ステップ;
e)任意選択で標的核酸断片を逆転写酵素及び第2の鋳型RNA分子と接触させ、それにより、1つ又は複数のヌクレオチドで標的核酸断片の第2の鎖を遊離3’末端において標識するステップであり、好ましくはステップe)がステップc)と同時に行われる、ステップ;
f)任意選択で第1のオリゴヌクレオチドを、標的核酸断片の第1の鎖の標識された3’末端にアニールするステップであり、任意選択で鋳型RNA及びcrRNAが、第1のオリゴヌクレオチドをアニールする前に分解される、ステップ;
g)任意選択でアニールされたオリゴヌクレオチド(複数可)をライゲート及び/又は充填するステップ
により1つ又は複数の標識された標的核酸断片を得るステップ;
(ii)任意選択で1つ又は複数の標識された標的核酸断片を増幅する、好ましくは選択的に増幅するステップ;並びに
(iii)任意選択で増幅された、1つ又は複数の標的核酸断片の配列の少なくとも部分を決定するステップ
を含んでもよい。
任意選択で、本発明の方法は、マルチプレックスである、すなわち複数の核酸試料のために、例えば少なくとも約5、10、20、30、40、50、60、70、80、90、100、500、1000個又はより多くの核酸試料のために同時に応用される。方法は、複数の試料のために並列で行われてもよく、「並列で」は、実質的に同時であるが、各々の試料が別々の反応チューブ又は容器中で処理されることとして本明細書において理解されるべきである。
追加的に又は代替的に、本発明の方法の1つ又は複数のステップは、プールされた試料に対して行われてもよい。プールするステップは、例えば、ステップa)、b)、c)、d)、e)、f)及びg)のうちのいずれか1つの後、並びに/又はステップ(i)及び(ii)のうちのいずれか1つの後であってもよい。好ましくは、プールするステップは、ステップf)及びステップg)のうちの少なくとも1つの後、並びに/又はステップ(i)及びステップ(ii)のうちの少なくとも1つの後である。好ましくは、プールするステップは、ステップg)の後並びに/又はステップ(i)及び(ii)のうちの少なくとも1つの後である。
富化、単離及び/又はシークエンシングされた断片を、起源となる試料にトレースバックするために、断片は、試料をプールする前に識別物でタグ付加されてもよい。そのような識別物は、任意の検出可能な実体であり得、以下に限定されないが例えば放射性又は蛍光標識であるが、好ましくは特定のヌクレオチド配列又はヌクレオチド配列の組合せ、好ましくは定義された長さのものである。識別物は、好ましくは、標識、標識にアニールするオリゴヌクレオチド及び標的核酸断片を増幅するためのプライマーのうちの少なくとも1つにおいて存在する。
追加的に又は代替的に、試料は、巧妙なプーリング戦略、以下に限定されないが例えば、プールした後に、各々の試料が少なくともそれぞれ2つ又は3つのプール中に包含される2D及び3Dプーリング戦略を使用してプールされ得る。特定の標的核酸断片は、特定の富化、単離及び/又はシークエンシングされた標的断片を含むそれぞれのプールの座標を使用することにより、起源となる試料にトレースバックされ得る。
さらなる態様
一態様において、本発明は、標識された標的核酸断片に関する。標識された標的核酸断片は本発明の方法により得ることが可能であり得る。標識された標的核酸断片は、
ステップa)、b)、及びc);
ステップa)、b)、c)、d)及びe);
ステップa)、b)、d)、c)及びe);
ステップa)、b)、c);f)、及び任意選択でステップg)
ステップa)、b)、c)、d)及びe);f)、及び任意選択でステップg);並びに/又は
ステップa)、b)、d)、c)及びe);f)、及び任意選択でステップg)
のうちの少なくとも1つを行うことにより得ることが可能であるものであってもよい。
ステップb)及びd)は実質的に同時に行われてもよく、並びに/又はステップc)及びe)は実質的に同時に行われてもよいことが本明細書においてさらに理解される。
別の態様において、本発明は、本発明の方法により得ることが可能であるシークエンシングライブラリー、好ましくはディープシークエンシングライブラリーに関する。ディープシークエンシングライブラリーは、
ステップa)、b)、及びc);
ステップa)、b)、c)、d)及びe);
ステップa)、b)、d)、c)及びe);
ステップa)、b)、c);f)、及び任意選択でステップg)
ステップa)、b)、c)、d)及びe);f)、及び任意選択でステップg);並びに/又は
ステップa)、b)、d)、c)及びe);f)、及び任意選択でステップg)
のうちの少なくとも1つを行うことにより得ることが可能であるものであってもよい。
追加的に、ステップ(ii)が、本発明の方法により得ることが可能であるシークエンシングライブラリーを増幅するために行われてもよい。
追加的に、シークエンシングライブラリーは、好ましくは本明細書において定義されているプーリング戦略を使用する、プールされた標識された標的核酸断片の収集物を含む。標識された標的核酸断片は、好ましくは、バーコード、好ましくは試料バーコードを含む。
別の態様において、本発明は、本発明の方法における使用のための構築物に関する。構築物は、好ましくは、本明細書において定義されている部位特異的ヌクレアーゼをコードする配列並びに本明細書において定義されている逆転写酵素及び鋳型RNA分子のうちの少なくとも1つをコードする配列を含む。代替的に、構築物は、本明細書において定義されている逆転写酵素をコードする配列及び鋳型RNA分子をコードする配列を含んでもよい。
構築物は、ガイドRNAをコードする配列をさらに含んでもよい。好ましくは、構築物は、sgRNA、crRNA及び任意選択でtracrRNAのうちの少なくとも1つをコードする配列をさらに含んでもよい。構築物は、少なくとも2、3、4、5、6、7、8、9、10個又はより多くの鋳型RNA分子を含んでもよい。追加的に又は代替的に、構築物は、少なくとも2、3、4、5、6、7、8、9、10個又はより多くのガイドRNAを含んでもよい。鋳型RNA分子及び/又はガイドRNA分子は、例えば鋳型RNA分子の間、ガイドRNAの間及び/又は鋳型RNAとガイドRNAとの間に切断部位を組み込むことにより、転写後に切断されてもよい。好ましい切断部位は、tRNA切断部位、例えば国際公開第2016/061481号(参照により本明細書に組み込まれる)に記載されるものである。
一態様において、本発明は、本発明の方法を実行するためのキットに関する。好ましくは、キットは、少なくとも3つの構成要素を含み、
第1の構成要素は、本明細書において定義されている部位特異的ヌクレアーゼ、又はそれをコードする構築物、並びに任意選択でcrRNA、tracrRNA及びsgRNAのうちの少なくとも1つ、又はそれをコードする構築物、好ましくは本明細書において定義されている構築物であり;
第2の構成要素は、本明細書において定義されているDNAポリメラーゼ、好ましくは逆転写酵素、又はそれをコードする構築物であり;
第3の構成要素は、本明細書において定義されている鋳型RNA分子、又はそれをコードする構築物である。
好ましい実施形態において、キットは、試料の二本鎖核酸分子からの少なくとも1つの標的断片の切除のための少なくとも2つの異なるcrRNA及び/又はsgRNAを含む。さらなる好ましい実施形態において、キットは、試料の二本鎖核酸分子からの標的断片のセットの切除のためのcrRNA及び/又はsgRNAの対のセットを含み、対のセットは、2、3、4、5、6、7、8、9、10個又はより多く、例えば少なくとも約50、100、150、200、250、300、350、400、450、500、750、1000個又はより多くであってもよい。
任意選択で、前記キットは、前記少なくとも1つの標的断片の1つの側を標識するための少なくとも1つの鋳型RNA分子を含む。キットは、標的断片のセットを標識するための鋳型RNA分子のセットをさらに含んでもよく、鋳型RNA分子のセットは、2、3、4、5、6、7、8、9、10個又はより多く、例えば少なくとも約50、100、150、200、250、300、350、400、450、500、750、1000個又はより多くであってもよい。
代替的に又は追加的に、前記キットは、前記少なくとも1つの標的断片の両方の側を標識するための少なくとも2つの鋳型RNA分子を含む。キットは、標的断片のセットの両方の側を標識するための鋳型RNA分子の対のセットをさらに含んでもよく、鋳型RNA分子の対のセットは、2、3、4、5、6、7、8、9、10個又はより多く、例えば少なくとも約50、100、150、200、250、300、350、400、450、500、750、1000個又はより多くであってもよい。
追加的に、キットは、第4、第5、第6及び第7の構成要素のうちの少なくとも1つをさらに含んでもよく、
第4の構成要素は、本明細書において定義されている1つ又は複数のオリゴヌクレオチドであり、好ましくは、1つ又は複数のオリゴヌクレオチドは、UMI、バーコード及びプライマー結合部位のうちの少なくとも1つを含み;
第5の構成要素は、標識された標的核酸断片の選択的な増幅のための1つ又は複数のプライマー、好ましくは本明細書において定義されている1つ又は複数のプライマーであり;
第6の構成要素は、標識された標的核酸断片の非選択的(ユニバーサル)な増幅のための1つ又は複数のプライマー、好ましくは本明細書において定義されている1つ又は複数のプライマーであり;
第7の構成要素は、標的核酸断片のサブセットの選択的な増幅のための1つ又は複数のプライマー、好ましくは本明細書において定義されている1つ又は複数のプライマーである。
キットは、好ましくは、複数の試料及び/又は複数の標的核酸断片を処理するための少なくとも2つ若しくはより多くのガイドRNA及び/又は少なくとも2つ若しくはより多くの鋳型RNAを含む。キットは、好ましくは、複数の試料及び/又は複数の標的核酸断片を処理するための少なくとも2、3、4、5、6、7、8、9、10個若しくはより多くのガイドRNA及び/又は少なくとも2、3、4、5、6、7、8、9、10個若しくはより多くの鋳型RNAを含む。
構成要素は、別々のバイアル中に存在してもよいか、又は1つ若しくは複数のバイアル中に組み合わせられてもよい。
好ましくは、キット内のバイアルのいずれかの体積は、100mL、50mL、20mL、10mL、5mL、4mL、3mL、2mL又は1mLを超えない。
試薬は、凍結乾燥形態で、又は適切な緩衝剤中に存在してもよい。キットはまた、本発明を実行するために必要な任意の他の構成要素、例えば緩衝剤、ピペット、マイクロタイタープレート及び書面による使用説明書を含有してもよい。本発明のキットのためのそのような他の構成要素は当業者に公知である。
実施例1
材料及び方法
標的核酸分子のCas9切断
配列番号25又は配列番号26を有するプライマーを使用してラムダゲノムの5043~6074位を増幅することにより二本鎖核酸分子を得た。増幅されたλ DNA断片(約1030bp)をその後に、以下の反応条件:
ヌクレアーゼ非含有水:2.7μl
10x Buffer 3.1(NEB):2μl
3uM RevsgRNA:1.3μl
3uM sgRNA3:1.3μl
1uM Cas9ヌクレアーゼ(NEB):7.7μl
基質DNA(100ng/ul):5μl
総体積:20μl
37℃で1時間インキュベート
を使用して、図2に指し示されている2つの選択された位置においてCas9で切断した。
5’から3’方向のRevsgRNAの配列(標的配列に下線を引いている):
AGUGUCUCCCGGACGUCAUCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号27)
5’から3’方向のsgRNA3の配列(標的配列に下線を引いている):
GCUCAUACCGCAACCGCGCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(配列番号28)
切断後に、DNAを3回精製し、Bioanalyzerシステム(Agilent)で分析したか、又は以下に指し示されるようにさらに処理した:
切断されたDNAの逆転写
切断されたDNAをその後に、選択されたヌクレオチド配列を用いてその3’末端において伸長した。この目的のために、DNAを以下の反応条件:
切断されたDNA:15μl
111.2μM RevsgRNA-RNA-Ad:0.7μl
126.6uM sgRNA3-RNA-Ad:0.6μl
5x Protoscript II緩衝剤(NEB):6μl
Protoscript II RT(200U/ul)(NEB):1μl
1M DTT:0.3μl
10mM dNTP:1μl
MQ:5.4μl
総体積:30μl
42℃で1時間インキュベート、続いて65℃で20分間のインキュベーション
を使用して逆転写酵素並びに第1及び第2の鋳型RNAに曝露した。
5’から3’方向の第1の鋳型RNA(RevsgRNA-RNA-Ad)の配列、(標的DNA配列にハイブリダイズする配列に下線を引いており、PAM配列は斜体であり、鋳型配列は太字である):
Figure 2023543602000002

5’から3’方向の第2の鋳型RNA(sgRNA3-RNA-Ad)の配列、(標的DNA配列にハイブリダイズする配列に下線を引いており、PAM配列は斜体であり、鋳型配列は太字である):
Figure 2023543602000003
RNA分解
切断されたDNAへの新たな配列の付加後に、RNAse H処理を使用してRNAを分解した:
伸長されたDNA:10μl
10x RNAse H反応緩衝剤(NEB):10μl
RNAse H(5U/ul)(NEB):1μl
MQ:79μl
総体積:100μl
37℃で20分間インキュベート、続いて1μl 0.5M EDTAの追加。
アダプターアニーリング、充填及びライゲーション
最後に、オリゴヌクレオチドをDNA分子の生成された一本鎖オーバーハングにアニールした。第1の鋳型RNAを使用して作り出されるオーバーハングは、第2の鋳型RNAを使用して作り出されるオーバーハングとは異なるので、2つの異なるオリゴヌクレオチドを使用した。アニールされたオリゴヌクレオチドをその後にDNA分子にライゲートし、充填した(すなわち二本鎖DNA分子を生成した)。
5’から3’方向のオリゴヌクレオチド(RevsgRNA-BC2)の配列(バーコードに下線を引いており、オーバーハングにアニールする配列を太字で指し示している)。このオリゴヌクレオチドは、鋳型RNA分子としてRevsgRNA-RNA-Adを使用して生成されたオーバーハングにアニールすることができる:
Figure 2023543602000004
5’から3’方向のオリゴヌクレオチド(sgRNA3-BC1)の配列(バーコードに下線を引いており、オーバーハングにアニールする配列を太字で指し示している)。このオリゴヌクレオチドは、鋳型RNA分子としてsgRNA3-RNA-Adを使用して生成されたオーバーハングにアニールすることができる:
Figure 2023543602000005
以下の反応条件:
伸長されたDNA:10μl
100uM sgRNA3-BC1:2.5μl
100uM RevsgRNA-BC2:2.5μl
FFPE DNA Repair Buffer(NEB):3.25μl
NEBNext FFPE DNA repair Mix(NEB):1μl
MQ:11.75μl
総体積:31μl
20℃で15分間インキュベート
を使用して、生成されたオーバーハングにオリゴヌクレオチドをアニールした。
増幅
生成されたDNA生成物を可視化するために、標準的な条件を使用するPCR反応において図2に指し示されるように異なるプライマーセットを使用した。逆転写酵素反応後に生成された生成物を、プライマー対を用いて増幅し、第1のプライマーはλ DNA断片中の配列にアニールし、第2のプライマーは新たに生成されたオーバーハングにのみアニールする。それゆえ、第2のプライマーの配列はGACGATGAGTCCTGAG(配列番号33)又はCTCGTAGACTGCGTACC(配列番号34)であり、それぞれ337bp又は204bpのアンプリコンを生成した。
追加的にオリゴヌクレオチドのアニーリング後に、プライマー対と共に標準的なPCR反応を使用して生成物を可視化し、第1のプライマーは第1のオリゴヌクレオチド(RevsgRNA-BC2)中に存在する配列にのみアニールすることができ、第2のプライマーは第2のオリゴヌクレオチド(sgRNA3-BC1)中に存在する配列にのみアニールすることができるものであった。これらのプライマーの配列はACGACTACAAACGGAATCGAA(配列番号35)及びCACAAAGACACCGACAACTTTC(配列番号36)であり、生成されるアンプリコンは822bpの予想されるサイズを有する。
結果及び結論
図3に示されるように、明確な増幅生成物が、Cas9複合体及び逆転写酵素で処理されたDNA断片の増幅後に見られた。増幅生成物は337bp又は204bpの予想されるサイズを示し、本明細書に詳述されている方法は実際に、選択的な予め決定された配列を用いて目的のDNA断片の3’末端を伸長できることが確認された。
生成された一本鎖オーバーハングは、下流の処理において、例えばその後のディープシークエンシングのためにDNA断片にオリゴヌクレオチドをアニールするために、使用され得る。実際に、オリゴヌクレオチドは、生成された3’オーバーハングに直接的にアニールすることができ、生成された生成物は増幅され、822bpの予想されるサイズを有する適用生成物を生成した(図3を参照)。
新たに付加される一本鎖DNAの配列を変更することにより、特異的なオリゴヌクレオチドは、生成されたオーバーハングにアニールすることができる。実際に、2つの異なる一本鎖オーバーハングが、切断されたDNA断片の各々の部位において作り出され得ること、続いて断片の1つの部位において1つのオリゴヌクレオチド及びDNA断片の他の部位において別のオリゴヌクレオチドをアニールし得ることをこの実験は示す。
例えば、各々のDNA試料の特異的なオーバーハングを設計すること、並びに/又は各々の目的の遺伝子の特異的なオーバーハング、及び/若しくは単一の遺伝子の各々の部位の特異的なオーバーハング(そのため第1の鎖の3’末端において生成される特異的なオーバーハング及び単一の遺伝子の相補鎖の3’末端において生成される別の一本鎖オーバーハング)を作り出すことが可能であり得る。それゆえ、方法は、生成された3’-オーバーハングが実験の特定の必要性に直接的にカスタマイズされ得る多用途のプラットフォームを提供する。

Claims (15)

  1. 標的核酸断片を標識する方法であって、前記標的核酸断片が第1の鎖及び相補的な第2の鎖を含み、前記標的核酸断片が目的の配列を含み、前記方法が、
    a)二本鎖核酸分子を含む試料を提供するステップであり、前記二本鎖核酸分子が目的の前記配列を含む、ステップ;
    b)前記二本鎖核酸分子を部位特異的ヌクレアーゼと接触させて二本鎖切断を生成するステップであり、前記二本鎖切断が前記標的核酸断片の前記第1の鎖の遊離3’末端を結果としてもたらす、ステップ;並びに
    c)前記切断された核酸分子をDNAポリメラーゼ及び鋳型分子と接触させ、好ましくは前記切断された核酸分子を逆転写酵素及び鋳型RNA分子と接触させ、それにより、1つ又は複数のヌクレオチドで前記標的核酸断片の前記第1の鎖の前記遊離3’末端を標識するステップ
    を含み、
    任意選択でステップb)における前記部位特異的ヌクレアーゼ及びステップc)における前記逆転写酵素が別々の実体である、方法。
  2. 前記方法が、
    d)前記二本鎖核酸分子を第2の部位特異的ヌクレアーゼと接触させて第2の二本鎖切断を生成するステップであり、前記第2の二本鎖切断が前記標的核酸断片の前記第2の鎖の遊離3’末端を結果としてもたらす、ステップをさらに含み、好ましくはステップd)がステップb)と同時に行われる、請求項1に記載の方法。
  3. 前記方法が、
    e)前記標的核酸断片をDNAポリメラーゼ及び第2の鋳型分子と、好ましくは逆転写酵素及び第2の鋳型RNA分子と接触させ、それにより、1つ又は複数のヌクレオチドで前記標的核酸断片の前記第2の鎖を前記遊離3’末端において標識するステップをさらに含み、好ましくはステップe)がステップc)と同時に行われる、請求項2に記載の方法。
  4. ステップb)及び/又はステップd)における前記部位特異的ヌクレアーゼが、好ましくはCas9又はCpf1ヌクレアーゼのうちの少なくとも1つ及びガイドRNAを含む、CRISPR-ヌクレアーゼ複合体である、請求項1~3のいずれか一項に記載の方法。
  5. ステップc)の前記鋳型RNA分子が、前記標的核酸断片の前記第1の鎖の前記3’末端における配列にアニールできるその3’末端における配列を含み、任意選択でステップe)の前記鋳型RNA分子が、前記標的核酸断片の前記第2の鎖の前記3’末端における配列にアニールできるその3’末端における配列を含む、請求項1~4のいずれか一項に記載の方法。
  6. 前記鋳型RNA及び前記ガイドRNAが別々のRNA分子である、請求項4又は5に記載の方法。
  7. 前記第1の鎖を伸長するヌクレオチドの配列が、前記標的核酸断片の前記第2の鎖を伸長するヌクレオチドの配列とは異なり、好ましくは前記第1及び第2の鎖を伸長する前記1つ又は複数のヌクレオチドが、90%、80%、60%より低い、又は40%より低いヌクレオチド配列同一性を有する、請求項1~6のいずれか一項に記載の方法。
  8. 前記方法が、
    f)第1のオリゴヌクレオチドを、前記標的核酸断片の前記第1の鎖の前記標識された3’末端にアニールするステップであり、任意選択で前記鋳型RNA及びガイドRNAが前記第1のオリゴヌクレオチドをアニールする前に分解される、ステップ
    をさらに含み、
    好ましくは前記第1の鎖の前記標識された3’末端にアニールする前記オリゴヌクレオチドが、通常のハイブリダイズ条件下で前記第2の鎖の、任意選択で標識された前記3’末端にアニールすることが可能でない、請求項1~7のいずれか一項に記載の方法。
  9. ステップf)が、第2のオリゴヌクレオチドを、前記第2の鎖の前記標識された3’末端にアニールすることをさらに含み、好ましくは前記第2の鎖の前記標識された3’末端にアニールする前記オリゴヌクレオチドが、通常のハイブリダイズ条件下で前記第1の鎖の、任意選択で標識された前記3’末端にアニールすることが可能でない、請求項8に記載の方法。
  10. 前記方法が、
    g)1つ又は複数の前記アニールされたオリゴヌクレオチドをライゲート及び/又は充填するステップ
    をさらに含む、請求項8又は9に記載の方法。
  11. 前記第1及び第2のオリゴヌクレオチドのうちの少なくとも1つが、UMI、バーコード及びプライマー結合部位のうちの少なくとも1つを含む、請求項8~10のいずれか一項に記載の方法。
  12. 1つ又は複数の標的核酸断片をシークエンシングする、好ましくはディープシークエンシングする方法であって、
    (i)請求項1~11のいずれか一項に定義される1つ又は複数の標識された標的核酸断片を得るステップ;
    (ii)任意選択で前記1つ又は複数の標識された標的核酸断片を増幅する、好ましくは選択的に増幅するステップ;及び
    (iii)任意選択で増幅された前記1つ又は複数の標的核酸断片の配列の少なくとも部分を決定するステップ
    を含み、
    好ましくは前記1つ又は複数の標的核酸断片が1つ又は複数の核酸試料から得られ、任意選択で前記1つ又は複数の標的核酸断片がステップ(i)の後及び/又はステップ(ii)の後にプールされる、方法。
  13. 請求項1~11のいずれか一項に記載の方法により得ることが可能である標識された標的核酸断片又は請求項12に記載の方法により得ることが可能であるディープシークエンシングライブラリー。
  14. 請求項1~12のいずれか一項に記載の方法における使用のための、部位特異的ヌクレアーゼ並びに逆転写酵素及び鋳型RNA分子のうちの少なくとも1つをコードする構築物であって、好ましくはガイドRNAをさらにコードする、構築物。
  15. 請求項1~12のいずれか一項に記載の方法における使用のための、少なくとも第1、第2及び第3の構成要素を含むパーツのキットであって、
    前記第1の構成要素が、部位特異的ヌクレアーゼ、又はそれをコードする構築物、及び任意選択でガイドRNA、又はそれをコードする構築物であり;
    前記第2の構成要素が、逆転写酵素、又はそれをコードする構築物であり;
    前記第3の構成要素が、鋳型RNA分子、又はそれをコードする構築物であり、
    前記キットが、好ましくは、第4、第5、第6及び第7の構成要素のうちの少なくとも1つをさらに含み、
    前記第4の構成要素が、請求項8、9及び11のいずれか一項に定義される1つ又は複数のオリゴヌクレオチドであり、前記1つ又は複数のオリゴヌクレオチドが、UMI、バーコード及びプライマー結合部位のうちの少なくとも1つを任意選択で含み;
    前記第5の構成要素が、請求項12に定義される標識された標的核酸断片の増幅のための1つ又は複数のプライマーであり;
    前記第6の構成要素が、前記標識された標的核酸断片の非選択的な増幅のための1つ又は複数のプライマーであり;
    前記第7の構成要素が、標的核酸断片のサブセットの選択的な増幅のための1つ又は複数のプライマーである、キット。
JP2023519825A 2020-10-06 2021-10-06 標的化された配列付加 Pending JP2023543602A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP20200254.9 2020-10-06
EP20200254 2020-10-06
US202063118781P 2020-11-27 2020-11-27
US63/118,781 2020-11-27
PCT/EP2021/077567 WO2022074058A1 (en) 2020-10-06 2021-10-06 Targeted sequence addition

Publications (1)

Publication Number Publication Date
JP2023543602A true JP2023543602A (ja) 2023-10-17

Family

ID=78049264

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023519825A Pending JP2023543602A (ja) 2020-10-06 2021-10-06 標的化された配列付加

Country Status (4)

Country Link
US (1) US20230407366A1 (ja)
EP (1) EP4225914A1 (ja)
JP (1) JP2023543602A (ja)
WO (1) WO2022074058A1 (ja)

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4663290A (en) 1982-01-21 1987-05-05 Molecular Genetics, Inc. Production of reverse transcriptase
WO1992006200A1 (en) 1990-09-28 1992-04-16 F. Hoffmann-La-Roche Ag 5' to 3' exonuclease mutations of thermostable dna polymerases
US5079352A (en) 1986-08-22 1992-01-07 Cetus Corporation Purified thermostable enzyme
US4889818A (en) 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
US5374553A (en) 1986-08-22 1994-12-20 Hoffmann-La Roche Inc. DNA encoding a thermostable nucleic acid polymerase enzyme from thermotoga maritima
CA1340807C (en) 1988-02-24 1999-11-02 Lawrence T. Malek Nucleic acid amplification process
FR2632821B1 (fr) 1988-06-22 1990-11-16 Inst Kriobiologii Procede de conservation a basse temperature des embryons
US5270179A (en) 1989-08-10 1993-12-14 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase reduced in 3'- to-5' exonuclease activity
US5047342A (en) 1989-08-10 1991-09-10 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase
DE553264T1 (de) 1990-10-05 1994-04-28 Wayne M Barnes Thermostabile dna polymerase.
PT969102E (pt) 1991-09-24 2008-03-25 Keygene Nv Iniciadores, grupos e conjuntos de fragmentos de restrição usados na amplificação selectiva de fragmentos de restrição
US5436149A (en) 1993-02-19 1995-07-25 Barnes; Wayne M. Thermostable DNA polymerase with enhanced thermostability and enhanced length and efficiency of primer extension
US5512462A (en) 1994-02-25 1996-04-30 Hoffmann-La Roche Inc. Methods and reagents for the polymerase chain reaction amplification of long DNA sequences
US5912155A (en) 1994-09-30 1999-06-15 Life Technologies, Inc. Cloned DNA polymerases from Thermotoga neapolitana
US5614365A (en) 1994-10-17 1997-03-25 President & Fellow Of Harvard College DNA polymerase having modified nucleotide binding site for DNA sequencing
US5948902A (en) 1997-11-20 1999-09-07 South Alabama Medical Science Foundation Antisense oligonucleotides to human serine/threonine protein phosphatase genes
DE69929542T2 (de) 1998-10-27 2006-09-14 Affymetrix, Inc., Santa Clara Komplexitätsmanagement und analyse genomischer dna
EP1873260B1 (en) 1998-11-09 2009-03-18 Eiken Kagaku Kabushiki Kaisha Process for synthesizing nucleic acid
US6958225B2 (en) 1999-10-27 2005-10-25 Affymetrix, Inc. Complexity management of genomic DNA
US6756501B2 (en) 2001-07-10 2004-06-29 E. I. Du Pont De Nemours And Company Manufacture of 3-methyl-tetrahydrofuran from alpha-methylene-gamma-butyrolactone in a single step process
US6872529B2 (en) 2001-07-25 2005-03-29 Affymetrix, Inc. Complexity management of genomic DNA
CA2496517A1 (en) 2002-09-05 2004-03-18 Plant Bioscience Limited Genome partitioning
ATE557105T1 (de) 2005-06-23 2012-05-15 Keygene Nv Strategien für eine hohe durchsatzidentifikation und erkennung von polymorphismen
CA2910861C (en) 2005-09-29 2018-08-07 Michael Josephus Theresia Van Eijk High throughput screening of mutagenized populations
CN103937899B (zh) 2005-12-22 2017-09-08 凯津公司 用于基于aflp的高通量多态性检测的方法
EP1966394B1 (en) 2005-12-22 2012-07-25 Keygene N.V. Improved strategies for transcript profiling using high throughput sequencing technologies
GB0901593D0 (en) 2009-01-30 2009-03-11 Touchlight Genetics Ltd Production of closed linear DNA
WO2011155833A2 (en) 2010-06-09 2011-12-15 Keygene N.V. Combinatorial sequence barcodes for high throughput screening
US9528107B2 (en) 2012-01-31 2016-12-27 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
LT3241902T (lt) 2012-05-25 2018-06-25 The Regents Of The University Of California Būdai ir kompozicijos, skirti rnr nukreiptos tikslinės dnr modifikacijai ir rnr nukreiptos transkripcijos moduliacijai
US20140349400A1 (en) * 2013-03-15 2014-11-27 Massachusetts Institute Of Technology Programmable Modification of DNA
EP3183367B1 (en) 2014-08-19 2019-06-26 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
EP3207139A1 (en) 2014-10-17 2017-08-23 The Penn State Research Foundation Methods and compositions for multiplex rna guided genome editing and other rna technologies
EP3957745A1 (en) * 2014-12-20 2022-02-23 Arc Bio, LLC Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using crispr/cas system proteins
MX2021011325A (es) * 2019-03-19 2022-01-06 Broad Inst Inc Metodos y composiciones para editar secuencias de nucleotidos.

Also Published As

Publication number Publication date
EP4225914A1 (en) 2023-08-16
WO2022074058A1 (en) 2022-04-14
US20230407366A1 (en) 2023-12-21

Similar Documents

Publication Publication Date Title
US10876108B2 (en) Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
US20210381042A1 (en) Methods for Adding Adapters to Nucleic Acids and Compositions for Practicing the Same
US10988795B2 (en) Synthesis of double-stranded nucleic acids
US20190169603A1 (en) Compositions and Methods for Labeling Target Nucleic Acid Molecules
JP2023002557A (ja) シングルプライマーからデュアルプライマーのアンプリコンへのスイッチング
US10711296B2 (en) Directional amplification of RNA
US20220333100A1 (en) Ngs library preparation using covalently closed nucleic acid molecule ends
US20230407366A1 (en) Targeted sequence addition
US11174511B2 (en) Methods and compositions for selecting and amplifying DNA targets in a single reaction mixture
EP3914729A1 (en) Methods of nucleic acid detection and primer design
EP4251761A1 (en) Targeted enrichment using nanopore selective sequencing

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20230414

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20230414