本発明は、二本鎖DNA分子の集団においてメチル化シトシンを同定するための方法に関する。この方法は、記載の実施形態のいずれにおいても、同じDNA分子の両鎖が同時に読み取られ、エラーおよびバイアス制御が徹底されていることから、配列の正確性を保証し、シーケンシングの質を高める。
加えて、より正確なシーケンシングのために、信頼性のある読み取りを得るために必要とされる被覆率が低く、必要とされる出発材料が少ない。具体的には、本発明の方法により生成される二本鎖DNAライブラリーは、少量のDNAおよびDNAの断片化を伴うものを含む、幅広いサンプル調製源から生成することができる。
本発明の方法は、記載の実施形態のいずれにおいても、DNA鋳型として使用されるサンプルがそのプロセス中で保存可能であり、それは回収、蓄積可能であり、また、異なる条件で何回も増幅を受けることができ、サンプル消耗なく、何回もシーケンシングを受けることができるというさらなる利点を提供する。特に、本発明の方法で、記載の実施形態のいずれにおいても使用されるアダプターおよび/またはヘアピン配列および/またはバーコード配列は、場合に応じて、サンプル同定のためのユニークなバーコード(バーコード配列、コンビナトリアル配列またはコンビナトリアルバーコードとも呼ばれる)と伸長または増幅工程の後に元のDNA鋳型の回収を可能とするための官能基を持ち得る。これらのバーコードはまた、下記のように独立した分子として提供されてもよい。
本発明の方法は、総てのその実施形態において、メチル化配列のシーケンシングに特に有用である。本発明の方法により生成された二本鎖DNAライブラリーは、明白なDNA配列およびDNAのメチル化情報を保持し、配列バリエーション(多形および突然変異を含む)とDNAのメチル化修飾の同時検出を可能とする。特に、両鎖が同時に分析されるので、本発明の方法は、ゲノム規模でのDNAメチル化の対称性の決定を可能とする。両鎖を読み取ることにより、シーケンシングプロセスがモニタリングでき、総ての個々の配列リードにおいて生じたエラーが補正でき、従って、ゲノムおよびメチロームの両方に関してより信頼性の高い情報が得られる。
さらに、DNA鋳型にコンビナトリアルバーコードを導入することにより、配列変異体(多形および突然変異を含む)およびDNAのメチル化修飾に関する定量結果を得ることができる。前記バーコードは、サンプルの処理(すなわち、DNAの不均質な分解)および増幅(すなわち、配列変異体に関する増幅効率の違い)中に導入されたバイアスに関して全ライブラリーをモニタリングすることを可能とする。この目的を達成するために、本発明は、コンビナトリアルバーコードDNAアダプターを超高効率で合成するための方法を提供する。
さらに、本発明はまた、ライブラリーの生成およびメチル化配列のシーケンシングを提供し、ここで、使用されるアダプターは、元のDNA分子のセンス鎖およびアンチセンス鎖の追跡の維持を可能とするユニークなコンビナトリアルバーコードを含む。要するに、本発明の方法によりDNAライブラリーを得、それをシーケンシングする全プロセスは、手作業およびコンピューター利用とも、現況技術の方法を使用するよりも労働集約度が低く、低コストである。それは元の二本鎖DNA分子、好ましくはゲノムDNAの両鎖においてメチル化シトシンの同定を可能とする。
本発明は、二本鎖DNA分子の集団においてメチル化シトシンを同定するための方法であって、
(i)二本鎖DNAアダプターを複数の二本鎖DNA分子の鎖の少なくとも一方の末端に連結し、複数の二本鎖DNA分子の鎖のペアを形成して、複数の、ペアを形成したアダプター修飾DNA分子を提供する工程;
(ii)ペアを形成したアダプター修飾DNA分子の両鎖に存在する(非メチル化)シトシンを、ペアを形成したアダプター修飾DNA分子においてウラシルに変換する工程;
(iii)(変換工程(ii)の後に得られるような)ペアを形成し変換されたアダプター修飾DNA分子の相補鎖を、ヌクレオチドA、G、CおよびTとその配列が二本鎖アダプターの少なくとも一部に相補的であるプライマーを用いて提供し、部分的に変換された、ペアを形成した二本鎖分子を提供する工程;
(iv)場合により、部分的に変換された、ペアを形成した二本鎖分子を工程(iii)で得られた部分的に変換された、ペアを形成した二本鎖DNA分子を増幅して、増幅された、ペアを形成した二本鎖DNA分子を提供する工程;
(v)工程(ii)、(iii)または工程(iv)(好ましくは、工程(iii)および/または工程(iv))で得られたペアを形成したDNA分子のシーケンシングを行う工程
を含んでなり、
ある位置のメチル化シトシンの存在が、工程(iii)または工程(iv)で得られたペアを形成した二本鎖DNA分子の鎖の一方にシトシンが見られ、かつ、前記ペアを形成した二本鎖DNA分子の他方の鎖の対応する位置にグアニンが見られる場合に決定され、またはある位置の非メチル化シトシンの存在が、工程(iii)または工程(iv)で得られたペアを形成した二本鎖DNA分子の一方にウラシルまたはチミンが見られ、かつ、前記ペアを形成した二本鎖DNA分子の他方の鎖の対応する位置にグアニンが見られる場合に決定される方法に関する。
本発明の方法は、工程(i)、(ii)、(iii)および場合により(iv)の後に、DNA分子の元のセンス鎖およびアンチセンス鎖が物理的に結合され得る(前記ペアの形成が下記のようにヘアピン分子を介して存在する場合)二本鎖DNAライブラリーを得ることを可能とする。本発明の方法の概略図を図1に示す。
用語「DNAライブラリー」は、本明細書で使用する場合、対象とするDNA断片を同定および単離するためにアダプター分子に連結されたDNA断片のコレクションを意味し得る。
「二本鎖DNAライブラリー」という表現は、本明細書で使用する場合、それらの末端の一方が物理的に結合して同じ分子の一部を形成し得るDNA分子の両鎖(すなわち、センス鎖およびアンチセンス鎖)を含むライブラリーを意味し得る。DNAライブラリーの二本鎖DNA分子の鎖はまた、それらの末端の一方が物理的に連結しなくてもよい。それらは、下記のように、バーコード配列の存在によりペアを形成し得る。本発明の方法の二本鎖DNAライブラリーは、環状ライブラリーではない。DNA分子の元の鎖は、それらの末端の一方がループにより物理的に連結し、従って、センス鎖とアンチセンス鎖の間で二重鎖を形成し得る。二本鎖DNAライブラリーの各分子はまた、DNA分子のセンス鎖とアンチセンス鎖の間の相補性が部分的にまたは完全に失われた際に線状コンフォメーションとなり得る。加えて、DNA分子の元の鎖はそれらの末端の1つが連結していなくてもよいが、少なくとも1つのバーコード配列の存在によりペアを形成し得る。
本発明の方法は、二本鎖DNA分子の集団または複数を必要とする。「二本鎖DNA分子の集団または複数」は、本明細書で使用する場合、限定されるものではないが、ゲノムDNA(核DNA、ミトコンドリアDNA、葉緑体DNAなど)、プラスミドDNAまたは一本鎖核酸サンプルから得られる二本鎖DNA分子(例えば、DNA、cDNA、mRNA)であり得る二本鎖DNA分子のコレクションである。一実施形態では、前記集団は、DNAの断片により形成される。
好ましくは、複数の二本鎖DNA分子はゲノムDNAである。これは全ゲノムまたはゲノムの被約表現であり得る。前記DNAは、例えば、濃縮またはクロマチン免疫沈降(ChiP)などにより得ることができる。
用語「ゲノムDNA」は、生物の受け継がれる遺伝情報を意味する。ゲノムDNAは、核のDNA(染色体DNAとも呼ばれる)だけでなく、プラスチド(例えば、葉緑体)および他の細胞オルガネラ(例えば、ミトコンドリア)のDNAも含んでなる。本発明において企図される用語「ゲノムDNA」は、本明細書に記載のものに相補な配列を含有するゲノムDNAを含む。
好ましくは、複数の二本鎖DNA分子は、DNAの断片である。DNAは、限定されるものではないが、機械的ストレス(音波処理、噴霧化、キャビテーションなど)、酵素的断片化(制限エンドヌクレアーゼ、ニックエンドヌクレアーゼ、エキソヌクレアーゼなどによる酵素消化)および化学的断片化(硫酸ジメチル、ヒドラジン、NaCl、ピペリジン、酸など)を含む任意の好適な方法によって断片化される。原則として、断片化の後のDNA断片の長さに制限はないが、狭い範囲の長さを有することが好ましい。断片の好適なサイズは本発明の第1の方法の工程(i)の前に選択することができる。最適な長さは最終的には利用可能なシーケンシング法による。より好ましい実施形態では、二本鎖DNA分子はゲノムDNAの断片である。
工程(i)で使用される複数の二本鎖DNA分子は、
a)ゲノムDNAに由来する二本鎖DNA分子の集団を提供すること;
b)ゲノムDNAに由来する二本鎖分子を分離して、ゲノムDNAに由来する一本鎖DNA分子を提供すること;および
c)工程(i)で使用する二本鎖DNA分子を得るために、ヌクレオチドA、G、CおよびTを用いて、ゲノムDNAに由来する一本鎖DNA分子の相補鎖を提供することにより得ることができる。
好ましくは、アダプターが連結される複数の二本鎖DNA分子は、両鎖に(非メチル化)シトシンを含有するDNA分子および/または鎖の一方に非メチル化シトシンを含有するDNA分子を含んでなる。
通常、二本鎖DNA分子の集団の末端は、サンプルがシーケンシングプラットフォームの特定のプロトコールに入り得るように処理される。
場合により、二本鎖DNAアダプターは、「切断のための部位」(例えば、「制限部位」、制限酵素によって認識されるオリゴヌクレオチドの配列)を含み得る。「切断のための部位」は、種々のシーケンシングプラットフォームの要求にライブラリーの最終要素を適合させる手段を付与する。この適合は(シーケンシングプライマーなどのプラットフォーム試薬と適合する配列を導入することによる)二本鎖DNAアダプターの特定のデザインにより達成できるが、切断部位は、複合体形成(種々の起源からのサンプルを混合する)ため、または大規模シーケンシングの任意のプラットフォームの要求のためのバーコードまたはアダプターを付加するため(あるいはまた潜在的に不必要なヌクレオチドを除去するため)のモジュール性を可能とする。「切断のための部位」は、複数の、ペアを形成したアダプター修飾DNA分子(工程(i)で得られたペアを形成したアダプター修飾DNA分子のライブラリー、または工程(iii)(および場合により工程(iv))で得られるような、ペアを形成し、変換されたアダプター修飾DNA分子のライブラリー)の端部に既知の標的を存在させる特定の配列である。「切断のための部位」は、アダプターおよび/またはヘアピン配列および/またはバーコード配列を連結する工程の前または後に複数の二本鎖DNA分子に連結されてよい。上述のように、「切断のための部位」は、アダプターおよび/またはヘアピン配列および/またはバーコード配列内にすでに含まれていてもよい。このように、総ての断片が切断可能であり、アダプターが適切に連結され得る(このように、もはや必要とされないアダプターおよび/またはヘアピン配列および/またはバーコード配列の配列はシーケンシング効率を高めるために除去され得る)。
好ましくは、工程(i)で使用される二本鎖DNA分子は、工程(i)の前に末端修復される。
用語「末端修復される」は、本明細書で使用する場合、損傷を受けたまたは不適合の5’−および/または3’−突出末端を含むDNA断片の、5’−リン酸基および3’−ヒドロキシル基を含有する平滑末端化DNAへの変換を意味する。DNA末端の平滑化は、限定されるものではないが、T4 DNAポリメラーゼ(5’突出DNA末端を埋める5’→3’ポリメラーゼ活性を有する)および大腸菌(E.coli)DNAポリメラーゼIのクレノウ断片(3’−オーバーハングを除去する3’→5’エキソヌクレアーゼ活性を有する)を含む酵素によって達成できる。DNA末端の効率的なリン酸化のために、限定されるものではないが、T4ポリヌクレオチドキナーゼを含む、非リン酸化DNA断片の末端に5’−リン酸基を付加し得るいずれの酵素も使用可能である。
好ましくは、本発明の方法は、末端修復工程後にDNA分子にdAテールを付加する工程をさらに含んでなる。
用語「dAテールを付加する」は、本明細書で使用する場合、平滑なリン酸化DNA断片の3’末端へのA塩基の付加を意味する。この処理は、その後の連結反応に適合したオーバーハングを作り出す。この工程は、例えば、大腸菌DNAポリメラーゼIのクレノウ断片を使用することによる当業者に周知の方法によって行われる。
本発明の方法で出発材料として使用される複数の二本鎖DNAはまた、一本鎖DNAまたはcDNAからの合成から得ることもできる。二本鎖DNA分子の集団はcDNAから得ることもできる。二本鎖DNAはまた、mRNAから(例えば、ウイルスのRNAから)、mRNAの単離、RNAの逆転写による一本鎖cDNAの生成および二本鎖DNAを得るための一本鎖DNAの処理を含んでなる、現況技術で周知の方法によって得ることもできる。
複数の二本鎖DNA分子を得るために使用されるサンプルは、生物学的起源または環境起源であり得る。生物学的サンプルとしては、限定されるものではないが、動物またはヒトサンプル、液体および固体食品および飼料製品(乳製品品目、野菜、肉類など)が含まれる。好ましい生物学的サンプルとしては、限定されるものではないが、DNAまたはmRNAを含有する流体、細胞、組織、器官またはその一部が含まれる。生物学的サンプルは、結腸、直腸、乳房、卵巣、前立腺、腎臓、肺、血液、脳またはその他の器官または組織由来の細胞などの新生細胞を含み得る。いずれの生物も供給源として使用可能であり、限定されるものではないが、細菌、真菌、ウイルス、植物、動物、例えば、ヒト、非ヒト 霊長類、爬虫類、昆虫、鳥類、蠕虫、魚類、哺乳動物、家庭内および農用動物(ウシ、ウマ、ブタ、ヒツジ、ヤギ、イヌ、ネコ、齧歯類など)が含まれる。環境サンプルとしては、限定されるものではないが、表面物質、土壌、水および工業サンプル、ならびに食品および乳製品加工機器から得られるサンプルが含まれる。分析されるサンプルは、単一の供給源(例えば、単一の生物、組織、細胞など)または複数の生物、組織もしくは細胞由来の核酸プールに由来し得る。
工程(i)
第1工程では、本発明の二本鎖DNA分子集団においてメチル化シトシンを同定するための方法は、複数の二本鎖DNA分子の鎖の少なくとも一方の末端に二本鎖DNAアダプターを連結することを含む。好ましくは、二本鎖DNAアダプターは、複数の二本鎖DNA分子の鎖の一方の末端に連結され得る。あるいは、二本鎖DNAアダプターは、複数の二本鎖DNA分子の鎖の両末端に連結されてもよい。
用語「アダプター(adapter)」および「アダプター(adaptor)」は互換的に使用され、対象とする核酸分子に連結され得るオリゴヌクレオチドまたは核酸断片もしくはセグメントを意味する。
本発明の方法の「アダプター分子」は、一方の末端に、二本鎖DNAの末端に適合する末端を有する二本鎖DNA分子である。アダプター分子は、実質的に相補的な第1のDNA鎖と第2のDNA鎖により形成され得る。アダプター分子は、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域が配列相補性によって二本鎖領域を形成し、かつ、第1のDNA鎖の5’領域と第2のDNA鎖の3’領域が相補的でないY−アダプターであり得る。
一実施形態では、二本鎖アダプターの少なくとも一部分は、工程(i)で使用される二本鎖アダプターと総て共通の配列を有する。この場合、工程(iii)および/または増幅工程(iv)においてペアを形成し、変換されたアダプター修飾DNA分子の相補鎖の生成のために同一のプライマーを使用することができる。
場合により、アダプターは、サンプル同定、複合体形成、ペア形成ならびに定量分析を可能とするユニークなコンビナトリアルバーコード(「コンビナトリアル配列」または「バーコード」または「バーコード配列」または「コンビナトリアル標識」とも呼ばれる)を含む。本発明の方法により得られる構築物は、最初の構築物と関連付けられたユニークな識別子の作出、従って、構築物間の識別能の付与を可能とするバーコードを有する。前記ユニークな識別子は、前記識別子を含んでなる特定の構築物およびその後代の同定を可能とする。各ユニークな識別子は、出発サンプル中の個々の分子に関連付けられる。従って、ユニークな識別子を保有する前記の最初の個々の分子のいずれの増幅産物も同一系統であると想定される。コンビナトリアルバーコードはまた、サンプル内の個々の配列のパーセンテージの定量を可能とし、増幅工程中のバイアスおよびエラー制御のモニタリングに有用である。
バーコード配列は、「バイアス制御」の特徴を付与する。増幅が起こる際、いくつかの理由のために一部の断片が選択的に増幅されるようになることがある。この望ましくない効果は、シーケンシングの多くの適用で重要である定量目的、特に、DNAのメチル化状態の分析目的(各細胞の各対立遺伝子は異なるメチル化状態を持ち、一様なサンプルでも不均質な組成を持ち得るので、ほとんどの適用で定量およびバイアス制御が不可欠なものとなる)では大きな問題となる。よって、少なくとも1つのバーコード配列は、バイアス制御を可能とする。複数の二本鎖DNA分子に由来する各二本鎖DNA分子は1以上の異なるバーコード配列を持ち得るので、バイアス制御の実施および所与の二本鎖または一本鎖DNA分子の選択的増幅の検出が可能となり得る。
現在のところ、シーケンシングマシンは、想定する必要のある誤り率を有する。これらのエラーのほとんどは、最終結果では表出され得ず、隠れたままとなる。これはその後の結果の処理および分析にマイナスの結果を及ぼす。本発明の方法は、各ヌクレオチドに関する最大4つの情報源(所与のdsDNAおよび場合に応じてそれらの各合成相補鎖の上鎖および下鎖)を提供し、総ての読み取りが一貫していなければならないので、各ヌクレオチドの読み取りのバリデーションを可能とする。よって、本発明の方法は、(一次配列決定およびシトシンメチル化分析の両方を目的とする)配列決定のエラーの検出および補正をも可能とする。
好ましくは、アダプター分子および/またはヘアピン配列および/またはバーコード配列はそれぞれ、分子ライブラリーとして提供され、ライブラリー内の各メンバーは、下記のように、配列内のコンビナトリアル配列により他と識別可能である。
用語「アダプター分子および/またはヘアピン配列および/またはバーコード配列のライブラリー」および/または「コンビナトリアル標識」は、本明細書で使用する場合、コレクションの各メンバーがアダプターおよび/またはヘアピン配列および/またはバーコード配列内のコンビナトリアル配列により他から識別可能な、アダプター分子および/またはヘアピン配列および/またはバーコード配列のコレクションを意味する。
用語「コンビナトリアル配列」、「バーコード配列」、「バーコード」および「コンビナトリアルバーコード」は、本明細書の全体で互換的に使用され、個々のアダプター/ヘアピン配列または独立したDNA分子(アダプターおよび/またはヘアピン配列に属さない独立したバーコード配列)にユニークな識別子を意味する。好ましくは、バーコード配列は、アダプターおよび/またはヘアピン配列内に含まれる。一実施形態では、アダプター配列/ヘアピン配列内のコンビナトリアル配列は縮重核酸配列である。コンビナトリアル配列は、アデニン、グアニン、チミン、シトシン、メチル化シトシンおよび他の修飾ヌクレオチドを含む、任意のヌクレオチドを含み得る。コンビナトリアル配列のヌクレオチドの数は、好ましくは、コンビナトリアル配列と表される潜在的配列および実際の配列の数がライブラリー内のアダプターの総数よりも多くなるように設計される。コンビナトリアル配列は、アダプター/ヘアピン配列のいずれの領域に位置していてもよい。好ましくは、コンビナトリアル配列は、アダプター/ヘアピン配列の二本鎖領域内に位置する。
場合により、アダプター/ヘアピン配列/バーコード配列には、伸長または増幅工程後に元のDNA鋳型の回収を可能とする、以下に記載される結合対の第2のメンバーで標識された塩基が組み込まれている。これは、DNA鋳型として使用されるサンプルがプロセス中も保存され、センス鎖とアンチセンス鎖により形成される元のDNA鋳型が回収、蓄積可能であり、また、異なる条件で何回も増幅を受けることができ、サンプル消耗なくシーケンシングを受けることができるというさらなる利点を提供する。本発明の方法の概略図を図1に示す。
第1の工程(i)では、本発明の二本鎖DNA分子集団においてメチル化シトシンを同定するための方法はさらに、複数の二本鎖DNA分子の鎖のペアを形成して、複数の、ペアを形成したアダプター修飾DNA分子を提供することを含む。
本発明の方法の第1の工程の「ペアを形成する工程」は、1以上の二本鎖DNA分子の鎖をヘアピン配列(「ヘアピン分子」または「ヘアピンアダプター」とも呼ばれる)と共有結合させることにより行ってもよい。本発明の方法の第1の工程の「ペアを形成する工程」は、バーコード配列を使用することにより行ってもよい。本発明の方法の第1の工程の「ペアを形成する工程」は、ヘアピン配列とバーコード配列の両方を使用することにより行ってもよい。
例えば、本発明の方法の第1の工程の「ペアを形成する工程」は、ヘアピン配列を介して達成され得る。ヘアピン配列はヘアピンループ領域と二本鎖領域を含んでなり得、前記二本鎖領域は、二本鎖DNA分子の末端に(および/またはそれらがすでにDNAに連結されている場合には、バーコード配列の末端に)適合する末端を含む。従って、ペアを形成する工程は、1以上の二本鎖DNA分子の鎖をヘアピン配列と共有結合させることにより行ってよい。ヘアピン配列はまた1以上のバーコード配列を含んでもよい。
この場合、DNA分子の元のセンス鎖およびアンチセンス鎖が物理的に結合された二本鎖DNAライブラリーが得られる(例えば、図1参照)。
用語「ペア形成配列」または「ペア形成分子」は、本発明の文脈では、1以上の二本鎖DNA分子の鎖のペアを形成するのに好適な配列を意味して使用され得る。例えば、「ペア形成配列」は、ヘアピン配列および/または1以上のバーコード配列を意味し得る。用語「ヘアピン配列」(または「ヘアピン分子」または「ヘアピンアダプター」)は、本発明の方法において使用する場合、それら自体が折り返して、同じ鎖上の相補的塩基配列間で塩基対を形成することによって維持される二本鎖領域を形成する、一本鎖核酸により形成される二重鎖を意味する。前記ヘアピン分子はまた、対合していない塩基により形成されたヘアピンループ領域も含んでなる。ヘアピン配列は、二本鎖DNA分子中の二本鎖DNAアダプターの位置に対して二本鎖DNA分子の反対の末端に位置する。
場合により、本発明の方法の第1の工程(工程(i))の「ペアを形成する工程」は、(上記のように「バーコード配列」、「コンビナトリアル配列」および/または「コンビナトリアルバーコード」および/または「バーコード」および/または「コンビナトリアル標識」、とも呼ばれる)のバーコードの使用によって達成され得る。従って、前記ペアの形成工程は、バーコード配列を使用することにより行われ得る。
複数の二本鎖DNA分子の鎖のペアを形成するために使用される「コンビナトリアル配列」、「コンビナトリアルバーコード」、「バーコード配列」または「バーコード」は、1または複数のアダプターおよび/または存在する場合にはヘアピン配列に位置していてもよい。バーコードは、二本鎖DNA分子の一末端または両末端のいずれかに連結され得る独立した二本鎖DNA分子であってもよい。例えば、バーコードは、アダプターおよび/またはヘアピン配列が二本鎖DNA分子に連結される前に二本鎖DNA分子の一末端または二末端に連結してもよい(この場合、アダプターおよび/またはヘアピン配列はバーコードに連結され得る)。例えば、バーコードは、アダプターが二本鎖DNA分子に連結された後に二本鎖DNA分子の一末端または二末端に連結してもよく、従って、アダプターに連結され得る。
前記ペア形成工程はまた、ヘアピン配列とバーコードの両方を使用することにより行ってもよい。
アダプター、ヘアピン配列および/またはバーコード配列は、非メチル化シトシンおよび/またはメチル化シトシンを含み得る。アダプター、ヘアピン配列および/またはバーコード配列は、非メチル化シトシンを含まなくてもよい。例えば、アダプター、ヘアピン配列および/またはバーコード配列は、シトシンを含まない。例えば、アダプター、ヘアピン配列および/またはバーコード配列はメチル化シトシンを含むが、非メチル化シトシンを含まない。例えば、アダプター、ヘアピン配列および/またはバーコード配列は、メチル化シトシンを含む。例えば、アダプター、ヘアピン配列および/またはバーコード配列は、メチル化シトシンと非メチル化シトシンを含む。
アダプターが非メチル化シトシンを含む場合には、これらの非メチル化シトシンは、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基(好ましくは、ウラシル)への変換(本発明の方法の、その実施形態のいずれかの工程(ii))を可能とする試薬で一様に処理され、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基(好ましくは、ウラシル)に一様に変換される。よって、工程(iii)(および場合により工程(iv))で使用されるプライマーは、このような変換後に二本鎖アダプターの少なくとも一部に相補的な配列を含むべきである。
用語「末端」は、本明細書で使用する場合、核酸配列のいずれかの末端(またはその近傍)にある配列の領域を意味する。
用語「適合する」は、本明細書で使用する場合、アダプター分子の末端の一方の両鎖が出発材料として使用される二本鎖DNA分子の一末端または両末端に連結可能なことを意味する。適合末端は、平滑DNA末端、および相補的(complimentary)オーバーハングを有する粘着末端を含む。2つの適合末端は好ましくはギャップまたはミスマッチなく相互に連結することができ、連結して、多くの場合、制限エンドヌクレアー部位を含むDNA配列を作り出すことができる。
用語「平滑末端」は、本明細書で使用する場合、二本鎖DNAの両鎖が同じ長さであり、一塩基対で終わる(すなわち、不対合の塩基が無く、それらの鎖は他とのオーバーラップまたはオーバーハングが無い)ことを意味する。
用語「粘着末端」、「付着末端」および「オーバーハング末端」は本明細書では互換的に使用され、様々なオーバーハングによって作り出される非平滑末端を意味する。オーバーハングは、DNA分子の末端における不対合ヌクレオチドのストレッチである。これらの不対合ヌクレオチドは、いずれかの鎖で3’または5’オーバーハングのいずれかを作り出すことができる。これらのオーバーハングは、ほとんどの場合、パリンドロームである。オーバーハングの最も単純なケースは、単一のヌクレオチドである。これはアデノシンであることが最も多く、数種のDNAポリメラーゼにより3’オーバーハングとして作り出される。この産物は、3’チミンオーバーハングを有する線状DNA分子と連結される。アデニンとチミンは塩基対を形成するので、これはリガーゼによる2分子の連結を助長する。本発明の第1の方法では、工程(i)で使用される二本鎖DNA分子が、工程(i)の前に末端修復され、d−Aテールを有する場合、第1および第2のアダプター分子は3’−チミンオーバーハングを持たなければならない。より長いオーバーハングは制限エンドヌクレアーゼにより作り出される場合が最も多い。例えば、制限エンドヌクレアーゼは、2本のDNA鎖を互いから4塩基対のところで切断して、一方の分子に4塩基5’オーバーハングを、他方に相補的5’オーバーハングを作り出し得る。これらの末端は、それらがリガーゼにより容易に互いに再び連結されるので、付着末端と呼ばれる。異なる制限エンドヌクレアーゼは通常、異なるオーバーハングを作り出すので、2つの異なる酵素でDNA片を切断した後に、それを同じ酵素により作り出された末端を有する別のDNA分子と連結させることが可能である。リガーゼが働くためにオーバーハング同士が相補的でなければならないので、これら2つの分子は一配向でのみ連結し得る。
連結工程(i)は、複数のアダプター修飾DNA分子を得るためのアダプターおよび/またはペア形成分子(ヘアピンおよび/またはバーコード配列)とDNA分子の連結反応に十分な条件下で行われる。
用語「連結反応」は、本明細書で使用する場合、2以上の核酸の末端間の共有結合(covalent bond or linkage)の形成を意味する。結合(bond or linkage)の性質は極めて多様であり得、連結反応は酵素的または化学的に遂行され得る。本明細書で使用する場合、連結反応は通常、一方の核酸の5’炭素末端ヌクレオチドと他方の核酸の3’炭素の間のホスホジエステルを形成するように酵素的に遂行される。連結反応に十分な条件は、1または2つのアダプターに連結された二本鎖DNA分子の取得を可能とする任意の条件である。DNAリガーゼを使用しない連結反応の手順も知られているが、好ましい条件はDNAリガーゼの使用である。
前記ペア形成は、アダプターおよび/またはヘアピン配列の連結反応の前または後のいずれか、または連結反応と同時に行うことができる。好ましくは、前記ペア形成は、アダプターおよび/またはヘアピン配列の連結反応と同時に行われる。
本発明の方法の第1の工程(工程(i))の結果得られるものは、複数のDNA分子である。
本発明の方法に関して、本発明の方法の工程(i)のペア形成工程はヘアピン配列の存在により達成され(例えば、ヘアピン配列それ自体の存在によるか、またはヘアピン配列と1以上のバーコード配列の存在による)、工程(i)で得られるDNA分子は、
A)一方の末端で1つのアダプター分子(場合により少なくとも1つのバーコード配列を含む)と、他方の末端で第2の分子と連結された二本鎖DNA分子、ここで、第2の分子はヘアピン配列(場合により1以上のバーコード配列を含む)である(これらはいわゆるペアを形成したアダプター修飾DNA分子である);
B)ヘアピン配列の不在下で2つのアダプター分子と連結された二本鎖DNA分子(少なくとも1つの各末端で);
C)ヘアピン配列および/またはバーコード配列であり得る2つの分子と連結された二本鎖DNA分子(少なくとも1つの各末端で);および
D)いずれの分子も連結されていない二本鎖DNA分子(元の二本鎖DNA分子、すなわち、非修飾二本鎖DNA分子)
であり得る(図1参照)。
本発明の方法に関して、本発明の方法の工程(i)のペア形成工程が(1以上の)バーコード配列の存在により、ヘアピン配列の不在下で達成される場合、工程(i)で得られるDNA分子は、
A)二本鎖DNA分子(少なくとも1つのバーコード配列を含む)の末端のそれぞれで1つのアダプター分子と連結された二本鎖DNA分子(これらはいわゆるペアを形成した、アダプター修飾DNA分子である);
B)二本鎖DNA分子の末端の1つのみで少なくとも1つのアダプター分子と連結された二本鎖DNA分子;
C)この場合には、アダプター分子の不在下で、二本鎖DNA分子の末端のそれぞれで少なくとも1つのバーコード配列と連結された二本鎖DNA分子;および
D)いずれの分子も連結されていない二本鎖DNA分子(元の二本鎖DNA分子、すなわち、非修飾二本鎖DNA分子)
であり得る。
本発明の方法の工程(i)のペア形成工程が(1以上の)バーコード配列の存在下、ヘアピン配列の不在下で達成される場合、工程(i)で得られるペアを形成したアダプター修飾DNA分子は、二本鎖DNA分子の末端のそれぞれで1つのアダプター分子(両鎖のペア形成のための少なくとも1つのバーコード配列を含む)に連結されるべきである。
二本鎖DNA分子の集団は、工程(i)の前に、アダプター分子とDNA分子の連結反応、それによる前記DNA分子における付着末端の導入のために十分な条件下で、アダプター分子で処理してよい。付着末端を有するアダプター分子は、好適な制限エンドヌクレアーゼ酵素による二本鎖DNAの消化によって得てもよく、または一本鎖オリゴヌクレオチドのアニーリングによるなどの合成により生成してもよい。
工程(i)におけるアダプターおよび/またはペア形成分子(例えば、ヘアピン配列および/またはバーコード配列)の連結反応の後、反応混合物から、上記選択肢(A)に従って(上記のように前記ペア形成分子に依存する)アダプターおよび/またはヘアピン配列および/またはバーコード配列を含んでなる分子、すなわち、一方の末端で1つのアダプター分子(場合により少なくとも1つのバーコード配列を含む)と、他方の末端で第2の分子と連結された二本鎖DNA分子を回収するために、場合により捕捉工程(または「回収工程」または「精製工程」))を行ってもよく、ここで、第2の分子は、ペア形成が少なくとも1つのヘアピン分子の存在下で達成される場合にはヘアピン配列(場合により1以上のバーコード配列を含む)であり、前記ペア形成がヘアピン配列の不在下で(少なくとも1つのバーコード配列によってのみ)達成される場合には、二本鎖DNA分子の末端のそれぞれで1つのアダプター分子(少なくとも1つのバーコード配列を含む)と連結された二本鎖DNA分子である(「回収工程」)。よって、本発明の方法の第1の工程(i)は、工程(i)で得られたDNA分子の集団から、ペアを形成したアダプター修飾DNA分子(上記の(A)の分子)の一末端または二末端にアダプターおよび/またはヘアピン配列および/またはバーコード配列を含んでなるアダプター修飾DNA分子である分子を回収することをさらに含み得る。
前記工程は、アダプターおよび/またはヘアピン配列および/またはバーコード配列(上記(A)による)を含んでなる工程(i)で得られたペアを形成したアダプター修飾DNA分子を、生じたDNA分子(例えば、上記B)〜D)による)(上記(A)によらない)の残りの部分から分離することを可能とする。前記捕捉工程は、例えば、ヘアピン配列および/もしくはバーコード配列に対して親和性を有するが、アダプター分子に対しては親和性を有さないプローブもしくはリガンドの手段により、またはアダプター分子に対してのみ親和性を有するプローブもしくはリガンドの手段により行われ得る。
これは、DNA鋳型として使用されるサンプルがプロセス中に保存され、センス鎖とアンチセンス鎖により形成される元のDNA鋳型が回収、蓄積可能であり、また、異なる条件で何回も増幅を受けることができ、サンプル消耗なくシーケンシングを受けることができる(上記工程iiiおよび/またはiv)という利点を提供する。概略図を図1に示す。
好ましくは、回収工程(「捕捉工程」または「精製工程」または「分離工程」とも呼ばれ得る)は、アダプターおよび/またはヘアピン配列および/またはバーコード配列および精製タグの配列の少なくとも一部に相補的である配列を含んでなるポリヌクレオチドを使用して行われる。
用語「ポリヌクレオチド」は、本明細書で使用する場合、共有結合された複数のヌクレオチドモノマーを含んでなる一本鎖DNAまたはRNA分子を意味する。好ましくは、ポリヌクレオチドは、8以上のヌクレオチドモノマーを有する。好ましい実施形態では、ポリヌクレオチドは、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも18、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100以上のヌクレオチド長を有する一本鎖DNA分子である。
用語「精製タグ」は、本明細書で使用する場合、ポリヌクレオチドおよび標的配列の分離を可能とする部分を意味する。好ましくは、ポリヌクレオチドのDNA骨格は、アフィニティー精製タグにコンジュゲートされた1以上のヌクレオチドを含む。好ましくは、アフィニティー精製タグは、結合対のメンバーであり得る。より好ましくは、アフィニティー精製タグはビオチンであって、二本鎖DNA分子はアビジンまたはストレプトアビジンを用いたアフィニティー精製により単離される。前記工程は、限定されるものではないが、磁性ビーズの手段によって行うことができる。
工程(ii)の前に、工程(i)で生じた複数の、ペアを形成したアダプター修飾DNA分子(上記(A)で定義される、両場合とも前記ペア形成分子に依存する)が、工程(i)のB)〜D)に従って生じたDNA分子から分離され、上記(A)のペアを形成したアダプター修飾DNA分子のライブラリーが生成され得る。よって、本発明の方法は、DNA分子の元のセンス鎖とアンチセンス鎖がペアを形成している二本鎖DNAライブラリーの取得を可能とする。
用語「DNAライブラリー」は、本明細書で使用する場合、対象とするDNA断片を同定および単離するための、アダプター分子と連結されたDNA断片のコレクションを意味する。
「二本鎖DNAライブラリー」という表現は、本文脈では、(例えば、ヘアピン配列により)それらの末端の1つにより物理的に連結され、同じ分子の一部を形成するNA分子の両鎖(すなわち、センス鎖とアンチセンス鎖)を含むライブラリーを意味し得る。二本鎖DNAライブラリーは、環状ライブラリーではない。DNA分子の元の鎖は、それらの末端の1つでループにより物理的に連結され、従って、センス鎖とアンチセンス鎖の間で二重鎖を形成していてもよい(上記A)による)。二本鎖DNAライブラリーの各分子はまた、DNA分子のセンス鎖とアンチセンス鎖の間の相補性が部分的または完全に失われた場合には、線状コンフォメーションであってもよい。あるいは、「二本鎖DNAライブラリー」という表現は、本発明の方法に関して、DNA分子の両鎖がそれらの末端の1つで物理的に連結されていないが、例えば、少なくとも1つのバーコード配列を用いてペアを形成している(上記A)による)ライブラリーを意味する。
本発明の方法の工程(i)の連結反応工程は「接触工程」と呼ばれ得る。
工程(ii)
DNAのメチル化は一般にCpG部位(シトシン−リン酸−グアニン部位、ここで、DNA配列ではシトシンの後に直接グアニンがくる)で起こる。このメチル化は、シトシンの5−メチルシトシンへの変換をもたらす。Me(メチル)−CpGの形成は、酵素としてのDNAメチルトランスフェラーゼにより触媒される。ヒトDNAは約80〜90%のメチル化CpG部位を有するが、メチル化されないGCが豊富な(約65%のCG残基から構成される)、CpGアイランドとして知られる特定の領域が存在する。これらは、遍在的に発現される総ての遺伝子を含め、哺乳動物遺伝子の56%のプロモーターに関連している。ヒトゲノムの1〜2パーセントはCpGクラスターであり、CpGメチル化と転写活性の間には逆相関が存在する。
メチル化のパターンは、いくつかの疾患の研究に重要である。正常組織では、遺伝子のメチル化は主としてCpGが少ないコード領域に存在し、一方、遺伝子のプロモーター領域は、その領域にCpGアイランドの密度が高いにもかかわらずメチル化されていない。しかしながら、癌では、メチル化がアンバランスで、ゲノムワイドな低メチル化に、局部的な高メチル化およびDNAメチルトランスフェラーゼの発現の増加が付随している。いくつかの遺伝子のメチル化状態は、腫瘍形成のバイオマーカーとして使用され得る。
第2の工程(工程(ii))では、工程(i)の後に生じたペアを形成したアダプター修飾DNA分子の集団が、サンプルのメチル化パターンを分析するために、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基(好ましくは、ウラシル)への変換を可能とする試薬で処理される。好ましくは、工程(iii)(および場合により(iv))で使用されるプライマーは、前記試薬で処理された後のアダプター分子に特異的である。図1は本発明の方法のこの実施形態を示す概略図を示す。
「ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基」という表現は、本明細書で使用する場合、相補鎖においてグアニンとハイブリダイズできない塩基を意味する。好ましくは、シトシンとは検出可能に異なる塩基は、チミンまたはウラシルであり、より好ましくはウラシルである。
この工程で使用される試薬は、非メチル化シトシンを、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基に変換できるが、メチル化シトシンには作用できない試薬でなければならない。このような薬剤の例としては、限定されるものではないが、バイサルファイト、メタバイサルファイトおよびシチジン−デアミナーゼ、例えば、活性化誘導シチジンデアミナーゼ(AID)が挙げられる。好ましい実施形態では、前記試薬はバイサルファイトである。本明細書で使用する場合、バイサルファイトイオンは、HSO3−というその関連の意味を有する。一般に、バイサルファイトは、バイサルファイト塩、例えば、式NaHSO3を有する重亜硫酸ナトリウム、または式Mg(HSO3)2を有するマグネシウムバイサルファイトの水溶液として使用される。バイサルファイト化合物の好適なカウンターイオンは一価または二価であり得る。一価陽イオンの例としては、限定されるものではないが、ナトリウム、リチウム、カリウム、アンモニウム、およびテトラアルキルアンモニウムが挙げられる。好適な二価陽イオンとしては、限定されるものではないが、マグネシウム、マンガン、およびカルシウムが挙げられる。バイサルファイトでDNAを処理すると、非メチル化シトシン塩基はウラシルに変換されるが、5−メチルシトシン塩基は影響を受けずに残る。前記変換は標準的な手順(Frommer et al. 1992, Proc Natl Acad Sci USA, 89:1827-31; Olek, 1996, Nucleic Acid Res. 24:5064-6; EP 1394172)により行われる。サンプルを得るための方法は、reduced representation bisulfite sequencing(RRBS)に使用されるものを含む。
好ましくは、ペアを形成したDNA分子における(非メチル化)シトシンのウラシルの変換はバイサルファイトにより行われる。
工程(ii)で得られたペアを形成したアダプター修飾DNA分子は、非メチル化シトシンを、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基(上記のように、好ましくはウラシル)に変換し得る試薬で処理され、元の二本鎖DNA分子のセンス鎖とアンチセンス鎖の間の相補性が部分的または完全に失われる。これは次工程で使用されるプライマーのアニーリングを助長する。これはまた、特に鎖の一方が非メチル化シトシンを有し、メチル化シトシンを有さない場合に、工程(iii)で相補鎖の生成を助長する。
ペアを形成したアダプター修飾DNA分子は、センス鎖またはアンチセンス鎖を含有する領域の1つのヌクレオチドは、他の領域の100%未満、99%未満、95%未満、90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、3%未満、1%未満、0.5%未満、0.1%未満と対合する場合に、元の二本鎖DNA分子のセンス鎖とアンチセンス鎖を含有する領域の間の相補性が部分的に失われたと見なされる。センス鎖またはアンチセンス鎖を含有する領域の1つのヌクレオチドが他の領域の0%と対合する場合に、相補性が完全に失われたと見なされる。
元の二本鎖DNA分子が完全にメチル化されている特定の場合では、元の二本鎖DNA分子のセンス鎖とアンチセンス鎖の間の相補性は、非メチル化シトシンを、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基(例えば、ウラシル)へ変換し得る試薬により処理の後にも失われない。鎖の1つが(非メチル化)シトシンを有するが、メチル化シトシンを有さない特定の場合では、相補性が最適に失われる。
工程(iii)
第3の工程において、DNA鎖は、工程(ii)で得られたペアを形成し変換されたアダプター修飾DNA分子を鋳型として用い、鎖の合成を起こす条件下で、その配列が第1のアダプター分子の配列の少なくとも一部に相補的なプライマーを用いて合成される。よって、本発明の方法の工程(iii)は、ペアを形成し変換されたアダプター修飾DNA分子の相補鎖を、ヌクレオチドA、G、CおよびTとその配列が二本鎖アダプターの少なくとも一部に相補的であるプライマーを用いて提供し、部分的に変換された、ペアを形成した二本鎖分子を提供する。
例えば、バイサルファイトによる処理の後に、工程(ii)で得られた変換されペアを形成したアダプター修飾DNA分子を鋳型として用い、その配列がアダプター分子の配列の少なくとも一部にまたはアダプター分子の相補配列の少なくとも一部に相補的なプライマー(好ましくは、工程(iii)(および場合により(iv)で使用されるプライマーは、従前に記載したように、工程(ii)で使用される試薬で処理した後にアダプター分子、またはその相補配列に特異的である)を用いてDNA鎖が合成され、場合により得られた産物が増幅されてもよい。ウラシルはTaqポリメラーゼによればチミンとして認識され、伸長(場合により増幅工程)の後に、得られる産物は、DNA鋳型が非メチル化シトシンを有する位置にチミンを含み、かつ、DNA鋳型が5−メチルシトシンを有する位置にシトシンを含む。
「DNA鎖を合成する」という表現は、鎖の合成を起こす条件下での、鋳型として使用されるアダプター修飾DNA分子に相補的なDNA分子の合成を意味する。
用語「鋳型」は、新たな鎖の遺伝子配列を設定するDNA鎖を意味する。
「鎖の合成を起こす条件下」という表現は、工程(i)で使用される二本鎖DNA分子のセンス鎖とアンチセンス鎖を含有する領域で相補的塩基間の水素結合を切断する条件を意味する。前記条件は、元の二本鎖DNA分子のセンス鎖およびアンチセンス鎖を含有する領域の分離に十分な条件であり、これには、限定されるものではないが、ペア形成がヘアピン分子により得られた場合には、工程(i)の後に得られるアダプター修飾DNA分子の線状形態の適合を可能とする条件、または鎖置換DNAポリメラーゼなどの等温技術の使用が含まれる。
前記領域の分離に十分な条件は、例えば、分子を94〜98℃で20秒〜2分間加熱することにより両領域の変性を達成し、相補的塩基間の水素結合の切断を引き起こす。前記領域の分離はまた、等温技術の使用により、例えば、限定されるものではないが、Phi29DNAポリメラーゼまたはバチルス・ステアロサーモフィラス(Bacillus stearothermophilus)DNAポリメラーゼの大断片などの鎖置換DNAポリメラーゼの使用によって、分子を加熱せずに実施され得る。
加えて、工程(i)で得られたペアを形成したアダプター修飾DNA分子が、非メチル化シトシンをハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基(例えば、ウラシル)へ変換し得る試薬で処理されると、元の二本鎖DNA分子のセンス鎖とアンチセンス鎖の間の相補性が部分的にまたは完全に失われる。これは、特に鎖の1つが非メチル化シトシンを有するがメチル化シトシンを有さない場合に相補鎖の合成を助長する。
用語「プライマー」は、本明細書で使用する場合、別の核酸の配列に相補的で、DNA合成の開始点として機能する、核酸の短い鎖を意味する。好ましくは、プライマーは、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも18、少なくとも20、少なくとも25、少なくとも30以上の塩基長を有する。
用語「相補的」は、ヌクレオチドまたは核酸間、例えば、二本鎖DNA分子の2鎖間、または一本鎖核酸上のオリゴヌクレオチドプライマーとプライマー結合部位の間、またはオリゴヌクレオチドプローブとDNA分子内のその相補配列の間での二重鎖の形態を可能とする塩基対合を意味する。相補的ヌクレオチドは一般に、AとT(もしくはAとU)、またはCとGである。2つの一本鎖DNA分子は、一鎖のヌクレオチドが最適にアラインされ、比較され、適当なヌクレオチド挿入または欠失を伴って、他の鎖の約60%、少なくとも70%、少なくとも80%、少なくとも85%、通常には少なくとも約90%〜約95%、さらには約98%〜約100%と対合する場合に、実質的に相補的であると言われる。2つヌクレオチド領域間の同一性の程度は、当業者に広く知られているコンピューターおよび方法に実装されたアルゴリズムを用いて決定される。2つのヌクレオチド配列間の同一性は好ましくは、BLASTNアルゴリズム(BLAST Manual, Altschul, S. et al., NCBI NLM NIH Bethesda, Md. 20894, Altschul, S., et al., J., 1990, Mol. Biol. 215:403-410)を用いて決定される。
プライマーはアダプター分子の配列と(好ましくは、工程(ii)において試薬、好ましくはバイサルファイトによる処理後の、それから誘導された配列と)低ストリンジェンシー条件、好ましくは中ストリンジェンシー条件、最も好ましくは高ストリンジェンシー条件下でハイブリダイズし得る。工程(iii)で、およびこの場合には工程(iv)で使用されるプライマーは、従前に記載したように、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬(例えば、バイサルファイト)で処理された後に、アダプター分子に対して特異的である。
「ハイブリダイゼーション」は、2つの一本鎖ポリヌクレオチドが非共有結合的に結合して安定な二本鎖ポリヌクレオチドを形成するプロセスを意味する。「ハイブリダイゼーション条件」は、一般におよそ1M以下、より通常には約500mM未満の塩濃度を含み、約200mM未満であり得る。「ハイブリダイゼーションバッファー」は、5%SSPEなどの緩衝塩溶液、または当技術分野で公知の他のこのようなバッファーである。ハイブリダイゼーション温度は5℃という低い温度であってもよいが、一般には22℃より高く、一般には約30℃より高く、一般には37℃を超える。ハイブリダイゼーションは、多くの場合、ストリンジェント条件、すなわち、プライマーがその標的部分配列とハイブリダイズするが、他の非相補配列とはハイブリダイズしない条件下で行われる。ストリンジェント条件は配列に依存し、状況が異なれば異なる。例えば、長い断片は、短い断片よりも特異的ハイブリダイゼーションに高いハイブリダイゼーション温度を要求し得る。相補鎖の塩基組成および長さ、有機溶媒の存在、ならびに塩基のミスマッチの程度を含め、他の因子もハイブリダイゼーションのストリンジェンシーに影響を及ぼし得るので、いずれか1つのパラメーター単独の絶対的尺度よりもパラメーターの組合せがより重要である。一般に、ストリンジェント条件は、定義されたイオン強度およびpHで特定の配列のTmよりも約5℃低くなるように選択される。例示的ストリンジェント条件としては、約7.0〜約8.3のpHおよび少なくとも25℃の温度で少なくとも0.01M〜1Mを超えないナトリウムイオン濃度(または他の塩)の塩濃度を含む。
ゆえに、変換され、ペアを形成したアダプター修飾DNA分子は、当技術分野で周知の方法(すなわち、DNAポリメラーゼおよびdNTPによる伸長/延長)により、二本鎖DNA分子(1または場合に応じて2つの分離した一本鎖分子、ペア形成のタイプ(物理的かまたはバーコード配列によるか)に依存する)に変換されて、部分的に変換された(元の鎖は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基(好ましくは、ウラシル)への変換を可能とする試薬で処理することにより影響を受けたが、新たに生じたものは影響を受けない)、ペアを形成した二本鎖DNA分子が提供される。
工程(ii)で回収される、ペアを形成し変換されたアダプター修飾DNA分子はまた、2つのヘアピン分子におよび/または2つのバーコード配列に(例えば、回収または精製工程が行われなかった場合)連結された二本鎖DNA分子も含み得る。しかしながら、ヘアピン分子/バーコード配列には、工程(iii)で使用されるプライマーの標的配列が存在しないので、前記分子は二本鎖DNA分子に変換されない。図2は、本発明の方法の伸長工程を示し、この場合、二本鎖DNA分子の一末端に連結された1つのアダプターを有する連結反応産物だけが延長および増幅される。
工程(ii)後、または工程(iii)後または工程(iv)後に得られる構築物は、本発明の二本鎖DNAライブラリーを形成し、シーケンシングまたは他の従来の分子生物学的技術に使用可能である。
工程(iii)はまた、「伸長工程」とも呼ばれ得る。
工程(iv)(「増幅工程」とも呼ばれる)
場合により、前記構築物は、以降の工程のために材料の量を増すために増幅することができる。好ましい実施形態では、工程(iii)で得られた二本鎖DNA分子は、その配列がアダプター領域の少なくとも一部に相補的なプライマーを用いて増幅される(上記で既述のように、(iv)で使用されるプライマーは、工程(ii)の試薬で処理した後にアダプター分子に特異的である)。
よって、任意選択の第4の工程では、本発明の方法は、工程(iii)で得られた、部分的に変換されペアを形成した二本鎖DNA分子を増幅して、増幅されペアを形成した二本鎖DNA分子を提供することを含んでなる。
DNA増幅は、二本鎖DNA分子のin vitro合成により前記分子の複数のコピーを作り出すことを可能とする。DNA増幅のためのいずれの方法も使用可能である。好ましくは、それはポリメラーゼ連鎖反応により行われる。別の実施形態では、それは種々のプローブ(例えば、LightCycler、Taqman、Escorpio、Sunrise、Molecular BeaconまたはEclipse)を用いてリアルタイム−PCRにより行うことができる。起こり得るバイアスを克服するために、同じサンプルのアリコートに対して異なる増幅条件を使用することができる。
本発明の方法により得られた二本鎖DNA分子は、反応混合物から回収され得る(「回収工程」または「精製工程」)。従って、好ましくは、工程(iii)または場合に応じて工程(iv)で得られたDNA分子が反応混合物から回収される。より好ましくは、前記回収は、結合対の第1のメンバーを用いて行われ、ここで、工程(iii)または場合に応じて工程(iv)で使用されるプライマーは、前記結合対の第2のメンバーで修飾される。
場合により、元の複数の二本鎖DNA分子が回収可能である。工程(i)で得られるペアを形成したアダプター修飾DNA分子は、伸長および増幅工程の元の鋳型として働く。前記元の鋳型はこの処理において破壊されず、保存および再利用またはその後の工程のために蓄積することができる。この目的を達成するために、元の鋳型は修飾アダプター/ヘアピン配列/バーコード配列でタグ付けされ得る。よって、好ましい実施形態では、工程(i)で得られるペアを形成したアダプター修飾DNA分子は、工程(iii)後または場合に応じて工程(iv)後に得られる反応混合物から回収される。より好ましい実施形態では、前記回収は結合対の第1のメンバーを用いて行われ、ここで、アダプターおよび/またはヘアピン配列および/またはバーコード配列は、前記結合対の第2のメンバーで修飾される。
用語「反応混合物」は、本明細書で使用する場合、工程(iii)および/または(iv)が行われた後に得られる混合物を意味する。前記反応混合物は、試薬と、鋳型として使用されるペアを形成したアダプター修飾DNA分子と、非反応性のペアを形成したアダプター修飾DNA分子と、二本鎖DNAライブラリーを形成する分子を含む反応産物との組合せにより形成される。
用語「結合対」は、本明細書で使用する場合、第1のメンバーと第2のメンバーにより形成される対を意味し、抗原/抗体(ジゴキシゲニン/抗ジゴキシゲニン抗体)またはハプテン/抗ハプテン系などの免疫型結合対種のいずれか;およびまたビオチン/アビジン、ビオチン/ストレプトアビジン、葉酸/葉酸結合タンパク質、相補的核酸セグメント、AまたはGタンパク質/免疫グロブリンなど、二成分が、抗体ではないが互いに対して天然の親和性を共有する系を含む非免疫型結合対種のいずれか;およびマレイミドおよびハロアセチル誘導体を含むスルフヒドリル反応性基と、イソチオシアネート、スクシンイミジルエステルおよびスルホニルハリドなどのアミン反応性基など、互いに共有結合を形成する共有結合対が含まれる。
工程(iii)または工程(iv)で使用されるプライマーの配列、またはアダプターおよび/またはヘアピン配列および/またはバーコード配列の配列は、結合対の第2のメンバー(例えば、ジゴキシゲニン、ビオチンなど)で標識された塩基を組み込むように設計することができる。組み込まれた標識塩基は、それらと、場合により支持体に結合された、結合対の第1のメンバーとの複合体を形成するために使用することができる。
工程(iii)およびこの場合には工程(iv)で使用されるプライマーは、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬(例えば、バイサルファイト)で処理した後に、アダプター分子に対して特異的である。用語「特異的」は、本明細書で使用する場合、プライマーが、前記分子が非メチル化シトシンを、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基(好ましくは、ウラシル)に変換する試薬で処理された場合にのみアダプター分子とハイブリダイズし得ることを意味する。好ましくは、前記プライマーは、それが前記変換を受ける前にはアダプター分子とハイブリダイズできない。アダプター分子が非メチル化シトシンを含む場合、工程(iii)および/または(iv)で使用されるプライマーは、元のアダプター分子の非メチル化シトシンと対合する位置に、グアニン塩基の代わりにアデニン塩基を有する。アダプター分子は、メチル化シトシンまたは非メチル化シトシンを含み得る。場合により、アダプター分子、ヘアピン配列および/またはバーコード配列の配列の特定の部分が前記試薬により処理の後に変化しないようにするために、第1のアダプター分子およびこの場合には、好ましくはアダプター配列内のコンビナトリアル配列の配列は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に対して耐性のある修飾シトシンを含み得る。
用語「修飾シトシン」は、本明細書で使用する場合、非メチル化シトシンをシトシンとは検出可能に異なる塩基に変換する試薬による処理によっては、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基へ変換できない修飾シトシンを得るために、1以上の原子または基の置換または付加により修飾されたシトシン塩基を意味する。アダプター配列に、および好ましくは本発明のアダプター、ヘアピン配列および/またはバーコード配列のコンビナトリアル配列に好適な修飾シトシンの例としては、限定されるものではないが、メチルシトシンおよび5−ヒドロキシメチルシトシンが挙げられる。前記修飾シトシンは、それらが処理後も不変を維持するので(例えば、メチルシトシン)またはバイサルファイト処理時にそれらはグアニンに相補的な塩基に変換されて、ポリメラーゼ塩基増幅およびシーケンシングにおいてシトシンとして読み取られるので(例えば、シトシン−5−メチルスルホネートに変換される5−ヒドロキシメチルシトシン)、試薬による処理に対して耐性がある。
次に、工程(iii)および/または工程(iv)で得られるペアを形成したDNA分子(および/または、場合により、あまり好ましくはないが、工程(ii)で得られるペアを形成したDNA分子)を配列決定する(本明細書の下記の「シーケンシング工程」の節を参照)。
ある位置におけるメチル化シトシンの存在は、工程(iii)および/または工程(iv)で得られるペアを形成した二本鎖DNA分子の鎖の一方にシトシンが見られ、かつ、ペアを形成した二本鎖DNA分子の他方の鎖の対応する位置にグアニンが見られる場合に決定され、またはこの場合、ある位置における非メチル化シトシンの存在は、工程(iii)または工程(iv)で得られるペアを形成した二本鎖DNA分子の鎖の一方にウラシルまたはチミンが見られ、かつ、ペアを形成した二本鎖DNA分子の他方の鎖の対応する位置にグアニンが見られる場合に決定される。このことは下記の「メチル化シトシンの同定」の節にさらに記載される。
本発明の方法の第1の実施形態
本発明の方法は、固相支持体上で行われ得る。具体的には、二本鎖アダプター、ヘアピン配列および/またはバーコード配列は、支持体に固定されて提供され得る。固相支持体が使用される場合、シーケンシングマシンによる高度自動化およびより高度のサンプル保存(サンプルの永続性)が期待される。
固定は好ましくは、二本鎖アダプター、ヘアピン配列および/またはバーコード配列の鎖の1つの末端を前記支持体に結合させることにより行われ得る。好ましくは、二本鎖アダプター、ヘアピン配列および/またはバーコード配列の鎖の1つの末端が支持体に結合される。よって、二本鎖アダプター、ヘアピン配列および/またはバーコード配列が支持体に固定される場合、連結反応のセンスは、特定のアダプター/ヘアピン配列またはバーコード配列がDNA分子の特定の末端に連結されるように配向させることができる。
二本鎖アダプター分子、ヘアピン配列および/またはバーコード配列が支持体に固定される場合、工程(i)で得られるペアを形成したアダプター修飾DNA分子は支持体との結合を維持するので、上記のような元のDNA鋳型を回収するための工程は必要とされない。
加えて、アダプター分子が支持体に固定される場合、工程(i)で得られるペアを形成したアダプター修飾DNA分子は総て、一方の末端でアダプター分子に連結され、ペアの形成がヘアピン分子の存在によって起こる場合には、他方の末端でヘアピン配列に、および場合によりバーコード配列に連結された二本鎖DNA分子である。ペアの形成がヘアピン配列の不在下で、すなわち、バーコード配列によってのみ起こる場合には、工程(i)で得られるペアを形成したアダプター修飾DNA分子は、その末端の両方でアダプター分子に連結され、加えて少なくとも1つのバーコード配列を含んでなる二本鎖DNA分子である。よって、一方の末端にアダプター配列を、他方の末端にヘアピン配列および/またはバーコード配列および/またはアダプター配列を含んでなる分子(上記のようなA)の分子)を工程(i)で得られる分子の集団から回収することは必要とされない。加えて、二本鎖アダプター、ヘアピン配列および/またはバーコード配列が支持体に固定されて提供され本発明のこの実施形態では、工程(i)のペア形成は、二本鎖アダプターを支持体上の所定の位置に配置することにより行われ得る。
用語「支持体」は、本明細書で使用する場合、限定されるものではないが、プラスチック、ラテックス、ガラス、金属(すなわち、例えば、磁化金属)、ナイロン、ニトロセルロース、石英、ケイ素またはセラミックを含む、核酸と化学的に結合するように構成されたいずれの材料も意味する。支持体は好ましくは固体であり、略球形(すなわち、例えばビーズ)であり得るか、またはマイクロウェルプレートまたは表面などの標準的な実験容器を含んでなってもよい。
用語「固定された」は、本明細書で使用する場合、伸長、増幅、延長、および本明細書に記載の他のプロセスの条件下で安定な会合を提供する様式での分子(例えば、アダプター、ヘアピン配列、バーコード配列)と支持体間の会合または結合を意味する。このような結合は、共有結合または非共有結合であり得る。非共有結合としては、電気的、親水性および疎水性の相互作用が含まれる。共有結合は、原子間で電子対を共有することを特徴とする共有結合である。このような共有結合は直接的なアダプターと支持体間の結合であってもよいし、または支持体もしくはアダプターのいずれかもしくは両方に特定の反応性基を含ませることにより形成され得る。アダプターの共有結合は、支持体に固定されたアビジンまたはストレプトアビジンなどの結合相手およびビオチン化アダプターとアビジンまたはストレプトアビジンとの非共有結合を用いて達成され得る。固定はまた共有結合的相互作用と非共有結合的相互作用の組合せを含んでもよい。
アダプター、ヘアピン配列および/またはバーコード配列は、まず合成し、その後、支持体に結合させてもよい。あるいは、アダプター、ヘアピン配列および/またはバーコード配列は、支持体上で直接合成されてもよい。好ましくは、前記固定は、アダプター、ヘアピン配列および/またはバーコード配列の鎖の一方の末端またはヘアピンループのヌクレオチドを前記支持体に共有結合させることにより行われる。
好ましくは、アダプターは支持体に結合されているが、ヘアピン配列および/またはバーコード配列は前記支持体に結合されていない。この実施形態に関して、支持体に結合された各アダプター分子は、1つの二本鎖DNA分子がこれらのアダプターの2つに連結しないように、近傍のアダプター分子から十分に離れている。本発明の方法の工程(i)によれば、一実施形態において、複数の二本鎖DNA分子が、支持体に結合されたアダプター分子と接触され、1つだけのアダプターが各二本鎖DNA分子に連結され得る。その後、アダプターおよび/またはヘアピン配列および/またはバーコード配列が、二本鎖DNA分子の遊離末端に連結され得る。
あるいは、ヘアピン配列および/またはバーコード配列は支持体に結合されてよいが、アダプター分子は前記支持体に結合されない。この実施形態のこの文脈では、支持体に結合された各ヘアピン配列および/またはバーコード配列は、1つの二本鎖DNA分子がこれらの分子の2つに連結しないように、近傍のヘアピン配列および/またはバーコード配列から十分に離れている。例えば、最初の複数の二本鎖DNA分子を、支持体に結合されたヘアピン配列および/またはバーコード配列と接触させてよく、1つだけのヘアピン配列および/またはバーコード配列が各二本鎖DNA分子に連結され得る。その後、アダプター分子が二本鎖DNA分子の遊離末端に連結される(ヘアピンが支持体に結合され、かつ、二本鎖DNA分子のもう一方の末端に連結された場合)。ペア形成はバーコード配列のみにより(ヘアピン配列の不在下で)達成され、バーコード配列は支持体に結合される場合には、まず(firs)、アダプターが、結合されたバーコード配列に連結されなければならない。次に、そのアダプターに二本鎖DNA配列が連結されなければならない。最後に、その二本鎖DNA分子の遊離末端に他のアダプター分子が連結される。
あるいは、アダプター分子とヘアピン配列および/またはバーコード配列は支持体に結合されてもよい。ペア形成がバーコード配列の存在によってのみ(ヘアピン配列の不在下で)達成される場合には、二本鎖DNA分子が2つの同一のアダプターではない2つの同一の分子に連結しないようにするためのさらなる対策をとらなければならず、この場合、二本鎖DNA分子が、二本鎖DNA分子の各末端に1つずつ、2つのアダプターに連結される。
本発明の方法を固相支持体上で実施する利点(例えば、上記のように固相支持体にアダプターおよび/またはヘアピン配列および/またはバーコード配列を固定することによる)は下記の通りであり得る。
・連結反応の方向が制御可能であり、従って、望ましくない連結反応(例えば、分子と2つのヘアピン配列との連結反応など)が生じない。加えて、元の複数の二本鎖DNA分子が固相支持体に固定されるので、最初の材料の損失がない。
・加えて、反応がフローセルで実施できる。反応(例えば、連結反応、変換、相補鎖の生成)が行われた後に、元の材料が保存および再利用され得る(それが支持体に結合されているため)。フローセルはNGS(次世代シーケンシング)デバイスに統合することができ(架橋増幅またはシーケンシング反応などの特定の反応がフローセルそれ自体で実施できる)、プロセスの自動化および簡素化が可能である。
上記のように、二本鎖アダプターの連結反応、およびプロセスの終了時に支持体に固定される複数の二本鎖DNA分子の鎖のペア形成の後に、ペアを形成したアダプター修飾DNA分子の両鎖に存在する(非メチル化)シトシンは、上記のように、ペアを形成したアダプター修飾DNA分子においてシトシンとは検出可能に異なる塩基(好ましくは、ウラシル)に変換される(工程ii)。
次に、ペアを形成し変換されたアダプター修飾DNA分子の相補鎖が、ヌクレオチドA、C、GおよびTとその配列が二本鎖アダプターの少なくとも一部に相補的であるプライマー(好ましくは、プライマーは、上記で既述のように、工程(ii)の試薬で処理された後にアダプター分子に特異的である)を用いて提供され、部分的に変換された、ペアを形成した二本鎖分子が提供される(工程iii)。
本発明のこの実施形態において相補鎖を提供するこの工程(工程iii)は、支持体に結合されたペアを形成し変換されたアダプター修飾DNA分子を用いて行われてよく、それは鎖の合成を起こす条件下で行われる。
好ましくは、本実施形態(工程iii)で使用されるプライマーは、支持体に結合されない。アダプター分子の集団が支持体に固定されて提供される本実施形態を示す概略図を図3および4に示す。鋳型鎖は支持体と結合したままとなり、伸長産物は上清中に遊離される。よって、この実施形態では、二本鎖DNAライブラリーは上清に遊離される。場合により、工程(iv)(場合により、部分的に変換されペアを形成した二本鎖分子を増幅する)は、上清上にある分子に対して、反応混合物から回収される前または回収された後に行うことができる。支持体に結合されたこのようなアダプターまたはアダプター修飾DNA分子は、その方法の様々な段階で支持体から遊離され得る。
場合により、工程(iii)で使用されるプライマーもまた支持体に結合されてよい。この場合、鋳型と伸長産物は支持体と結合したままとなる。よって、この場合、二本鎖DNAライブラリーは支持体に結合されている。支持体に結合されたアダプター、プライマーおよび/またはアダプター修飾DNA分子は、本方法の本実施形態の様々な段階で支持体から遊離され得る。
場合により、工程(iv)は、支持体に結合された分子に対して、支持体から遊離された後に上清上にある分子に対して行われ得る。
任意選択の増幅工程(iv)で使用されるプライマーは好ましくは、支持体に結合されない。しかしながら、工程(iv)で使用する一方または両方のプライマーは支持体に結合されてもよい。工程(iv)で使用される両プライマーが支持体に結合されている場合には、架橋増幅(等温であり得る)が起こり得る。この架橋増幅は、シーケンシングプロトコール、特にNGS(次世代シーケンシング)に従う、ポロニー、すなわち、クローン性のクラスターアンプリコンを生じ得る。
この実施形態は、支持体に結合した鋳型の回収を可能とし、従って、サンプルの永続性を高め得る。鋳型に結合された前記支持体はサンプルの保存に使用され得る。鋳型は、生じ得るバイアスを克服するために、異なる条件を用いた異なる増幅で使用され得る。前記の元の鋳型の回収は、結合対に基づく再捕捉工程を必要としない。よって、この実施形態は、材料の量が限定されるサンプルに特に適している。再捕捉工程は必要とされないが、工程(i)または(ii)で得られるDNA分子は、支持体からの遊離、および工程(iii)の後または場合に応じて工程(iv)の後に得られる反応混合物からの回収が可能である。好ましくは、前記の反応混合物からの回収は、結合対の第1のメンバーを使用して行われ、ここで、アダプターおよび/またはヘアピン配列および/またはバーコード配列は、前記結合対の第2のメンバーで修飾される。
工程(i)で得られるDNA分子はまたシーケンシングにも使用可能である。
好ましくは、工程(i)で使用される二本鎖DNA分子は、ゲノムDNAの断片である。場合により、工程(i)で使用される二本鎖DNA分子は前記工程(i)の前に末端修復され、好ましくは、末端修復工程後にDNA分子にdAテールを付加する工程をさらに含んでなる。アダプター分子および/またはヘアピン分子および/またはバーコード分子は分子のライブラリーとして提供されてよく、ここで、ライブラリーの各メンバーは、分子配列内のコンビナトリアル配列により他から識別可能である。工程(i)の後、アダプター修飾DNA分子の集団は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬で処理され、ここで、本発明の方法の工程(iii)および場合により工程(vi)で使用されるプライマーは、前記試薬で処理された後にアダプター分子に特異的である(本発明の方法の工程(ii))。アダプター配列および/またはヘアピン配列および/またはバーコード配列内のコンビナトリアル配列は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に対して耐性のある修飾シトシンを含み得る。それらは非メチル化シトシンを含まないものであり得る。場合により、本発明の第2の方法の工程(iii)または場合に応じて工程(iv)で得られるDNA分子は、好ましくは、結合対の第1のメンバーを用いて反応混合物から回収され、ここで、本発明の方法の工程(iii)または場合に応じて工程(iv)で使用されるプライマーは前記結合対の第2のメンバーで修飾される。二本鎖DNA分子の集団は、工程(i)の前に、アダプター分子とDNA分子の連結反応に十分な条件下、アダプター分子で処理され、それにより、前記DNA分子に付着末端を導入し得る。
本発明の方法の第2の実施形態
本発明の方法の第2の実施形態では、複数の二本鎖DNA分子の鎖の少なくとも一方の末端に連結された二本鎖DNAアダプター(本発明の方法の工程(i))は「Y」型を有し、「Yアダプター」と呼ばれる。
用語「Y−アダプター(Y-adapter)」および「Y−アダプター(Y-adaptor)」は互換的に使用され、本実施形態に関しては、2本のDNA鎖により形成され、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域が配列相補性により二本鎖領域を形成し、Y−アダプターの第1のDNA鎖の3’領域と第2のDNA鎖の5’領域により形成された前記二本鎖領域の末端が二本鎖DNA分子の末端に適合しているアダプターを意味する。「3’領域」という表現は、本明細書で使用する場合、前記鎖の3’末端を含むヌクレオチド鎖の領域を意味する。
用語「3’末端」は、本明細書で使用する場合、その末端のデオキシリボースの糖環内の3番目の炭素のヒドロキシル基を有するヌクレオチド鎖の末端をいう。
「5’領域」という表現は、本明細書で使用する場合、前記鎖の5’末端を含むヌクレオチド鎖の領域を意味する。
用語「5’末端」は、本明細書で使用する場合、その末端のデオキシリボースの糖環内の5番目の炭素を有するヌクレオチド鎖の末端をいう。
「配列相補性」という表現は、本明細書で使用する場合、2つの核酸配列が互いに逆平行にアラインされた際に各位置のヌクレオチド塩基が相補的であるような、それらの核酸配列間で共有される特性を意味する。
この第2の実施形態に従い、本発明の方法の工程(i)に従って得られる複数の、ペアを形成したアダプター修飾DNA分子は、
(a)DNA Y−アダプターを、複数の二本鎖DNA分子の鎖の各末端に連結すること、前記アダプターは第1のDNA鎖と第2のDNA鎖を含んでなり、
ここで、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域は配列相補性により二本鎖領域を形成し、
Y−アダプターの第1のDNA鎖の3’領域と第2のDNA鎖の5’領域により形成された前記二本鎖領域の末端は二本鎖DNA分子の末端に適合している;
(b)工程(a)で得られたDNA分子の鎖のそれぞれに関して、Y−アダプター分子内の第2のDNA鎖の3’末端から、工程(a)で得られたDNA分子の鎖のそれぞれを鋳型として用いてポリメラーゼ伸長により相補鎖を合成し、それにより、工程(a)で得られたDNA分子の鎖のそれぞれとその合成相補鎖のペアを形成して、複数の、ペアを形成したアダプター修飾DNA分子を提供すること
によって得られる。
好ましくは、Y−アダプターの第2のDNA鎖の3’領域は、前記3’領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成し、第1のセグメントは第2のDNA鎖の3’領域の3’末端に位置し、第2のセグメントは5’領域の近傍に位置する。
場合により、Y−アダプターの第2のDNA鎖の3’領域は、前記3’領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成しない。
本実施形態に従う、本発明の方法の工程(i)のペア形成工程は、物理的に(Yアダプター内のヘアピン配列の存在による、これにより、元のDNA鎖とその合成相補鎖の物理的ペア形成が可能となる)またはYアダプターにおけるバーコード配列の存在により(二本鎖領域における、および/または一本鎖領域のいずれかにおける、または3領域総てにおける)、およびヘアピン配列の不在下で(これにより、元のDNA鎖とその合成相補鎖は物理的に結合されないが少なくとも1つのバーコード配列の存在によりペア形成が可能となる)、または両方により(ヘアピン配列と1以上のバーコード配列)起こり得る。
従って、一態様において、Y−アダプターの第2のDNA鎖の3’領域は、前記3’領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成することができ、第1のセグメントは第2のDNA鎖の3’領域の3’末端に位置し、第2のセグメントは5’領域の近傍に位置する。この態様では、工程(a)で得られるDNA分子の鎖のそれぞれは、その合成相補鎖と物理的にペアを形成し(少なくとも1つのヘアピン分子の手段による)、ペアを形成したアダプター修飾DNA分子が提供される。当然のことながら、バーコード配列もまたYアダプター内に存在してよい。
用語「ヘアピンループ」は、本明細書で使用する場合、DNA鎖が同じ鎖の別のセクションまたはセグメントと塩基対を保持および形成する場合に作り出される不対合塩基により形成されるDNAの領域を意味する。
用語「ハイブリダイゼーション」は、本明細書で使用する場合、2つの一本鎖ポリヌクレオチドまたは同じ鎖の2領域が非共有結合的に結合して安定な二本鎖ポリヌクレオチドを形成するプロセスを意味する。
よって、本態様は、DNA分子の元のセンス鎖とアンチセンス鎖が互いに物理的に結合された二本鎖DNAライブラリーの取得を可能とする。DNA分子の各元の鎖は合成伸長により得られる相補鎖と物理的に結合される。この実施形態の概略図を図5および図6に示す。
用語「DNAライブラリー」は、本明細書で使用する場合、対象とするDNA断片を同定および単離するためにアダプター分子に連結されたDNA断片のコレクションを意味する。
「二本鎖DNAライブラリー」という表現は、本態様に関しては、それらの末端の一方で合成伸長により得られた相補鎖に物理的に連結されたDNA分子の元の鎖の1つを含むライブラリーを意味する。本発明の第3の方法の二本鎖DNAライブラリーは、環状ライブラリーではない。DNA分子の元のDNA鎖とその合成相補鎖は、それらの末端の一方でループにより物理的に連結され、従って、それらの間で二重鎖を形成する(図12参照)。 本発明の方法の第2の実施形態の本態様では、DNA分子の各元のDNA鎖とその合成相補鎖はヘアピンループによりペアが形成され、従って、物理的にペアが形成される。二本鎖DNAライブラリーの各分子はまた、両鎖間の相補性が部分的にまたは完全に失われた場合には、線状コンフォメーションであってもよい。
本発明の方法の第2の実施形態の別の態様では、ペアの形成は、アダプターにおける(その一本鎖領域のいずれかにおける、および/または二本鎖領域における、またはその両方における)少なくとも1つのバーコード配列により行われる。この態様によれば、Y−アダプターの第2のDNA鎖の3’領域は、前記3’領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成しない。この場合、DNA分子の各元のDNA鎖とその合成相補鎖は、Yアダプターの二本鎖領域における、もしくはYアダプターの一本鎖領域におけるバーコード配列の存在により、または元のDNA鎖上の他所のバーコード配列の存在によりペアが形成される。
当然のことながら、DNA分子の元のDNA鎖とその合成相補鎖のペア形成は、物理的なもの(上記のようにYアダプター内のヘアピンループの存在による)および1以上のバーコード配列によるものの両方で行われ得る。
Yアダプターは、その二本鎖DNA領域に1以上のバーコード配列を含み得る。これは少なくとも元の二本鎖DNA分子の各元のDNA鎖間のペア形成を提供する。
この場合、DNA分子の元のセンス鎖およびアンチセンス鎖はコンビナトリアル標識(「バーコード配列」または「コンビナトリアルバーコード」)により同定され、特に、センス鎖およびアンチセンス鎖のそれぞれが2つのコンビナトリアル配列に連結される。両コンビナトリアル配列はセンス鎖とアンチセンス鎖で同じであるので、両鎖はプロセス中に追跡可能である。全プロセスの後に、元々一緒にあった相補鎖は2つの同じコンビナトリアル配列を共有する。これにより、本発明の方法の工程(i)で元々使用された各二本鎖DNA断片の両鎖の追跡を維持することができる。図13はコンビナトリアル標識が使用される本発明の方法の実施形態を示す。
代わりにまたは加えて、Yアダプターは、2本のDNA鎖により形成されるYアダプターの第1のDNA鎖の5’領域に、および/または第2のDNA鎖の3’領域に(および/または二本鎖領域に)1以上のバーコード配列を含み得る。従って、バーコード配列はY−アダプター分子の一本鎖領域および/またはY−アダプターの二本鎖領域に位置し得る。この場合、その後に、各元のDNA鎖とその合成相補鎖のペアが形成される。
好ましくは、DNA Yアダプターは、Y−アダプターの二本鎖領域に第1のバーコード配列を、および/または第2のDNA鎖の3’領域に第2のバーコード配列を有する。場合により、DNA Yアダプターは、Y−アダプターの二本鎖領域に第1のバーコード配列を、および/または第1のDNA鎖の5’領域に第2のバーコード配列を有する。場合により、DNA Yアダプターは、Y−アダプターの二本鎖領域に第1のバーコード配列を、および/または第2のDNA鎖の3’領域に第2のバーコード配列を、および/またはY−アダプターの第1のDNA鎖の5’領域に第3のバーコード配列を有する。
好ましくは、DNA Y−アダプターは、Yアダプターの第1のDNA鎖の5’領域に制限部位を有する。
二本鎖DNA分子の各元のDNA鎖と各元のDNA鎖とその合成相補鎖のペアが形成される場合、これは「二重のペア形成」と呼ばれる(すなわち、その元の相補鎖と、およびその合成相補鎖と同時にペアを形成した鎖)。二重のペア形成は、4つの異なる分子の情報源(所与のdsDNA分子およびそれらの個々の合成相補鎖の上鎖および下鎖)の比較を可能とすることにより、各ヌクレオチド読み取りの固有のバリデーションを提供し、これにより結果の信頼性がさらに高まる。加えて、これは元の二本鎖DNA分子の上鎖および下鎖の両方の評価を可能とし、結果として、ゲノム規模でのヘミメチル化の分析を可能とする。好ましくは、この実施形態により工程(i)の後に得られる複数の、ペアを形成したアダプター修飾DNA分子は、上記のように二重にペア形成されている。
工程(a)で使用される二本鎖DNA分子は、好ましくは、ゲノムDNAの断片である。好ましくは、工程(a)で使用されるゲノムDNAの断片はペアを形成し、複数の、ペアを形成したゲノムDNA断片を提供する。このペア形成は、上記のように、好ましくは、バーコード配列の使用により行われる。
好ましくは、工程(a)で使用される二本鎖DNA分子は前記工程(a)の前に末端修復され、好ましくは、末端修復工程後にDNA分子にdAテールを付加する工程をさらに含んでなる。
連結工程(a)は、Y−アダプターと二本鎖DNA分子の両末端の連結反応に十分な条件下で行われる。
前記工程(a)の結果得られるものは、複数のY−アダプター含有DNA分子である。前記分子は、分子の各末端に連結された1つのY−アダプターを有する、ペアを形成した(ヘアピン配列および/またはバーコード配列による)二本鎖DNA分子である。
好ましくは、本実施形態では、工程(a)で得られるY−アダプター含有DNA分子は、工程(b)の前に、Y−アダプター含有DNA分子の鎖の分離に十分な条件下で処理される。
Y−アダプター含有DNA分子の鎖の分離に十分な条件は、限定されるものではないが、両鎖の変性が、例えば、それらの分子を94〜98℃に20秒〜2分間加熱して、相補的塩基間の水素結合の切断を引き起こして一本鎖DNA分子を得ることによって達成される条件であり得る。鎖の分離はまた、分子を加熱せずに、等温技術の使用により、例えば、限定されるものではないが、Phi29DNAポリメラーゼまたはバチルス・ステアロサーモフィルスDNAポリメラーゼの大断片などの鎖置換DNAポリメラーゼを使用することにより達成され得る。
工程(a)におけるアダプターの連結反応後、工程(a)で得られたDNA分子の鎖のそれぞれは、工程(a)で得られたDNA分子の鎖のそれぞれを鋳型として用い、Y−アダプター分子の第2のDNA鎖の3’末端からのポリメラーゼ伸長により、ペアを形成した二本鎖DNA分子に変換される(上記工程(b))。
「鎖のそれぞれを、ペアを形成した二本鎖DNA分子に変換する」という表現は、本実施形態に関しては、両鎖がペアを形成した鎖のそれぞれに相補的なDNA鎖の合成を意味する。ペア形成は、物理的に達成されてよく(すなわち、Y−アダプターの第2のDNA鎖の3’領域が前記3’領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成する場合には、第1のセグメントは第2のDNA鎖の3’領域の3’末端に位置し、第2のセグメントは5’領域の近傍に位置する)、その結果、単一のDNA鎖がそれ自体に折り重ねられた二本鎖DNAコンフォメーションが得られる。
場合により、Y−アダプターの第2のDNA鎖の3’領域が前記3’領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成しない場合、ペア形成は、Y−アダプターの少なくとも1つの鎖の、二本鎖領域または一本鎖領域のいずれか、好ましくは一本鎖領域にバーコード配列を導入することにより達成され得る。
上記のように、ペア形成は、元のDNA鎖とその合成相補鎖の物理的連結反応と、1以上のバーコード配列の存在の両方により達成され得る。
「ポリメラーゼ伸長」という表現は、本明細書で使用する場合、Y−アダプター分子の第2のDNA鎖の3’末端に遊離型のヌクレオチドを付加するDNAポリメラーゼによる相補鎖の合成を意味する。前記Y−アダプター分子は、伸長工程のプライマーとして働き得る。この工程の間、温度は使用する特定のDNAポリメラーゼの最適温度に応じて選択される。
好ましくは、工程(b)は、ヌクレオチドA、G、CおよびTを用いて行われる。場合により伸長工程にメチル化シトシンは使用されてもよいが、代わりに非メチル化シトシンを使用することが重要な問題を解決する。
1−バイサルファイト変換の制御。バイサルファイト変換効率には変動があり、これは、(好ましくは、ウラシル(U)に)首尾良く変換されるわけではないことを意味する。さらに、実験ごとに、また、さらには所与の実験における分子ごとに、この効率を評価することが重要である。
総てのCがメチル化され、ゆえにCとして読み取られるので、新たな鎖にメチル化シトシン(C)が使用されても、C>U変換の程度を評価(または制御)することができない。対照的に、非メチル化Cが使用される場合には、各個の分子のバイサルファイト変換効率が決定できる。
2−ヘアピンによりペアを形成した2鎖の相補性を低下させることによる増幅の促進
本実施形態による工程(i)の後、各Y−アダプター含有DNA分子から2つの二本鎖DNA分子が得られ、前記二本鎖DNA分子のそれぞれは、ペアを形成しているDNA分子の元のDNA鎖とその合成相補鎖により形成される(上記のように、それらはヘアピン分子によりそれらの末端の1つで物理的に連結されてよく、またはそれらはバーコード配列を含有してもよく、またはその両方である)。
元の二本鎖DNA分子の両鎖の間のペア形成は、最初に使用された各二本鎖DNA断片の両鎖の追跡を維持することを可能とする。
よって、各Y−アダプターは、サンプルの同定および複合体形成ならびに定量的分析を可能とするユニークなコンビナトリアルバーコードを含み得る。好ましい実施形態では、Y−アダプターはアダプターのライブラリーとして提供され、ここで、ライブラリーの各メンバーは、アダプターの第1のDNA鎖の3’領域と第2のDNA鎖の5’領域により形成される二本鎖領域内に位置するコンビナトリアル配列によって識別可能である。よって、本発明は、とりわけ本発明の方法における使用のための、少なくとも1つのバーコード配列を含んでなるYヘアピンアダプターを提供する。
コンビナトリアル配列を有するY−アダプターのライブラリーが本発明の方法の工程(i)で使用される場合、工程(i)の後に得られるDNA分子を含有する各Y−アダプターは2つの異なるコンビナトリアル配列を有し、それらのそれぞれはDNA分子の各末端に連結されたY−アダプターの1つに位置する。これら2つの識別子は最初のサンプルの個々の分子に関連付けられ、従って、構築物間を識別する能力を与える。本実施形態の工程(b)の後に、二本鎖DNA分子の元のセンス鎖およびアンチセンス鎖は異なる分子中に残るが、これらの分子のそれぞれは両コンビナトリアル配列を含むので、前記識別子は、前記識別子を含んでなる特定の構築物およびその後代の同定を可能とする。前記識別子を保有する前記の最初の個々の分子のいずれの増幅産物も同一系統であると想定される。コンビナトリアルバーコードはまた、サンプル内の個々の配列のパーセンテージの定量を可能とし、増幅工程中のバイアスおよびエラー制御のモニタリングに有用である。
場合により、Y−アダプターには、伸長または増幅工程後に元のDNA鋳型の回収を可能とする結合対の第2のメンバーで標識された塩基を組み込まれる。これは、DNA鋳型として使用されるサンプルが識別され、プロセス中に保存され、回収され、蓄積され、また、異なる条件で何回も増幅を受けることができ、サンプル消耗なくシーケンシングを受けることができるという利点を提供する。
本実施形態による工程(i)の後に得られる構築物は二本鎖DNAライブラリーを形成し、これはシーケンシングのため、または他の従来の分子生物学的技術で使用可能である。
場合により、Y−アダプターは、上記のように「切断のための部位」を含み得る。「切断のための部位」は、種々のシーケンシングプラットフォームの要求にライブラリーの最終要素を適合させる手段を付与する。この適合は(シーケンシングプライマーなどのプラットフォーム試薬と適合する配列を導入することによる)Y−アダプターの特定のデザインにより達成できるが、切断部位は、複合体形成(種々の起源からのサンプルを混合する)ため、または大規模シーケンシングの任意のプラットフォームの要求のためのバーコードまたはアダプターを付加するため(あるいはまた潜在的に不必要なヌクレオチドを除去するため)のモジュール性を可能とする。「切断のための部位」は、複数の、ペアを形成したアダプター修飾DNA分子(工程(i)で得られたペアを形成したアダプター修飾DNA分子のライブラリー、または工程(iii)(および場合により工程(iv))で得られるような、ペアを形成し、変換されたアダプター修飾DNA分子のライブラリー)の端部に既知の標的を存在させる特定の配列である。「切断のための部位」は、Y−アダプターを連結する工程の前または後に複数の二本鎖DNA分子に連結されてよい。上述のように、「切断のための部位」は、Y−アダプター内にすでに含まれていてもよい。このように、総ての断片が切断可能であり、アダプターが適切に連結され得る(このように、もはや必要とされないアダプターの配列はシーケンシング効率を高めるために除去され得る)。
次に、本発明の方法の工程(ii)が行われ、すなわち、本発明の方法の本実施形態の工程(i)で得られる複数の、ペアを形成したアダプター修飾DNA分子内に存在する(非メチル化)シトシンが、従前に記載したように、複数の、ペアを形成したアダプター修飾DNA分子において変換される(好ましくは、ウラシルに)。
よって、複数の、ペアを形成したアダプター含有DNA分子は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基(好ましくは、ウラシル)への変換を可能とする試薬で処理され、ここで、工程(iii)(および場合により工程(iv))で使用されるプライマーは、工程(ii)で得られる二本鎖DNA分子の前記試薬による処理から生じる配列の少なくとも一部に相補的である。この処理は、元の鎖と合成鎖の間の相補性が部分的にまたは完全に失われ、従って、次の工程で使用されるプライマーのアニーリングを助長するアダプター含有DNA分子を与える。図5および6はこれを示す概略図である。
好ましい実施形態では、試薬は、総ての非メチル化シトシンをウラシルに変換するバイサルファイトであり、ウラシルは工程(iii)で増幅される分子ではチミンとして読み取られる。
工程(i)で得られたペアを形成したアダプター修飾DNA分子は、非メチル化シトシンをハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基に変換し得る試薬で処理され、元の二本鎖DNA分子のセンス鎖とアンチセンス鎖の間の相補性が部分的にまたは完全に失われる。これが相補鎖の合成を助長し得る。
本発明の方法の工程(ii)で得られるY−アダプター含有DNA分子は、工程(iii)の前に、Y−アダプター含有DNA分子の鎖の分離に十分な条件下でさらに処理され得る。
Y−アダプター含有DNA分子の鎖の分離に十分な条件は、限定されるものではないが、両鎖の変性が、例えば、それらの分子を94〜98℃に20秒〜2分間加熱して、相補的塩基間の水素結合の切断を引き起こして一本鎖DNA分子を得ることによって達成される条件であり得る。鎖の分離はまた、分子を加熱せずに、等温技術の使用により、例えば、限定されるものではないが、Phi29DNAポリメラーゼまたはバチルス・ステアロサーモフィルスDNAポリメラーゼの大断片などの鎖置換DNAポリメラーゼを使用することにより達成され得る。次に、本発明の方法の工程(iii)が行われ、すなわち、ペアを形成し、変換された複数のアダプター修飾DNA分子の相補鎖を提供する。
場合により、前記構築物は、以降の工程のために材料の量を増すために増幅することができる(工程(iv))。好ましくは、工程(iii)で得られる二本鎖DNA分子は、その配列が工程(iii)で得られる二本鎖DNA分子の少なくとも一部に相補的な少なくとも1つのプライマーを用いて増幅される。
好ましくは、工程(iii)で得られる二本鎖DNA分子は、第1の増幅工程において、その配列がアダプター分子の第1のDNA鎖の5’領域の相補配列の少なくとも一部に相補的なプライマーを用いて増幅され得る。工程(iii)および場合により工程(iv))で(使用されるプライマーは好ましくは、工程(ii)で得られる二本鎖DNA分子の試薬による処理から得られる配列の少なくとも一部に相補的である。この実施形態は図5および6に示され、二本鎖DNAライブラリーを生成するために使用される二本鎖DNA分子の集団の全配列に関して増幅を得ることを可能とする。
あるいは、工程(iii)で得られる二本鎖DNA分子は、第1の増幅工程において、その配列が二本鎖DNAライブラリーを生成するために使用される二本鎖DNA分子の集団の相補配列の少なくとも一部に相補的なプライマーを用いて増幅され得る。工程(iii)(および場合により工程(iv))で使用されるプライマーは好ましくは、工程(ii)で得られる二本鎖DNA分子の試薬による処理から得られる配列の少なくとも一部に相補的である。この実施形態を図6に示す。
また、プライマー対を用いた続いての増幅工程も可能である。プライマーのいずれの組合せも本発明により包含される。例えば、第1のプライマーは、アダプター分子の第1のDNA鎖の5’領域の相補配列の少なくとも一部に相補的であり得、第2のプライマーは、第1の増幅工程後に得られる分子の3’領域に相補的であり得る(図6)。
図12は、本実施形態により得られる二本鎖DNAライブラリーにおける種々の要素の構成を示す。いずれのバイアス(TAまたはCGバイアス)も分析段階で評価および考慮可能であるという点で、同じサンプルのアリコートに対して異なる条件で異なる増幅を行うことができることに留意されたい。
場合により、本発明の方法の工程(iii)および/または(iv)後に得られる分子は反応混合物から回収され得る。従って、工程(iii)および/または(iv)で得られる分子は好ましくは、結合対の第1のメンバーを用いて反応混合物から回収され得、ここで、工程(iii)および/または(iv)で使用されるプライマーは、前記結合対の第2のメンバーで修飾される。
場合により、コンビナトリアル配列は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性のある修飾シトシンを含み得る。コンビナトリアル配列は、代わりにまたは加えて 非修飾シトシン(非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性がない)も含み得る。
「二本鎖DNA分子の集団」、「末端」、「適合する」、「連結反応」、「鋳型」、「プライマー」、「相補的」、「アダプターのライブラリー」、「コンビナトリアル配列」または「コンビナトリアルバーコード」、「反応混合物」、「結合対」、「結合対の第1のメンバー」、「結合対の第2のメンバー」および「ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基」という表現は本発明の方法に関して定義される。
Y−アダプターは支持体に固定されて提供され得る。好ましくは、前記固定は、Y−アダプターの第1のDNA鎖の5’末端または第2のDNA鎖のヘアピンループのヌクレオチドを、これが存在する場合には、前記支持体に結合させることにより行われる。工程(iii)で使用されるプライマーもまた支持体に結合させてよい。アダプターおよび/またはプライマーと支持体との結合は好ましくは、共有結合であり得る。
用語「固定される」、「支持体」および「共有結合」は上記で定義されている。
例えば、本発明の方法の工程(i)の複数の、ペアを形成したアダプター修飾DNA分子は、
(a)二本鎖DNA分子の集団をDNA Y−アダプターと接触させること、前記アダプターは第1のDNA鎖と第2のDNA鎖を含んでなる、
ここで、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域は配列相補性により二本鎖領域を形成し、かつ、前記二本鎖領域の末端は前記二本鎖DNA分子の末端と適合し、
前記接触は、Y−アダプターが前記二本鎖DNA分子の両末端に連結するのに十分な条件下で行われ、それにより、複数のY−アダプター含有DNA分子が得られる、
(b)前記Y−アダプター含有DNA分子の各鎖を、Y−アダプター分子の第2のDNA鎖に相補的な3’領域を含んでなる伸長プライマーと、伸長プライマーがY−アダプターの第2の鎖とハイブリダイズするのに十分な条件下で接触させ、これがY−アダプター分子の第2のDNA鎖とのハイブリダイゼーション後にオーバーハング末端を作り出すこと;
(c)工程(b)で作出された分子をヘアピンアダプターと、ヘアピンアダプターと工程(b)で生成された分子との連結反応に十分な条件下で接触させること、前記ヘアピンアダプターは、ヘアピンループ領域と、工程(b)で生成された分子のオーバーハング末端と適合するオーバーハング末端とを含んでなる、
(d)工程(c)で得られたDNA分子を、工程(b)で使用された伸長プライマーからのポリメラーゼ伸長により二本鎖DNA分子に変換すること
により得られ、
ヘアピンアダプター(c)との連結反応の工程および伸長工程(d)が任意の順序で、または同時に行うことができる。
用語「アダプター(adapter)」および「アダプター(adaptor)」は互換的に使用され、上記と同様に、2本のDNA鎖により形成され、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域が配列相補性により二本鎖領域を形成し、前記二本鎖領域の末端が二本鎖DNA分子の末端に適合しているアダプターを意味する。この場合、Y−アダプターはヘアピンループを含まず、すなわち、Y−アダプターの第2のDNA鎖の3’領域は、前記3’領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成しない。
好ましくは、工程(a)で使用される二本鎖DNA分子は、ゲノムDNAの断片である。好ましくは、工程(a)で使用される二本鎖DNA分子は、前記工程(a)の前に末端修復され、好ましくは、末端修復工程後にDNA分子にdAテールを付加する工程をさらに含んでなる。
接触工程(a)は、Y−アダプターと二本鎖DNA分子の両末端との連結反応に十分な条件下で行われる。
前記工程の結果得られるものは、1つのY−アダプターが分子の各末端に連結されている二本鎖DNA分子である、複数のY−アダプター含有DNA分子である。
第2の工程(b)は、Y−アダプター含有DNA分子の各鎖を伸長プライマーと接触させることを含む。
用語「伸長プライマー」は、本明細書で使用する場合、本方法の次の工程において伸長のために使用される、オーバーハング末端を作り出すY−アダプター分子の第2の鎖に相補的な3’領域を含んでなるプライマーを意味する。用語「プライマー」および「オーバーハング末端」は上記で定義される。
第3の工程(c)は、工程(b)で生成された分子をヘアピンアダプターと、ヘアピンアダプターと工程(b)で生成された分子との連結反応に十分な条件下で接触させることを含む。
用語「ヘアピンアダプター」は、本明細書で使用する場合、それら自体が折り返して、同じ鎖の相補的塩基配列間で塩基対を形成することによって維持される二本鎖領域を形成する一本鎖核酸、対合していない塩基により形成されたヘアピンループ領域および工程(b)で生成された分子内のオーバーハング末端と適合するオーバーハング末端により形成される二重鎖を意味する。
図7は、ヘアピンアダプターと伸長プライマーが別個に提供される本発明の方法の実施形態を示す。
あるいは、前記Y−アダプター含有DNA分子の各鎖と伸長プライマーを接触させる工程(b)と工程(b)で生成された分子とヘアピンアダプターを接触させる工程(c)は、ヘアピンアダプターと伸長プライマーを複合体として提供することによって単一の工程として行われる。
用語「複合体」は、本明細書で使用する場合、ヘアピンアダプターと伸長プライマーにより形成されるユニークな分子を意味する。図8および9は、伸長プライマーとヘアピンアダプターが種々のコンフォメーションの複合体として提供される本発明の方法の種々の実施形態を示す。この場合、Y−アダプターの連結反応後、複合体に含まれる伸長プライマーはアニーリングされ、Y−アダプターの第2の鎖の3’末端とヘアピンアダプターの5’末端の間で連結反応が行われる。
ヘアピンアダプターへの連結反応の工程(c)と伸長工程(d)は、任意の順序でまたは同時に行うことができる。一実施形態では、工程(c)は、工程(d)の前に行われる。別の実施形態では、工程(d)は、工程(c)の前に行われる(すなわち、ヘアピンアダプターが構築物に連結される前に伸長が行われる)。別の実施形態では、工程(c)および(d)は同時に行われる。
好ましくは、工程(a)または工程(c)で得られたY−アダプター含有DNA分子は、記Y−アダプター含有DNA分子の鎖を分離するのに十分な条件下に置かれる。
工程(d)に得られる構築物は二本鎖DNAライブラリーを形成し、シーケンシングのためまたは他の従来の分子生物学的技術において使用可能である。
Y−アダプターは、ライブラリーの各メンバーが、二本鎖DNA分子(元の鎖およびその相補的な元の鎖)の複数の断片のペアを形成するために、アダプターの第1のDNA鎖の3’領域と第2のDNA鎖の5’領域により形成される二本鎖領域内に位置するコンビナトリアル配列(バーコード配列とも呼ばれる)によって他から識別可能なアダプターのライブラリーとして提供される。
場合により、Y−アダプター、伸長プライマーおよび/またはヘアピンアダプターには、伸長または増幅工程後に元のDNA鋳型の回収を可能とする結合対の第2のメンバーで標識された塩基が組み込まれる。
場合により、工程(d)後に得られた分子は、反応混合物から回収することができる。よって、工程(d)で得られた分子は、好ましくは結合対の第1のメンバーを用いて反応混合物から回収され得、ここで、工程(e)で使用されるプライマーは前記結合対の第2のメンバーで修飾される。
ひと度、複数の、ペアを形成したアダプター修飾DNA分子が提供されれば(本発明の方法の工程(i))、ペアを形成したアダプター含有DNA分子は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基(好ましくは、ウラシル)への変換を可能とする試薬で処理され、ここで、上記の工程(i)(b)で使用されるプライマーは、二本鎖DNA分子の前記試薬による処理(本発明の方法の工程(ii))から得られる配列の少なくとも一部に相補的である。
好ましくは、試薬はバイサルファイトである。
場合により、前記試薬による処理後にコンビナトリアル配列の配列の特定の部分(バーコード配列)が変化することを避けるために、コンビナトリアル配列の配列は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性のある修飾シトシンを含み得る。
例えば、ヘアピンアダプターおよび/またはY−アダプターは、従前に記載したように、支持体に固定されて提供され得る。好ましくは、前記固定は、ヘアピンアダプターのヘアピンループおよび/またはY−アダプターの第1のDNA鎖の5’末端のヌクレオチドを前記支持体に結合させることにより行われる。
別の実施形態では、本実施形態に関して上記されたように工程(i)(d)、および本発明の方法の場合により工程(iii)および場合により(iv)(場合により、部分的に変換された、ペアを形成した二本鎖DNA分子を増幅するための)で使用されるプライマーも支持体に結合される。好ましくは、アダプターおよび/またはプライマーと支持体の間の結合は共有結合である。
本発明の方法の3の実施形態
本発明の方法の第3の実施形態では、本発明の方法の工程(i)の複数の、ペアを形成したアダプター修飾DNA分子は、
(a)複数の二本鎖DNA分子を、オーバーハング末端を有する二本鎖DNA分子の複数の断片を生成するのに十分な条件下で断片化すること、ここで、各断片の各末端はヘミアダプター分子に結合され、前記ヘミアダプター分子は第1のDNA鎖および場合により第2のDNA鎖を含んでなり、第2の鎖は第1の鎖と、第1の鎖の中央領域との相補性によって二本鎖領域を形成し、ヘミアダプター分子は、ヘミアダプターの第1の鎖の3’末端と二本鎖DNA分子の断片のオーバーハング末端の間の二本鎖DNA分子の断片に結合される、
(b)別の第2の鎖を付加するか、またはヘミアダプター分子の第2のDNA鎖を別の第2の鎖で置換すること、ここで、前記別の第2の鎖の5’領域は、ヘミアダプター分子の第1の鎖の3’領域に相補的であり、前記別の第2の鎖は、ヘミアダプター分子の第1の鎖に相補的でない領域を含有し、それにより、複数のY−アダプター修飾DNA分子を生成する、
(c)場合により、Y−アダプターの別の第2の鎖の5’末端と各DNA断片の3’末端の間に存在するギャップを埋めること、
(d)前記Y−アダプター含有DNA分子の各鎖を、Y−アダプター分子別の第2のDNA鎖に相補的な3’領域と、伸長プライマーとY−アダプターの別の第2の鎖のハイブリダイゼーションに十分な条件下でY−アダプターの別の第2のDNA鎖とハイブリダイズしない5’領域とを含んでなる伸長プライマーと接触させること、
(e)工程(d)で生成された分子のペアを形成させること、前記ペア形成は、好ましくは、工程(d)で生成された分子をヘアピン分子と接触させることにより達成され得、前記ヘアピン分子は、ヘアピンループ領域と、ヘアピンアダプターと工程(d)で生成された分子との連結反応に十分な条件下で、工程(d)で生成された分子の末端と適合する末端を含んでなり;場合により、前記ペア形成は、工程(d)の後に付加されるか、またはY−アダプターおよび/もしくは伸長プライマー中にすでに存在する、バーコード配列の存在により(ヘアピン分子の不在下で)達成され得る;
(f)工程(e)で得られたDNA分子の鎖のそれぞれを、工程(d)で使用された伸長プライマーからのポリメラーゼ伸長により二本鎖DNA分子に変換し、複数の、ペアを形成したアダプター修飾DNA分子を得ること、
ここで、ヘアピンアダプター(e)への連結反応の工程と伸長工程(f)は任意の順序でまたは同時に行うことができる、
により得られる。
本発明のこの第3の実施形態は種々の断片化システムに適合される。
第1の工程では、本発明の第3の実施形態に従って二本鎖DNAライブラリーを生成するための方法は、複数の二本鎖DNA分子を、オーバーハング末端を有する二本鎖DNA分子の複数の断片を生成するのに十分な条件下で断片化することを含み、ここで、各断片の各末端は、ヘミアダプター分子と、ヘミアダプターの第1の鎖の3’末端と本鎖DNA分子の断片のオーバーハング末端の間で結合される。
用語「ヘミアダプター」および「ヘミアダプター」は互換的に使用され、第1のDNA鎖および場合により第2のDNA鎖により形成された不完全なアダプターを意味し、第2の鎖は第1の鎖と、第1の鎖の中央領域との相補性によって二本鎖領域を形成する。本実施形態のヘミアダプターは、ヘアピンループを含まない。例えば、ヘミアダプターは、第2のDNA鎖を含まない。例えば、ヘミアダプターは、第1および第2のDNA鎖を含んでなる。
好ましくは、工程(a)で使用される二本鎖DNA分子は、ゲノムDNAの断片である。
断片化およびヘミアダプターと二本鎖DNA分子との連結反応を含んでなる本実施形態の第1の工程は、例えば、in vitro転移により行われてよく、ここで、転移要素がドナーDNA(ヘミアダプター分子)から標的DNA(二本鎖DNA分子の集団)へ導入される。
好ましくは、断片化工程(a)は、二本鎖DNA分子の集団を、二本鎖アダプター分子を積載したトランスポゼース二量体と接触させることを含んでなる方法により行われ、ここで、前記アダプター分子は、Tn5逆位リピートと鎖の一方の5’オーバーハングを含んでなる二本鎖領域を含んでなり、Tn5逆位リピートの一部を形成しない二本鎖領域および一本鎖領域のシトシンヌクレオチドは場合によりメチル化され、接触は、DNAの断片化に、および各DNA断片の両末端へのヘミアダプター分子の結合に十分な条件下で行われる。
用語「トランスポゼース」、本明細書で使用する場合、特定のDNA配列を認識し、2つの二重鎖DNA分子を4か所で切断し、鎖を連結することができる酵素(E.C番号3.1.−.−)を意味する。トランスポゼースは、転移能のある核酸と複合体を形成し、すなわち、標的DNA配列に対するその核酸の挿入を触媒する。
「トランスポゼース二量体」という表現は、本明細書で使用する場合、いくつかの残基の化学的に同一の2つのモノマーの二量体を意味する。天然であれ突然変異体であれ、いずれの種に由来するいずれのトランスポゼース二量体も本発明で使用可能である。特に注目されるものとして、限定されるものではないが、トランスポゼースTn5、Tn3、Tn7およびその突然変異体、およびまたレトロウイルスインテグラーゼがある。好ましい実施形態では、トランスポゼース二量体はTn5トランスポゼースである。用語「Tn5 トランスポゼース」は、レトロウイルスインテグラーゼを含むRNアーゼタンパク質スーパーファミリーのメンバーを意味する。本発明のTn5トランスポゼースは大腸菌(Escherichia coli)に見られ、2013年4月3日版のUniProtデータベースの配列Q46731により定義される。本発明はまた、他の種(例えば、シュワネラ属(Shewanella))に見られる天然変異体および分子生物学的技術により得られる人工変異体(例えば、US5965443に開示されている突然変異体Tn5トランスポゼース)を含んでなる前記Tn5トランスポゼースの機能的に同等な変異体も含む。
用語「積載される」とは、本明細書で使用する場合、トランスポゼース二量体が二重鎖DNAの断片と結合されることを意味する。
「二本鎖アダプター分子」という表現は、本実施形態に関して、Tn5逆位リピートと鎖の一方の5’オーバーハングを含んでなる二本鎖領域を含んでなるアダプター分子を意味する。
「Tn5逆位リピート」という表現は、本明細書で使用する場合、転移要素を意味する。前記Tn5逆位リピートは一般に18または19塩基長であると考えられ、別のTn5逆位リピートに対して逆位リピートである(Johnson R.C. and Reznikoff W.S. 1983. Nature, 304:280)。Tn5逆位リピートは現況技術において周知である。
Tn5逆位リピートの一部を形成しない二本鎖領域および一本鎖領域のシトシンヌクレオチドは、メチル化されていてもメチル化されていなくてもよい。特定の実施形態では、前記シトシンヌクレオチドはメチル化されている。
「DNAの断片化に、および各DNA断片の両末端へのヘミアダプター分子の結合に十分な条件」という表現は、本実施形態に関して使用される場合、積載されたトランスポゼース二量体酵素が適切に働くための時間、温度およびバッファー組成の十分な条件を意味する。前記条件は当業者により周知である。例示的条件は、dey A. and Shendure J. 2012. Genome Research, 22:1139-1143およびAdey A. et al. 2010. Genome Biology, 11: R119に開示されているものであり得る。
本実施形態の第1の工程(a)に好適なキットは、例えば、Nextera(商標)DNAサンプル調製キット(Illumina)である。
in vitro転移は、タグメンテーション(“Ultra-low-input, tagmentation-based-whole-genome bisulfite sequencing” Adey A. and Shendure J. 2012. Genome Research, 22:1139-1143; “Rapid, low-input, low-bias construction of shotgun fragment libraries by high-density in vitro transposition” Adey A. et al. 2010. Genome Biology, 11: R119)または特許US5965443に開示されているタグメンテーション法の変法を用いて行うことができる。本発明で使用可能な他の方法は、限定されるものではないが、EP2527438A1、US2003143740A、US7160682BおよびWO9925817Aに開示されているものを含む。
前記工程(a)の結果得られるものは、1つのヘミアダプターが分子の各末端に連結された二本鎖DNA分子である複数のヘミアダプター含有DNA分子である。
本実施形態の第2の工程(b)は、別の第2の鎖を付加するか、またはヘミアダプター分子の第2のDNA鎖を別の第2の鎖で置換して複数のY−アダプター含有DNA分子を得ることを含む。
「置換する」という表現は、本明細書で使用する場合、ヘミアダプターの第2のDNA鎖が別の第2の鎖により置換されることを意味する。この置換は、その反応において温度、鎖の濃度および鎖の融解温度を制御することにより、ヘミアダプターの最初の第2のDNA鎖が別の第2の鎖に対して親和性を失う条件下で生じる。簡単に述べれば、最初の第2のDNA鎖は、好適なバッファー中、温度を例えば50℃に2分間引き上げることにより、ヘミアダプターの第1の鎖とのハイブリダイゼーションを失う。次に、この混合物を冷却し、別の第2の鎖が最初の第2のDNA鎖に取って代わる。ヘミアダプターの第2のDNA鎖の置換条件の例は、Adey A. and Shendure J. 2012. Genome Research, 22:1139-1143に開示されている。
「別の第2の鎖」という表現は、本明細書で使用する場合、ヘミアダプター分子の第1の鎖の3’領域に相補的な5’領域を有し、かつ、ヘミアダプターの第1の鎖に相補的でない領域を含有する鎖を意味する。一実施形態では、ヘミアダプター分子の第1の鎖の3’領域に相補的な別の第2の鎖の5’領域は、別の第2の鎖の5’末端とDNA断片の3’末端との間にギャップを持たない。別の実施形態では、別の第2の鎖の5’末端とDNA断片の3’末端との間にはギャップが存在する。
「Y−アダプター」という表現は、本実施形態に関して、2本のDNA鎖により形成されたアダプターを意味し、第1のDNA鎖の3’領域および/または中央領域と別の第2の鎖の5’領域が配列相補性により二本鎖領域を形成し、かつ、第1の鎖の5’領域と別の第2の鎖の3’領域は相補的でない。
いくつかの場合、Y−アダプターの別の第2の鎖の5’末端と各DNA断片の3’末端は、これらの末端の間にギャップが存在し得るので連結されない。
場合により、本実施形態は、Y−アダプターの別の第2の鎖の5’末端と各DNA断片の3’末端の間に存在するギャップを埋める工程(c)を含む。
用語「ギャップ」は、本明細書で使用する場合、2つのDNA鎖のうちの一方における、1以上のヌクレオチドの欠損による不連続性を意味する。
「ギャップを埋める」という表現は、本明細書で使用する場合、鎖内に欠損しているヌクレオチドを付加することを意味する。DNAポリメラーゼは、ギャップに適正なヌクレオチドを挿入し、どの塩基が相補的DNA鎖上のギャップに対応するかを認識することにより、それを鎖の3’末端のヌクレオチドに連結する。ギャップにはニックが存在するので、そのニックの両側のDNA鎖は、DNAリガーゼを使用することによって連結される。
ヘミアダプターの第1のDNA鎖がコンビナトリアル配列を含む場合、本実施形態の工程(c)は、ギャップ充填により前記コンビナトリアル配列の相補的コピーを生じる。
本実施形態の工程(d)は、Y−アダプター含有DNA分子の各鎖を伸長プライマーと、伸長プライマーとY−アダプターの別の第2の鎖とのハイブリダイゼーションに十分な条件下で接触させることを含む。
用語「伸長プライマー」は、本実施形態に関して使用される場合、本方法の次工程において伸長のために使用される、Y−アダプターの別の第2のDNA鎖に相補的な3’領域とY−アダプターの別の第2のDNA鎖と好ましくはハイブリダイズしない5’領域を含んでなるプライマーを意味する。
本実施形態の工程(d)は、平滑末端またはオーバーハング末端、好ましくは、オーバーハング末端を生じ得る。
本実施形態の工程(e)は、好ましくは、工程(d)で生成された分子とヘアピンアダプターを、ヘアピンアダプターと工程(d)で生成された分子との連結反応に十分な条件下で接触させることにより、工程(d)で生成された分子のペアを形成することを含む。場合により、前記ペア形成は、工程(d)の後に付加されるか、またはY−アダプターおよび/もしくは伸長プライマー中にすでに存在するか、バーコード配列の存在により(ヘアピン分子の不在下で)達成され得る。
用語「ヘアピンアダプター」、「ヘアピン配列」および/または「ヘアピン分子」、本実施形態に関して、それら自体が折り返して、同じ鎖の相補的塩基配列間で塩基対を形成することによって維持される二本鎖領域を形成する一本鎖核酸、対合していない塩基により形成されたヘアピンループ領域および工程(d)で生成された分子内の末端と適合する末端により形成される二重鎖を意味する。ヘアピンアダプターは、平滑末端またはオーバーハング末端、好ましくは、オーバーハング末端を含み得る。
本実施形態の別の例では、前記Y−アダプター含有DNA分子の各鎖と伸長プライマーを接触させる工程(d)と工程(d)で生成された分子とヘアピン分子を接触させる工程(e)は、ヘアピンアダプターと伸長プライマーを複合体として提供することにより単一の工程で行われる。
用語「複合体」は、本明細書で使用する場合、ヘアピンアダプターと伸長プライマーにより形成されるユニークな分子を意味する。図10は、伸長プライマーとヘアピンアダプターが複合体として提供される本実施形態に従う例を示す。この場合、複合体に含まれる伸長プライマーはアニーリングされ、連結反応は、Y−アダプターの別の第2の鎖の3’末端とヘアピンアダプターの5’末端の間で行われる。
本実施形態の別の例において、別の第2の鎖を付加するか、またはヘミアダプター分子の第2のDNA鎖を別の第2の鎖で置換する工程(b)、前記Y−アダプター含有DNA分子の各鎖と伸長プライマーを接触させる工程(d)、および工程(d)で生成された分子とヘアピン分子を接触させる工程(e)は、別の第2の鎖、ヘアピンアダプターおよび伸長プライマーを複合体として提供することにより単一の工程で行われる。
用語「複合体」、本明細書で使用する場合、別の第2の鎖、ヘアピンアダプターおよび伸長プライマーにより形成されるユニークな分子を意味する。図11は、別の第2の鎖、伸長プライマーおよびヘアピン分子が複合体として提供される本実施形態に従う実施形態を示す。この場合、複合体に含まれる別の第2の鎖は、ヘミアダプター分子の第1のDNA鎖にアニーリングされる。ギャップ充填工程(c)よび伸長工程(f)は、DNAポリメラーゼとDNAリガーゼが加えられた場合には同時に行うことができ、または伸長プライマーの3’末端が可逆的に保護される場合には、それらの工程は別個に行うことができる。好ましくは、工程(b)〜(f)は同時に行われる。
本実施形態では、ヘアピン分子への連結反応の工程(e)と伸長工程(f)は、任意の順序でまたは同時に行うことができる。
好ましい実施形態では、工程(b)もしくは場合に応じて工程(c)で得られたY−アダプター含有DNA分子または工程(e)もしくは場合に応じて工程(f)で得られた、ペアを形成したアダプター含有DNA分子は、前記分子の鎖を分離するのに十分な条件下に置かれる。
本実施形態の工程(f)の後に得られる構築物は二本鎖DNAライブラリーを形成し、シーケンシングのため、または他の従来の分子生物学的技術において使用可能である。
好ましくは、工程(a)で使用されるヘミアダプターは、ヘミアダプターのライブラリーとして提供され、ライブラリーの各メンバーは、ヘミアダプターの第1の鎖の3’領域内のコンビナトリアル配列により他から識別可能である。例えば、工程(b)で使用されるヘミアダプターの第2の鎖または別の第2の鎖は、前記コンビナトリアル領域と実質的なオーバーラップを示さない。別の例では、工程(b)で使用されるヘミアダプターの第2の鎖または別の第2の鎖は、前記コンビナトリアル領域と実質的なオーバーラップを示す。
「実質的なオーバーラップを示さない」という表現は、本明細書で使用する場合、工程(b)で使用されるヘミアダプターの第2の鎖または別の第2の鎖が伸長せず、コンビナトリアル領域を包含しないことを意味する。「実質的なオーバーラップを示す」という表現は、本明細書で使用する場合、工程(b)で使用されるヘミアダプターの第2の鎖または別の第2の鎖が伸長し、コンビナトリアル領域を部分的または完全に包含することを意味する。
場合により、Y−アダプター、伸長プライマーおよび/またはヘアピンアダプターおよび/またはバーコード配列は、存在する場合、伸長または増幅工程の後に元のDNA鋳型の回収を可能とする結合対の第2のメンバーで標識された塩基を組み込む。
場合により、本実施形態の工程(f)の後に得られる分子は、反応混合物から回収することができる。よって、本発明の本実施形態の実施形態では、好ましくは、Y−アダプター、伸長プライマーおよび/またはヘアピン分子および/または、この場合、バーコード配列は、伸長または増幅工程後に元のDNA鋳型の回収を可能とする結合対の第2のメンバーで標識される塩基を組み込んでいるので、工程(f)で得られた分子は反応混合物から回収される。
本実施形態に従い、ひと度、複数の、ペアを形成したアダプター修飾DNA分子が提供されれば(本発明の方法の工程(i))、ペアを形成したアダプター修飾DNA分子の両に存在する(非メチル化)シトシンは、ペアを形成したアダプター修飾DNA分子において、例えばウラシルに変換される(本発明の方法の工程(ii))。
よって、複数の、ペアを形成したアダプター修飾DNA分子は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬で処理され、工程(g)で使用されるプライマーは、工程(f)で得られた二本鎖DNA分子の前記試薬による処理から生じる配列の少なくとも一部に相補的である。
好ましくは、試薬はバイサルファイトである。
場合により、コンビナトリアル配列(バーコード配列)は、存在する場合、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性のある1以上の修飾シトシンを含み得る。コンビナトリアル配列は代わりにまたは加えて、非修飾シトシン(非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性がない)を含み得る。
ひと度、複数の、ペアを形成し、変換されたアダプター修飾DNA分子が生成されれば(本発明の方法の工程(ii))、ペアを形成し、変換されたアダプター修飾DNA分子の相補鎖が提供される(本発明の方法の工程(iii))。
好ましくは、本発明の方法の工程(iii)は、その配列がヘミアダプター分子の第1のDNA鎖の5’領域の相補配列の少なくとも一部に相補的なプライマー(好ましくは、二本鎖DNA分子の前記試薬による処理から生じる(本発明の方法の工程(ii)))を用いて行われる。
好ましくは、本発明の方法の工程(iii)は、その配列が、ペアを形成し、変換されたアダプター修飾DNA分子を生成するために使用される二本鎖DNA分子の集団の相補配列の少なくとも一部に相補的なプライマー(好ましくは、二本鎖DNA分子の前記試薬による処理から生じる配列に相補的(上記のような本発明の方法の工程(ii))を用いて行われる。
続いてのプライマー対を用いた増幅工程もまた可能である(本発明の方法の工程(iv))。プライマーのいずれの組合せも本発明により包含される。例えば、特定の実施形態では、工程(iii)のプライマーは、ヘミアダプター分子の第1のDNA鎖の5’領域の相補配列の少なくとも一部に相補的であり、工程(iv)のプライマーは、第1の増幅工程後に得られる分子の3’領域に相補的である。
場合により、工程(iii)および/または工程(iv)の後に得られる分子は、反応混合物から回収可能である。よって、工程(iii)および/または工程(iv)で得られる分子は、好ましくは、結合対の第1のメンバーを用いて反応混合物から回収され、ここで、工程(iii)および/または工程(iv)で使用されるプライマーは、前記結合対の第2のメンバーで修飾される。
本実施形態では、ヘアピンアダプターおよび/またはヘミアダプターの第1のDNA鎖は、支持体に固定されて提供され得る。好ましくは、前記固定は、ヘアピンアダプターのヘアピンループおよび/またはヘミアダプターの第1のDNA鎖の5’末端のヌクレオチドを前記支持体に結合させることにより行われる。本実施形態では、工程(iii)および/または工程(iv)で使用されるプライマーは、支持体と結合させることができる。好ましくは、アダプターおよび/またはプライマーと支持体の間の結合は共有結合である。
本発明の方法のさらなる実施形態
1.複数の二本鎖DNA分子の鎖のペア形成がバーコード配列の存在により達成される本発明の方法
例えば、本発明の方法の工程(i)の複数の、ペアを形成したアダプター修飾DNA分子は、二本鎖DNA分子の集団をDNAアダプターの集団と連結することにより得ることができ、各アダプターは第1のDNA鎖と第2のDNA鎖を含んでなり、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域は配列相補性により二本鎖領域を形成し、前記二本鎖領域の末端は、二本鎖DNA分子の末端に適合され、集団の各アダプターは、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域の間で形成される二本鎖領域内に位置するコンビナトリアル配列により他から識別可能であり、前記連結は、アダプターと二本鎖DNA分子の各末端の連結反応に十分な条件下で行われ、それにより複数のアダプター含有DNA分子が得られる。
よって、サンプルのメチル化を分析するために特に有用な二本鎖DNAライブラリーが得られ、DNA分子の元のセンス鎖およびアンチセンス鎖はリンカーにより互いに物理的に結合されず、それらはコンビナトリアル標識(コンビナトリアル配列またはバーコード配列)により同定され得る。特に、センス鎖およびアンチセンス鎖のそれぞれが2つのコンビナトリアル配列に連結される。
用語「DNAライブラリー」は、本明細書で使用する場合、対象とするDNA断片を同定および単離するためにアダプター分子に連結されているDNA断片のコレクションを意味する。
「二本鎖DNAライブラリー」という表現は、本明細書で使用する場合、DNAの分子の両鎖(すなわち、センス鎖とアンチセンス鎖)を含むライブラリーを意味し、前記鎖はリンカーにより物理的に連結されてない。元の分子のセンス鎖およびアンチセンス鎖は、センス鎖は2つのユニークなコンビナトリアルバーコードを含み、これがアンチセンス鎖にも存在することから、コンビナトリアル標識(コンビナトリアル配列またはバーコード配列)により同定される。DNA分子の各元の鎖は、一方の末端において、ユニークなコンビナトリアル配列を有するアダプターの第1の鎖に結合され、他方の末端において、ユニークな異なるコンビナトリアル配列を有する異なるアダプターの第2の鎖に結合される。
用語「アダプター(adapter)」および「アダプター(adaptor)」は互換的に使用され、対象とする核酸分子に連結され得るオリゴヌクレオチドまたは核酸断片もしくはセグメントを意味する。
「DNAアダプター」は、本明細書で使用する場合、第1のDNA鎖と第2のDNA鎖を含んでなり、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域は、配列相補性により二本鎖領域を形成し、前記二本鎖領域の末端は複数の二本鎖DNA分子の末端に適合され、各アダプターは、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域の間で形成される二本鎖領域内に位置するコンビナトリアル配列により他から識別可能である。DNAアダプターは、実質的に相補的な第1のDNA鎖と第2のDNA鎖により形成され得る。よって、第1のDNA鎖の5’領域と第2のDNA鎖の3’領域は相補的であり得る。DNAアダプターはY−アダプターであり得る。よって、DNAアダプターはY−アダプターであり得、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域は配列相補性により二本鎖領域を形成することができ、第1のDNA鎖の5’領域と第2のDNA鎖の3’領域は相補的でなくてよい。図14は、本発明の方法のこの態様を示す概略図を示す。場合により、DNAアダプターは、本明細書の「本発明のY−アダプターのライブラリー、それらを合成するための方法およびキット」の節に開示されているアダプターに従うアダプターであり得る。前記の節に開示されている実施形態はいずれも、本明細書で使用する場合、アダプターに適用可能である。好ましくは、各アダプターの第2のDNA鎖の3’末端は、第1のDNA鎖の5’末端と第2のDNA鎖の3’末端を連結するリンカーにより可逆的に保護される。
好ましくは、工程(i)で使用される二本鎖DNA分子は、ゲノムDNAの断片である。場合により、工程(i)で使用される二本鎖DNA分子は、前記工程(i)の前に末端修復され、好ましくは、上記のように末端修復工程後に、DNA分子にdAテールを付加する工程をさらに含んでなる。
場合により、複数の二本鎖DNA分子は、工程(i)の前に、アダプター分子とDNA分子の連結反応に十分な条件下、アダプター分子で処理され、それにより、前記DNA分子に付着末端を導入する。
連結反応工程(i)は、アダプターと二本鎖DNA分子の各末端との連結反応に十分な条件下で行われ、複数のアダプター含有DNA分子が得られる。
前記工程の結果得られるものは、複数の、ペアを形成したアダプター含有DNA分子である。各ペアを形成したアダプター修飾DNA分子は2つの異なるコンビナトリアル配列を有すると考えられ、それらはそれぞれDNA分子の各末端に連結されたアダプターの1つに位置する。
工程(i)の後に得られる構築物は、本発明の二本鎖ライブラリーを形成し、シーケンシングのため、または他の従来の分子生物学的技術において使用可能である。これらのライブラリーの利点は、コンビナトリアル配列が、より信頼性の高い結果を得るために、元々一緒にあったセンス鎖およびアンチセンス鎖から得られた配列情報の交差を可能とする。
工程(i)で得られるアダプター含有DNA分子は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬で処理される(工程(ii))。
好ましい実施形態では、試薬は、総ての非メチル化シトシンをウラシルに変換するバイサルファイトであり、ウラシルは工程(iii)で増幅される分子ではチミンとして読み取られる。
工程(ii)の処理後、元の二本鎖DNA分子のセンス鎖とアンチセンス鎖の間の相補性は部分的にまたは完全に失われる。これは次工程で使用されるプライマーのアニーリングを助長する。
工程(ii)の後に得られる構築物はまた、シーケンシングのため、または他の従来の分子生物学的技術において、特に、サンプルのメチル化を分析するためにも使用可能である。
本発明の方法の第3の工程(工程(iii))では、工程(ii)で得られたペアを形成し、変換されたアダプター修飾DNA分子の相補鎖が提供される。この工程では、その配列が(二本鎖DNA分子の前記試薬による処理(本発明の方法の工程(ii))から生じる)アダプターの第2のDNA鎖少なくとも一部に相補的なプライマーが使用される。これは図14に示され、二本鎖DNAライブラリーを生成するために使用されるペアを形成し、変換されたアダプター修飾二本鎖DNA分子の集団の全配列に対して相補鎖を得ることを可能とする。
工程(ii)が行われた後、前記分子が、非メチル化シトシンを、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基に変換する試薬で処理された際に、工程(iii)で使用されたプライマーは、ペアを形成し、変換されたアダプター修飾DNA分子とハイブリダイズすることができる。例えば、前記プライマーは、それが前記変換を受ける前にはアダプター分子とハイブリダイズできないものであり得る。アダプター分子が非メチル化シトシンを含む場合、工程(iii)で使用されるプライマーは、元のアダプター分子の非メチル化シトシンと対合する位置に、グアニン塩基の代わりにアデニン塩基を有する。アダプター分子は、メチル化シトシンまたは非メチル化シトシンを含み得る。場合により、アダプター分子、ヘアピン配列および/またはバーコード配列の配列の特定の部分が前記試薬による処理の後に変化しないようにするために、第1のアダプター分子および好ましくはアダプター配列内のコンビナトリアル配列の配列は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に対して耐性のある修飾シトシンを含み得る。アダプターは非メチル化(非修飾)シトシンを含み得る。
いずれのバイアス(TAまたはCGバイアス)も分析段階で評価および考慮可能であるという点で、同じサンプルのアリコートに対して異なる条件で異なる増幅を行うことができることに留意されたい。
場合により、DNAアダプターには、工程(i)、(ii)、(iii)または(iv)の後に元のDNA鋳型の回収を可能とする結合対の第2のメンバーで標識された塩基が組み込まれる。
場合により、本発明の方法の工程(i)または工程(ii)で得られるDNA分子は、工程(i)、工程(ii)の後または場合に応じて工程(iii)の後および/または工程(iv)の後に得られる反応混合物から、好ましくは結合対の第1のメンバーを使用することにより回収され、ここで、アダプターは上記のように前記結合対の第2のメンバーで修飾される。
場合により、工程(iii)でおよび/または工程(iv)の後に得られるDNA分子は、好ましくは結合対の第1のメンバーを使用することにより反応混合物から回収され、ここで、工程(iii)でおよび/または工程(iv)の後に使用されるプライマーは、前記結合対の第2のメンバーで修飾される。
コンビナトリアルバーコードは、サンプルの同定、複合体形成、ペア形成ならびに定量的分析を可能にし、増幅工程中のバイアスおよびエラー制御をモニタリングするために有用である。この場合に得られる構築物は、センス鎖に関連付けられた2つの異なる識別子を有し、それらはアンチセンス鎖に関連付けられたものと同じ2つの識別子である。両コンビナトリアル配列はセンス鎖とアンチセンス鎖で同じであるので、両鎖はプロセス中に追跡可能である。全プロセスの後に、元々一緒にあった相補鎖は2つの同じコンビナトリアル配列を共有する。最初のサンプル中の各個の分子に2つのユニークな識別子が関連付けられており、従って、構築物間の識別能が得られる。工程(ii)後に二本鎖DNA分子の元のセンス鎖およびアンチセンス鎖は分離され得るが、これらの鎖のそれぞれは両方のコンビナトリアル配列を含むので、前記ユニークな識別子は、前記識別子を含んでなる特定の構築物およびその後代の同定を可能とする。従って、ユニークな識別子を保持する前記の最初の個々の分子のいずれの増幅産物も同一系統であると想定される。
これは、DNA鋳型として使用されるサンプルが識別され、プロセス中に保存され、回収され、蓄積され、また、異なる条件で何回も増幅を受けることができ、サンプル消耗なくシーケンシングを受けることができるという利点を提供する。
「二本鎖DNA分子の集団」、「コンビナトリアル配列」、「末端」、「適合する」、「連結反応」、「鋳型」、「プライマー」、「相補的」、「増幅」、「結合対」、「結合対の第1のメンバー」、「結合対の第2のメンバー」、「ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基」および「修飾シトシン」という表現は、本発明の方法に関して定義されている。
総ての本発明の方法で使用される実施形態および定義は本例にも適用可能である。
2.複数の二本鎖DNA分子の鎖のペア形成がバーコード配列の存在により達成される本発明の方法
例えば、本発明の方法の工程(i)の複数の、ペアを形成したアダプター修飾DNA分子は、
(a)複数の二本鎖DNA分子を、オーバーハング末端を有する二本鎖DNA分子の複数の断片を生成するのに十分な条件下で断片化すること、ここで、各断片の各末端はヘミアダプター分子に結合され、前記ヘミアダプター分子は第1のDNA鎖および場合により第2のDNA鎖を含んでなり、ここで、各ヘミアダプターは、第1のDNA鎖の3’領域内に位置するコンビナトリアル配列により他から識別可能であり、第2の鎖は第1の鎖と、第1の鎖の中央領域との相補性によって二本鎖領域を形成し、ヘミアダプター分子は、ヘミアダプターの第1の鎖の3’末端と二本鎖DNA分子の断片のオーバーハング末端の間の二本鎖DNA分子の断片に結合される、
(b)別の第2の鎖を付加するか、またはヘミアダプター分子の第2のDNA鎖を別の第2の鎖で置換すること、ここで、前記別の第2の鎖の5’領域は、ヘミアダプター分子の第1の鎖の3’領域に相補的であり、前記別の第2の鎖は、ヘミアダプター分子の第1の鎖に相補的でない領域を含有し、それにより、複数のY−アダプター修飾DNA分子を生成する、
(c)場合により、Y−アダプターの別の第2の鎖の5’末端と各DNA断片の3’末端の間に存在するギャップを埋めること
により得られ得る。
この場合、本発明の方法の工程(i)の後に得られる複数の、ペアを形成したアダプター修飾DNA分子は、種々の断片化システムに適合される。
第1の工程では、複数の二本鎖DNA分子が、オーバーハング末端を有する二本鎖DNA分子の断片の集団を生成するのに十分な条件下で断片化され、ここで、各断片の各末端は、ヘミアダプター分子と、ヘミアダプターの第1の鎖の3’末端と二本鎖DNA分子の断片のオーバーハング末端の間で結合される。
用語「ヘミアダプター」は、本明細書で使用する場合、第1のDNA鎖および場合により第2のDNA鎖により形成される不完全なアダプターを意味し、ここで、第2の鎖は、第1の鎖の中央領域との相補性により第1の鎖と二本鎖領域を形成し、各ヘミアダプターは、第1のDNA鎖の3’領域内に位置するコンビナトリアル配列により他から識別可能である。一実施形態では、ヘミアダプターは、第2のDNA鎖を含まない。ヘミアダプターは第1および第2のDNA鎖を含んでなり得る。
好ましくは、ヘミアダプターの第2の鎖は、前記コンビナトリアル配列と実質的なオーバーラップを示さない。
好ましくは、工程(i)で使用される二本鎖DNA分子は、ゲノムDNAの断片である。
場合により、工程(i)で使用される二本鎖DNA分子は、前記工程(i)の前に末端修復され、好ましくは、末端修復工程の後にDNA分子にdAテールを付加する工程をさらに含んでなる。
場合により、二本鎖DNA分子の集団は、工程(i)の前に、アダプター分子とDNA分子の連結反応に十分な条件下、アダプター分子で処理され、それにより、前記DNA分子に付着末端を導入する。
断片化およびヘミアダプターと二本鎖DNA分子の連結反応を含んでなる第1の工程は、例えば、in vitro転移により行われてよく、ここで、転移要素がドナーDNA(ヘミアダプター分子)から標的DNA(二本鎖DNA分子の集団)へ導入される。
好ましくは、断片化工程(i)は、二本鎖DNA分子の集団を、二本鎖アダプター分子を積載したトランスポゼース二量体と接触させることを含んでなる方法により行われ、ここで、前記アダプター分子は、Tn5逆位リピートと鎖の一方の5’オーバーハングを含んでなる二本鎖領域を含んでなり、Tn5逆位リピートの一部を形成しない二本鎖領域および一本鎖領域のシトシンヌクレオチドは場合によりメチル化され、接触は、DNAの断片化に、および各DNA断片の両末端へのヘミアダプター分子の結合に十分な条件下で行われる。
「二本鎖アダプター分子」という表現は、本明細書で使用する場合、Tn5逆位リピートと鎖の一方の5’オーバーハングを含んでなる二本鎖領域を含んでなるアダプター分子を意味する。
前記工程の結果得られるものは、1つのヘミアダプターが分子の各末端に連結された二本鎖DNA分子である複数のヘミアダプター含有DNA分子である。各ヘミアダプター含有DNA分子は、2つの異なるコンビナトリアル配列を有することになり、それらはそれぞれ、DNA分子の各末端に連結されたヘミアダプターの第1のDNA鎖の3’領域内に位置する。
第2の工程(b)は、別の第2の鎖を付加するか、またはヘミアダプター分子の第2のDNA鎖を別の第2の鎖で置換し、複数のY−アダプター含有DNA分子を得ることを含む。
「別の第2の鎖」という表現は、本明細書で使用する場合、ヘミアダプター分子の第1の鎖の3’領域に相補的な5’領域を有し、かつ、ヘミアダプターの第1の鎖に相補的でない領域を含有する鎖を意味する。場合により、ヘミアダプター分子の第1の鎖の3’領域に相補的な別の第2の鎖の5’領域は、ヘミアダプターの別の第2の鎖の5’末端とDNA断片の3’末端との間にギャップを持たない。別の実施形態では、ヘミアダプターの別の第2の鎖の5’末端とDNA断片の3’末端との間にギャップが存在する。
好ましくは、別の第2の鎖は、ヘミアダプターの第1のDNA鎖のコンビナトリアル領域と実質的なオーバーラップを示さない。
「Y−アダプター」という表現は、本明細書で使用する場合、2本のDNA鎖により形成されたアダプターを意味し、第1のDNA鎖の3’領域および/または中央領域と別の第2の鎖の5’領域が配列相補性により二本鎖領域を形成し、かつ、第1の鎖の5’領域と別の第2の鎖の3’領域は相補的でない。
いくつかの実施形態では、Y−アダプターの別の第2の鎖の5’末端と各DNA断片の3’末端は、これらの末端の間にギャップが存在し得るので連結されない。
工程(b)の後に得られる構築物は、本発明の二本鎖ライブラリーを形成し、シーケンシングのため、または他の従来の分子生物学的技術において使用可能である。これらのライブラリーの利点は、コンビナトリアル配列が、より信頼性の高い結果を得るために、元々一緒にあったセンス鎖およびアンチセンス鎖から得られた配列情報の組合せを可能とする。
場合により、工程(c)は、Y−アダプターの別の第2の鎖の5’末端と各DNA断片の3’末端の間に存在するギャップを埋めることを含む。
この工程は、ギャップ充填により、ヘミアダプターの第1のDNA鎖のコンビナトリアル配列の相補的コピーを生成する。
その後、得られた複数の、ペアを形成したアダプター修飾DNA分子には、続いて上記のように本発明の方法の工程(ii)および(iii)(および場合により工程(iv))が行われる。
場合により、Y−アダプターには、元のDNA鋳型の回収を可能とする結合対の第2のメンバーで標識された塩基が組み込まれる。Y−アダプターは、メチル化シトシンおよび/または非メチル化シトシンを含んでなり得る。「二本鎖DNA分子の集団」、「コンビナトリアル配列」、「末端」、「適合する」、「連結反応」、「鋳型」、「プライマー」、「相補的」、「増幅」、「結合対」、「結合対の第1のメンバー」、「結合対の第2のメンバー」、「ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基」および「修飾シトシン」という表現は上記で定義されている。
「トランスポゼース」、「トランスポゼース二量体」、「積載される」、「Tn5逆位リピート」、「DNAの断片化および各DNA断片の両末端へのヘミアダプター分子の結合に十分な条件」、「置換する」、「ギャップ」、「ギャップを埋める」および「実質的なオーバーラップを示さない」という表現は上記で定義されている。
用語「DNAライブラリー」および「二本鎖DNAライブラリー」は上記で定義されている。
シーケンシング工程(本発明の方法の工程(v))
本発明の方法の工程(ii)、(iii)および/または工程(iv)で生成されたペアを形成したDNA分子(二本鎖DNAライブラリーまたはDNAライブラリーとも呼ばれる)は、シーケンシング技術に好適である(好ましくは、工程(iii)および/または工程(iv)で生成されたペアを形成したDNA分子が配列決定される)。
本発明の方法で生成されたDNAライブラリーのデザインは、現行使用されている方法よりも良好に、前工程中に生じたバイアスをモニタリングすること、ならびにシーケンシングおよび変換エラーを検出することを可能とする。
増幅が起こる際、いくつかの理由のために一部の断片が選択的に増幅されるようになることがある。この望ましくない効果は、シーケンシングの多くの適用で重要である定量目的、特に、DNAのメチル化状態の分析目的(各細胞の各対立遺伝子は異なるメチル化状態を持ち、一様なサンプルでも不均質な組成を持ち得るので、ほとんどの適用で定量およびバイアス制御が不可欠なものとなる)では大きな問題となる。
本発明の方法で生成された二本鎖DNAライブラリーは、シーケンシング中に全二本鎖DNA分子の両鎖が同時に読み取られるという利点を有する。前記二重読み取りは、個々の配列リードごとに生じた体系的な潜在的シーケンシングエラーが検出および補正できるので、方法の信頼性を高める。
現在のところ、シーケンシングマシンは、想定する必要のある誤り率を有する。これらのエラーのほとんどは、最終結果では表出され得ず、隠れたままとなる。これはその後の結果の処理および分析にマイナスの結果を及ぼす。本発明の方法は、各ヌクレオチドに関する最大4つの情報源(所与のdsDNAおよび場合に応じてそれらの各合成相補鎖の上鎖および下鎖)を提供し、総ての読み取りが一貫していなければならないので、各ヌクレオチドの読み取りのバリデーションを可能とする。よって、本発明の方法は、(一次配列決定およびシトシンメチル化分析の両方を目的とする)配列決定のエラーの検出および補正をも可能とする。
シーケンシングエラーは、それが鎖の一方にのみ存在する場合に検出される。このエラーは、非対称メチル化と混同される可能性がなければ補正可能となり、ヌクレオチド検出の信頼性は高く、参照ゲノム配列が識別を可能とする。
遺伝子変異体(すなわち、突然変異およびSNP)は、真の遺伝子変異体と見なされるためには変異が両鎖で見られなければならないので、シーケンシングエラーと混同される可能性はない。本発明の方法の二重検出は、実際に、変異検出のバリデーションとなる。さらに、一次配列とメチル化の情報が同時に評価されるので、非メチル化シトシンからくるチミンが、突然変異またはSNPからくるチミンから識別可能である。
加えて、コンビナトリアル配列(バーコード配列)がアダプター内に含まれる場合、増幅バイアスを追跡し、サンプル中に最初に存在していたユニークな二本鎖DNA分子を計数することが可能である。この定量はまた、本発明のシーケンシング法の際にも可能である。
二本鎖DNAライブラリーは、次世代シーケンシング(NGS)アプローチを含む従来のいずれのシーケンシング法において使用可能である。本発明に従って二本鎖DNAライブラリーを生成するための方法は、DNAシーケンシングのための現行および今後のパイプライン、すなわち、NGS技術およびその他に組み込むことができる。ライブラリーのNGSは、利用可能なほとんどのプラットフォームを用いて行うことができる。ペアを形成した末端シーケンシングも、必要ではないが、使用可能である。ペアを形成した末端シーケンシングはより長い断片の検討を可能とする。シーケンシングが分子全体をカバーしない場合であっても、シーケンシング領域が相補的領域、および必要であればバーコードを含む限り、2鎖のペア形成に基づく情報が取得できる(例えば、図13参照)。
あるいは、遺伝子座特異的シーケンシングも同様に実施可能である。
本発明の方法に従って得られるライブラリーは、それらが得られた反応混合物から直接シーケンシングに使用してもよく、またはそれらはシーケンシングプロセスの前に精製してもよい。
一態様において、本発明は、二本鎖DNA分子の集団の配列を決定するための方法であって、前記二本鎖DNA分子の集団から、本発明の、その実施形態のいずれかにおける方法を用いてライブラリーを生成すること、ならびに本発明の方法の工程((ii))、(iii)または場合に応じて工程(iv)(本発明の方法の工程(v))で得られたDNA分子のシーケンシングを行うことを含んでなる方法に関する。
用語「シーケンシング」または「配列を決定する」または「配列決定」などという表現は、特に、核酸内の複数の連続するヌクレオチドの決定および順序付けを含む、核酸のヌクレオチド塩基配列に関する情報の決定を意味する。前記情報には、核酸の部分的ならびに完全な配列情報の同定または決定を含み得る。前記情報は、二本鎖DNAライブラリーの一次配列、エピジェネティック修飾(例えば、メチル化またはヒドロキシメチル化)またはその両方に関する。配列情報は、様々な程度の統計学的信頼性(statistical reliability or confidence)で決定され得る。上記で説明したように、本発明の方法は、二本鎖DNA分子が配列決定される場合に高い信頼性の取得を可能とする。
本発明の方法は、さらに、二本鎖DNAライブラリーの一次配列のシーケンシングにも使用可能である。
一次配列の決定は、突然変異または遺伝子変異体、例えば、多形(SNPなど)の検出を含む。
好ましくは、本発明の方法は、一次配列およびシトシンのメチル化の両方を同じ読み取りで同時に決定することを可能とする。シーケンシングの出力を分析することにより、各リードは、両鎖の一次配列(突然変異およびSNPを含む)およびメチル化配列ならびにアダプターに含まれるコンビナトリアル配列の情報を有する。
メチル化シトシンの同定
本発明の方法は、二本鎖DNA分子の集団におけるメチル化シトシンの同定を可能とする。
本発明の方法(工程(iii)または(iv))に従って生成される二本鎖DNA分子(二本鎖DNAライブラリーとも呼ばれる)は、上記のようにメチル化シトシンの同定に好適である。
ある位置のメチル化シトシンの存在は、鎖の一方にシトシンが見られ、反対鎖の対応する位置にグアニンが見られる場合に決定され、ある位置の非メチル化シトシンの存在は、鎖の一方にウラシルまたはチミンが見られ、反対鎖の対応する位置にグアニンが見られる場合に決定される。
「鎖」という表現は、本明細書で使用する場合、二本鎖DNA分子の各鎖を意味する。2鎖のペア形成がヘアピン分子の存在によって起こる場合、DNA分子の両鎖は相互に連結されてユニークな分子を形成する。ペア形成がヘアピン分子の存在なく起こる場合は、DNA分子の鎖は異なる分子にあり、すなわち、それらは物理的に相互に連結されていないが、コンビナトリアル配列により同定できる。
「反対鎖」という表現は、第1の鎖に対して本明細書で使用する場合、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理の前に、第1の鎖に相補的であった鎖を意味し得る。例えば、DNA分子のアンチセンス鎖は、センス鎖の反対鎖である。用語「反対鎖」は、試薬による処理後はそれらの鎖間の相補性が部分的にまたは完全に失われ得るので、用語「相補鎖」よりも広いものであり得る。
「対応する位置」という表現は、本明細書で使用する場合、反対鎖における同じ位置(すなわち、反対鎖における所与のヌクレオチド位置とペアを形成するヌクレオチド位置(前記ペア形成は、相補的である必要はない))を意味する。
「二本鎖DNA分子の集団」、「ライブラリー」、「アダプター修飾DNA分子」、「試薬」、「ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基」、「プライマー」、「特異的」という表現は、上記で定義されている。
用語「シーケンシング」は、本発明のシーケンシング法に関して定義されている。従って、本発明の方法のシーケンシング工程(v)(メチル化シトシンの同定のため)は、一次配列およびメチル化情報を同時に得ることを可能とする。
好ましくは、非メチル化シトシンの、シトシンとは検出可能に異なる塩基への変換を可能とする試薬はバイサルファイトである。好ましくは、シトシンとは検出可能に異なる塩基はチミンまたはウラシル、より好ましくは、ウラシルである。
非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬(例えば、バイサルファイト)による処理は、本発明の方法の工程(i)で得られた分子の総ての非メチル化シトシンをウラシルに変換する。前記の処理済み分子が本発明の方法の工程(iii)を受けると、合成される相補的DNA分子は、鋳型分子がウラシルを有する位置にアデニンを有することになる。分子(場合により本方法の工程(iv)で増幅される)は、第1の分子ではウラシルであったところにチミンを有する(ただし、チミンが増幅に使用され、ウラシルが使用されない場合)。従って、非メチル化シトシンは、プロセスの終了時にはウラシルまたはチミンとして読み取られる。
伸長またはPCR増幅時に、ウラシルはチミンとして増幅され、一方、5−メチルシトシン残基はシトシンのままであり、これにより、メチル化シトシンを元の二本鎖DNA分子中の非メチル化シトシンから識別することが可能となる。元の二本鎖DNA分子中のメチル化シトシンは、二本鎖DNAライブラリーの分子が配列決定された際に、所与の位置にシトシンが存在し、これに対して反対鎖の対応する位置にグアニンが存在することで推測できる。元の二本鎖DNA分子中の非メチル化シトシンは、二本鎖DNAライブラリーの分子が配列決定された際に、所与の位置にウラシルまたはチミンが存在し、これに対して反対鎖の対応する位置にグアニンが存在することで推測できる。
本発明の方法の工程(iii)または(iv)で得られる、ペアを形成した二本鎖DNA分子(DNAライブラリーとも呼ばれる)が使用される場合、各リードは、試薬により変換された、二本鎖DNA分子の両鎖の配列を有する。元々相補的であった鎖は、ペアの形成がバーコードの使用により達成されたならば、各鎖のコンビナトリアル配列(バーコード配列またはコンビナトリアルバーコード)から取り除くことができる。
この情報を用いれば、両鎖の元の配列(試薬による変換前)が推測できる。従って、各リードに関して、元の二本鎖DNA分子の両鎖の一次配列(参照ゲノムにマッピングするためおよび多形を評価するため)およびメチル化状態の情報が得られる。これらの分子のコンビナトリアル標識は、二本鎖DNA分子の元の両鎖の、試薬により変換された配列の評価を可能とする。
元の二本鎖DNA分子の配列の推測を可能とするプロセスは、二本鎖DNAライブラリーの各分子に関して試薬で処理する前の配列と前記試薬で処理した後の配列を得るために、出力配列を処理するソフトウエアの手段により行われる。その後、このソフトウエアは、各鎖およびその真正な相補鎖からの情報を、その真正な相補鎖が第1の鎖に元々結合されていた鎖であることを考慮しながら交差させる。この情報は、両鎖が物理的に連結された本発明の方法により得られるライブラリーでは、直接的に得ることができる。この情報は、元の鎖がコンビナトリアル配列によりペアが形成されている場合には、間接的に得られる。
開発されたソフトウエアは、(i)一次配列とメチル化情報を統合すること、(ii)突然変異、SNP、およびCNV(欠損および増加)を検出すること、および(iii)シーケンシングエラーおよびバイアスを検出することができる。
元の二本鎖DNA分子の両鎖のメチル化情報が決定されるので、これは各鎖においてヘミメチル化またはメチル化対称を評価することを可能とする。
用語「ヘミメチル化」および「非対称メチル化」は互換的に使用され、2鎖のうちの一方だけがメチル化されている二重鎖DNAの配列、例えば、CpGを意味する。
y−アダプターのライブラリー、それらを合成するための方法およびキット
本発明はまた、本発明の方法で使用されるY−アダプターを合成するための方法およびキットを提供する。本発明はまた、Y−アダプターのライブラリーを含有するキットを提供する。
本発明はまた、Y−アダプターのライブラリーに関し、ここで、各Y−アダプターは、第1のDNA鎖と第2のDNA鎖を含んでなり、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域は、配列相補性により二本鎖領域を形成し、第2のDNA鎖の3’領域は、前記3’領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成することができ、第1のセグメントは3’領域の3’末端に位置し、第2のセグメントは、第2のDNA鎖の、第1のDNA鎖の3’領域と二本鎖領域を形成している領域の近傍に位置し、ライブラリーの各メンバーは、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域の間で形成される二本鎖領域内に位置する1以上の(好ましくは、1つの)コンビナトリアル配列により、および/またはY−アダプターの一本鎖領域に位置する1以上のコンビナトリアル配列により他から識別可能である。好ましくは、Y−アダプターは、Y−アダプターの二本鎖領域内に1つのバーコード配列とY−アダプターの一本鎖領域内に1つのバーコード配列を含んでなる。場合により、Y−アダプターは、Y−アダプター内に上記のように「切断のための部位」をさらに含んでなる。好ましくは、「切断のための部位」は、Y−アダプターの一本鎖領域内に位置する。
Y−アダプターのライブラリーの好ましい実施形態では、コンビナトリアル配列は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性のある1以上の修飾シトシンを含む。
Y−アダプターのライブラリーの別の実施形態では、各アダプターにおける第2のポリヌクレオチドの3’末端は可逆的に保護される。
「可逆的に保護される」という表現は、本明細書で使用する場合、限定されるものではないが、ポリヌクレオチドが合成のためにプライミングされないようにする可逆的保護基による可逆的修飾を意味する。前記修飾は可逆的であるので、保護基はさらなる工程で除去され得る。
用語「可逆的保護基」は、本明細書で使用する場合、ポリヌクレオチドの3’末端の3’OH基を置換してポリメラーゼ伸長を妨げる基を意味する。例示的な可逆的保護基は、限定されるものではないが、3’−p;3’−アミノ;3’−逆位3−3’デオキシヌクレオシド(idN)、イノシン、3’−Oエーテル、例えば、3’−O−アリル(Intelligent Bio−Systems)、3’−O−メトキシメチル、3’−O−ニトロベンジルおよび3’−O−アジドメチル(Illumina/Solexa);3’−アミノアルコキシルおよび3’−O−アミノである。例示的な可逆的保護基としてはまた、Gardner A.F. et al. 2012. Nucleic Acids Research, 40(15):7404-7415に開示されているものがあり、Lightning Terminators(商標)(Lasergen、Inc.)と呼ばれる。本発明の文脈では、全ジデオキシヌクレオチド(ddCMP、ddAMP、ddTMP、ddGMP)も「可逆的保護基」と考えることができる。
用語「可逆的保護基」はまた、本明細書で使用する場合、第1のDNA鎖の5’末端と第2のDNA鎖の3’末端を連結し、除去可能なリンカーも含む。前記リンカーは、限定されるものではないが、典型的ヌクレオチド、修飾ヌクレオチド、または典型的もしくは修飾型いずれかのヌクレオチドの配列であり得る。リンカーが除去されると、アダプターの第1のDNA鎖と第2のDNA鎖は分離される。アダプターは、本発明の方法において、リンカーが除去される前または除去された後に、二本鎖DNA分子の集団との連結反応に使用され得る。リンカーは支持体に連結可能である。
従って、Y−アダプターのライブラリーの別の実施形態では、各アダプターの第2のポリヌクレオチドの3’末端は、第1のDNAの5’末端と第2のDNA鎖の3’末端を連結するリンカーによって可逆的に保護される。
Y−アダプターのライブラリーの別の実施形態では、各アダプターの第1のDNA鎖の3’領域と第2のDNA鎖の5’領域の間で形成される二本鎖領域の末端セグメントは、制限エンドヌクレアーゼの標的部位を含む。
用語「制限エンドヌクレアーゼ」は、制限部位または標的部位(制限酵素により認識されるオリゴヌクレオチド配列)として知られる特定の認識ヌクレオチド配列の位置で、またはその近傍でDNAを切断する酵素を意味する。例示的制限エンドヌクレアーゼは現況技術において周知である。制限エンドヌクレアーゼとしては、限定されるものではないが、I型酵素、II型酵素、IIS型酵素、III型酵素およびIV型酵素が挙げられる。REBASEデータベースは、制限エンドヌクレアーゼに関する情報の包括的データベースを提供している(Roberts R.J. et al. 2010. Nucleic Acids Research, 38: D234-D236)。
用語「標的部位」は、本明細書で使用する場合、制限エンドヌクレアーゼにより特異的に認識されるヌクレオチド配列を意味する。
別の態様では、本発明は、DNA Y−アダプターを作製するための方法であって、
(i)第1の一本鎖ポリヌクレオチドを第2の一本鎖ポリヌクレオチドと接触させる工程、ここで、第1の一本鎖ポリヌクレオチドの3’領域は、第2のポリヌクレオチドの5’領域の少なくとも一部に相補的である、
ここで、第2の一本鎖ポリヌクレオチドの3’領域は、前記3’領域内の第1のセグメントと第2のセグメントのハイブリダイゼーションによりヘアピンループを形成し、第1のセグメントは第2のポリヌクレオチドの3’領域の3’末端に位置し、第2のセグメントは5’領域の近傍に位置し、第2のポリヌクレオチドの3’末端は可逆的に保護され、
前記接触は、第1の一本鎖ポリヌクレオチドの3’領域と第2の一本鎖ポリヌクレオチドの5’領域内の相補的領域のハイブリダイゼーションに十分な条件下で行われ、それにより二重鎖DNA分子を生成する、
(ii)前記第1の一本鎖ポリヌクレオチド内に第2のポリヌクレオチドの5’領域に相補的な配列を作出するように第1のポリヌクレオチドの3’末端を伸長させる工程、および
(iii)場合により、第2のポリヌクレオチドの3’末端を脱保護する工程
を含んでなる方法に関する。
工程(i)は、第1の一本鎖ポリヌクレオチドの3’領域と第2の一本鎖ポリヌクレオチドの集団のメンバーの5’領域内の相補的領域のハイブリダイゼーションに十分な条件下で行われる。ハイブリダイゼーションに十分な条件は、本発明の第1の方法に関して定義されている。
工程(ii)は、伸長を含む。伸長の好適な条件は当業者に周知である。
工程(iii)は、第2のポリヌクレオチドの3’末端を脱保護することを含む。用語「脱保護する」は、ポリヌクレオチドの3’末端から保護基を除去し、3’−OH基を回復させることを意味する。脱保護に好適な条件は、二重鎖を破壊せず、DNAを損傷もしない条件であり、除去される特定の保護基に依存する。例えば、3’−O−アリル基は遷移金属触媒により切断され、3’−O−メトキシメチル基は酸により切断され、3’−O−ニトロベンジル基は光により切断され、3’−oアジドメチレン基はホスフィンにより切断される。可逆的保護基がジデオキシヌクレオチドである場合、二重鎖を破壊することなく(すなわち、第1の一本鎖ポリヌクレオチドの3’領域と第2の一本鎖ポリヌクレオチドの5’領域内の相補的領域の間のペア形成が維持される)、第2のポリヌクレオチドの3’末端からジデオキシヌクレオチド全体が除去される。用語「脱保護」はまた、第1の一本鎖ポリヌクレオチドの5’末端と第2の一本鎖ポリヌクレオチドの3’末端を連結するリンカーを除去することも意味する。
DNA Y−アダプターを作製するための方法の好ましい実施形態では、工程(ii)で行われる伸長は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性のある修飾シトシンの存在下で行われる。
別の実施形態では、工程(i)で使用される第1の一本鎖ポリヌクレオチドおよび/または第2の一本鎖ポリヌクレオチドはまた、修飾シトシンも含む。
別の好ましい実施形態では、本発明の第3の方法に従ってDNA Y−アダプターを作製するための方法は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬でY−アダプターを処理することをさらに含んでなる。
別の好ましい実施形態では、第1のポリヌクレオチドの3’末端内の少なくとも1つの位置はグアニンであり、前記位置とハイブリダイズする第2のポリヌクレオチドの5’領域内の位置または第1のポリヌクレオチドの3’末端の位置はシトシンまたはメチル−シトシンである。
別の好ましい実施形態では、第2の一本鎖ポリヌクレオチドの5’末端は、伸長工程(ii)中に相補鎖が形成される際に相補鎖上に複製されて、制限エンドヌクレアーゼの標的部位を形成する配列を含んでなる。
第2の一本鎖ポリヌクレオチドは、パリンドローム配列であってもなくてもよい配列を含んでなる。パリンドローム配列は、一方の鎖では5’から3’へ読まれ、または相補鎖では5’から3’へ読まれるが、同じである核酸配列である。
「相補鎖上に複製される」という表現は、合成される相補鎖が第2の一本鎖ポリヌクレオチドの相補的でかつ逆平行の配列を含むことを意味する。
Y−アダプターは、本発明の方法の産物の追跡を可能とするコンビナトリアルバーコードを含み得る。
第2の一本鎖ポリヌクレオチドはポリヌクレオチドのライブラリーとして提供され、ここで、ライブラリーの各メンバーは、前記ポリヌクレオチドの5’領域に位置するコンビナトリアル配列(バーコード配列またはコンビナトリアルバーコードとも呼ばれる)により他から識別可能であり、前記コンビナトリアル配列は、第1の一本鎖ポリヌクレオチドと配列相補性を示す領域よりも上流に位置し、それにより、DNA Y−アダプター分子のライブラリーを生成する。より好ましい実施形態では、コンビナトリアル配列は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性がある1以上のシトシンを含む。図15は、本発明の第3の方法に従ってコンビナトリアル配列を含有するDNA Y−アダプターを作製するための方法の一実施形態を示す。
コンビナトリアル配列は、いくつかの縮重したヌクレオチドにより形成される(各縮重ヌクレオチドは2以上のヌクレオチドの混合物である)。Xがコンビナトリアル配列内の種々の縮重ヌクレオチドの数であり、Yがコンビナトリアル配列のヌクレオチドの長さである場合、得られ得る異なるアダプターの数はXYである。例えば、コンビナトリアル配列がA、TまたはGであり得る4ヌクレオチド長であれば、異なるアダプターの数は34=81であり、Y−アダプター含有DNA分子中の2つのアダプターの組合せの数は812=6561である。コンビナトリアル配列が、A、TまたはGであり得る5ヌクレオチド長であれば、異なるアダプターの数は243であり、Y−アダプター含有DNA分子中の2つのアダプターの組合せの数は59049である。
「上流」という表現は、本明細書で使用する場合、鎖の5’末端側の領域を意味する。
別の実施形態では、第1の一本鎖ポリヌクレオチドおよび/または第2の一本鎖ポリヌクレオチドは支持体に固定されて提供され、ここで、前記固定は、第1の一本鎖ポリヌクレオチドの5’末端または第2の一本鎖ポリヌクレオチドのヘアピンループのヌクレオチドを前記支持体に結合させることにより行われる。好ましくは、前記結合は共有結合である。
別の実施形態では、第1の一本鎖ポリヌクレオチドおよび第2の一本鎖ポリヌクレオチドは、第1の一本鎖ポリヌクレオチドの5’末端と第2の一本鎖ポリヌクレオチドの3’末端の間でリンカーにより連結され、前記リンカーが支持体に固定される。リンカーの支持体への結合は伸長工程を助長する。リンカーと支持体の間の結合は、Y−アダプターの合成が完了した後に、アダプターを遊離させるために破断されてもよい。リンカーにより支持体に連結されたアダプターはまた、分子を連結するためにも使用され得る。
本発明はまた、本発明の方法のY−アダプターを得るためのポリヌクレオチドを含んでなるキットを提供する。
別の態様において、本発明は、
(i)5’領域および3’領域を含んでなる第1の一本鎖ポリヌクレオチド、
(ii)5’領域および3’領域を含んでなる第2のポリヌクレオチド、ここで、3’領域は、前記3’領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成し、第1のセグメントは3’領域の3’末端に位置し、第2のセグメントは5’領域の近傍に位置し、第2のポリヌクレオチドの3’末端は可逆的に保護される、
ここで、第1の一本鎖ポリヌクレオチドの3’領域は、第2のポリヌクレオチドの5’領域の少なくとも一部に相補的である、
を含んでなるキットに関する。
「キット」という表現は、本明細書で使用する場合、他のタイプの生化学的試薬、容器、パッケージ、例えば、市販規模を意図したパッケージング、電子ハードウエア成分などを含む2以上の要素または成分の組合せを意味する。
好適なキットは、チューブ、バイアル、および収縮包装および吹き込み成形パッケージを含む好適な容器およびパッケージング材料中に、本発明において使用するための種々の試薬を含む。加えて、本発明のキットは、キット内にある種々の成分の同時、逐次または個別使用に関する説明書を含み得る。前記説明書は印刷物の形態であってもよく、または 電子保存媒体(磁気ディスクおよびテープなど)、および光媒体(CD−ROM、DVD)など、それらが対象者により読まれ得るように説明書を保存し得る電子支援の形態であってもよい。加えてまたはあるいは、媒体は、前記説明書を提供するインターネットアドレスを含み得る。
本発明のキットの好ましい実施形態では、第2のポリヌクレオチドは、ポリヌクレオチドのライブラリーとして提供され、ここで、各メンバーは、第2のポリヌクレオチドの5’領域内で、かつ、第1の一本鎖ポリヌクレオチドと配列相補性を示す領域よりも上流に位置するコンビナトリアル配列により他から識別可能である。より好ましい実施形態では、コンビナトリアル配列は、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性のある1以上の修飾シトシンを含む。
別の実施形態では、第1の一本鎖ポリヌクレオチドおよび/または第2のポリヌクレオチドはまた修飾シトシンも含む。
別の実施形態では、第2のポリヌクレオチドの5’領域は、二本鎖領域に変換された際に制限エンドヌクレアーゼの標的部位を作り出す配列を含む。
場合により、本キットは1以上の付加的成分を含んでなり得る。
別の実施形態では、本キットは、
(i)DNAポリメラーゼ、
(ii)A、G、CおよびTから選択される1以上のヌクレオチド、
(iii)非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性のある1以上の修飾シトシン、
(iv)第2のポリヌクレオチドの3’末端から保護基を除去し得る試薬、
(v)非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬、
(vi)第2のポリヌクレオチドの5’末端内の配列により形成される標的部位に特異的な制限エンドヌクレアーゼ
からなる群から選択される1以上の成分をさらに含んでなる。
「DNAポリメラーゼ」という表現は、本明細書で使用する場合、鋳型としての核酸鎖を用いてDNA鎖をde novo合成し、新たに形成する鎖の3’−ヒドロキシル末端にのみ遊離のヌクレオチドを付加する酵素を意味する。この結果、5’−3’方向の新たな鎖の伸長が得られる。DNAポリメラーゼは、天然のDNAポリメラーゼまたは上述の活性を有する天然酵素の変異体であり得る。
本キットに提供されるヌクレオチドは、修飾ヌクレオチドであってもよい。修飾ヌクレオチドの例は、修飾シトシン、例えば、メチルシトシンおよびヒドロキシメチルシトシンである。
「第2のポリヌクレオチドの3’末端から保護基を除去し得る試薬」という表現は、本明細書で使用する場合、第2のポリヌクレオチドの3’末端を脱保護する試薬を意味する。前記試薬は、使用する特定の保護基によって異なる。好適な試薬は上記に開示されている(例えば、酸、ホスフィンなど)。
標的部位に特異的な制限エンドヌクレアーゼは、標的配列を特異的に認識し、その位置で、またはその近傍で切断することができる制限エンドヌクレアーゼである。
好ましい実施形態では、1以上の修飾シトシンは、メチルシトシン、ヒドロキシメチルシトシンおよびそれらの組合せからなる群から選択される。
本発明はまた、本発明の方法のY−アダプターのライブラリーとさらなる成分を含んでなるキットを提供する。
別の態様において、本発明は、
(i)Y−アダプターのライブラリー、ここで、各Y−アダプターは、第1のDNA鎖と第2のDNA鎖を含んでなり、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域は配列相補性により二本鎖領域を形成し、第2のDNA鎖の3’領域は、前記3’領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成し、第1のセグメントは3’領域の3’末端に位置し、第2のセグメントは第2のDNA鎖の、第1のDNA鎖の3’領域と二本鎖領域を形成する領域の近傍に位置し、ライブラリーの各メンバーは、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域の間で形成される二本鎖領域内に位置するコンビナトリアル配列により他から識別可能であり、および
(ii)
a)DNAポリメラーゼ、
b)A、G、CおよびTから選択される1以上のヌクレオチド、
c)非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性のある1以上の修飾シトシン、
d)第2のポリヌクレオチドの3’末端から保護基を除去し得る試薬、
e)非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬、
f)第2のポリヌクレオチドの5’末端内の配列により形成される標的部位に特異的な制限エンドヌクレアーゼ
からなる群から選択される1以上の成分
を含んでなるキットに関する。
Y−アダプターのライブラリーに関して、また、Y−アダプターを得るためのキットの付加的成分に関して従前に開示された特定の実施形態は総て、本発明の方法のY−アダプターのライブラリーを含んでなるキットに適用可能である。
他の用語および表現も従前に定義されている。
コンビナトリアル配列を含有する二本鎖DNAアダプターのライブラリーおよびそれを得るための方法
本発明はまた、本発明の方法またはコンビナトリアルバーコードを必要とする他の任意の方法論で使用され得るコンビナトリアル配列(「バーコード配列」または「コンビナトリアルバーコード」)を有する二本鎖DNAアダプターのライブラリーを合成するための方法を提供する。
アダプターを合成するために、2つの部分的に相補的なオリゴヌクレオチドからなり、その1つがコンビナトリアル領域を有する前駆体が使用され得る。このコンビナトリアル領域は、前駆体型の一本鎖DNAである。この前駆体型を十分な酵素とともにインキュベートした後、不完全なオリゴヌクレオチドが完成し、コンビナトリアル領域が二本鎖DNAとなる。
一態様において、本発明は、二本鎖DNAアダプターのライブラリーを得るための方法であって、各アダプターが第1のDNA鎖と第2のDNA鎖を含んでなり、各アダプターが第1のDNA鎖の3’領域と第2のDNA鎖の5’領域の間で形成される二本鎖領域内に位置するコンビナトリアル配列により他から識別可能であり、
(i)定常領域とコンビナトリアル領域を含んでなる一本鎖DNA分子の集団を提供する工程、ここで、前記一本鎖DNA分子は、コンビナトリアル領域内の配列により他から識別可能であり、定常領域はコンビナトリアル領域の3’側に位置し、3’末端は可逆的に保護される、および
(ii)鋳型として工程(i)の一本鎖DNA分子を使用し、一本鎖DNA分子の定常領域と完全にまたは部分的にハイブリダイズする伸長プライマーを使用することにより二本鎖DNAを生成し、それにより、新たに生成された鎖上にコンビナトリアル領域を複製し、それにより、二本鎖コンビナトリアル配列を作製する工程
を含んでなる方法に関する。
「定常領域」という表現は、本明細書で使用する場合、一本鎖DNA分子の集団の各メンバーに関して配列が同じである一本鎖DNA分子内の領域を意味する。
「可逆的に保護される」という表現は、本発明のこの態様で使用する場合、ポリヌクレオチドの3’末端の3’OH基を置換してポリメラーゼ伸長を妨げる基を意味する。前記修飾は可逆的であるので、保護基はさらなる工程で除去され得る。例示的可逆的保護基は、「本発明のY−アダプターのライブラリー、それらを合成するための方法およびキット」に関して開示されている。
「可逆的に保護される」という表現にはまた、第1のDNA鎖の5’末端と第2のDNA鎖の3’末端を連結し、除去可能なリンカーも含む。
「可逆的に保護される」という表現にはまた、その3’末端を前記支持体に結合させることによる一本鎖DNA分子の支持体における固定も包含する。保護は可逆的であるので、一本鎖DNA分子の3’末端と支持体の間の連結はさらなる工程で破断され得る。
「一本鎖DNA分子の定常領域と完全にまたは部分的にハイブリダイズする」という表現は、本明細書で使用する場合、伸長プライマーの全体または御一部が非共有結合的に結合して、一本鎖DNA分子の定常領域と安定な二本鎖ポリヌクレオチドを形成することを意味する。「ハイブリダイゼーション」および「ハイブリダイゼーション条件」という表現 は、本発明の第1の方法に関して定義されている。
伸長プライマーは、そのプライマーの100%が前記領域とハイブリダイズ場合に、一本鎖DNA分子の定常領域と完全にハイブリダイズする。伸長プライマーは、プライマーの100%未満が前記領域とハイブリダイズする場合に、一本鎖DNA分子の定常領域と部分的にハイブリダイズする。好ましくは、少なくとも0.1%、少なくとも0.5%、少なくとも1%、少なくとも2%、少なくとも5%、少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%の伸長プライマーは、一本鎖DNA分子の定常領域とハイブリダイズしない。
「コンビナトリアル領域」という表現は、本明細書で使用する場合、一本鎖DNA分子の集団の各メンバーに関して配列が異なる一本鎖DNA分子内の可変領域を意味する。コンビナトリアル配列という用語は従前に定義されている。
「新たに生成された鎖上にコンビナトリアル領域を複製する」という表現は、本明細書で使用する場合、新たに生成された鎖が一本鎖DNA分子のコンビナトリアル領域の相補的でかつ逆平行の配列を含むことを意味する。
好ましい実施形態では、本方法は、一本鎖DNA分子の3’末端から保護基を除去することをさらに含んでなる。
別の実施形態では、伸長プライマーは、一本鎖DNA分子の定常領域とはハイブリダイズしないオーバーハング5’領域を含んでなる。
別の実施形態では、一本鎖DNA分子の定常領域は、伸長プライマーとはハイブリダイズしないオーバーハング3’領域を含んでなる。
別の実施形態では、一本鎖DNA分子の定常領域は、前記定常領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成する。
コンビナトリアル配列は、別個に作製され、次いで、コンビナトリアルアダプターを作製するために別のアダプターに付加されてもよい。従って、ライブラリーのアダプターは、複雑性の高いアダプターを得るために他の不完全なアダプターと結合可能なモジュールとして使用され得る。例えば、2本の相補鎖により形成されるライブラリーのコンビナトリアルアダプターは、非コンビナトリアルY−アダプターに連結して、コンビナトリアル領域を有するY−アダプターのコレクションを得ることができる。
別の実施形態では、本方法は、ライブラリーのアダプターを第2のDNA分子に連結することをさらに含んでなり、前記第2のDNA分子は、その末端がアダプター分子の末端に適合する二本鎖領域を有する。好ましくは、前記第2のDNA分子は、互いにハイブリダイズしない、第1の鎖の5’領域および/または第2の鎖の3’領域にオーバーハング領域を含んでなる。より好ましい実施形態では、第2の鎖の3’オーバーハング領域は、前記領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成する。
別の実施形態では、工程(i)の各一本鎖DNA分子は、支持体に固定されて提供される。より好ましい実施形態では、前記固定は、一本鎖DNA分子の5’末端を前記支持体に、好ましくは共有結合によって結合させることにより行われる。別の実施形態では、前記固定は、一本鎖DNA分子の3’末端を前記支持体に、好ましくは共有結合によって結合させることにより行われる。別の好ましい実施形態では、一本鎖DNA分子の定常領域が前記定常領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成する場合、前記固定は、一本鎖DNA分子のヘアピンループのヌクレオチドを前記支持体に、好ましくは共有結合によって結合させることにより行われる。
別の実施形態では、第1のDNA鎖と第2のDNA鎖は、第1のDNA鎖の5’末端と第2のDNA鎖の3’末端の間でリンカーにより連結され、前記リンカーは支持体に固定される。リンカーと支持体の結合は伸長工程を助長する。リンカーと支持体の間の結合は、アダプターの合成が完了した後にアダプターを遊離させるために破断され得る。リンカーにより支持体に連結されたアダプターはまた分子を連結するためにも使用可能である。
本発明はまた、前記方法により得られる二本鎖DNAアダプター分子のライブラリーに関する。
別の態様において、本発明は、二本鎖DNAアダプター分子のライブラリーに関し、こここで、各DNAアダプター分子は定常領域と可変領域を含んでなり、各二本鎖DNAアダプターは第1のDNA鎖と第2のDNA鎖を含んでなり、各アダプターは、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域の間で形成された二本鎖領域内に位置する可変領域内のコンビナトリアル配列により他から識別可能である。
好ましい実施形態では、これらの鎖の少なくとも一方の3’末端は可逆的に保護される。
別の実施形態では、一鎖または両鎖がオーバーハング領域を含んでなり、反対鎖とハイブリダイズしない。好ましくは、これらの鎖の一方の定常領域は、前記定常領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成する。
図16は、本発明の前記態様の種々の実施形態を示し、ここで、Y−アダプターは本発明の第3の方法によるヘアピンを含んでなり、本発明の第4、第6および第7の方法によるY−アダプター、ヘミアダプターおよびブレーンアダプターが得られる。
以上に本発明を明瞭性と理解のためにいくらか詳細に記載してきたが、当業者には本開示を読むことで、本発明の真の範囲および添付の特許請求の範囲から逸脱することなく形態および詳細における様々な変更が行えることが認識されるであろう。
以下、本発明を下記の実施例により説明するが、それらは単に例であって本発明の範囲を何ら限定しないと見なされなければならない。
実施例1:2本の元の鎖が物理的にペア形成され、所望の中間生成物だけが選択的にフィルタリングされ、バイサルファイトで変換され、増幅され、配列決定される方法のプロトコール
アダプターの作製。ヘアピンアダプターを10μMオリゴヌクレオチドc15_Hairp01−5’P(配列番号1)から作製した。二本鎖アダプターを20μMオリゴヌクレオチドc14_Hang04 5’P(配列番号2)および20μMオリゴヌクレオチドc14_BIO05noB(配列番号3)から作製した。アダプターを、サーモサイクラーでの初期変性とその後の段階的冷却(95°2’;80°2’;65°10’;37°10’;25°5’;4°−‘)によりハイブリダイズさせた。
連結反応プロセス。4pmolのdsDNA断片(30マー)を、最終容量20μLで、T4DNAリガーゼおよびT4バッファーの存在下、終濃度0.2μMとなるように3μMヘアピンアダプターおよび3μM二本鎖アダプターと、23℃で15分間混合した。反応産物はG50カラムで精製した。
連結反応産物の捕捉。適切な反応産物をヘアピンアダプターに相補的なビオチン化オリゴヌクレオチドの手段により捕捉した:3μLの20μM c14_BIO04−5’B (配列番号4)をSSCの存在下、10μLの連結反応物に加えた。この反応試験管を穏やかに混合し、サーモサイクラーでインキュベートした(90°2’;65°5’;60°5’;55°5’;25°−‘)。30μLのM−270ビーズを再懸濁させ、製造者の説明書に従って最終容量90μLのBW1xとなるように調製した。M−270ビーズを捕捉反応物に加え、ラウンド温度で15分間インキュベートした。反応物を洗浄し、連結反応産物をM−270ビーズから遊離させた。ビーズをSCC1×に再懸濁させ、ヒーティングブロックにて95℃で2分間インキュベートした。対象とする連結反応産物を含有する上清を回収した。
バイサルファイト。50μLの連結反応産物捕捉物を標準的な手順に従い、または製造者の説明書に従い、重亜硫酸ナトリウムで処理した。最終産物を30μLの溶出バッファーで溶出させた。
増幅。1μLの前工程産物を、ZymotagまたはTurboPfuなどのポリメラーゼを使用することにより、プライマーc14_amp02F(配列番号5)およびc14_amp02R(配列番号6)を用いて増幅した。20μMの各プライマー1μLを30μLの最終容量反応物に対して用いた。20回のPCRサイクル(95°2’;62°30’’;72°1’)を行った。産物をG50カラムで精製し、PAGE電気泳動により評価した。
シーケンシング。前工程から得られた産物をIon Torrentのプロトコールに従って処理し、Integrative Genomics Viewerを用いて可視化した。
実施例2:相補鎖が生成され、それらの鋳型と物理的にペアが形成され、得られた全中間生成物がバイサルファイトにより変換され、増幅され、配列決定される方法のプロトコール
アダプターの作製。Y−アダプターを20μMオリゴヌクレオチドc15_YA4(配列番号7)および20μMオリゴヌクレオチドc15_Hairp06(配列番号8)から作製した。アダプターをサーモサイクラーでの初期変性とその後の段階的冷却(95o2’80°2’;65°10’;37°10’;25°5’;4°−‘)によりハイブリダイズさせた。
連結反応プロセス。4pmolのdsDNA断片(30マー)を、最終容量20μLで、T4DNAリガーゼおよびT4バッファーの存在下、終濃度0.2μMとなるように2.5μMのY−アダプターと、23℃で15分間混合した。反応産物をG50カラムで精製した。
連結反応産物伸長。30μL容量の反応物に、dNTPを含む最適バッファー下、反応物にポリメラーゼを加えることにより、連結反応産物を伸長させた。この反応試験管を穏やかに混合し、サーモサイクラーでインキュベートした(25°2’;72°10’;4°−‘)。
バイサルファイト。20μLの連結反応産物捕捉物を標準的な手順に従い、または製造者の説明書に従い、重亜硫酸ナトリウムで処理した。最終産物を20μLの溶出バッファーで溶出させた。
増幅。1μLの前工程産物を、ZymotagまたはTurboPfuなどのポリメラーゼを使用することにより、プライマーc14_amp02F(配列番号5)およびc14_amp02R(配列番号6)を用いて増幅した。20μMの各プライマー1μLを30μLの最終容量反応物に対して用いた。20回のPCRサイクル(95°2’;62°30’’;72°1’)を行った。産物をG50カラムで精製し、PAGE電気泳動により評価した
シーケンシング。前工程から得られた産物をIon Torrentのプロトコールに従って処理し、Integrative Genomics Viewerを用いて可視化した。
本発明の項
本発明は、以下の項を提供する。
[1].二本鎖DNA分子の集団から二本鎖DNAライブラリーを生成するための方法であって、
(i)二本鎖DNA分子の集団を第1のアダプター分子および第2のアダプター分子と接触させる工程、ここで、前記第1のアダプター分子は、一方の末端に二本鎖DNAの末端と適合する末端を有する二本鎖DNA分子であり、
ここで、第2のアダプター分子は、ヘアピンループ領域と二本鎖領域を含んでなるヘアピンアダプターであり、前記二本鎖領域は、二本鎖DNA分子の末端と適合する末端を含み、かつ、
前記接触工程は、第1および/または第2のアダプター分子とDNA分子との連結反応による複数のアダプター修飾DNA分子の取得に十分な条件下で行われる、
(ii)工程(i)で得られたアダプター修飾DNA分子の集団から、アダプター修飾DNA分子の一末端または二末端に第2のアダプター分子を含んでなる分子を回収する工程、
(iii)工程(ii)で得られたアダプター修飾DNA分子を鋳型として用い、鎖合成を生じさせる条件下で、その配列が第1のアダプター分子の配列の少なくとも一部に相補的なプライマーを用いてDNA鎖を合成する工程、および
(iv)場合により、工程(iii)で得られた二本鎖DNA分子を、その配列が第1のアダプター領域の少なくとも一部に相補的なプライマーを用いて増幅する工程
を含んでなる方法。
[2].回収工程(ii)が、第2のアダプターの配列の少なくとも一部に相補的な配列および精製タグを含んでなるポリヌクレオチドを用いて行われる、[1]に記載の方法。
[3].工程(ii)で得られたDNA分子が、工程(iii)後、または場合に応じて工程(iv)後に得られた反応混合物から回収される、[1]または[2]に記載の方法。
[4].前記反応混合物からの回収が結合対の第1のメンバーを用いて行われ、第1および/または第2のアダプターが前記結合対の第2のメンバーで修飾される、[3]に記載の方法。
[5].二本鎖DNA分子の集団から二本鎖DNAライブラリーを生成するための方法であって、
(i)二本鎖DNA分子の集団を第1のアダプター分子および第2のアダプター分子と接触させる工程、ここで、前記第1のアダプター分子は、一方の末端に二本鎖DNAの末端と適合する末端を有する二本鎖DNA分子であり、
ここで、第2のアダプター分子は、ヘアピンループ領域と二本鎖領域を含んでなるヘアピンアダプターであり、前記二本鎖領域は、二本鎖DNA分子の末端と適合する末端を含み、
第1のアダプター分子または第2のアダプター分子またはその両方は支持体に固定されて提供され、前記固定は、第1のアダプター分子の鎖の一末端または第2のアダプター分子のヘアピンループのヌクレオチドを前記支持体に結合させることにより行われ、かつ
前記接触工程は、第1および/または第2のアダプター分子とDNA分子との連結反応による複数のアダプター修飾DNA分子の取得に十分な条件下で行われる、
(ii)工程(i)で得られたアダプター修飾DNA分子を鋳型として用い、その配列が、第1のアダプター分子の配列の少なくとも一部に相補的なプライマーを用いてDNA鎖を合成する工程、および
(iii)場合により、工程(ii)で得られた二本鎖DNA分子を、その配列が第1のアダプター領域の少なくとも一部に相補的なプライマーを用いて増幅する工程
を含んでなる方法。
[6].工程(i)で使用される二本鎖DNA分子がゲノムDNAの断片である、[1]〜[5]に記載の方法。
[7].工程(i)で使用される二本鎖DNA分子が前記工程(i)の前に末端修復される、[1]〜[6]に記載の方法。
[8].末端修復工程の後にDNA分子にdAテールを付加する工程をさらに含んでなる、[7]に記載の方法。
[9].第1および/または第2のアダプター分子がそれぞれアダプター分子の第1および第2のライブラリーとして提供され、前記ライブラリーの各メンバーがアダプター配列内のコンビナトリアル配列により他から識別可能である、[1]〜[8]に記載の方法。
[10].アダプター修飾DNA分子の集団が、ライブラリーが[1]に記載の方法により得られた場合には工程(iii)の前に、またはライブラリーが[5]に記載の方法により得られた場合には工程(ii)の前に、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬で処理され、[1]の工程(iii)および(iv)または場合に応じて[5]の工程(ii)および(iii)で使用されるプライマーが、前記試薬で処理された後に第1のアダプター分子に特異的である、[1]〜[9]に記載の方法。
[11].アダプター配列内のコンビナトリアル配列が、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性がある修飾シトシンを含む、[10]に記載の方法。
[12].ライブラリーが[1]に記載の方法により得られた場合には工程(iii)もしくは場合に応じて工程(iv)で、またはライブラリーが[5]に記載の方法により得られた場合には工程(ii)もしくは場合に応じて工程(iii)で得られたDNA分子が反応混合物から回収される、[1]〜[11]に記載の方法。
[13].前記反応混合物からの回収が結合対の第1のメンバーを用いて行われ、[1]の工程(iii)もしくは場合に応じて工程(iv)で、または[5]の工程(ii)もしくは場合に応じて工程(iii)で使用されるプライマーが前記結合対の第2のメンバーで修飾される、[12]に記載の方法。
[14].二本鎖DNA分子の集団が工程(i)の前に、アダプター分子とDNA分子の連結反応に十分な条件下、アダプター分子で処理され、それにより、前記DNA分子に付着末端が導入される、[1]〜[13]に記載の方法。
[15].二本鎖DNA分子の集団の配列を決定するための方法であって、[1]〜[14]に記載の方法を用いて前記二本鎖DNA分子の集団からライブラリーを生成すること、およびライブラリーが[1]に記載の方法により得られた場合には工程(iii)もしくは場合に応じて工程(iv)で得られたDNA分子、またはライブラリーが[5]に記載の方法により得られた場合には工程(i)もしくは工程(ii)もしくは場合に応じて工程(iii)で得られたDNA分子のシーケンシングを行うことを含んでなる、方法。
[16].二本鎖DNA分子の集団におけるメチル化シトシンの同定のための方法であって、
(i)[1]〜[14]に記載の方法を用いて前記二本鎖DNA分子の集団からライブラリーを生成する工程、ここで、アダプター修飾DNA分子の集団は、ライブラリーが[1]に記載の方法により得られた場合には工程(iii)の前に、またはライブラリーが[5]に記載の方法により得られた場合には工程(ii)の前に、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬で処理され、ライブラリーが[1]に記載の方法により得られた場合には工程(iii)および(iv)で、またはライブラリーが[5]に記載の方法により得られた場合には工程(ii)および(iii)で使用されるプライマーは、前記試薬で処理された後に第1のアダプター分子に特異的である、および
(ii)ライブラリーが[1]に記載の方法により得られた場合には工程(iii)の前に、またはライブラリーが[5]に記載の方法により得られた場合には工程(ii)の前に、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬で処理された、ライブラリーが[1]に記載の方法により得られた場合には工程(ii)もしくは工程(iii)もしくは場合に応じて工程(iv)で得られたDNA分子またはライブラリーが[5]に記載の方法により得られた場合には工程(i)もしくは工程(ii)もしくは場合に応じて工程(iii)で得られたDNA分子のシーケンシングを行う工程、
ここで、ある位置のメチル化シトシンの存在は、鎖の一方にシトシンが見られ、反対鎖の対応する位置にグアニンが見られる場合に決定され、ある位置の非メチル化シトシンの存在は、鎖の一方にウラシルまたはチミンが見られ、反対鎖の対応する位置にグアニンが見られる場合に決定される、
を含んでなる、方法。
[17].二本鎖DNA分子の集団から二本鎖DNAライブラリーを生成するための方法であって、
(i)二本鎖DNA分子の集団をDNA Y−アダプターと接触させる工程、前記アダプターは、第1のDNA鎖と第2のDNA鎖を含んでなり、
ここで、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域は配列相補性により二本鎖領域を形成し、
Y−アダプターの第1のDNA鎖の3’領域と第2のDNA鎖の5’領域により形成された前記二本鎖領域の末端は、二本鎖DNA分子の末端に適合し、
Y−アダプターの第2のDNA鎖の3’領域は、前記3’領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成し、第1のセグメントは第2のDNA鎖の3’領域の3’末端に位置し、第2のセグメントは5’領域の近傍に位置し、
前記接触は、Y−アダプターと二本鎖DNA分子の両末端との連結反応による複数のY−アダプター含有DNA分子の取得に十分な条件下で行われる、
(ii)工程(i)で得られたDNA分子の鎖のそれぞれを、工程(i)で得られたDNA分子の鎖のそれぞれを鋳型として用いて、Y−アダプター分子の第2のDNA鎖の3’末端からのポリメラーゼ伸長により二本鎖DNA分子に変換する工程、および
(iii)場合により、工程(ii)で得られた二本鎖DNA分子を、その配列が、工程(ii)で得られた二本鎖DNA分子の少なくとも一部に相補的な少なくとも1つのプライマーを用いて増幅する工程
を含んでなる、方法。
[18].工程(i)で得られたY−アダプター含有DNA分子が、工程(ii)の前に、Y−アダプター含有DNA分子の鎖の分離に十分な条件下で処理される、[17]に記載の方法。
[19].二本鎖DNA分子の集団から二本鎖DNAライブラリーを生成するための方法であって、
(i)二本鎖DNA分子の集団をDNA Y−アダプターと接触させる工程、前記アダプターは第1のDNA鎖と第2のDNA鎖を含んでなり、
ここで、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域は配列相補性により二本鎖領域を形成し、前記二本鎖領域の末端は二本鎖DNA分子の末端に適合し、
前記接触が、Y−アダプターと二本鎖DNA分子の両末端との連結反応による複数のY−アダプター含有DNA分子の取得に十分な条件下で行われる、
(ii)前記Y−アダプター含有DNA分子の各鎖と、Y−アダプター分子の第2のDNA鎖に相補的な3’領域を含んでなる伸長プライマーとを、伸長プライマーとY−アダプターの第2の鎖のハイブリダイゼーションに十分な条件下で接触させ、これがY−アダプター分子の第2のDNA鎖とのハイブリダイゼーション後にオーバーハング末端を作り出す工程、
(iii)工程(ii)で生成された分子をヘアピンアダプターと、ヘアピンアダプターと工程(ii)で生成された分子の連結反応に十分な条件下で接触させる工程、前記ヘアピンアダプターは、ヘアピンループ領域と、工程(ii)で生成された分子のオーバーハング末端と適合するオーバーハング末端を含んでなる、
(iv)工程(iii)で得られたDNA分子の鎖のそれぞれを、工程(ii)で使用された伸長プライマーからのポリメラーゼ伸長により二本鎖DNA分子に変換する工程、および
(v)場合により、工程(iv)で得られた二本鎖DNA分子を、その配列が、工程(iv)で得られた二本鎖DNA分子の少なくとも一部に相補的な少なくとも1つのプライマーを用いて増幅する工程、
ここで、ヘアピンアダプターとの連結反応の工程(iii)および伸長工程(iv)は任意の順序でまたは同時に行うことができる、
を含んでなる、方法。
[20].工程(i)または工程(iii)で得られたY−アダプター含有DNA分子が、前記Y−アダプター含有DNA分子の鎖の分離に十分な条件下に置かれる、[19]に記載の方法。
[21].前記Y−アダプター含有DNA分子の各鎖を伸長プライマーと接触させる工程(ii)と工程(ii)で生成された分子をヘアピンアダプターと接触させる工程(iii)が、ヘアピンアダプターと伸長プライマーを複合体として提供することにより単一の工程で行われる、[19]または[20]に記載の方法。
[22].工程(i)で使用される二本鎖DNA分子がゲノムDNAの断片である、[17]〜[21]に記載の方法。
[23].工程(i)で使用される二本鎖DNA分子が前記工程(i)の前に末端修復される、[17]〜[22]に記載の方法。
[24].末端修復工程後にDNA分子のdAテールを付加する工程をさらに含んでなる、[23]に記載の方法。
[25].Y−アダプターがアダプターのライブラリーとして提供され、ライブラリーの各メンバーが、アダプターの第1のDNA鎖の3’領域と第2のDNA鎖の5’領域により形成された二本鎖領域内に位置するコンビナトリアル配列により他から識別可能である、[17]〜[24]に記載の方法。
[26].コンビナトリアル配列が、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性がある修飾シトシンを含む、[25]に記載の方法。
[27].アダプター含有DNA分子が、ライブラリーが[17]に記載の方法により得られた場合には工程(iii)の前に、またはライブラリーが[19]に記載の方法により得られた場合には工程(v)の前に、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬で処理され、[17]の工程(iii)または場合に応じて[19]の工程(v)で使用されるプライマーが、[17]の工程(ii)または場合に応じて[19]の工程(iv)で得られた二本鎖DNA分子の前記試薬による処理から得られる配列の少なくとも一部に相補的である、[17]〜[26]に記載の方法。
[28].ヘアピンアダプターおよび/またはY−アダプターが支持体に固定されて提供され、前記固定が、ヘアピンアダプターのヘアピンループのヌクレオチドおよび/またはY−アダプターの第2のDNA鎖のヘアピンループのヌクレオチドおよび/またはY−アダプターの第1のDNA鎖の5’末端を前記支持体に結合させることにより行われる、[17]〜[27]に記載の方法。
[29].二本鎖DNA分子の集団の配列を決定するための方法であって、前記二本鎖DNA分子の集団から、[17]〜[28]に記載の方法を用いてライブラリーを生成すること、およびライブラリーが[17]に記載の方法により得られた場合には工程(ii)もしくは場合に応じて工程(iii)で得られたDNA分子またはライブラリーが[19]に記載の方法により得られた場合には工程(iv)もしくは場合に応じて工程(v)で得られたDNA分子のシーケンシングを行うことを含んでなる、方法。
[30].二本鎖DNA分子の集団におけるメチル化シトシンの同定のための方法であって、
(i)[17]〜[28]に記載の方法を用いて前記二本鎖DNA分子の集団からライブラリーを生成する工程、ここで、アダプター修飾DNA分子の集団は、ライブラリーが[17]に記載の方法により得られた場合には工程(iii)の前に、またはライブラリーが[19]に記載の方法により得られた場合には工程(v)の前に、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬で処理され、ライブラリーが[17]に記載の方法により得られた場合には工程(iii)で、またはライブラリーが[19]に記載の方法により得られた場合には工程(v)で使用されるプライマーは、前記試薬で処理された後に、[17]の工程(ii)でまたは[19]の工程(iv)で得られた二本鎖DNA分子のこれらの配列に特異的である、および
(ii)ライブラリーが[17]に記載の方法により得られた場合には工程(iii)の前に、またはライブラリーが[19]に記載の方法により得られた場合には工程(v)の前に、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬で処理された、ライブラリーが[17]に記載の方法により得られた場合には工程(ii)もしくは場合に応じて工程(iii)で得られたDNA分子またはライブラリーが[19]に記載の方法により得られた場合には工程(iv)もしくは場合に応じて工程(v)で得られたDNA分子のシーケンシングを行う工程、
ここで、ある位置のメチル化シトシンの存在は、鎖の一方にシトシンが見られ、反対鎖の対応する位置にグアニンが見られる場合に決定され、ある位置の非メチル化シトシンの存在は、鎖の一方にウラシルまたはチミンが見られ、反対鎖の対応する位置にグアニンが見られる場合に決定される、
を含んでなる、方法。
[31].二本鎖DNA分子の集団から二本鎖DNAライブラリーを生成するための方法であって、
(i)二本鎖DNA分子の集団を、オーバーハング末端を有する二本鎖DNA分子の断片の集団を生成するのに十分な条件下で断片化する工程、ここで、各断片の各末端はヘミアダプター分子に結合され、前記ヘミアダプター分子は第1のDNA鎖および場合により第2のDNA鎖を含んでなり、第2の鎖は第1の鎖と、第1の鎖の中央領域との相補性によって二本鎖領域を形成し、ヘミアダプター分子は、ヘミアダプターの第1の鎖の3’末端と二本鎖DNA分子の断片のオーバーハング末端の間の二本鎖DNA分子の断片に結合される、
(ii)別の第2の鎖を付加するか、またはヘミアダプター分子の第2のDNA鎖を別の第2の鎖で置換する工程、ここで、前記別の第2の鎖の5’領域は、ヘミアダプター分子の第1の鎖の3’領域に相補的であり、前記別の第2の鎖は、ヘミアダプター分子の第1の鎖に相補的でない領域を含有し、それにより、複数のY−アダプター含有DNA分子を生成する、
(iii)場合により、Y−アダプターの別の第2の鎖の5’末端と各DNA断片の3’末端の間に存在するギャップを埋める工程、
(iv)前記Y−アダプター含有DNA分子の各鎖と、Y−アダプター分子の別の第2のDNA鎖およびY−アダプターの別の第2のDNA鎖とハイブリダイズしない5’領域に相補的な3’領域を含んでなる伸長プライマーとを、伸長プライマーとY−アダプターの別の第2の鎖のハイブリダイゼーションに十分な条件下で接触させる工程、
(v)工程(iv)で生成された分子をヘアピンアダプターと、ヘアピンアダプターと工程(iv)で生成された分子の連結反応に十分な条件下で接触させる工程、前記ヘアピンアダプターは、ヘアピンループ領域と工程(iv)で生成された分子の末端に適合する末端を含んでなる、
(vi)工程(v)で得られたDNA分子の鎖のそれぞれを、工程(iv)で使用された伸長プライマーからのポリメラーゼ伸長により二本鎖DNA分子に変換する工程、および
(vii)場合により、工程(vi)で得られた二本鎖DNA分子を、その配列が、工程(vi)で得られた二本鎖DNA分子の少なくとも一部に相補的な少なくとも1つのプライマーを用いて増幅する工程、
ここで、ヘアピンアダプターとの連結反応の工程(v)および伸長工程(vi)は任意の順序でまたは同時に行うことができる、
を含んでなる、方法。
[32].断片化工程(i)が、二本鎖DNA分子の集団を、二本鎖アダプター分子を積載したトランスポゼース二量体と接触させることを含んでなる方法により行われ、ここで、前記アダプター分子は、Tn5逆位リピートと鎖の一方の5’オーバーハングを含んでなる二本鎖領域を含んでなり、Tn5逆位リピートの一部を形成しない二本鎖領域および一本鎖領域のシトシンヌクレオチドは場合によりメチル化され、接触は、DNAの断片化に、および各DNA断片の両末端へのヘミアダプター分子の結合に十分な条件下で行われる、[31]に記載の方法。
[33].工程(ii)もしくは場合に応じて工程(iii)で得られたY−アダプター含有DNA分子または工程(v)もしくは場合に応じて工程(vi)で得られたヘアピンアダプター含有DNA分子が、前記Y−アダプター含有DNA分子の鎖の分離に十分な条件下に置かれる、[31]または[32]に記載の方法。
[34].前記Y−アダプター含有DNA分子の各鎖を伸長プライマーと接触させる工程(iv)と工程(iv)で生成された分子をヘアピンアダプターと接触させる工程(v)が、ヘアピンアダプターと伸長プライマーを複合体として提供することにより単一の工程で行われる、[31]〜[33]に記載の方法。
[35].別の第2の鎖を付加するか、またはヘミアダプター分子の第2のDNA鎖を別の第2の鎖で置換する工程(ii)、前記Y−アダプター含有DNA分子の各鎖を伸長プライマーと接触させる工程(iv)および工程(iv)で生成された分子をヘアピンアダプターと接触させる工程(v)が、別の第2の鎖、ヘアピンアダプターおよび伸長プライマーを複合体として提供することにより単一の工程で行われる、[31]〜[33]に記載の方法。
[36].工程(ii)〜(vi)が同時に行われる、[35]に記載の方法。
[37].工程(i)で使用されるヘミアダプターがヘミアダプターのライブラリーとして提供され、ライブラリーの各メンバーがヘミアダプターの第1の鎖の3’領域内のコンビナトリアル配列により他から識別可能である、[31]〜[36]に記載の方法。
[38].ヘミアダプターの第2の鎖または工程(ii)で使用される別の第2の鎖が前記コンビナトリアル配列と実質的なオーバーラップを示さない、[37]に記載の方法。
[39].コンビナトリアル配列が、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性のある1以上の修飾シトシンを含む、[37]または[38]に記載の方法。
[40].アダプター含有DNA分子が、工程(vii)の前に、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬で処理され、工程(vii)で使用されるプライマーが、工程(vi)で得られた二本鎖DNA分子の前記試薬による処理から生じた配列の少なくとも一部に相補的である、[31]〜[39]に記載の方法。
[41].工程(vi)または場合に応じて工程(vii)で得られた分子が反応混合物から回収される、[31]〜[40]に記載の方法。
[42].二本鎖DNA分子の集団の配列を決定するための方法であって、[31]〜[41]に記載の方法を用いて前記二本鎖DNA分子の集団からライブラリーを生成すること、および工程(vi)または場合に応じて工程(vii)で得られたDNA分子のシーケンシングを行うことを含んでなる、方法。
[43].二本鎖DNA分子の集団におけるメチル化シトシンの同定のための方法であって、
(i)[31]〜[41]に記載の方法を用いて前記二本鎖DNA分子の集団からライブラリーを生成する工程、ここで、アダプター修飾DNA分子の集団は、工程(vii)の前に、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬で処理され、工程(vii)で使用されるプライマーは、前記試薬で処理された後に、工程(vi)で得られた二本鎖DNA分子の配列に特異的である、および
(ii)工程(vii)の前に非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬で処理された、工程(vi)または場合に応じて工程(vii)で得られたDNA分子のシーケンシングを行う工程、
ここで、ある位置のメチル化シトシンの存在は、鎖の一方にシトシンが見られ、反対鎖の対応する位置にグアニンが見られる場合に決定され、ある位置の非メチル化シトシンの存在は、鎖の一方にウラシルまたはチミンが見られ、反対鎖の対応する位置にグアニンが見られる場合に決定される、
を含んでなる、方法。
[44].二本鎖DNA分子の集団から二本鎖DNAライブラリーを生成するための方法であって、
(i)二本鎖DNA分子の集団をDNAアダプターの集団と接触させる工程、各アダプターは第1のDNA鎖と第2のDNA鎖を含んでなり、
ここで、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域は配列相補性により二本鎖領域を形成し、前記二本鎖領域の末端は二本鎖DNA分子の末端に適合し、
前記集団の各アダプターは、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域の間で形成された二本鎖領域内に位置するコンビナトリアル配列により他から識別可能であり、
前記接触は、アダプターと二本鎖DNA分子の各末端との連結反応による複数のアダプター含有DNA分子の取得に十分な条件下で行われる、
(ii)場合により、工程(i)で得られたアダプター含有DNA分子を、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬で処理する工程、および
(iii)場合により、工程(i)または場合に応じて工程(ii)で得られたアダプター含有DNA分子を、その配列が、工程(i)または工程(ii)で得られたアダプター含有DNA分子の少なくとも一部に相補的な少なくとも1つのプライマーを用いて、増幅する工程
を含んでなる、方法。
[45].第1のDNA鎖の5’領域と第2のDNA鎖の3’領域が相補的である、[44]に記載の方法。
[46].アダプターが、第1のDNA鎖の5’領域との第2のDNA鎖の3’領域が相補的でないY−アダプターである、[44]に記載の方法。
[47].二本鎖DNA分子の集団から二本鎖DNAライブラリーを生成するための方法であって、
(i)二本鎖DNA分子の集団を、オーバーハング末端を有する二本鎖DNA分子の断片の集団を生成するのに十分な条件下で断片化する工程、ここで、各断片の各末端はヘミアダプター分子に結合され、前記ヘミアダプター分子は第1のDNA鎖および場合により第2のDNA鎖を含んでなり、各ヘミアダプターは、第1のDNA鎖の3’領域内に位置するコンビナトリアル配列により他から識別可能であり、第2の鎖は第1の鎖と、第1の鎖の中央領域との相補性によって二本鎖領域を形成し、ヘミアダプター分子は、ヘミアダプターの第1の鎖の3’末端と二本鎖DNA分子の断片のオーバーハング末端の間の二本鎖DNA分子の断片に結合される、
(ii)別の第2の鎖を付加するか、またはヘミアダプター分子の第2のDNA鎖を別の第2の鎖で置換する工程、ここで、前記別の第2の鎖の5’領域は、ヘミアダプター分子の第1の鎖の3’領域に相補的であり、前記別の第2の鎖は、ヘミアダプター分子の第1の鎖に相補的でない領域を含有し、それにより、複数のY−アダプター含有DNA分子を生成する、
(iii)場合により、Y−アダプターの別の第2の鎖の5’末端と各DNA断片の3’末端の間に存在するギャップを埋める工程、
(iv)場合により、工程(iii)で得られたY−アダプター含有DNA分子を、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬で処理する工程、および
(v)場合により、工程(ii)または工程(iii)または場合に応じて工程(iv)で得られたY−アダプター含有DNA分子を、その配列が、工程(ii)または工程(iii)または場合に応じて工程(iv)で得られたY−アダプター含有DNA分子の少なくとも一部に相補的な少なくとも1つのプライマーを用いて増幅する工程
を含んでなる、方法。
[48].(i)が、二本鎖DNA分子の集団を、二本鎖アダプター分子を積載したトランスポゼース二量体と接触させることを含んでなる方法により行われ、ここで、前記アダプター分子は、Tn5逆位リピートと鎖の一方の5’オーバーハングを含んでなる二本鎖領域を含んでなり、Tn5逆位リピートの一部を形成しない二本鎖領域および一本鎖領域のシトシンヌクレオチドは場合によりメチル化され、接触は、DNAの断片化に、および各DNA断片の両末端へのヘミアダプター分子の結合に十分な条件下で行われる、[47]に記載の方法。
[49].ヘミアダプターの第2の鎖または工程(ii)で使用された別の第2の鎖が前記コンビナトリアル領域と実質的なオーバーラップを示さない、[47]または[48]に記載の方法。
[50].工程(i)で使用される二本鎖DNA分子がゲノムDNAの断片である、[44]〜[49]に記載の方法。
[51].工程(i)で使用される二本鎖DNA分子が前記工程(i)の前に末端修復される、[44]〜[50]に記載の方法。
[52].末端修復工程の後にDNA分子にdAテールを付加する工程をさらに含んでなる、[51]に記載の方法。
[53].二本鎖DNA分子の集団が、工程(i)の前に、アダプター分子とDNA分子の連結反応に十分な条件下、アダプター分子で処理され、それにより、前記DNA分子に付着末端が導入される、[44]〜[52]に記載の方法。
[54].アダプター配列内のコンビナトリアル配列が、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性がある1以上の修飾シトシンを含む、[44]〜[53]に記載の方法。
[55].ライブラリーが[44]に記載の方法により得られた場合には工程(i)もしくは工程(ii)で得られたDNA分子、またはライブラリーが[47]に記載の方法により得られた場合には工程(iii)または工程(iv)で得られたDNA分子が、[44]の工程(i)、工程(ii)もしくは場合に応じて工程(iii)の後に得られる反応混合物から、または[47]の工程(iii)、工程(iv)もしくは場合に応じて工程(v)の後に得られる反応混合物から回収される、[44]〜[54]に記載の方法。
[56].前記反応混合物からの回収が結合対の第1のメンバーを用いて行われ、アダプターが前記結合対の第2のメンバーで修飾される、[55]に記載の方法。
[57].ライブラリーが[44]に記載の方法により得られた場合には工程(iii)で得られたDNA分子、またはライブラリーが[47]に記載の方法により得られた場合には工程(v)で得られたDNA分子が反応混合物から回収される、[44]〜[56]に記載の方法。
[58].前記反応混合物からの回収が結合対の第1のメンバーを用いて行われ、[44]の工程(iii)または[47]の工程(v)で使用されるプライマーが前記結合対の第2のメンバーで修飾される、[57]に記載の方法。
[59].二本鎖DNA分子の集団の配列を決定するための方法であって、[44]〜[58]の方法を用いて前記二本鎖DNA分子の集団からライブラリーを生成すること、およびライブラリーが[44]に記載の方法により得られた場合には工程(i)もしくは工程(ii)もしくは場合に応じて工程(iii)で得られたDNA分子のシーケンシングを行い、またはライブラリーが[47]に記載の方法により得られた場合には工程(ii)もしくは工程(iii)もしくは工程(iv)もしくは場合に応じて工程(v)で得られたDNA分子のシーケンシングを行うことを含んでなる、方法。
[60].二本鎖DNA分子の集団におけるメチル化シトシンの同定のための方法であって、
(i)[44]〜[58]に記載の方法を用いて前記二本鎖DNA分子の集団からライブラリーを生成する工程、ここで、アダプター修飾DNA分子の集団は、ライブラリーが[44]に記載の方法により得られた場合には工程(iii)の前に、またはライブラリーが[47]に記載の方法により得られた場合には工程(v)の前に、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬で処理され、ライブラリーが[44]に記載の方法により得られた場合には工程(iii)で、またはライブラリーが[47]に記載の方法により得られた場合には工程(v)で使用されるプライマーは、[44]の工程(ii)でまたは[47]の工程(iv)で得られたDNA分子の配列に特異的である、および
(ii)ライブラリーが[44]に記載の方法により得られた場合には工程(ii)もしくは場合に応じて工程(iii)で得られたDNA分子のシーケンシングを行い、またはライブラリーが[47]に記載の方法により得られた場合には工程(iv)もしくは場合に応じて工程(v)で得られたDNA分子のシーケンシングを行う工程、
ここで、ある位置のメチル化シトシンの存在は、鎖の一方にシトシンが見られ、反対鎖の対応する位置にグアニンが見られる場合に決定され、ある位置の非メチル化シトシンの存在は、鎖の一方にウラシルまたはチミンが見られ、反対鎖の対応する位置にグアニンが見られる場合に決定される、
を含んでなる、方法。
[61].[1]〜[14]、[17]〜[28]、[31]〜[41]または[44]〜[58]に記載の方法で得ることにできるDNAライブラリー。
[62].各Y−アダプターが第1のDNA鎖と第2のDNA鎖を含んでなり、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域が配列相補性により二本鎖領域を形成し、
ここで、第2のDNA鎖の3’領域は、前記3’領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成し、第1のセグメントは3’領域の3’末端に位置し、第2のセグメントは、第2のDNA鎖の、第1のDNA鎖の3’領域と二本鎖領域を形成する領域の近傍に位置し、
ライブラリーの各メンバーは、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域の間で形成される二本鎖領域内に位置するコンビナトリアル配列により他から識別可能である、Y−アダプターのライブラリー。
[63].コンビナトリアル配列が、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性がある1以上の修飾シトシンを含む、[62]に記載のライブラリー。
[64].各アダプターの第2のポリヌクレオチドの3’末端が可逆的に保護される、[62]または[63]に記載のライブラリー。
[65].各アダプターの第1のDNA鎖の3’領域と第2のDNA鎖の5’領域の間で形成される二本鎖領域の末端セグメントが制限エンドヌクレアーゼの標的部位を含む、[62]〜[64]に記載のライブラリー。
[66].DNA Y−アダプターを作製するための方法であって、
(i)第1の一本鎖ポリヌクレオチドを第2の一本鎖ポリヌクレオチドと接触させる工程、ここで、第1の一本鎖ポリヌクレオチドの3’領域は、第2のポリヌクレオチドの5’領域の少なくとも一部に相補的である、
ここで、第2の一本鎖ポリヌクレオチドの3’領域は、前記3’領域内の第1のセグメントと第2のセグメントのハイブリダイゼーションによりヘアピンループを形成し、第1のセグメントは第2のポリヌクレオチドの3’領域の3’末端に位置し、第2のセグメントは5’領域の近傍に位置し、第2のポリヌクレオチドの3’末端は可逆的に保護され、
前記接触は、第1の一本鎖ポリヌクレオチドの3’領域と第2の一本鎖ポリヌクレオチドの5’領域内の相補的領域のハイブリダイゼーションに十分な条件下で行われ、それにより二重鎖DNA分子を生成する、
(ii)前記第1の一本鎖ポリヌクレオチド内に第2のポリヌクレオチドの5’領域に相補的な配列を作出するように第1のポリヌクレオチドの3’末端を伸長させる工程、および
(iii)場合により、第2のポリヌクレオチドの3’末端を脱保護する工程
を含んでなる、方法。
[67].工程(ii)で行われる伸長が、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性がある修飾シトシンの存在下で行われる、[66]に記載の方法。
[68].第1のポリヌクレオチドの3’末端内の少なくとも1つの位置がグアニンであり、前記の位置とハイブリダイズする第2のポリヌクレオチドの5’領域内の位置または第1のポリヌクレオチドの3’末端内の位置がシトシンまたはメチル−シトシンである、[66]または[67]に記載の方法。
[69].第2の一本鎖ポリヌクレオチドの5’末端が、伸長工程(ii)中に相補鎖が形成される際に相補鎖上に複製されて、制限エンドヌクレアーゼの標的部位を形成する配列を含んでなる、[66]〜[68]に記載の方法。
[70].第2の一本鎖ポリヌクレオチドがポリヌクレオチドのライブラリーとして提供され、ライブラリーの各メンバーが、前記ポリヌクレオチドの5’領域内に位置するコンビナトリアル配列により他から識別可能であり、前記コンビナトリアル配列が第1の一本鎖ポリヌクレオチドと配列相補性を示す領域よりも上流に位置し、それにより、DNA Y−アダプター分子のライブラリーを生成する、[66]〜[69]に記載の方法。
[71].コンビナトリアル配列が、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性がある1以上のシトシンを含む、[70]に記載の方法。
[72].第1の一本鎖ポリヌクレオチドおよび/または第2の一本鎖ポリヌクレオチドが支持体に固定されて提供され、前記固定が、第1の一本鎖ポリヌクレオチドの5’末端または第2の一本鎖ポリヌクレオチドのヘアピンループのヌクレオチドを前記支持体に結合させることにより行われる、[66]〜[71]に記載の方法。
[73].
(i)5’領域および3’領域を含んでなる第1の一本鎖ポリヌクレオチド、
(ii)5’領域および3’領域を含んでなる第2のポリヌクレオチド、ここで、3’領域は、前記3’領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成し、第1のセグメントは3’領域の3’末端に位置し、第2のセグメントは5’領域の近傍に位置し、第2のポリヌクレオチドの3’末端は可逆的に保護される、
ここで、第1の一本鎖ポリヌクレオチドの3’領域は、第2のポリヌクレオチドの5’領域の少なくとも一部に相補的である、
を含んでなるキット。
[74].第2のポリヌクレオチドがポリヌクレオチドのライブラリーとして提供され、各メンバーが、第2のポリヌクレオチドの5’領域内で、かつ、第1の一本鎖ポリヌクレオチドと配列相補性を示す領域よりも上流に位置するコンビナトリアル配列により他から識別可能である、[73]に記載のキット。
[75].コンビナトリアル配列が、非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性がある1以上の修飾シトシンを含む、[74]に記載のキット。
[76].第2のポリヌクレオチドの5’領域が、二本鎖領域に変換された際に制限エンドヌクレアーゼの標的部位を作り出す配列を含む、[73]〜[75]に記載のキット。
[77].
(i)DNAポリメラーゼ、
(ii)A、G、CおよびTから選択される1以上のヌクレオチド、
(iii)非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性のある1以上の修飾シトシン、
(iv)第2のポリヌクレオチドの3’末端から保護基を除去し得る試薬、
(v)非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬、
(vi)第2のポリヌクレオチドの5’末端内の配列により形成される標的部位に特異的な制限エンドヌクレアーゼ
からなる群から選択される1以上の成分をさらに含んでなる、[73]〜[76]に記載のキット。
[78].
(i)[62]〜[65]に記載のY−アダプターのライブラリー;および
(ii)
i.DNAポリメラーゼ、
ii.A、G、CおよびTから選択される1以上のヌクレオチド、
iii.非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬による処理に耐性のある1以上の修飾シトシン、
iv.第2のポリヌクレオチドの3’末端から保護基を除去し得る試薬、
v.非メチル化シトシンの、ハイブリダイゼーション特性に関してシトシンとは検出可能に異なる塩基への変換を可能とする試薬、
vi.第2のポリヌクレオチドの5’末端内の配列により形成される標的部位に特異的な制限エンドヌクレアーゼ
からなる群から選択される1以上の成分
を含んでなるキット。
[79].1以上の修飾シトシンがメチルシトシン、ヒドロキシルメチルシトシンおよびそれらの組合せからなる群から選択される、[77]または[78]に記載のキット。
[80].二本鎖DNAアダプターのライブラリーを得るための方法であって、各アダプターが第1のDNA鎖と第2のDNA鎖を含んでなり、各アダプターが第1のDNA鎖の3’領域と第2のDNA鎖の5’領域の間で形成される二本鎖領域内に位置するコンビナトリアル配列により他から識別可能であり、
(i)定常領域とコンビナトリアル領域を含んでなる一本鎖DNA分子の集団を提供する工程、ここで、前記一本鎖DNA分子は、コンビナトリアル領域内の配列により他から識別可能であり、定常領域はコンビナトリアル領域の3’側に位置し、3’末端は可逆的に保護される、および
(ii)鋳型として工程(i)の一本鎖DNA分子を使用し、一本鎖DNA分子の定常領域と完全にまたは部分的にハイブリダイズする伸長プライマーを使用して二本鎖DNAを生成し、それにより、新たに生成された鎖上にコンビナトリアル領域を複製し、それにより、二本鎖コンビナトリアル配列を作製する工程
を含んでなる、方法。
[81].一本鎖DNA分子の3’末端から保護基を除去することをさらに含んでなる、[80]に記載の方法。
[82].伸長プライマーが、一本鎖DNA分子の定常領域とはハイブリダイズしないオーバーハング5’領域を含んでなる、[80]または[81]に記載の方法。
[83].一本鎖DNA分子の定常領域が、前記定常領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成する、[80]〜[82]に記載の方法。
[84].ライブラリーのアダプターを第2のDNA分子に連結することをさらに含んでなり、前記第2のDNA分子は、その末端がアダプター分子の末端に適合する二本鎖領域を有する、[80]または[81]に記載の方法。
[85].第2のDNA分子が、互いにハイブリダイズしない、第1の鎖の5’領域および/または第2の鎖の3’にオーバーハング領域を含んでなる、[84]に記載の方法。
[86].第2の鎖の3’オーバーハング領域が、前記領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成する、[85]に記載の方法。
[87].工程(i)の各一本鎖DNA分子が支持体に固定されて提供され、前記固定が、一本鎖DNA分子の5’末端を前記支持体に結合させることにより行われる、[80]〜[82]または[84]〜[86]に記載の方法。
[88].工程(i)の各一本鎖DNA分子が支持体に固定されて提供され、前記固定が、一本鎖DNA分子のヘアピンループのヌクレオチドを前記支持体に結合させることにより行われる、[83]に記載の方法。
[89].各DNAアダプター分子が定常領域と可変領域を含んでなり、各二本鎖DNAアダプターが第1のDNA鎖と第2のDNA鎖を含んでなり、各アダプターが、第1のDNA鎖の3’領域と第2のDNA鎖の5’領域の間で形成される二本鎖領域内に位置する可変領域内のコンビナトリアル配列により他から識別可能である、二本鎖DNAアダプター分子のライブラリー。
[90].鎖の少なくとも一方の3’末端が可逆的に保護される、[89]に記載のライブラリー。
[91].一鎖または両鎖が反対鎖とハイブリダイズしないオーバーハング領域を含んでなる、[89]または[90]に記載のライブラリー。
[92].鎖の一方の定常領域が、前記定常領域内の第1のセグメントと第2のセグメントの間のハイブリダイゼーションによりヘアピンループを形成する、[91]に記載のライブラリー。