JP2023508795A

JP2023508795A - Ｄｎａおよびｒｎａ修飾の濃縮および検出のための方法およびキット、ならびに機能モチーフ

Info

Publication number: JP2023508795A
Application number: JP2021569030A
Authority: JP
Inventors: ベンジャミンエフ．デラッテ; エディーダブリュ．アダムス; ジョセフエム．フェルナンデス
Original assignee: アクティブモティフインコーポレイテッド
Priority date: 2019-12-23
Filing date: 2020-12-23
Publication date: 2023-03-06
Also published as: CA3162799A1; EP3959342A1; WO2021133999A1; US20220162675A1; EP3959342A4; CN114072525A

Abstract

本明細書では、核酸内の修飾ヌクレオチド残基をマッピングする方法が提供される。方法は、非標的または標的の修飾および未修飾ヌクレオチド残基が変換されて別のヌクレオチドを形成している（たとえば「C」が「T」に変換されている）核酸試料を準備することを含む。次に、該変換核酸について、1組のアンカー塩基プライマーを用いて、第2鎖合成を実施する。このアンカー塩基プライマーの組の各プライマーは、3'末端に標的ヌクレオチドに相補的な1つまたは複数のアンカー塩基（たとえば「G」または「CpG」）、および完全にまたは部分的に縮重した配列の組であり得る1組の配列から選択されるヌクレオチドの配列を含む。たとえば該配列は、5'-XnG-3'および／または5'-X(n-1)CG-3'であり得、Xは任意の塩基であり、n = 2～25である。二本鎖核酸産物を、たとえば増幅およびハイスループットシーケンシングにより分析することができる。

Description

関連出願の相互参照
本願は、2019年12月23日に出願された米国特許仮出願第62/953,080号の優先日の恩典を主張するものであり、その内容の全文が参照により本明細書に組み入れられる。

背景
エピジェネティクスとは、遺伝子の違いの結果ではない、細胞間および生物間の表現型の違いを指す。DNAのメチル化のパターンは、表現型のエピジェネティック的違いを生じさせ得、たとえば遺伝子発現パターンの変化をもたらす。DNAのメチル化は、典型的にはシトシン残基に生じる。これには、たとえば、5位炭素におけるメチル化が含まれる。このメチル化の形態としては、5-メチルシトシン（「5mC」）および5-ヒドロキシメチルシトシン（「5hmC」）が挙げられる。5-メチルシトシンのもっと酸化された形態としては、5-ホルミルシトシン（「5fC」）および5-カルボキシシトシン（「5caC」）が挙げられる。シトシンのメチル化は、典型的にはCpG部位で生じ、そこではヌクレオチド配列は「CG」である。CpG部位は、「CpGアイランド」と呼ばれるクラスターとして生じる傾向がある。ヒトでは、遺伝子プロモーターの約70%がCpGアイランドを含んでいる。プロモーターのCpGアイランドに複数のメチル化CpG部位が存在することにより、安定した遺伝子サイレンシングがもたらされる。メチル化は、がんおよび老化との関連が知られている。がんでは、遺伝子サイレンシングは、プロモーターアイランドの過剰なメチル化のせいであり得る。

DNAのメチル化パターンのマッピングは、重要研究分野になっている。現在いくつかのマッピングが使用されている。これらの方法に共通のアプローチは、DNA分子内の様々な形態のシトシンをウラシルに変換すること、変換された分子のシーケンシングを行うこと、および得られた配列を無変換分子の配列と、またはゲノムデータベース中の配列と、たとえばマッピング技法により比較することである。

メチル化パターンのマッピングの最も一般的な方法の一つが、バイサルファイトシーケンシングである。DNAをバイサルファイトで処理すると、シトシン残基がウラシルに変換されるが、5-メチルシトシンまたは5-ヒドロキシメチルシトシン残基は変換されない。これには4-アミノ基の4-カルボニル基への変換が関与しているため、このプロセスは、脱アミノ化とも呼ばれている。第2鎖の合成で、Gは導入されたUと対を形成し、増幅中は「CG」ではなく「TA」として増える。マッピング後、配列内の「C」の存在は、もとの未修飾の5-メチルシトシンまたは5-ヒドロキシメチルシトシンを表す。「T」の存在は、もとの「C」（または5-ホルミルシトシンもしくは5-カルボキシシトシン）を表す。

このストラテジーのバリエーションとしては、テン-イレブン転座メチルシトシンジオキシゲナーゼ（「TET」）および／またはAPOBEC3A（「A3A」）の使用が挙げられる。TETは、5mC、5hmC、および5fCを5caCに変換する。バイサルファイトは、5caCをウラシルに変換することができる。たとえばグルコシル化により5hmC基を保護する方法と併せると、A3Aは、Cおよび5mCをウラシルに変換するが、5hmCを変換しない。グルコシル化は、たとえばT4ベータ-グルコシル-トランスフェラーゼにより実施され得る。5mCまたは5hmCだけのマッピングのストラテジーを考案することができる。

様々な脱アミノ化ストラテジーにより処理したDNAの配列を決定して、DNA内のメチル化部位をマッピングすることができる。そのような方法の一つは、全ゲノムシーケンシングである。しかし、ゲノム内のメチル化パターンの位置を突き止めることができるかぎりでは、全ゲノムシーケンシングは非効率的であり得る。メチル化などの修飾を含むDNAに関するDNA濃縮の方法は公知である。

既存のエピジェネティクス技術は、以下のものなどの、特定の核酸修飾、たとえばメチル化を濃縮し、シーケンシングを行い、かつ／または検出するいくつかの方法を含む。
1.メチル化CpGを特異的に認識する能力のある修飾特異的抗体またはタンパク質／タンパク質ドメインを利用した濃縮ベースの方法（MeDIPおよびMBD-Seq/MIRA-Seq/メチルキャップ-seq）
2.全ゲノムバイサルファイトシーケンシング
3.リデュースト・レプリゼンテーション（Reduced representation）バイサルファイトシーケンシング
4.メチル化特異的(q)PCR
5.バイサルファイト-PCR

たとえばJames G. Herman et al.の“Methylation-specific PCR: a novel PCR assay for methylation status of CpG islands” PNAS (1996)（非特許文献1）を参照されたい。

James G. Herman et al."Methylation-specific PCR: a novel PCR assay for methylation status of CpG islands" PNAS (1996)

本明細書に組み入れられ、かつその一部を形成する添付の図面は、例示的態様を説明するほか、本明細書とともに、これらの態様および当業者には明白になるその他の態様をなし、かつ使用することができるよう、さらに役立つ。以下の図面とともに、本発明をより具体的に記載していく。

全ゲノムバイサルファイトシーケンシング（「WGBS」）の例示的プロトコル、およびアンカリングベースのシーケンシングの例示的プロトコルを示す。アンカー塩基バイサルファイトシーケンシングの例示的プロトコルを示す。この方法は、5-メチルシトシンおよび5-ヒドロキシメチルシトシン残基を有する核酸を濃縮する。核酸をバイサルファイトで処理すると、シトシン（「C」）、ホルミルシトシン（「5fC」）、およびカルボキシシトシン（「5caC」）がウラシルに変換される。メチルシトシン（「5mC」）およびヒドロキシメチルシトシン（「5hmC」）は修飾されない。3’に「G」残基を含み、かつヌクレオチドの縮重配列を含む1組のプライマーを用いて、第2鎖合成を実施する。得られた二本鎖核酸を、増幅、ライブラリー調製、およびシーケンシングに供する。アンカー塩基TABシーケンシングの例示的プロトコルを示す。この方法は、5hmC残基を有する核酸分子を濃縮する。核酸をグルコシル化酵素で処理すると、5hmC残基がグルコシル基で保護される。保護された核酸をTETタンパク質または触媒ドメインで処理すると、5mCおよび5fCが5caC残基に変換される。バイサルファイト処理により、シトシンおよび5caC残基がウラシルに変換される。第2鎖合成を、図2の1組のプローブを用いて実施する。得られた二本鎖核酸を、増幅、ライブラリー調製、およびシーケンシングに供する。アンカー塩基A3Aシーケンシングの例示的プロトコルを示す。この方法は、5mC、5hmC、5fC、および5caC残基を有する核酸分子を濃縮する。核酸をTETタンパク質または触媒ドメインで処理すると、5mC、5hmC、および5fC残基が5caC残基に変換される。A3A処理により、シトシン残基がウラシルに変換される。第2鎖合成を、図2の1組のプローブを用いて実施する。得られた二本鎖核酸を、増幅、ライブラリー調製、およびシーケンシングに供する。図5Aおよび5Bは、クリックケミストリーライブラリー調製の例示的プロトコルを示す。核酸分子をバイサルファイト処理（または本明細書に記載される他の処理）に供する。ビオチンなどのタグに連結された本明細書に記載されるアンカー塩基プローブを、処理した核酸分子の第2鎖合成に用いる。そのようなプライマーは、たとえばIllumina P5配列を含むアダプター配列を含んでもよい（図5A）。二本鎖分子を変性させ、そしてタグに結合させた伸長させた第2鎖をキャプチャー部分（たとえばストレプトアビジン）を用いて捕捉する。捕捉した分子を、3’末端にアダプター配列が組み入れられるようにクリックケミストリーにより修飾することができる。これには、3’末端アジド（N3）基を導入すること、および5’-3トリアゾール結合によりアルキル化アダプターを結合させることが含まれ得る。次に、該分子を、該分子の5’および3’末端に相補的な1組のプライマー(たとえばP5/P7アダプター配列を含む）を用いての増幅に供する。得られた分子を分析、たとえば核酸シーケンシングに供することができる（図5B）。図5Aの説明を参照。図6A～6Eは、線形増幅アンカー塩基バイサルファイトシーケンシングの例示的プロトコルを示す。ヘアピンループを含むアダプター分子を末端修復された標的核酸分子に結合させ、ここでループはCを含んでおらず、二本鎖ステムにメチル化C残基（脱アミノ化、変性、および非特異的アンカーに対し抵抗性となる）が含まれ、ループに非「C」残基が含まれる。核酸分子をバイサルファイトまたはその他で処理すると、相補性の喪失および変性が生じる（図6A）。次に、図2aの1組のプローブ、および強力な置換活性を有するphi29ポリメラーゼなどの鎖特異的等温ポリメラーゼを用いて、環状化標的分子のローリングサークル増幅を実施して、コンカテマー化分子を産生する。脱アミノ化によりウラシルにならなかったシトシン残基は「G」として伸長産物に組み入れられ、ウラシル残基に変換されたシトシン形態は「A」として組み入れられる（図6B～C）。増幅したコンカテマーを、ヘアピンループの二本鎖ステム内の配列を認識する制限酵素を用いて、個々の分子に切断することができる（図6D）。次に個々の分子をPCR増幅などの増幅に供してインデックスおよびほかのアダプター要素を組み入れることができる。得られた分子を分析、たとえばDNAシーケンシングに供することができる（図6E）。なお、ローリングサークル増幅で用いられたdeoxyGTPをフルオロフォアで標識して、修飾シトシンをフルオロメトリーにより測定できるようにしてもよい。図6Aの説明を参照。図6Aの説明を参照。図6Aの説明を参照。図6Aの説明を参照。哺乳動物細胞でのアンカー塩基バイサルファイトシーケンシングの結果を示す。この図は、CpG部位の濃縮を示し、ゲノム全体で「G」にアンカリングされている。プライマーの6位にGがある場合、75%の確率で、すぐ上流にCがある。これは、CpGメチル化の指標であり、偶然とは相容れない結果である。ショウジョウバエ（Drosophila）SL2細胞でのアンカー塩基バイサルファイトシーケンシングの結果を示す。この図は、SL2細胞のアンカー塩基バイサルファイトシーケンシングの2つのテクニカル反復を示し、ヒートマップおよびブラウザートラックを含む。これらの結果は、ヒートマップおよびゲノムブラウザートラックに明白な重複が観測されることから、この技法の再現性を実証している。大腸菌（E.coli）K12株DNAで、DNA免疫沈降シーケンシング（MeDIP-Seq）とアンカー塩基バイサルファイトシーケンシングとを比較した実験の結果を示す。DNAにおいて、配列CCWGGの2つめの「C」がメチル化されている。バックグラウンドモチーフAASTTが、対照として用いられる。図からわかるように、メチル化塩基により生成されるシグナルは、アンカー塩基バイサルファイトシーケンシングのほうが、MeDIP-Seqよりもかなり強力である。

概要
本明細書では、修飾塩基を含む核酸分子を分析する方法が提供される。方法は、核酸内のシトシンなどの1つまたは複数の非標的塩基をウラシルなどの別の塩基に変換すること、それからGまたはCpGの3’アンカー塩基を有するプライマー（典型的には1組の縮重プライマー）を用いて第2鎖合成を実施することを含む。第2鎖合成の産物は、非標的塩基がアンカー「G」をもつプライマーの鋳型になれない「U」に変換されている結果として、標的塩基（たとえばメチルシトシンまたはヒドロキシメチルシトシン）を含む配列が濃縮されている、1組の二本鎖核酸分子である。

詳細な説明
I.はじめに
本明細書で提供される方法、具体的にはABBS態様は、以下を含めいくつかの点で既存の技術よりも優れている。
1.)関心対象の修飾が見出されるDNAまたはRNAの領域のみを濃縮することで、シーケンシングによるDNA/RNA修飾の分析のコストを低減する。これは、関心対象の部位の高いデータカバレッジを得るのにあまり深いシーケンシングを行う必要がないことを意味する。
2.)アンカー塩基ランダムプライミング（一般的な修飾バイアス増幅ストラテジー）を塩基対特異的プローブと組み合わせることにより、診断アッセイの設計が簡易化される。
3.)この方法ではDNA/RNA修飾の密度が潜在的に高い領域を濃縮するので、DNAまたはRNA修飾をマッピングするのにピーク抽出アプローチを、ならびにABBSデータに対しバイサルファイト分析（C→T転換）を使用できるため、分析が簡易化される。

本明細書で開示されるのは、関心対象の（たとえば細菌、ウイルス、ヒト）ゲノム全体で、バイサルファイト修飾DNAを濃縮する、特定する、かつマッピングする方法である。方法はまた、以下に詳述するように、バイサルファイトを使わないシトシン分析法とも両立できる。

既存の技術と比較して、これらの方法、具体的にはABBS態様の4つのユニークな局面としては、以下が挙げられる。
1.)（MeDIPまたはhMeDIPのように）抗体または（MIRA-SeqにおけるMBD2b/MBD3L、およびメチルキャップ-seqにおけるMeCP2などの）修飾特異的結合タンパク質を使う必要なしに、全ゲノムから修飾シトシン（たとえばメチル化CpG）を濃縮しかつ一塩基分解能によりシーケンシングを行う手段の提供。
2.)（メチル化特異的PCRアッセイのように）ゲノム内の所定の部位に対する特異的なプライマーを設計する必要なしに、修飾シトシンを増幅しかつ検出する手段の提供。
3.)多重診断アッセイに組み入れられる能力。DNA/RNA修飾部位から増幅する高度に一般化されたスキームを提供することにより、関心対象の領域に特異的なプライマーおよびプローブの組ではなく、関心対象の領域の特異性プローブ（たとえば、TaqManハイブリダイゼーションプローブ）を設計するだけでよくなる。したがって、このストラテジーはアッセイ設計をかなり簡易化する。
4.)ゲノム全体の5mCおよび5hmCまたは他の「oxi-mC」（5hmC、5fC、および5caC）の分布を分析する酵素的方法と完全に統合される能力（たとえばTET支援バイサルファイトシーケンシングおよびAPOBEC結合（coupled）エピジェネティックシーケンシング（ACE-Seq））。一方、MeDIP、hMeDIP、MIRA-Seq、またはメチルキャップ-seqのような技法は、(1)これらがABBSのような一塩基分解能を提供しないため、(2)タンパク質によっては他の種と交差反応する場合があり（たとえばMeCP2は、5mCだけでなく5hmCも認識できる）、特異性が低くなるため、また(3)これらの技法はどれも、タンパク質も抗体も必要としないABBSの技法ほどユニバーサルではないため、それができない。

本明細書に開示される方法は、以下を実現する。
1.)塩基対分解能により、バイサルファイト/APOBEC/AID感受性および非感受性DNAおよびRNA修飾を検出する高スループットの方法を可能にする。
2.)バイサルファイト/APOBEC/AIDクラスの酵素による修飾に抵抗性の部位（たとえばバイサルファイトはメチル化C、AID/APOBECクラスの酵素はグルコシル-hmCおよび5fC/5caC）において、核酸増幅のアンカリングの手段を提供し、これらのバイサルファイト/APOBEC/AID抵抗性の座からの迅速な全ゲノム増幅を促進する。
3.)DNA/RNA修飾の特異的かつ多重的検出を可能にするたとえばTaqManプローブ、分子ビーコン、パドロックプローブといった一般的な分子検出法の効率的な統合を可能にする。
4.)診断および臨床の用途でのバイサルファイト/Apobec3A感受性バイオマーカーの特定および追跡を可能にする。

たとえばAB HiC態様の追加のメリットが、本明細書で論じられる。

II.修飾シトシン残基を含む配列に関する核酸の濃縮
本明細書で提供される方法は、選択されたシトシン残基の修飾を有する核酸の濃縮を可能にする。濃縮は、より深い配列分析、およびより効率のよい修飾残基の特定を可能にする。方法は、非標的形態のシトシンを非シトシンヌクレオチド残基に変換すること、およびプライマーの3’位に「G」または「CG」残基を有する1組の縮重プライマーを用いて、残りのシトシン形態の残基を含む核酸分子の第2鎖を合成することを含み得る。プライマーの末端ヌクレオチドは、そこから伸長が進行するアンカーとして機能する。伸長は無変換シトシン残基から進行するので、標的シトシン修飾を含むゲノムの領域が濃縮されることになる。

A.核酸を含む試料
核酸は、たとえばウイルス、またはあらゆる生命体の1つもしくは複数の細胞、もしくはミクロビオームを含め、あらゆる生物学的試料を供給源とし得る。これには原核生物（たとえば古細菌および細菌）および真核生物（たとえば植物、動物、および真菌）の両方が含まれる。動物としては、限定ではないが、昆虫類、魚類、両生類、爬虫類、鳥類、および哺乳類が挙げられる。哺乳類としては、限定ではないが、肉食動物（たとえばイヌおよびネコ）、偶蹄目（たとえばウシ、ヤギ、ヒツジ、ブタ）、ウサギ類（たとえばウサギ）、奇蹄類（たとえばウマ）、げっ歯類（たとえばマウス、ラット）、および霊長類（たとえばヒトおよび非ヒト霊長類（たとえばサル、チンパンジー、ヒヒ、ゴリラ））が挙げられる。

核酸は、細胞系、組織、器官、または体液に由来し得る。動物のあらゆる器官または器官系に由来する細胞。そのような器官としては、限定ではないが、心臓、脳、腎臓、肝臓、肺、筋肉、血液が挙げられる。核酸の供給源となり得る体液としては、限定ではないが、血液、血漿、血清、唾液、痰、粘液、リンパ液、尿、精液、脳脊髄液、または羊水が挙げられる。器官系としては、限定ではないが、筋肉系、消化系、呼吸系、泌尿系、生殖系、内分泌系、循環系、神経系、および外皮系が挙げられる。試料は、たとえば生検により調製され得る。これには、固形組織生検および液体生検の両方が含まれる。試料は、セルフリーDNA（「cfDNA」）、たとえば循環腫瘍DNAを含み得る。核酸断片は、約100～約800ヌクレオチドまたは350～450ヌクレオチド、たとえば約400ヌクレオチドの長さを有し得る。cfDNAは、典型的には、約120～220ヌクレオチドのサイズを有する。

核酸を含む試料は、病的状態を有する、または有すると考えられる対象を供給源とし得る。そのような状態としては、限定ではないが、たとえばがん（たとえばがん生検試料）を含む、過形成、肥大、萎縮、および異形成が挙げられる。他の病理としては、神経疾患（たとえばアルツハイマー病、筋萎縮性側索硬化症、クロイツフェルトヤコブ病、フリートライヒ運動失調症、多発性硬化症）が挙げられる。

核酸は、ネイキッド核酸、つまりタンパク質が結合していない核酸であり得る。あるいは、核酸はクロマチンの形態であり得る。本明細書で使用する場合、「クロマチン」という用語は、DNAとヒストンおよび／または非ヒストンタンパク質との複合体を指す。

核酸を含む試料は、特定の暦年齢を有する対象を供給源とし得る。メチル化のパターンは年齢と関連があるので、早老または遅老を予測することができる。

DNAは、クロマチンの形態で精製され得る。クロマチンからのDNAは、クロマチン免疫沈降（ChIP）およびトランスポゾン支援クロマチン免疫沈降などの方法により濃縮され得る。ChIP法は、典型的には、タンパク質を核酸と共有結合させるためにクロマチンを架橋することを含む。クロマチンは、まだ細胞内にあるときに架橋することができる。それからクロマチンをせん断することができる。ヒストンなどの特定のタンパク質が結合した核酸を、該標的タンパク質に対する抗体を用いて免疫沈降することができる。トランスポゾン支援クロマチン免疫沈降では、標的タンパク質に対する抗体を直接または間接的にトランスポソームに付加させる。トランスポソームは、トランスポゾンに結合したトランスポサーゼを含む。トランスポゾンはその標的を見つけるとDNAに挿入される。トランスポゾンがプライマー結合部位を備えている場合、プライマー結合部位間に位置する核酸を増幅することができる（たとえばJelinek et al.の米国特許第10,689,643号を参照）。

B.ヌクレオチドおよびそれらの修飾形態
RNAおよびDNAのヌクレオチドは、未変性の形態でも、様々な修飾形態でも存在し得る。シトシンはいくつかの異なる形態で存在し得る。

「修飾ヌクレオチド」という用語は、シトシン、アデニン、グアニン、チミンまたはウラシルの誘導体を指す。「修飾シトシン」という用語は、典型的には、5位に化学部分を有する状態で誘導されたシトシンの誘導体を指す。例示的修飾シトシンとしては、酸化状態の昇順に、5メチルシトシン（「5mC」）、5ヒドロキシメチルシトシン（「5hmC」）、5ホルミルシトシン（「5fC」）、および5カルボキシルシトシン（「5caC」）が挙げられる。シトシンの別の修飾形態は、N-4-アセチルデオキシシチジン（「N4-acdC」）である。（たとえば2020年12月22日出願の国際公開公報PCT/US2020/066741を参照）。

塩基と違って、文字によりヌクレオチドに言及する場合、特に明言しないかぎり、「リボ」バージョンまたは「デオキシリボ」バージョンのいずれかを指し得る。一般に、DNAのヌクレオチドは「デオキシリボ」バージョンとなり、RNAのヌクレオチドは「リボ」形態ということになる。

本明細書に開示される特定の方法では、シトシンの4-アミノ基がカルボニル基に変換され得る。このプロセスは「脱アミノ化」と呼ばれる。この例では、該塩基はウラシルになっている。4位のアミノ基をカルボニル基で置換することによるシトシンまたは修飾シトシンの脱アミノ化は、シトシンまたは修飾シトシンをウラシルに変換する。

C.変換ストラテジー
核酸におけるメチル化またはヒドロキシメチル化などの特定の塩基修飾を検出する方法は、非標的形態の塩基および／または修飾形態の塩基を、もとの塩基以外の塩基または塩基形態に変換することを含み得る。本明細書で使用する場合、「非標的」形態の塩基は、可能な形態の塩基のサブセットを指す。たとえば、シトシン形態の場合、「5hmC」が「標的」形態であり得、「C」、「5mC」、「5fC」、および「5caC」が非標的形態であり得る。他の態様では、「5mC」および「5hmC」が「標的」形態であり得、「C」、「5fC」、および「5caC」が非標的形態であり得る。「非塩基」残基、たとえば「非シトシン」残基は、異なる塩基形態を指す。たとえば「非シトシン」塩基は典型的にはウラシルということになるが、グアニン、アデニン、またはチミジン、およびその修飾形態を含む場合もある。いくつかの変換ストラテジーが公知である。

1.バイサルファイトシーケンシング
核酸のバイサルファイト処理は、5mCおよび5hmC以外のシトシン形態の残基を、脱アミノ化のプロセスによりウラシルに変換する。シーケンシングを行うと、5mCおよび5hmC（「標的形態」）はシトシンとして読み出され、非メチル化シトシンであるホルミルシトシンおよびカルボキシルシトシン（「非標的形態」）はチミンとして読み出される。

2.TETシーケンシング
テン-イレブン転座メチルシトシンジオキシゲナーゼ（「TET」）は、5mC、5hmC、および5fCを5caCに変換する。TETは、ヒト、マウス、または無脊椎動物(たとえば、ネグレリア（Naegleria）、ショウジョウバエ（dTet、またの名をDMADまたはCG43444））などのいくつかの異なる種から入手可能である。哺乳動物のTETとしては、TET1、TET2、およびTET3が挙げられる。TET酵素はそれぞれ、Fe(II)/α-KG-依存性オキシゲナーゼのファミリーに見られる重要な金属結合性残基を含有する二本鎖βヘリックスフォールドを有するコア触媒ドメインをもつ。これらの触媒ドメインは、変換工程で用いることもできる。したがって、特に明言しないかぎり、「TET」は全酵素または機能性触媒ドメインを指す。

この酵素は、核酸内の5hmC残基を検出する方法で用いることができる。方法は、次のように進行することができる。核酸内の5hmC残基をグルコシル化により保護する。これは、たとえば組み換えファージT4ベータ-グルコシルトランスフェラーゼを用いて行われ得る。次に、核酸をTET酵素（普通はTET1または原生生物ネグレリア・グルベリ（Naegleria gruberi）に由来するNgTETホモログ）で処理すると、シトシン、5mC、および5fCなどの無保護形態のシトシンが5caCに変換される。核酸をバイサルファイトでさらに処理すると、5caCがウラシルに変換される。シーケンシングを行うと、5hmC（「標的形態」）がシトシンとして読み出され、他のシトシン形態（「非標的形態」）はチミジンとして読み出される。

3.A3Aシーケンシング
AID/APOBECは、シチジンを脱アミノ化してウリジンにすることによりDNAおよびRNAに変異を挿入することができる一群のシチジンデアミナーゼである。AID/APOBECファミリーの酵素としては、次のヒト酵素が挙げられる:APOBEC1、APOBEC2、APOBEC3A（「A3A」）、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、活性化誘導（シチジン）デアミナーゼ（AID）。これらの酵素はシトシンおよび5mCをウラシルに変換するが、5hmC、5fC、または5caCは修飾しない（または修飾しても効率は極めて低い）。このクラスの酵素は、修飾形態のシトシンを互いに区別することなく検出する方法に用いられ得る。この方法の一つのバージョンでは、まず、5mC、5hmC、および5fCを5caCに酸化するTET酵素で核酸を処理する。その次のA3Aでの処理はシトシンをウラシルに変換するが、5caCは変換に対し抵抗性を保つ。シーケンシングを行うと、5mC、5hmC、5fC、および5caC（「標的形態」）がシトシンとして読み出され、天然の未修飾シトシン（「非標的形態」）はチミジンとして読み出される。

D.第2鎖合成
核酸分子中の非標的ヌクレオチドが非塩基（たとえば非シトシン）残基に変換された後、標的ヌクレオチドを含む核酸を、無変換部位をアンカーとする第2鎖合成により濃縮することができる。第2鎖合成は、変換核酸分子にプライマーまたは1組のプライマーをハイブリダイズさせること、続いてポリメラーゼを用いてプライマーを伸長させることを含む。特定の態様では、ポリメラーゼは、5’-3’エクソヌクレアーゼおよび／または鎖置換活性を有する。プライマーが核酸内の標的部位にハイブリダイズするので、標的ヌクレオチドを含む二本鎖分子が濃縮されることになる。

1.アンカー伸長プライマー
本明細書に記載される方法で使用される伸長プライマーは、5’-Xn-G-3’、または5’-X(n-1)-CG-3’というヌクレオチド配列を含み得、ここで「X」は任意の塩基である。「G」は該分子の3’末端に位置する。いくつかの態様では、「n」は2～25、12～25、3～10、4～7、または約5である(たとえばプライミング配列はヘキサマーである）。プライマーは個別に準備することができる。しかし典型的には、一度の第2鎖合成操作で一緒に使用される組として準備される。

「X」は、任意の位置で、次のいずれかであり得る：「N」 = A、C、T/U、G;「H」 = A、C、T/U;および「I」 = イレギュラー塩基、たとえば（1）その塩基に修飾のあるレギュラー塩基（A、C、T/U、G）（「Q」）または（2）ユニバーサル塩基（「J」）。本明細書で使用する場合、「ユニバーサル塩基」は、2つ以上の標準塩基と結合する、したがって縮重塩基として機能する塩基である。例示的なユニバーサル塩基は、（デオキシ）イノシン、ネブラリン、3-ニトロピロール、5-ニトロインドールである。

したがって、たとえば一態様では、プライマーの組のプライマーは、配列5’-XXXXXG-3’もしくは5’-XXXXCG-3’;5’-NNNNNG-3’もしくは3’-NNNNCG-3’;5’-IIIIIG-3’もしくは5’-IIIICG-3’;5’-QQQQQG-3’もしくは5’-QQQQCG-3’;5’-JJJJJG-3’もしくは5’-JJJJCG-3’、またはこれらの塩基の任意の組み合わせを有するヘキサマーである。

「Xn」または「X(n-1)」を含む1組のプライマーは、縮重した配列の組を含み得る。1組の縮重プライマーは、いくつかの位置にある数の決まった可能な塩基を含む配列を有するオリゴヌクレオチド分子の集合体であり、その結果、様々な位置でのすべての可能な選択ヌクレオチドの組み合わせを網羅する類似配列を有するプライマー集団となっている。たとえば、配列5’-NNNNNG-3’を有する1組の縮重プライマーは、「N」が占めている各位置に4つの標準ヌクレオチド（A、C、G、T/U）のそれぞれが存在し得るプライマーを含むことになる。そのような配列の組は、完全に縮重している。

あるいは、プライマーの組は、部分的に縮重している、または偏っている場合がある。たとえば、特定の塩基が、ランダムと比較して、組のなかで大きな比率を占め得る。たとえば、塩基「C」が、ランダムよりも頻繁に存在し得る。これは、プライマーの一部として転写因子モチーフを使って、このモチーフ上のシトシン修飾をゲノムワイドに分析したいような場合である。

いくつかのプライマー設計プログラムが利用できる（いろいろあるが、たとえばOLIGO、OSP、Primer Master、PRIDE、Primer3）。これらのプログラムは、C/G含率などの特定の基準に合わせたプライマーの組を設計することができる。

他の態様では、配列「Xn」または「Xn-1」は、関心対象の標的核酸モチーフ配列を表す。たとえば、モチーフ配列は、転写因子のモチーフであるCCTCに逆相補的な「GAGG」であり得る。モチーフは、NF-_KB、CTCF、BORIS、YY1、TBP、AP-1、CEBP、HOXタンパク質などの転写因子のモチーフであり得る。

プライマーは、たとえばアダプター配列、試料バーコード、および分子バーコードの1つまたは複数を含む補助配列を備えることができる。したがって、たとえば、プライマーは、配列5’-[アダプター配列]-[試料バーコード]-[分子バーコード]-Xn-G-3’、または5’-[アダプター配列]-[試料バーコード]-[分子バーコード]-X(n-1)-CG-3’を有することができる。

特定の態様では、プライマーは、シーケンサープラットフォームに特異的なアダプター配列を含み得る。そのような配列は、典型的には、増幅プライマー配列を含むことになる。たとえば、Illuminaシーケンサーでは、アダプターはp5およびp7配列を含む。

試料バーコードは、異なる試料に由来するが、典型的には一度のシーケンシング操作で配列決定される核酸分子を区別するのに用いられるヌクレオチド配列である。異なる試料には異なるバーコード配列を付ける。典型的には試料バーコードは約6～約20ヌクレオチドである。

分子バーコードは、試料中のもとの分子を区別するのに用いられる1組のバーコードである。試料中の核酸分子をユニークバーコード付けすることができ、つまり、各分子に異なるバーコードが結合している。あるいは、核酸分子を非ユニークバーコード付けすることができ、つまり、試料中の分子に付けるのに用いられる相異なるバーコード配列の数は、試料中のユニーク分子の数よりも少ない。ユニークバーコードの場合、同一のもとの分子から増幅した分子の配列リードは同一のバーコードをもつことになるので、それによって区別することができる。非ユニークバーコードの場合、バーコードからの、および標的分子からの配列情報を用いて、同一のもとの分子から増幅した配列リードを決定することができる。分子バーコードは、典型的には約6～約20ヌクレオチドである。

本明細書に開示される方法で用いられる伸長プライマーは、プライマーとしての機能と両立可能な、任意の形態の核酸または核酸類似体を含み得る。これには、限定ではないが、DNA、RNA、ロックド核酸（「LNA」）、ペプチド核酸（「PNA」）、修飾塩基、リボース、デオキシリボース、修飾糖を含むポリヌクレオチド、およびたとえばA、T、C、G、またはU以外の非標準ヌクレオチドを含むポリヌクレオチドを含む、プライマーが含まれる。例としては、限定ではないが、イノシンまたはニトロインドールなどのユニバーサル塩基類似体が挙げられる。

他の態様では、プライマーは、分子反転プローブまたはパドロックプローブとしての機能のための配列を含み得る。たとえば、プライマーは、プライミング配列5’-Xn-G-3’または5’-X(n-1)-CG-3’、分子の5’末端に位置する標的ヌクレオチド配列にハイブリダイズする第2のヌクレオチド配列、およびプライミング配列と第2の配列との間に位置するリンカー配列を含み得る。

2.プライマーの伸長
専門家は、変換核酸から、標的の修飾ヌクレオチドを含む配列が濃縮された二本鎖核酸の集団を作製する。このプロセスは、変換核酸を変性させて一本鎖核酸を準備することを含む。3’末端にアンカー塩基「G」または複数のアンカー塩基「CpG」を含む1組のプライマーを、ハイブリダイゼーション条件下で変性させた核酸と接触させ、ハイブリダイズさせる。

適切なポリメラーゼを用いてプライマーを伸長させる。ポリメラーゼは、中温性または好熱性ポリメラーゼであり得る。たとえば、ポリメラーゼは、クレノウエクソ-ポリメラーゼ、クレノウポリメラーゼ、DNAポリメラーゼI、T4 DNAポリメラーゼ、Phi29 DNAポリメラーゼ、BST DNAポリメラーゼ、Taqポリメラーゼ、pfuポリメラーゼ、およびリバーストランスクリプターゼ（たとえば、モロニーマウス白血病ウイルス（M-MLV）、トリ骨髄芽球症ウイルス（AMV）、およびそれらの変異／改変バージョンであり得る。特定の態様では、ポリメラーゼは、5’-3’エクソヌクレアーゼまたは鎖置換活性を有する。そうすれば、いくつかのプライマーが互いの近くでハイブリダイズした場合、他のプライマーの最上流でハイブリダイズしたプライマーが、該プライマーの下流でハイブリダイズした伸長するポリヌクレオチドを消化するかまたは置換することにより、最長の伸長産物を作ることになる。

RNAの逆転写の場合、dUTPヌクレオチドを用いることができる。dUTPを含有する鎖はライブラリー調製中に増幅されないので、RNA-seq用の鎖情報が保存される。

プライマー伸長の産物は、修飾塩基を含む配列が濃縮された二本鎖ポリヌクレオチドの集合体となる。この集合体をライブラリー調製に供することができる。

E.ライブラリーの調製
1.二本鎖核酸の単離
二本鎖核酸を、いくつかの方法で、残りの一本鎖核酸から分離することができる。一態様では、組成物を、たとえば限定ではないがヌクレアーゼS1などの一本鎖ヌクレアーゼに供して、一本鎖分子を消化させることができる。別の態様では、一本鎖核酸と二本鎖核酸とを、既知の方法により、互いから分画することができる。そのような態様の一つでは、DNAは、シリカ粒子およびヒドロキシアパタイトなどの二本鎖核酸に対する高親和性および一本鎖核酸に対する低親和性を有するシリカベースの方法または非シリカベースの方法を用いて単離される。これらは、DNAをシリカ粒子もしくは膜に、またはDNAグレードのBio-Gel HTPヒドロキシアパタイトに結合させること、および他の夾雑物から分離することを含み得る。一態様では、抗二本鎖DNA抗イディオタイプ抗体などの二本鎖核酸結合タンパク質の使用により、二本鎖核酸を特異的に濃縮することができる。一態様では、抗一本鎖DNA抗イディオタイプ抗体などの一本鎖核酸結合タンパク質により、一本鎖核酸を除去することができる（ネガティブ選択）。一態様では、プライマーは、たとえばビオチンまたはデスチオビオチンなどのキャプチャー部分を備えている。したがって、プライマー伸長により生成した二本鎖分子はビオチン化されていることになる。これらの分子は、ストレプトアビジンなどのキャプチャー部分のパートナーで捕捉して単離することができ、一本鎖DNA分子は、限定ではないがヌクレアーゼS1などの一本鎖ヌクレアーゼにより消化することができる。

末端修復およびアダプター連結の後、キャプチャー配列を用いて標的核酸配列を単離することができる。キャプチャー配列は、標的配列を有する核酸分子にハイブリダイズする能力のあるヌクレオチド配列を含むポリヌクレオチドである。標的配列は、ハイブリダイズすると、ハイブリダイズした配列を捕捉する。典型的には、プローブは、ビオチンなどのキャプチャー部分を含むか、または磁気誘因性粒子などの固体支持体に結合させられて、非結合物からの結合物の分離を可能にする。

2.末端修復およびアダプター連結
断片化に供されたポリヌクレオチド、またはセルフリーDNAは、典型的には、アダプター連結前に末端修復を要する一本鎖オーバーハングを有する末端を含む。末端修復は、たとえば、5’オーバーハングを除去し3’オーバーハングの埋め込みをするクレノウポリメラーゼなどの酵素により達成され得る。その結果、平滑末端の分子となる。アダプターは、平滑末端連結により、平滑末端DNAに直接結合させることができる。あるいは、平滑末端分子の3’末端を「A尾部化」して、1ヌクレオチド「A」オーバーハングを産生してもよい。したがって、5’末端に1つの「T」オーバーハングを有するシーケンシングアダプターを結合させることができる。

あるいは、上述したように、プライマー分子が本明細書に記載されるようにアダプター配列をさらに含んでいるプライマー伸長反応によって、標的ポリヌクレオチドはアダプターを備えることができる。この場合、ポリメラーゼによる伸長後、DNAは3’末端にアジドddNTPが付けられている。次に、アルキル5’を含むアダプターを、クリックケミストリーにより結合させることができる。それからDNAをPCR増幅することができ、さらに分析することができる（たとえば図5A～Bを参照）。

別の態様では、二本鎖ステムにメチル化C残基を含む、ヘアピンループを含むアダプター分子が連結され、そしてバイサルファイトおよびプライマーのアンカリング後、Phi29/Φ29ポリメラーゼなどの強力な置換活性を有する酵素を用いて「ローリングサークル」介在ライブラリーを作製する（たとえば図6A～Eを参照）。

なお、シーケンサープライマー配列、試料バーコード、および分子バーコードなどの補助配列を、二本鎖分子に連結されるアダプター内に備えていてもよい。

3.核酸の増幅
二本鎖核酸を増幅することができる。増幅は、典型的には、プライマーハイブリダイゼーション配列を含むアダプターを備えた核酸に対し実施される。二本鎖核酸は、任意の公知の増幅方式により増幅され得る。これには、限定ではないが、ポリメラーゼ連鎖反応（PCR）増幅、定量PCR、ローリングサークル増幅、多置換増幅、ループ介在等温増幅（LAMP）、逆転写ループ介在等温増幅（RT-LAMP）、鎖置換増幅（SDA）、ヘリカーゼ依存性増幅（HDA）、または転写介在増幅（TMA）が含まれる。説明を簡潔にするため、反応はPCRに関して論じることにする。他の増幅方法に必要な調節は、当業者には容易に明らかになろう。

III.核酸の分析
次に、増幅ありまたはなしで、二本鎖核酸分子を分析に供することができる。

A.核酸のシーケンシング
一態様では、核酸シーケンシングにより二本鎖核酸を分析する。典型的には、核酸は、ハイスループットシーケンシングを用いて配列決定される。本明細書で使用する場合、「ハイスループットシーケンシング」という用語は、何千という核酸分子の同時またはほぼ同時のシーケンシングを指す。ハイスループットシーケンシングは、「次世代シーケンシング」または「超並列シーケンシング」と呼ばれることもある。ハイスループットシーケンシングのプラットフォームとしては、限定ではないが、超並列シグネチャーシーケンシング（MPSS）、Polonyシーケンシング、454パイロシーケンシング、Illumina（Solexa）シーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング、Heliscope一分子シーケンシング、一分子リアルタイム（SMRT）シーケンシング（PacBio）、およびナノポアDNAシーケンシング（たとえばOxford Nanopore）が挙げられる。

B.核酸配列の分析
核酸シーケンシングは配列リードを生成する。配列リードは、典型的には、配列リードを参照ゲノムに対しマッピングすることにより分析される。たとえば、現在のヒトゲノム参照配列はhg38であり、たとえばNCBIのウェブサイトからアクセス可能である。分析対象の遺伝子座は、ゲノム内の1ヌクレオチド位置、またはゲノムの配列もしくはプロモーター領域などの周辺領域を含めた領域、たとえば遺伝子、または染色体であり得る。

配列を参照ゲノムに対しマッピングした後、結果をいくつかの方法で分析することができる。分析の一つの方法は、「ピーク分析」と呼ばれる。この方法では、参照ゲノム全体の座に対する配列リードのマッピング数が決定され得る。核酸は、修飾ヌクレオチドを含む配列が濃縮されているので、たとえば、X軸がゲノムを表し、「Y」軸がそれに対するリードマッピング数を表すグラフにおいて、多数の配列リードがリードの「ピーク」として現れる。ピークは、ヌクレオチド修飾の座を表すことができる。

別の方法は、一塩基分解能の分析を含む。この方法では、1ヌクレオチドを1つの座として用いて、配列リードを参照ゲノムに対し比較する。非シトシン形態のヌクレオチドに変換されたシトシン形態のヌクレオチドは、参照ゲノムに対しミスマッチとして現れることになる。たとえば、参照ゲノム内のシトシン残基は、配列リード内のチミジン残基とマッチするであろう。配列リード内のシトシン残基とマッチする参照ゲノム内のシトシン残基は、標的の修飾ヌクレオチドを表す。

C.DNAマイクロアレイ分析
いくつかの態様では、本明細書に記載される方法により調製された核酸を、DNAマイクロアレイを用いて分析することができる。DNAマイクロアレイは、比較ゲノムハイブリダイゼーション、クロマチン免疫沈降分析、およびSNP検出に使用され得る。「DNAチップ」とも呼ばれるDNAマイクロアレイは固体支持体であって、オリゴヌクレオチドプローブが所定の位置にアドレス可能に結合している。この一連の核酸プローブに試料核酸を接触させると、試料核酸は相補的またはほぼ相補的な配列を有するプローブとハイブリダイズする。試料核酸がハイブリダイズした場所を決定することができる。そしてこの情報を使って、試料核酸の素性または配列を決定することができる。DNAマイクロアレイは、核酸分子を配列特異的に検出できるので、参照ゲノムでは「C」として読み取られる塩基が本明細書に記載される方法で処理された後は「T」に置き換わっているような改変配列の検出に有用である。DNAマイクロアレイは、実験室で調製してもよいし、たとえばAffymetrix（ThermoFisher）から購入してもよい。

D.他の検出方法
他の方法を使って核酸を検出することもできる。それらの方法は、増幅プロセス中に行うことができ、また、アンカーベースのバイサルファイト濃縮の読み取り情報として用いることができる。

1.TaqMan
TaqManプローブ検出では、標的DNA分子用のプローブが、フルオロフォアおよびクエンチャー部分を含む。PCR中、標的DNA上にプライマーを伸長させているTaqポリメラーゼが、その5’-3’エクソヌクレアーゼ活性を使って、ハイブリダイズしたTaqManプローブからヌクレオチドを切断し、そうすることでフルオロフォアを放出する。フルオロフォアは、クエンチャーから切り離されると、検出可能な蛍光を発する。

2.分子ビーコン
分子ビーコンは、ステム・ループ構造の形態の核酸である。ステムは、相補的ヌクレオチドにより分子両端に形成される。典型的には、分子の5’末端にフルオロフォアを結合させ、分子の3’末端にクエンチャーを結合させる。ビーコンのループは、標的分子内の標的ヌクレオチド配列に相補的なヌクレオチド配列を含む。ビーコンが標的配列を有する分子とハイブリダイズすると、フルオロフォアとクエンチャーとが物理的に分離され、検出可能な蛍光を生じる。

3.パドロックプローブおよび分子反転プローブ
パドロックプローブおよび分子反転プローブは、一本鎖核酸分子であって、標的分子に相補的な配列をその両端に含む。パドロックプローブを用いる標的指向性バイサルファイトシーケンシングでは、パドロックプローブが準備される。各パドロックプローブは、2つの標的特異的キャプチャーアームに挟まれた共通リンカー配列を有する。リンカー配列は、ユニバーサルプライマーのプライミング部位を含む。複数のパドロックプローブが、交互のDNA鎖上の部分的に重複する領域のCpGアイランドをカバーする。パドロックプローブのライブラリーを、バイサルファイト変換ゲノムDNAにアニールさせ、3’末端を伸長させて5’と連結させ、エクソヌクレアーゼで直鎖DNAを除去した後、一対の共通プライマーを用いてすべての環状化パドロックプローブをPCR増幅する。分子反転プローブでは、両端が標的核酸分子に結合し、ギャップ、たとえば一塩基ギャップを残す。

分子反転プローブは、標的核酸内の標的領域に相補的な配列を有する両端、典型的にはプローブ放出切断部位により分離されている一対のPCRプライマー結合部位、ハイブリダイゼーションベースの検出用タグ配列、およびタグ放出切断部位を含み得る。標的核酸にハイブリダイズすると、ハイブリダイゼーション部位のギャップがリガーゼにより、またはポリメラーゼおよびリガーゼにより埋められ得る。プローブ放出部位の切断により一本鎖プローブが生じる。プローブのPCRプライマー部位からのPCRは、標的配列およびキャプチャー配列を増幅する。増幅した分子を、タグ配列を用いての濃縮により単離することができる。その後タグ配列を放出することができる。

4.qPCR
別の方法では、配列をqPCRにより検出する。qPCRでは、DNAをPCRにより増幅し、ここで検出可能に標識されたヌクレオチドが増幅産物に組み入れられる。標識の検出率および検出量が、試料中の標的の量の指標となる。

IV.診断方法
標的／非標的塩基を修飾するよう処理された核酸分子のアンカー塩基の濃縮を、バイオマーカーとしての修飾塩基の検出を含む診断方法に用いることができる。バイオマーカーを発見する方法では、一方は診断されるべき病気を有しており、他方はその病気をもたない、2つの対象群由来の試料が準備される。病気は、限定ではないが、遺伝的病気、がん、早老症または促進老化などの年齢関連の病気、細胞病理、神経病理、その他を含め、任意の病態であり得る。

本明細書に記載される方法は、異なる群それぞれの各試料の塩基修飾パターンの遺伝子解析をもたらすために用いられる。この遺伝子解析は、配列情報の形態をとり得る。データをデータセットとしてまとめ、統計学的分析に供して、2群を区別するモデルを生成する。このために、当技術分野で公知の任意の統計学的方法を用いることができる。そのような方法またはツールとしては、限定ではないが、相関、ピアソンの相関、スピアマンの相関、カイ二乗、平均／分散の比較（たとえば、対応T検定、独立T検定、ANOVA）回帰分析（たとえば、単回帰、重回帰、線形回帰、非線形回帰、ロジスティック回帰、多項式回帰、段階的回帰、リッジ回帰、ラッソ回帰、エラスティックネット回帰）、またはノンパラメトリック分析（たとえば、ウィルコクソンの順位和検定、ウィルコクソンの符号順位検定、符号検定）が挙げられる。そのようなツールは、MATLAB、JMP Statistical Software、およびSASなどの市販されている統計学パッケージに含まれる。そのような方法は、特定のバイオマーカープロファイルを特定の状態に分類するのに使えるモデルまたは分類子を生成する。統計学的分析は、オペレーターが実行してもよいし、機械学習により実行してもよい。そのような分析の結果は、修飾塩基、たとえば修飾シトシン残基の場所についての情報を用いて、試料が採取された対象を病気を有するかまたは有さないかに分類するモデルである。

病気を診断するモデルが確立されると、そのモデルを対象の診断に用いることができる。そのような方法では、対象由来の核酸を含む試料が準備される。核酸を、本明細書に記載される方法に供する。処理した核酸を分析して配列データなどの特徴データを生成する。該モデルを該配列データに適用して、該試料を適当なカテゴリーに分類する。

たとえば、検出の方法は、(1)対象由来の生物学的試料からDNAを準備すること;(2)本明細書に記載されるアンカー塩基第2鎖合成により、修飾シトシン残基を含む配列が濃縮された二本鎖核酸分子を生成すること;(3)バイオマーカーとして機能する二本鎖分子内の修飾シトシン残基の場所を、遺伝子座に対しマッピングすること、を含み得る。バイオマーカーの存在は、該バイオマーカーと関連づけられる病気の指標である。

方法は、本明細書に記載されるマッピングストラテジーのいずれかを含み得る。さらに、検出は、限定ではないが、DNAシーケンシング、PCR、qPCR、バイオマーカーに対する標識プローブのハイブリダイゼーション、TaqMan増幅、または分子ビーコンによる検出を含め、特定のヌクレオチド配列を検出する当技術分野で公知の任意の方法により行うことができる。

例示的態様
本発明の例示的態様は、限定されないが、以下を含む。
1. a)変換核酸分子を産生するために、試料中の標的核酸分子内の非標的形態のシトシンおよび／または修飾シトシンを化学的または酵素的に非シトシン残基に変換する工程;
b)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2～25である、第2鎖合成を実施する工程;ならびに
c)前記二本鎖核酸分子を分析する工程
を含む、方法。
2. n = 5～20、または4～9、または5である、態様1記載の方法。
3. 前記プライマーがヘキサマーである、態様1記載の方法。
4. XがN、H、I、Q、またはJのいずれかであり得る、態様1記載の方法。
5. XnGまたはX(n-1)CGが、NnGもしくはN(n-1)CG、HnGもしくはH(n-1)CG、InGもしくはI(n-1)CG、QnGもしくはQ(n-1)CG、JnGもしくはJ(n-1)CG、またはそれらの組み合わせから選択される、態様1記載の方法。
6. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様1記載の方法。
7. 前記プライマーがヘキサマーである、態様1記載の方法。
8. 配列XnGまたはX(n-1)CGに関し、前記プライマーの組が完全に縮重している、態様1～7のいずれか記載の方法。
9. 前記標的核酸分子がヒトDNAを含む、態様1記載の方法。
10. 前記核酸が、病的組織または細胞、たとえばがん性細胞に由来する、態様1記載の方法。
11. 前記標的核酸分子が、精製DNAもしくはRNA、またはクロマチンを含む、態様1記載の方法。
12. 前記標的核酸が、約150ヌクレオチド～約700ヌクレオチドの長さを有する、態様1記載の方法。
13. 化学的または酵素的に変換する工程が、バイサルファイト、テン-イレブン転座メチルシトシンジオキシゲナーゼ酵素（「TET」）、およびAID/APOBEC酵素クラスの酵素（たとえばAPOBEC3A（「A3A」））の1つまたは複数での処理を含む、態様1記載の方法。
14. シトシンの標的形態が、5メチルシトシン（「5mC」）、5ヒドロキシメチルシトシン（「5hmC」）、5ホルミルシトシン（「5fC」）、および5カルボキシルシトシン（「5caC」）の1つまたは複数を含む、態様1記載の方法。
15. 化学的または酵素的に変換する工程が、5mCおよび5hmC以外のシトシン形態をウラシルに変換することを含む、態様1記載の方法。
16. 化学的または酵素的に変換する工程が、5hmC以外のシトシン形態をウラシルに変換することを含む、態様1記載の方法。
17. 化学的または酵素的に変換する工程が、シトシンをウラシルに変換するが、5mC、5hmC、5fC、または5caCはウラシルに変換しないことを含む、態様1記載の方法。
18. 非シトシン残基がウラシルである、態様1記載の方法。
19. 前記プライマーが、DNA、RNA、LNA、またはPNAを含む、態様1記載の方法。
20. 前記プライマーが、修飾リボースまたはデオキシリボースを含む、態様1記載の方法。
21. 前記プライマーが、前記プライマーの融解温度を変える修飾糖残基を含む、態様1記載の方法。
22. 前記プライマーが、アダプター配列および／またはユニバーサルプライミング配列をさらに含む、態様1記載の方法。
23. 前記アダプター配列が、P3およびP5を含む、態様22記載の方法。
24. 前記アダプター配列が、P3およびP5を含む、態様22記載の方法。
25. 前記プライマーが、試料バーコード配列を含む、態様1記載の方法。
26. 前記プライマーが、分子バーコード配列を含む、態様1記載の方法。
27. 前記プライマーが、アダプター配列および／またはユニバーサルプライミング配列をさらに含む、態様1記載の方法。
28. 第2鎖合成が、中温性または好熱性DNAポリメラーゼを用いて実施される、態様1記載の方法。
29. 第2鎖合成が、エクソ-ポリメラーゼを用いて実施される、態様1記載の方法。
30. 第2鎖合成が、クレノウエクソ-ポリメラーゼ、クレノウポリメラーゼ、T4 DNAポリメラーゼ、Taqポリメラーゼ、pfuポリメラーゼ、DNAポリメラーゼI、Phi29ポリメラーゼ、およびリバーストランスクリプターゼ（たとえば、モロニーマウス白血病ウイルス（M-MLV）、トリ骨髄芽球症ウイルス（AMV）、ならびにそれらの変異／改変バージョンから選択されるポリメラーゼを用いて実施される、態様1記載の方法。
31. 前記プライマーがビオチン化されており、方法が、ビオチンを含む二本鎖核酸分子を捕捉する工程をさらに含む、態様1記載の方法。
32. 前記核酸分子に3’末端アジド（N3）基を導入する工程;
5’-3-トリアゾール結合によりアルキル化アダプターを結合させてアダプター付き分子を産生する工程;ならびに
前記分子の5’および3’末端に相補的な1組のプライマーを用いて前記アダプター付き分子を増幅する工程
をさらに含む、態様31記載の方法。
33. アダプター付き核酸分子を産生するために、プライマー伸長後に、シーケンサー特異的アダプターを前記核酸分子に結合させる工程を含む、態様1記載の方法。
34. 結合させる工程が、末端修復、任意選択によりヌクレオチドオーバーハングの追加、および前記アダプターと平滑末端またはオーバーハングとの連結を含む、態様33記載の方法。
35. 前記アダプターが、Polonyシーケンシング、454パイロシーケンシング、Illumina（Solexa）シーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング、Heliscope一分子シーケンシング、一分子リアルタイム（SMRT）シーケンシング、およびナノポアDNAシーケンシングによるシーケンシングに特異的である、態様33記載の方法。
36. 前記二本鎖分子がプライマーハイブリダイゼーション配列を備えており、方法が、前記二本鎖核酸分子を増幅する工程を含む、態様1記載の方法。
37. 標的ヌクレオチド配列を含む核酸の配列捕捉をさらに含む、態様1記載の方法。
38. 分析する工程が、
配列リードを産生するために、核酸増幅ありまたはなしで、前記二本鎖核酸分子のシーケンシングを行うこと
を含む、態様1記載の方法。
39. シーケンシングが、Polonyシーケンシング、454パイロシーケンシング、Illumina（Solexa）シーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング、Heliscope一分子シーケンシング、一分子リアルタイム（SMRT）シーケンシング、またはナノポアDNAシーケンシングにより実施される、態様38記載の方法。
40. 分析が、ピーク分析またはSNP分析を含む、態様39記載の方法。
41. 前記配列リードを参照ゲノムに対しマッピングする工程を含む、態様39記載の方法。
42. 参照ゲノム内のシトシン残基に対しマッピングする前記配列リード内の1つまたは複数のシトシン残基の遺伝子座をマッピングする工程、および／または前記参照ゲノム内のシトシン残基に対しマッピングする前記配列リード内の1つまたは複数のチミジン残基の遺伝子座をマッピングする工程をさらに含み、ここで前記参照ゲノム内のシトシン残基に対しマッピングする配列リード内のシトシン残基が、配列リードを産生するためにシーケンシングされた核酸分子内の修飾シトシン残基を表す、態様41記載の方法。
43. 分析する工程が、DNAアレイ分析を含む、態様1記載の方法。
44. 前記核酸がRNAを含んでおり、第2鎖合成がdUTPヌクレオチドを用いる、態様1記載の方法。
45. 標的DNA分子が、
i)（任意選択により細胞内の）クロマチンを含む試料を準備すること;
ii)前記クロマチンにおいてタンパク質をDNAに架橋すること;任意選択により、前記架橋したクロマチンを断片化すること;および
iii)クロマチン免疫沈降（ChIP）により前記クロマチンから標的核酸分子を単離すること
により準備される、態様1記載の方法。
46. 前記免疫沈降が、ヒストン、DNAポリメラーゼ、RNAポリメラーゼ、メチル結合タンパク質と結合している核酸配列、または以下のドメイン：bZIPドメイン、DNA結合性ドメイン、ヘリックス-ループ-ヘリックス、ヘリックス-ターン-ヘリックス、MG-box、ロイシンジッパー、レキシトロプシン、核酸シミュレーション、ジンクフィンガー、ヒストンメチラーゼ、動員タンパク質、Swi6を含有するタンパク質と結合している核酸配列を標的とする、態様45記載の方法。
47. 標的DNA分子が、
i)クロマチンを含む試料を準備すること;
ii)前記クロマチンにおいて（たとえばホルムアルデヒドを用いて）タンパク質をDNAに架橋すること;
iii)クロマチンを消化して断片化クロマチンを作製すること;
iv)前記断片化クロマチンにビオチンを導入してビオチン化クロマチンを産生すること;
v)前記ビオチン化クロマチン断片同士を連結すること;
vi)前記連結断片を脱架橋、抽出、およびせん断すること;ならびに
vii)前記せん断したビオチン化断片を単離すること
48. DNA中のバイサルファイト非反応性シトシンをマッピングする方法であって、
a)断片化されていてもよい核酸分子を含む試料を準備する工程;
b)前記核酸分子をバイサルファイトで処理する工程であって、処理によって未修飾シトシン残基がウラシルに変換される、処理する工程;
c)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含み、Xが任意の塩基であり、n = 2～25である、第2鎖合成を実施する工程;
d)前記二本鎖核酸分子に対し末端修復およびアダプター連結を実施して、アダプター付き核酸分子を産生する工程;
e)（たとえばPCRまたはqPCRにより）前記アダプター付き核酸分子を増幅する工程;ならびに
f)前記増幅した核酸分子のシーケンシングを行う工程
を含む、方法。
49. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様48記載の方法。
50. a)断片化されていてもよい核酸分子を含む試料を準備する工程;
b)前記核酸分子内の5-ヒドロキシメチルシトシン（「5hmC」）残基を保護する工程;
c)5-メチルシトシン（「5mC」）および／または5-ホルミルシトシン（「5fC」）を5-カルボキシルシトシン（「5caC」）残基に変換する工程;
d)前記核酸内のC、および5caC残基をウラシルに変換する工程;
e)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含み、Xが任意の塩基であり、n = 2～25である、第2鎖合成を実施する工程;
f)前記二本鎖核酸分子にアダプターを結合させて、アダプター付き核酸分子を産生する工程;
g)（たとえばPCRにより）前記アダプター付き核酸分子を増幅する工程;ならびに
h)前記増幅した核酸分子のシーケンシングを行う工程
を含む、方法。
51. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様50記載の方法。
52. 5mCおよび／または5fCが、TETでの処理により5caCに変換される、態様50記載の方法。
53. 5hmCが、たとえばT4グルコシルトランスフェラーゼを用いたグルコシル化により保護される、態様50記載の方法。
54. a)断片化されていてもよい核酸分子を含む試料を準備する工程;
b)5-メチルシトシン（「5mC」）、5-ヒドロキシメチルシトシン（「5hmC」）、および／または5-ホルミルシトシン（「5fC」）を5-カルボキシルシトシン（「5caC」）残基に変換する工程;
c)たとえばAPOBEC/AID酵素クラスの酵素を用いて、前記核酸内のC残基をウラシルに変換する工程;
d)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2～25である、第2鎖合成を実施する工程;
e)前記二本鎖核酸分子にアダプターを結合させて、アダプター付き核酸分子を産生する工程;
f)（たとえばPCRにより）前記アダプター付き核酸分子を増幅する工程;ならびに
g)たとえばシーケンシングまたはDNAアレイ分析により、前記増幅した核酸分子を分析する工程
を含む、方法。
55. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様54記載の方法。
56. 以下:
(a)ヌクレオチド配列を含む1組のプライマーであって、前記プライマーがヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含み、Xが任意の塩基であり、n = 2～25である、1組のプライマー;
(b)1つまたは複数の容器であって、それぞれの容器が(i)ナトリウムバイサルファイト、(2)テン-イレブン転座メチルシトシンジオキシゲナーゼ1（「TET1」）、T4ベータ-グルコシル-トランスフェラーゼ、APOBEC3A（「A3A」）、またはAID/APOBECクラスのデアミナーゼからの酵素のうち1つを含む、容器
を含む、キット。
57. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様56記載の方法。
58. ヒト、マウス、または無脊椎動物（たとえばネグレリア（Naegleria）、ショウジョウバエ（Drosophila））由来のTET1を含む、態様56記載のキット。
59. 「X」が、たとえば（デオキシ）イノシン、ネブラリン、3-ニトロピロール、5-ニトロインドールから選択される、少なくとも1つのユニバーサル塩基を含む、態様56記載のキット。
60. 以下:
(a)ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含む1組のプライマーであって、Xが任意の塩基であり、n = 2～25である、1組のプライマー;
(b)標的核酸分子内の全部ではないが少なくとも1つの形態のシトシンまたは修飾シトシンがウラシルに変換されている、核酸分子
を含む、キット。
62. 以下:
(a)ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含む1組のプライマーであって、Xが任意の塩基であり、n = 2～25であり、前記プライマーがタグ、たとえばビオチンを含んでいる、1組のプライマー;
(b)3'-アジド-ddGTP;
(c)5’アルキルオリゴ;ならびに
(d)標的核酸分子内の全部ではないが少なくとも1つの形態のシトシンまたは修飾シトシンがに変換されている、核酸分子
を含む、キット。
63. 以下:
a)一本鎖核酸分子の集団;ならびに
b)前記aにハイブリダイズした、ヌクレオチド配列5’-HnG-3’および／または5’-H(n-1)CG-3’を含む1組のプライマーであって、Xが任意の塩基であり、n = 2～25である、1組のプライマー
を含む、組成物。
64. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様63記載の方法。
65. 試料を病的または非病的と分類するモデルを生成する方法であって、
a)病状を有する第1の組の対象に由来する第1の組の核酸分子、および病状を有さない第2の組の対象に由来する第2の組の核酸分子を準備する工程;
b)前記試料中の核酸分子を以下:
(i)変換核酸分子を産生するために、試料中の標的核酸分子内の非標的形態のシトシンおよび／または修飾シトシンを化学的または酵素的に非シトシン残基に変換すること;
(ii)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施することであって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2～25である、第2鎖合成を実施すること
により処理する工程;ならびに
c)前記二本鎖核酸分子を分析して、前記試料中の塩基修飾をマッピングするデータを産生する工程;
d)前記試料中の塩基修飾の位置の違いを比較するために前記データの統計学的分析を実施する工程であって、前記統計学的分析が、試料を病的または非病的と分類するモデルを産生する、統計学的分析を実施する工程
を含む、方法。
66. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様65記載の方法。
67. (a)対象由来の生物学的試料からのDNAを準備する工程;
(b)試料中の標的核酸分子内の非標的形態のシトシンおよび／または修飾シトシンを化学的または酵素的に非シトシン残基に変換して、変換核酸分子を産生する工程;
(c)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2～25である、第2鎖合成を実施する工程;
(d)本明細書に記載されるアンカー塩基第2鎖合成方法により、修飾シトシン残基を含む配列が濃縮された二本鎖核酸分子を生成する工程;ならびに
(e)前記二本鎖分子内の修飾シトシン残基の場所を、遺伝子座に対しマッピングする工程
を含む、方法。
68. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様67記載の方法。
69. 前記マッピングされた修飾シトシン残基がバイオマーカーである、態様67記載の方法。

I. AB-BS（ABBSまたはABBAとも呼ばれる）
この方法は、DNAまたはRNAに存在する5mCおよび5hmC塩基はバイサルファイトと反応しないが、未修飾シトシン、5-ホルミルシトシン、および5-カルボキシシトシンは（そしておそらくはその他のまだ同定されていない修飾シトシンも）脱アミノ化され、効率よくウラシルに変換される、という事実を利用するものである。これらのウラシル部位は、クレノウエクソ-ポリメラーゼを用いての第2鎖合成後、アデニンと塩基対を形成し、したがってもとの親系統のDNAにおけるバイサルファイト反応性Cはすべてウラシルに変換され、PCRおよび／またはシーケンシングではTとして読み出される。これを利用して、本発明は、第2鎖合成中にランダムプライミングストラテジーを用いてゲノム内に存在する任意の不反応シトシン（たとえば5mCおよび5hmC）からDNAを増幅することを可能にし、ここでプライマーは、5’-HHHHHG-3’（HはGではない）（もしくは特にCpGメチル化を濃縮する際は5’-HHHHCG-3’）、または5’-NNNNNG-3’（N = A、C、G、T/U）（もしくは特にCpGメチル化を濃縮する際は5’-NNNNCG-3’）という構造を有する。3’末端のGは、バイサルファイトと反応しなかった任意のCにプライマーをアンカリングさせ、内側および5’のHは、存在する場合は、プライマーがCと部分的にハイブリダイズすることを阻止する。したがって、これらのアンカープライマーから駆動されるPCR増幅は、ゲノムにおけるメチル化および／またはヒドロキシメチル化領域を優先的に増幅することになる。

プロトコル
1/ （高効率なバイサルファイト変換を測定するため）0.5%の非メチル化ラムダDNAを添加した500 ngのDNA、EZ DNAメチル化ライトニングキット（Zymo Research Corp.）をプロトコルどおりに用いてのバイサルファイト変換。
2/ ナノドロップ（Nanodrop）定量化。
3/ 第2鎖合成:

1. 94℃で5分間
2. 4℃で5分間→5分後、溶液に5 μLのクレノウエクソ-（NEB、5 U/μL）を加え、よく混ぜる。
3. 5%のペースで4℃から37℃に漸増。
4. 37℃で60分間
5. 75℃で15分間、その後4℃/∞
4/ QiagenのMinEluteカラムを用い、洗浄2回、20 μLのトリス-HCl pH 8.0 10 mMでの溶出により、dsDNAを精製後、Qubit 2.0 dsDNA HSキットを用いて定量化。
5/ 出発材料2.5 ngの2s Swiftによるライブラリー

追加実施例:
II. AB-TAB-Seq（アンカー塩基Tet支援バイサルファイトシーケンシング）
工程:
1. 最初に、Active Motifのヒドロキシメチルコレクター-Seq（Hydroxymethyl Collector-Seq）キット（#55019）に概説されている条件で、組み換えT4ファージベータ-グルコシルトランスフェラーゼ（Active Motif cat# 81249）を用いて5hmC塩基をグルコシル化により保護する。
2. 5mCおよび5fCを組み換えTET1酵素（Active Motifのcat #81148）により酸化して5-カルボキシルシトシンを形成するが、グルコシル化5hmCはインタクトのままである。
3. 次に、酸化DNAをバイサルファイトと反応させて、ゲノム全体の未修飾シトシンおよび5-カルボキシシトシン基を脱アミノ化する。
4. 次いでDNAを精製し（Active MotifのChIP IP DNA精製キット（Purification Kit））、上述のようにクレノウエクソ-、アンカーオリゴを用いてプロセスし、二本鎖DNAライブラリーを調製する。
5. 形成したライブラリーのNGSにより、濃縮された5hmCの領域をゲノムから特定する。

III. AB-A3A-Seq（アンカー塩基A3A支援シーケンシング）。図面を参照のこと。
工程:
1. 組み換えTET1酵素でDNAを処理して、5mC、5hmC、5fC塩基を5caCに変換するが、未修飾シトシンはインタクトのままである。
2. 次に、TET1酸化DNAを組み換えAPOBEC3A（A3A）で処理して未修飾シトシンを脱アミノ化し、これらの塩基をウラシルに変換する。TET1により形成した5caC部位はどれも、A3Aに影響されないままである。
3. 次いでDNAを精製し（Active MotifのChIP IP DNA精製キット（Purification Kit））、上述のようにクレノウエクソ-、アンカーオリゴを用いてプロセスし、二本鎖DNAライブラリーを調製する。
4. 形成したライブラリーのNGSにより、濃縮された修飾TET酸化塩基の領域をゲノムから特定する。

IV. AB-HiC
この態様では、（相互作用する座をマッピングするために）「HiC」で使用されたDNA（たとえばLieberman-Aiden et al., Science (2009) Vol. 326, Issue 5950, pp. 289-293）を断片化および熱変性に供する。次に、中温性ポリメラーゼが、モチーフコンセンサスを含む（モチーフコンセンサスにアンカリングされた）短いプライマーを用いて第2鎖を合成する。（本案ではNNNNNGまたはHHHHHGが強調されるが、本明細書に記載される任意のプライマー、および本明細書でモチーフにより例示されているようなライブラリー調製に用いられる二本鎖DNAを作ることができるプライマーを使用することができる。）（http://genome.ucsc.edu/FAQ/FAQformat#format1のブラウザー・エクステンシブル・データ（Brower Extensible Data）「BED」ファイルで）シーケンシングおよび標的ゲノム領域外のリードのフィルタリング後、特定の相互作用が抽出される。この方法は、（普通は約10億リードが必要とされる）通常のHiCと比べてかなり安価である。この具体的事例の場合、たとえばヘキサマーを含むプライマーは、シーケンシング費用を数百倍低減するであろう。

単離核酸を分析する。分析には、たとえば核酸シーケンシング、PCR、qPCR等が含まれ得る。後の分析のために一般に配列決定を行う。本明細書に記載される方法は、概してハイスループットシーケンシング法を使用する。本明細書で使用する場合、「ハイスループットシーケンシング」という用語は、何千という核酸分子の同時またはほぼ同時のシーケンシングを指す。ハイスループットシーケンシングは、「次世代シーケンシング」または「超並列シーケンシング」と呼ばれることもある。ハイスループットシーケンシングのプラットフォームとしては、限定ではないが、超並列シグネチャーシーケンシング（MPSS）、Polonyシーケンシング、454パイロシーケンシング、Illumina（Solexa）シーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング（Complete Genomics）、Heliscope一分子シーケンシング、一分子リアルタイム（SMRT）シーケンシング（PacBio）、およびナノポアDNAシーケンシング（たとえばOxford Nanopore）が挙げられる。シーケンシングにより生成された核酸のヌクレオチド配列を本明細書では「配列情報」、「配列リード」、または「配列データ」と呼ぶ。

HiC:プロセスを簡単にまとめると、細胞をホルムアルデヒドで架橋する;DNAを制限酵素で消化して5'オーバーハングを残す;ビオチン化残基を含め、5'オーバーハングを埋める;得られた平滑末端断片を、架橋DNA断片間の連結イベントに好都合な希釈条件下で連結する（透過性細胞におけるインサイチュー連結も一つの選択肢である）。得られたDNA試料は、もともと核内で空間的に近接していた、接合部がビオチン標識されている断片からなる連結産物を含む。DNAのせん断、およびストレプトアビジンビーズを用いてビオチン含有断片を選別することにより、HiCライブラリーを作製する。次にこのライブラリーを超並列DNAシーケンシングにより分析して、相互作用する断片の一覧を生成する。

本明細書で使用する場合、特に明言しないかぎり、次の意味が適用される。「～することができる」という言葉は、強制の意味（すなわち、～でなくてはならない、という意味）ではなく、容認の意味（すなわち、～する可能性を有する、という意味）で使用される。「含む（include）」、「含む（including）」、および「含む（includes）」等の言葉は、限定ではないが、「～を含む」を意味する。単数形の「1つの（a）」、「1つの（an）」、および「その（the）」は、複数形も含む。したがって、たとえば、「1つの要素（an element）」への言及は、「1つまたは複数の」などの1つまたは複数の要素を指す他の用語および語句の使用にかかわらず、2つ以上の要素の組み合わせも含む。「少なくとも1つの」という語句は、「1つの」、「1つ以上の」、「1つまたは複数の」、および「複数」を含む。「または」という用語は、特に明言しないかぎり、排他的ではなく、すなわち「および」と「または」の両方を包含する。修飾語と一連の連続物との間の「のいずれか」という用語は、その修飾語が、その一連の連続物の各メンバーを修飾することを意味する。したがって、たとえば「少なくとも1、2、または3のいずれか」は、「少なくとも1、少なくとも2、または少なくとも3」を意味する。「～から本質的になる」という用語は、記載の要素、および言明している組み合わせの基本的かつ新規な特徴に重大な影響を与えないその他の要素を含む、ということを指す。

本明細書および図面は、本発明を開示の特定の形態に限定する意図はなく、むしろその意図は、添付の請求項に定められる本発明の趣旨および範囲内であらゆる改造物、均等物、および代替物を網羅することである、と理解すべきである。本発明の様々な局面のさらなる改造および代替の態様は、本明細書に鑑み当業者には明らかになる。したがって、本明細書および図面は、単に説明的なものであって、本発明を実施する一般的な方法を当業者に教示するためのものである、と解釈すべきである。本明細書に示され、かつ記載される本発明の諸形態は、諸態様の例と考えるべきであることを理解されたい。本明細書に説明されかつ記載された要素および材料を別のもので置き換えることもでき、部分およびプロセスを逆にすることも省略することもでき、また本発明の特定の特徴を独立して利用することもでき、それらはすべて、本発明の明細書の利益を受けた後当業者には明白になろう。添付の請求項に記載される本発明の趣旨および範囲から逸脱することなく、本明細書に記載される要素に変更を加えることができる。本明細書で用いた見出しは単に編成上のものであり、本明細書の範囲を限定するために使ったものではない。

本明細書に記載したすべての刊行物、特許、特許出願は、個々の刊行物、特許、特許出願が、参照により組み入れられることがあたかも具体的かつ個別に表明されたも同然に、参照により本明細書に組み入れられる。

I. AB-BS（ABBSまたはABBAとも呼ばれる）
この方法は、DNAまたはRNAに存在する5mCおよび5hmC塩基はバイサルファイトと反応しないが、未修飾シトシン、5-ホルミルシトシン、および5-カルボキシシトシンは（そしておそらくはその他のまだ同定されていない修飾シトシンも）脱アミノ化され、効率よくウラシルに変換される、という事実を利用するものである。これらのウラシル部位は、クレノウエクソ-ポリメラーゼを用いての第2鎖合成後、アデニンと塩基対を形成し、したがってDNAのもとの親鎖におけるバイサルファイト反応性Cはすべてウラシルに変換され、PCRおよび／またはシーケンシングではTとして読み出される。これを利用して、本発明は、第2鎖合成中にランダムプライミングストラテジーを用いてゲノム内に存在する任意の不反応シトシン（たとえば5mCおよび5hmC）からDNAを増幅することを可能にし、ここでプライマーは、5’-HHHHHG-3’（HはGではない）（もしくは特にCpGメチル化を濃縮する際は5’-HHHHCG-3’）、または5’-NNNNNG-3’（N = A、C、G、T/U）（もしくは特にCpGメチル化を濃縮する際は5’-NNNNCG-3’）という構造を有する。3’末端のGは、バイサルファイトと反応しなかった任意のCにプライマーをアンカリングさせ、内側および5’のHは、存在する場合は、プライマーがCと部分的にハイブリダイズすることを阻止する。したがって、これらのアンカープライマーから駆動されるPCR増幅は、ゲノムにおけるメチル化および／またはヒドロキシメチル化領域を優先的に増幅することになる。

Claims

a)変換核酸分子を産生するために、試料中の標的核酸分子内の非標的形態のシトシンおよび／または修飾シトシンを化学的または酵素的に非シトシン残基に変換する工程;
b)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2～25である、第2鎖合成を実施する工程;ならびに
c)前記二本鎖核酸分子を分析する工程
を含む、方法。
n = 5～20、または4～9、または5である、請求項1記載の方法。
前記プライマーがヘキサマーである、請求項1記載の方法。
XがN、H、I、Q、またはJのいずれかであり得る、請求項1記載の方法。
XnGまたはX(n-1)CGが、NnGもしくはN(n-1)CG、HnGもしくはH(n-1)CG、InGもしくはI(n-1)CG、QnGもしくはQ(n-1)CG、JnGもしくはJ(n-1)CG、またはそれらの組み合わせから選択される、請求項1記載の方法。
XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項1記載の方法。
前記プライマーがヘキサマーである、請求項1記載の方法。
配列XnGまたはX(n-1)CGに関し、前記プライマーの組が完全に縮重している、請求項1～7のいずれか記載の方法。
前記標的核酸分子がヒトDNAを含む、請求項1記載の方法。
前記核酸が、病的組織または細胞、たとえばがん性細胞に由来する、請求項1記載の方法。
前記標的核酸分子が、精製DNAもしくはRNA、またはクロマチンを含む、請求項1記載の方法。
前記標的核酸が、約150ヌクレオチド～約700ヌクレオチドの長さを有する、請求項1記載の方法。
化学的または酵素的に変換する工程が、バイサルファイト、テン-イレブン転座メチルシトシンジオキシゲナーゼ酵素（「TET」）、およびAID/APOBEC酵素クラスの酵素（たとえばAPOBEC3A（「A3A」））の1つまたは複数での処理を含む、請求項1記載の方法。
シトシンの標的形態が、5メチルシトシン（「5mC」）、5ヒドロキシメチルシトシン（「5hmC」）、5ホルミルシトシン（「5fC」）、および5カルボキシルシトシン（「5caC」）の1つまたは複数を含む、請求項1記載の方法。
化学的または酵素的に変換する工程が、5mCおよび5hmC以外のシトシン形態をウラシルに変換することを含む、請求項1記載の方法。
化学的または酵素的に変換する工程が、5hmC以外のシトシン形態をウラシルに変換することを含む、請求項1記載の方法。
化学的または酵素的に変換する工程が、シトシンをウラシルに変換するが、5mC、5hmC、5fC、または5caCはウラシルに変換しないことを含む、請求項1記載の方法。
非シトシン残基がウラシルである、請求項1記載の方法。
前記プライマーが、DNA、RNA、LNA、またはPNAを含む、請求項1記載の方法。
前記プライマーが、修飾リボースまたはデオキシリボースを含む、請求項1記載の方法。
前記プライマーが、前記プライマーの融解温度を変える修飾糖残基を含む、請求項1記載の方法。
前記プライマーが、アダプター配列および／またはユニバーサルプライミング配列をさらに含む、請求項1記載の方法。
前記アダプター配列が、P3およびP5を含む、請求項22記載の方法。
前記アダプター配列が、P3およびP5を含む、請求項22記載の方法。
前記プライマーが、試料バーコード配列を含む、請求項1記載の方法。
前記プライマーが、分子バーコード配列を含む、請求項1記載の方法。
前記プライマーが、アダプター配列および／またはユニバーサルプライミング配列をさらに含む、請求項1記載の方法。
第2鎖合成が、中温性または好熱性DNAポリメラーゼを用いて実施される、請求項1記載の方法。
第2鎖合成が、エクソ-ポリメラーゼを用いて実施される、請求項1記載の方法。
第2鎖合成が、クレノウエクソ-ポリメラーゼ、クレノウポリメラーゼ、T4 DNAポリメラーゼ、Taqポリメラーゼ、pfuポリメラーゼ、DNAポリメラーゼI、Phi29ポリメラーゼ、およびリバーストランスクリプターゼ（たとえば、モロニーマウス白血病ウイルス（M-MLV）、トリ骨髄芽球症ウイルス（AMV）、ならびにそれらの変異／改変バージョンから選択されるポリメラーゼを用いて実施される、請求項1記載の方法。
前記プライマーがビオチン化されており、方法が、ビオチンを含む二本鎖核酸分子を捕捉する工程をさらに含む、請求項1記載の方法。
前記核酸分子に3’末端アジド（N3）基を導入する工程;
5’-3-トリアゾール結合によりアルキル化アダプターを結合させてアダプター付き分子を産生する工程;ならびに
前記分子の5’および3’末端に相補的な1組のプライマーを用いて前記アダプター付き分子を増幅する工程
をさらに含む、請求項31記載の方法。
アダプター付き核酸分子を産生するために、プライマー伸長後に、シーケンサー特異的アダプターを前記核酸分子に結合させる工程を含む、請求項1記載の方法。
結合させる工程が、末端修復、任意選択によりヌクレオチドオーバーハングの追加、および前記アダプターと平滑末端またはオーバーハングとの連結を含む、請求項33記載の方法。
前記アダプターが、Polonyシーケンシング、454パイロシーケンシング、Illumina（Solexa）シーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング、Heliscope一分子シーケンシング、一分子リアルタイム（SMRT）シーケンシング、およびナノポアDNAシーケンシングによるシーケンシングに特異的である、請求項33記載の方法。
前記二本鎖分子がプライマーハイブリダイゼーション配列を備えており、方法が、前記二本鎖核酸分子を増幅する工程を含む、請求項1記載の方法。
標的ヌクレオチド配列を含む核酸の配列捕捉をさらに含む、請求項1記載の方法。
分析する工程が、
配列リードを産生するために、核酸増幅ありまたはなしで、前記二本鎖核酸分子のシーケンシングを行うこと
を含む、請求項1記載の方法。
シーケンシングが、Polonyシーケンシング、454パイロシーケンシング、Illumina（Solexa）シーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング、Heliscope一分子シーケンシング、一分子リアルタイム（SMRT）シーケンシング、またはナノポアDNAシーケンシングにより実施される、請求項38記載の方法。
分析が、ピーク分析またはSNP分析を含む、請求項39記載の方法。
前記配列リードを参照ゲノムに対しマッピングする工程を含む、請求項39記載の方法。
参照ゲノム内のシトシン残基に対しマッピングする前記配列リード内の1つまたは複数のシトシン残基の遺伝子座をマッピングする工程、および／または前記参照ゲノム内のシトシン残基に対しマッピングする前記配列リード内の1つまたは複数のチミジン残基の遺伝子座をマッピングする工程をさらに含み、ここで前記参照ゲノム内のシトシン残基に対しマッピングする配列リード内のシトシン残基が、配列リードを産生するためにシーケンシングされた核酸分子内の修飾シトシン残基を表す、請求項41記載の方法。
分析する工程が、DNAアレイ分析を含む、請求項1記載の方法。
前記核酸がRNAを含んでおり、第2鎖合成がdUTPヌクレオチドを用いる、請求項1記載の方法。
標的DNA分子が、
i)（任意選択により細胞内の）クロマチンを含む試料を準備すること;
ii)前記クロマチンにおいてタンパク質をDNAに架橋すること;任意選択により、前記架橋したクロマチンを断片化すること;および
iii)クロマチン免疫沈降（ChIP）により前記クロマチンから標的核酸分子を単離すること
により準備される、請求項1記載の方法。
前記免疫沈降が、ヒストン、DNAポリメラーゼ、RNAポリメラーゼ、メチル結合タンパク質と結合している核酸配列、または以下のドメイン：bZIPドメイン、DNA結合性ドメイン、ヘリックス-ループ-ヘリックス、ヘリックス-ターン-ヘリックス、MG-box、ロイシンジッパー、レキシトロプシン、核酸シミュレーション、ジンクフィンガー、ヒストンメチラーゼ、動員タンパク質、Swi6を含有するタンパク質と結合している核酸配列を標的とする、請求項45記載の方法。
標的DNA分子が、
i)クロマチンを含む試料を準備すること;
ii)前記クロマチンにおいて（たとえばホルムアルデヒドを用いて）タンパク質をDNAに架橋すること;
iii)クロマチンを消化して断片化クロマチンを作製すること;
iv)前記断片化クロマチンにビオチンを導入してビオチン化クロマチンを産生すること;
v)前記ビオチン化クロマチン断片同士を連結すること;
vi)前記連結断片を脱架橋、抽出、およびせん断すること;ならびに
vii)前記せん断したビオチン化断片を単離すること
により準備される、請求項1記載の方法。
DNA中のバイサルファイト非反応性シトシンをマッピングする方法であって、
a)断片化されていてもよい核酸分子を含む試料を準備する工程;
b)前記核酸分子をバイサルファイトで処理する工程であって、処理によって未修飾シトシン残基がウラシルに変換される、処理する工程;
c)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含み、Xが任意の塩基であり、n = 2～25である、第2鎖合成を実施する工程;
d)前記二本鎖核酸分子に対し末端修復およびアダプター連結を実施して、アダプター付き核酸分子を産生する工程;
e)（たとえばPCRまたはqPCRにより）前記アダプター付き核酸分子を増幅する工程;ならびに
f)前記増幅した核酸分子のシーケンシングを行う工程
を含む、方法。
XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項48記載の方法。
a)断片化されていてもよい核酸分子を含む試料を準備する工程;
b)前記核酸分子内の5-ヒドロキシメチルシトシン（「5hmC」）残基を保護する工程;
c)5-メチルシトシン（「5mC」）および／または5-ホルミルシトシン（「5fC」）を5-カルボキシルシトシン（「5caC」）残基に変換する工程;
d)前記核酸内のC、および5caC残基をウラシルに変換する工程;
e)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含み、Xが任意の塩基であり、n = 2～25である、第2鎖合成を実施する工程;
f)前記二本鎖核酸分子にアダプターを結合させて、アダプター付き核酸分子を産生する工程;
g)（たとえばPCRにより）前記アダプター付き核酸分子を増幅する工程;ならびに
h)前記増幅した核酸分子のシーケンシングを行う工程
を含む、方法。
XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項50記載の方法。
5mCおよび／または5fCが、TETでの処理により5caCに変換される、請求項50記載の方法。
5hmCが、たとえばT4グルコシルトランスフェラーゼを用いたグルコシル化により保護される、請求項50記載の方法。
a)断片化されていてもよい核酸分子を含む試料を準備する工程;
b)5-メチルシトシン（「5mC」）、5-ヒドロキシメチルシトシン（「5hmC」）、および／または5-ホルミルシトシン（「5fC」）を5-カルボキシルシトシン（「5caC」）残基に変換する工程;
c)たとえばAPOBEC/AID酵素クラスの酵素を用いて、前記核酸内のC残基をウラシルに変換する工程;
d)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2～25である、第2鎖合成を実施する工程;
e)前記二本鎖核酸分子にアダプターを結合させて、アダプター付き核酸分子を産生する工程;
f)（たとえばPCRにより）前記アダプター付き核酸分子を増幅する工程;ならびに
g)たとえばシーケンシングまたはDNAアレイ分析により、前記増幅した核酸分子を分析する工程
を含む、方法。
XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項54記載の方法。
以下:
(a)ヌクレオチド配列を含む1組のプライマーであって、前記プライマーがヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含み、Xが任意の塩基であり、n = 2～25である、1組のプライマー;
(b)1つまたは複数の容器であって、それぞれの容器が(i)ナトリウムバイサルファイト、(2)テン-イレブン転座メチルシトシンジオキシゲナーゼ1（「TET1」）、T4ベータ-グルコシル-トランスフェラーゼ、APOBEC3A（「A3A」）、またはAID/APOBECクラスのデアミナーゼからの酵素のうち1つを含む、容器
を含む、キット。
XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項56記載の方法。
ヒト、マウス、または無脊椎動物（たとえばネグレリア（Naegleria）、ショウジョウバエ（Drosophila））由来のTET1を含む、請求項56記載のキット。
「X」が、たとえば（デオキシ）イノシン、ネブラリン、3-ニトロピロール、5-ニトロインドールから選択される、少なくとも1つのユニバーサル塩基を含む、請求項56記載のキット。
以下:
(a)ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含む1組のプライマーであって、Xが任意の塩基であり、n = 2～25である、1組のプライマー;
(b)標的核酸分子内の全部ではないが少なくとも1つの形態のシトシンまたは修飾シトシンがウラシルに変換されている、核酸分子
を含む、キット。
XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項60記載の方法。
以下:
(a)ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含む1組のプライマーであって、Xが任意の塩基であり、n = 2～25であり、前記プライマーがタグ、たとえばビオチンを含んでいる、1組のプライマー;
(b)3'-アジド-ddGTP;
(c)5’アルキルオリゴ;ならびに
(d)標的核酸分子内の全部ではないが少なくとも1つの形態のシトシンまたは修飾シトシンがに変換されている、核酸分子
を含む、キット。
以下:
a)一本鎖核酸分子の集団;ならびに
b)前記aにハイブリダイズした、ヌクレオチド配列5’-HnG-3’および／または5’-H(n-1)CG-3’を含む1組のプライマーであって、Xが任意の塩基であり、n = 2～25である、1組のプライマー
を含む、組成物。
XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項63記載の方法。
試料を病的または非病的と分類するモデルを生成する方法であって、
a)病状を有する第1の組の対象に由来する第1の組の核酸分子、および病状を有さない第2の組の対象に由来する第2の組の核酸分子を準備する工程;
b)前記試料中の核酸分子を以下:
(i)変換核酸分子を産生するために、試料中の標的核酸分子内の非標的形態のシトシンおよび／または修飾シトシンを化学的または酵素的に非シトシン残基に変換すること;
(ii)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施することであって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2～25である、第2鎖合成を実施すること
により処理する工程;ならびに
c)前記二本鎖核酸分子を分析して、前記試料中の塩基修飾をマッピングするデータを産生する工程;
d)前記試料中の塩基修飾の位置の違いを比較するために前記データの統計学的分析を実施する工程であって、前記統計学的分析が、試料を病的または非病的と分類するモデルを産生する、統計学的分析を実施する工程
を含む、方法。
XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項65記載の方法。
(a)対象由来の生物学的試料からのDNAを準備する工程;
(b)試料中の標的核酸分子内の非標的形態のシトシンおよび／または修飾シトシンを化学的または酵素的に非シトシン残基に変換して、変換核酸分子を産生する工程;
(c)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および／または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2～25である、第2鎖合成を実施する工程;
(d)本明細書に記載されるアンカー塩基第2鎖合成方法により、修飾シトシン残基を含む配列が濃縮された二本鎖核酸分子を生成する工程;ならびに
(e)前記二本鎖分子内の修飾シトシン残基の場所を、遺伝子座に対しマッピングする工程
を含む、方法。
XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項67記載の方法。
前記マッピングされた修飾シトシン残基がバイオマーカーである、請求項67記載の方法。