JP7206284B2

JP7206284B2 - Ｄｎａ、特にセルフリーｄｎａのエピジェネティック解析の方法

Info

Publication number: JP7206284B2
Application number: JP2020543880A
Authority: JP
Inventors: パトリックエー．アレンスドルフ，; ダメクスペイセック，; チュンシャオソン，
Original assignee: ブルースタージェノミクス，インコーポレイテッド
Priority date: 2018-02-14
Filing date: 2019-02-13
Publication date: 2023-01-17
Anticipated expiration: 2039-02-13
Also published as: US11634748B2; US20230235380A1; CA3091335A1; AU2019222723A1; AU2019222723B2; EP3752515A1; CN112105626A; JP2021513358A; US20200024643A1; US11274335B2; US20210262009A1; WO2019160994A1

Description

本発明は、概してバイオテクノロジーに関し、より詳細にはセルフリーＤＮＡのエピジェネティック解析に関する。本発明は、ゲノミクス、医学、診断学、およびエピジェネティック研究の分野で有用性を見出す。

エピジェネティクスの分野では、特定のＤＮＡ修飾、特に修飾シトシン残基５－メチルシトシン（５ｍＣ）およびその一次酸化産物５－ヒドロキシメチルシトシン（５ｈｍＣ）：

の検出が必要である。
最初、５ｈｍＣは潜在的に重要な修飾として後で特定されるまで特定されなかったため、研究者は５ｍＣに焦点を合わせた。単一塩基の解像度で未修飾のシトシン残基と５ｍＣ残基とを区別するために、バイサルファイトがスキーム１のプロセスでシトシン残基をジヒドロウラシル残基に急速に変換する限り、ＤＮＡエピジェネティック解析では通常、バイサルファイト試薬の使用が必要であった。

一方、スキーム２に示すように、５ｍＣで非常に低い変換率を示す。

しかしながら、単一塩基解像度配列決定におけるバイサルファイトの使用において２つの重大な欠点がある。第１に、バイサルファイトは、ＤＮＡの大幅な分解を引き起こし、９０％以上にもなる。これは、セルフリーＤＮＡには通常血漿１ｍＬあたり数ナノグラムのＤＮＡしか含まれていないため、セルフリーＤＮＡ環境内など、非常に少量のＤＮＡでの手法を実装することを不可能にする。第２に、バイサルファイト法は、シトシンからチミンへの完全な変換を仮定し、バイサルファイトプロセスを偽陽性の影響を受けやすくし、１％の非変換率でも１０～１５％以上の偽陽性の読み取りにつながる。完全な変換に依存すると、プライマーの設計が困難になり、配列決定の読み取りのマッピング率が低くなり、配列決定の費用が全体的に増加する。

エピジェネティクスの分野が発展するにつれて、別のＤＮＡ修飾、５ｈｍＣの検出は、５ｍＣの検出と同様に潜在的に重要であることが証明された。５ｍＣ修飾は一般にＣｐＧジヌクレオチド内で起こるが、天然の５ｈｍＣ残基は他の位置に出現する傾向がある。さらに、５ｈＭＣの発生は、５ｍＣの発生よりもはるかに少ない頻度であり、組織の種類によって、通常は約１０：１の比率であり（Ｎｅｓｔｏｒｅｔａｌ．（２０１２）ＧｅｎｏｍｅＢｉｏｌｏｇｙ１３：Ｒ８４を参照）、５ｍＣは全ＤＮＡ塩基の約１％を示す。５ｈｍＣは、転写、ＤＮＡ脱メチル化、および異常な５ｈｍＣパターンの場合は腫瘍形成を含むさまざまなプロセスに関与していることが確立されているが、５ｈｍＣの分子機能が、理解され始めたばかりである。Ｔａｈｉｌｉａｎｉｅｔａｌ．（２００９）Ｓｃｉｅｎｃｅ３２４（５９２９）：９３０－０３５（２００９）；Ｇｕｏｅｔａｌ．（２０１１）Ｃｅｌｌ１４５：４２３－４３４；Ｗｕｅｔａｌ．（２０１１）Ｇｅｎｅｓ＆Ｄｅｖｅｌｏｐｍｅｎｔ２５：６７９－６８４；Ｋｏｅｔａｌ．（２０１０）Ｎａｔｕｒｅ４６８：８３９－８４３；およびＲｏｂｅｒｔｓｏｎｅｔａｌ．（２０１１）Ｂｉｏｃｈｅｍ．Ｂｉｏｐｈｙｓ．Ｒｅｓ．Ｃｏｍｍ．４１１（１）：４０－３を参照。５ｈｍＣはＴＥＴ１などのＴｅｎ－ＥｌｅｖｅｎＴｒａｎｓｌｏｃａｔｉｏｎ（ＴＥＴ）酵素による５ｍＣの触媒酸化から形成される、安定なＤＮＡ修飾であることも知られている。

バイサルファイト配列決定は、５ｍＣと５ｈｍＣとを区別せず、そのため、５ｍＣおよび５ｈｍＣ残基を個別に検出するための他の方法が必要である。上記のように、５ｈｍＣは５ｍＣよりもはるかに少ない頻度で現れるため、５ｈｍＣを検出する任意の方法は、識別されたすべての５ｈｍＣ残基の画分に関して高い効率と高い選択性を示す必要があり、これは、５ｈｍＣとして識別された実質的にすべての残基が、実際には５ｈｍＣ残基であるはずであることを意味する。スキーム３に示すように：

酵素は５ｍＣを修飾せずに５ｈｍＣを選択的にグルコシル化するため、Ｔ４バクテリオファージ酵素、β－グルコシルトランスフェラーゼ（β－ＧＴ）によるグルコシル化を伴うＤＮＡの５ｈｍＣを検出するいくつかの方法が報告されている。

例えば、ＲｏｂｅｒｔｓｏｎらがＪ－結合タンパク質を使用して、グルコシル化５ｈｍＣ残基を持つ標的ＤＮＡ断片をプルダウンすることについて記載している（Ｒｏｂｅｒｔｓｏｎｅｔａｌ．（２０１１）Ｎｕｃ．ＡｃｉｄｓＲｅｓ．３９，ｅ５５を参照）。他の人たちは、５ｍＣと５ｈｍＣとを区別するために５ｈｍＣに対して作られた抗体を使用する可能性を提案している。最近では、５ｈｍＣ残基の選択的グルコシル化は、例えば、アジド部分により６位で官能基をもたせたウリジン二リン酸（ＵＤＰ）グルコースでのグルコシル化によって、これらの位置にアジド基を提供する方法で行われている。これらの位置でアジド基を提供する５ｈｍＣ残基のこの選択的反応の後に、アルキン官能化ビオチンとの自発的な１，３付加環化反応が続き、これは、当該分野で一般的に「クリックケミストリー」と呼ばれる反応の一種である。これらのビオチン化５ｈｍＣ残基を含むＤＮＡ断片は、その後ストレプトアビジンビーズでプルダウンできる。そのような方法を詳細に記載している、Ｑｕａｋｅらの国際公開２０１７／１７６６３０号を参照されたい。５ｈｍＣ残基を選択的にグルコシル化することにより５ｍＣと５ｈｍＣとを区別する方法に関する、Ｈｅらの米国特許第８，７４１，５６７号およびＬｕらの米国特許出願公開第２０１７／０２５３９２４号も参照のこと。

しかしながら、特に、例えばセルフリーＤＮＡ解析で使用されるような、非常に小さい試料サイズで、単一塩基解像度配列決定を実行する代替方法の必要性が残っている。理想的な方法は、正常なシトシン残基に影響を与えることなく、単一塩基解像度で修飾されたシトシン残基を検出する。最適には、５ｍＣおよび５ｈｍＣの両方の残基を含む単一ＤＮＡ鎖の場合でも、前記方法を容易に適応し、５ｍＣに加えて、または５ｍＣの代わりに５ｈｍＣを検出できる。５ｍＣと同様５ｈｍＣを塩基解像度で個別に検出する方法は、プロセスが両方のエピジェネティックマーカーのマッピングを可能にするため、非常に重要になる可能性がある。非毒性試薬の使用および穏やかな反応条件は、ＤＮＡ分解を回避または少なくとも最小限に抑えるために好ましい。最後に、理想的な方法では、ＤＮＡ断片に少なくとも１つの分子バーコード（または「配列バーコード」）、すなわち、配列決定中に、分子バーコードを含む各ＤＮＡ鎖または断片の１つ以上の特徴を識別するのに役立つ、短い、唯一のオリゴヌクレオチド配列をタグ付けすることを可能にする。

したがって、本発明は、セルフリーＤＮＡのエピジェネティック解析のための新規な方法を提供することにより、当該分野における上記の必要性を扱う。

第１の実施形態において、セルフリーＤＮＡ中の酸化５－メチルシトシン残基をジヒドロウラシル残基に変換する方法が提供され、前記方法は、５－カルボキシシトシン、５－ホルミルシトシン、およびこれらの組み合わせから選択される少なくとも１つの酸化５－メチルシトシン残基を含むセルフリーＤＮＡを接触させることを含み、有機ボランは、少なくとも１つの酸化５－メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかに効果的であり、それによりその場所にジヒドロウラシル残基を提供する。

前述の実施形態の一局面において、有機ボランは、ボランと、窒素複素環および三級アミンから選択される窒素含有化合物との錯体を含む。

実施形態の別の局面において、還元、脱アミノ化、および脱炭酸は、任意の中間体を単離することなく、すなわち「ワンポット」または「ワンチューブ」反応として実施される。

実施形態の別の局面において、前記方法は、バルサルファイト試薬の全くの非存在下で行われる。

実施形態のさらに別の局面において、セルフリーＤＮＡは、セルフリーＤＮＡの選択された領域を含み、ここで「領域」は、ＤＮＡ鎖に沿った位置または配列ベースの組成のいずれかを指す。関連する局面において、セルフリーＤＮＡは、セルフリーＤＮＡの選択された領域に加えて、またはその代わりに、セルフリーＤＮＡの選択された断片を含む。

実施形態のさらなる局面において、セルフリーＤＮＡは二本鎖ＤＮＡを含む。

実施形態の追加の局面において、セルフリーＤＮＡは一本鎖ＤＮＡを含む。

別の実施形態において、以下を含む反応混合物が提供される：

（ａ）５－カルボキシシトシン、５－ホルミルシトシン、およびそれらの組み合わせから選択される少なくとも１つの酸化５－メチルシトシン残基を含むセルフリーＤＮＡの試料；ならびに

（ｂ）少なくとも１つの酸化５－メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかに有効であるのに有効な有機ボラン。

追加の実施形態において、セルフリーＤＮＡ中の５－メチルシトシン残基の存在および位置を検出するための方法を提供し、ここで前記方法は以下を含む：

（ａ）断片化されたアダプターライゲーションセルフリーＤＮＡ中の５－ヒドロキシメチルシトシン残基を修飾して、その上に親和性タグを提供するステップであって、ここで親和性タグはセルフリーＤＮＡからの修飾５－ヒドロキシメチルシトシン含有ＤＮＡの除去を可能にするステップ；

（ｂ）セルフリーＤＮＡから修飾５－ヒドロキシメチルシトシン含有ＤＮＡを除去し、未修飾５－メチルシトシン残基を含むＤＮＡを残すステップ；

（ｃ）未修飾５－メチルシトシン残基を酸化して、５－カルボキシシトシン、５－ホルミルシトシン、およびそれらの組み合わせから選択される酸化５－メチルシトシン残基を含むＤＮＡを得るステップ；

（ｄ）酸化５－メチルシトシン残基を含むＤＮＡを、酸化５－メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化いずれかに有効な有機ボランと接触させ、それにより、酸化５－メチルシトシン残基の代わりにジヒドロウラシル残基を含むＤＮＡを提供するステップ；

（ｅ）ジヒドロウラシル残基を含むＤＮＡを増幅および配列決定するステップ；

（ｆ）（ｅ）における配列決定の結果から５－メチル化パターンを決定するステップ。

この実施形態の一局面において、前記方法はさらに以下を含む。

（ｇ）ステップ（ｂ）においてセルフリーＤＮＡ試料から除去された５－ヒドロキシメチルシトシン含有ＤＮＡにおけるヒドロキシメチル化パターンを同定するステップ。

実施形態の別の局面において、親和性タグはビオチンで構成され、ステップ（ａ）は、ビオチンによる５－ヒドロキシメチルシトシン残基の選択的標識を含む。関連する局面において、ステップ（ｂ）は、ビオチン化ＤＮＡを支持体結合ストレプトアビジンと接触させることを含む。

実施形態の別の局面において、親和性タグは、所定の配列を有する選択されたオリゴヌクレオチドで構成され、ステップ（ａ）は、オリゴヌクレオチドによる５－ヒドロキシメチルシトシン残基の選択的標識を含む。関連する局面において、ステップ（ｂ）は、オリゴヌクレオチド標識ＤＮＡを、所定の配列に実質的に相補的な配列を含む支持体結合オリゴヌクレオチドと接触させることを含む。

実施形態の追加の局面において、ステップ（ｃ）は、酵素的に、例えば、Ｔｅｎ－ＥｌｅｖｅｎＴｒａｎｓｌｏｃａｔｉｏｎ（ＴＥＴ）酵素を使用して実行される。

実施形態のさらなる局面において、セルフリーＤＮＡ試料は、少なくとも１つの５－メチルシトシン残基および少なくとも１つの５－ヒドロキシメチルシトシン残基を有する少なくとも１つのＤＮＡ鎖を含む。

追加の局面において、前記方法は、ステップ（ｅ）の前に、複数の二本鎖ＤＮＡ断片のそれぞれに少なくとも１つの配列バーコードを取り付けることをさらに含む。関連する局面において、少なくとも１つの配列バーコードは、ＤＮＡ断片が受けるプロセスに対応するＤＮＡ断片の特徴を示す個々のバーコードを含む。

別の実施形態において、本発明は、セルフリーＤＮＡ中の５－メチルシトシン残基および５－ヒドロキシメチルシトシン残基をジヒドロウラシル残基に変換するためのキットを提供し、上記キットは、５－メチルシトシンおよび５－ヒドロキシメチルシトシン残基を酸化して、酸化５－メチルシトシン残基を提供するための試薬、ならびに酸化５－メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化に有効な有機ボランをを含む。

さらなる実施形態において、本発明は、セルフリーＤＮＡ試料中の５－メチルシトシン残基を同定するためのキットを提供し、上記キットは、５－ヒドロキシメチルシトシン残基を修飾し、その上に親和性タグを提供する；修飾５－ヒドロキシメチルシトシン残基を試料から取り除く；未修飾５－メチルシトシン残基を酸化し、酸化５－メチルシトシン残基を提供する；ならびに酸化５－メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかに有効な有機ボランのための個々の試薬組成物を含む。
本発明は、例えば、以下の項目を提供する。
（項目１）
セルフリーＤＮＡ中の酸化５－メチルシトシン残基をジヒドロウラシル残基に変換する方法であって、５－カルボキシシトシン、５－ホルミルシトシン、およびそれらの組み合わせから選択される少なくとも１つの酸化５－メチルシトシン残基を含むセルフリーＤＮＡを、前記少なくとも１つの酸化５－メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかを行うのに有効な有機ボランと接触させ、、それによりその代わりにジヒドロウラシル残基を提供することを含む方法。
（項目２）
前記少なくとも１つの酸化５－メチルシトシン残基が、５－カルボキシシトシンを含む、項目１記載の方法。
（項目３）
前記少なくとも１つの酸化５－メチルシトシン残基が、５－ホルミルシトシンを含む、項目１記載の方法。
（項目４）
前記少なくとも１つの酸化５－メチルシトシン残基が、５－カルボキシシトシンおよび５－ホルミルシトシンの組み合わせを含む、項目１に記載の方法。
（項目５）
前記有機ボランが、ボランと、窒素複素環および第３級アミンから選択される窒素含有化合物との錯体を含む、項目１から４のいずれか一項に記載の方法。
（項目６）
前記有機ボランが、ボランと窒素複素環との錯体を含む、項目５に記載の方法。
（項目７）
前記窒素複素環が、１～４個の低級アルキル基で必要に応じて置換されたピリジンを含む、項目６に記載の方法。
（項目８）
前記窒素複素環が、ピリジン、２－メチルピリジン、または５－エチル－２－メチルピリジンを含む、項目７記載の方法。
（項目９）
前記窒素複素環が、２－メチルピリジンを含み、前記有機ボランが２－ピコリンボランである、項目８記載の方法。
（項目１０）
前記有機ボランが、ボランと第３級アミンとの錯体を含む、項目５に記載の方法。
（項目１１）
前記第３級アミンが、トリエチルアミンおよびトリ（ｔ－ブチル）アミンから選択される、項目１０に記載の方法。
（項目１２）
還元、脱アミノ化、および脱炭酸が、いかなる中間体を単離することなく行われる、項目１記載の方法。
（項目１３）
前記方法が、バイサルファイトの非存在下で行われる、項目１記載の方法。
（項目１４）
（ａ）５－カルボキシシトシン、５－ホルミルシトシン、およびそれらの組み合わせから選択される少なくとも１つの酸化５－メチルシトシン残基を含むセルフリーＤＮＡの試料；ならびに
（ｂ）前記少なくとも１つの酸化５－メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかを行うのに有効な有機ボラン
を含む反応混合物。
（項目１５）
前記少なくとも１つの酸化５－メチルシトシン残基が、５－カルボキシシトシンを含む、項目１４に記載の混合物。
（項目１６）
前記少なくとも１つの酸化５－メチルシトシン残基が、５－ホルミルシトシンを含む、項目１４に記載の混合物。
（項目１７）
前記少なくとも１つの酸化５－メチルシトシン残基が、５－カルボキシシトシンと５－ホルミルシトシンとの組み合わせを含む、項目１４に記載の混合物。
（項目１８）
前記有機ボランが、ボランと、窒素複素環および第３級アミンから選択される窒素含有化合物との錯体を含む、項目１５から１７のいずれか一項に記載の混合物。
（項目１９）
前記有機ボランが、ボランと窒素複素環との錯体を含む、項目１８に記載の混合物。
（項目２０）
前記窒素複素環が、１～４個の低級アルキル基で必要に応じて置換されたピリジンを含む、項目１９に記載の混合物。
（項目２１）
前記窒素複素環が、ピリジン、２－メチルピリジン、または５－エチル－２－メチルピリジンを含む、項目２０記載の混合物。
（項目２２）
前記窒素複素環が、２－メチルピリジンを含み、前記有機ボランが、２－ピコリンボランである、項目２１に記載の混合物。
（項目２３）
前記有機ボランが、ボランと第３級アミンとの錯体を含む、項目１８に記載の混合物。
（項目２４）
前記第３級アミンが、トリエチルアミンおよびトリ（ｔ－ブチル）アミンから選択される、項目２３に記載の混合物。
（項目２５）
前記混合物がバイサルファイトを実質的に含まない、項目１４に記載の混合物。
（項目２６）
セルフリーＤＮＡ中の５－メチルシトシン残基の存在および位置を検出するための方法であって、前記方法が：
（ａ）断片化されたアダプターライゲーションセルフリーＤＮＡ中の５－ヒドロキシメチルシトシン残基を修飾し、その上に親和性タグを提供するステップであって、ここで前記親和性タグにより前記セルフリーＤＮＡから修飾５－ヒドロキシメチルシトシン含有ＤＮＡを除去できるステップ；
（ｂ）前記セルフリーＤＮＡから前記修飾５－ヒドロキシメチルシトシン含有ＤＮＡを除去し、未修飾５－メチルシトシン残基を含むＤＮＡを残すステップ；
（ｃ）前記未修飾５－メチルシトシン残基を酸化し、酸化５－メチルシトシン残基を含むＤＮＡを得るステップ；
（ｄ）前記酸化５－メチルシトシン残基を含むＤＮＡを、前記酸化５－メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかを行うのに有効な有機ボランと接触させ、それにより、前記酸化５－メチルシトシン残基の代わりにジヒドロウラシル残基を含むＤＮＡを提供するステップ；
（ｅ）前記ジヒドロウラシル残基を含むＤＮＡを増幅および配列決定するステップ；
（ｆ）（ｅ）中の前記配列決定の結果から５－メチル化パターンを決定するステップ
を含む、方法。
（項目２７）
（ｇ）ステップ（ｂ）で前記セルフリーＤＮＡ試料から除去された５－ヒドロキシメチルシトシン含有ＤＮＡにおけるヒドロキシメチル化パターンを特定するステップ、
をさらに含む、項目２６に記載の方法：
（項目２８）
ステップ（ａ）から（ｄ）が、バイサルファイトの非存在下で行われる、項目２６または項目２７に記載の方法。
（項目２９）
ステップ（ａ）から（ｄ）が、いかなる中間体を単離することなく行われる、項目２６または項目２７に記載の方法。
（項目３０）
前記親和性タグがビオチンを含み、ステップ（ａ）がビオチンでの５－ヒドロキシメチルシトシン残基の選択的標識を含む、項目２６または項目２７に記載の方法。
（項目３１）
ステップ（ｂ）が前記ビオチン化ＤＮＡを支持体結合ストレプトアビジンと接触させることを含む、項目３０に記載の方法。
（項目３２）
ステップ（ｃ）が酵素的に行われる、項目２６または項目２７に記載の方法。
（項目３３）
ステップ（ｃ）がＴｅｎ－ＥｌｅｖｅｎＴｒａｎｓｌｏｃａｔｉｏｎ（ＴＥＴ）酵素を使用して行われる、項目３２に記載の方法。
（項目３４）
ステップ（ｃ）が化学的に行われる、項目２６または項目２７に記載の方法。
（項目３５）
前記セルフリーＤＮＡが、セルフリーＤＮＡの選択された領域を含む、項目１に記載の方法。
（項目３６）
前記セルフリーＤＮＡ試料が、セルフリーＤＮＡの選択された領域を含む、項目２６または項目２７に記載の方法。
（項目３７）
前記アダプターライゲーションＤＮＡ断片が、試料識別子配列、断片識別子配列、および鎖識別子配列から選択される少なくとも１つの分子バーコードを含むアダプターを含む、項目２６または２７に記載の方法。
（項目３８）
ステップ（ｅ）において、プロセス識別子配列を含む分子バーコードが、前記ＤＨＵ含有ＤＮＡに付加される、項目２６または項目２７に記載の方法。
（項目３９）
前記セルフリーＤＮＡが、二本鎖ＤＮＡを含む、項目２６または項目２７に記載の方法。
（項目４０）
前記セルフリーＤＮＡが、一本鎖ＤＮＡを含む、項目２６または項目２７に記載の方法。
（項目４１）
前記親和性タグが、所定の配列を有する選択されたオリゴヌクレオチドタグで構成されており、ステップ（ａ）が、前記オリゴヌクレオチドタグによる５－ヒドロキシメチルシトシン残基の選択的標識を含む、項目２６または項目２７に記載の方法。
（項目４２）
ステップ（ｂ）が、オリゴヌクレオチドタグ付きＤＮＡを、前記所定の配列に実質的に相補的な配列を含む支持体結合オリゴヌクレオチドと接触させることを含む、項目４１に記載の方法。
（項目４３）
前記アダプターライゲーションＤＮＡ断片が、断片識別子配列および鎖識別子配列の両方を含む、項目３７に記載の方法。
（項目４４）
処理された鎖における前記断片識別子配列および前記鎖識別子配列を分析して、鋳型ＤＮＡ断片が完全に修飾またはヘミ修飾されているかを決定することをさらに含む、項目４３に記載の方法。
（項目４５）
セルフリーＤＮＡの５－メチルシトシン残基をジヒドロウラシル残基に変換するためのキットであって、前記５－ヒドロキシメチルシトシン残基をブロックするためのブロッキング試薬組成物、ヒドロキシメチル化を超えて前記５－メチルシトシン残基を酸化して酸化５－メチルシトシン残基を提供する酸化試薬、および前記酸化５－メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかを行うのに有効な有機ボランを含む、キット。
（項目４６）
セルフリーＤＮＡ試料中の５－メチルシトシン残基を同定するためのキットであって、５－ヒドロキシメチルシトシン残基を修飾してその上に親和性タグを提供し、前記試料から前記修飾５－ヒドロキシメチルシトシン残基を除去し、ヒドロキシメチル化を超えて未修飾５－メチルシトシン残基を酸化して酸化５－メチルシトシン残基を提供するための個々の試薬組成物、ならびに前記酸化５－メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかを行うのに有効な有機ボランを含む、キット。
（項目４７）
セルフリーＤＮＡ中の５－メチルシトシン残基および５－ヒドロキシメチルシトシン残基の存在および位置を検出する方法であって、前記方法が、
（ａ）断片化された、アダプターライゲーションセルフリーＤＮＡの５－ヒドロキシメチルシトシン残基をビオチン化して、ビオチン化５－ヒドロキシメチルシトシン含有ＤＮＡ断片の最初の群を形成するステップ；
（ｂ）前記セルフリーＤＮＡからビオチン化５－ヒドロキシメチルシトシン含有ＤＮＡ断片の最初の群を除去し、未修飾ＤＮＡと未修飾５－メチルシトシン残基を含むＤＮＡ断片とを残すステップ；
（ｃ）未修飾５－メチルシトシン断片を含むＤＮＡ断片を酸化して、それの代わりに５－ヒドロキシメチルシトシン残基を提供し、その後ビオチン化して、ビオチン化５－ヒドロキシメチルシトシン含有ＤＮＡ断片の第２の群を提供するステップ；
（ｄ）ビオチン化５－ヒドロキシメチルシトシン含有ＤＮＡ断片の第２の群を除去するステップ；ならびに
（ｅ）前記最初の群のＤＮＡ断片および第２の群のＤＮＡ断片をプールし、増幅し、配列決定するステップ、
を含む方法。
（項目４８）
（ｆ）ステップ（ｅ）の前記結果から、５－メチル化パターン、５－ヒドロキシメチル化パターン、または５－メチル化パターンおよび５－ヒドロキシメチル化パターンの両方を決定することをさらに含む、項目４６に記載の方法。
（項目４９）
セルフリーＤＮＡの単一のＤＮＡ鎖における５－メチルシトシンと５－ヒドロキシメチルシトシンとの共起を同定する方法であって、
（ａ）断片化された、アダプターライゲーションセルフリーＤＮＡ中の５－ヒドロキシメチル残基を、前記セルフリーＤＮＡからタグ付きＤＮＡ断片を選択的に除去できる親和性タグで官能基化するステップ；
（ｂ）前記除去されたタグ付きＤＮＡ断片を酸化して、その結果、未修飾５－メチルシトシン残基が、５－ホルミルシトシン、５－カルボキシシトシン残基、またはそれらの組み合わせから選択される酸化５－メチルシトシン残基に変換されるステップ；
（ｃ）（ｂ）の前記酸化タグ付きＤＮＡ断片を、前記酸化５－メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかを行うのに有効な有機ボランと接触させ、それにより、前記酸化５－メチルシトシン残基の代わりにジヒドロウラシル残基を含むＤＮＡを提供するステップ；ならびに
（ｄ）ジヒドロウラシル残基を含む前記ＤＮＡを増幅し、配列決定するステップ、
を含む、方法。
（項目５０）
ＤＮＡ試料中の５－メチルシトシン残基および５－ヒドロキシメチルシトシン残基の存在および位置を検出するための方法であって、前記方法が、
（ａ）前記ＤＮＡ試料からのタグ付き５－ヒドロキシメチルシトシン含有ＤＮＡの選択的除去を可能にする親和性タグを使用して、前記ＤＮＡ試料内の５－ヒドロキシメチルシトシン残基を官能化するステップ；
（ｂ）前記タグ付きＤＮＡ断片を前記ＤＮＡ試料から除去し、未修飾ＤＮＡおよび未修飾５－メチルシトシン残基を含むＤＮＡを残すステップ；
（ｃ）前記５－メチルシトシン残基を修飾して、前記５－メチルシトシン含有ＤＮＡの選択的除去を可能にするステップ；
（ｄ）前記修飾５－メチルシトシン含有ＤＮＡを除去するステップ；ならびに
（ｅ）前記タグ付き５－ヒドロキシメチル含有ＤＮＡおよび前記修飾５－メチルシトシン含有ＤＮＡにプロセス識別子配列を追加するステップであって、ここで各プロセス識別子配列が、前記タグ付きＤＮＡおよび前記修飾ＤＮＡを識別および／または分離するために使用されるプロセスを識別するステップ。
（項目５１）
前記ＤＮＡ試料が、セルフリーＤＮＡを含む、項目５０に記載の方法。
（項目５２）
前記セルフリーＤＮＡが、試料識別子配列、断片識別子配列、および鎖識別子配列から選択される分子バーコードを含む少なくとも１つのアダプターとアダプターライゲーションされる、項目５１に記載の方法。

図１は、２－ピコリンボランと５－カルボキシシトシンとの仮定の反応産物を概略的に示す。

図２は、５－カルボキシシトシン（上）および５－カルボキシシトシンと２－ピコリンボランの反応産物の質量スペクトルを提供する。

図３は、５－カルボキシシトシンと２－メチルピリミジンとの反応産物のジヒドロウラシルとの同一性を確認する追加のスペクトルを提供する。図３は、５－カルボキシシトシンと２－メチルピリミジンとの反応産物のジヒドロウラシルとの同一性を確認する追加のスペクトルを提供する。図３は、５－カルボキシシトシンと２－メチルピリミジンとの反応産物のジヒドロウラシルとの同一性を確認する追加のスペクトルを提供する。

図４は、２－ピコリンボランボランとの反応による５－カルボキシシトシンのジヒドロウラシルへの変換に関与する可能性のある反応メカニズムを概略的に示す。

図５は、２－ピコリンボランボランとの反応による５－ホルミルシトシンのジヒドロウラシルへの変換に関与する可能性のある反応メカニズムを概略的に示す。

図６および７は、２－ピコリンボランとの反応の前および後の両方で、５位でホルミル、カルボキシル、エチルアミド、およびエトキシイミノで置換されたシトシンの質量スペクトルを提供する。図６および７は、２－ピコリンボランとの反応の前および後の両方で、５位でホルミル、カルボキシル、エチルアミド、およびエトキシイミノで置換されたシトシンの質量スペクトルを提供する。図６および７は、２－ピコリンボランとの反応の前および後の両方で、５位でホルミル、カルボキシル、エチルアミド、およびエトキシイミノで置換されたシトシンの質量スペクトルを提供する。図６および７は、２－ピコリンボランとの反応の前および後の両方で、５位でホルミル、カルボキシル、エチルアミド、およびエトキシイミノで置換されたシトシンの質量スペクトルを提供する。

図８は、酵素酸化剤、随意のブロッキング基、および有機ボラン２－メチルピリミジンボランを使用して、５－メチルシトシンおよび５－ヒドロキシメチルシトシンをジヒドロウラシルに段階的に変換する方法を概略的に示す。図８は、酵素酸化剤、随意のブロッキング基、および有機ボラン２－メチルピリミジンボランを使用して、５－メチルシトシンおよび５－ヒドロキシメチルシトシンをジヒドロウラシルに段階的に変換する方法を概略的に示す。

図９は、化学的酸化剤を使用して５－ヒドロキシメチルシトシンをジヒドロウラシルに段階的に変換し、続いて有機ボラン２－メチルピリミジンボランと反応させるための化学的方法を概略的に示す。

図１０は、２－ピコリンボランとの反応前後の５－メチルシトシン、５－ヒドロキシメチルシトシン、および５－グルコメチルシトシンの質量スペクトルを示す。図１０は、２－ピコリンボランとの反応前後の５－メチルシトシン、５－ヒドロキシメチルシトシン、および５－グルコメチルシトシンの質量スペクトルを示す。図１０は、２－ピコリンボランとの反応前後の５－メチルシトシン、５－ヒドロキシメチルシトシン、および５－グルコメチルシトシンの質量スペクトルを示す。

図１１は、セルフリーＤＮＡ断片中の５ｍＣ残基の存在および位置を検出するための方法の一実施形態を概略的に示す。

図１２は、本発明に従って解析されたＤＮＡ断片に分子バーコードを組み込むためのハイブリッドアダプター法の最初の３つのステップを概略的に示す。

図１３は、図１２のハイブリッドアダプタ－法の残りのステップを概略的に示す。

図１４は、試料識別子配列、断片識別子配列、および鎖識別子配列のうちの少なくとも１つで既にバーコード化されているＤＮＡ断片にプロセスバーコードを組み込むための方法を概略的に示す。

図１５は、本発明の「二重ビオチン」濃縮方法を概略的に示す。

図１６は、本発明の「ビオチン／天然５ｍＣ」濃縮方法を概略的に示す。

図１７は、少なくとも１つの鎖が５ｍＣおよび５ｈｍＣ残基の両方を含む、ＤＮＡ断片を同定するための方法を概略的に示す。

図１８は、図１７の方法の拡張を概略的に示す。ここで、未修飾のＤＮＡ断片および５ｍＣ含有ＤＮＡ断片を含む、残りのＤＮＡ断片を解析する。

図１９は、オリゴヌクレオチドが親和性タグとして使用される本発明の方法を概略的に示す。

（発明の詳細な説明）
１．定義および用語：

他に定義されない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が関係する当業者によって一般に理解される意味を有する。本発明の説明に特に重要な特定の用語を以下に定義する。他の関連する用語は、Ｑｕａｋｅらの国際特許公開番ＷＯ２０１７／１７６６３０「ＮｏｎｉｎｖａｓｉｖｅＤｉａｇｎｏｓｔｉｃｓｂｙＳｅｑｕｅｎｃｉｎｇ５－ＨｙｄｒｏｘｙｍｅｔｈｙｌａｔｅｄＣｅｌｌ－ＦｒｅｅＤＮＡ．」で定義される。

本明細書および添付の特許請求の範囲において、単数形「ａ」、「ａｎ」、および「ｔｈｅ」は、文脈が明らかに他に指示しない限り、複数の指示対象を含む。したがって、例えば、「構成要素」は、単一の構成要素だけでなく、２つ以上の異なる構成要素の組み合わせなども指す。

数値範囲は、範囲を定義する数を含む。他に明記しない限り、核酸は左から右に５’から３’の向きで書かれる；アミノ酸配列は、左から右にアミノからカルボキシの向きでそれぞれ書かれる。

本明細書で提供される表題は、本発明の様々な局面または実施形態を限定するものではない。したがって、すぐに以下に定義される用語は、明細書全体を参照することにより、より完全に定義される。

他に定義しない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が属する当業者によって一般に理解されるのと同じ意味を有する。Ｓｉｎｇｌｅｔｏｎら、ＤｉｃｔｉｏｎａｒｙｏｆＭｉｃｒｏｂｉｏｌｏｇｙａｎｄＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ、第２版（ＮｅｗＹｏｒｋ：ＪｏｈｎＷｉｌｅｙａｎｄＳｏｎｓ，１９９４）、およびＨａｌｅ＆Ｍａｒｋｈａｍ、ＴｈｅＨａｒｐｅｒＣｏｌｌｉｎｓＤｉｃｔｉｏｎａｒｙｏｆＢｉｏｌｏｇｙ（ＮｅｗＹｏｒｋ：ＨａｒｐｅｒＰｅｒｅｎｎｉａｌ，１９９１）は、当業者に、本明細書で使用される用語の多くの一般的な意味を提供する。それでも、参照の明確さおよび容易さのために、特定の用語が以下に定義される。

本明細書で使用される用語「試料」は、必ずしもそうではないが、典型的には液体形態で、対象となる１つ以上の分析物を含む材料または材料の混合物に関する。

本明細書で使用される用語「核酸試料」は、少なくとも１つの核酸を含む試料を示す。本明細書で使用される核酸試料は、それらが核酸配列を含む複数の異なる分子を含み得るという点で複合体であり得る。哺乳類（例えば、マウスまたはヒト）由来のゲノムＤＮＡは、複合試料の一種である。複合試料は、少なくとも１０，０００、少なくとも１００，０００、少なくとも１０^６、少なくとも１０^７、少なくとも１０^８または少なくとも１０^９またはそれ以上の異なる核酸分子を有し得る。ＤＮＡ標的は、ゲノムＤＮＡ、または人工ＤＮＡコンストラクトなどの任意の供給源に由来し得る。本明細書では、核酸を含む任意の試料、例えば、組織培養細胞または組織の試料から作製されたゲノムＤＮＡを使用することができる。核酸試料は、歯、骨、毛髪または骨などの試料を含む、任意の適切な供給源から作製することができる。

用語「ヌクレオチド」は、公知のプリンおよびピリミジン塩基だけでなく、修飾された他の複素環式塩基も含む部分を含むことを意図している。そのような修飾には、メチル化プリンもしくはピリミジン、アシル化プリンもしくはピリミジン、アルキル化リボースまたは他の複素環が含まれる。さらに、用語「ヌクレオチド」は、ハプテンまたは蛍光標識を含み、従来のリボース糖およびデオキシリボース糖だけでなく、他の糖も含み得る部分を含む。修飾ヌクレオシドまたはヌクレオチドは、糖部分の修飾も含み、ここで、例えば、１つ以上のヒドロキシル基がハロゲン原子または脂肪族基で置き換えられているか、またはエーテル、アミンなどとして官能基を持たせている。

用語「核酸」および「ポリヌクレオチド」は、本明細書では互換的に使用され、例えばデオキシリボヌクレオチドまたはリボヌクレオチドで構成される、任意の長さ、例えば、約２塩基超、約１０塩基超、約１００塩基超、約５００塩基超、１０００塩基超、最大で約１０，０００塩基、またはそれより多くの塩基のポリマーを記載し、酵素的または合成的に生成することができる（例えば、Ｈｏｎｋａｎｅｎらの米国特許第５，９４８，９０２号およびそこに引用されている参考文献に記載のＰＮＡ）、これは、２つの天然に存在する核酸と類似した配列特異的な方法で天然に存在する核酸とハイブリダイズすることができ、例えば、ワトソン－クリック塩基対相互作用に参加することができる。天然に存在するヌクレオチドには、グアニン、シトシン、アデニンおよびチミン（それぞれＧ、Ｃ、ＡおよびＴ）を含む。ＤＮＡおよびＲＮＡは、それぞれデオキシリボース糖主鎖およびリボース糖主鎖を有するが、ＰＮＡの主鎖はペプチド結合で連結された繰り返しのＮ－（２－アミノエチル）－グリシン単位で構成される。ＰＮＡにおいて、さまざまなプリンおよびピリミジン塩基が、メチレンカルボニル結合によって主鎖に結合されている。ロックされた核酸（ＬＮＡ）は、隔絶されたＲＮＡとも呼ばれ、修飾ＲＮＡヌクレオチドである。ＬＮＡヌクレオチドのリボース部分は、２’酸素と４’炭素とを接続する追加のブリッジで修飾される。ブリッジは、リボースを３’－ｅｎｄｏ（Ｎｏｒｔｈ）構造で「ロック」し、これは、Ａ型二本鎖でよく見られる。ＬＮＡヌクレオチドは、必要に応じてオリゴヌクレオチドのＤＮＡまたはＲＮＡ残基と混合できる。用語「非構造化核酸、」または「ＵＮＡ」は、安定性が低下して互いに結合する非天然ヌクレオチドを含む核酸である。

例えば、非構造化核酸は、Ｇ’残基およびＣ’残基を含み得、ここでこれらの残基は、天然に存在しない形態、すなわち、安定性が低下して互いに塩基対を形成するＧおよびＣの類似体に対応する。しかし、それぞれ天然に存在するＣおよびＧ残基と塩基対を形成する能力を保持する。非構造化核酸は、Ｂａｒｒｅｔｔらの米国特許公開番号ＵＳ２００５／０２３３３４０に記載されている。この定義において、ＺＮＡ、つまりｚｉｐ核酸も含まれる。

本明細書で使用される用語「オリゴヌクレオチド」は、長さが約２～２００ヌクレオチド、５００ヌクレオチドまでのヌクレオチドの一本鎖多量体を示す。

オリゴヌクレオチドは、合成的であってもよく、または酵素的に作製されてもよく、いくつかの実施形態において、長さが３０～１５０ヌクレオチドである。オリゴヌクレオチドは、リボヌクレオチドモノマー（すなわち、オリゴリボヌクレオチドであり得る）および／またはデオキシリボヌクレオチドモノマーを含み得る。オリゴヌクレオチドは、例えば、長さが１０～２０、２１～３０、３１～４０、４１～５０、５１～６０、６１～７０、７１～８０、８０～１００、１００～１５０または１５０～２００ヌクレオチドであり得る。

用語「ハイブリダイゼーション」は、当該分野で知られているように、核酸の鎖が塩基対形成を介して相補鎖と結合するプロセスを指す。中程度から高度のストリンジェンシーのハイブリダイゼーションおよび洗浄条件下で２つの配列が特異的に互いにハイブリダイズする場合、核酸は参照核酸配列に「選択的にハイブリダイズ可能」であると見なされる。中程度および高度のストリンジェンシーのハイブリダイゼーション条件が知られている（例えば、Ａｕｓｕｂｅｌ，ｅｔａｌ．，ＳｈｏｒｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，３ｒｄｅｄ．，Ｗｉｌｅｙ＆Ｓｏｎｓ１９９５およびＳａｍｂｒｏｏｋｅｔａｌ．，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，ＴｈｉｒｄＥｄｉｔｉｏｎ，２００１ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ，Ｎ．Ｙ．を参照）。高度のストリンジェンシー条件の一例は、５０％ホルムアミド、５ＸＳＳＣ、５Ｘデンハルト溶液、０．５％ＳＤＳ、１００μｇ／ｍｌ変性キャリアＤＮＡでの約４２℃でのハイブリダイゼーション、それに続く２ＸＳＳＣおよび０．５％ＳＤＳでの室温での２回、ならびに０．１ＸＳＳＣおよび０．５％ＳＤＳでの４２°Ｃでのさらに２回の洗浄を含む。

用語「プライマー」は、ポリヌクレオチド鋳型と二本鎖を形成すると、核酸合成の開始点として作用し、鋳型に沿ってその３’末端から伸長することができ、その結果伸長２本鎖が形成される、天然または合成いずれかのオリゴヌクレオチドを指す。伸長プロセス中に付加されるヌクレオチドの配列は、鋳型ポリヌクレオチドの配列によって決定される。通常、プライマーは、ＤＮＡポリメラーゼによって伸長される。プライマーは一般に、プライマー伸長産物の合成におけるそれらの使用に適合する長さであり、通常、１０～７５、１５～６０、１５～４０、１８～３０、２０～４０、２１～５０、２２～４５、２５～４０など、長さが８～１００ヌクレオチドの範囲である。典型的なプライマーは、１５～４５、１８～４０、２０～３０、２１～２５など、１０～５０ヌクレオチド長の間の範囲、および指定された範囲の間の任意の長さであり得る。いくつかの実施形態において、プライマーは通常、長さが約１０、１２、１５、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３５、４０、４５、５０、５５、６０、６５、または７０ヌクレオチド以下である。

用語「二本鎖」および「二本鎖の」という用語は、本明細書では互換的に使用され、塩基対形成している、すなわち一緒にハイブリダイズしている２つの相補的ポリヌクレオチドを説明する。

用語「決定する」、「測定する」、「評価する」、「査定する」、「分析する」、および「解析する」は、本明細書において互換的に使用され、測定の任意の形態を指し、要素が存在するまたはしないかどうかの決定を含む。これらの用語は、定量的および／または定性的な決定の両方が含まれる。査定は、相対的または絶対的であり得る。したがって、「存在の査定」は、存在する部分の量を決定すること、ならびにそれが存在するかまたは存在しないかを決定することを含む。

用語「使用する」は、その従来の意味を有し、そのような意味では、目的を達成するために方法または組成物を用いること（employing）、例えば、使用すること（putting into service）を意味する。たとえば、プログラムを使用してファイルを作成すると、プログラムが実行されてファイルが作成され、通常、ファイルはプログラムの出力である。別の実施例において、コンピュータファイルが使用される場合、通常、ファイルにアクセスし、読み取り、ファイルに格納されている情報を使用して目的を達成する。同様に、特有の識別子、例えば、バーコードが使用される場合、通常、特有の識別子は、たとえば、特有の識別子に関連付けられた対象またはファイルを識別するために読み取られる。

本明細書で使用される用語「ライゲーション」は、第１のＤＮＡ分子の５’末端の末端ヌクレオチドと第２のＤＮＡ分子の３’末端の末端ヌクレオチドとの酵素的に触媒された結合を指す；相補鎖も結合することができる；例えば３’～５’；または二本鎖ＤＮＡの場合のように一緒に。

「複数」は、少なくとも２つのメンバーを含む。特定の場合において、複数は、少なくとも１０、少なくとも１００、少なくとも１０，０００、少なくとも１００，０００、少なくとも１０^６、少なくとも１０^７、少なくとも１０^８または少なくとも１０^９あるいはそれより多くのメンバーを有し得る。

２つの核酸が「相補的」である場合、核酸の一方の各塩基は、他の核酸中の対応するヌクレオチドと塩基対を形成する。２つの核酸は、互いにハイブリダイズするために完全に相補的である必要はない。

本明細書で使用される用語「分離する」は、２つの要素の物理的分離（例えば、サイズまたは親和性などによる）ならびに１つの要素の分解を指し、他の要素はそのままにしておく。

本明細書で使用される用語「配列決定」は、ポリヌクレオチドの少なくとも１０個の連続したヌクレオチドの同一性（例えば、少なくとも２０、少なくとも５０、少なくとも１００または少なくとも２００以上の連続したヌクレオチドの同一性）が得られる方法を指す。

本明細書で使用される用語「次世代シーケンシング」または「ハイスループットシーケンシング」は、イルミナ、ライフテクノロジーズ、およびロシュなどによって現在用いられている、いわゆる並列化されたｓｅｑｕｅｎｃｉｎｇ－ｂｙ－ｓｙｎｔｈｅｓｉｓまたはｓｅｑｕｅｎｃｉｎｇ－ｂｙ－ｌｉｇａｔｉｏｎプラットフォームを指す。次世代シーケンシング法には、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓが商品化したようなナノポアシーケンシング法、ライフテクノロジーズが商品化したＩｏｎＴｏｒｒｅｎｔテクノロジーなどの電子検出法、およびＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓが商品化したような単一分子蛍光ベースの方法も含まれ得る。

用語「アダプター」は、二本鎖ＤＮＡ分子の両方の鎖にライゲーション可能である核酸を指す。一実施形態において、アダプターはヘアピンアダプターであり得る（すなわち、それ自体と塩基対を形成して、二本鎖ステムおよびループを有する構造を形成する１つの分子であり得、ここで分子の３’および５’末端は、二本鎖ＤＮＡ分子のそれぞれ５’および３’末端に結合する）。別の実施形態において、アダプターはＹアダプターであり得る。別の実施形態において、アダプター自体が、互いに塩基対を形成する２つの別個のオリゴヌクレオチド分子で構成され得る。明らかであるように、アダプターのライゲーション可能な末端は、制限酵素による切断によって作製されるオーバーハングと適合するように設計され得るか、または平滑末端または５’Ｔオーバーハングを有し得る。用語「アダプター」は、二本鎖および一本鎖の分子を指す。アダプターは、ＤＮＡもしくはＲＮＡ、またはその２つの混合物であり得る。ＲＮＡを含むアダプターは、ＲＮａｓｅ処理によるまたはアルカリ加水分解により切断可能であり得る。アダプターは、１５～１００塩基、例えば、５０～７０塩基であり得るが、この範囲外のアダプターが想定される。

本明細書で使用される用語「アダプターがライゲーションされた」は、アダプターにライゲーションされている核酸を指す。アダプターは、核酸分子の５’末端および／または３’末端にライゲーションすることができる。本明細書で使用する場合、用語「アダプター配列を付加する」は、試料中の断片の末端にアダプター配列を付加する行為を指す。これは、ポリメラーゼを使用して断片の末端を埋め、Ａテールを付加し、次にＴオーバーハングを含むアダプターをＡテール付加された断片にライゲーションすることによって行うことができる。

本明細書で使用される用語「非対称アダプター」は、二本鎖核酸断片の両末端にライゲーションする際、３’末端のタグ配列と同じでも相補的でもない５’タグ配列を含むトップ鎖をもたらすアダプターを指す。非対称アダプターの例は、Ｗｅｉｓｓｍａｎらの米国特許第５，７１２，１２６号および６，３７２，４３４号、ならびにＢｉｇｎｅｌｌらの国際特許公開番号ＷＯ２００９／０３２１６７に記載されている。非対称的にタグ付けされた断片は、２つのプライマーによって増幅できる：この２つのプライマーは、鎖の３’末端に付加された第１のタグ配列にハイブリダイズする第１のプライマー；および鎖の５’末端に付加された第２のタグ配列の相補体にハイブリダイズする第２のプライマーである。Ｙアダプターおよびヘアピンアダプター（ライゲーション後、切断して「Ｙアダプター」を生成できる）は、非対称アダプターの例である。

用語「Ｙアダプター」は、対立する配列が相補的ではない二本鎖領域および一本鎖領域を含むアダプターを指す。二本鎖領域の末端は、例えば、ライゲーションまたはトランスポザーゼ触媒反応により、ゲノムＤＮＡの二本鎖断片などの標的分子に結合することができる。Ｙアダプターにライゲーションされたアダプタータグ付きの二本鎖ＤＮＡの各鎖は、一方の末端にＹアダプターの一方の鎖、およびもう一方の末端にＹアダプターのもう一方の鎖の配列があるという点で非対称的にタグ付けされる。両末端でＹアダプターに結合されている核酸分子の増幅により、非対称的にタグ付けされた核酸、つまり、１つのタグ配列を含む５’末端および別のタグ配列を有する３’末端を持つ核酸が生成される。

用語「ヘアピンアダプター」は、ヘアピンの形態であるアダプターを指す。一実施形態において、ライゲーション後、ヘアピンループを切断して、末端に非相補的タグを有する鎖を生成することができる。いくつかの場合において、ヘアピンアダプターのループはウラシル残基を含み得、前記ループは、ウラシルＤＮＡグリコシラーゼおよびエンドヌクレアーゼＶＩＩＩを使用して切断できるが、他の方法も公知である。

本明細書で使用される用語「アダプターがライゲーションされた試料」は、アダプターにライゲーションされている試料を指す。上記の定義からわかるように、非対称アダプターにライゲーションされている試料には、５’および３’末端に非相補的な配列を持つ鎖を含む。

「オリゴヌクレオチド結合部位」は、オリゴヌクレオチドが標的ポリヌクレオチドにおいてハイブリダイズする部位を指す。オリゴヌクレオチドがプライマーの結合部位を「提供する」場合、その時プライマーはそのオリゴヌクレオチドまたはその相補物にハイブリダイズし得る。

本明細書で使用される用語「鎖」は、共有結合、例えば、ホスホジエステル結合によって一緒に共有結合的に結合したヌクレオチドから構成される核酸の一本鎖を指す。細胞内では、ＤＮＡは通常２本鎖の形態で存在し、そのため、本明細書で「トップ」および「ボトム」鎖と呼ばれる核酸の２つの相補鎖を有する。特定の場合において、染色体領域の相補鎖は、「プラス」および「マイナス」鎖、「ポジティブ」および「ネガティブ」鎖、「第１」および「第２」鎖、「コーディング」および「非コーディング」鎖、「ワトソン」および「クリック」鎖、または「センス」および「アンチセンス」鎖と呼ばれ得る。トップまたはボトム鎖としての鎖の割り当ては任意であり、特定の方向、機能、または構造を意味するものではない。いくつかの例示的な哺乳動物染色体領域（例えば、ＢＡＣ、集合体、染色体など）の第１鎖のヌクレオチド配列は公知であり、例えば、ＮＣＢＩのＧｅｎｂａｎｋデータベースで見つけることができる。

本明細書で使用される用語「増幅する」は、標的核酸を鋳型として使用して、標的核酸の１つ以上のコピーを生成することを指す。

用語「濃縮する」および「濃縮」は、特徴を持たない解析物（例えば、ヒドロキシメチルシトシンを含む核酸）から、特定の特徴を有する解析物（例えば、ヒドロキシメチルシトシンを含む核酸）の部分精製を指す。濃縮は、典型的に、特徴を有する解析物（たとえば、ヒドロキシメチルシトシンを含む核酸）の濃度を、特徴を有しない解析物と比較して少なくとも２倍、少なくとも５倍、または少なくとも１０倍増加する。濃縮後、試料中の解析物の少なくとも１０％、少なくとも２０％、少なくとも５０％、少なくとも８０％、または少なくとも９０％は、濃縮に使用される特徴を有し得る。例えば、濃縮した組成物中の核酸分子の少なくとも１０％、少なくとも２０％、少なくとも５０％、少なくとも８０％または少なくとも９０％は、捕獲タグを含むよう修飾された、１つ以上のヒドロキシメチルシトシンを有する鎖を含み得る。

本明細書で使用される場合、用語「循環セルフリーＤＮＡ」および「セルフリーＤＮＡ」（ｃｆＤＮＡ）は、患者の末梢血中を循環しているＤＮＡを指すために互換的に使用される。セルフリーＤＮＡ中のＤＮＡ分子は、中央値サイズが１ｋｂ未満であり得るが（例えば、５０ｂｐ～５００ｂｐ、８０ｂｐ～４００ｂｐ、または１００～１，０００ｂｐの範囲）、この範囲外の中央値サイズを有する断片が存在し得る。セルフリーＤＮＡは、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）、すなわちがん患者の血液中を自由に循環する腫瘍ＤＮＡまたは循環胎児ＤＮＡ（対象が妊娠中の女性の場合）を含み得る。ｃｆＤＮＡは高度に断片化され得、いくつかの場合において、約１６５～２５０ｂｐの平均断片サイズを有し得る（ＮｅｗｍａｎｅｔａｌＮａｔＭｅｄ．２０１４２０：５４８－５４）。全血を遠心分離して全細胞を除去し、その後残りの血漿または血清からＤＮＡを分離することにより、ｃｆＤＮＡを取得できる。そのような方法は周知である（例えば、Ｌｏｅｔａｌ、ＡｍＪＨｕｍＧｅｎｅｔ１９９８；６２：７６８－７５を参照）。循環セルフリーＤＮＡは二本鎖であるが、変性により一本鎖にすることができる。本明細書で使用される用語「タグ付け」は、分子バーコードを核酸分子に付加することを指す。分子バーコードは、核酸分子の５’末端、３’末端、または両端に付加され得る。分子バーコードは典型的に、従来の手段、例えばＴ４ＤＮＡリガーゼまたは別のリガーゼを使用してアダプターを断片にライゲーションすることにより、ＤＮＡ断片に付加される。

用語「分子バーコード」は、様々な型の識別子配列を指し、本明細書で論じるように、試料識別子配列、分子識別子配列、鎖識別子配列、および他の型の識別子配列を包含する。いくつかの実施形態において、分子バーコードは、１から約３６ヌクレオチド、例えば、４から３０ヌクレオチド、６から２５ヌクレオチド、または８から２０ヌクレオチドの範囲の長さを有し得る。特定の場合において、分子バーコードはエラーを検出および／またはエラー修正している可能性がある、つまり、エラーが存在する場合でも（たとえば、分子バーコード配列の決定に至るまでのさまざまな処理ステップのいずれかの間、分子バーコードの配列が誤って合成されたり、誤って読み取られたり、または歪んだりした場合）、その後、コードをまだ正しく解釈できる。エラー修正配列の使用は、文献に記載される（たとえば、Ｈａｍａｔｉらの米国特許公開第２０１０／０３２３３４８号およびＢｒａｖｅｒｍａｎらの米国特許第２００９／０１０５９５９号において）。いくつかの実施形態において、より複雑な識別子配列がいくつかの場合に使用され得るが、識別子配列は、比較的低い複雑さ（例えば、４～１０２４の異なる配列の混合で構成され得る）であり得る。

本明細書で使用される場合、断片の特定の（例えば、上部または下部）鎖に「対応する」配列読み取りに関して、用語「に対応する」は、その鎖またはその増幅産物に由来する配列読み取りを指す。

本明細書で使用される場合、用語「１，３－付加環化反応」は、アジドとアルキンとの間の１，３－付加環化が５員複素環を形成することを指す。いくつかの実施形態において、アルキンは、（例えば、シクロオクチンなどの環において）歪ませられ得、付加環化反応は、銅を含まない条件下で行われる。ジベンゾシクロオクチン（ＤＢＣＯ）およびジフルオロオクチン（ＤＩＦＯ）は、銅を含まない付加環化反応に参加できるアルキンの例であるが、他の群も公知である。例えば、Ｋｏｌｂｅｔａｌ．（２００８）Ｄｒｕｇ．Ｄｉｓｃｏｖ．Ｔｏｄａｙ８：１１２８－１１３）；Ｂａｓｋｉｎｅｔａｌ．（２００７）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．１０４：１６７９３－１６７９７；およびＳｌｅｔｔｅｎｅｔａｌ．（２０１１）ＡｃｃｏｕｎｔｓｏｆＣｈｅｍｉｃａｌＲｅｓｅａｒｃｈ４４：６６６－６７６参照。

用語「クリックケミストリー」は、自発的に起こり、少なくとも１つの新しく形成された共有結合を含む少なくとも１つの反応生成物を形成する２つ以上の反応物質間の反応を指す。アジドとアルキン間の１，３－付加環化反応は、クリックケミストリー型の反応の例である。

本明細書で使用する場合、用語「化学選択基で修飾されたＵＤＰグルコース」は、クリックケミストリーによって親和性タグと反応することができる官能基で、特に６－ヒドロキシル位で、官能化されたウリジンジホスホグルコース分子を指す。

用語「酸化５－メチルシトシン」は、５位で酸化されている酸化５－メチルシトシン残基を指す。したがって、酸化５－メチルシトシン残基は、５－ヒドロキシメチルシトシン、５－ホルミルシトシン、および５－カルボキシシトシンを含む。本発明の一実施形態による有機ボランとの反応を受ける酸化５－メチルシトシン残基は、５－ホルミルシトシンおよび５－カルボキシシトシンである。

例えば、特定の部分の語句「実質的に含まない」におけるような用語「実質的に」は、その特定の部分の１０％以下、好ましくは５％以下、より好ましくは１％以下を含む組成物を指す。用語「実質的に」の他の使用は、類似の定義を含む。

化学置換基および化合物の用語：

本明細書で使用される場合、語句「構造を有する」は、限定することを意図するものではなく、用語「含む」が一般的に使用されるのと同じ意味で使用される。

本明細書で使用される用語「アルキル」は、典型的には必ずしもメチル、エチル、ｎ－プロピル、イソプロピル、ｎ－ブチル、イソブチル、ｔ－ブチル、オクチル、デシルなど、ならびにシクロペンチル、シクロヘキシルなどのシクロアルキル基などの１から約１２個の炭素原子を含むわけではないが、分岐または非分岐飽和炭化水素基を指す。用語「低級アルキル」は、１～６個の炭素原子のアルキル基を意図する。好ましい低級アルキル置換基は、１～３個の炭素原子を含み、特に好ましいこのような置換基は、１または２個の炭素原子（すなわち、メチルおよびエチル）を含む。「置換アルキル」は、１つ以上の置換基で置換されたアルキルを指し、用語「ヘテロ原子含有アルキル」および「ヘテロアルキル」は、以下でさらに詳細に記載するように、少なくとも１つの炭素原子がヘテロ原子で置き換えられたアルキルを指す。特に明記しない限り、用語「アルキル」および「低級アルキル」は、それぞれ、直鎖、分岐、環状、非置換、置換、および／またはヘテロ原子含有アルキルまたは低級アルキルを含む。

本明細書で使用される用語「アリール」は、他に特定されない限り、互いに融合、直接結合、または間接結合された単一の芳香環または複数の芳香環を含む芳香族置換基を指す（その結果異なる芳香環は、メチレンまたはエチレン部分などの一般的な基に結合している）。好ましいアリール基は５～２４個の炭素原子を含み、より好ましいアリール基は５～１４個の炭素原子を含み、特に好ましいアリール基は５～９個の炭素原子を含む。「置換アリール」は、１つ以上の置換基で置換されたアリール部分を指し、用語「ヘテロ原子含有アリール」および「ヘテロアリール」は、以下でさらに詳細に説明するように少なくとも１つの炭素原子がヘテロ原子で置き換えられているアリール置換基を指す。特に明記しない限り、用語「アリール」は、非置換、置換、および／またはヘテロ原子含有芳香族置換基を含む。

「ヘテロ原子含有アルキル基」（「ヘテロアルキル」基とも呼ばれる）または「ヘテロ原子含有アリール基」（「ヘテロアリール」基とも呼ばれる）におけるような「ヘテロ原子含有」という用語は、１つ以上の炭素原子が炭素以外の原子、例えば窒素、酸素、硫黄、リンまたはケイ素、典型的には窒素、酸素または硫黄、好ましくは窒素または酸素で置き換えられている分子、結合または置換基を指す。同様に、用語「ヘテロアルキル」は、ヘテロ原子含有のアルキル置換基を指し、用語「複素環式」は、ヘテロ原子含有の環状置換基を指し、用語「ヘテロアリール」および「ヘテロ芳香族」は、それぞれヘテロ原子含有などである「アリール」および「芳香族」置換基を指す。

「ヒドロカルビル」は、１～約３０個の炭素原子、好ましくは１～約２４個の炭素原子、より好ましくは１～約１８個の炭素原子、最も好ましくは約１～１２個の炭素原子を含む一価のヒドロカルビルラジカルを指し、直鎖、分岐、環状、飽和、および不飽和種、例えば、アルキル基、アルケニル基、アリール基などを含む。「置換ヒドロカルビル」は、１つ以上の置換基で置換されたヒドロカルビルを指し、用語「ヘテロ原子含有ヒドロカルビル」は、少なくとも１個の炭素原子がヘテロ原子で置き換えられているヒドロカルビルを指す。特に明記しない限り、用語「ヒドロカルビル」は、置換および／またはヘテロ原子含有ヒドロカルビル部分を含むと解釈されるべきである。

２セルフリーＤＮＡにおける酸化５ｍＣ残基のＤＨＵへの変換：

一実施形態において、本発明は、セルフリーＤＮＡ中の酸化５－メチルシトシン残基をジヒドロウラシル残基に変換する方法を提供する。この方法は、５－ホルミルシトシン（５ｆＣ）、５－カルボキシシトシン（５ｃａＣ）、およびそれらの組み合わせから選択される酸化５ｍＣ残基と有機ボランとの反応を含む。酸化５ｍＣ残基は、天然に生じるか、またはより典型的には、５ｍＣまたは５ｈｍＣ残基の事前酸化の結果、たとえば、５ｍＣまたは５ｈｍＣのＴＥＴファミリー酵素（例えば、下で議論するようにＴＥＴ１、ＴＥＴ２、またはＴＥＴ３）での酸化の結果である。あるいは、例えば、過ルテニウム酸カリウム（ＫＲｕＯ_４）もしくはペルオキソタングステン酸塩（例えばＯｋａｍｏｔｏｅｔａｌ．（２０１１）Ｃｈｅｍ．Ｃｏｍｍｕｎ．４７：１１２３１－３３参照）および過塩素酸銅（ＩＩ）／２，２，６，６－テトラメチルピぺリジン－１－オキシル（ＴＥＭＰＯ）配合物（Ｍａｔｓｕｓｈｉｔａｅｔａｌ．（２０１７）Ｃｈｅｍ．Ｃｏｍｍｕｎ．５３：５７５６－５９参照）などの無機ペルオキソ化合物または組成物による５ｍＣあるいは５ｈｍＣの化学酸化の結果である

有機ボランは、ボランと、窒素複素環および第３級アミンから選択される窒素含有化合物との錯体として特徴付けられ得る。窒素複素環は、単環式、二環式、または多環式であってもよいが、典型的には、単環式であり、窒素ヘテロ原子と、必要に応じてＮ、Ｏ、およびＳから選択される１つ以上の追加のヘテロ原子を含む５員または６員環の形態である。窒素複素環は、芳香族または脂環式であってよい。本明細書において好ましい窒素複素環には、２－ピロリン、２Ｈ－ピロール、１Ｈ－ピロール、ピラゾリジン、イミダゾリジン、２－ピラゾリン、２－イミダゾリン、ピラゾール、イミダゾール、１，２，４－トリアゾール、１，２，４－トリアゾール、ピリダジン、ピリミジン、ピラジン、１，２，４－トリアジン、および１，３，５－トリアジンが含まれる、これらはいずれも非置換であっても、１つ以上の非水素置換基で置換されていてもよい。典型的な非水素置換基は、アルキル基、特にメチル、エチル、ｎ－プロピル、イソプロピル、ｎ－ブチル、イソブチル、ｔ－ブチルなどの低級アルキル基である。例示的な化合物には、ピリジンボラン、２－メチルピリジンボラン（２－ピコリンボランとも呼ばれる）、および５－エチル－２－ピリジンが含まれる。これらの有機ボランは、

で表され得り、または

として、複素環式窒素原子とホウ素の間の電荷移動の証拠がある。
例えば、Ｈｏｆｆｍａｎｎ（１９６４）， ”ＥｘｔｅｎｄｅｄＨuｃｋｅｌＴｈｅｏｒｙ．ＩＩＩ．ＣｏｍｐｏｕｎｄｓｏｆＢｏｒｏｎａｎｄＮｉｔｒｏｇｅｎ，” Ｊ．Ｃｈｅｍ．Ｐｈｙｓ．４０：２４７４を参照。

第３級アミン－ボラン錯体は、ボランおよび式（Ｉ）

の構造を有する第３級アミンから形成される。
ここで式中、Ｒ^１、Ｒ^２、およびＲ^３部分は、同一または異なってもよく、一般に、置換および／またはヘテロ原子含有ヒドロカルビル基を含むＣ_１～Ｃ_１２ヒドロカルビル基から独立して選択される。Ｒ_１、Ｒ_２、およびＲ_３は、典型的にはＣ_１～Ｃ_１２アルキル、より典型的には低級アルキル、例えばメチル、エチル、ｎ－プロピル、イソプロピル、ｎ－ブチル、イソブチル、ｔ－ブチル、シクロペンチル、シクロヘキシルなどである。本明細書で使用するための例示的な第３級アミン－ボラン錯体には、トリエチルアミンボランおよびトリ（ｔ－ブチル）アミンボランが含まれる。

セルフリーＤＮＡ中の有機ボランと酸化５ｍＣ残基との反応は、非毒性試薬および穏やかな反応条件を使用できる限り有利であり、バイサルファイトも、その他の潜在的にＤＮＡ分解試薬も必要ない。さらに、酸化５ｍＣ残基の有機ボランによるジヒドロウラシルへの変換は、「ワンポット」または「ワンチューブ」反応で、いかなる中間体を単離する必要なく実行できる。変換には複数のステップつまり、（１）酸化５ｍＣでＣ－４とＣ－５を結ぶアルケン結合の還元、（２）脱アミノ化、および（３）酸化５ｍＣが５ｃａＣの場合は脱炭酸、または酸化５ｍＣが５ｆＣの場合は脱ホルミル化のいずれか、のステップが含まれるため、これは非常に重要である。代表的な有機ボランとして２－ピコリンボランを使用して５ｃａＣをジヒドロウラシルに変換する一連の反応をスキーム４に示す

一方、５ｆＣをジヒドロウラシルに変換する対応する順序は、スキーム５に示す。

有機ボランを使用して酸化５－メチルシトシン残基をジヒドロウラシルに変換する実現可能性を決定するために、２－ピコリンボランを水性ＤＮＡ緩衝液中で、配列５’－ＴＣＧＡＣ５ｃａＣＧＧＡＴＣ－３’を有するオリゴヌクレオチドと組み合わせた、ここで５ｃａｃは５－カルボキシシトシンを表す。図１は、２－ピコリンボランと５ｃａＣの仮定の反応生成物を示す。示されているように、反応生成物としてジヒドロウラシルを使用すると、４１Ｄａの損失が予想される。得られた結果を図２に示す。約４１．６Ｄａの損失が見られ、主な反応生成物が、ジヒドロウラシルであることを示唆している。さらに^１ＨＮＭＲおよび質量スペクトル分析により、この発見が確認された；図３を参照。反応のために提案されたメカニズムは、図４に概略的に示され、上記のように、連続的な還元、脱アミノ化、および脱炭酸のステップを伴い、一方図５は、２－ピコリンボランと５－ホルミルシトシン（５ｆＣ）との類似の反応を示す。前記図は、連続的な還元、脱アミノ化、および脱ホルミル化を伴う、提案されたメカニズムも示す。

図６および７の質量スペクトルは、２－ピコリンボランが５－カルボキシシトシンおよび５－ホルミルシトシンと選択的に反応してこれらの残基をＤＨＵに変換したが、オキシム＝Ｎ－Ｏ－ＣＨ_２ＣＨ_３またはアミド－（ＣＯ）－ＮＨ－ＣＨ_２ＣＨ_３で５位が置換されたシトシンとは反応しないことを示す。

図１０は、２－ピコリンボランとの反応前後の５－メチルシトシン、５－ヒドロキシメチルシトシン、および５－グルコメチルシトシンの質量スペクトルを示す。見ての通り、２－ピコリンボランはこれらのいずれとも反応せず、５－ホルミルシトシンおよび５－カルボキシシトシンに対する２－ピコリンボランの選択性が強調されていた。

セルフリーＤＮＡ中の酸化５－メチルシトシン残基をジヒドロウラシル残基に変換する方法に加えて、本発明はまた、前述の方法に関連する反応混合物を提供する。反応混合物は、５ｃａＣ、５ｆＣ、およびそれらの組み合わせから選択される少なくとも１つの酸化５－メチルシトシン残基を含むセルフリーＤＮＡの試料、ならびに少なくとも１つの酸化５－メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれか、に有効な有効な有機ボランとを含む。有機ボランは、上で説明したように、ボランならびに窒素複素環および第３級アミンから選択された窒素含有化合物の複合体である。好ましい実施形態において、反応混合物は、バイサルファイトを実質的に含まず、これは、バイサルファイトイオンおよびバイサルファイト塩を実質的に含まないことを意味する。理想的には、反応混合物はバイサルファイト塩を含まない。

本発明の関連する局面において、セルフリーＤＮＡ中の５ｍＣ残基をジヒドロウラシル残基に変換するためのキットが提供され、キットは、５ｈｍＣ残基をブロックするための試薬、ヒドロキシメチル化を超えて５ｍＣ残基を酸化して酸化５ｍＣ残基を提供するための試薬、ならびに酸化５ｍＣ残基の還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかに有効な有機ボランを含む。キットはまた、上記記載の方法を実施するために構成要素を使用するための説明書を含み得る。

３．セルフリーＤＮＡにおける５ｍＣおよび５ｈｍＣの存在および位置の検出：

別の実施形態において、上記記載の酸化反応を利用する方法が提供される。この方法は、セルフリーＤＮＡにおける５－メチルシトシン残基の存在および位置を検出することを可能にし、以下のステップを含む：

（ａ）断片化されたアダプターライゲーションセルフリーＤＮＡ中の５ｈｍＣ残基を修飾してその上に親和性タグを提供するステップであって、ここで親和性タグはセルフリーＤＮＡからの修飾５ｈｍＣ含有ＤＮＡの除去を可能にするステップ；

（ｂ）セルフリーＤＮＡから修飾５ｈｍＣ含有ＤＮＡを除去し、非修飾５ｍＣ残基を含むＤＮＡを残すステップ；

（ｃ）未修飾５ｍＣ残基を酸化して、５ｃａＣ、５ｆＣ、およびそれらの組み合わせから選択される酸化５ｍＣ残基を含むＤＮＡを得るステップ；

（ｄ）酸化５ｍＣ残基を含むＤＮＡを、酸化５ｍＣ残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化するのに有効な有機ボランと接触させることにより、酸化５ｍＣ残基の代わりにジヒドロウラシル残基を含むＤＮＡを提供するステップ；

（ｆ）配列決定から５－メチル化パターンを決定すると、（ｅ）が得られるステップ。

セルフリーＤＮＡは、対象からの身体試料から抽出され、身体試料は、典型的には全血、血漿、または血清、最も典型的には血漿であるが、試料は、尿、唾液、粘膜排泄物、痰、便、または涙であってもよい。一部の実施形態において、セルフリーＤＮＡは腫瘍に由来する。他の実施形態において、セルフリーＤＮＡは、疾患または他の病原性状態を有する患者に由来する。セルフリーＤＮＡは腫瘍に由来してもよいし、しなくてもよい。ステップ（ａ）において、５ｈｍＣ残基が修飾されるセルフリーＤＮＡが精製され、断片化された形態であり、およびアダプターライゲーションされていることに注意すべきである。この文脈でのＤＮＡ精製は、当業者に公知のおよび／または関連文献に記載されている任意の適切な方法を使用して実行でき、例えば、Ｌｕらの米国特許公開第２０１７／０２５３９２４号に記載されているように、セルフリーＤＮＡ自体が高度に断片化されている場合、さらなる断片化が時々望ましい場合がある。セルフリーＤＮＡ断片は、一般に、約２０ヌクレオチド～約５００ヌクレオチドのサイズ範囲、より典型的には約２０ヌクレオチド～約２５０ヌクレオチドの範囲である。ステップ（ａ）で修飾された精製済みのセルフリーＤＮＡ断片は、従来の手法（制限酵素など）を使用して末端が修復されているため、断片は各３’末端および５’末端で平滑末端を有している。好ましい方法において、ＱｕａｋｅらのＷＯ２０１７／１７６６３０に記載されているように、平滑化された断片は、Ｔａｑポリメラーゼなどのポリメラーゼを使用して単一のアデニン残基を含む３’オーバーハングにより提供されている。これは、選択したユニバーサルアダプター、すなわち、セルフリーＤＮＡ断片の両末端にライゲーションし、以下で詳細に説明するように少なくとも１つの分子バーコードを含むＹアダプターまたはヘアピンアダプターなどのアダプターのその後のライゲーションを容易にする。アダプターの使用は、アダプターライゲーションされたＤＮＡ断片の選択的ＰＣＲ濃縮も可能にする。

次に、ステップ（ａ）において、「精製され、断片化されたセルフリーＤＮＡ」は、アダプターライゲーションされたＤＮＡ断片を含む。ステップ（ａ）で指定されているように、親和性タグ付きのこれらのセルフリーＤＮＡ断片の５ｈｍＣ残基の修飾は、セルフリーＤＮＡからの修飾５ｈｍＣ含有ＤＮＡのその後の除去を可能にするために行われる。一実施形態において、親和性タグは、ビオチン、デスチオビオチン、オキシビオチン、２－イミノビオチン、ジアミノビオチン、ビオチンスルホキシド、ビオシチンなどのビオチン部分を含む。親和性タグとしてビオチン部分を使用すると、ストレプトアビジン、例えばストレプトアビジンビーズ、磁気ストレプトアビジンビーズなどで簡単に除去できる。

５ｈｍＣ残基をビオチン部分または他の親和性タグでタグ付けすることは、ＤＮＡ断片の５ｈｍＣ残基への化学選択基の共有結合によって達成される。ここで化学選択基は、５ｈｍＣ残基に親和性タグを結合するために、官能化された親和性タグと反応することができる。一実施形態において、化学選択基は、ＵＤＰグルコース－６－アジドであり、これは、Ｒｏｂｅｒｔｓｏｎら（２０１１）Ｂｉｏｃｈｅｍ．Ｂｉｏｐｈｙｓ．Ｒｅｓ．Ｃｏｍｍ．４１１（１）：４０－３、Ｈｅらの米国特許第８，７４１，５６７号、およびＱｕａｋｅらのＷＯ２０１７／１７６６３０、すべて以前に引用されている、に記載されているように、アルキン官能化ビオチン部分との自発的１，３－付加環化反応を受ける。したがって、アルキン官能化ビオチン部分を追加すると、ビオチン部分が各５ｈｍＣ残基と共有結合する。そのような反応の例が、Ｈｅらの米国特許第８，７４１，５６７号の図５Ｂに示されている。

次いで、一実施形態において、ストレプトアビジンビーズ、磁気ストレプトアビジンビーズなどの形態のストレプトアビジンを使用して、ステップ（ｂ）で親和性タグ付きＤＮＡ断片をプルダウンし、もし望むなら、後の分析のために取っておくことができる。親和性タグ付き断片の除去後に残っている上清は、未修飾の５ｍＣ残基を含み、５ｈｍＣ残基を含まないＤＮＡを含む。

ステップ（ｃ）において、未修飾の５ｍＣ残基は、任意の適切な手法を使用して酸化され、５ｃａＣ残基および／または５ｆＣ残基を提供する。酸化剤は、ヒドロキシメチル化を超えて５ｍＣ残基を酸化するように、すなわち、５ｃａＣおよび／または５ｆＣ残基を提供するように選択される。酸化は、触媒的に活性なＴＥＴファミリー酵素を使用して、酵素的に行うことができる。本明細書で使用される用語「ＴＥＴファミリー酵素」または「ＴＥＴ酵素」は、米国特許第９，１１５，３８６号に定義されている触媒活性「ＴＥＴファミリータンパク質」または「ＴＥＴ触媒活性断片」を指す。この文脈における好ましいＴＥＴ酵素は、ＴＥＴ２である；Ｉｔｏｅｔａｌ．（２０１１）Ｓｃｉｅｎｃｅ３３３（６０４７）：１３００－１３０を参照。酸化は、前のセクションで記載したように、化学的酸化剤を使用して化学的に行うこともできる。適切な酸化剤の例には、限定するものではないが、過ルテニウム酸カリウム（ＫＲｕＯ_４）などの過ルテニウム酸金属、過ルテニウム酸テトラプロピルアンモニウム（ＴＰＡＰ）および過ルテニウム酸テトラブチルアンモニウム（ＴＢＡＰ）などの過ルテニウム酸テトラアルキルアンモニウムおよびポリマーで支持されている過ルテニウム酸塩（ＰＳＰ）を含む、無機または有機過ルテニウム酸塩の形態の過ルテニウム酸アニオン；ならびに無機ペルオキソ化合物およびペルオキソタングステン酸塩または過塩素酸銅（ＩＩ）／ＴＥＭＰＯの組み合わせなどの組成物が含まれる。プロセスの次のステップである、ステップ（ｅ）が５ｆＣ残基および５ｃａＣ残基の両方をジヒドロウラシル（ＤＨＵ）に変換する限り、この時点で５ｆＣ含有断片を５ｃａＣ含有断片から分離する必要はない。

すなわち、ステップ（ｅ）は、前のセクションで記載したように、５ｆＣ含有および５ｃａＣ含有ＤＮＡ断片と有機ボランとの反応を伴う。スキーム４、スキーム５、図４および図５に示されるように、有機ボランは、酸化５ｍＣ残基を還元し、脱アミノ化し、および脱炭酸または脱ホルミル化のいずれかをする。ステップ（ｆ）において、任意の適切な方法を使用して、元の５ｍＣ残基の代わりにＤＨＵを含むＤＮＡ断片をプールし、増幅し、配列決定する；本明細書における好ましい増幅および配列決定技術は、ＱｕａｋｅらのＷＯ２０１７／１７６６３０に記載されている。

前述の方法は、図８の右側のスキームに示されており、β－ＧＴブロッキングを用いたＴＥＴ支援２－ピコリンボラン配列（ＴＡＰＳ）を示す。このスキームは、５－ヒドロキシメチルシトシン残基が、β－グルコシルトランスフェラーゼ（βＧＴ）でブロックされているのに対し、５－メチルシトシン残基は、５－ホルミルシトシンおよび５－カルボキシシトシンの混合物を提供するのに効果的なＴＥＴ酵素で酸化されていることを示す。これらの酸化種の両方を含む混合物を２－ピコリンボランまたは別の有機ボランと反応させ、ジヒドロウラシルを得ることができる。この実施形態の変形において、５ｈｍＣ含有断片は、ステップ（ｂ）では除去されない。むしろ、図８の左側のスキームに示されるように、「ＴＥＴ支援ピコリンボラン配列（ＴＡＰＳ）」、５ｍＣ含有断片および５ｈｍＣ含有断片を一緒に酵素酸化して、５ｆＣおよび５ｃａＣ含有断片を提供する。２－ピコリンボランとの反応により、５ｍＣおよび５ｈｍＣ残基が元々存在していた場所にＤＨＵ残基が生じる。「化学支援ピコリンボラン配列決定（ＣＡＰＳ）」と題された図９は、５ｍＣ残基を変更せずに残したまま、過ルテニウム酸カリウムを用いた５ｈｍＣ含有断片の選択的酸化を模式的に示している。

前述の技術を使用したシトシンならびにシトシン誘導体５ｍＣおよび５ｈｍＣの配列読み取りを表１に示す：
表１：

表に示されているように、５ｈｍＣ残基のβＧＴブロッキングを有するＴＡＰＳと、ＣＡＰＳは、５ｍＣ残基および５ｈｍＣ残基の差分読み取りを可能にする。

この実施形態の方法には多くの利点がある：バイサルファイトは不要であり、非毒性の試薬および反応物が使用される；そしてプロセスは穏やかな条件下で進行する。さらに、いかなる中間体を分離する必要なく、プロセス全体を１本のチューブで行うことができる。

関連する実施形態において、上記の方法は、さらなるステップを含む：（ｇ）ステップ（ｂ）においてセルフリーＤＮＡから除去された５ｈｍＣ含有ＤＮＡにおけるヒドロキシメチル化パターンを同定するステップ。これは、以前に引用されたＱｕａｋｅらのＷＯ２０１７／１７６６３０に詳細に記載されている技術を使用して実行することができる。このプロセスは、図１１に概略的に示されるように、中間体の除去または単離をせずに、ワンチューブ方法で実行することができる。

より具体的には、図１１は、セルフリーＤＮＡ断片中の５ｍＣ残基の存在および位置を検出するための方法の一実施形態を示し、ここで前記方法は、「ワンチューブ」プロセスとして実行することができる。最初に、セルフリーＤＮＡ断片、好ましくはアダプターライゲーションＤＮＡ断片を、以前記載したようにβＧＴ触媒ウリジンジホスホグルコース６－アジドで官能化に供し、続いて化学選択的アジド基を介してビオチン化する。前に説明したように、この手順により、各５ｈｍＣ部位に共有結合したビオチンが生成される。次のステップにおいて、ビオチン化された鎖および、未修飾（天然）５ｍＣを含む鎖が、さらなる処理のために同時にプルダウンされる。当該分野で知られているように、天然の５ｍＣ含有鎖は、抗５ｍＣ抗体またはメチル－ＣｐＧ結合ドメイン（ＭＢＤ）タンパク質を使用してプルダウンされる。次に、５ｈｍＣ残基がブロックされた状態で、本明細書の他の場所に記載したように、未修飾５ｍＣ残基は、５ｍＣを５ｆＣおよび／または５ｃａＣに変換する任意の適切な技術を使用して選択的に酸化される。図１１は、１つのそのような方法、ＴＥＴ支援酸化を指す。２－ピコリンボランなどの有機ボランを使用して、既に記載したように５ｃａＣをＤＨＵに変換し、その結果元の５ｍＣ残基をＴ残基として読み取る。図１１のプロセスにおいて、単一チューブ配列決定の結果は、表２に示すとおりである。
表２

表からわかるように、５ｍＣ残基のみ（つまり、５ｈｍＣ残基を含まない）を有するＤＮＡ断片はＴＧペアとして読み取られ、そのように一意に識別できる。必要に応じて、天然の５ｍＣ含有断片およびビオチン化５ｈｍＣ断片を別々にプルダウンするようにプロセスを改変して、鋳型ＤＮＡ断片内の５ｈｍＣ残基の存在および位置を検出できるようにすることができる。

ステップ（ａ）から（ｆ）および必要に応じて（ｇ）に記載された方法の変形において、断片化されたアダプターライゲーションセルフリーＤＮＡ中の５ｈｍＣ残基は、ブロッキング基の付着によって修飾され、その結果、次に、方法はステップ（ｂ）なしで、５ｈｍＣ含有断片の除去を進行する。

ステップ（ａ）から（ｆ）および必要に応じて（ｇ）に記載された方法の別の変形において、方法は、セルフリーＤＮＡの代わりに腫瘍ＤＮＡを用いて実行される。

セルフリーＤＮＡ断片の分子バーコーディング：

好ましい実施形態において、分子バーコーディングを使用して、複数のセルフリーＤＮＡ試料のそれぞれにおける各ＤＮＡ鎖の特徴を特定する。本明細書で先に説明したように、分子バーコード、または「一意識別子」（ＵＩＤ）は、特定のＤＮＡ鎖の後での識別および生成を可能にするために、ＤＮＡ断片にタグ付け、または追跡するために使用される短いオリゴヌクレオチド配列である。したがって、分子バーコード、または「配列タグ」は、それがライゲーションされている以下のようなＤＮＡ鎖の特徴を識別する：

（１）ＤＮＡ鎖が由来する試料；

（２）ＤＮＡ鎖が由来する分子（二本鎖ＤＮＡ断片）；

（３）元の二本鎖ＤＮＡ断片における鎖の同一性、すなわち、ポジティブまたはネガティブ；および

（４）非配列特性に基づいて核酸鋳型（非増幅）分子の初期プールを分割するために使用される上流ゲノムプロセス、ここで、「上流」は、実際の鋳型配列が読み取られる前に発生するプロセスまたは他の方法で、例えば、直接配列決定、またはパイロシーケンシングなどの配列決定により；プローブまたは他の標識のように、相補的配列へのハイブリダイゼーションにより；またはメチル化感受性ＰＣＲを含む、ＰＣＲのような配列特異的増幅により；制限消化により；ＭＡＬＤＩ－ＴＯＦにより；メチル化マイクロアレイを使用して；および／または、本明細書で前述したようなＴＡＰＳもしくはＣＡＰＳプロセスにより）検出されるその存在を示す。

第１の例において、分子バーコードは、試料識別子配列、二本鎖ＤＮＡ断片の両方の鎖に付加されるヌクレオチドの配列を含み、ここで配列は、ＤＮＡ断片の供給源、例えば、ＤＮＡ断片が由来する試料および／または患者を識別する。使用において、各試料は異なる試料識別子配列でタグ付けされ、その結果１つの試料識別子配列が１つの試料内のすべてのＤＮＡ断片に付加され、異なる試料のために異なる試料識別子配列が使用される。プールおよび配列決定の後、試料識別子配列を使用して、配列の供給源を識別するのに使用できる。

上記の第２型のバーコードである、分子識別配列は、試料内のＤＮＡ断片の両方の鎖に付加されるヌクレオチドの配列であり、その結果、付加されたヌクレオチドの配列は、単独でまたは断片の他の特徴、例えば、それらの断片化ブレークポイントと組み合わせて、試料またはその一部における異なる二本鎖断片分子間を区別することに使用され得る。任意の１つの実施において使用される分子識別子配列の集団の複雑さは、例えば、試料中の断片の数および／または後続のステップで使用される試料の量などの様々なパラメーターに応じて異なり得る。例えば、特定の場合において、分子識別子配列は、複雑性が低くてもよい（例えば、８から１０２４の配列の混合物で構成されてもよい）。他の場合において、分子識別子配列は、複雑性が高くてもよい（例えば、１０２５から２Ｍまたはそれ以上の配列で構成されてもよい）。特定の実施形態において、分子識別子配列の集団は、１つ以上（例えば、少なくとも２つ、少なくとも３つ、少なくとも４つ、少なくとも５つ、または５～３０あるいはそれより多く）のＲ、Ｙ、Ｓ、Ｗ、Ｋ、Ｍ、Ｂ、Ｄ、Ｈ、Ｖ、Ｎ（ＩＵＰＡＣコードで定義）、またはその変異体から選択されるヌクレオチドを含む縮重塩基領域（ＤＢＲ）を含み得る。米国特許第８，７４１，６０６号に記載されているように、分子識別子配列は、隣接していない配列で構成されていてもよい。いくつかの実施形態において、分子識別子配列の集団は、定義された配列のオリゴヌクレオチドを一緒に混合することによって作製され得る。これらの実施形態において、各オリゴヌクレオチドの分子識別子配列は、誤り訂正であり得る。本明細書に記載の方法において、分子識別子配列を使用して、最初の試料の一部の異なる断片間を区別することができ、ここで、その部分は最初の試料から除去されている。分子識別子配列は、断片間を区別するために、断片の他の特徴（例えば、ブレークポイントを定義する、断片の末端配列）と組み合わせて使用されてもよい。

本発明に関連して有用な第３の型の分子バーコードは、鎖識別子配列である。鎖識別子配列は、試料内のＤＮＡ断片の１つの鎖に固有であるため、配列決定されたＤＮＡ鎖の別の特徴、つまり、配列決定されたＤＮＡ鎖が由来する元の鋳型ＤＮＡ断片の鎖を識別する。別の好ましい実施形態において、この鎖特異性は、両末端での各断片の二重バーコード化によってさらに強化される。

好ましい実施形態において、上記記載の分子バーコードの少なくとも１つが、現在記載されている方法およびキットと併せて使用される。より好ましい実施形態において、３つすべての型の分子バーコードが使用される。このような場合において、３種類のバーコードは典型的に、試料のＤＮＡ断片の末端修復されたＡテール付加された末端に分子バーコード含有アダプターをライゲーションすることにより、例えばセルフリーＤＮＡのＤＮＡ断片に付加される。ＤｉｅｈｎおよびＡｌｉｚａｄｅｈによってＮｅｗｍａｎｅｔａｌ．（２０１６）ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌ．および他の場所で記載されたＣＡＰＰ－Ｓｅｑプロセスに類似している、このハイブリッドアダプターアプローチは、図１２および図１３に示されている。

図１２に示すように、ハイブリッドアダプター方法論の最初のステップは、Ａテール付加されたＤＮＡ断片へのＴ末端化分子バーコードＹアダプターのライゲーションである。Ｙアダプターが示されているが、前述のヘアピンアダプターなどの、機能的に同等のアダプターも使用できることを理解されたい。バーコード化されたアダプターには、それぞれ次のバーコードが含まれる：試料識別子配列１および５；鎖識別子配列２および４；ならびに断片（または分子）識別子配列３および６。ライゲーション後、ポジティブ鎖およびネガティブ鎖が分離され、ＰＣＲで増幅される（ステップ３）。

ＰＣＲ増幅の結果を図１３に示す。２つの（＋）－鎖由来の鎖は（４）に示され、それぞれ試料識別子配列５、断片識別子配列３および６、ならびに鎖識別子配列４を含んでいる。２つの（－）－鎖由来の鎖は（５）に示され、それぞれ試料識別子配列１、断片識別子配列３および６、ならびに鎖識別子配列２を含む。

別の実施形態において、本明細書の方法に従って処理されたセルフリーＤＮＡ断片は、断片識別子配列および鎖識別子配列の両方を含む。鎖の断片識別子配列（再び、処理された鎖が由来する鋳型ｄｓＤＮＡ断片を識別する）の鎖識別子配列（処理された鎖が由来する鋳型鎖を識別する）と組み合わせた分析により、対応する鋳型断片が完全に修飾されている（すなわち、完全に修飾、たとえば、両方の鎖でメチル化、両方の鎖でヒドロキシメチル化、または一方の鎖でメチル化され、他方の鎖でヒドロメチル化）か、またはヘミ修飾されている（すなわち、ヘミ修飾、たとえば、一方の鎖のみでメチル化またはヒドロキシメチル化）かを決定することができる。

分子バーコーディングは、本明細書に記載されている任意の方法と組み合わせて使用することができる。現在のエピジェネティック解析では、ほとんどの場合、セルフリーＤＮＡを出発点として依拠するため、バーコーディングは、バーコード含有アダプターを処理した断片にライゲーションすることにより、精製、断片化、および末端修復後、通常実行される。

５．プロセスバーコーディング

前のセクションで言及されたように、分子バーコードはまた、プロセス識別子配列であり得る。プロセスバーコードまたは「プロセスタグ」は、核酸の修飾、タンパク質との会合、およびゲノム構造などの非配列特性に基づいて、非増幅鋳型ＤＮＡ断片の初期プールを分割するために使用されるプロセスを識別する。

そのようなプロセスタグの１つの利点は、元の核酸鋳型分子に関連する非古典的配列特性を古典的な配列差に変換し、それにより、さもなければ前記特性をマスクまたは破壊し得る後続のプロセスを通じてそのような特性を「不死化」することである。たとえば、鋳型分子の５ｈｍＣまたは５ｍＣなどの修飾エピジェネティック塩基は、通常、標準的なＰＣＲのラウンドまたは古典的な４つの塩基を使用するその他の増幅によって希釈され、最終的には主に未修飾のシトシンになる。代わりに、増幅前にそのような塩基に対して処理された鋳型分子に隣接する配列としてプロセスバーコードが追加された場合、それらは通常の手段で続いて増幅され、後に（配列決定またはＰＣＲもしくはマイクロアレイなどの他の手段を通じて）鋳型分子と一緒に読み取られる。したがって、そのような読み取り内のプロセスタグおよび鋳型核酸の両方の存在（または非存在）は、後続の増幅産物にない場合でも、元の鋳型にこのようなエピジェネティック修飾があったかどうかを示す。

同様の場合は、特定のタンパク質（ヒストンのような）、または鋳型分子自体の配列の外に広がる隣接ゲノム領域（例えば、ゲノムの全長にまたがるＣＴＣＦ結合部位）のいずれであっても、元の鋳型核酸をその元の結合相手から正常に解離させる、様々な通常の核酸抽出、断片化および精製技術に当てはまる。しばしば、そのような共起を特徴付けるために使用される免疫沈降および核酸架橋反応は、後の操作または配列の読み取りもしくは検出の十分上流でのみ実行することができる。当業者は、そのようなプロセスバーコードが、そのような特徴に基づいて核酸のプールを選択された残りの核酸部分集合に分離し、抽出、精製、または抽出など、その後の反応を通じてこれらの鋳型の将来のマーキングを可能にする、任意の反応に適用可能であることを認識することができる。これは、その他の点で、そのような分離の基礎となった元の特性（例えば、結合相手の下流の存在または他の非隣接配列の継続的な空間的隣接関係）を削除する。

固有の分子識別子または他の非常に多様なバーコード（一般に１０^３から１０^９の固有の配列の範囲）とは異なり、プロセスバーコードは一般に離散的であり、数塩基（通常２～４塩基）しか必要としないため、各プロセスの特定の出力をカバーする数個の固有の配列のみ（例えば、１～４つのバーコードタグなどの５０未満、２５未満、２０未満、１０未満のバーコードタグ）を表す。設計により、プロセスの共有産物である配列に関係なく（プロセスで使用される共通の特性を共有する）複数の断片に適用でき、個々の鋳型分子のそれぞれに固有の配列を付与することを意図したものではなく、大規模な異種の鋳型配列に適用できることが検証されている（許容可能なライゲーションのバイアスを伴う）。ただし、それらは、プロセスタグブロックの延長セットとして順次実行されるそのようなプロセスの多くの組み合わせをカバーするために、一緒に順番に追加したり、組み合わせて分割して再プールしたりできる。開始鋳型の個々のサブフラクションを利用する並行プロセスで異なるプロセスタグを追加することもでき、核酸を異なるマークについて問い合わせることができる。例えば、単一の鋳型分子は２つのバーコードでタグ付けられて、その元の鋳型分子にも５ｍＣおよび５ｈｍＣの両方が含まれていたことを示すことができる。さらなるタグは、元の鋳型分子が特定のヒストン（または修飾ヒストン、例えば、Ｓｈｅｍａｅｔａｌ．（２０１６）Ｓｃｉｅｎｃｅ３５２（６２８６）：７１７－７２１，およびＳａｄｅｈ（２０１６）ＭｏｌｅｃｕｌａｒＣｅｌｌ６３：１０８０－１０８８を参照）とも関連付けられていたかどうかを示し得る。

この実施形態による核酸の部分集合への分割は、以下に基づくことができる。

（１）（バイサルファイトなどで）化学修飾されたり、（βＧＴなどで）標識またはブロックされたり、またはＭＢＤ結合タンパク質に関連付けられたりする５ｈｍＣまたは５ｍＣなどのエピジェネティック塩基の組み込み。

（２）特定のヒストンまたは核酸架橋（例えば、ＣＴＣＦ）または結合タンパク質（転写因子およびポリメラーゼ、またはエピジェネティック読み取りおよび書き取りタンパク質など）または典型的に免疫沈降される他の核タンパク質との会合；あるいは

（３）地理的に近いが隣接していない核酸配列との会合（典型的には架橋および免疫沈降）。

分離の濃縮フラクションおよび／または枯渇フラクションには、それに負荷されるプロセスタグを有し得る。例えば、１つのプロセスタグで修飾された塩基を含む断片と、別のプロセスタグで修飾された塩基を含まない残りとの両方にマークを付けることは重要である。

分割の基礎となる非配列修飾は、通常、比較的短いＤＮＡ断片に含まれている；複数の非配列修飾を検出することには有用性があるが、特にそのような修飾がブロックで発生する場合、塩基分解能解析から数個または１個の潜在的に異なる修飾部位しか持たないことが公知であるより小さな核酸にプロセスタグを追加することが有益であることが多い。

鋳型核酸断片サイズが、およそ研究されているゲノムの領域の修飾頻度率（例えば、１０００塩基ごとに１つ、１６０塩基ごとに１つ、または１００塩基ごとに１つ）以下である場合（またはゲノム全体にわたって、ゲノム全体の解析が実行されている場合）、個々の断片は「デジタル」になる可能性がある、つまり、任意の与えられた断片で１つまたはゼロしかない修飾を有する可能性がある。潜在的な修飾の部位が以前の塩基分解能解析から知られている場合、塩基分解能の読み出しは配列決定での断片レベルの読み出しから推測できる。

プロセスバーコードは、それ自体で、またはより好ましくは、前のセクションで扱った３つのバーコード型の少なくとも１つと組み合わせて使用できる。図１４は、試料識別子配列、断片識別子配列、および鎖識別子配列で既にバーコード化されているＤＮＡへのプロセスバーコードの追加を模式的に図示する。プロセスバーコードは、必然的に鎖分離後、好ましくは後続のＰＣＲ処理中にＤＮＡ断片に付加され、そこでは、プロセスバーコードは、図１４に示されるように、ＰＣＲプライマーに付加され得る。

一実施形態において、記載されるプロセスバーコードの使用は、セルフリーＤＮＡならびに、試料識別子配列、断片識別子配列、鎖識別子配列、およびそれらの組み合わせから選択される少なくとも１つの追加の分子バーコードを用いて行われる。

別の実施形態において、記載されたプロセスバーコードの使用は、セルフリーＤＮＡを用いて行われ、追加のバーコードは用いられない。

さらなる実施形態において、プロセスバーコードの使用は、細胞内ＤＮＡに由来するＤＮＡで実行され、試料識別子配列、断片識別子配列、鎖識別子配列、およびそれらの組み合わせから選択される少なくとも１つの追加の分子バーコードと共に使用される。

６．ＤＮＡ断片中の５ｍＣおよび５ｈｍＣを検出するためのデュアルビオチン技術：

上記で言及したように、本発明は、ＤＮＡ断片中の５ｍＣおよび５ｈｍＣの両方の存在および位置を検出するための方法、反応混合物およびキットを提供する。

一実施形態において、５ｈｍＣ残基または５ｍＣ残基のいずれかを有するＤＮＡ断片を見出すために、「デュアルビオチン」濃縮法が使用される。そのような方法の例が図１５に示されている。前記方法は、適切にアダプターライゲーションＤＮＡ断片、つまり１つ以上の分子バーコードを含み、プロセスの後の選択的ＰＣＲ増幅を促進するアダプターから始まる。最初のステップにおいて、５ｈｍＣ残基を選択的に親和性タグで標識する。図１５は、ウリジン二リン酸グルコース－６－アジドを用いたβＧＴ触媒グルコシル化とその後の「クリックケミストリー」反応を介した５ｈｍＣ残基の選択的機能化を示し、前述のようにビオチンタグを共有結合させる。次に、ストレプトアビジンビーズを使用して、５ｈｍＣの位置でビオチン化されたすべてのＤＮＡ断片を引き抜き、ＰＣＲ増幅中のプロセスバーコーディング用に別の容器に配置する。上清中の残りのＤＮＡ断片は、５ｍＣ残基を含む断片か、修飾されていない断片のいずれかである。次に、ＴＥＴタンパク質またはＴＥＴ変異タンパク質を使用して、上清の５ｍＣ残基を５ｈｍＣに酸化する；この場合において、変異ＴＥＴタンパク質を使用して、５ｍＣの酸化がヒドロキシル化を超えないようにする。この目的に適したＴＥＴ変異タンパク質は、Ｌｉｕｅｔａｌ．（２０１７）ＮａｔｕｒｅＣｈｅｍ．Ｂｉｏ．１３：１８１－１９１に記載され、その後βＧＴ触媒グルコシル化とそれに続くビオチン官能基化が繰り返される。このようにマークされた断片－元の５ｍＣの位置のそれぞれでビオチン化されている－は、ストレプトアビジンビーズでプルダウンされる。次に、ビーズに結合したＤＮＡ断片は、ＰＣＲ増幅中に、－最初のステップで使用されたものとは異なるプロセス識別子配列で－プロセスバーコード化される。未修飾ＤＮＡ断片、つまり修飾シトシン残基を含まない断片は、上清に残る。必要に応じて、配列固有のプローブを使用して、非メチル化ＤＮＡ鎖にハイブリダイズできる。結果として生じるハイブリダイズした複合体は、以前と同様に、引き抜かれ、ＰＣＲ中に３番目のプロセスバーコードでタグ付けされ得る。

したがって、デュアルビオチン濃縮法は、５ｈｍＣ残基を有する元のＤＮＡ断片、５ｍＣ残基を有する元のＤＮＡ断片、およびＣ修飾を全く含まない元のＤＮＡ断片に対応する、セルフリーＤＮＡ断片の３つの別々の群をもたらす。３つの群がプールされて配列決定され、バイオインフォマティクスデコンボリューションを可能にするバーコード化により、初期ＤＮＡ断片の構造が決定される。

好ましい実施形態において、デュアルビオチン濃縮処理を受けるＤＮＡ断片は、セルフリーＤＮＡ断片である。

７．ビオチン／天然５ｍＣ濃縮法：

関連する実施形態が図１６に示されている。前記方法は前のセクションにおけるように開始し、アダプターライゲーションＤＮＡ断片の５ｈｍＣ残基をビオチン化し、続いてストレプトアビジンでプルダウンを行う。ここでは、残っているメチル化ＤＮＡを修飾する代わりに、しかしながら、抗５ｍＣ抗体またはＭＢＤタンパク質を使用して、天然５ｍＣ含有断片を捕捉およびプルダウンする。残りの非メチル化ＤＮＡは、前のセクションで記載したように処理できる。断片の３つの群は、上記のように増幅され、プロセスバーコードでタグ付けされ、プールされ、配列決定され得る。

８．単一ＤＮＡ鎖での５ｍＣ／５ｈｍＣ共起の同定：

本発明はまた、５ｍＣおよび５ｈｍＣが両方とも単一鎖上に存在するＤＮＡ断片の同定を含む、ＤＮＡ断片中の５ｍＣおよび５ｈｍＣ残基を検出するための新規の方法を包含する。

前述のように、第１のステップは、アダプターライゲーションされた５ｈｍＣ含有ＤＮＡ断片を分離するのに効果的な任意の方法を使用して実行することができる。前記方法は、例えば、親和性タグに共有結合する化学選択剤による５ｈｍＣの機能化により、５ｈｍＣ部位に親和性タグを付着することを含む。そのような方法の例が図１７に示されている。図１７において、アダプターライゲーションされた５ｈｍＣ含有断片は、以前に記載したように、親和性タグとしてビオチンを付加した後に、ウリジン二リン酸グルコース－６－アジドによるβＧＴ触媒グルコシル化を使用してアジド基で官能基化される。ストレプトアビジンビーズは、ビオチン化されたＤＮＡ断片をプルダウンするために使用される。この方法で単離されたすべてのＤＮＡ断片は、ビオチン化５ｈｍＣ部位を有することが理解されよう。これらの断片の一部には、未修飾５ｍＣ部位も含まれ得る。次のステップにおいて、以前に記載したように、ＴＥＴ酵素などを使用して断片を酸化し、その結果、５ｍＣ残基を５ｆＣおよび／または５ｃａＣに変換する。先に説明したように、２－ピコリンボランなどの有機ボランを使用して、酸化５ｍＣ部分を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかを行い、ＤＨＵ残基を与える。したがって、この方法で処理されたすべてのＤＮＡ断片には、元々５ｈｍＣ部分および５ｈｍＣ部分の両方を含む少なくとも１つの鎖が含まれた。次に、ＰＣＲ増幅中にプロセスバーコードを、ＤＮＡ修飾種のコンビナトリアル断片分解能のために追加し、その後、プールされた配列決定を行う。

５ｍＣ／５ｈｍＣ共起解析を第２段階に拡張して、５ｍＣ含有断片（５ｈｍＣ含有断片が段階１でプルダウンされたので、５ｈｍＣを含まない断片）を同定することができる。段階１の後の残りのＤＮＡには、非メチル化ＤＮＡと５ｍＣを含むＤＮＡが含まれる。これらの断片は、段階１におけるように、ＴＥＴ酵素等を用いて酸化反応に供し、それによって５ｍＣ残基を５ｆＣおよび５ｃａＣ残基に変換する。２－ピコリンボランなどの有機ボランは、５ｆＣおよび５ｃａＣ残基をＤＨＵに変換し、段階１におけるように、前記方法は、プロセスバーコードのＰＣＲ追加、ＤＮＡ修飾種のコンビナトリアル断片分解能、およびプールされた配列決定で続ける。そのような代表的な方法は、図１８に概略的に示す。

９．その他の方法：

別の実施形態において、上記の方法のいずれかは、公知の配列の選択されたオリゴヌクレオチドを５ｈｍＣ部位のための親和性タグとして使用でき、その結果、そのオリゴヌクレオチドに相補的な配列を有する支持体結合プローブとのハイブリダイゼーションを使用して、オリゴヌクレオチドタグ付き５ｈｍＣ部位をプルダウンできる。この方法の例は、図１９のスキームで提供される。

Claims

セルフリーＤＮＡ試料中のアダプターライゲーションされた標的ＤＮＡにおける５ｈｍＣ位置を同定するための方法であって、該方法が、
（ａ）５ｍＣに影響を与えることなく、該標的ＤＮＡにおける５ｈｍＣを酸化試薬により酸化して、酸化５ｈｍＣを含有するＤＮＡを得るステップであって、該酸化５ｈｍＣが、５ｃａＣ、５ｆＣ、およびそれらの組み合わせから選択される、ステップ；
（ｂ）酸化５ｈｍＣを含有する該ＤＮＡをピリジンボランと反応させて、該酸化５ｈｍＣを還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかをして、それにより、該酸化５ｈｍＣの代わりにＤＨＵを含有する修飾ＤＮＡを提供するステップ；
（ｃ）該修飾ＤＮＡを増幅および配列決定して、５ｈｍＣを示す配列読み取りを提供するステップ；および
（ｄ）該５ｈｍＣを示す配列読み取りと該標的分子について得られた標準配列読み取りとを比較するステップであって、該標準配列読み取りにおけるＣから該５ｈｍＣを示す配列読み取りにおけるＴへの変化が、５ｈｍＣ位置を示す、ステップ
を含む、方法。
ステップ（ａ）から（ｃ）が、任意の中間体を単離することなく実施される、請求項１に記載の方法。
ステップ（ａ）から（ｃ）が、バイサルファイト非存在下で実施される、請求項１に記載の方法。
ステップ（ａ）が、化学酸化試薬を使用して実施される、請求項１に記載の方法。
前記化学酸化試薬が過ルテニウム酸塩である、請求項４に記載の方法。
前記アダプターライゲーションされた標的ＤＮＡが、試料識別子配列と、断片識別子配列および鎖識別子配列から選択される少なくとも１つの追加の分子バーコードとを含有するアダプターを含む、請求項１に記載の方法。
前記アダプターライゲーションされた標的ＤＮＡが、断片識別子配列および鎖識別子配列の両方を含む、請求項６に記載の方法。
前記セルフリーＤＮＡが、二本鎖ＤＮＡを含む、請求項１に記載の方法。
前記セルフリーＤＮＡが、一本鎖ＤＮＡを含む、請求項１に記載の方法。