JP7206284B2 - Dna、特にセルフリーdnaのエピジェネティック解析の方法 - Google Patents

Dna、特にセルフリーdnaのエピジェネティック解析の方法 Download PDF

Info

Publication number
JP7206284B2
JP7206284B2 JP2020543880A JP2020543880A JP7206284B2 JP 7206284 B2 JP7206284 B2 JP 7206284B2 JP 2020543880 A JP2020543880 A JP 2020543880A JP 2020543880 A JP2020543880 A JP 2020543880A JP 7206284 B2 JP7206284 B2 JP 7206284B2
Authority
JP
Japan
Prior art keywords
dna
5hmc
residues
cell
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020543880A
Other languages
English (en)
Other versions
JPWO2019160994A5 (ja
JP2021513358A (ja
Inventor
パトリック エー. アレンスドルフ,
ダメク スペイセック,
チュンシャオ ソン,
Original Assignee
ブルースター ジェノミクス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ブルースター ジェノミクス, インコーポレイテッド filed Critical ブルースター ジェノミクス, インコーポレイテッド
Publication of JP2021513358A publication Critical patent/JP2021513358A/ja
Publication of JPWO2019160994A5 publication Critical patent/JPWO2019160994A5/ja
Application granted granted Critical
Publication of JP7206284B2 publication Critical patent/JP7206284B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H1/00Processes for the preparation of sugar derivatives
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07JSTEROIDS
    • C07J1/00Normal steroids containing carbon, hydrogen, halogen or oxygen, not substituted in position 17 beta by a carbon atom, e.g. estrane, androstane
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/115Characterised by chemical treatment oxidising agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/164Methylation detection other then bisulfite or methylation sensitive restriction endonucleases

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

本発明は、概してバイオテクノロジーに関し、より詳細にはセルフリーDNAのエピジェネティック解析に関する。本発明は、ゲノミクス、医学、診断学、およびエピジェネティック研究の分野で有用性を見出す。
エピジェネティクスの分野では、特定のDNA修飾、特に修飾シトシン残基5-メチルシトシン(5mC)およびその一次酸化産物5-ヒドロキシメチルシトシン(5hmC):
Figure 0007206284000001

の検出が必要である。
最初、5hmCは潜在的に重要な修飾として後で特定されるまで特定されなかったため、研究者は5mCに焦点を合わせた。単一塩基の解像度で未修飾のシトシン残基と5mC残基とを区別するために、バイサルファイトがスキーム1のプロセスでシトシン残基をジヒドロウラシル残基に急速に変換する限り、DNAエピジェネティック解析では通常、バイサルファイト試薬の使用が必要であった。
Figure 0007206284000002

一方、スキーム2に示すように、5mCで非常に低い変換率を示す。
Figure 0007206284000003
しかしながら、単一塩基解像度配列決定におけるバイサルファイトの使用において2つの重大な欠点がある。第1に、バイサルファイトは、DNAの大幅な分解を引き起こし、90%以上にもなる。これは、セルフリーDNAには通常血漿1mLあたり数ナノグラムのDNAしか含まれていないため、セルフリーDNA環境内など、非常に少量のDNAでの手法を実装することを不可能にする。第2に、バイサルファイト法は、シトシンからチミンへの完全な変換を仮定し、バイサルファイトプロセスを偽陽性の影響を受けやすくし、1%の非変換率でも10~15%以上の偽陽性の読み取りにつながる。完全な変換に依存すると、プライマーの設計が困難になり、配列決定の読み取りのマッピング率が低くなり、配列決定の費用が全体的に増加する。
エピジェネティクスの分野が発展するにつれて、別のDNA修飾、5hmCの検出は、5mCの検出と同様に潜在的に重要であることが証明された。5mC修飾は一般にCpGジヌクレオチド内で起こるが、天然の5hmC残基は他の位置に出現する傾向がある。さらに、5hMCの発生は、5mCの発生よりもはるかに少ない頻度であり、組織の種類によって、通常は約10:1の比率であり(Nestor et al.(2012)Genome Biology 13:R84を参照)、5mCは全DNA塩基の約1%を示す。5hmCは、転写、DNA脱メチル化、および異常な5hmCパターンの場合は腫瘍形成を含むさまざまなプロセスに関与していることが確立されているが、5hmCの分子機能が、理解され始めたばかりである。Tahiliani et al. (2009) Science 324(5929):930-035 (2009); Guo et al. (2011) Cell 145:423-434; Wu et al. (2011) Genes & Development 25:679-684; Ko et al. (2010) Nature 468:839-843; および Robertson et al. (2011) Biochem. Biophys. Res. Comm. 411(1):40-3を参照。5hmCはTET1などのTen-Eleven Translocation(TET)酵素による5mCの触媒酸化から形成される、安定なDNA修飾であることも知られている。
バイサルファイト配列決定は、5mCと5hmCとを区別せず、そのため、5mCおよび5hmC残基を個別に検出するための他の方法が必要である。上記のように、5hmCは5mCよりもはるかに少ない頻度で現れるため、5hmCを検出する任意の方法は、識別されたすべての5hmC残基の画分に関して高い効率と高い選択性を示す必要があり、これは、5hmCとして識別された実質的にすべての残基が、実際には5hmC残基であるはずであることを意味する。スキーム3に示すように:
Figure 0007206284000004

酵素は5mCを修飾せずに5hmCを選択的にグルコシル化するため、T4バクテリオファージ酵素、β-グルコシルトランスフェラーゼ(β-GT)によるグルコシル化を伴うDNAの5hmCを検出するいくつかの方法が報告されている。
例えば、RobertsonらがJ-結合タンパク質を使用して、グルコシル化5hmC残基を持つ標的DNA断片をプルダウンすることについて記載している(Robertson et al. (2011) Nuc. Acids Res. 39, e55を参照)。他の人たちは、5mCと5hmCとを区別するために5hmCに対して作られた抗体を使用する可能性を提案している。最近では、5hmC残基の選択的グルコシル化は、例えば、アジド部分により6位で官能基をもたせたウリジン二リン酸(UDP)グルコースでのグルコシル化によって、これらの位置にアジド基を提供する方法で行われている。これらの位置でアジド基を提供する5hmC残基のこの選択的反応の後に、アルキン官能化ビオチンとの自発的な1,3付加環化反応が続き、これは、当該分野で一般的に「クリックケミストリー」と呼ばれる反応の一種である。これらのビオチン化5hmC残基を含むDNA断片は、その後ストレプトアビジンビーズでプルダウンできる。そのような方法を詳細に記載している、Quakeらの国際公開2017/176630号を参照されたい。5hmC残基を選択的にグルコシル化することにより5mCと5hmCとを区別する方法に関する、Heらの米国特許第8,741,567号およびLuらの米国特許出願公開第2017/0253924号も参照のこと。
しかしながら、特に、例えばセルフリーDNA解析で使用されるような、非常に小さい試料サイズで、単一塩基解像度配列決定を実行する代替方法の必要性が残っている。理想的な方法は、正常なシトシン残基に影響を与えることなく、単一塩基解像度で修飾されたシトシン残基を検出する。最適には、5mCおよび5hmCの両方の残基を含む単一DNA鎖の場合でも、前記方法を容易に適応し、5mCに加えて、または5mCの代わりに5hmCを検出できる。5mCと同様5hmCを塩基解像度で個別に検出する方法は、プロセスが両方のエピジェネティックマーカーのマッピングを可能にするため、非常に重要になる可能性がある。非毒性試薬の使用および穏やかな反応条件は、DNA分解を回避または少なくとも最小限に抑えるために好ましい。最後に、理想的な方法では、DNA断片に少なくとも1つの分子バーコード(または「配列バーコード」)、すなわち、配列決定中に、分子バーコードを含む各DNA鎖または断片の1つ以上の特徴を識別するのに役立つ、短い、唯一のオリゴヌクレオチド配列をタグ付けすることを可能にする。
したがって、本発明は、セルフリーDNAのエピジェネティック解析のための新規な方法を提供することにより、当該分野における上記の必要性を扱う。
第1の実施形態において、セルフリーDNA中の酸化5-メチルシトシン残基をジヒドロウラシル残基に変換する方法が提供され、前記方法は、5-カルボキシシトシン、5-ホルミルシトシン、およびこれらの組み合わせから選択される少なくとも1つの酸化5-メチルシトシン残基を含むセルフリーDNAを接触させることを含み、有機ボランは、少なくとも1つの酸化5-メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかに効果的であり、それによりその場所にジヒドロウラシル残基を提供する。

前述の実施形態の一局面において、有機ボランは、ボランと、窒素複素環および三級アミンから選択される窒素含有化合物との錯体を含む。
実施形態の別の局面において、還元、脱アミノ化、および脱炭酸は、任意の中間体を単離することなく、すなわち「ワンポット」または「ワンチューブ」反応として実施される。
実施形態の別の局面において、前記方法は、バルサルファイト試薬の全くの非存在下で行われる。
実施形態のさらに別の局面において、セルフリーDNAは、セルフリーDNAの選択された領域を含み、ここで「領域」は、DNA鎖に沿った位置または配列ベースの組成のいずれかを指す。関連する局面において、セルフリーDNAは、セルフリーDNAの選択された領域に加えて、またはその代わりに、セルフリーDNAの選択された断片を含む。
実施形態のさらなる局面において、セルフリーDNAは二本鎖DNAを含む。
実施形態の追加の局面において、セルフリーDNAは一本鎖DNAを含む。
別の実施形態において、以下を含む反応混合物が提供される:
(a)5-カルボキシシトシン、5-ホルミルシトシン、およびそれらの組み合わせから選択される少なくとも1つの酸化5-メチルシトシン残基を含むセルフリーDNAの試料;ならびに

(b)少なくとも1つの酸化5-メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかに有効であるのに有効な有機ボラン。
追加の実施形態において、セルフリーDNA中の5-メチルシトシン残基の存在および位置を検出するための方法を提供し、ここで前記方法は以下を含む:
(a)断片化されたアダプターライゲーションセルフリーDNA中の5-ヒドロキシメチルシトシン残基を修飾して、その上に親和性タグを提供するステップであって、ここで親和性タグはセルフリーDNAからの修飾5-ヒドロキシメチルシトシン含有DNAの除去を可能にするステップ;
(b)セルフリーDNAから修飾5-ヒドロキシメチルシトシン含有DNAを除去し、未修飾5-メチルシトシン残基を含むDNAを残すステップ;
(c)未修飾5-メチルシトシン残基を酸化して、5-カルボキシシトシン、5-ホルミルシトシン、およびそれらの組み合わせから選択される酸化5-メチルシトシン残基を含むDNAを得るステップ;

(d)酸化5-メチルシトシン残基を含むDNAを、酸化5-メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化いずれかに有効な有機ボランと接触させ、それにより、酸化5-メチルシトシン残基の代わりにジヒドロウラシル残基を含むDNAを提供するステップ;
(e)ジヒドロウラシル残基を含むDNAを増幅および配列決定するステップ;
(f)(e)における配列決定の結果から5-メチル化パターンを決定するステップ。
この実施形態の一局面において、前記方法はさらに以下を含む。
(g)ステップ(b)においてセルフリーDNA試料から除去された5-ヒドロキシメチルシトシン含有DNAにおけるヒドロキシメチル化パターンを同定するステップ。
実施形態の別の局面において、親和性タグはビオチンで構成され、ステップ(a)は、ビオチンによる5-ヒドロキシメチルシトシン残基の選択的標識を含む。関連する局面において、ステップ(b)は、ビオチン化DNAを支持体結合ストレプトアビジンと接触させることを含む。
実施形態の別の局面において、親和性タグは、所定の配列を有する選択されたオリゴヌクレオチドで構成され、ステップ(a)は、オリゴヌクレオチドによる5-ヒドロキシメチルシトシン残基の選択的標識を含む。関連する局面において、ステップ(b)は、オリゴヌクレオチド標識DNAを、所定の配列に実質的に相補的な配列を含む支持体結合オリゴヌクレオチドと接触させることを含む。
実施形態の追加の局面において、ステップ(c)は、酵素的に、例えば、Ten-Eleven Translocation(TET)酵素を使用して実行される。
実施形態のさらなる局面において、セルフリーDNA試料は、少なくとも1つの5-メチルシトシン残基および少なくとも1つの5-ヒドロキシメチルシトシン残基を有する少なくとも1つのDNA鎖を含む。
追加の局面において、前記方法は、ステップ(e)の前に、複数の二本鎖DNA断片のそれぞれに少なくとも1つの配列バーコードを取り付けることをさらに含む。関連する局面において、少なくとも1つの配列バーコードは、DNA断片が受けるプロセスに対応するDNA断片の特徴を示す個々のバーコードを含む。
別の実施形態において、本発明は、セルフリーDNA中の5-メチルシトシン残基および5-ヒドロキシメチルシトシン残基をジヒドロウラシル残基に変換するためのキットを提供し、上記キットは、5-メチルシトシンおよび5-ヒドロキシメチルシトシン残基を酸化して、酸化5-メチルシトシン残基を提供するための試薬、ならびに酸化5-メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化に有効な有機ボランをを含む。
さらなる実施形態において、本発明は、セルフリーDNA試料中の5-メチルシトシン残基を同定するためのキットを提供し、上記キットは、5-ヒドロキシメチルシトシン残基を修飾し、その上に親和性タグを提供する;修飾5-ヒドロキシメチルシトシン残基を試料から取り除く;未修飾5-メチルシトシン残基を酸化し、酸化5-メチルシトシン残基を提供する;ならびに酸化5-メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかに有効な有機ボランのための個々の試薬組成物を含む。
本発明は、例えば、以下の項目を提供する。
(項目1)
セルフリーDNA中の酸化5-メチルシトシン残基をジヒドロウラシル残基に変換する方法であって、5-カルボキシシトシン、5-ホルミルシトシン、およびそれらの組み合わせから選択される少なくとも1つの酸化5-メチルシトシン残基を含むセルフリーDNAを、前記少なくとも1つの酸化5-メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかを行うのに有効な有機ボランと接触させ、、それによりその代わりにジヒドロウラシル残基を提供することを含む方法。
(項目2)
前記少なくとも1つの酸化5-メチルシトシン残基が、5-カルボキシシトシンを含む、項目1記載の方法。
(項目3)
前記少なくとも1つの酸化5-メチルシトシン残基が、5-ホルミルシトシンを含む、項目1記載の方法。
(項目4)
前記少なくとも1つの酸化5-メチルシトシン残基が、5-カルボキシシトシンおよび5-ホルミルシトシンの組み合わせを含む、項目1に記載の方法。
(項目5)
前記有機ボランが、ボランと、窒素複素環および第3級アミンから選択される窒素含有化合物との錯体を含む、項目1から4のいずれか一項に記載の方法。
(項目6)
前記有機ボランが、ボランと窒素複素環との錯体を含む、項目5に記載の方法。
(項目7)
前記窒素複素環が、1~4個の低級アルキル基で必要に応じて置換されたピリジンを含む、項目6に記載の方法。
(項目8)
前記窒素複素環が、ピリジン、2-メチルピリジン、または5-エチル-2-メチルピリジンを含む、項目7記載の方法。
(項目9)
前記窒素複素環が、2-メチルピリジンを含み、前記有機ボランが2-ピコリンボランである、項目8記載の方法。
(項目10)
前記有機ボランが、ボランと第3級アミンとの錯体を含む、項目5に記載の方法。
(項目11)
前記第3級アミンが、トリエチルアミンおよびトリ(t-ブチル)アミンから選択される、項目10に記載の方法。
(項目12)
還元、脱アミノ化、および脱炭酸が、いかなる中間体を単離することなく行われる、項目1記載の方法。
(項目13)
前記方法が、バイサルファイトの非存在下で行われる、項目1記載の方法。
(項目14)
(a)5-カルボキシシトシン、5-ホルミルシトシン、およびそれらの組み合わせから選択される少なくとも1つの酸化5-メチルシトシン残基を含むセルフリーDNAの試料;ならびに
(b)前記少なくとも1つの酸化5-メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかを行うのに有効な有機ボラン
を含む反応混合物。
(項目15)
前記少なくとも1つの酸化5-メチルシトシン残基が、5-カルボキシシトシンを含む、項目14に記載の混合物。
(項目16)
前記少なくとも1つの酸化5-メチルシトシン残基が、5-ホルミルシトシンを含む、項目14に記載の混合物。
(項目17)
前記少なくとも1つの酸化5-メチルシトシン残基が、5-カルボキシシトシンと5-ホルミルシトシンとの組み合わせを含む、項目14に記載の混合物。
(項目18)
前記有機ボランが、ボランと、窒素複素環および第3級アミンから選択される窒素含有化合物との錯体を含む、項目15から17のいずれか一項に記載の混合物。
(項目19)
前記有機ボランが、ボランと窒素複素環との錯体を含む、項目18に記載の混合物。
(項目20)
前記窒素複素環が、1~4個の低級アルキル基で必要に応じて置換されたピリジンを含む、項目19に記載の混合物。
(項目21)
前記窒素複素環が、ピリジン、2-メチルピリジン、または5-エチル-2-メチルピリジンを含む、項目20記載の混合物。
(項目22)
前記窒素複素環が、2-メチルピリジンを含み、前記有機ボランが、2-ピコリンボランである、項目21に記載の混合物。
(項目23)
前記有機ボランが、ボランと第3級アミンとの錯体を含む、項目18に記載の混合物。
(項目24)
前記第3級アミンが、トリエチルアミンおよびトリ(t-ブチル)アミンから選択される、項目23に記載の混合物。
(項目25)
前記混合物がバイサルファイトを実質的に含まない、項目14に記載の混合物。
(項目26)
セルフリーDNA中の5-メチルシトシン残基の存在および位置を検出するための方法であって、前記方法が:
(a)断片化されたアダプターライゲーションセルフリーDNA中の5-ヒドロキシメチルシトシン残基を修飾し、その上に親和性タグを提供するステップであって、ここで前記親和性タグにより前記セルフリーDNAから修飾5-ヒドロキシメチルシトシン含有DNAを除去できるステップ;
(b)前記セルフリーDNAから前記修飾5-ヒドロキシメチルシトシン含有DNAを除去し、未修飾5-メチルシトシン残基を含むDNAを残すステップ;
(c)前記未修飾5-メチルシトシン残基を酸化し、酸化5-メチルシトシン残基を含むDNAを得るステップ;
(d)前記酸化5-メチルシトシン残基を含むDNAを、前記酸化5-メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかを行うのに有効な有機ボランと接触させ、それにより、前記酸化5-メチルシトシン残基の代わりにジヒドロウラシル残基を含むDNAを提供するステップ;
(e)前記ジヒドロウラシル残基を含むDNAを増幅および配列決定するステップ;
(f)(e)中の前記配列決定の結果から5-メチル化パターンを決定するステップ
を含む、方法。
(項目27)
(g)ステップ(b)で前記セルフリーDNA試料から除去された5-ヒドロキシメチルシトシン含有DNAにおけるヒドロキシメチル化パターンを特定するステップ、
をさらに含む、項目26に記載の方法:
(項目28)
ステップ(a)から(d)が、バイサルファイトの非存在下で行われる、項目26または項目27に記載の方法。
(項目29)
ステップ(a)から(d)が、いかなる中間体を単離することなく行われる、項目26または項目27に記載の方法。
(項目30)
前記親和性タグがビオチンを含み、ステップ(a)がビオチンでの5-ヒドロキシメチルシトシン残基の選択的標識を含む、項目26または項目27に記載の方法。
(項目31)
ステップ(b)が前記ビオチン化DNAを支持体結合ストレプトアビジンと接触させることを含む、項目30に記載の方法。
(項目32)
ステップ(c)が酵素的に行われる、項目26または項目27に記載の方法。
(項目33)
ステップ(c)がTen-Eleven Translocation(TET)酵素を使用して行われる、項目32に記載の方法。
(項目34)
ステップ(c)が化学的に行われる、項目26または項目27に記載の方法。
(項目35)
前記セルフリーDNAが、セルフリーDNAの選択された領域を含む、項目1に記載の方法。
(項目36)
前記セルフリーDNA試料が、セルフリーDNAの選択された領域を含む、項目26または項目27に記載の方法。
(項目37)
前記アダプターライゲーションDNA断片が、試料識別子配列、断片識別子配列、および鎖識別子配列から選択される少なくとも1つの分子バーコードを含むアダプターを含む、項目26または27に記載の方法。
(項目38)
ステップ(e)において、プロセス識別子配列を含む分子バーコードが、前記DHU含有DNAに付加される、項目26または項目27に記載の方法。
(項目39)
前記セルフリーDNAが、二本鎖DNAを含む、項目26または項目27に記載の方法。
(項目40)
前記セルフリーDNAが、一本鎖DNAを含む、項目26または項目27に記載の方法。
(項目41)
前記親和性タグが、所定の配列を有する選択されたオリゴヌクレオチドタグで構成されており、ステップ(a)が、前記オリゴヌクレオチドタグによる5-ヒドロキシメチルシトシン残基の選択的標識を含む、項目26または項目27に記載の方法。
(項目42)
ステップ(b)が、オリゴヌクレオチドタグ付きDNAを、前記所定の配列に実質的に相補的な配列を含む支持体結合オリゴヌクレオチドと接触させることを含む、項目41に記載の方法。
(項目43)
前記アダプターライゲーションDNA断片が、断片識別子配列および鎖識別子配列の両方を含む、項目37に記載の方法。
(項目44)
処理された鎖における前記断片識別子配列および前記鎖識別子配列を分析して、鋳型DNA断片が完全に修飾またはヘミ修飾されているかを決定することをさらに含む、項目43に記載の方法。
(項目45)
セルフリーDNAの5-メチルシトシン残基をジヒドロウラシル残基に変換するためのキットであって、前記5-ヒドロキシメチルシトシン残基をブロックするためのブロッキング試薬組成物、ヒドロキシメチル化を超えて前記5-メチルシトシン残基を酸化して酸化5-メチルシトシン残基を提供する酸化試薬、および前記酸化5-メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかを行うのに有効な有機ボランを含む、キット。
(項目46)
セルフリーDNA試料中の5-メチルシトシン残基を同定するためのキットであって、5-ヒドロキシメチルシトシン残基を修飾してその上に親和性タグを提供し、前記試料から前記修飾5-ヒドロキシメチルシトシン残基を除去し、ヒドロキシメチル化を超えて未修飾5-メチルシトシン残基を酸化して酸化5-メチルシトシン残基を提供するための個々の試薬組成物、ならびに前記酸化5-メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかを行うのに有効な有機ボランを含む、キット。
(項目47)
セルフリーDNA中の5-メチルシトシン残基および5-ヒドロキシメチルシトシン残基の存在および位置を検出する方法であって、前記方法が、
(a)断片化された、アダプターライゲーションセルフリーDNAの5-ヒドロキシメチルシトシン残基をビオチン化して、ビオチン化5-ヒドロキシメチルシトシン含有DNA断片の最初の群を形成するステップ;
(b)前記セルフリーDNAからビオチン化5-ヒドロキシメチルシトシン含有DNA断片の最初の群を除去し、未修飾DNAと未修飾5-メチルシトシン残基を含むDNA断片とを残すステップ;
(c)未修飾5-メチルシトシン断片を含むDNA断片を酸化して、それの代わりに5-ヒドロキシメチルシトシン残基を提供し、その後ビオチン化して、ビオチン化5-ヒドロキシメチルシトシン含有DNA断片の第2の群を提供するステップ;
(d)ビオチン化5-ヒドロキシメチルシトシン含有DNA断片の第2の群を除去するステップ;ならびに
(e)前記最初の群のDNA断片および第2の群のDNA断片をプールし、増幅し、配列決定するステップ、
を含む方法。
(項目48)
(f)ステップ(e)の前記結果から、5-メチル化パターン、5-ヒドロキシメチル化パターン、または5-メチル化パターンおよび5-ヒドロキシメチル化パターンの両方を決定することをさらに含む、項目46に記載の方法。
(項目49)
セルフリーDNAの単一のDNA鎖における5-メチルシトシンと5-ヒドロキシメチルシトシンとの共起を同定する方法であって、
(a)断片化された、アダプターライゲーションセルフリーDNA中の5-ヒドロキシメチル残基を、前記セルフリーDNAからタグ付きDNA断片を選択的に除去できる親和性タグで官能基化するステップ;
(b)前記除去されたタグ付きDNA断片を酸化して、その結果、未修飾5-メチルシトシン残基が、5-ホルミルシトシン、5-カルボキシシトシン残基、またはそれらの組み合わせから選択される酸化5-メチルシトシン残基に変換されるステップ;
(c)(b)の前記酸化タグ付きDNA断片を、前記酸化5-メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかを行うのに有効な有機ボランと接触させ、それにより、前記酸化5-メチルシトシン残基の代わりにジヒドロウラシル残基を含むDNAを提供するステップ;ならびに
(d)ジヒドロウラシル残基を含む前記DNAを増幅し、配列決定するステップ、
を含む、方法。
(項目50)
DNA試料中の5-メチルシトシン残基および5-ヒドロキシメチルシトシン残基の存在および位置を検出するための方法であって、前記方法が、
(a)前記DNA試料からのタグ付き5-ヒドロキシメチルシトシン含有DNAの選択的除去を可能にする親和性タグを使用して、前記DNA試料内の5-ヒドロキシメチルシトシン残基を官能化するステップ;
(b)前記タグ付きDNA断片を前記DNA試料から除去し、未修飾DNAおよび未修飾5-メチルシトシン残基を含むDNAを残すステップ;
(c)前記5-メチルシトシン残基を修飾して、前記5-メチルシトシン含有DNAの選択的除去を可能にするステップ;
(d)前記修飾5-メチルシトシン含有DNAを除去するステップ;ならびに
(e)前記タグ付き5-ヒドロキシメチル含有DNAおよび前記修飾5-メチルシトシン含有DNAにプロセス識別子配列を追加するステップであって、ここで各プロセス識別子配列が、前記タグ付きDNAおよび前記修飾DNAを識別および/または分離するために使用されるプロセスを識別するステップ。
(項目51)
前記DNA試料が、セルフリーDNAを含む、項目50に記載の方法。
(項目52)
前記セルフリーDNAが、試料識別子配列、断片識別子配列、および鎖識別子配列から選択される分子バーコードを含む少なくとも1つのアダプターとアダプターライゲーションされる、項目51に記載の方法。

図1は、2-ピコリンボランと5-カルボキシシトシンとの仮定の反応産物を概略的に示す。
図2は、5-カルボキシシトシン(上)および5-カルボキシシトシンと2-ピコリンボランの反応産物の質量スペクトルを提供する。
図3は、5-カルボキシシトシンと2-メチルピリミジンとの反応産物のジヒドロウラシルとの同一性を確認する追加のスペクトルを提供する。 図3は、5-カルボキシシトシンと2-メチルピリミジンとの反応産物の ジヒドロウラシルとの同一性を確認する追加のスペクトルを提供する。 図3は、5-カルボキシシトシンと2-メチルピリミジンとの反応産物の ジヒドロウラシルとの同一性を確認する追加のスペクトルを提供する。
図4は、2-ピコリンボランボランとの反応による5-カルボキシシトシンのジヒドロウラシルへの変換に関与する可能性のある反応メカニズムを概略的に示す。
図5は、2-ピコリンボランボランとの反応による5-ホルミルシトシンのジヒドロウラシルへの変換に関与する可能性のある反応メカニズムを概略的に示す。
図6および7は、2-ピコリンボランとの反応の前および後の両方で、5位でホルミル、カルボキシル、エチルアミド、およびエトキシイミノで置換されたシトシンの質量スペクトルを提供する。 図6および7は、2-ピコリンボランとの反応の前および後の両方で、5 位でホルミル、カルボキシル、エチルアミド、およびエトキシイミノで置換されたシトシンの質量スペクトルを提供する。 図6および7は、2-ピコリンボランとの反応の前および後の両方で、5位でホルミル、カルボキシル、エチルアミド、およびエトキシイミノで置換されたシトシンの質量スペクトルを提供する。 図6および7は、2-ピコリンボランとの反応の前および後の両方で、5 位でホルミル、カルボキシル、エチルアミド、およびエトキシイミノで置換されたシトシンの質量スペクトルを提供する。
図8は、酵素酸化剤、随意のブロッキング基、および有機ボラン2-メチルピリミジンボランを使用して、5-メチルシトシンおよび5-ヒドロキシメチルシトシンをジヒドロウラシルに段階的に変換する方法を概略的に示す。 図8は、酵素酸化剤、随意のブロッキング基、および有機ボラン2-メチ ルピリミジンボランを使用して、5-メチルシトシンおよび5-ヒドロキシメチルシトシンをジヒドロウラシルに段階的に変換する方法を概略的に示す。
図9は、化学的酸化剤を使用して5-ヒドロキシメチルシトシンをジヒドロウラシルに段階的に変換し、続いて有機ボラン2-メチルピリミジンボランと反応させるための化学的方法を概略的に示す。
図10は、2-ピコリンボランとの反応前後の5-メチルシトシン、5-ヒドロキシメチルシトシン、および5-グルコメチルシトシンの質量スペクトルを示す。 図10は、2-ピコリンボランとの反応前後の5-メチルシトシン、5 -ヒドロキシメチルシトシン、および5-グルコメチルシトシンの質量スペクトルを示す。 図10は、2-ピコリンボランとの反応前後の5-メチルシトシン、5 -ヒドロキシメチルシトシン、および5-グルコメチルシトシンの質量スペクトルを示す。
図11は、セルフリーDNA断片中の5mC残基の存在および位置を検出するための方法の一実施形態を概略的に示す。
図12は、本発明に従って解析されたDNA断片に分子バーコードを組み込むためのハイブリッドアダプター法の最初の3つのステップを概略的に示す。
図13は、図12のハイブリッドアダプタ-法の残りのステップを概略的に示す。
図14は、試料識別子配列、断片識別子配列、および鎖識別子配列のうちの少なくとも1つで既にバーコード化されているDNA断片にプロセスバーコードを組み込むための方法を概略的に示す。
図15は、本発明の「二重ビオチン」濃縮方法を概略的に示す。
図16は、本発明の「ビオチン/天然5mC」濃縮方法を概略的に示す。
図17は、少なくとも1つの鎖が5mCおよび5hmC残基の両方を含む、DNA断片を同定するための方法を概略的に示す。
図18は、図17の方法の拡張を概略的に示す。ここで、未修飾のDNA断片および5mC含有DNA断片を含む、残りのDNA断片を解析する。
図19は、オリゴヌクレオチドが親和性タグとして使用される本発明の方法を概略的に示す。
(発明の詳細な説明)
1.定義および用語:
他に定義されない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が関係する当業者によって一般に理解される意味を有する。本発明の説明に特に重要な特定の用語を以下に定義する。他の関連する用語は、Quakeらの国際特許公開番WO2017/176630「Noninvasive Diagnostics by Sequencing 5-Hydroxymethylated Cell-Free DNA.」で定義される。
本明細書および添付の特許請求の範囲において、単数形「a」、「an」、および「the」は、文脈が明らかに他に指示しない限り、複数の指示対象を含む。したがって、例えば、「構成要素」は、単一の構成要素だけでなく、2つ以上の異なる構成要素の組み合わせなども指す。
数値範囲は、範囲を定義する数を含む。他に明記しない限り、核酸は左から右に5’から3’の向きで書かれる;アミノ酸配列は、左から右にアミノからカルボキシの向きでそれぞれ書かれる。
本明細書で提供される表題は、本発明の様々な局面または実施形態を限定するものではない。したがって、すぐに以下に定義される用語は、明細書全体を参照することにより、より完全に定義される。
他に定義しない限り、本明細書で使用されるすべての技術用語および科学用語は、本発明が属する当業者によって一般に理解されるのと同じ意味を有する。Singletonら、Dictionary of Microbiology and Molecular Biology、第2版(New York: John Wiley and Sons, 1994)、およびHale&Markham、The Harper Collins Dictionary of Biology (New York: Harper Perennial, 1991)は、当業者に、本明細書で使用される用語の多くの一般的な意味を提供する。それでも、参照の明確さおよび容易さのために、特定の用語が以下に定義される。
本明細書で使用される用語「試料」は、必ずしもそうではないが、典型的には液体形態で、対象となる1つ以上の分析物を含む材料または材料の混合物に関する。
本明細書で使用される用語「核酸試料」は、少なくとも1つの核酸を含む試料を示す。本明細書で使用される核酸試料は、それらが核酸配列を含む複数の異なる分子を含み得るという点で複合体であり得る。哺乳類(例えば、マウスまたはヒト)由来のゲノムDNAは、複合試料の一種である。複合試料は、少なくとも10,000、少なくとも100,000、少なくとも10、少なくとも10、少なくとも10または少なくとも10またはそれ以上の異なる核酸分子を有し得る。DNA標的は、ゲノムDNA、または人工DNAコンストラクトなどの任意の供給源に由来し得る。本明細書では、核酸を含む任意の試料、例えば、組織培養細胞または組織の試料から作製されたゲノムDNAを使用することができる。核酸試料は、歯、骨、毛髪または骨などの試料を含む、任意の適切な供給源から作製することができる。
用語「ヌクレオチド」は、公知のプリンおよびピリミジン塩基だけでなく、修飾された他の複素環式塩基も含む部分を含むことを意図している。そのような修飾には、メチル化プリンもしくはピリミジン、アシル化プリンもしくはピリミジン、アルキル化リボースまたは他の複素環が含まれる。さらに、用語「ヌクレオチド」は、ハプテンまたは蛍光標識を含み、従来のリボース糖およびデオキシリボース糖だけでなく、他の糖も含み得る部分を含む。修飾ヌクレオシドまたはヌクレオチドは、糖部分の修飾も含み、ここで、例えば、1つ以上のヒドロキシル基がハロゲン原子または脂肪族基で置き換えられているか、またはエーテル、アミンなどとして官能基を持たせている。
用語「核酸」および「ポリヌクレオチド」は、本明細書では互換的に使用され、例えばデオキシリボヌクレオチドまたはリボヌクレオチドで構成される、任意の長さ、例えば、約2塩基超、約10塩基超、約100塩基超、約500塩基超、1000塩基超、最大で約10,000塩基、またはそれより多くの塩基のポリマーを記載し、酵素的または合成的に生成することができる(例えば、Honkanenらの米国特許第5,948,902号およびそこに引用されている参考文献に記載のPNA)、これは、2つの天然に存在する核酸と類似した配列特異的な方法で天然に存在する核酸とハイブリダイズすることができ、例えば、ワトソン-クリック塩基対相互作用に参加することができる。天然に存在するヌクレオチドには、グアニン、シトシン、アデニンおよびチミン(それぞれG、C、AおよびT)を含む。DNAおよびRNAは、それぞれデオキシリボース糖主鎖およびリボース糖主鎖を有するが、PNAの主鎖はペプチド結合で連結された繰り返しのN-(2-アミノエチル)-グリシン単位で構成される。PNAにおいて、さまざまなプリンおよびピリミジン塩基が、メチレンカルボニル結合によって主鎖に結合されている。ロックされた核酸(LNA)は、隔絶されたRNAとも呼ばれ、修飾RNAヌクレオチドである。LNAヌクレオチドのリボース部分は、2’酸素と4’炭素とを接続する追加のブリッジで修飾される。ブリッジは、リボースを3’-endo(North)構造で「ロック」し、これは、A型二本鎖でよく見られる。LNAヌクレオチドは、必要に応じてオリゴヌクレオチドのDNAまたはRNA残基と混合できる。用語「非構造化核酸、」または「UNA」は、安定性が低下して互いに結合する非天然ヌクレオチドを含む核酸である。
例えば、非構造化核酸は、G’残基およびC’残基を含み得、ここでこれらの残基は、天然に存在しない形態、すなわち、安定性が低下して互いに塩基対を形成するGおよびCの類似体に対応する。しかし、それぞれ天然に存在するCおよびG残基と塩基対を形成する能力を保持する。非構造化核酸は、Barrettらの米国特許公開番号US2005/0233340に記載されている。この定義において、ZNA、つまりzip核酸も含まれる。
本明細書で使用される用語「オリゴヌクレオチド」は、長さが約2~200ヌクレオチド、500ヌクレオチドまでのヌクレオチドの一本鎖多量体を示す。
オリゴヌクレオチドは、合成的であってもよく、または酵素的に作製されてもよく、いくつかの実施形態において、長さが30~150ヌクレオチドである。オリゴヌクレオチドは、リボヌクレオチドモノマー(すなわち、オリゴリボヌクレオチドであり得る)および/またはデオキシリボヌクレオチドモノマーを含み得る。オリゴヌクレオチドは、例えば、長さが10~20、21~30、31~40、41~50、51~60、61~70、71~80、80~100、100~150または150~200ヌクレオチドであり得る。
用語「ハイブリダイゼーション」は、当該分野で知られているように、核酸の鎖が塩基対形成を介して相補鎖と結合するプロセスを指す。中程度から高度のストリンジェンシーのハイブリダイゼーションおよび洗浄条件下で2つの配列が特異的に互いにハイブリダイズする場合、核酸は参照核酸配列に「選択的にハイブリダイズ可能」であると見なされる。中程度および高度のストリンジェンシーのハイブリダイゼーション条件が知られている(例えば、Ausubel, et al., Short Protocols in Molecular Biology, 3rd ed., Wiley & Sons 1995およびSambrook et al., Molecular Cloning: A Laboratory Manual, Third Edition, 2001 Cold Spring Harbor, N.Y.を参照)。高度のストリンジェンシー条件の一例は、50%ホルムアミド、5X SSC、5Xデンハルト溶液、0.5%SDS、100μg/ml変性キャリアDNAでの約42℃でのハイブリダイゼーション、それに続く2X SSCおよび0.5%SDSでの室温での2回、ならびに0.1X SSCおよび0.5%SDSでの42°Cでのさらに2回の洗浄を含む。
用語「プライマー」は、ポリヌクレオチド鋳型と二本鎖を形成すると、核酸合成の開始点として作用し、鋳型に沿ってその3’末端から伸長することができ、その結果伸長2本鎖が形成される、天然または合成いずれかのオリゴヌクレオチドを指す。伸長プロセス中に付加されるヌクレオチドの配列は、鋳型ポリヌクレオチドの配列によって決定される。通常、プライマーは、DNAポリメラーゼによって伸長される。プライマーは一般に、プライマー伸長産物の合成におけるそれらの使用に適合する長さであり、通常、10~75、15~60、15~40、18~30、20~40、21~50、22~45、25~40など、長さが8~100ヌクレオチドの範囲である。典型的なプライマーは、15~45、18~40、20~30、21~25など、10~50ヌクレオチド長の間の範囲、および指定された範囲の間の任意の長さであり得る。いくつかの実施形態において、プライマーは通常、長さが約10、12、15、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、または70ヌクレオチド以下である。
用語「二本鎖」および「二本鎖の」という用語は、本明細書では互換的に使用され、塩基対形成している、すなわち一緒にハイブリダイズしている2つの相補的ポリヌクレオチドを説明する。
用語「決定する」、「測定する」、「評価する」、「査定する」、「分析する」、および「解析する」は、本明細書において互換的に使用され、測定の任意の形態を指し、要素が存在するまたはしないかどうかの決定を含む。これらの用語は、定量的および/または定性的な決定の両方が含まれる。査定は、相対的または絶対的であり得る。したがって、「存在の査定」は、存在する部分の量を決定すること、ならびにそれが存在するかまたは存在しないかを決定することを含む。
用語「使用する」は、その従来の意味を有し、そのような意味では、目的を達成するために方法または組成物を用いること(employing)、例えば、使用すること(putting into service)を意味する。たとえば、プログラムを使用してファイルを作成すると、プログラムが実行されてファイルが作成され、通常、ファイルはプログラムの出力である。別の実施例において、コンピュータファイルが使用される場合、通常、ファイルにアクセスし、読み取り、ファイルに格納されている情報を使用して目的を達成する。同様に、特有の識別子、例えば、バーコードが使用される場合、通常、特有の識別子は、たとえば、特有の識別子に関連付けられた対象またはファイルを識別するために読み取られる。
本明細書で使用される用語「ライゲーション」は、第1のDNA分子の5’末端の末端ヌクレオチドと第2のDNA分子の3’末端の末端ヌクレオチドとの酵素的に触媒された結合を指す;相補鎖も結合することができる;例えば3’~5’;または二本鎖DNAの場合のように一緒に。
「複数」は、少なくとも2つのメンバーを含む。特定の場合において、複数は、少なくとも10、少なくとも100、少なくとも10,000、少なくとも100,000、少なくとも10、少なくとも10、少なくとも10または少なくとも10あるいはそれより多くのメンバーを有し得る。
2つの核酸が「相補的」である場合、核酸の一方の各塩基は、他の核酸中の対応するヌクレオチドと塩基対を形成する。2つの核酸は、互いにハイブリダイズするために完全に相補的である必要はない。
本明細書で使用される用語「分離する」は、2つの要素の物理的分離(例えば、サイズまたは親和性などによる)ならびに1つの要素の分解を指し、他の要素はそのままにしておく。
本明細書で使用される用語「配列決定」は、ポリヌクレオチドの少なくとも10個の連続したヌクレオチドの同一性(例えば、少なくとも20、少なくとも50、少なくとも100または少なくとも200以上の連続したヌクレオチドの同一性)が得られる方法を指す。
本明細書で使用される用語「次世代シーケンシング」または「ハイスループットシーケンシング」は、イルミナ、ライフテクノロジーズ、およびロシュなどによって現在用いられている、いわゆる並列化されたsequencing-by-synthesisまたはsequencing-by-ligationプラットフォームを指す。次世代シーケンシング法には、Oxford Nanopore Technologiesが商品化したようなナノポアシーケンシング法、ライフテクノロジーズが商品化したIon Torrentテクノロジーなどの電子検出法、およびPacific Biosciencesが商品化したような単一分子蛍光ベースの方法も含まれ得る。
用語「アダプター」は、二本鎖DNA分子の両方の鎖にライゲーション可能である核酸を指す。一実施形態において、アダプターはヘアピンアダプターであり得る(すなわち、それ自体と塩基対を形成して、二本鎖ステムおよびループを有する構造を形成する1つの分子であり得、ここで分子の3’および5’末端は、二本鎖DNA分子のそれぞれ5’および3’末端に結合する)。別の実施形態において、アダプターはYアダプターであり得る。別の実施形態において、アダプター自体が、互いに塩基対を形成する2つの別個のオリゴヌクレオチド分子で構成され得る。明らかであるように、アダプターのライゲーション可能な末端は、制限酵素による切断によって作製されるオーバーハングと適合するように設計され得るか、または平滑末端または5’Tオーバーハングを有し得る。用語「アダプター」は、二本鎖および一本鎖の分子を指す。アダプターは、DNAもしくはRNA、またはその2つの混合物であり得る。RNAを含むアダプターは、RNase処理によるまたはアルカリ加水分解により切断可能であり得る。アダプターは、15~100塩基、例えば、50~70塩基であり得るが、この範囲外のアダプターが想定される。
本明細書で使用される用語「アダプターがライゲーションされた」は、アダプターにライゲーションされている核酸を指す。アダプターは、核酸分子の5’末端および/または3’末端にライゲーションすることができる。本明細書で使用する場合、用語「アダプター配列を付加する」は、試料中の断片の末端にアダプター配列を付加する行為を指す。これは、ポリメラーゼを使用して断片の末端を埋め、Aテールを付加し、次にTオーバーハングを含むアダプターをAテール付加された断片にライゲーションすることによって行うことができる。
本明細書で使用される用語「非対称アダプター」は、二本鎖核酸断片の両末端にライゲーションする際、3’末端のタグ配列と同じでも相補的でもない5’タグ配列を含むトップ鎖をもたらすアダプターを指す。非対称アダプターの例は、Weissmanらの米国特許第5,712,126号および6,372,434号、ならびにBignellらの国際特許公開番号WO2009/032167に記載されている。非対称的にタグ付けされた断片は、2つのプライマーによって増幅できる:この2つのプライマーは、鎖の3’末端に付加された第1のタグ配列にハイブリダイズする第1のプライマー;および鎖の5’末端に付加された第2のタグ配列の相補体にハイブリダイズする第2のプライマーである。Yアダプターおよびヘアピンアダプター(ライゲーション後、切断して「Yアダプター」を生成できる)は、非対称アダプターの例である。
用語「Yアダプター」は、対立する配列が相補的ではない二本鎖領域および一本鎖領域を含むアダプターを指す。二本鎖領域の末端は、例えば、ライゲーションまたはトランスポザーゼ触媒反応により、ゲノムDNAの二本鎖断片などの標的分子に結合することができる。Yアダプターにライゲーションされたアダプタータグ付きの二本鎖DNAの各鎖は、一方の末端にYアダプターの一方の鎖、およびもう一方の末端にYアダプターのもう一方の鎖の配列があるという点で非対称的にタグ付けされる。両末端でYアダプターに結合されている核酸分子の増幅により、非対称的にタグ付けされた核酸、つまり、1つのタグ配列を含む5’末端および別のタグ配列を有する3’末端を持つ核酸が生成される。
用語「ヘアピンアダプター」は、ヘアピンの形態であるアダプターを指す。一実施形態において、ライゲーション後、ヘアピンループを切断して、末端に非相補的タグを有する鎖を生成することができる。いくつかの場合において、ヘアピンアダプターのループはウラシル残基を含み得、前記ループは、ウラシルDNAグリコシラーゼおよびエンドヌクレアーゼVIIIを使用して切断できるが、他の方法も公知である。
本明細書で使用される用語「アダプターがライゲーションされた試料」は、アダプターにライゲーションされている試料を指す。上記の定義からわかるように、非対称アダプターにライゲーションされている試料には、5’および3’末端に非相補的な配列を持つ鎖を含む。
「オリゴヌクレオチド結合部位」は、オリゴヌクレオチドが標的ポリヌクレオチドにおいてハイブリダイズする部位を指す。オリゴヌクレオチドがプライマーの結合部位を「提供する」場合、その時プライマーはそのオリゴヌクレオチドまたはその相補物にハイブリダイズし得る。
本明細書で使用される用語「鎖」は、共有結合、例えば、ホスホジエステル結合によって一緒に共有結合的に結合したヌクレオチドから構成される核酸の一本鎖を指す。細胞内では、DNAは通常2本鎖の形態で存在し、そのため、本明細書で「トップ」および「ボトム」鎖と呼ばれる核酸の2つの相補鎖を有する。特定の場合において、染色体領域の相補鎖は、「プラス」および「マイナス」鎖、「ポジティブ」および「ネガティブ」鎖、「第1」および「第2」鎖、「コーディング」および「非コーディング」鎖、「ワトソン」および「クリック」鎖、または「センス」および「アンチセンス」鎖と呼ばれ得る。トップまたはボトム鎖としての鎖の割り当ては任意であり、特定の方向、機能、または構造を意味するものではない。いくつかの例示的な哺乳動物染色体領域(例えば、BAC、集合体、染色体など)の第1鎖のヌクレオチド配列は公知であり、例えば、NCBIのGenbankデータベースで見つけることができる。
本明細書で使用される用語「増幅する」は、標的核酸を鋳型として使用して、標的核酸の1つ以上のコピーを生成することを指す。
用語「濃縮する」および「濃縮」は、特徴を持たない解析物(例えば、ヒドロキシメチルシトシンを含む核酸)から、特定の特徴を有する解析物(例えば、ヒドロキシメチルシトシンを含む核酸)の部分精製を指す。濃縮は、典型的に、特徴を有する解析物(たとえば、ヒドロキシメチルシトシンを含む核酸)の濃度を、特徴を有しない解析物と比較して少なくとも2倍、少なくとも5倍、または少なくとも10倍増加する。濃縮後、試料中の解析物の少なくとも10%、少なくとも20%、少なくとも50%、少なくとも80%、または少なくとも90%は、濃縮に使用される特徴を有し得る。例えば、濃縮した組成物中の核酸分子の少なくとも10%、少なくとも20%、少なくとも50%、少なくとも80%または少なくとも90%は、捕獲タグを含むよう修飾された、1つ以上のヒドロキシメチルシトシンを有する鎖を含み得る。
本明細書で使用される場合、用語「循環セルフリーDNA」および「セルフリーDNA」(cfDNA)は、患者の末梢血中を循環しているDNAを指すために互換的に使用される。セルフリーDNA中のDNA分子は、中央値サイズが1kb未満であり得るが(例えば、50bp~500bp、80bp~400bp、または100~1,000bpの範囲)、この範囲外の中央値サイズを有する断片が存在し得る。セルフリーDNAは、循環腫瘍DNA(ctDNA)、すなわちがん患者の血液中を自由に循環する腫瘍DNAまたは循環胎児DNA(対象が妊娠中の女性の場合)を含み得る。cfDNAは高度に断片化され得、いくつかの場合において、約165~250bpの平均断片サイズを有し得る(Newman et al Nat Med. 2014 20: 548-54)。全血を遠心分離して全細胞を除去し、その後残りの血漿または血清からDNAを分離することにより、cfDNAを取得できる。そのような方法は周知である(例えば、Lo et al、Am J Hum Genet 1998; 62:768-75を参照)。循環セルフリーDNAは二本鎖であるが、変性により一本鎖にすることができる。本明細書で使用される用語「タグ付け」は、分子バーコードを核酸分子に付加することを指す。分子バーコードは、核酸分子の5’末端、3’末端、または両端に付加され得る。分子バーコードは典型的に、従来の手段、例えばT4 DNAリガーゼまたは別のリガーゼを使用してアダプターを断片にライゲーションすることにより、DNA断片に付加される。
用語「分子バーコード」は、様々な型の識別子配列を指し、本明細書で論じるように、試料識別子配列、分子識別子配列、鎖識別子配列、および他の型の識別子配列を包含する。いくつかの実施形態において、分子バーコードは、1から約36ヌクレオチド、例えば、4から30ヌクレオチド、6から25ヌクレオチド、または8から20ヌクレオチドの範囲の長さを有し得る。特定の場合において、分子バーコードはエラーを検出および/またはエラー修正している可能性がある、つまり、エラーが存在する場合でも(たとえば、分子バーコード配列の決定に至るまでのさまざまな処理ステップのいずれかの間、分子バーコードの配列が誤って合成されたり、誤って読み取られたり、または歪んだりした場合)、その後、コードをまだ正しく解釈できる。エラー修正配列の使用は、文献に記載される(たとえば、Hamatiらの米国特許公開第2010/0323348号およびBravermanらの米国特許第2009/0105959号において)。いくつかの実施形態において、より複雑な識別子配列がいくつかの場合に使用され得るが、識別子配列は、比較的低い複雑さ(例えば、4~1024の異なる配列の混合で構成され得る)であり得る。
本明細書で使用される場合、断片の特定の(例えば、上部または下部)鎖に「対応する」配列読み取りに関して、用語「に対応する」は、その鎖またはその増幅産物に由来する配列読み取りを指す。
本明細書で使用される場合、用語「1,3-付加環化反応」は、アジドとアルキンとの間の1,3-付加環化が5員複素環を形成することを指す。いくつかの実施形態において、アルキンは、(例えば、シクロオクチンなどの環において)歪ませられ得、付加環化反応は、銅を含まない条件下で行われる。ジベンゾシクロオクチン(DBCO)およびジフルオロオクチン(DIFO)は、銅を含まない付加環化反応に参加できるアルキンの例であるが、他の群も公知である。例えば、Kolb et al. (2008) Drug. Discov. Today 8:1128-113); Baskin et al. (2007) Proc. Natl. Acad. Sci. 104:16793-16797;およびSletten et al. (2011) Accounts of Chemical Research 44: 666-676参照。
用語「クリックケミストリー」は、自発的に起こり、少なくとも1つの新しく形成された共有結合を含む少なくとも1つの反応生成物を形成する2つ以上の反応物質間の反応を指す。アジドとアルキン間の1,3-付加環化反応は、クリックケミストリー型の反応の例である。
本明細書で使用する場合、用語「化学選択基で修飾されたUDPグルコース」は、クリックケミストリーによって親和性タグと反応することができる官能基で、特に6-ヒドロキシル位で、官能化されたウリジンジホスホグルコース分子を指す。
用語「酸化5-メチルシトシン」は、5位で酸化されている酸化5-メチルシトシン残基を指す。したがって、酸化5-メチルシトシン残基は、5-ヒドロキシメチルシトシン、5-ホルミルシトシン、および5-カルボキシシトシンを含む。本発明の一実施形態による有機ボランとの反応を受ける酸化5-メチルシトシン残基は、5-ホルミルシトシンおよび5-カルボキシシトシンである。

例えば、特定の部分の語句「実質的に含まない」におけるような用語「実質的に」は、その特定の部分の10%以下、好ましくは5%以下、より好ましくは1%以下を含む組成物を指す。用語「実質的に」の他の使用は、類似の定義を含む。
化学置換基および化合物の用語:
本明細書で使用される場合、語句「構造を有する」は、限定することを意図するものではなく、用語「含む」が一般的に使用されるのと同じ意味で使用される。
本明細書で使用される用語「アルキル」は、典型的には必ずしもメチル、エチル、n-プロピル、イソプロピル、n-ブチル、イソブチル、t-ブチル、オクチル、デシルなど、ならびにシクロペンチル、シクロヘキシルなどのシクロアルキル基などの1から約12個の炭素原子を含むわけではないが、分岐または非分岐飽和炭化水素基を指す。用語「低級アルキル」は、1~6個の炭素原子のアルキル基を意図する。好ましい低級アルキル置換基は、1~3個の炭素原子を含み、特に好ましいこのような置換基は、1または2個の炭素原子(すなわち、メチルおよびエチル)を含む。「置換アルキル」は、1つ以上の置換基で置換されたアルキルを指し、用語「ヘテロ原子含有アルキル」および「ヘテロアルキル」は、以下でさらに詳細に記載するように、少なくとも1つの炭素原子がヘテロ原子で置き換えられたアルキルを指す。特に明記しない限り、用語「アルキル」および「低級アルキル」は、それぞれ、直鎖、分岐、環状、非置換、置換、および/またはヘテロ原子含有アルキルまたは低級アルキルを含む。
本明細書で使用される用語「アリール」は、他に特定されない限り、互いに融合、直接結合、または間接結合された単一の芳香環または複数の芳香環を含む芳香族置換基を指す(その結果異なる芳香環は、メチレンまたはエチレン部分などの一般的な基に結合している)。好ましいアリール基は5~24個の炭素原子を含み、より好ましいアリール基は5~14個の炭素原子を含み、特に好ましいアリール基は5~9個の炭素原子を含む。「置換アリール」は、1つ以上の置換基で置換されたアリール部分を指し、用語「ヘテロ原子含有アリール」および「ヘテロアリール」は、以下でさらに詳細に説明するように少なくとも1つの炭素原子がヘテロ原子で置き換えられているアリール置換基を指す。特に明記しない限り、用語「アリール」は、非置換、置換、および/またはヘテロ原子含有芳香族置換基を含む。
「ヘテロ原子含有アルキル基」(「ヘテロアルキル」基とも呼ばれる)または「ヘテロ原子含有アリール基」(「ヘテロアリール」基とも呼ばれる)におけるような「ヘテロ原子含有」という用語は、1つ以上の炭素原子が炭素以外の原子、例えば窒素、酸素、硫黄、リンまたはケイ素、典型的には窒素、酸素または硫黄、好ましくは窒素または酸素で置き換えられている分子、結合または置換基を指す。同様に、用語「ヘテロアルキル」は、ヘテロ原子含有のアルキル置換基を指し、用語「複素環式」は、ヘテロ原子含有の環状置換基を指し、用語「ヘテロアリール」および「ヘテロ芳香族」は、それぞれヘテロ原子含有などである「アリール」および「芳香族」置換基を指す。
「ヒドロカルビル」は、1~約30個の炭素原子、好ましくは1~約24個の炭素原子、より好ましくは1~約18個の炭素原子、最も好ましくは約1~12個の炭素原子を含む一価のヒドロカルビルラジカルを指し、直鎖、分岐、環状、飽和、および不飽和種、例えば、アルキル基、アルケニル基、アリール基などを含む。「置換ヒドロカルビル」は、1つ以上の置換基で置換されたヒドロカルビルを指し、用語「ヘテロ原子含有ヒドロカルビル」は、少なくとも1個の炭素原子がヘテロ原子で置き換えられているヒドロカルビルを指す。特に明記しない限り、用語「ヒドロカルビル」は、置換および/またはヘテロ原子含有ヒドロカルビル部分を含むと解釈されるべきである。
2セルフリーDNAにおける酸化5mC残基のDHUへの変換:
一実施形態において、本発明は、セルフリーDNA中の酸化5-メチルシトシン残基をジヒドロウラシル残基に変換する方法を提供する。この方法は、5-ホルミルシトシン(5fC)、5-カルボキシシトシン(5caC)、およびそれらの組み合わせから選択される酸化5mC残基と有機ボランとの反応を含む。酸化5mC残基は、天然に生じるか、またはより典型的には、5mCまたは5hmC残基の事前酸化の結果、たとえば、5mCまたは5hmCのTETファミリー酵素(例えば、下で議論するようにTET1、TET2、またはTET3)での酸化の結果である。あるいは、例えば、過ルテニウム酸カリウム(KRuO)もしくはペルオキソタングステン酸塩(例えばOkamoto et al. (2011) Chem. Commun. 47:11231-33参照)および過塩素酸銅(II)/2,2,6,6-テトラメチルピぺリジン-1-オキシル(TEMPO)配合物(Matsushita et al. (2017) Chem. Commun. 53:5756-59参照)などの無機ペルオキソ化合物または組成物による5mCあるいは5hmCの化学酸化の結果である

有機ボランは、ボランと、窒素複素環および第3級アミンから選択される窒素含有化合物との錯体として特徴付けられ得る。窒素複素環は、単環式、二環式、または多環式であってもよいが、典型的には、単環式であり、窒素ヘテロ原子と、必要に応じてN、O、およびSから選択される1つ以上の追加のヘテロ原子を含む5員または6員環の形態である。窒素複素環は、芳香族または脂環式であってよい。本明細書において好ましい窒素複素環には、2-ピロリン、2H-ピロール、1H-ピロール、ピラゾリジン、イミダゾリジン、2-ピラゾリン、2-イミダゾリン、ピラゾール、イミダゾール、1,2,4-トリアゾール、1,2,4-トリアゾール、ピリダジン、ピリミジン、ピラジン、1,2,4-トリアジン、および1,3,5-トリアジンが含まれる、これらはいずれも非置換であっても、1つ以上の非水素置換基で置換されていてもよい。典型的な非水素置換基は、アルキル基、特にメチル、エチル、n-プロピル、イソプロピル、n-ブチル、イソブチル、t-ブチルなどの低級アルキル基である。例示的な化合物には、ピリジンボラン、2-メチルピリジンボラン(2-ピコリンボランとも呼ばれる)、および5-エチル-2-ピリジンが含まれる。これらの有機ボランは、
Figure 0007206284000005

で表され得り、または
Figure 0007206284000006

として、複素環式窒素原子とホウ素の間の電荷移動の証拠がある。
例えば、Hoffmann (1964), ”Extended Huckel Theory. III. Compounds of Boron and Nitrogen,” J. Chem. Phys.40:2474を参照。
第3級アミン-ボラン錯体は、ボランおよび式(I)
Figure 0007206284000007

の構造を有する第3級アミンから形成される。
ここで式中、R、R、およびR部分は、同一または異なってもよく、一般に、置換および/またはヘテロ原子含有ヒドロカルビル基を含むC~C12ヒドロカルビル基から独立して選択される。R、R、およびRは、典型的にはC~C12アルキル、より典型的には低級アルキル、例えばメチル、エチル、n-プロピル、イソプロピル、n-ブチル、イソブチル、t-ブチル、シクロペンチル、シクロヘキシルなどである。本明細書で使用するための例示的な第3級アミン-ボラン錯体には、トリエチルアミンボランおよびトリ(t-ブチル)アミンボランが含まれる。
セルフリーDNA中の有機ボランと酸化5mC残基との反応は、非毒性試薬および穏やかな反応条件を使用できる限り有利であり、バイサルファイトも、その他の潜在的にDNA分解試薬も必要ない。さらに、酸化5mC残基の有機ボランによるジヒドロウラシルへの変換は、「ワンポット」または「ワンチューブ」反応で、いかなる中間体を単離する必要なく実行できる。変換には複数のステップつまり、(1)酸化5mCでC-4とC-5を結ぶアルケン結合の還元、(2)脱アミノ化、および(3)酸化5mCが5caCの場合は脱炭酸、または酸化5mCが5fCの場合は脱ホルミル化のいずれか、のステップが含まれるため、これは非常に重要である。代表的な有機ボランとして2-ピコリンボランを使用して5caCをジヒドロウラシルに変換する一連の反応をスキーム4に示す
Figure 0007206284000008

一方、5fCをジヒドロウラシルに変換する対応する順序は、スキーム5に示す。
Figure 0007206284000009
有機ボランを使用して酸化5-メチルシトシン残基をジヒドロウラシルに変換する実現可能性を決定するために、2-ピコリンボランを水性DNA緩衝液中で、配列5’-TCGAC5caCGGATC-3’を有するオリゴヌクレオチドと組み合わせた、ここで5cacは5-カルボキシシトシンを表す。図1は、2-ピコリンボランと5caCの仮定の反応生成物を示す。示されているように、反応生成物としてジヒドロウラシルを使用すると、41Daの損失が予想される。得られた結果を図2に示す。約41.6Daの損失が見られ、主な反応生成物が、ジヒドロウラシルであることを示唆している。さらにH NMRおよび質量スペクトル分析により、この発見が確認された;図3を参照。反応のために提案されたメカニズムは、図4に概略的に示され、上記のように、連続的な還元、脱アミノ化、および脱炭酸のステップを伴い、一方図5は、2-ピコリンボランと5-ホルミルシトシン(5fC)との類似の反応を示す。前記図は、連続的な還元、脱アミノ化、および脱ホルミル化を伴う、提案されたメカニズムも示す。
図6および7の質量スペクトルは、2-ピコリンボランが5-カルボキシシトシンおよび5-ホルミルシトシンと選択的に反応してこれらの残基をDHUに変換したが、オキシム=N-O-CHCHまたはアミド-(CO)-NH-CHCHで5位が置換されたシトシンとは反応しないことを示す。

図10は、2-ピコリンボランとの反応前後の5-メチルシトシン、5-ヒドロキシメチルシトシン、および5-グルコメチルシトシンの質量スペクトルを示す。見ての通り、2-ピコリンボランはこれらのいずれとも反応せず、5-ホルミルシトシンおよび5-カルボキシシトシンに対する2-ピコリンボランの選択性が強調されていた。

セルフリーDNA中の酸化5-メチルシトシン残基をジヒドロウラシル残基に変換する方法に加えて、本発明はまた、前述の方法に関連する反応混合物を提供する。反応混合物は、5caC、5fC、およびそれらの組み合わせから選択される少なくとも1つの酸化5-メチルシトシン残基を含むセルフリーDNAの試料、ならびに少なくとも1つの酸化5-メチルシトシン残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれか、に有効な有効な有機ボランとを含む。有機ボランは、上で説明したように、ボランならびに窒素複素環および第3級アミンから選択された窒素含有化合物の複合体である。好ましい実施形態において、反応混合物は、バイサルファイトを実質的に含まず、これは、バイサルファイトイオンおよびバイサルファイト塩を実質的に含まないことを意味する。理想的には、反応混合物はバイサルファイト塩を含まない。
本発明の関連する局面において、セルフリーDNA中の5mC残基をジヒドロウラシル残基に変換するためのキットが提供され、キットは、5hmC残基をブロックするための試薬、ヒドロキシメチル化を超えて5mC残基を酸化して酸化5mC残基を提供するための試薬、ならびに酸化5mC残基の還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかに有効な有機ボランを含む。キットはまた、上記記載の方法を実施するために構成要素を使用するための説明書を含み得る。
3. セルフリーDNAにおける5mCおよび5hmCの存在および位置の検出:
別の実施形態において、上記記載の酸化反応を利用する方法が提供される。この方法は、セルフリーDNAにおける5-メチルシトシン残基の存在および位置を検出することを可能にし、以下のステップを含む:
(a)断片化されたアダプターライゲーションセルフリーDNA中の5hmC残基を修飾してその上に親和性タグを提供するステップであって、ここで親和性タグはセルフリーDNAからの修飾5hmC含有DNAの除去を可能にするステップ;
(b)セルフリーDNAから修飾5hmC含有DNAを除去し、非修飾5mC残基を含むDNAを残すステップ;
(c)未修飾5mC残基を酸化して、5caC、5fC、およびそれらの組み合わせから選択される酸化5mC残基を含むDNAを得るステップ;
(d)酸化5mC残基を含むDNAを、酸化5mC残基を還元、脱アミノ化、および脱炭酸または脱ホルミル化するのに有効な有機ボランと接触させることにより、酸化5mC残基の代わりにジヒドロウラシル残基を含むDNAを提供するステップ;
(e)ジヒドロウラシル残基を含むDNAを増幅および配列決定するステップ;
(f)配列決定から5-メチル化パターンを決定すると、(e)が得られるステップ。
セルフリーDNAは、対象からの身体試料から抽出され、身体試料は、典型的には全血、血漿、または血清、最も典型的には血漿であるが、試料は、尿、唾液、粘膜排泄物、痰、便、または涙であってもよい。一部の実施形態において、セルフリーDNAは腫瘍に由来する。他の実施形態において、セルフリーDNAは、疾患または他の病原性状態を有する患者に由来する。セルフリーDNAは腫瘍に由来してもよいし、しなくてもよい。ステップ(a)において、5hmC残基が修飾されるセルフリーDNAが精製され、断片化された形態であり、およびアダプターライゲーションされていることに注意すべきである。この文脈でのDNA精製は、当業者に公知のおよび/または関連文献に記載されている任意の適切な方法を使用して実行でき、例えば、Luらの米国特許公開第2017/0253924号に記載されているように、セルフリーDNA自体が高度に断片化されている場合、さらなる断片化が時々望ましい場合がある。セルフリーDNA断片は、一般に、約20ヌクレオチド~約500ヌクレオチドのサイズ範囲、より典型的には約20ヌクレオチド~約250ヌクレオチドの範囲である。ステップ(a)で修飾された精製済みのセルフリーDNA断片は、従来の手法(制限酵素など)を使用して末端が修復されているため、断片は各3’末端および5’末端で平滑末端を有している。好ましい方法において、QuakeらのWO2017/176630に記載されているように、平滑化された断片は、Taqポリメラーゼなどのポリメラーゼを使用して単一のアデニン残基を含む3’オーバーハングにより提供されている。これは、選択したユニバーサルアダプター、すなわち、セルフリーDNA断片の両末端にライゲーションし、以下で詳細に説明するように少なくとも1つの分子バーコードを含むYアダプターまたはヘアピンアダプターなどのアダプターのその後のライゲーションを容易にする。アダプターの使用は、アダプターライゲーションされたDNA断片の選択的PCR濃縮も可能にする。
次に、ステップ(a)において、「精製され、断片化されたセルフリーDNA」は、アダプターライゲーションされたDNA断片を含む。ステップ(a)で指定されているように、親和性タグ付きのこれらのセルフリーDNA断片の5hmC残基の修飾は、セルフリーDNAからの修飾5hmC含有DNAのその後の除去を可能にするために行われる。一実施形態において、親和性タグは、ビオチン、デスチオビオチン、オキシビオチン、2-イミノビオチン、ジアミノビオチン、ビオチンスルホキシド、ビオシチンなどのビオチン部分を含む。親和性タグとしてビオチン部分を使用すると、ストレプトアビジン、例えばストレプトアビジンビーズ、磁気ストレプトアビジンビーズなどで簡単に除去できる。
5hmC残基をビオチン部分または他の親和性タグでタグ付けすることは、DNA断片の5hmC残基への化学選択基の共有結合によって達成される。ここで化学選択基は、5hmC残基に親和性タグを結合するために、官能化された親和性タグと反応することができる。一実施形態において、化学選択基は、UDPグルコース-6-アジドであり、これは、Robertsonら(2011) Biochem. Biophys. Res. Comm. 411(1):40-3、Heらの米国特許第8,741,567号、およびQuakeらのWO 2017/176630、すべて以前に引用されている、に記載されているように、アルキン官能化ビオチン部分との自発的1,3-付加環化反応を受ける。したがって、アルキン官能化ビオチン部分を追加すると、ビオチン部分が各5hmC残基と共有結合する。そのような反応の例が、Heらの米国特許第8,741,567号の図5Bに示されている。
次いで、一実施形態において、ストレプトアビジンビーズ、磁気ストレプトアビジンビーズなどの形態のストレプトアビジンを使用して、ステップ(b)で親和性タグ付きDNA断片をプルダウンし、もし望むなら、後の分析のために取っておくことができる。親和性タグ付き断片の除去後に残っている上清は、未修飾の5mC残基を含み、5hmC残基を含まないDNAを含む。
ステップ(c)において、未修飾の5mC残基は、任意の適切な手法を使用して酸化され、5caC残基および/または5fC残基を提供する。酸化剤は、ヒドロキシメチル化を超えて5mC残基を酸化するように、すなわち、5caCおよび/または5fC残基を提供するように選択される。酸化は、触媒的に活性なTETファミリー酵素を使用して、酵素的に行うことができる。本明細書で使用される用語「TETファミリー酵素」または「TET酵素」は、米国特許第9,115,386号に定義されている触媒活性「TETファミリータンパク質」または「TET触媒活性断片」を指す。この文脈における好ましいTET酵素は、TET2である;Ito et al. (2011) Science 333(6047):1300-130を参照。酸化は、前のセクションで記載したように、化学的酸化剤を使用して化学的に行うこともできる。適切な酸化剤の例には、限定するものではないが、過ルテニウム酸カリウム(KRuO)などの過ルテニウム酸金属、過ルテニウム酸テトラプロピルアンモニウム(TPAP)および過ルテニウム酸テトラブチルアンモニウム(TBAP)などの過ルテニウム酸テトラアルキルアンモニウムおよびポリマーで支持されている過ルテニウム酸塩(PSP)を含む、無機または有機過ルテニウム酸塩の形態の過ルテニウム酸アニオン;ならびに無機ペルオキソ化合物およびペルオキソタングステン酸塩または過塩素酸銅(II)/TEMPOの組み合わせなどの組成物が含まれる。プロセスの次のステップである、ステップ(e)が5fC残基および5caC残基の両方をジヒドロウラシル(DHU)に変換する限り、この時点で5fC含有断片を5caC含有断片から分離する必要はない。
すなわち、ステップ(e)は、前のセクションで記載したように、5fC含有および5caC含有DNA断片と有機ボランとの反応を伴う。スキーム4、スキーム5、図4および図5に示されるように、有機ボランは、酸化5mC残基を還元し、脱アミノ化し、および脱炭酸または脱ホルミル化のいずれかをする。ステップ(f)において、任意の適切な方法を使用して、元の5mC残基の代わりにDHUを含むDNA断片をプールし、増幅し、配列決定する;本明細書における好ましい増幅および配列決定技術は、QuakeらのWO2017/176630に記載されている。
前述の方法は、図8の右側のスキームに示されており、β-GTブロッキングを用いたTET支援2-ピコリンボラン配列(TAPS)を示す。このスキームは、5-ヒドロキシメチルシトシン残基が、β-グルコシルトランスフェラーゼ(βGT)でブロックされているのに対し、5-メチルシトシン残基は、5-ホルミルシトシンおよび5-カルボキシシトシンの混合物を提供するのに効果的なTET酵素で酸化されていることを示す。これらの酸化種の両方を含む混合物を2-ピコリンボランまたは別の有機ボランと反応させ、ジヒドロウラシルを得ることができる。この実施形態の変形において、5hmC含有断片は、ステップ(b)では除去されない。むしろ、図8の左側のスキームに示されるように、「TET支援ピコリンボラン配列(TAPS)」、5mC含有断片および5hmC含有断片を一緒に酵素酸化して、5fCおよび5caC含有断片を提供する。2-ピコリンボランとの反応により、5mCおよび5hmC残基が元々存在していた場所にDHU残基が生じる。「化学支援ピコリンボラン配列決定(CAPS)」と題された図9は、5mC残基を変更せずに残したまま、過ルテニウム酸カリウムを用いた5hmC含有断片の選択的酸化を模式的に示している。

前述の技術を使用したシトシンならびにシトシン誘導体5mCおよび5hmCの配列読み取りを表1に示す:
表1:
Figure 0007206284000010

表に示されているように、5hmC残基のβGTブロッキングを有するTAPSと、CAPSは、5mC残基および5hmC残基の差分読み取りを可能にする。
この実施形態の方法には多くの利点がある:バイサルファイトは不要であり、非毒性の試薬および反応物が使用される;そしてプロセスは穏やかな条件下で進行する。さらに、いかなる中間体を分離する必要なく、プロセス全体を1本のチューブで行うことができる。
関連する実施形態において、上記の方法は、さらなるステップを含む:(g)ステップ(b)においてセルフリーDNAから除去された5hmC含有DNAにおけるヒドロキシメチル化パターンを同定するステップ。これは、以前に引用されたQuakeらのWO2017/176630に詳細に記載されている技術を使用して実行することができる。このプロセスは、図11に概略的に示されるように、中間体の除去または単離をせずに、ワンチューブ方法で実行することができる。
より具体的には、図11は、セルフリーDNA断片中の5mC残基の存在および位置を検出するための方法の一実施形態を示し、ここで前記方法は、「ワンチューブ」プロセスとして実行することができる。最初に、セルフリーDNA断片、好ましくはアダプターライゲーションDNA断片を、以前記載したようにβGT触媒ウリジンジホスホグルコース6-アジドで官能化に供し、続いて化学選択的アジド基を介してビオチン化する。前に説明したように、この手順により、各5hmC部位に共有結合したビオチンが生成される。次のステップにおいて、ビオチン化された鎖および、未修飾(天然)5mCを含む鎖が、さらなる処理のために同時にプルダウンされる。当該分野で知られているように、天然の5mC含有鎖は、抗5mC抗体またはメチル-CpG結合ドメイン(MBD)タンパク質を使用してプルダウンされる。次に、5hmC残基がブロックされた状態で、本明細書の他の場所に記載したように、未修飾5mC残基は、5mCを5fCおよび/または5caCに変換する任意の適切な技術を使用して選択的に酸化される。図11は、1つのそのような方法、TET支援酸化を指す。2-ピコリンボランなどの有機ボランを使用して、既に記載したように5caCをDHUに変換し、その結果元の5mC残基をT残基として読み取る。図11のプロセスにおいて、単一チューブ配列決定の結果は、表2に示すとおりである。
表2
Figure 0007206284000011

表からわかるように、5mC残基のみ(つまり、5hmC残基を含まない)を有するDNA断片はTGペアとして読み取られ、そのように一意に識別できる。必要に応じて、天然の5mC含有断片およびビオチン化5hmC断片を別々にプルダウンするようにプロセスを改変して、鋳型DNA断片内の5hmC残基の存在および位置を検出できるようにすることができる。
ステップ(a)から(f)および必要に応じて(g)に記載された方法の変形において、断片化されたアダプターライゲーションセルフリーDNA中の5hmC残基は、ブロッキング基の付着によって修飾され、その結果、次に、方法はステップ(b)なしで、5hmC含有断片の除去を進行する。
ステップ(a)から(f)および必要に応じて(g)に記載された方法の別の変形において、方法は、セルフリーDNAの代わりに腫瘍DNAを用いて実行される。
セルフリーDNA断片の分子バーコーディング:
好ましい実施形態において、分子バーコーディングを使用して、複数のセルフリーDNA試料のそれぞれにおける各DNA鎖の特徴を特定する。本明細書で先に説明したように、分子バーコード、または「一意識別子」(UID)は、特定のDNA鎖の後での識別および生成を可能にするために、DNA断片にタグ付け、または追跡するために使用される短いオリゴヌクレオチド配列である。したがって、分子バーコード、または「配列タグ」は、それがライゲーションされている以下のようなDNA鎖の特徴を識別する:
(1)DNA鎖が由来する試料;
(2)DNA鎖が由来する分子(二本鎖DNA断片);
(3)元の二本鎖DNA断片における鎖の同一性、すなわち、ポジティブまたはネガティブ;および
(4)非配列特性に基づいて核酸鋳型(非増幅)分子の初期プールを分割するために使用される上流ゲノムプロセス、ここで、「上流」は、実際の鋳型配列が読み取られる前に発生するプロセスまたは他の方法で、例えば、直接配列決定、またはパイロシーケンシングなどの配列決定により;プローブまたは他の標識のように、相補的配列へのハイブリダイゼーションにより;またはメチル化感受性PCRを含む、PCRのような配列特異的増幅により;制限消化により; MALDI-TOFにより;メチル化マイクロアレイを使用して;および/または、本明細書で前述したようなTAPSもしくはCAPSプロセスにより)検出されるその存在を示す。
第1の例において、分子バーコードは、試料識別子配列、二本鎖DNA断片の両方の鎖に付加されるヌクレオチドの配列を含み、ここで配列は、DNA断片の供給源、例えば、DNA断片が由来する試料および/または患者を識別する。使用において、各試料は異なる試料識別子配列でタグ付けされ、その結果1つの試料識別子配列が1つの試料内のすべてのDNA断片に付加され、異なる試料のために異なる試料識別子配列が使用される。プールおよび配列決定の後、試料識別子配列を使用して、配列の供給源を識別するのに使用できる。
上記の第2型のバーコードである、分子識別配列は、試料内のDNA断片の両方の鎖に付加されるヌクレオチドの配列であり、その結果、付加されたヌクレオチドの配列は、単独でまたは断片の他の特徴、例えば、それらの断片化ブレークポイントと組み合わせて、試料またはその一部における異なる二本鎖断片分子間を区別することに使用され得る。任意の1つの実施において使用される分子識別子配列の集団の複雑さは、例えば、試料中の断片の数および/または後続のステップで使用される試料の量などの様々なパラメーターに応じて異なり得る。例えば、特定の場合において、分子識別子配列は、複雑性が低くてもよい(例えば、8から1024の配列の混合物で構成されてもよい)。他の場合において、分子識別子配列は、複雑性が高くてもよい(例えば、1025から2Mまたはそれ以上の配列で構成されてもよい)。特定の実施形態において、分子識別子配列の集団は、1つ以上(例えば、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、または5~30あるいはそれより多く)のR、Y、S、W、K、M、B、D、H、V、N(IUPACコードで定義)、またはその変異体から選択されるヌクレオチドを含む縮重塩基領域(DBR)を含み得る。米国特許第8,741,606号に記載されているように、分子識別子配列は、隣接していない配列で構成されていてもよい。いくつかの実施形態において、分子識別子配列の集団は、定義された配列のオリゴヌクレオチドを一緒に混合することによって作製され得る。これらの実施形態において、各オリゴヌクレオチドの分子識別子配列は、誤り訂正であり得る。本明細書に記載の方法において、分子識別子配列を使用して、最初の試料の一部の異なる断片間を区別することができ、ここで、その部分は最初の試料から除去されている。分子識別子配列は、断片間を区別するために、断片の他の特徴(例えば、ブレークポイントを定義する、断片の末端配列)と組み合わせて使用されてもよい。
本発明に関連して有用な第3の型の分子バーコードは、鎖識別子配列である。鎖識別子配列は、試料内のDNA断片の1つの鎖に固有であるため、配列決定されたDNA鎖の別の特徴、つまり、配列決定されたDNA鎖が由来する元の鋳型DNA断片の鎖を識別する。別の好ましい実施形態において、この鎖特異性は、両末端での各断片の二重バーコード化によってさらに強化される。
好ましい実施形態において、上記記載の分子バーコードの少なくとも1つが、現在記載されている方法およびキットと併せて使用される。より好ましい実施形態において、3つすべての型の分子バーコードが使用される。このような場合において、3種類のバーコードは典型的に、試料のDNA断片の末端修復されたAテール付加された末端に分子バーコード含有アダプターをライゲーションすることにより、例えばセルフリーDNAのDNA断片に付加される。DiehnおよびAlizadehによってNewman et al. (2016) Nature Biotechnol.および他の場所で記載されたCAPP-Seqプロセスに類似している、このハイブリッドアダプターアプローチは、図12および図13に示されている。
図12に示すように、ハイブリッドアダプター方法論の最初のステップは、Aテール付加されたDNA断片へのT末端化分子バーコードYアダプターのライゲーションである。Yアダプターが示されているが、前述のヘアピンアダプターなどの、機能的に同等のアダプターも使用できることを理解されたい。バーコード化されたアダプターには、それぞれ次のバーコードが含まれる:試料識別子配列1および5;鎖識別子配列2および4;ならびに断片(または分子)識別子配列3および6。ライゲーション後、ポジティブ鎖およびネガティブ鎖が分離され、PCRで増幅される(ステップ3)。
PCR増幅の結果を図13に示す。2つの(+)-鎖由来の鎖は(4)に示され、それぞれ試料識別子配列5、断片識別子配列3および6、ならびに鎖識別子配列4を含んでいる。2つの(-)-鎖由来の鎖は(5)に示され、それぞれ試料識別子配列1、断片識別子配列3および6、ならびに鎖識別子配列2を含む。
別の実施形態において、本明細書の方法に従って処理されたセルフリーDNA断片は、断片識別子配列および鎖識別子配列の両方を含む。鎖の断片識別子配列(再び、処理された鎖が由来する鋳型dsDNA断片を識別する)の鎖識別子配列(処理された鎖が由来する鋳型鎖を識別する)と組み合わせた分析により、対応する鋳型断片が完全に修飾されている(すなわち、完全に修飾、たとえば、両方の鎖でメチル化、両方の鎖でヒドロキシメチル化、または一方の鎖でメチル化され、他方の鎖でヒドロメチル化)か、またはヘミ修飾されている(すなわち、ヘミ修飾、たとえば、一方の鎖のみでメチル化またはヒドロキシメチル化)かを決定することができる。
分子バーコーディングは、本明細書に記載されている任意の方法と組み合わせて使用することができる。現在のエピジェネティック解析では、ほとんどの場合、セルフリーDNAを出発点として依拠するため、バーコーディングは、バーコード含有アダプターを処理した断片にライゲーションすることにより、精製、断片化、および末端修復後、通常実行される。
5.プロセスバーコーディング
前のセクションで言及されたように、分子バーコードはまた、プロセス識別子配列であり得る。プロセスバーコードまたは「プロセスタグ」は、核酸の修飾、タンパク質との会合、およびゲノム構造などの非配列特性に基づいて、非増幅鋳型DNA断片の初期プールを分割するために使用されるプロセスを識別する。
そのようなプロセスタグの1つの利点は、元の核酸鋳型分子に関連する非古典的配列特性を古典的な配列差に変換し、それにより、さもなければ前記特性をマスクまたは破壊し得る後続のプロセスを通じてそのような特性を「不死化」することである。たとえば、鋳型分子の5hmCまたは5mCなどの修飾エピジェネティック塩基は、通常、標準的なPCRのラウンドまたは古典的な4つの塩基を使用するその他の増幅によって希釈され、最終的には主に未修飾のシトシンになる。代わりに、増幅前にそのような塩基に対して処理された鋳型分子に隣接する配列としてプロセスバーコードが追加された場合、それらは通常の手段で続いて増幅され、後に(配列決定またはPCRもしくはマイクロアレイなどの他の手段を通じて)鋳型分子と一緒に読み取られる。したがって、そのような読み取り内のプロセスタグおよび鋳型核酸の両方の存在(または非存在)は、後続の増幅産物にない場合でも、元の鋳型にこのようなエピジェネティック修飾があったかどうかを示す。
同様の場合は、特定のタンパク質(ヒストンのような)、または鋳型分子自体の配列の外に広がる隣接ゲノム領域(例えば、ゲノムの全長にまたがるCTCF結合部位)のいずれであっても、元の鋳型核酸をその元の結合相手から正常に解離させる、様々な通常の核酸抽出、断片化および精製技術に当てはまる。しばしば、そのような共起を特徴付けるために使用される免疫沈降および核酸架橋反応は、後の操作または配列の読み取りもしくは検出の十分上流でのみ実行することができる。当業者は、そのようなプロセスバーコードが、そのような特徴に基づいて核酸のプールを選択された残りの核酸部分集合に分離し、抽出、精製、または抽出など、その後の反応を通じてこれらの鋳型の将来のマーキングを可能にする、任意の反応に適用可能であることを認識することができる。これは、その他の点で、そのような分離の基礎となった元の特性(例えば、結合相手の下流の存在または他の非隣接配列の継続的な空間的隣接関係)を削除する。
固有の分子識別子または他の非常に多様なバーコード(一般に10から10の固有の配列の範囲)とは異なり、プロセスバーコードは一般に離散的であり、数塩基(通常2~4塩基)しか必要としないため、各プロセスの特定の出力をカバーする数個の固有の配列のみ(例えば、1~4つのバーコードタグなどの50未満、25未満、20未満、10未満のバーコードタグ)を表す。設計により、プロセスの共有産物である配列に関係なく(プロセスで使用される共通の特性を共有する)複数の断片に適用でき、個々の鋳型分子のそれぞれに固有の配列を付与することを意図したものではなく、大規模な異種の鋳型配列に適用できることが検証されている(許容可能なライゲーションのバイアスを伴う)。ただし、それらは、プロセスタグブロックの延長セットとして順次実行されるそのようなプロセスの多くの組み合わせをカバーするために、一緒に順番に追加したり、組み合わせて分割して再プールしたりできる。開始鋳型の個々のサブフラクションを利用する並行プロセスで異なるプロセスタグを追加することもでき、核酸を異なるマークについて問い合わせることができる。例えば、単一の鋳型分子は2つのバーコードでタグ付けられて、その元の鋳型分子にも5mCおよび5hmCの両方が含まれていたことを示すことができる。さらなるタグは、元の鋳型分子が特定のヒストン(または修飾ヒストン、例えば、Shema et al. (2016) Science 352(6286): 717-721,およびSadeh (2016) Molecular Cell 63:1080-1088を参照)とも関連付けられていたかどうかを示し得る。
この実施形態による核酸の部分集合への分割は、以下に基づくことができる。
(1)(バイサルファイトなどで)化学修飾されたり、(βGTなどで)標識またはブロックされたり、またはMBD結合タンパク質に関連付けられたりする5hmCまたは5mCなどのエピジェネティック塩基の組み込み。
(2)特定のヒストンまたは核酸架橋(例えば、CTCF)または結合タンパク質(転写因子およびポリメラーゼ、またはエピジェネティック読み取りおよび書き取りタンパク質など)または典型的に免疫沈降される他の核タンパク質との会合;あるいは
(3)地理的に近いが隣接していない核酸配列との会合(典型的には架橋および免疫沈降)。
分離の濃縮フラクションおよび/または枯渇フラクションには、それに負荷されるプロセスタグを有し得る。例えば、1つのプロセスタグで修飾された塩基を含む断片と、別のプロセスタグで修飾された塩基を含まない残りとの両方にマークを付けることは重要である。
分割の基礎となる非配列修飾は、通常、比較的短いDNA断片に含まれている;複数の非配列修飾を検出することには有用性があるが、特にそのような修飾がブロックで発生する場合、塩基分解能解析から数個または1個の潜在的に異なる修飾部位しか持たないことが公知であるより小さな核酸にプロセスタグを追加することが有益であることが多い。
鋳型核酸断片サイズが、およそ研究されているゲノムの領域の修飾頻度率(例えば、1000塩基ごとに1つ、160塩基ごとに1つ、または100塩基ごとに1つ)以下である場合(またはゲノム全体にわたって、ゲノム全体の解析が実行されている場合)、個々の断片は「デジタル」になる可能性がある、つまり、任意の与えられた断片で1つまたはゼロしかない修飾を有する可能性がある。潜在的な修飾の部位が以前の塩基分解能解析から知られている場合、塩基分解能の読み出しは配列決定での断片レベルの読み出しから推測できる。
プロセスバーコードは、それ自体で、またはより好ましくは、前のセクションで扱った3つのバーコード型の少なくとも1つと組み合わせて使用できる。図14は、試料識別子配列、断片識別子配列、および鎖識別子配列で既にバーコード化されているDNAへのプロセスバーコードの追加を模式的に図示する。プロセスバーコードは、必然的に鎖分離後、好ましくは後続のPCR処理中にDNA断片に付加され、そこでは、プロセスバーコードは、図14に示されるように、PCRプライマーに付加され得る。
一実施形態において、記載されるプロセスバーコードの使用は、セルフリーDNAならびに、試料識別子配列、断片識別子配列、鎖識別子配列、およびそれらの組み合わせから選択される少なくとも1つの追加の分子バーコードを用いて行われる。
別の実施形態において、記載されたプロセスバーコードの使用は、セルフリーDNAを用いて行われ、追加のバーコードは用いられない。
さらなる実施形態において、プロセスバーコードの使用は、細胞内DNAに由来するDNAで実行され、試料識別子配列、断片識別子配列、鎖識別子配列、およびそれらの組み合わせから選択される少なくとも1つの追加の分子バーコードと共に使用される。
6.DNA断片中の5mCおよび5hmCを検出するためのデュアルビオチン技術:
上記で言及したように、本発明は、DNA断片中の5mCおよび5hmCの両方の存在および位置を検出するための方法、反応混合物およびキットを提供する。
一実施形態において、5hmC残基または5mC残基のいずれかを有するDNA断片を見出すために、「デュアルビオチン」濃縮法が使用される。そのような方法の例が図15に示されている。前記方法は、適切にアダプターライゲーションDNA断片、つまり1つ以上の分子バーコードを含み、プロセスの後の選択的PCR増幅を促進するアダプターから始まる。最初のステップにおいて、5hmC残基を選択的に親和性タグで標識する。図15は、ウリジン二リン酸グルコース-6-アジドを用いたβGT触媒グルコシル化とその後の「クリックケミストリー」反応を介した5hmC残基の選択的機能化を示し、前述のようにビオチンタグを共有結合させる。次に、ストレプトアビジンビーズを使用して、5hmCの位置でビオチン化されたすべてのDNA断片を引き抜き、PCR増幅中のプロセスバーコーディング用に別の容器に配置する。上清中の残りのDNA断片は、5mC残基を含む断片か、修飾されていない断片のいずれかである。次に、TETタンパク質またはTET変異タンパク質を使用して、上清の5mC残基を5hmCに酸化する;この場合において、変異TETタンパク質を使用して、5mCの酸化がヒドロキシル化を超えないようにする。この目的に適したTET変異タンパク質は、Liu et al. (2017) Nature Chem. Bio. 13: 181-191に記載され、その後βGT触媒グルコシル化とそれに続くビオチン官能基化が繰り返される。このようにマークされた断片-元の5mCの位置のそれぞれでビオチン化されている-は、ストレプトアビジンビーズでプルダウンされる。次に、ビーズに結合したDNA断片は、PCR増幅中に、-最初のステップで使用されたものとは異なるプロセス識別子配列で-プロセスバーコード化される。未修飾DNA断片、つまり修飾シトシン残基を含まない断片は、上清に残る。必要に応じて、配列固有のプローブを使用して、非メチル化DNA鎖にハイブリダイズできる。結果として生じるハイブリダイズした複合体は、以前と同様に、引き抜かれ、PCR中に3番目のプロセスバーコードでタグ付けされ得る。
したがって、デュアルビオチン濃縮法は、5hmC残基を有する元のDNA断片、5mC残基を有する元のDNA断片、およびC修飾を全く含まない元のDNA断片に対応する、セルフリーDNA断片の3つの別々の群をもたらす。3つの群がプールされて配列決定され、バイオインフォマティクスデコンボリューションを可能にするバーコード化により、初期DNA断片の構造が決定される。
好ましい実施形態において、デュアルビオチン濃縮処理を受けるDNA断片は、セルフリーDNA断片である。
7.ビオチン/天然5mC濃縮法:
関連する実施形態が図16に示されている。前記方法は前のセクションにおけるように開始し、アダプターライゲーションDNA断片の5hmC残基をビオチン化し、続いてストレプトアビジンでプルダウンを行う。ここでは、残っているメチル化DNAを修飾する代わりに、しかしながら、抗5mC抗体またはMBDタンパク質を使用して、天然5mC含有断片を捕捉およびプルダウンする。残りの非メチル化DNAは、前のセクションで記載したように処理できる。断片の3つの群は、上記のように増幅され、プロセスバーコードでタグ付けされ、プールされ、配列決定され得る。
8.単一DNA鎖での5mC/5hmC共起の同定:
本発明はまた、5mCおよび5hmCが両方とも単一鎖上に存在するDNA断片の同定を含む、DNA断片中の5mCおよび5hmC残基を検出するための新規の方法を包含する。
前述のように、第1のステップは、アダプターライゲーションされた5hmC含有DNA断片を分離するのに効果的な任意の方法を使用して実行することができる。前記方法は、例えば、親和性タグに共有結合する化学選択剤による5hmCの機能化により、5hmC部位に親和性タグを付着することを含む。そのような方法の例が図17に示されている。図17において、アダプターライゲーションされた5hmC含有断片は、以前に記載したように、親和性タグとしてビオチンを付加した後に、ウリジン二リン酸グルコース-6-アジドによるβGT触媒グルコシル化を使用してアジド基で官能基化される。ストレプトアビジンビーズは、ビオチン化されたDNA断片をプルダウンするために使用される。この方法で単離されたすべてのDNA断片は、ビオチン化5hmC部位を有することが理解されよう。これらの断片の一部には、未修飾5mC部位も含まれ得る。次のステップにおいて、以前に記載したように、TET酵素などを使用して断片を酸化し、その結果、5mC残基を5fCおよび/または5caCに変換する。先に説明したように、2-ピコリンボランなどの有機ボランを使用して、酸化5mC部分を還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかを行い、DHU残基を与える。したがって、この方法で処理されたすべてのDNA断片には、元々5hmC部分および5hmC部分の両方を含む少なくとも1つの鎖が含まれた。次に、PCR増幅中にプロセスバーコードを、DNA修飾種のコンビナトリアル断片分解能のために追加し、その後、プールされた配列決定を行う。
5mC/5hmC共起解析を第2段階に拡張して、5mC含有断片(5hmC含有断片が段階1でプルダウンされたので、5hmCを含まない断片)を同定することができる。段階1の後の残りのDNAには、非メチル化DNAと5mCを含むDNAが含まれる。これらの断片は、段階1におけるように、TET酵素等を用いて酸化反応に供し、それによって5mC残基を5fCおよび5caC残基に変換する。2-ピコリンボランなどの有機ボランは、5fCおよび5caC残基をDHUに変換し、段階1におけるように、前記方法は、プロセスバーコードのPCR追加、DNA修飾種のコンビナトリアル断片分解能、およびプールされた配列決定で続ける。そのような代表的な方法は、図18に概略的に示す。
9.その他の方法:
別の実施形態において、上記の方法のいずれかは、公知の配列の選択されたオリゴヌクレオチドを5hmC部位のための親和性タグとして使用でき、その結果、そのオリゴヌクレオチドに相補的な配列を有する支持体結合プローブとのハイブリダイゼーションを使用して、オリゴヌクレオチドタグ付き5hmC部位をプルダウンできる。この方法の例は、図19のスキームで提供される。

Claims (9)

  1. セルフリーDNA試料中のアダプターライゲーションされた標的DNAにおける5hmC位置を同定するための方法であって、該方法が、
    (a)5mCに影響を与えることなく、該標的DNAにおける5hmCを酸化試薬により酸化して、酸化5hmCを含有するDNAを得るステップであって、該酸化5hmCが、5caC、5fC、およびそれらの組み合わせから選択される、ステップ;
    (b)酸化5hmCを含有する該DNAをピリジンボランと反応させて、該酸化5hmCを還元、脱アミノ化、および脱炭酸または脱ホルミル化のいずれかをして、それにより、該酸化5hmCの代わりにDHUを含有する修飾DNAを提供するステップ;
    (c)該修飾DNAを増幅および配列決定して、5hmCを示す配列読み取りを提供するステップ;および
    (d)該5hmCを示す配列読み取りと該標的分子について得られた標準配列読み取りとを比較するステップであって、該標準配列読み取りにおけるCから該5hmCを示す配列読み取りにおけるTへの変化が、5hmC位置を示す、ステップ
    を含む、方法。
  2. ステップ(a)から(c)が、任意の中間体を単離することなく実施される、請求項1に記載の方法。
  3. ステップ(a)から(c)が、バイサルファイト非存在下で実施される、請求項1に記載の方法。
  4. ステップ(a)が、化学酸化試薬を使用して実施される、請求項1に記載の方法。
  5. 前記化学酸化試薬が過ルテニウム酸塩である、請求項4に記載の方法。
  6. 前記アダプターライゲーションされた標的DNAが、試料識別子配列と、断片識別子配列および鎖識別子配列から選択される少なくとも1つの追加の分子バーコードとを含有するアダプターを含む、請求項1に記載の方法。
  7. 前記アダプターライゲーションされた標的DNAが、断片識別子配列および鎖識別子配列の両方を含む、請求項6に記載の方法。
  8. 前記セルフリーDNAが、二本鎖DNAを含む、請求項1に記載の方法。
  9. 前記セルフリーDNAが、一本鎖DNAを含む、請求項1に記載の方法。

JP2020543880A 2018-02-14 2019-02-13 Dna、特にセルフリーdnaのエピジェネティック解析の方法 Active JP7206284B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862630798P 2018-02-14 2018-02-14
US62/630,798 2018-02-14
PCT/US2019/017902 WO2019160994A1 (en) 2018-02-14 2019-02-13 Methods for the epigenetic analysis of dna, particularly cell-free dna

Publications (3)

Publication Number Publication Date
JP2021513358A JP2021513358A (ja) 2021-05-27
JPWO2019160994A5 JPWO2019160994A5 (ja) 2022-06-30
JP7206284B2 true JP7206284B2 (ja) 2023-01-17

Family

ID=65529873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020543880A Active JP7206284B2 (ja) 2018-02-14 2019-02-13 Dna、特にセルフリーdnaのエピジェネティック解析の方法

Country Status (7)

Country Link
US (3) US11634748B2 (ja)
EP (1) EP3752515A1 (ja)
JP (1) JP7206284B2 (ja)
CN (1) CN112105626A (ja)
AU (1) AU2019222723B2 (ja)
CA (1) CA3091335A1 (ja)
WO (1) WO2019160994A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2020007259A (es) 2018-01-08 2022-08-26 Ludwig Inst For Cancer Res Ltd Identificación libre de bisulfito de modificaciones de citosina por resolución de base.
CA3091335A1 (en) * 2018-02-14 2019-08-22 Bluestar Genomics, Inc. Methods for the epigenetic analysis of dna, particularly cell-free dna
MX2021003164A (es) 2018-09-19 2021-06-23 Bluestar Genomics Inc Perfiles de hidroximetilación de adn circulante en la evaluación de lesiones pancreáticas.
US20230076949A1 (en) * 2020-02-11 2023-03-09 Ludwig Institute For Cancer Research Ltd Targeted, long-read nucleic acid sequencing for the determination of cytosine modifications
WO2022023753A1 (en) 2020-07-30 2022-02-03 Cambridge Epigenetix Limited Compositions and methods for nucleic acid analysis
GB202017653D0 (en) * 2020-11-09 2020-12-23 Cambridge Entpr Ltd Methods for detection of nucleotide modification
CA3211005A1 (en) * 2021-03-05 2022-09-09 Mayo Foundation For Medical Education And Research Detecting cervical cancer
CN113846160A (zh) * 2021-09-14 2021-12-28 翌圣生物科技(上海)股份有限公司 正向筛选的胞嘧啶甲基化快速检测方法及过氧钨酸盐在将5hmC氧化为thT中的应用
CN113881739B (zh) * 2021-09-28 2022-09-13 深圳吉因加医学检验实验室 氧化含锯齿末端核酸分子的方法及还原方法与文库构建法
CN113943763B (zh) * 2021-10-28 2022-10-04 深圳吉因加医学检验实验室 一种还原核酸的方法及其检测方法
WO2023187012A1 (en) * 2022-03-31 2023-10-05 Illumina Cambridge Limited Compositions including aqueous amine borane complexes and polynucleotides, and methods of using the same to detect methylcytosine or hydroxymethylcytosine

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015514397A (ja) 2012-03-15 2015-05-21 ニユー・イングランド・バイオレイブス・インコーポレイテツド シトシンとこれの修飾物とを識別するための、およびメチローム分析のための方法および組成物
JP2017148064A (ja) 2011-07-29 2017-08-31 ケンブリッジ エピジェネティクス リミテッド ヌクレオチド修飾の検出方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5712126A (en) 1995-08-01 1998-01-27 Yale University Analysis of gene expression by display of 3-end restriction fragments of CDNA
US5948902A (en) 1997-11-20 1999-09-07 South Alabama Medical Science Foundation Antisense oligonucleotides to human serine/threonine protein phosphatase genes
US6287825B1 (en) 1998-09-18 2001-09-11 Molecular Staging Inc. Methods for reducing the complexity of DNA sequences
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US20050233340A1 (en) 2004-04-20 2005-10-20 Barrett Michael T Methods and compositions for assessing CpG methylation
TWI423957B (zh) * 2006-09-21 2014-01-21 Basf Ag 吡啶硼烷複合物
EP2164985A4 (en) 2007-06-01 2014-05-14 454 Life Sciences Corp SYSTEM AND METHOD FOR IDENTIFYING INDIVIDUAL SAMPLES FROM A MULTIPLEX MIXTURE
EP2191011B1 (en) 2007-08-29 2017-03-29 Illumina Cambridge Limited Method for sequencing a polynucleotide template
WO2010037001A2 (en) 2008-09-26 2010-04-01 Immune Disease Institute, Inc. Selective oxidation of 5-methylcytosine by tet-family proteins
US20100323348A1 (en) 2009-01-31 2010-12-23 The Regents Of The University Of Colorado, A Body Corporate Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process
WO2011127136A1 (en) 2010-04-06 2011-10-13 University Of Chicago Composition and methods related to modification of 5-hydroxymethylcytosine (5-hmc)
ES2523140T3 (es) 2010-09-21 2014-11-21 Population Genetics Technologies Ltd. Aumento de la confianza en las identificaciones de alelos con el recuento molecular
EP2694686B2 (en) * 2011-04-06 2023-07-19 The University of Chicago COMPOSITION AND METHODS RELATED TO MODIFICATION OF 5-METHYLCYTOSINE (5mC)
CN102888395B (zh) * 2011-07-22 2015-03-25 中国科学院上海生命科学研究院 调节核酸的甲基化/去甲基化状态的方法和试剂
US9200260B2 (en) 2012-03-15 2015-12-01 New England Biolabs, Inc. Compositions and methods for the transfer of a hexosamine to a modified nucleotide in a nucleic acid
WO2015021282A1 (en) * 2013-08-09 2015-02-12 New England Biolabs, Inc. Detecting, sequencing and/or mapping 5-hydroxymethylcytosine and 5-formylcytosine at single-base resolution
US11162139B2 (en) 2016-03-02 2021-11-02 Shanghai Epican Genetech Co. Ltd. Method for genomic profiling of DNA 5-methylcytosine and 5-hydroxymethylcytosine
WO2017176630A1 (en) 2016-04-07 2017-10-12 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive diagnostics by sequencing 5-hydroxymethylated cell-free dna
CN106957350B (zh) * 2017-02-28 2019-09-27 北京大学 5-醛基胞嘧啶的标记方法及其在单碱基分辨率测序中的应用
MX2020007259A (es) 2018-01-08 2022-08-26 Ludwig Inst For Cancer Res Ltd Identificación libre de bisulfito de modificaciones de citosina por resolución de base.
CA3091335A1 (en) * 2018-02-14 2019-08-22 Bluestar Genomics, Inc. Methods for the epigenetic analysis of dna, particularly cell-free dna

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017148064A (ja) 2011-07-29 2017-08-31 ケンブリッジ エピジェネティクス リミテッド ヌクレオチド修飾の検出方法
JP2015514397A (ja) 2012-03-15 2015-05-21 ニユー・イングランド・バイオレイブス・インコーポレイテツド シトシンとこれの修飾物とを識別するための、およびメチローム分析のための方法および組成物

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Peter Schuler and Aubry K. Miller,Angew. Chem. Int. Ed.,2012年,Vol.51,pp.10704-10707
Shahnaz Begum et al.,Clin Cancer Res,2011年,Vol.17. No.13,pp.4494-4503

Also Published As

Publication number Publication date
US11634748B2 (en) 2023-04-25
US20230235380A1 (en) 2023-07-27
CA3091335A1 (en) 2019-08-22
AU2019222723A1 (en) 2020-09-17
AU2019222723B2 (en) 2023-10-12
EP3752515A1 (en) 2020-12-23
CN112105626A (zh) 2020-12-18
JP2021513358A (ja) 2021-05-27
US20200024643A1 (en) 2020-01-23
US11274335B2 (en) 2022-03-15
US20210262009A1 (en) 2021-08-26
WO2019160994A1 (en) 2019-08-22

Similar Documents

Publication Publication Date Title
JP7206284B2 (ja) Dna、特にセルフリーdnaのエピジェネティック解析の方法
US11519029B2 (en) Linked paired strand sequencing
US9745614B2 (en) Reduced representation bisulfite sequencing with diversity adaptors
JP6525473B2 (ja) 複製物配列決定リードを同定するための組成物および方法
US11795492B2 (en) Methods of nucleic acid sample preparation
CN111849965B (zh) 用于减少偏向性的多核苷酸衔接子设计
US10465241B2 (en) High resolution STR analysis using next generation sequencing
US20210380971A1 (en) Simultaneous, sequencing-based analysis of proteins, nucleosomes, and cell-free nucleic acids from a single biological sample
WO2022271954A1 (en) Methods and compositions for combinatorial indexing of bead-based nucleic acids
CN115874291A (zh) 一种对样本中dna和rna分子进行标记并同时检测的方法
JP2023519979A (ja) ゲノム内の構造再編成の検出方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220531

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230104

R150 Certificate of patent or registration of utility model

Ref document number: 7206284

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150