JP2021532735A

JP2021532735A - がんの非侵襲的検出のためのｄｎａメチル化マーカーとその使用

Info

Publication number: JP2021532735A
Application number: JP2020567152A
Authority: JP
Inventors: チェイシビリ，デビッド; リー，フイ; ウォン，チーファット
Original assignee: Hkg Epitherapeutics Ltd
Current assignee: Hkg Epitherapeutics Ltd
Priority date: 2018-07-09
Filing date: 2019-07-09
Publication date: 2021-12-02
Also published as: EP3821039A2; AU2019301959B2; KR20210018189A; SG11202004888PA; CA3087429A1; EP3821039A4; JP2024001068A; US20210171617A1; CN112236534A; KR20240023700A; BR112020013857A2; WO2020012367A3; IL279170A; AU2019301959A1; WO2020012367A2; AU2023241365A1

Abstract

患者由来の生体物質中のＤＮＡにあるがんを検出し、他の組織の無細胞ＤＮＡおよび血球ＤＮＡと区別するために、ヒトゲノム（ＣＧＩＤ）内の少数の精巧なＤＮＡメチル化位置の組み合わせを見つけるための「バイナリーカテゴリー区別」法である。腫瘍ＤＮＡの起源の組織を検出する別の方法は、ヒトゲノム（ＣＧＩＤ）の固有のＤＮＡメチル化位置の組み合わせを使用する。腫瘍ＤＮＡに由来するＣＧＩＤの組み合わせは、がんを正確に検出するために、特定のＣＧＩＤの組み合わせのＤＮＡメチル化を測定し、「メチル化スコア」を導出することにより、開示されている。少量の血漿から、多重化された次世代シーケンスメチル化アッセイ、パイロシーケンスアッセイそしてメチル化特異的ＰＣＲを使用して、ＣＧＩＤを使用してがんを予測するためのキットである。生物学的材料を使用するさまざまな方法が、他にがんの臨床的証拠がない人のがんの予測につながる。【選択図】図１

Description

本発明は、ヒトＤＮＡ特に分子診断の分野におけるＤＮＡメチル化シグネチャに関する。

がんは人間の主要な死因になっている。がんの早期発見は、治癒率を大幅に改善し、患者とその家族および医療システムへの甚大な個人的および経済的コストを削減できる。例えば、肝細胞がん（ＨＣＣ）は、世界で５番目に多いがんである（Ｅｌ−Ｓｅｒａｇ、２０１１年）。これは特にアジアで蔓延しており、その発生率はＢ型肝炎が蔓延している地域で最も高く、因果関係の可能性を示している（Ｆｌｏｒｅｓ＆Ｍａｒｒｅｒｏ、２０１４年）。慢性肝炎患者などの高リスク集団のフォローアップおよび慢性肝炎からＨＣＣへの移行の早期診断は、治癒率を改善するだろう。肝細胞がんの生存率は、ほとんどの場合末期に診断されるため、現在非常に低い。早期に診断されれば、肝臓がんは８０％を超える治癒率で効果的に治療できる。イメージングの進歩により、ＨＣＣの非侵襲的検出が改善された（Ｔａｎ、Ｌｏｗ、＆Ｔｈｎｇ、２０１１；Ｖａｌｅｎｔｅｅｔａｌ．、２０１４）。しかし、α−フェトプロテインなどの単一タンパク質を用いたイメージングやイムノアッセイを含む現在の診断方法では、ＨＣＣを早期に診断できないことがよくある（Ｆｌｏｒｅｓ＆Ｍａｒｒｅｒｏ、２０１４年）。これらの課題はＨＣＣに限定されず、他のがんにも共通している。例えば、乳がんと大腸がんの早期発見は、罹患率と死亡率、および公衆衛生システムと保険会社のコストを劇的に削減する可能性がある。さらに、膵臓がんなどの特定のがんは、ほぼ常に遅れて検出され、その結果、事実上一定の死亡率を生じる。イメージングの進歩によりがんの早期発見が改善されているが、ＭＲＩなどの高解像度イメージングは高価であり、高度な訓練を受けた人材が必要であり、多くの場所では利用できない。それはまだ多数の集団をスクリーニングする方法に進化していない。がんによる罹患率と死亡率の低減に影響を与えるには、集団の定期的なスクリーニングのために広い地理的領域で使用できる、非侵襲的で強力にもかかわらず低コストの方法を開発する必要がある。主な課題は、固形腫瘍が内臓に隠れ、臨床症状を示すずっと前に進化することである。しかしながら、腫瘍材料を非侵襲的に得ることは可能である。

腫瘍ＤＮＡがシステムに放出され、血漿で見つけられ得ること（Ｗａｒｔｏｎ＆Ｓａｍｉｍｉ、２０１５）、そして尿や唾液などのその他の分泌された体液や糞中に見つかる可能性があることは、今では広く確立されている。腫瘍ＤＮＡの分子特性を測定することにより、体液に見つかったＤＮＡが腫瘍に由来することを確認できる（Ｚｈａｉｅｔａｌ．、２０１２）。腫瘍細胞は腫瘍ＤＮＡと正常細胞ＤＮＡを区別できる突然変異を発生させるが、起こり得る突然変異の数は膨大であり、すべての腫瘍で一般的な突然変異が起こるわけではない（Ｄｏｍｉｎｇｕｅｚ−Ｖｉｇｉｌ、Ｍｏｒｅｎｏ−Ｍａｒｔｉｎｅｚ、Ｗａｎｇ、Ｒｏｅｈｒｌ、＆Ｂａｒｒｅｒａ−Ｓａｌｄａｎａ、２０１８）。

ＤＮＡの共有結合修飾であるＤＮＡメチル化は、ゲノム機能のエピジェネティック制御の主要なメカニズムであり、腫瘍内で遍在的に変化している（Ａｇｕｉｒｒｅ−Ｇｈｉｓｏ、２００７；Ｂａｙｌｉｎｅｔａｌ．、２００１；Ｅｈｒｌｉｃｈ、２００２；Ｉｓｓａｅｔａｌ．、１９９３）。腫瘍のＤＮＡメチル化プロファイルは、腫瘍の分類、予後、および化学療法に対する反応の予測のための強力なツールとなる可能性がある（Ｓｔｅｆａｎｓｓｏｎｅｔａｌ．、２０１４）。早期診断で腫瘍ＤＮＡメチル化を使用することの主な欠点は、疑わしい腫瘍の侵襲的手順と解剖学的視覚化が必要なことである。循環腫瘍細胞は非侵襲的な腫瘍ＤＮＡの供給源であり、腫瘍抑制遺伝子のＤＮＡメチル化を測定するために使用される（Ｒａｄｐｏｕｒｅｔａｌ．、２０１１）。ＨＣＣ
ＤＮＡの低メチル化は患者の血液で検出可能であり（Ｒａｍｚｙ、Ｏｍｒａｎ、Ｈａｍａｄ、Ｓｈａｋｅｒ、＆Ａｂｂｏｕｄ、２０１１）、最近ゲノムワイドバイサルファイトシーケンス（ｂｉｓｕｌｆｉｔｅｓｅｑｕｅｎｃｉｎｇ）が、ＨＣＣ患者の血漿中の低メチル化ＤＮＡを検出するために適用された（Ｃｈａｎｅｔａｌ．、２０１３）。ただし、特にがんの初期段階では、この情報源は限られており、ＤＮＡメチル化プロファイルは宿主（ｈｏｓｔ）のＤＮＡメチル化プロファイルによって混同されている。ゲノムワイドバイサルファイトシーケンスは比較的費用のかかる手順であり、重要なバイオインフォマティクス分析を必要とするため、スクリーニングツールとしては実行不可能である。したがって、課題は、腫瘍ＤＮＡと非腫瘍ＤＮＡを確実に区別できる少数のＣＧを描き、広範で多様な地理的領域の幅広い集団のスクリーニングを可能にする低コストハイスループットアッセイを開発することである。最近、いくつかのグループが、がんと正常なＤＮＡおよび血中ＤＮＡのゲノムワイドなＤＮＡメチル化マップの比較分析を実施した（Ｚｈａｉｅｔａｌ．、２０１２）。ただし、これらのアプローチの主な課題は、先験的に予期しないさまざまなレベルで血液中に見られる他の組織からの無細胞ＤＮＡを考慮に入れていないことである。がん組織と同様のメチル化プロファイルを持つ別の組織からのＤＮＡの混入は、偽陽性を引き起こす可能性がある。さらに、過去のアプローチでは、正常組織とがん組織におけるＤＮＡメチル化を定量的に比較している。この定量的な違いは、腫瘍ＤＮＡが他の非形質転換組織からの異なる未知の量のＤＮＡと混合されると希釈され、偽陰性を引き起こす可能性がある。現在の方法におけるこれらの欠陥は、本発明の主題において開示される異なるアプローチを必要とする。

がんを検出するためのシステムと方法の使用に関連するさらなる出版物は次のとおりである：ＧｒｉｇｇＧ、ＣｌａｒｋＳ。ゲノムＤＮＡの５−メチルシトシン残基のシーケンス。Ｂｉｏｅｓｓａｙｓ。１９９４年６月；ｌ６（６）：４３１−６、４３１；ＺｅｓｃｈｎｉｇｋＭ、ＳｃｈｍｉｔｚＢ、ＤｉｔｔｒｉｃｈＢ、ＢｕｉｔｉｎｇＫ、ＨｏｒｓｔｈｅｍｋｅＢ、ＤｏｅｒｆｌｅｒＷ。ヒトのゲノムにインプリントされたセグメント：ゲノムシーケンス法で決定されたプラダー・ウィリー／アンジェルマン症候群領域の異なるＤＮＡメチル化パターン。ＨｕｍＭｏｌＧｅｎｅｔ。１９９７年３月；６（３）：３８７−９５；ＦｅｉｌＲ、ＣｈａｒｌｔｏｎＪ、ＢｉｒｄＡＰ、ＷａｌｔｅｒＪ、ＲｅｉｋＷ。個々の染色体のメチル化分析：バイサルファイトゲノムシーケンスのための改良されたプロトコル。ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ。
１９９４年２月２５日；２２（４）：６９５−６；ＭａｒｔｉｎＶ、ＲｉｂｉｅｒａｓＳ、Ｓｏｎｇ−ＷａｎｇＸ、ＲｉｏＭＣ、ＤａｎｔｅＲ。ゲノムシーケンスは、ｐＳ２遺伝子の５’領域のＤＮＡ低メチル化とヒト乳がん細胞株におけるその発現との相関を示す。Ｇｅｎｅ。１９９５年５月１９日；ｌ５７（ｌ−２）：２６ｌ−４；ＷＯ
９７４６７０５、ＷＯ９５１５３７３およびＷＯ４５５６０。
Ａｇｕｉｒｒｅ−Ｇｈｉｓｏ，Ｊ．Ａ．（２００７）。がん休眠のモデル、メカニズム、および臨床的証拠。ＮａｔＲｅｖＣａｎｃｅｒ、７（１１）、８３４−８４６。ｄｏｉ：ｌ０．ｌ０３８／ｎｒｃ２２５６
Ｂａｙｌｉｎ，Ｓ．Ｂ．、Ｅｓｔｅｌｌｅｒ，Ｍ．、Ｒｏｕｎｔｒｅｅ，Ｍ．Ｒ．、Ｂａｃｈｍａｎ，Ｋ．Ｅ．、Ｓｃｈｕｅｂｅｌ，Ｋ．、＆Ｈｅｒｍａｎ，Ｊ．Ｇ．（２００１）。がんにおけるＤＮＡメチル化、クロマチン形成および遺伝子発現の異常なパターン。ＨｕｍＭｏｌＧｅｎｅｔ、１０（７）、６８７−６９２。
Ｂｒｅｉｔｂａｃｈ，Ｓ．、Ｔｕｇ，Ｓ．、Ｈｅｌｍｉｇ，Ｓ．、Ｚａｈｎ，Ｄ．、Ｋｕｂｉａｋ，Ｔ．、Ｍｉｃｈａｌ，Ｍ．、．．．Ｓｉｍｏｎ，Ｐ．（２０１４）。未精製血漿からの無細胞循環ＤＮＡの直接定量。ＰＬｏＳＯｎｅ、９（３）、ｅ８７８３８。ｄｏｉ：ｌ０．ｌ３７ｌ／ｊｏｕｒｎａｌ．ｐｏｎｅ．００８７８３８
Ｃｈａｎ，Ｋ．Ｃ．、Ｊｉａｎｇ，Ｐ．、Ｃｈａｎ，Ｃ．Ｗ．、Ｓｕｎ，Ｋ．、Ｗｏｎｇ，Ｊ．、Ｈｕｉ，Ｅ．Ｐ．、．．．Ｌｏ，Ｙ．Ｍ．（２０１３）。血漿ＤＮＡバイサルファイトシーケンスによるがん関連ゲノムワイドの低メチル化とコピー数異常の非侵襲的
検出。ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ、１１０（４７）、１８７６１−１８７６８。ｄｏｉ：ｌ０．ｌ０７３／ｐｎａｓ．ｌ３ｌ３９９５１１０
Ｄｏｍｉｎｇｕｅｚ−Ｖｉｇｉｌ，Ｉ．Ｇ．、Ｍｏｒｅｎｏ−Ｍａｒｔｉｎｅｚ，Ａ．Ｋ．、Ｗａｎｇ，Ｊ．Ｙ．、Ｒｏｅｈｒｌ，Ｍ．Ｈ．Ａ．、＆Ｂａｒｒｅｒａ−Ｓａｌｄａｎａ，Ｈ．Ａ．（２０１８）。がんとの闘いにおけるリキッドバイオプシーの夜明け。Ｏｎｃｏｔａｒｇｅｔ、９（２）、２９１２−２９２２。ｄｏｉ：ｌ０．１８６３２／ｏｎｃｏｔａｒｇｅｔ．２３ｌ３ｌ
Ｅｈｒｌｉｃｈ，Ｍ．（２００２）。がんにおけるＤＮＡメチル化：多すぎるが少なすぎる。Ｏｎｃｏｇｅｎｅ、２１（３５）、５４００−５４１３。
Ｅｌ−Ｓｅｒａｇ，Ｈ．Ｂ．（２０１１）。肝細胞がん。ＮＥｎｇｌＪＭｅｄ、３６５（１２）、１１１８−１１２７。ｄｏｉ：１０．１０５６／ＮＥＪＭｒａ１００１６８３
Ｆｌｏｒｅｓ，Ａ．、＆Ｍａｒｒｅｒｏ，Ｊ．Ａ．（２０１４）。肝細胞がんの最新動向：診断と治療に焦点を当てる。ＣｌｉｎＭｅｄＩｎｓｉｇｈｔｓＯｎｃｏｌ、８、７１−７６．ｄｏｉ：ｌ０．４ｌ３７／ＣＭＯ．Ｓ９９２６
Ｉｓｓａ，Ｊ．Ｐ．、Ｖｅｒｔｉｎｏ，Ｐ．Ｍ．、Ｗｕ，Ｊ．、Ｓａｚａｗａｌ，Ｓ．、Ｃｅｌａｎｏ，Ｐ．、Ｎｅｌｋｉｎ，Ｂ．Ｄ．、．．．Ｂａｙｌｉｎ，Ｓ．Ｂ．（１９９３）。結腸がんの進行中のシトシンＤＮＡ−メチルトランスフェラーゼ活性の増加。Ｊ
ＮａｔｌＣａｎｃｅｒＩｎｓｔ、８５（１５）、１２３５−１２４０。
Ｌｕｃｚａｋ，Ｍ．Ｗ．、＆Ｊａｇｏｄｚｉｎｓｋｉ，Ｐ．Ｐ．（２００６）。がん進行におけるＤＮＡメチル化の役割。ＦｏｌｉａＨｉｓｔｏｃｈｅｍＣｙｔｏｂｉｏｌ、４４（３）、１４３−１５４
Ｒａｄｐｏｕｒ，Ｒ．、Ｂａｒｅｋａｔｉ，Ｚ．、Ｋｏｈｌｅｒ，Ｃ．、Ｌｖ，Ｑ．、Ｂｕｒｋｉ，Ｎ．、Ｄｉｅｓｃｈ，Ｃ．、．．．Ｚｈｏｎｇ，Ｘ．Ｙ．（２０１１）。乳がんの血液検査を開発するための重要な調節経路に関与する腫瘍抑制遺伝子の高メチル化。ＰＬｏＳＯｎｅ、６（１）、ｅｌ６０８０。ｄｏｉ：ｌ０．ｌ３７ｌ／ｊｏｕｒｎａｌ．ｐｏｎｅ．００ｌ６０８０
Ｒａｍｚｙ，ＩＩ，Ｏｍｒａｎ，Ｄ．Ａ．、Ｈａｍａｄ，Ｏ．、Ｓｈａｋｅｒ，Ｏ．、＆Ａｂｂｏｕｄ，Ａ．（２０１１）。肝細胞がんの予後マーカーとしての血清ＬＩＮＥ−１低メチル化の評価。ＡｒａｂＪＧａｓｔｒｏｅｎｔｅｒｏｌ、１２（３）、１３９−１４２。ｄｏｉ：ｌ０．ｌ０ｌ６／ｊ．ａｊｇ．２０ｌ１．０７．００２
Ｓｔｅｆａｎｓｓｏｎ，Ｏ．Ａ．、Ｍｏｒａｎ，Ｓ．、Ｇｏｍｅｚ，Ａ．、Ｓａｙｏｌｓ，Ｓ．、Ａｒｒｉｂａｓ−Ｊｏｒｂａ，Ｃ．、Ｓａｎｄｏｖａｌ，Ｊ．、．．．Ｅｓｔｅｌｌｅｒ，Ｍ．（２０１４）。生物学的に区別される乳がんのサブタイプのＤＮＡメチル化に基づく定義。ＭｏｌＯｎｃｏｌ。ｄｏｉ：ｌ０．ｌ０ｌ６／ｊ．ｍｏｌｏｎｃ．２０ｌ４．ｌ０．０ｌ２
Ｔａｎ，Ｃ．Ｈ．、Ｌｏｗ，Ｓ．Ｃ．、＆Ｔｈｎｇ，Ｃ．Ｈ．（２０１１）。肝細胞がんの画像診断に関するＡＰＡＳＬおよびＡＡＳＬＤコンセンサスガイドライン：レビュー。ＩｎｔＪＨｅｐａｔｏｌ、２０１１、５１９７８３。ｄｏｉ：１０．４０６１／２０１１／５１９７８３
Ｖａｌｅｎｔｅ，Ｓ．、Ｌｉｕ，Ｙ．、Ｓｃｈｎｅｋｅｎｂｕｒｇｅｒ，Ｍ．、Ｚｗｅｒｇｅｌ，Ｃ．、Ｃｏｓｃｏｎａｔｉ，Ｓ．、Ｇｒｏｓ，Ｃ．、．．．Ｍａｉ，Ａ．（２０１４）。がん幹細胞を含むがんで活性化するヒトＤＮＡメチルトランスフェラーゼの選択的非ヌクレオシド阻害剤。ＪＭｅｄＣｈｅｍ、５７（３）、７０１−７１３。ｄｏｉ：ｌ０．ｌ０２ｌ／ｊｍ４０ｌ２６２７
Ｗａｒｔｏｎ，Ｋ．、＆Ｓａｍｉｍｉ，Ｇ．（２０１５）。がんの診断における無細胞循環ＤＮＡのメチル化。ＦｒｏｎｔＭｏｌＢｉｏｓｃｉ、２、１３。ｄｏｉ：ｌ０．３３８９／ｆｍｏｌｂ．２０ｌ５．０００ｌ３
Ｘｕ，Ｒ．Ｈ．、Ｗｅｉ，Ｗ．、Ｋｒａｗｃｚｙｋ，Ｍ．、Ｗａｎｇ，Ｗ．、Ｌｕｏ，Ｈ．、Ｆｌａｇｇ，Ｋ．、．．．Ｚｈａｎｇ，Ｋ．（２０１７）。肝細胞がんの診断と予
後のための循環腫瘍ＤＮＡメチル化マーカー。ＮａｔＭａｔｅｒ、１６（１１）、１１５５−１１６１。ｄｏｉ：ｌ０．ｌ０３８／ｎｍａｔ４９９７
Ｚｈａｉ，Ｒ．、Ｚｈａｏ，Ｙ．、Ｓｕ，Ｌ．、Ｃａｓｓｉｄｙ，Ｌ．、Ｌｉｕ，Ｇ．、＆Ｃｈｒｉｓｔｉａｎｉ，Ｄ．Ｃ．（２０１２）。食道腺がんおよびバレット食道における無細胞血清ＤＮＡのゲノムワイドなＤＮＡメチル化プロファイリング。Ｎｅｏｐｌａｓｉａ、１４（１）、２９−３３。

請求される主題の実施形態は、がんが、任意の正常組織および血球のＤＮＡメチル化プロファイルとは異なる、一連の「カテゴリー的に」区別されるＤＮＡメチル化シグネチャに関連付けられることを示す。これらのサイト（ｓｉｔｅ）は、がんと他の組織との間に二元的な分化を作り、これにより、これらのサイトはがんでのみメチル化され、他のがんでは完全にメチル化されない。したがって、ディープ次世代シーケンスを使用して、メチル化の正常な細胞ＤＮＡプロファイルのバックグラウンドにあるがん細胞の数個の分子さえも検出することが可能である。本発明の主題の実施形態は、他の組織からの無細胞ＤＮＡの高いバックグラウンド上でさえ、無細胞腫瘍ＤＮＡの検出を可能にし、したがって、例えば、唾液、血漿、尿、糞便など体液から抽出された無細胞（ＣＦ）ＤＮＡを使用するがんの早期検出に特に適している。実施形態はまた、パップテストなどの組織スミアならびにバイオプシーおよび針バイオプシーにおけるがんの早期検出を可能にする。従来技術での以前の分析では、同じ組織と血液の正常細胞とがん細胞、およびＤＮＡメチル化レベルが量的に異なる派生サイト（ｓｉｔｅ）のみが比較されていた（Ｘｕｅｔａｌ．、２０１７）。ただし、このような先行技術の分析で発見されたサイトは、他の組織のＣＦ
ＤＮＡと混合した場合、ＣＦ腫瘍ＤＮＡを検出できない（中山大学がん病院のＨＣＣのｃｔＤＮＡマーカーについては、図２を参照する）。本発明請求の主題の一実施形態は、すべての組織ではメチル化されていないが、特定のがんではメチル化されているユニークなサイトのセットを明らかにしている。別の実施形態は、次世代シーケンシング、ＭｅＤＩＰアレイ、ＭｅＤＩＰシーケンスなどによって得られたゲノムワイドなＤＮＡメチル化データのさまざまなソースを使用して、「バイナリーカテゴリー区別（ＢＣＤ）法」（ｂｉｎａｒｙ−ｃａｔｅｇｏｒｉｃａｌｄｉｆｆｅｒｅｎｔｉａｔｉｏｎｍｅｔｈｏｄ）と呼ばれるがん、他の組織および他の疾患におけるカテゴリー的に区別されるメチル化サイトを発見する方法を明らかにする。一実施形態は、ゲノムワイドデータの発見セットにおけるａ．肝細胞がん（ＨＣＣ）、ｂ．肺がん、ｃ．前立腺がん、ｄ．乳がん、ｅ．大腸がん、ｆ．頭頸部扁平上皮がん（ＨＮＳＣ）、ｇ．膵臓がん、ｈ．脳がん（膠芽腫）、ｉ．胃がん、ｊ．卵巣がん、ｋ．子宮頸がん、ｌ．食道がん、ｍ．膀胱がん、ｎ．腎臓がん、ｏ．精巣がん、ｐ．一般的な固形腫瘍、ｑ．血液がんのプロファイルの検出のための「カテゴリー」ＤＮＡメチル化サイトの組み合わせを明らかにする。別の実施形態はまた、起源の組織によって腫瘍を区別する「カテゴリー」ＤＮＡメチル化サイトの組み合わせを明らかにする。この実施形態は、組織特異性が低いメチル化ＣＦＤＮＡを検出するための先行技術の方法とアッセイを区別する。実施形態は高い感度および特異性で、何百人もの患者からのＤＮＡメチル化データならびに腫瘍の起源の組織におけるがんの検出のためのポリジーンＤＮＡメチル化アッセイを検証する。本発明は、ターゲット特異的プライマーとそれに続くバーコードプライマーによる逐次増幅、および単一の次世代Ｍｉｓｅｑシーケンス反応におけるマルチプレックスシーケンス、血漿、唾液、尿などの少量の体液からのデータ抽出とメチル化の定量化により、何百もの人々のＣＧＩＤのポリジーンセットにおけるＤＮＡメチル化を同時に正確に測定する方法を開示する。本発明の主題の別の実施形態はまた、パイロシーケンスアッセイまたはメチル化特異的ＰＣＲを使用する、前記ＤＮＡメチル化ＣＧＩＤのメチル化の測定を開示する。別の実施形態は、がんを有する人を健康な人から区別する、「カテゴリー」またはポリジーン加重メチル化スコアのいずれかの計算を開示する。別の実施形態は、血漿、尿、糞便、組織バイオプシーまたは組織スワブからがんの他の臨床的証拠がない人のがんの予測に至る新規プロセスを開示す
る。別の実施形態は、がんならびに、細胞死およびアルツハイマー病およびニューロンの他の神経変性疾患、心筋細胞の心臓病などのＣＦＤＮＡの放出を含む他の疾患を検出するために当業者によって使用され得る。実施形態に記載されているＤＮＡメチル化マーカー（ＣＧＩＤ）は、下記に利用される。ａ．定期的な「健康診断」による、すなわち「健康な」人のがんの非侵襲的早期発見。ｂ．ＨＣＣのリスクが高い慢性肝炎患者や肺がんのリスクが高い喫煙者などの、「リスクの高い」人の監視。ｃ．がん治療を受けている患者の治療への反応を監視し、再発または転移を検出。

実施形態は、本明細書に開示されるＤＮＡメチル化測定方法に基づいて、ポリジーンまたはカテゴリースコアを使用して未知のサンプルのがんを検出する有用性を実証する。開示された実施形態は、体液、糞便、尿、および任意のがんの組織または罹患組織におけるがんを検出するために、例えば次世代バイサルファイトシーケンス（ｂｉｓｕｌｆｉｔｅ
ｓｅｑｕｅｎｃｉｎｇ）、ＩｌｌｕｍｉｎａＥｐｉｃマイクロアレイ、キャプチャーシーケンス、メチル化ＤＮＡ免疫沈降（ＭｅＤＩＰ）メチル化特異的ＰＣＲ、および利用可能になるメチル化測定法など、当業者が利用できるメチル化分析の方法を使用することで、当業者によって使用され得る。

実施形態はまた、次世代バイサルファイトシーケンス、ＭｅＤｉｐシーケンス、イオントレントシーケンス、Ｅｐｉｃマイクロアレイなどに続いて、疾患の非侵襲的検出に使用される特定の高感度マーカーを発見するためのバイナリーカテゴリー区別（ＢＣＤ）法の分析など、ゲノムワイドシーケンスのために当業者が利用可能な任意の方法を使用して、他のがんおよび疾患の新しい「ポリジーン」カテゴリーＤＮＡメチル化マーカーの発見の可能性を開示する。

本発明の主題の実施形態は、以下を含む。
第１の態様では、実施形態は、がんの早期検出のために、血漿などの体液中の無細胞ＤＮＡにおけるがんのポリジーンＤＮＡメチル化マーカーを提供し、前記ポリジーンＤＮＡメチル化マーカーセットは、本明細書に開示されている「バイナリーカテゴリー区別（ＢＣＤ）分析」を使用して、Ｉｌｌｕｍｉｎａ４５０ＫやＥＰＩＣアレイ、ゲノムワイドバイサルファイトシーケンス、メチル化ＤＮＡ免疫沈降（ＭｅＤＩＰ）シーケンス、またはオリゴヌクレオチドアレイとのハイブリダイゼーションなどのマッピング方法によって得られたゲノム全体のＤＮＡメチル化から得られる。

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用した肝臓がん肝細胞がん（ＨＣＣ）の早期検出のために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせ（または表１の下に例として示される本リストの短いサブセット）である。

検出するためのサブセット：
ｃｇ０２０１２５７６，ｃｇ０３７６８７７７，ｃｇ２４８０４５４４，ｃｇ０５７３９１９０

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＤＮＡを使用してがんの起源をＨＣＣとして特定し、そして他の１０種の一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表２の下に例として示される）である。

特異性（ｓｐｅｃｉｆｉｃｉｔｙ、スペック）のためサブセット：
ｃｇ１４１２６４９３

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用した肺がんの早期検出のために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表３の下に例として示される）である。

検出するためのサブセット：
ｃｇ０４２２３４２４，ｃｇ２３１４１３５５

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＤＮＡを使用してがんの起源を肺がんとして特定し、そして他の１０種の一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表４の下に例として示される）である。

スペックのためのサブセット：
ｃｇ０５９１７７３２，ｃｇ２５４７００７７

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用して、前立腺がんを早期に検出し、そしてがんの起源を前立腺がんとして特定し、ならびに他の１６種の一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせ（または表５の下に例として示される本リストの短いサブセット）である。

検出_スペックのためのサブセット：
ｃｇ１４２８３５６９
［上記の表に示された４つの組み合わせのサブセットである］

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用して、乳がんを早期に検出するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表６の下に示される例など）である。

検出するためのサブセット：
ｃｇ１３０３１２５１，ｃｇ０９７３４７９１，ｃｇ０９６９５７３５，ｃｇ０３６３７８７８

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＤＮＡを使用してがんの起源を乳がんとして特定し、そして他の１０種の一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表７の下に例として示される）である。

スペックのためのサブセット：
ｃｇ０３１１３８７８，ｃｇ２０１８０８４３

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用して、大腸がん（ＣＲＣ）を早期に検出し、そしてがんの起源を大腸がんとして特定し、ならびに他の１６種の一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表８の下に例として示される）である。

検出−スペックのためのサブセット：
ｃｇ０９８５４６５３，ｃｇ０１５６６２４２

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用して、膵臓がんを早期に検出するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧ
ＩＤの組み合わせまたは本リストの短いサブセット（表９の下に例として示される）である。

検出するためのサブセット：
ｃｇ２５０２４０７４，ｃｇ１５３８６９６４，ｃｇ１６２３２９７９

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＤＮＡを使用してがんの起源を膵臓がんとして特定し、そして他の１０種の一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表１０の下に例として示される）である。

スペックのためのサブセット：
ｃｇ０１２３７５６５，ｃｇ０８１８２９７５，ｃｇ２０９８３５７７，ｃｇ２５５９１３７７

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用して、脳がん（膠芽腫）を早期に検出し、そしてがんの起源を脳がん（膠芽腫）として特定し、ならびに他の１０種の一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表１１の下に例として示される）である。

検出−スペックのためのサブセット：
ｃｇ１９９２９３５５

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用して、胃（ｓｔｏｍａｃｈ）［胃（ｇａｓｔｒｉｃ）］がんを早期に検出するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表１２の下に例として示される）である。

検出するためのサブセット：
ｃｇ０５６１１７７９，ｃｇ０９７３４７９１，ｃｇ１５７６０２５７

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＤＮＡを使用してがんの起源を胃がんとして特定し、そして他の１０種の一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表１３の下に例として示される）である。

スペックのためのサブセット：
ｃｇ０５１１７７９，ｃｇ１９２３５３３９

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用して、卵巣がんを早期に検出するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧ
ＩＤの組み合わせまたは本リストの短いサブセット（表１４の下に例として示される）である。

検出するためのサブセット：
ｃｇ２４３３９１９３，ｃｇ２２６９４ｌ５３，ｃｇ１１２５２３３７，ｃｇ２１２１０９８５

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用してがんの起源を卵巣がんとして特定し、そして他の１０種の一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表１５の下に例として示される）である。

スペックのためのサブセット：
ｃｇ０７０６８７６８，ｃｇ１９８４６６０９

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用して、子宮頸
がんを早期に検出するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表１６の下に例として示される）である。

検出するためのサブセット：
ｃｇ００７５７１８２，ｃｇ０１６０１７４６

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＤＮＡを使用してがんの起源を子宮頸がんとして特定し、そして他の１０種の一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表１７の下に例として示される）である。

スペックのためのサブセット：
ｃｇ０７０６６５９４，ｃｇ０９２６０６４０，ｃｇ１２９６ｌ８４２

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用して、頭頸部扁平上皮がん（ＨＮＳＣ）を早期に検出するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表１８の下に例として示される）である。

検出するためのサブセット：
ｃｇ０７９００９６８，ｃｇ２０３３４２４３，ｃｇ２７４２０５２０

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＤＮＡを使用してがんの起源を頭頸部扁平上皮がん（ＨＮＳＣ）として特定し、そして他の１０種の一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表１９の下に例として示される）である。

スペックのためのサブセット：
ｃｇ１８００６３２８，ｃｇ１９２８７２２０

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用して、食道がんを早期に検出するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧ
ＩＤの組み合わせまたは本リストの短いサブセット（表２０の下に例として示される）である。

検出するためのサブセット：
ｃｇ０３２８０６２４，ｃｇ０３７３５８８８，ｃｇ０９７３４７９１，ｃｇ２７４２０５２０

一実施形態では、血漿ＣＦＤＮＡまたは他の体液ＤＮＡを使用してがんの起源を食道がんとして特定し、そして他の１０種の一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表２１の下に例として示される）である。

スペックのためのサブセット：
Ｃｇ０９５５６９５２，ｃｇ１２４７３２８５

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用して、膀胱がんを早期に検出するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧ
ＩＤの組み合わせまたは本リストの短いサブセット（表２２の下に例として示される）である。

検出するためのサブセット：
ｃｇ０４２２３４２４，ｃｇ１０７２３９６２，ｃｇ２５０２４０７４

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＤＮＡを使用してがんの起源を膀胱がんとして特定し、そして他の１０種の一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表２３の下に例として示される）である。

スペックのためのサブセット：
ｃｇ１３５４４００６

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＤＮＡを使用して、腎臓（ｒｅｎａｌ）［腎臓（ｋｉｄｎｅｙ）］がんを早期に検出し、がんの起源を腎臓がんとして特定し、そして他の１０種の一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表２４の下に例として示される）である。

検出スペックのためのサブセット：
ｃｇ０８８８４５７１，ｃｇ０００１１２２５，ｃｇ０００１１２２５

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用して、精巣がんを早期に検出し、がんの起源を精巣がんとして特定し、そして他の１０種の一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表２５の下に例として示される）である。

検出とスペックのためのサブセット：
ｃｇ１４５３１０９３，ｃｇ２５１５９９２７

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用して、１３種の最も一般的な固形腫瘍の１つを早期に検出するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストのＣＧＩＤの組み合わせまたは本リストの短いサブセット（表２６の下に例として示される）である。

検出するためのサブセット：
ｃｇ１０７２３９６２，ｃｇ１５７５９０５６，ｃｇ２４４２７５０４，ｃｇ２５０２４０７４

他の実施形態では、白血球、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用して、ＡＭＬ、ＣＬＬなどの血液がんを早期に検出するために、ポリジーンＤＮＡメチル化マーカーは、表２７に示されるようなゲノムワイドなＤＮＡメチル化データに対してのＢＣＤ法によって描かれたＣＧＩＤの組み合わせ（または表２７の下に示される本組み合わせの短いサブセット）である。

検出−スペックのためのサブセット：
ｃｇ１８６５８３９７，ｃｇ１８７８０４１２，ｃｇ２０４３９２８８，ｃｇ２２８２８０４５，ｃｇ２５３７５３４０

他の実施形態では、血漿ＣＦＤＮＡまたは他の体液ＣＦＤＮＡを使用して、黒色腫を早期に検出し、がんの起源を黒色腫として特定し、そして他の１６種一般的な固形腫瘍がんと区別するために、ポリジーンＤＮＡメチル化マーカーは、以下のリストに示されるＣＧＩＤの組み合わせ（または表２８の下に例として示される本リストの短いサブセット）である。

検出−スペックのためのサブセット：
ｃｇ１５３０７８９１，ｃｇ１８８６６５２９，ｃｇ２７０８４９０３

本発明の主題の別の態様では、ポリジーンＤＮＡメチル化マーカーのＤＮＡメチル化測定値を検出するための手段および試薬を含む、がんを検出するためのキットおよびプロセスが提供される。

一実施形態では、表１および表２のＣＧＩＤのＤＮＡメチル化測定値のための手段および試薬を含む、肝細胞がんを検出するためのキットが提供される。

別の実施形態では、表３および表４のＣＧＩＤのＤＮＡメチル化測定値のための手段および試薬を含む、肺がんを検出するためのキットが提供される。

別の実施形態では、表５のＣＧＩＤのＤＮＡメチル化測定値を検出するための手段および試薬を含む、前立腺がんを検出するためのキットが提供される。

別の実施形態では、表６および表７のＣＧＩＤのＤＮＡメチル化測定値を検出するための手段および試薬を含む、乳がんを検出するためのキットが提供される。

別の実施形態では、表８のＣＧＩＤのＤＮＡメチル化測定値のための手段および試薬を含む、大腸がんを検出するためのキットが提供される。

別の実施形態では、表９および表１０のＣＧＩＤのＤＮＡメチル化測定値を検出するための手段および試薬を含む、膵臓がんを検出するためのキットが提供される。

さらに別の実施形態では、表１１のＣＧＩＤのＤＮＡメチル化測定値を検出するための手段および試薬を含む、脳がんを検出するためのキットが提供される。

別の実施形態では、表１２および表１３のＣＧＩＤのＤＮＡメチル化測定値を検出するための手段および試薬を含む、胃がんを検出するためのキットが提供される。

別の実施形態では、表１４および表１５のＣＧＩＤのＤＮＡメチル化測定値を検出するための手段および試薬を含む、卵巣がんを検出するためのキットが提供される。

別の実施形態では、表１６および表１７のＣＧＩＤのＤＮＡメチル化測定値を検出するための手段および試薬を含む、子宮頸がんを検出するためのキットが提供される。

別の実施形態では、表１８および表１９のＣＧＩＤのＤＮＡメチル化測定値を検出するための手段および試薬を含む、頭頸部扁平上皮がん（ＨＮＳＣ）を検出するためのキットが提供される。

別の実施形態では、表２０および表２１のＣＧＩＤのＤＮＡメチル化測定値を検出するための手段および試薬を含む、食道がんを検出するためのキットが提供される。

別の実施形態では、表２２および表２３のＣＧＩＤのＤＮＡメチル化測定値を検出するための手段および試薬を含む、膀胱がんを検出するためのキットが提供される。

別の実施形態では、表２４のＣＧＩＤのＤＮＡメチル化測定値を検出するための手段および試薬を含む、腎臓がんを検出するためのキットが提供される。

別の実施形態では、表２５のＣＧＩＤのＤＮＡメチル化測定値を検出するための手段および試薬を含む、精巣がんを検出するためのキットが提供される。

他の実施形態では、表２６のＣＧＩＤのＤＮＡメチル化測定値を検出するための手段および試薬を含む、１３種の一般的ながん（膀胱、脳、乳房、子宮頸部、大腸、食道、ＨＮＳＣ、ＨＣＣ（肝臓）、肺、卵巣、膵臓、前立腺、胃）のうちの１つを検出するための
キットが提供される。

別の実施形態では、表２７の血液がんの異なるサブタイプに特異的であるＢＣＤ法によって検出されたＣＧＩＤのＤＮＡメチル化測定値を検出するための手段および試薬を含む、ＡＭＬおよびＣＬＬなどの血液がんを検出するためのキットが提供される。

別の実施形態では、表２８のＣＧＩＤのＤＮＡメチル化測定値を検出するための手段および試薬を含む、黒色腫を検出するためのキットが提供される。

別の実施形態では、ＤＮＡパイロシーケンスメチル化アッセイは、上記にリストされるＣＧＩＤを使用することにより、例えば以下に開示されるプライマーおよびパイロシーケンス反応の標準条件を使用することにより、血漿ＣＦＤＮＡなどの体液中のＨＣＣを予測するために使用される。
ｃｇ０２０１２５７６
フォワード:

リバース (ビオチン標識された):

配列:

ｃｇ０３７６８７７７（ＶＡＳＨ２）
フォワード:

リバース (ビオチン標識された):

配列:

ｃｇ０５７３９１９０（ＣＣＮＪ）
フォワード:

リバース (ビオチン標識された):

配列:

ｃｇ２４８０４５４４（ＧＲＩＤ２ＩＰ）
フォワード(ビオチン標識された):

リバース:

配列:

がんの起源の組織の特異性は、以下のＣＧＩＤｃｇ０２０１２５７６（ＨＰＸ）のＤＮＡメチル化を測定することによって決定される。
フォワード(ビオチン標識された):

リバース (ビオチン標識された):

配列:

別の実施形態では、ポリジーン多重増幅バイサルファイトシーケンスＤＮＡメチル化アッセイ（ｐｏｌｙｇｅｎｉｃｍｕｌｔｉｐｌｅｘｅｄａｍｐｌｉｃｏｎｂｉｓｕｌｆｉｔｅｓｅｑｕｅｎｃｉｎｇＤＮＡｍｅｔｈｙｌａｔｉｏｎａｓｓａｙ）が、上記のＣＧＩＤを使用することにより、血漿ＣＦＤＮＡなどの体液中のがんを予測するために使用される。例えば、以下に開示されているプライマーと標準条件を使用して前立腺がんを予測する。該標準条件は、バイサルファイト変換、ターゲット特異的プライマー（ＰＣＲ１）とそれに続くバーコードプライマー（ＰＣＲ２）による逐次増幅、および単一の次世代Ｍｉｓｅｑシーケンサー（Ｉｌｌｕｍｉｎａ）でのマルチプレックスシーケンス、Ｉｌｌｕｍｉｎａソフトウェアを使用した逆多重化（ｄｅｍｕｌｔｉｐｌｅｘｉｎｇ）、Ｍｅｔｈｙｌｋｉｔなどのメチル化分析の標準的な方法を使用したデータ抽出とメチル化の定量化、その後の加重ＤＮＡメチル化（ｗｅｉｇｈｔｅｄＤＮＡｍｅｔｈｙｌａｔｉｏｎ）スコアの計算と、血漿、唾液または尿などの少量の体液からのがんの予測を含む。

第一のＰＣＲで前立腺がんを検出するステップは次のとおりである：
ＣＧＩＤｃｇ０２８７９６６２の場合
フォワードプライマー：

リバースプライマー：

ＣＧＩＤｃｇ１６２３２９７９の場合
フォワードプライマー：

リバースプライマー：

がんが前立腺に特異的に発生していることをテストするために、第一のＰＣＲは次のように実行される：
ＣＧＩＤ：ｃｇ１４０４１７０１およびｃｇ１４４９８２２７の場合
フォワードプライマー:

リバースプライマー:

サンプルをバーコード化するには、次のプライマーを用いて第二のＰＣＲ反応を使用する。
フォワードプライマー：

バーコードプライマー (リバース)：

（赤い塩基はインデックスであり、このインデックスの２００のバリエーションが使用される）

他の実施形態では、受信者動作特性（ＲＯＣ）アッセイは、ＣＧＩＤの加重ＤＮＡメチル化測定値を使用して、がんと正常との間のしきい値を定義することによってがんを検出するために使用される。しきい値を超える／下回るサンプルは、がんとして分類される。例えば、ＨＣＣを検出するための上記のＣＧＩＤがある：

別の実施形態では、上記にリストされるＣＧＩＤのメチル化の測定値を使用することによってがんを予測するために、階層的クラスタリング分析アッセイが使用される。

本発明の主題の別の態様では、がんおよび他の疾患を検出するためのＤＮＡメチル化マーカーを同定する方法は、臨床サンプルから得られたＤＮＡメチル化測定値に関して以前に開示された「バイナリーカテゴリー区別（ＢＣＤ）」法で統計分析を行うステップを含む。

別の実施形態では、この方法は、サンプルから得られたＤＮＡメチル化測定値に対して統計分析および「バイナリーカテゴリー区別（ＢＣＤ）」法を実行することを含み、ＩｌｌｕｍｉｎａＢｅａｄｃｈｉｐ４５０Ｋまたは少なくとも１つのサンプルから抽出されたＤＮＡのＥＰＩＣアレイを実行することによって得られたＤＮＡメチル化測定値を伴う。

別の実施形態において、ＤＮＡメチル化測定値は、サンプルから抽出されたＤＮＡのＤＮＡパイロシーケンス、続いて質量分析ベース（Ｅｐｉｔｙｐｅｒ^ＴＭ）、ＰＣＲベースのメチル化アッセイ、およびバイサルファイト変換されたＤＮＡに続いて、増幅の第二のセットにおけるバーコード化、そしてＩｌｌｕｍｉｎａ次世代シーケンサーでのインデックス付きマルチプレックスシーケンスからの、本明細書に開示される、標的ＣＧＩＤにまたがる領域の標的増幅の実行により得られる。

他の実施形態では、統計分析は、受信者動作特性（ＲＯＣ）アッセイを含む。

他の実施形態では、統計分析は、階層的クラスタリング分析アッセイを含む。

定義
本明細書で使用されるように、「ＣＧ」という用語は、シトシンおよびグアノシン塩基を含むＤＮＡ中のジヌクレオチド配列を指す。これらのジヌクレオチドシーケンスは、人間や他の動物のＤＮＡでメチル化される可能性がある。ＣＧＩＤは、Ｉｌｌｕｍｉｎａ
４５０Ｋマニフェストで定義されているように、ヒトゲノムにおけるその位置を明らかにする（ここにリストされているＣＧの注釈は、ｈｔｔｐｓ：／／ｂｉｏｃｏｎｄｕｃｔｏｒ．ｏｒｇ／ｐａｃｋａｇｅｓ／ｒｅｌｅａｓｅ／ｄａｔａ／ａｎｎｏｔａｔｉｏｎ／ｈｔｍｌ／ＩｌｌｕｍｉｎａＨｕｍａｎＭｅｔｈｙｌａｔｉｏｎ４５０ｋ．ｄｂ．ｈｔｍｌで公開され、ＲパッケージＩｌｌｕｍｉｎａＨｕｍａｎＭｅｔｈｙｌａｔｉｏｎ４５０ｋ．ｄｂＩｌｌｕｍｉｎａＨｕｍａｎＭｅｔｈｙｌａｔｉｏｎ４５０ｋ．ｄｂ：ＩｌｌｕｍｉｎａＨｕｍａｎＭｅｔｈｙｌａｔｉｏｎ４５０ｋ注釈データとしてインストールされている。Ｒパッケージバージョン２．０．９．）。

本明細書で使用されるように、診断機器または機器という用語は、１つ以上の試薬と共に使用して、例えば請求される主題の実施形態によるＤＮＡメチル化スコアのＤＮＡメチル化測定値を導出するために使用される診断テストを実行できる、当業者に知られている任意の機器である。

本明細書で使用されるように、「ベータ値」という用語は、式ベータ値＝メチル化Ｃ強度／（メチル化Ｃ強度＋非メチル化Ｃ強度）を使用するメチル化プローブと非メチル化プローブの強度比を使用して、Ｉｌｌｕｍｉｎａ４５０Ｋアレイの正規化および定量化によって導き出されたＣＧＩＤ位置での推定のメチル化レベルを指す。ベータ値は０と１の間で、０は完全にメチル化されておらず、１は完全にメチル化されている。

本明細書で使用されるように、「ペナルティ付き回帰」という用語は、例えば、Ｒ統計パッケージにおける、「ペナルティ付き」が、ＧｏｅｍａｎＪ．Ｊ．、Ｃｏｘ比例ハザードモデルでのＬ１ペナルティ付き推定ＢｉｏｍｅｔｒｉｃａｌＪｏｕｒｎａｌ５２（１），７０−８４で説明されているように、実施されるバイオマーカーのより大きなリストから結果を予測するために必要な予測因子の最小数を特定することを目的とした統計的方法を指す。

本明細書で使用されるように、「クラスタリング」という用語は、同じグループ（クラスターと呼ばれる）内の対象が、他のグループ（クラスター）より（ある意味では）互いに類似するように、対象セットをグループ化することを指す。

本明細書で使用するように、「階層的クラスタリング」という用語は、例えば、Ｋａｕｆｍａｎ，Ｌ．；Ｒｏｕｓｓｅｅｕｗ，Ｐ．Ｊ．（１９９０）データ内のグループの検索：クラスター分析の概要（１版）ＮｅｗＹｏｒｋ：ＪｏｈｎＷｉｌｅｙ．ＩＳＢＮ０−４７１−８７８７６−６で説明されているように、互いにクラスターがどの程度類似（近い）または類似していない（遠い）かに基づいて「クラスター」の階層を構築する統計的方法を指す。

本明細書で使用されるように、「受信者動作特性（ＲＯＣ）アッセイ」という用語は、予測因子の性能を例示するグラフィカルプロットを作成する統計的方法を指す。例えば、Ｈａｎｌｅｙ，ＪａｍｅｓＡ．、ＭｃＮｅｉｌ，ＢａｒｂａｒａＪ．（１９８２）「
受信者操作特性（ＲＯＣ）曲線下の面積の意味と使用」Ｒａｄｉｏｌｏｇｙ１４３（１）：２９−３６で説明されているように、予測の真の陽性率は、予測因子のさまざまなしきい値設定（すなわち、メチル化の異なる％）での偽陽性率に対してプロットされる。

本明細書で使用される「多変量またはポリジーン線形回帰」という用語は、ＣＧＩＤのメチル化の割合などの複数の「独立変数」または「予測値」と、がんなどの「従属変数」の間の関係を推定する統計的方法を指す。この方法は、ＣＧＩＤなどのいくつかの「独立変数」がモデルに含まれている場合の「結果」（がんなどの従属変数）を予測する際に、各ＣＧＩＤの「重み（ｗｅｉｇｈｔ）」または係数（ｃｏｅｆｆｉｃｉｅｎｔ）を決定する。

図１は、何百人もの血液サンプルと正常組織にまたがる完全にメチル化されていないサイトの候補リストを示す。図Ａは、Ｉｌｌｕｍｉｎａ４５０Ｋのゲノムワイドなメチル化アレイのすべての個体（＜０．ｌ）（ＧＳＥ５０１９２）でメチル化されていない１７組織にわたるＣＧＩＤが、３１２の個体からの血液サンプル（ＧＳＥ６１４９６）のゲノムワイドなＤＮＡメチル化アレイの非メチル化ＣＧＩＤと重複して３３４７７個のＣＧＩＤのリストを生成したことを示している。Ｂは、最も強力な非メチル化ＣＧＩＤの候補リストを示しており、Ａの３３４７７個のＣＧＩＤのリストは、１９歳から１０１歳までの６５６人（女性および男性）の血液サンプル（ＧＳＥ４０２７９）のＤＮＡメチル化アレイの非メチル化ＣＧＩＤと重複していた。結合された部分について、これらの分析により、すべての年齢層の多くの個人の組織と血液サンプルにわたってメチル化されていない信頼度の高い２８７５４個のＣＧＩＤのリストが生成された。これらの２８７５４個の位置は、本発明の主題によって開示される「バイナリーカテゴリー区別（ＢＣＤ）」法を使用して、がんにおいてカテゴリー的にメチル化されているが他の組織ではメチル化されていないサイトの発見に使用された。図２は、ＨＣＣに対する現在の循環ＤＮＡマーカーの組織特異性の欠如を示す図である。図示されたヒートマップは、他の正常な組織におけるこれらのサイトのＨＣＣとメチル化レベルのバイオマーカーとしてＸｕ等（Ｘｕ等、２０１７）に候補としてリストされた１０個のＣＧＩＤを示す。ＨＣＣの特定のバイオマーカーとして提案されているＣＧＩＤのいくつかは、他の組織でもメチル化されており、そして血中ＤＮＡのメチル化レベルがさまざまであることを示す。（青は０メチル化、暗赤色は１００％メチル化）図２Ａは、本発明の主題の実施形態による図２の一部の分解図である。図２Ｂは、本発明の主題の実施形態による図２の一部の分解図である。図２Ｃは、本発明の主題の実施形態による図２の一部の分解図である。図３は、がんＤＮＡに対してＢＣＤ法を使用して発見されたＨＣＣＤＮＡメチル化マーカーの特異性を示す図である。図示されたヒートマップは、ここで説明するＢＣＤ法によってＨＣＣＤＮＡメチル化マーカーとして選択された４つのＣＧＩＤを示す。メチル化レベルは、がん（ＨＣＣ）と正常な組織および血液との間でカテゴリー的に異なり、これにより、血液および他の組織のすべての個体で該サイトがメチル化されず、ＨＣＣで測定可能な程度にメチル化される。図３Ａは、本発明の主題の実施形態による図３の一部の分解図である。図３Ｂは、本発明の主題の実施形態による図３の一部の分解図である。図３Ｃは、本発明の主題の実施形態による図３の一部の分解図である。図４は、大腸がんに対する現在のＤＮＡメチル化マーカーのがん組織起源特異性の欠如、および本発明の主題の実施形態による「検出−スペック」法との比較を示す図である。図Ａは、大腸がんのＣＦＤＮＡメチル化マーカー「Ｅｐｉ−大腸がん」（エピゲノミクス社より販売）に含まれるＳｅｐｔ９遺伝子のＣＧサイトを示しており、マーカーはがんＤＮＡメチル化データのＴＣＧＡコレクションからのメチル化データを利用して他の多くのがんを検出するために使用できるため、大腸がんに対する特異性に欠けている（ＨＫＧ−大腸がん（ＨＫＧ−ｅｐｉＣＲＣ）、青）。ＢＣＤ法（ＨＫＧ−大腸がんオレンジ）（表１０）を用いて発見された大腸がんの検出のために本発明の主題で開示されるマーカー（表９）は、他の一般的な固形腫瘍がんに対して試験した場合、大腸がんに非常に特異的である。図Ｂと図Ｃは、ＨＫＧ−大腸がん（ＨＫＧ−ｅｐｉＣＲＣ）（Ｂ）またはＥｐｉ−大腸がん（Ｃ）のいずれかのＤＮＡメチル化マーカーを使用した、さまざまながんの異なる個人からの腫瘍ＤＮＡのＤＮＡメチル化値の散布図である。注目すべきは、ＨＫＧ−ｅｐｉＣＲＣマーカー（Ｂ）対Ｅｐｉ−大腸がんマーカー（Ｃ）の散在する異質なプロファイルを使用した、大腸がんと他のがんの間のＤＮＡメチル化の厳格なカテゴリー的な違いである。図４Ａは、本発明の主題の実施形態による図４の一部の分解図である。図４Ｂは、本発明の主題の実施形態による図４の一部の分解図である。図５は、肝臓がん（ＨＣＣ）の早期発見のためのポリジーンＤＮＡメチル化マーカーの発見を示す図である。図Ａは、ソースと患者数をリストした表を示し、これらの患者のメチル化データは、ＢＣＤ法（表１）および起源特定のがんを決定するためのＣＧＩＤ（表２）を使用する実施形態による、ＨＣＣの検出のための４つの一連のＣＧＩＤの発見に使用された。図５の左下のパネルの図Ｂ（検出）は、１〜１４５（正常７９名およびＨＣＣ６６名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表１）のメチル化スコアの合計を示す。該ポリジーンスコアは、ＨＣＣを有する人と正常な肝組織を有する人をカテゴリー的に区別する。右下のパネルの図Ｃは、８種の異なる腫瘍（表２）のデータを使用して特定の腫瘍の起源を検出する１つのＣＧＩＤ（表２）のメチル化スコアを示す。マーカーは、他の起源のがんとＨＣＣをカテゴリー的に区別する。図６は、ＧＳＥ７６２６９（ｎ＝２２７）からのＤＮＡメチル化データを使用した、ＨＣＣ（スペック）のポリジーンＤＮＡメチル化マーカーの検証の図である。図Ａは、肝臓がん患者２２７名のＤＮＡメチル化データと正常１０名を使用したＨＣＣＤＮＡメチル化マーカーの曲線下の領域を示すＲＯＣプロットである。図６の図Ｂは、ＨＣＣ検出の感度、特異性、および精度を示す。図Ｃは、検証データセットにおけるＨＣＣの検出の予測率を示す。図７は、ＴＣＧＡメチル化データ（ｎ＝４１６６）における、ＨＣＣ対他のがんに対するポリジーンＨＫＧ−ｅｐｉ肝臓がん−検出およびスペックマーカーの精度および特異性の検証の図である。図７の図Ａは、異なるがんを有する患者のＨＫＧ−肝臓検出／スペックマーカーＤＮＡメチル化データの検出率を示す。ＨＣＣのほぼ完全な特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける４１６６人の患者のＤＮＡメチル化データにおける、ＨＣＣのＨＫＧ−肝臓−検出マーカーの特異性と感度のＲＯＣプロットである。図Ｃは、ＨＣＣ対他の起源のがんに対する感度と特異性である。図８は、肺がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図８の図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表３）および起源特定のがん組織を決定するためのＣＧＩＤ（表４）を使用する実施形態に開示される、肺がんの検出のための一連のＣＧＩＤの発見に使用された。図８の左下のパネルの図Ｂ（検出）は、１〜２０名（正常１０名および肺がん１０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表３）のメチル化スコアの合計を示す。該ポリジーンスコアは、肺がんを有する人と正常な組織を有する人をカテゴリー的に区別する。図８の右下のパネルの図Ｃは、８種の異なる腫瘍（ｎ＝８０）のある人からのデータを使用して特定の腫瘍の起源を検出するＣＧＩＤ（表４）のメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと肺がんをカテゴリー的に区別する。図９は、ＴＣＧＡメチル化データ（ｎ＝４１６６）における、ＨＣＣ対他のがんに対するポリジーンＨＫＧ−ｅｐｉ肺がん−検出およびスペックマーカーの精度および特異性の検証の図である。図９の図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用したＨＫＧ−ｅｐｉ肺がん検出／スペックマーカーの検出率を示す。肺がんの特異性に注目すべきである。図９の図Ｂは、ＴＣＧＡからの４１６６名の患者のＤＮＡメチル化データにおける、肺がんのＨＫＧ−肺がん−検出マーカーの特異性と感度のＲＯＣプロットを示す。図９の図Ｃは、肺がん対他の起源のがんに対する感度と特異性を示す。図１０は、前立腺がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図１０の図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表５）および起源特定のがん組織を決定するためのＣＧＩＤ（表６）を使用する実施形態に開示される、前立腺がんの検出のための一連のＣＧＩＤの発見に使用された。図１０の左下のパネルの図Ｂ（検出）は、１〜１５（正常５名および前立腺がん１０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表５）のメチル化スコアの合計を示す。該ポリジーンスコアは、前立腺がんを有する人と正常な人をカテゴリー的に区別する。図１０の右下のパネルの図Ｃは、８種の異なる腫瘍（ｎ＝８０）のある人からのデータを使用して起源特定の腫瘍組織を検出するＣＧ（表６）のメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと前立腺がんをカテゴリー的に区別する。図１１は、ＴＣＧＡメチル化データ（ｎ＝４１６６）における、前立腺がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉ前立腺がん−検出およびスペックマーカーの精度および特異性の検証の図である。図１１の図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用したＨＫＧ−前立腺がん検出／スペックマーカーの検出率を示す。前立腺がんの特異性に注目すべきである。図１１の図Ｂは、ＴＣＧＡにある４１６６名の患者からのＤＮＡメチル化データを使用する、肺がんのＨＫＧ−前立腺がん−検出マーカーの特異性と感度のＲＯＣプロットである。図１１の図Ｃは、前立腺対他の起源のがんに対する感度と特異性を示す。図１２は、乳がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図１２の図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表７）および起源特定のがんを決定するためのＣＧＩＤ（表８）を使用する実施形態に開示される、乳がんの検出のための一連のＣＧの発見に使用された。図１２の左下のパネルの図Ｂ（検出）は、１〜２７（正常１７名および乳がん１０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表７）のメチル化スコアの合計を示す。該ポリジーンスコアは、乳がんを有する人と正常な乳組織を有する人をカテゴリー的に区別する。図１２の右下のパネルの図Ｃは、８種の異なる腫瘍（ｎ＝８０）のある人からのデータを使用して特定の腫瘍の起源を検出するＣＧＩＤ（表８）のメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと乳がんをカテゴリー的に区別する。図１３は、検証コーホートＧＳＥ６０１８５（ｎ＝２８５）において、ＨＫＧ₋ｅｐｉ乳がん−検出ポリジーンＤＮＡメチル化マーカーが非浸潤性および浸潤性乳がんを検出する図である。図１３の図Ａは、２３９名の乳がん患者のＤＮＡメチル化データ、１７名の乳がんではない乳房形成術患者および２９名の隣接組織を使用した乳がんポリジーンＤＮＡメチル化マーカーの曲線下の領域を示すＲＯＣプロットである。すべての乳がんの感度、特異性および精度をＢに示し、ＤＣＩＳ（非浸潤性乳管がん）、浸潤性乳がんおよび混合乳がんのサンプルの予測率を図１３の図Ｃに示す。注目すべきは、乳がんマーカーが非常に早期の乳がん（ＤＣＩＳ）を検出することである。図１４は、ＴＣＧＡメチル化データ（ｎ＝４１６６）における、乳がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉ乳がん−検出およびスペックマーカーの精度および特異性の検証の図である。図１４の図Ａは、異なるがんを有する患者からのＤＮＡメチル化データにおいて、ＨＫＧ−ｅｐｉ乳がん検出／スペックマーカーの検出率を示す。乳がんの特異性に注目すべきである。図１４の図Ｂは、ＴＣＧＡにおける４１６６人患者のＤＮＡメチル化データを使用して乳がんを検出するための、ＨＫＧ−乳がん−検出マーカーの特異性と感度のＲＯＣプロットである。図１４の図Ｃは、乳がん対他の起源のがんに対する感度と特異性を示す。図１５は、大腸がん（ＣＲＣ）のポリジーンＤＮＡメチル化マーカーの発見の図である。図１５の図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表９）および起源特定のがんを決定するためのＣＧＩＤ（表１０）を使用する実施形態に開示される、大腸がんの検出のための一連のＣＧＩＤの発見に使用された。図１５の左下のパネルの図Ｂ（検出）は、１〜７５（正常２５名および大腸がん５０名）からリストされた各テスト対象者のこれらのＣＧＩＤのメチル化スコアの合計を示す。該ポリジーンスコアは、がんを有する人と正常な組織を有する人をカテゴリー的に区別する。図１５の右下のパネルの図Ｃは、８種の異なる腫瘍（ｎ＝８０）のある人からのＤＮＡメチル化データを使用して腫瘍の特定の起源を検出するＣＧＩＤのメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと大腸がんをカテゴリー的に区別する。図１６は、ＴＣＧＡＤＮＡメチル化データセット（ｎ＝４１６６）を使用した、大腸がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉＣＲＣ−検出およびスペックマーカーの精度および特異性の検証の図である。図１６の図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用するＨＫＧ−ｅｐｉＣＲＣ検出／スペックマーカーの検出率を示す。大腸がんの特異性に注目すべきである。図１６の図Ｂは、ＴＣＧＡにおける４１６６名の患者からのＤＮＡメチル化データを使用する、大腸がんのＨＫＧ−ｅｐｉ大腸がん−検出マーカーの特異性と感度のＲＯＣプロットである。図１６の図Ｃは、大腸がん対他の起源のがんに対する感度と特異性を示す。図１７は、膵臓がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図１７の図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表１１）および起源特定のがんを決定するためのＣＧＩＤ（表１２）を使用する本発明に開示される膵臓がんの検出のための一連のＣＧＩＤの発見に使用された。図１７の左下のパネルの図Ｂ（検出）は、１〜３２（正常１２名および膵臓がん２０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表１１）のメチル化スコアの合計を示す。該ポリジーンスコアは、膵臓がんを有する人と正常な組織を有する人をカテゴリー的に区別する。図１７の右下のパネルの図Ｃは、１０種の異なる腫瘍（ｎ＝１００）のある人からのデータを使用して腫瘍の特定の起源を検出するＣＧＩＤ（表１２）のメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと膵臓がんをカテゴリー的に区別する。図１８は、ＴＣＧＡメチル化データ（ｎ＝４８５４）における、膵臓がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉ膵臓がん−検出およびスペックマーカーの精度および特異性の検証の図である。図１８の図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉ膵臓がん検出／スペックマーカーの検出率である。膵臓がんの特異性に注目すべきである。図１８の図Ｂは、ＴＣＧＡにおける４８５４名の患者からのＤＮＡメチル化データを使用する、膵臓がんのＨＫＧ−ｅｐｉ膵臓がん−検出マーカーの特異性と感度のＲＯＣプロットである。図Ｃは、膵臓がん対他の起源のがんに対する感度と特異性を示す。図１９は、脳がん（膠芽腫）のポリジーンＤＮＡメチル化マーカーの発見の図である。図１９の図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表１３）およびがんの特定起源を決定するためのＣＧＩＤ（表１３）を使用する、本発明に開示される、脳がんの検出のための一連のＣＧＩＤの発見に使用された。左下のパネルの図Ｂ（検出／スペック）は、１〜１６（正常６名および脳がん１０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表１３）のメチル化スコアの合計を示す。該ポリジーンスコアは、脳がんを有する人、１１０名の別のがんを有する人と正常な組織を有する人をカテゴリー的に区別する。図２０は、ＴＣＧＡメチル化データ（ｎ＝４８５４）における、乳がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉ脳がん−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉ脳がん検出／スペックマーカーの検出率である。脳がんの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける４８５４名の患者からのＤＮＡメチル化データを使用する、脳がんのＨＫＧ−ｅｐｉ脳がん−検出マーカーの特異性と感度のＲＯＣプロットである。図Ｃは、ＴＣＧＡデータセット（ｎ＝６９５）における脳がんに対する感度と特異性を示す。図２１は、胃（ｇａｓｔｒｉｃ）［胃（ｓｔｏｍａｃｈ）］がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表１４）およびがんの特定起源を決定するためのＣＧＩＤ（表１５）を使用する、本発明に開示される胃がんの検出のための一連のＣＧＩＤの発見に使用された。図２１の左下のパネルの図Ｂ（検出）は、１〜２８（正常１４名および胃がん２０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表１４）のメチル化スコアの合計を示す。該ポリジーンスコアは、胃がんを有する人と正常な組織を有する人をカテゴリー的に区別する。図２１の右下のパネルの図Ｃ（スペック）は、１０種の異なる腫瘍（ｎ＝１００）のある人のポリジーンメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと胃がんをカテゴリー的に区別する。図２２は、ＴＣＧＡメチル化データ（ｎ＝４８１７）における、胃がん対他のがんに対するポリジーンＨＫＧ−胃−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉ胃がん検出／スペックマーカーの検出率である。胃がんの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける４４２０名の患者からのＤＮＡメチル化データを使用する、胃（胃がん）のＨＫＧ−ｅｐｉ胃がん−検出スペック１マーカーの特異性と感度のＲＯＣプロットである。図Ｃは、ＴＣＧＡにおける４８５４名の患者からのＤＮＡメチル化データを使用する、胃がんのＨＫＧ−ｅｐｉ胃がん−スペック１マーカーの特異性と感度のＲＯＣプロットである。注目すべきは、大腸がんおよび食道がんとの有意な交差反応性があり、それが共通の起源であることを証明していることである。図２３は、卵巣がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表１６）および起源特定のがんを決定するためのＣＧＩＤ（表１７）を使用する、本発明に開示される卵巣がんの検出のための一連のＣＧＩＤの発見に使用された。図２３の左下のパネルの図Ｂ（検出）は、１〜１５（正常５名および卵巣がん１０名）からリストされた各テスト対象者のこれらのＣＧＩＤのメチル化スコアの合計を示す。該ポリジーンスコアは、卵巣がんを有する人と正常な組織を有する人をカテゴリー的に区別する。図２３の右下のパネルの図Ｃは、１１種の異なる腫瘍（ｎ＝１１０）のある人からのデータを使用して特定の腫瘍起源を検出するＣＧＩＤのメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと卵巣がんをカテゴリー的に区別する。図２４は、ＴＣＧＡメチル化データ（ｎ＝６５２２）における、子宮頸がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉ卵巣がん−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉ卵巣がん検出／スペックマーカーの検出率である。卵巣がんの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける４７２３名の患者からのＤＮＡメチル化データにおける、卵巣がんのＨＫＧ−ｅｐｉ卵巣がん−検出およびスペックマーカーの特異性と感度のＲＯＣプロットである。図Ｃは、卵巣がんに対する感度と特異性を示す。図２５は、子宮頸がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表１８）および起源特定のがんを決定するためのＣＧ（表１９）を使用する、本発明に開示される子宮頸がんの検出のための一連のＣＧＩＤの発見に使用された。図２５の左下のパネルの図Ｂ（検出）は、１〜３０（正常２０名および卵巣がん１０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表１８）のメチル化スコアの合計を示す。該ポリジーンスコアは、子宮頸がんを有する人と正常な組織を有する人をカテゴリー的に区別する。図２５の右下のパネルの図Ｃは、８種の異なる腫瘍（ｎ＝８０）のある人からのデータを使用して腫瘍の特定起源を検出するＣＧＩＤ（表１９）のメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと子宮頸がんをカテゴリー的に区別するが、大腸がんのいくつかの測定可能な検出に留意されたい。図２６は、ＴＣＧＡメチル化データ（ｎ＝６５２２）における、子宮頸がん対他のがんに対するポリジーンＨＫＧ−子宮頸がん−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用する、ＨＫＧ−子宮頸がん検出／スペックマーカーの検出率を示す。子宮頸がんの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける４４２０名の患者からのＤＮＡメチル化データを使用する、子宮頸がんのＨＫＧ−子宮頸がん−検出スペックマーカーの特異性と感度のＲＯＣプロットである。図Ｃは、子宮頸がんに対する感度と特異性を示す。図２７は、頭頸部扁平上皮がん（ＨＮＳＣ）のポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表２０）および起源特定のがんを決定するためのＣＧ（表２１）を使用する、本発明に開示されるＨＮＳＣの検出のための一連のＣＧＩＤの発見に使用された。図２７の左下のパネルの図Ｂは、１〜１４０（がん１０名、正常１０名および他のがん１２０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表２０）のメチル化スコアの合計を示す。図Ｃは、実施形態においてＨＮＳＣと正常組織サンプルをカテゴリー的に区別するとともに、他の起源からのがんとＨＮＳＣをカテゴリー的に区別するポリジーンスコアを示す。図２８は、ＴＣＧＡメチル化データ（ｎ＝４１６６）における、ＨＮＳＣ対他のがんに対するポリジーンＨＫＧ−ｅｐｉＨＮＳＣ−検出／スペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉＨＮＳＣ検出／スペックマーカーの検出率である。ＨＮＳＣの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける４１６６名の患者からのＤＮＡメチル化データにおけるＨＮＳＣのＨＫＧ−ｅｐｉＨＮＳＣ−検出マーカーの特異性と感度のＲＯＣプロットである。図Ｃは、ＨＮＳＣ対他の起源のがんに対する感度と特異性を示す。図２９は、食道がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表２２）およびがんの特定起源を決定するためのＣＧＩＤ（表２３）を使用する、実施形態に開示される、食道がんの検出のための一連のＣＧＩＤの発見に使用された。図２９の左下のパネルの図Ｂは、１〜１５（正常６名、がん１０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表２２）のメチル化スコアの合計を示す。図Ｃは、実施形態において食道がんと正常組織をカテゴリー的に区別するとともに、他の起源からのがんと１〜２２０（がん２０名、他のがん１９０名および正常血液１０名）からリストされた食道がんをカテゴリー的に区別するポリジーンスコアを示す。図３０は、ＴＣＧＡメチル化データ（ｎ＝７１０２）における、食道がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉ食道がん−検出／スペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉ食道がん検出／スペックマーカーの検出率を示す。食道がんの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける４１６６名の患者のＤＮＡメチル化データにおけるＨＮＳＣのＨＫＧ−ｅｐｉ食道がん−検出マーカーの特異性と感度のＲＯＣプロットである。図Ｃは、食道がん対他の起源のがんに対する感度と特異性を示す。図３１は、膀胱がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表２４）およびがんの特定起源を決定するためのＣＧＩＤ（表２５）を使用する、実施形態に開示される膀胱がんの検出のための一連のＣＧＩＤの発見に使用された。図３１の左下のパネルの図Ｂ（検出）は、１〜１５（正常５名、膀胱がん１０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表２４）のメチル化スコアの合計を示す。図３１の右下のパネルの図Ｃは、１３種の異なる腫瘍（ｎ＝１３０）を有する人からのデータを使用して腫瘍の特定の起源を検出するＣＧＩＤ（表２５）のメチル化スコアを示す。これらの実施形態では、マーカーは、他の起源からのがんと膀胱がんとを区別する。これらのマーカーによる大腸がんの測定可能な検出も注目すべきである。図３２は、ＴＣＧＡ（ｎ＝４７２３）における膀胱がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉＢｌａｄｄｅｒ−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがん（Ａ）および膀胱がん（Ｂ）を有する患者のＤＮＡメチル化データにおいて、ＨＫＧ−ｅｐｉ膀胱がんスペックマーカー（Ａ）および検出マーカー（Ｂ）の検出率を示す。図Ｃは、ＴＣＧＡにおける４４２０名の患者からのＤＮＡメチル化データを使用した、膀胱がんのＨＫＧ−ｅｐｉ膀胱がんスペックマーカーの特異性と感度のＲＯＣプロットである。図Ｄは、膀胱がんのＨＫＧ−ｅｐｉ膀胱がん検出マーカーの特異性と感度のＲＯＣプロットである（ｎ＝４４０）。図３３は、腎臓がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ（ｈｙｐｏ）法を使用する、実施形態で開示された腎臓がんの検出およびがんの特定の起源の決定（表２６）のための一連のＣＧＩＤの発見に使用された。図３３の左下のパネルの図Ｂ（検出／スペック）は、１〜２２６（その他のがん１８０名、健康な血液１０名、正常な腎臓６名、腎がん３０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表２６）のメチル化スコアの合計を示す。これらの実施形態では、該ポリジーンスコアは腎臓がん、別のがんと正常な血液をカテゴリー的に区別する。図３４は、ＴＣＧＡＤＮＡメチル化データ（ｎ＝７１０２）を使用する、腎臓がん対他のがんおよび正常組織に対するポリジーンＨＫＧ−ｅｐｉ腎臓がん−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんからのＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉＫｉｄｎｅｙ検出／スペックマーカーの検出率である。腎臓がんの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける６３６７のがんのＤＮＡメチル化データを使用する、腎臓がんのＨＫＧ−子宮頸がん−検出スペックマーカーの特異性と感度のＲＯＣプロットである。図Ｃは、腎臓（ｒｅｎａｌ）［腎臓（ｋｉｄｎｅｙ）］がんに対する感度と特異性を示す。さらに注目すべきは、脳、ＨＣＣおよび精巣がんとのクロスオーバーである。図３５は、精巣がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ（ｈｙｐｏ）法を使用する実施形態で開示された精巣がんの検出および起源特定のがんの決定（表２７）のための一連のＣＧＩＤの発見に使用された。図３５の左下のパネルの図Ｂ（検出／スペック）は、１〜２２６（精巣がん１０名、その他のがん１８０名、健康な血液１０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表２７）のメチル化スコアの合計を示す。これらの実施形態では、該ポリジーンスコアは精巣がん、正常な血液と別のがんをカテゴリー的に区別する。図３６は、ＴＣＧＡメチル化データ（ｎ＝７１０２）における、精巣がん対他の正常な組織およびがんに対するポリジーンＨＫＧ−ｅｐｉ精巣がん−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者からのＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉ精巣がん検出／スペックマーカーの検出率を示す。精巣がんの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける６３６７名の患者のＤＮＡメチル化データを使用する、精巣がんのＨＫＧ−ｅｐｉ精巣がん−検出スペックマーカーの特異性と感度のＲＯＣプロットである。図Ｃは、精巣がんに対する感度と特異性を示す。図３７は、１３種の一般的ながんの汎がんポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表２８）を使用する実施形態で開示された１３種の一般的ながん（表２８）（膀胱がん、脳がん、乳がん、子宮頸がん、大腸がんＣＲＣ、食道がん、肝臓がん、肺がん、卵巣がん、膵臓がん、前立腺がん、胃がん）の検出のための一連のＣＧＩＤの発見に使用された。図Ｂは、１〜３１０（がん１８０名、正常１０名）からリストされた各テスト対象者のこれらのＣＧＩＤのメチル化スコアの合計を示す。これらの実施形態では、該ポリジーンスコアはがんと正常な組織を区別する。図３８は、ＴＣＧＡメチル化データ（ｎ＝７１０２）における、ポリジーンＨＫＧｅｐｉ汎がんマーカーの精度および特異性の検証の図である。図Ａは、ＴＣＧＡデータを使用し、１３人の異なるがん患者のｅｐｉ汎がんポリジーンＤＮＡメチル化マーカーを使用して計算されたメチル化スコアを示す。図Ｂは、ＴＣＧＡにおける４８７８名の患者からのすべてのがんのＤＮＡメチル化データを使用する、ＨＫＧ−汎がん検出およびスペックマーカーの特異性と感度のＲＯＣプロットである。図Ｃは、１３種の一般的ながんの検出のための特異性と感度を表すｅｐｉ汎がんポリジーンマーカーのＲＯＣプロットである。図Ｄは、がんを検出するための汎がんマーカーの全体的な感度と特異性を示す。これらの実施形態では、１つ以上の色、例えば、オレンジ（加重メチル化スコア）および青（サンプルあたり１つのＢＣＤマーカーの検出が陽性がんとしてスコア付けされる）が使用される。図３９は、黒色腫のポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表４５）を使用する実施形態で開示された黒色腫の検出（表４５）のための一連のＣＧＩＤの発見に使用された。図Ｂは、１〜２２０（その他のがんおよび健康な血液）および１０名の黒色腫を有する患者からリストされた各テスト対象者のこれらのＣＧＩＤのメチル化スコアの合計である。これらの実施形態では、該ポリジーンスコアは黒色腫、別のがんそして正常な組織を区別する。図４０は、ＴＣＧＡメチル化データ（ｎ＝７１０２）における、黒色腫対他の正常な組織およびがんに対するポリジーンＨＫＧ−ｅｐｉ黒色腫−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者からのＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉ黒色腫検出／スペックマーカーの検出率を示す。黒色腫（肝臓がん、脳がんおよび前立腺がんとの重複検出）の特異性に注目すべきである。図Ｂは、ＴＣＧＡにある６３６７名の患者のＤＮＡメチル化データを使用する、黒色腫のＨＫＧ−黒色腫−検出スペックマーカーの特異性と感度のＲＯＣプロットである。図Ｃは、黒色腫に対する感度と特異性を示す。図４１は、血液がん（急性骨髄性白血病（ＡＭＬ））のポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表４６）を使用する実施形態で開示された血液がんＡＭＬの検出（表４６）のための一連のＣＧＩＤの発見に使用された。図Ｂは、１〜１０（健康な血液）および１０名のＡＭＬを有する患者からリストされた各テスト対象者のこれらのＣＧＩＤのメチル化スコアの合計である。これらの実施形態では、該ポリジーンスコアはＡＭＬと正常な血液を区別する。図４２は、ＧＳＥ８６４０９（ｎ＝７９）およびＴＣＧＡ（ｎ＝１４０）におけるＡＭＬ対ＧＳＥ４０２７９およびＧＳＥ６１４９６（ｎ＝９６８）における正常な血液に対するポリジーンＨＫＧ−ｅｐｉＡＭＬ−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、ＡＭＬを有する患者及び健康な血液を有する者からのＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉＡＭＬ検出／スペックマーカーの検出率を示す。黒色腫（肝臓がん、脳がんおよび前立腺がんとの重複検出）の特異性に注目すべきである。図Ｂは、ＧＳＥ８６４０９（ｎ＝７９）、ＴＣＧＡ（ｎ＝１４０）、ＧＳＥ４０２７９およびＧＳＥ６１４９６（ｎ＝９６８）からのＤＮＡメチル化データを使用する、ＡＭＬのＨＫＧ−ＡＭＬ−検出スペックマーカーの特異性と感度のＲＯＣプロットである。図Ｃは、ＡＭＬに対する感度と特異性を示す。図４３は、正常な人に由来する血漿においてＢＣＤ特性〜０のメチル化を示す異なるがんを検出するために選択されたプライマーの検証の図である（各サンプルは正常な患者からの血漿の混合物である）。特定のＣＧをターゲットとする第一のＰＣＲ１反応は、シーケンスターゲットプライマーを使用して実行された。第二のＰＣＲの後、増幅されたフラグメントを精製し、次世代シーケンスを行った。ＤＮＡメチル化は、示された各々のＣＧＩＤ位置で定量化された。図４４は、正常な人に由来する血漿においてＢＣＤ特性〜０のメチル化を示す異なるがんを検出するために選択された、示されたプライマーの検証の図である（各サンプルは正常な患者からの血漿の混合物である）。図４５は、多重増幅およびシーケンスのためのプライマー設計の図である。第一のＰＣＲ反応は対象となる特定の関心領域をターゲットにするが、ＰＣＲ１プライマーは第二のＰＣＲ２プライマーに相補的な配列を持っていることに注意されたい。プライマーの第二セットは、各患者のインデックスと、リバースおよびフォワードシーケンスプライマーを導入する。図４６は、前立腺がんを検出するためのＰＣＲ条件の最適化の図である。右側のパネルには、前立腺がんの３つのマーカーＨＩＦ３Ａ２３２ｂｐ、ＴＰＭ４２１３ｂｐ、およびＣＴＴＮ１９９ｂｐについて、示されているＤＮＡのようなさまざまなプライマー濃度を使用したマルチプレックスＰＣＲ１反応が示されている。図４７は、ＤＮＡメチル化レベルを決定するためのバイオインフォマティクスワークフローの図である。ＰＣＲ２の産物を組み合わせ、定量化および精製し、ＭｉｓｅｑＩｌｌｕｍｉｎａシーケンサーで次世代シーケンスを行う。シーケンスは逆多重化（ｄｅｍｕｌｔｉｐｌｅｘｅｄ）され、ＦＡＳＴＱファイルは患者ごとに生成され、スキームに示されているワークフローで分析される。ＤＮＡメチル化スコアは患者ごとに計算される。

詳細な説明
図面のすべての説明は、選択された実施形態を説明するためのものであり、請求される主題の範囲を限定することを意図するものではない。

実施形態１：正常組織および血液ＤＮＡにおける数百人の個体にわたるカテゴリー的にメチル化されていないＣＧＩＤの発見

腫瘍に由来する無細胞ＤＮＡは、血漿、尿などの体液や糞中に見られることが知られている。ＣＦ腫瘍ＤＮＡのＤＮＡメチル化プロファイルが腫瘍ＤＮＡに類似していることも確立されている（Ｄｏｍｉｎｇｕｅｚ−Ｖｉｇｉｌｅｔａｌ．、２０１８）。膨大な量のデータにより、腫瘍ＤＮＡは正常組織と比較して区別的にメチル化されていることが確立されている（Ｌｕｃｚａｋ＆Ｊａｇｏｄｚｉｎｓｋｉ、２００６）。したがって、多くのグループは、がん性の組織とその正常な起源の組織、例えば肝臓がんと隣接する肝臓組織との間で区別的にメチル化されているＤＮＡのＣＧＩＤ位置（Ｉｌｌｕｍｉｎａ４５０ＫマニフェストのＣＧＩＤ）をロジスティック回帰によって描写しようとした。ただし、これらの方法は、カテゴリー的な質的な違いではなく、がんと非形質転換組織の間の量的な違いを測定するため、腫瘍と正常組織の間の量的な違いが正常組織からのＣＦＤＮＡによって希釈および消去され、偽陰性と感度低下につながる。さらに、分析に含まれなかった他の組織は、腫瘍ＤＮＡと同様のＤＮＡメチル化プロファイルを持っている可能性があり、そしてほとんどの研究は腫瘍ＤＮＡを、他の組織ではなくその非形質転換対応物とのみ比較するため、これは偽陽性につながる可能性がある。異なる組織からの変動する予測不可能な量のＤＮＡがＣＦＤＮＡで検出されている（Ｂｒｅｉｔｂａｃｈｅｔａｌ．、２０１４）ため、測定されたＤＮＡメチル化は、異なるソースからの組織ＤＮＡと腫瘍ＤＮＡの未知の予測不可能な混合物の複合を反映する。数千の腫瘍サンプルがＩｌｌｕｍｉｎａ４５０Ｋアレイを使用したゲノムワイドＤＮＡメチル化分析にかけられており、パブリックドメイン（ＴＣＧＡ）で発見されている。多くの正常組織およびがん組織のメチル化のプロファイルを調べると、発明者らは、すべての正常組織で完全にメチル化されていないが、腫瘍のＤＮＡでメチル化されているゲノムにＣＧの重要なグループがあることを発見した。これらのサイトのサブセットは、ＤＮＡメチル化がパブリックドメインでプロファイルされた多数の個人にわたってメチル化されていない。本発明者ら
はまた、多くのがんにおいて、これらの強力に非メチル化されたサイトががんにおいてメチル化されることに気づいた。したがって、腫瘍ＤＮＡと血液中に見つかる可能性のある他のすべてのＤＮＡとの間に質的な「カテゴリー的な違い」を生み出す。深い次世代シーケンスを使用すると、完全にメチル化されていないコピーのバックグラウンドで、わずかなメチル化分子でも簡単に識別できる。

データベース；Ｉｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データ
遺伝子発現オムニバス（ＧｅｎｅｅｘｐｒｅｓｓｉｏｎＯｍｎｉｂｕｓ）（ＧＥＯ）ｈｔｔｐｓ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｇｅｏ／またはがんゲノムアトラス（ＴｈｅＣａｎｃｅｒＧｅｎｏｍｅＡｔｌａｓ）ＴＣＧＡｈｔｔｐｓ：／／ｃａｎｃｅｒｇｅｎｏｍｅ．ｎｉｈ．ｇｏｖ／公開データベースのいずれかに寄託された多数の個人からのヒトゲノム全体の〜４５０，０００ＣＧのメチル化の正規化されたベータ値の公開されているデータベースを使用した。次のデータベースを使用して、多くの正常組織および血液ＤＮＡ：ＧＳＥ５０１９２、ＧＳＥ５０１９２、ＧＳＥ４０２７９にある強力な非メチル化ＣＧＩＤのリストを取得した。

白血球からのＤＮＡは、血漿中のＣＦＤＮＡの主要なソースの１つである。発明者らはまず、ＧＳＥ５０１９２のＩｌｌｕｍｉｎａ４５０ＫデータとＥｘｃｅｌの論理式ＣＯＵＮＴＩＦおよびＩＦ関数を使用して、１７の異なる体細胞ヒト組織のすべての個体でメチル化されていない４７９８１個のＣＧＩＤのリストを生成した：
NmCGID_x=COUNTIF (betaCGID_xn₁:n_i,“>0.1”)
umCGID_x=IF(NmCGID_x=0, TRUE, FALSE)
ＮｍＣＧＩＤｘ＝メチル化されたＣＧＩＤｘを有する正常な被験者の数。
ｕｍＣＧＩＤｘ＝すべての被験者における非メチル化ＣＧＩＤｘ
ｂｅｔａＣＧＩＤｘ＝与えられたＣＧＩＤｘのメチル化値
ｘ＝Ｉｌｌｕｍｉｎａ４５０ｋアレイ上の任意のＣＧＩＤ
ｎ_１＝アレイにおける最初のサブジェクト
ｎ_ｉ＝アレイにおける最後のサブジェクト。

次に、発明者らは、同じ基準を使用して、３１２個体からの血液ＤＮＡ中の６８２６０個の非メチル化ＣＧＩＤ（ＵＭＣＧＩＤ）のリストを生成した。次に、発明者らは、４７９８１と６８２６０のＣＧＩＤのリストを重ね、すべての個人の血液組織と体細胞組織の両方でメチル化されていない３３４７７のＣＧＩＤのリストを取得した（図１Ａ）。非メチル化ＣＧＩＤのこのリストの頑健性を高めるために、発明者らは、１９歳から１０１歳までの６５６人の男性と女性（ＧＳＥ４０２７９）の全血ＤＮＡのＩｌｌｕｍｉｎａ４５０Ｋアレイにおける非メチル化ＣＧＩＤの６０，３７９のＣＧＩＤのリストを描いた。これらは、数百人の性別や年齢に依存しない血液中における強力にメチル化されていない部位である。この６０，３７９のＣＧＩＤのリストは、体組織と血液の両方でメチル化されていない３３，４７７のＣＧＩＤのリストと重複して、がんのカテゴリー的なメチル化マーカーの発見に使用された２８，７５４のＣＧＩＤの最終リストを生成した。このリストには、組織および個人間で強力にメチル化されていないＣＧＩＤの位置が含まれる。

がんと正常組織との間でカテゴリー的に異なるＤＮＡメチル化位置を特定するために、発明者らはこれらの２８７５４のＣＧＩＤのいずれかが異なるがんでメチル化されているかどうかを調べた。発明者らは、腫瘍ＤＮＡメチル化データの調査に続いて、これらの２８７５４のＣＧＩＤのサブセットのメチル化が、個々の患者からの腫瘍ＤＮＡにおいて一般的であることに気付いた。ただし、すべての個人が同じ位置でメチル化されているわけではない。そのため、高い特異性でがんを検出するには、ＣＧＩＤの組み合わせが必要である。したがって、本発明者らは、がんの検出のためのＣＧＩＤのポリジーンの
組み合わせを発見した。

発明者らは、ＴＣＧＡまたはＧＥＯのパブリックドメインの１０〜５０個のＤＮＡメチル化プロファイルを「発見セット」として使用し、メチル化状態が腫瘍と正常組織の間で「カテゴリー的に」異なり、最高の感度と特異性でがんを検出できるＣＧＩＤのポリジーンセットを発見した。次に、これらのＣＧＩＤを「検証セット」として数百のＴＣＧＡおよびＧＥＯ腫瘍ＤＮＡメチル化アレイデータでテストし、実施形態２に開示されているように、がんを検出するためのポリジーンＤＮＡメチル化マーカーの感度と特異性を検証した。

実施形態２：無細胞ＤＮＡ中のがんを検出するためのバイナリーカテゴリー区別（ＢＣＤ）法。
ヒトゲノム全体の〜４５０，０００のＣＧ（ＣＧＩＤ）のメチル化の正規化されたベータ値の公開されている以下のデータベースを使用して、がん特有のＤＮＡメチル化マーカーのリストを導き出した。

ＢＣＤ法
以下は、異なるがんの早期予測のためのポリジーンＤＮＡメチル化マーカーを発見するために実施形態で使用されるバイナリーカテゴリー区別法（ＢＣＤ）のステップである。

正常な組織で強力にメチル化されていない２８，７５４個のＣＧＩＤをフィルター処理した。
発見コーホートについては、ＭｉｃｒｏｓｏｆｔＥｘｃｅｌのＣＯＵＮＴＩＦおよびＩＦ関数を使用して、正常な組織で強力にメチル化されていない２８，７５４個のＣＧＩＤのリスト内に描いた。該ＣＧＩＤは特定のがんではカテゴリー的にメチル化され、影響を受けていない組織および正常な組織ではメチル化されない。
NmcCGIDx=COUNTIF (betaCGIDxCancer n₁:n_i,“>0.2”)
NmnCGIDx=COUNTIF (betaCGIDxNormal n₁:n_i,“>0.1”)
DMCGIDx= IF((AND(NmcCGIDx>0, NmnCGIDx=0)),”TRUE”,”FALSE”)
ＤＭＣＧＩＤｘは最も高い番号から最も低い番号へとソートされた。
上位２０までのＴＲＵＥＤＭＣＧＩＤｘの位置が選択された。
ＮｍｃＣＧＩＤｘ＝メチル化されたＣＧＩＤｘを有するがん患者の数
Ｎｍｎ＝メチル化されたＣＧＩＤｘを持つ正常な隣接または類似の組織サンプルの数
ｂｅｔａＣＧＩＤｘ＝ＣＧＩＤｘのメチル化のレベル
ｎ＝１からｉまでの患者
ＤＭ＝区別的にメチル化されたＣＧＩＤｘ

本発明者らは、精巣がんおよび腎臓がんがすべての組織で高度にメチル化されているＣＧＩＤでメチル化の広範な欠如を示すことに気付いた。したがって、がんではカテゴリー的にメチル化されておらず正常な組織ではメチル化されることに対して、「ＢＣＤｈｙｐｏ」と呼ぶ改良したＢＣＤ法を使用して、精巣がんおよび腎臓（ｋｉｄｎｅｙ）［腎臓（ｒｅｎａｌ）］がんのカテゴリー的に区別的にメチル化されたＣＧＩＤの位置を発見した。以下のステップは、精巣がんと腎臓がんにおいて区別的に低（ｈｙｐｏ）メチル化されたＣＧＩＤの位置を発見するために使用された。

発見コーホートでは、ＥｘｃｅｌのＣＯＵＮＴＩＦおよびＩＦ関数を使用して、正常な組織で完全にメチル化されている精巣または腎臓における低メチル化ＣＧＩＤを描いた。NucCGIDx=COUNTIF (betaCGIDxCancer n₁:n_i,“<0.2”)
NunCGIDx=COUNTIF (betaCGIDxNormal n₁:n_i,“<0.9”)
DHMCGIDx= IF((AND(NucCGIDx>0, NunCGIDx=0)),”TRUE”,”FALSE”)
ＤＨＭＣＧＩＤの位置が最も高い番号から最も低い番号へとソートされた。
上位２０のＴＲＵＥＤＨＭのサイトが選択され、罰則付き回帰分析が行われた。
ＮｕｃＣＧＩＤｘ＝非メチル化ＣＧＩＤＸのがん患者の数
ＮｕｎＣＧＩＤｘ＝非メチル化ＣＧＩＤＸの正常な組織サンプルの数
ｎ＝１からｉまでの患者
ＤＨＭ＝区別的に低メチル化されたＣＧＩＤ

次に、発明者らは、上位２０のＤＭ（またはＤＨＭ）ＣＧＩＤｘで、Ｒで罰則するパッケージを使用して罰則付き回帰を実行し、最高の感度と特異性でがんを予測するＣＧＩＤｘの最小の組み合わせを描いた。ポリジーンの組み合わせとがんにおけるこれらのＣＧＩＤのメチル化レベル間の回帰係数を決定するために、ＣＧＩＤｘのポリジーンの組み合わせが多変量線形回帰方程式でさらにテストされた。このモデルを使用して、典型的ながんの各患者のメチル化スコアを計算した。

Ｍｓ＝メチル化スコア、α＝切片、β_ｉ＝ＣＧＩＤ_ｉの係数、ＣＧ_ｉ＝ＣＧあたりのメチル化レベルの組み合わせ。１からｉ＝組み合わせたＣＧの数。

実施形態３：肝臓がん（ＨＣＣ）のポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ６１２５８（正常な肝臓）から、そしてＨＣＣＤＮＡメチル化データのＴＣＧＡＨＣＣコレクションからランダムに選択された６６個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤｘを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性でＨＣＣを検出する（図５Ｂ、表１）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、８種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、ＨＣＣと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図５Ｃ、表２）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態４：ＨＣＣを検出するためのＨＣＣポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、加重ＨＣＣＤＮＡメチル化スコアが、表１のＣＧＩＤの２２７人のＨＣＣ患者のＧＳＥ７６２６９からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値を含む「検証コーホート」でＨＣＣを検出したことを実証した。この方法を使用して、９５％のＨＣＣサンプルがＨＣＣとして検出された（図６Ｃ）。図６Ａに示されるＲＯＣ曲線は、がんを検出するためのこのメチル化スコアの特異性（１）および感度（０．９６）を明らかにしている。次に、発明者らは、ＨＣＣと他の８種類のがんのＧＳＥ７５０４１とＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、ＨＣＣの検出およびＨＣＣと他のがんを区別するための、スペックおよび検出のＤＮＡメチル化スコアを組み合わせた有用性を実証した。図７Ｂに示されるＲＯＣ曲線は、ＨＣＣを他の正常な組織および他のがんと区別するためのこのメチル化スコアの特異性（０．９７）および感度（０．９５）を明らかにしている。これらのＤＮＡメチル化マーカーと計算されたメチル化スコアは、組織、糞便、唾液、血漿および尿などの人とは異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんのスクリーニングと早期発見に使用できる。

実施形態５：肺がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ６１２５８（正常な肺）からの１０人の、そして肺がんＤＮＡメチル化データのＴＣＧＡ肺がんコレクションからランダムに選択された１０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で肺がん（腺がんおよび扁平上皮がんの両方を含むサンプル）を検出する（図８Ｂ、表３）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、８種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、肺がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図８Ｃ、表４）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態６：肺がんを検出するための肺がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態３（検出）で開発された加重肺がんＤＮＡメチル化スコアおよび閾値が、ＧＳＥ６６８３６、ＧＳＥ６３７０４、ＧＳＥ７６２６９からの、およびＴＣＧＡの９１９人の肺がん患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で肺がんを検出することを実証した。この方法を使用して、９６％の肺がんサンプルが肺がんとして検出された（図９Ａ）。次に、発明者らは、肺がんと他の８種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、肺がんと他のがんを区別するための、スペックおよび検出のＤＮＡメチル化スコアを組み合わせた有用性を実証した（図９Ａ）。図９Ｂに示されるＲＯＣ曲線は、肺がんを他の正常な組織および他のがんから検出するための、このメチル化スコアの特異性（０．９６）および感度（０．８４）を明らかにしている（図９Ｃ）。これらのＤＮＡメチル化マーカーと計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態７：前立腺がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ５２９５５（正常な前立腺）からの５人の、そして前立腺がんＤＮＡメチル化データのＴＣＧＡ前立腺がんコレクションからランダムに選択された１０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で前立腺がんを検出する（図１０Ｂ、表５）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、８種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、前立腺がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図１０Ｃ、表６）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態８：前立腺がんを検出するための前立腺がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態３（検出）で開発された加重前立腺がんＤＮＡメチル化スコアおよび閾値が、ＧＳＥ７３５４９、ＧＳＥ２９５５からの、およびＴＣＧＡの４３０人の前立腺がん患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で前立腺がんを検出することを実証した。この方法を使用して、９９％の前立腺がんサンプルが前立腺がんとして検出された（図１１Ａ）。次に、発明者らは、前立腺がんと他の８種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、前立腺がんと他のがんを区別するための、スペックおよび検出のＤＮＡメチル化スコアを組み合わせた有用性を実証した（図１１Ａ）。図１１Ｂに示されるＲＯＣ曲線は、前立腺がんを他の正常な組織および他のがんから検出するための、このメチル化スコアの特異性（０．９９）および感度（０．９８）を明らかにしている（図１１Ｃ）。これらのＤＮＡメチル化マーカーと計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態９：乳がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ６０１８５（正常な乳房）からの１７人の、そして乳がんＤＮＡメチル化データのＴＣＧＡ乳がんコレクションからランダムに選択された１０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で乳がんを検出する（図１２Ｂ、表７）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、８種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、乳がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図１２Ｃ、表８）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態１０：乳がんを検出するための乳がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態９（検出）で開発された加重乳がんＤＮＡメチル化スコアおよび閾値が、ＧＳＥ６０１８５、ＧＳＥ７５０６７からの、およびＴＣＧＡからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値を使用する８９１人の乳がん患者が含まれる「検証コーホート」で乳がんを検出することを実証した。この方法を使用して、９１％の乳がんサンプルが乳がんとして検出され（図１３Ａ）、ＤＣＩＳと浸潤性がんの両方が検出された。次に、発明者らは、乳がんと他の８種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、乳がんと他のがんを区別するための、スペックおよび検出のＤＮＡメチル化スコアを組み合わせた有用性を実証した（図１４Ａ）。図１４Ｂに示されるＲＯＣ曲線は、乳がんを他の正常な組織および他のがんと区別するためのこのメチル化スコアの特異性（０．８９）および感度（０．８７）を明らかにしている（図１４Ｃ）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある女性や一般的な健康な人における乳がんの早期発見に使用できる。

実施形態１１：大腸がん（ＣＲＣ）のポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ（３２１４６）（正常）からの２５人の、そして大腸がんＤＮＡメチル化データのＴＣＧＡ大腸がんコレクションからランダムに選択された５０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で大腸がんを検出する（図１５Ｂ、表９）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、８種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、大腸がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図１５Ｃ、表１０）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態１２：大腸がんを検出するための大腸がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態１１（検出）で開発された加重大腸がんＤＮＡメチル化スコアおよび閾値が、ＧＳＥ６９５５０からの、およびＴＣＧＡの４５９人の大腸がん患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で大腸がんを検出することを実証した。この方法を使用して、９８％の大腸がんサンプルが大腸がんとして検出された（図１６Ａ）。次に、発明者らは、大腸がんと他の８種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、大腸がんと他のがんを区別するための、スペックおよび検出のＤＮＡメチル化スコアを組み合わせた有用性を実証した（図１６Ａ）。図１６Ｂに示されるＲＯＣ曲線は、大腸がんを他の正常な組織および他のがんを区別するためのこのメチル化スコアの特異性（０．９６）および感度（０．９８）を明らかにしている（図１６Ｃ）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、ＣＲＣのリスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態１３：膵臓がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ５３０５１（正常）からの１２人の、そして膵臓がんＤＮＡメチル化データのＴＣＧＡコレクションからランダムに選択された２０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で膵臓がんを検出する（図１７Ｂ、表１１）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、１０種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された１００個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、膵臓がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図１７Ｃ、表１２）（スペック）。実施
形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態１４：膵臓がんを検出するための膵臓がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態１３（検出）で開発された加重膵臓がんＤＮＡメチル化スコアおよび閾値が、ＴＣＧＡからの８９１人の膵臓がん患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で膵臓がんを検出することを実証した。この方法を使用して、８６％の膵臓がんサンプルが膵臓がんとして検出された（図１８Ａ）。次に、発明者らは、膵臓がんと他の９種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、膵臓がんと他のがんを区別するための、スペックおよび検出のＤＮＡメチル化スコアを組み合わせた有用性を実証した（図１８Ａ）。図１８Ｂに示されるＲＯＣ曲線は、膵臓がんの検出および膵臓がんを他の正常な組織および他のがんと区別するためのこのメチル化スコアの特異性（０．９３）および感度（０．８６）を明らかにしている（図１８Ｃ）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態１５：脳がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ６５８２０（正常）からの１０人の、そして脳がんＤＮＡメチル化データのＴＣＧＡコレクションからランダムに選択された１０個のサンプからルの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で脳がんを検出する（図１９Ｂ、表１３）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、１１種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された１１０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、検出のＣＧＩＤはまた、脳がんと他の腫瘍とを区別することを発見した（図１９Ｃ、表１３）（検出−スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態１６：脳がんを検出するための脳がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態１５（検出）で開発された加重脳がんＤＮＡメチル化スコアおよび閾値が、ＴＣＧＡからの６８９人の脳がん患者、ＧＳＥ５８２９８からの４０人の患者およびＧＳＥ３６２７８からの１３６人の患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で脳がんを検出することを実証した。この方法を使用して、９１％〜９７％の脳がんサンプルが脳がんとして検出された（図２０Ａ）。次に、発明者らは、脳がんと他の９種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、脳がんと他のがんを区別するための、同様のＣＧＩＤの有用性を実証した（図２０Ａ）。図２２Ｂに示されるＲＯＣ曲線は、脳がんを他の正常な組織および他のがんから検出するためのこのメチル化スコアの特異性（１）および感度（０．９７）を明らかにしている（図２０Ｃ）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態１７：胃がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ９９５５３（正常）からの１８人の、そして胃がんＤＮＡメチル化データのＴＣＧＡコレクションからランダムに選択された１０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で胃がんを検出する（図２１Ｂ、表１４）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、１１種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された１００個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、胃がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図２１Ｃ、表１５）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態１８：胃がんを検出するための胃がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態１７（検出）で開発された加重胃がんＤＮＡメチル化スコアおよび閾値が、ＴＣＧＡからの３９７人の胃がん患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で胃がんを検出することを実証した。この方法を使用して、８８％の胃がんサンプルが胃がんとして検出された（図２３Ａ）。次に、発明者らは、胃がんと他の１０種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、胃がんと他のがんを区別するための、スペックおよび検出のＤＮＡメチル化スコアを組み合わせた有用性を実証した（図２３Ａ）。図２２Ｂに示されるＲＯＣ曲線は、胃がんを他の正常な組織および他のがんから検出するためのこのメチル化スコアの特異性（０．９）および感度（０．９）を明らかにしている（図２２Ｃ）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんのスクリーニングと早期発見に使用できる。

実施形態１９：卵巣がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ６５８２０（正常）からの５人の、そして卵巣がんＤＮＡメチル化データのＴＣＧＡコレクションからランダムに選択された１０個のサンプからルの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で卵巣がんを検出する（図２３Ｂ、表１６）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、１０種の異なる腫瘍タイプおよび血液を表すＴＣＧＡからランダムに選択された１００個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、卵巣がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図２Ｃ、表１７）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発され
た。

実施形態２０：卵巣がんを検出するための卵巣がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態１９（検出）で開発された加重卵巣がんＤＮＡメチル化スコアおよび閾値が、ＴＣＧＡからの１１４人の卵巣がん患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で卵巣がんを検出することを実証した。この方法を使用して、８６％の卵巣がんサンプルが卵巣がんとして検出された（図２４Ａ）。次に、発明者らは、卵巣がんと他の９種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、卵巣がんと他のがんを区別するための、スペックＤＮＡメチル化スコアの有用性を実証した（図２４Ａ）。図２４Ｂに示されるＲＯＣ曲線は、卵巣がんを他の正常な組織および他のがんから区別するためのこのメチル化スコアの特異性（０．９９）および感度（１）を明らかにしている（図２４Ｃ）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態２１：子宮頸がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ４６３０６（正常）からの２０人の、そして子宮頸がんＤＮＡメチル化データのＴＣＧＡコレクションからランダムに選択された１０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で子宮頸がんを検出する（図２５Ｂ、表１８）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、８種の異なる腫瘍タイプおよび血液を表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、子宮頸がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図２５Ｃ、表１９）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態２２：子宮頸がんを検出するための子宮頸がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態２１（検出）で開発された加重子宮頸がんＤＮＡメチル化スコアおよび閾値が、ＴＣＧＡからの３１３人の子宮頸がん患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で子宮頸がんを検出することを実証した。この方法を使用して、９１％の子宮頸がんサンプルが子宮頸がんとして検出された（図２６Ａ）。次に、発明者らは、子宮頸がんと他の９種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、子宮頸がんと他のがんを区別するための、スペックＤＮＡメチル化スコアの有用性を実証した（図２６Ａ）。図２６Ｂに示されるＲＯＣ曲線は、子宮頸がんの検出、および子宮頸がんを他の正常な組織および他のがんから区別するためのこのメチル化スコアの特異性（０．９）および感度（０．９）を明らかにしている（図２６Ｃ）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態２３：頭頸部扁平上皮がん（ＨＮＳＣ）のポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ（５２０６８）（正常）からの１０人の、そしてＨＮＳＣＤＮＡメチル化データのＴＣＧＡがんコレクションからランダムに選択された１０個のサンプルから正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性でＨＮＳＣを検出する（図２７Ｂ、表２０）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、１２種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、ＨＮＳＣと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図２７Ｃ、表２１）（スペック）。

実施形態２４：ＨＮＳＣを検出するための頭頸部扁平上皮がん（ＨＮＳＣ）ポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態２３（検出）で開発された加重ＨＮＳＣＤＮＡメチル化スコアおよび閾値が、ＧＳＥ５２０６８からの正規化されたＩｌｌｕｍｉｎａ４５０Ｋ
ＤＮＡメチル化ベータ値が含まれる「検証コーホート」でＨＮＳＣを検出することを実証した。この方法を使用して、８８％〜９６％のＨＮＳＣサンプルが検出された（図２８Ａ）。次に、発明者らは、ＨＮＳＣと他の１２種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、ＨＮＳＣと他のがんを区別するための、ＤＮＡメチル化検出スコアの有用性を実証した（図２８Ａ）。図２８Ｂに示されるＲＯＣ曲線は、ＨＮＳＣを他の正常な組織および他のがんから区別するためのこのメチル化スコアの特異性（０．８６）および感度（０．８８）を明らかにしている（図２８Ｃ）。マーカーは、他のいくつかのがんも検出する（比較的高感度であるため、これらのがんに対する特異性は限られている）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態２５：食道がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ（５２０６８）（正常）からの１０人の、そして食道がんＤＮＡメチル化データのＴＣＧＡがんコレクションからランダムに選択された１０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で食道がんを検出する（図２９Ｂ、表２２）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、１２種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、食道がんと他の腫瘍との間で区別的にメ
チル化されたＣＧＩＤのポリジーンセットを発見した（図２９Ｃ、表２３）（スペック）。

実施形態２６：食道がんを検出するための食道がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態２５（検出）で開発された加重食道がんＤＮＡメチル化スコアおよび閾値が、ＧＳＥ５２０６８からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で食道がんを検出することを実証した。この方法を使用して、８８％〜９６％の食道がんサンプルが検出された（図３０Ａ）。次に、発明者らは、食道がんと他の１２種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、食道がんと他のがんを区別するための、検出ＤＮＡメチル化スコアの有用性を実証した（図３０Ａ）。図３０Ｂに示されるＲＯＣ曲線は、食道がんを他の正常な組織および他のがんから区別するためのこのメチル化スコアの特異性（０．８６）および感度（０．８８）を明らかにしている（図３０Ｃ）。マーカーは、他のいくつかのがんも検出する（比較的高感度であるため、これらのがんに対する特異性は限られている）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態２７：膀胱がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ５２９５５（正常）からの５人の、そして膀胱がんＤＮＡメチル化データのＴＣＧＡがんコレクションからランダムに選択された１０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で膀胱がんを検出する（図３１Ｂ、表２４）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、１３種の異なる腫瘍タイプおよび正常な血液を表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、膀胱がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図３１Ｃ、表２５）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態２８：膀胱がんを検出するための膀胱がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態２７（検出）で開発された加重膀胱がんＤＮＡメチル化スコアおよび閾値が、ＴＣＧＡからの４３９人の膀胱がん患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で膀胱がんを検出することを実証した。この方法を使用して、９６％の膀胱がんサンプルが膀胱がんとして検出された（図３２Ｂ）。次に、発明者らは、膀胱がんと他の１３種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、膀胱がんと他のがんを区別するための、スペックＤＮＡメチル化スコアの有用性を実証した（図３２Ｂ）。図３２Ｃに示されるＲＯＣ曲線は、膀胱がんを他の正常な組織および他のがんから区別するためのこのメチル化スコアの特異性（０．８６）および感度（０．８８）を明らかにしている（図３２Ｃ）。しかし、かなり高い割合で胃がん、膵臓がん、食道がん、お
よび大腸がんの交差検出がある。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態２９：腎臓がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ５２９５５（正常）からの１０人の、そしてＴＣＧＡデータセットにある１３種のがんよりがんごとにランダムに選択された１０個のサンプルからの、腎臓がんのための正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用し、そして正常な組織および血液（ＧＳＥ４０２７９、ＧＳＥ５２９５５）を使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤｈｙｐｏ法を使用して、トレーニングコーホートにおいて高い感度および特異性で腎臓がんを検出し、そして他のがんに対して腎臓がんに特異的である「検出−スペック」（図３３Ｂ、表２６）（検出−スペック）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。

実施形態３０：腎臓がんを検出するための腎臓がんポリジーンＤＮＡメチル化マーカーの有用性。
発明者らは、実施形態２７（検出−スペック）で開発された加重腎臓がんＤＮＡメチル化スコアおよび閾値が、ＴＣＧＡからの８７１人の腎臓がん患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で腎臓がんを検出し、腎臓がんを他のがんから区別することを実証した。この方法を使用して、９０％の腎臓がんのサンプルが腎臓がんとして検出された（図３４Ａ）。次に、発明者らは、腎臓がんと他の１３種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、腎臓がんと他のがんを区別するための、「検出−スペック」ＤＮＡメチル化スコアの有用性を実証した（図３４Ａ）。図３４Ｂに示されるＲＯＣ曲線は、腎臓がんを他の正常な組織および他のがんから検出するためのこのメチル化スコアの特異性（０．８７）および感度（０．９１）を明らかにしている（図３４Ｃ）（ＨＣＣ、脳がん、精巣がんとの高い交差）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人における腎臓がんの早期発見に使用できる。

実施形態３１：精巣がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ４６３０６（正常）からの１３人の、そしＴＣＧＡデータセットにある１３種のがんよりがんごとにランダムに選択された１０個のサンプルからの、正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用し、そして正常な組織および血液（ＧＳＥ４０２７９、ＧＳＥ６１４９６）を使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤｈｙｐｏ法を使用して、トレーニングコーホートにおいて高い感度および特異性で精巣がんを検出し、そして他のがんに対して精巣がんに特異的である「検出−スペック」（図３５Ｂ、表２７）（検出−スペック）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。

実施形態３２：精巣がんを検出するための精巣がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態３１（検出−スペック）で開発された加重精巣がんＤＮＡメチル化スコアおよび閾値が、ＴＣＧＡからの１５６人の精巣がん患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で精巣がんを検出し、精巣がんを他のがんから区別することを実証した。この方法を使用して、９６％の精巣がんサンプルが精巣がんとして検出された（図３６Ａ）。次に、発明者らは、精巣がんと他の１３種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、精巣がんと他のがんを区別するための、「検出−スペック」ＤＮＡメチル化スコアの有用性を実証した（図３６Ａ）。図３６Ｂに示されるＲＯＣ曲線は、精巣がんを他の正常な組織および他のがんから検出するためのこのメチル化スコアの特異性（０．９７）および感度（０．９６）を明らかにしている（図３６Ｃ）これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態３３：１３種の一般的な固形腫瘍のポリジーン汎がんＤＮＡメチル化マーカーの発見。
本発明者らは、ＴＣＧＡデータセットにある１３種のがん（膀胱がん、脳がん、乳がん、子宮頸がん、大腸がん、食道がん、ＨＮＳＣ、肝臓がん、肺がん、卵巣がん、膵臓がん、前立腺がん、胃がん）よりがんごとにランダムに選択された１０個のサンプルからの、正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用し、そしてＴＣＧＡとＧＥＯからの正常な組織および血液を使用した。次に、発明者らは、表ｘ−ｙにリストされている１０種類のがんを検出するＣＧＩＤの組み合わせリストおよび１０種の一般的ながんのいずれかを高い感度および特異性で検出する候補リストに挙げられたＣＧＩＤに対して罰則付き回帰を実行した（図３７Ｂ、表２８）（検出）。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。

実施形態３４：がんを検出するための汎がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態３３（「検出」）で開発された加重がんＤＮＡメチル化スコアおよび閾値が、他の正常な組織によるＴＣＧＡからの３６４４人のがん患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で１３種の一般的なのがん（膀胱がん、脳がん、乳がん、子宮頸がん、大腸がん、食道がん、ＨＮＳＣ、肝臓がん、肺がん、卵巣がん、膵臓がん、前立腺がん、胃がん）を検出することを実証した。この方法を使用して、９０％〜９５％のがんサンプルが検出された（図３８Ａ）。図３８Ｂに示されるＲＯＣ曲線は、１３種のがんを他の正常な組織から検出するためのこのメチル化スコアの特異性（０．９９）および感度（０．９５）を明らかにしている（図３８Ｃ）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態３５．黒色腫を検出するためのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＴＣＧＡおよびＧＥＯデータセット内のランダムに選択された１０個の黒色腫サンプルと他のがん（膀胱がん、脳がん、乳がん、子宮頸がん、大腸がん、食道がん、ＨＮＳＣ、肝臓がん、肺がん、卵巣がん、膵臓がん、前立腺がん、胃がん）および正常血液からの２２０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮ
Ａメチル化データを「トレーニング」コーホートとして使用した。次に、発明者らは、黒色腫の検出のためのＣＧＩＤの組み合わせリスト、および黒色腫を高い感度および特異性で検出する候補リストに挙げられたＣＧＩＤ対して罰則付き回帰を実行した（図３９、表２８）（検出−スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよび黒色腫の閾値がＣＧＩＤのために開発された。

実施形態３６：黒色腫を検出するための黒色腫ポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態３５（「検出−スペック」）で開発された加重黒色腫ＤＮＡメチル化スコアおよび閾値が、他のがんおよび正常な組織によるＴＣＧＡからの４７５人の黒色腫患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で黒色腫を検出することを実証した。この方法を使用して、９８％の黒色腫サンプルが検出された（図４０Ａ）。図４０Ｂに示されるＲＯＣ曲線は、黒色腫を他の正常な組織および他のがんから検出するためのこのメチル化スコアの特異性（０．９８）および感度（０．９５）を明らかにしている（図４０Ｃ）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人における黒色腫の早期発見に使用できる。

実施形態３７：急性骨髄性白血病（ＡＭＬ）を検出するためのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＥＯデータセット内のランダムに選択された１０個のＡＭＬサンプルと１０個の正常な血液サンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。次に、発明者らは、ＡＭＬの検出のためのＣＧＩＤの組み合わせリスト、および黒色腫を高い感度および特異性で検出する候補リストに挙げられたＣＧＩＤ対して罰則付き回帰を実行した（図４１、表２７）（検出−スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよび黒色腫の閾値がＣＧＩＤのために開発された。

実施形態３８：血液ＤＮＡ中のＡＭＬを検出するための急性骨髄性白血病（ＡＭＬ）ポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態３７（「検出−スペック」）で開発された加重黒色腫ＤＮＡメチル化スコアおよび閾値が、ＧＥＯからの７９人のＡＭＬ患者およびＴＣＧＡからの１４０人の患者、そして正常な血液からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」でＡＭＬを検出することを実証した。この方法を使用して、１００％のＡＭＬサンプルが検出された（図４２Ａ）。図４２Ｂに示されるＲＯＣ曲線は、血液からのＡＭＬを検出するためのこのメチル化スコアの特異性（１）および感度（１）を明らかにしている（図４２Ｃ）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、血液ＤＮＡを使用して、リスクのある人や一般的な健康な人におけるＡＭＬの早期発見に使用できる。

実施形態３９：前立腺がんを予測するためのバイサルファイト変換、多重増幅および次世代シーケンスおよびメチル化スコアの計算。
血液は、Ｋ３−ＥＤＴＡを含む９ｍｌチューブに収集され、１時間以内に処理された。新鮮な血液サンプルを４℃で１０００ｇで１０分間遠心分離した。細胞層を乱すことなく上澄みをファルコンチューブに注意深く移し、残りの細胞を完全に除去するために再度１０分間遠心分離し、−８０℃で凍結した。血漿サンプルを解凍し、血漿ＤＮＡ用のＱｉａｇｅｎキットやＥＺＤＮＡ直接抽出法など、血漿ＤＮＡ抽出用のいくつかの利用可能な方法と市販のキットでＤＮＡを抽出する。ＡＭＰｕｒｅＸＰ磁気ビーズなどの市販の方法を使用してＤＮＡを精製し、精製したＤＮＡを、例えばＥＺＤＮＡバイサルファイト
処理キットを使用して亜硫酸水素ナトリウムで処理する。ターゲット配列のライブラリーは、２段階のＰＣＲ反応によって生成される（図４０）。第一のＰＣＲ反応は、表５および表６の特定のＣＧＩＤをターゲットにする。ＰＣＲ１プライマーは、第二のＰＣＲ２プライマーと相補的な配列を持っていることに注意する（図４０）。本発明者らは、ＨＥＫ２９３細胞からのヒトバイサルファイト変換ゲノムＤＮＡを使用して、標準的なＴａｑポリメラーゼ反応で以下のプライマーを使用したマルチプレックスＰＣＲ反応において、ＨＩＦ３Ａ（２３２塩基対領域）、ＴＰＭ４（２１３塩基対領域）、およびＣＴＴＮ（１９９塩基対領域）から前立腺がんを検出するＣＧＩＤを含むＤＮＡの３つの配列を同時に増幅した：ＣＧＩＤｃｇ０２８７９６６２の場合、フォワードプライマー：

およびリバースプライマー:

ＣＧＩＤｃｇ１６２３２９７９の場合、フォワードプライマー：

およびリバースプライマー:

ＣＧＩＤ：ｃｇ１４０４１７０１およびｃｇ１４４９８２２７の場合、フォワードプライマー：

およびリバースプライマー:

増幅した断片をアガロースゲルで分画した。

サンプルをバーコード化するために、次のプライマーを使用した第二のＰＣＲ反応を使用する：
フォワードプライマー：

バーコードプライマー（リバース）：

（太字の塩基はインデックスである。このインデックスの２００のバリエーションが使用される。プライマーの第二のセットは、各患者のインデックスと、リバースおよびフォワードシーケンスプライマーを導入する。前立腺がんＨＩＦ３Ａ２３２ｂｐ、ＴＰＭ４
２１３ｂｐ、およびＣＴＴＮ１９９ｂｐの３つのマーカーに対するマルチプレックスＰＣＲ１反応は、図４１に示すように、さまざまなプライマー濃度を使用する右側のパネルに表示される。

実施形態４０：バイサルファイト変換、マルチプレックス増幅および次世代シーケンスの
方法の有用性、およびがんを予測するためのメチル化スコアの計算。
本発明者らは、実施形態３５が、何百人もの患者からの血漿サンプルを使用して、前立腺がんおよび他のがんを同時にハイスループット（ｈｉｇｈｔｈｒｏｕｇｈｐｕｔ）予測することに使用され得ることを実証する。高度に予測可能なＣＧＩＤのインデックス付き増幅と、がんを示すメチル化スコアを計算するための合理化された方法は、前立腺がんと他のがんの早期発見に使用できる。

実施形態４１：選択されたバイオマーカーが真のＢＣＤ特性を示すことの実証は、健康な人々の血漿では完全に低メチル化されている。
血漿ＤＮＡは、４０人の健康な個人から調製された血漿から抽出され、次のがんのがん特異的プライマーによる標的増幅に供された：肝臓がん、前立腺がん、肺がん（図４３）および胃がん、汎がんおよびＣＲＣ（図４４）、その後、実施形態３９および実施形態４０に記載されているように、第２の増幅セット（ＰＣＲ２）および次世代シーケンスを使用したバーコード化を行った。すべてのＣＧは、健康な人々からの血漿において非常に低レベルのメチル化を示した（図４３および図４４）。

実施形態４２：ＤＮＡメチル化レベルを決定するためのバイオインフォマティクスワークフロー。
ＰＣＲ２の産物は、定量化と精製を組み合わせて、ＭｉｓｅｑＩｌｌｕｍｉｎａシーケンサーで次世代シーケンスにかけられる。シーケンスは、インデックス付きシーケンス用のＩｌｌｕｍｉｎａのソフトウェアを使用して逆多重化され（ｄｅｍｕｌｔｉｐｌｅｘｅｄ）、各患者に対してＦＡＳＴＱファイルが生成される。Ｐｅｒｌテキスト編集スクリプトｈｔｔｐｓ：／／ｗｗｗ．ａｃｔｉｖｅｓｔａｔｅ．ｃｏｍ／ａｃｔｉｖｅｐｅｒｌ／ｄｏｗｎｌｏａｄｓを使用して、患者ごとのＣＧＩＤごとのＦＡＳＴＱファイル内のＴとＣをカウントし、Ｃ／Ｃ＋Ｔの数を除算して患者の一つのＣＧＩＤ内のメチル化したＣの割合を定量化する。（図４２のスキームを参照）。出力ＣＳＶファイルは、方程式を使用して各患者のメチル化スコア（Ｍｓ）を計算するために使用される。方程式：

、α＝切片、β＝ＣＧＩＤ_ｉの係数、ＣＧ＝１からｎまでのＣＧＩＤの組み合わせでのＣＧあたりのメチル化レベル。ｎ＝組み合わせたＣＧの数。ＭＳ＝メチル化スコア。

本発明の主題の用途
本発明の主題の用途は、一般に、分子診断およびがんの早期予測の分野にある。当業者は、本発明の主題を使用して、神経疾患、糖尿病、肝硬変および心血管疾患における心臓組織の損傷などの心臓病など、細胞死および無細胞ＤＮＡのシステムへの脱落を伴う他のがんおよび他の疾患の早期予測のための同様の非侵襲性バイオマーカーを導き出すことができる。本発明の主題は、ＢＣＤおよびＢＣＤｈｙｐｏ法を使用して、特定の細胞のタイプおよび組織の精巧なメチル化マーカーを見つける方法を提供する。がんを早期に検出し、生存率を劇的に高め、がんから治癒するために当業者が使用することができる広範囲のがんの早期予測のための方法およびバイオマーカーも開示される。本発明により開示された方法は、健康な人々に定期的な毎年のスクリーニングを行い、がんを発症し始めている人々を特定し、直ちに治療し、がんの死亡率と罹患率の悲惨な個人的社会的および経済的影響を防止するため、また、「リスクの高い」人々を監視し、再発または転移を検出するために治療を受けている患者の治療に対する反応を監視するために、当業者により使用され得る。ここに記載された本発明の、医療提供者および健康診断施設による日常の医療管理のための採用は、がんの負担および医療費の削減に大きな影響を与えるであろう。

本発明の主題が多数の異なる従属請求項を含むという事実は、がんを予測するためにこ
れらの請求項の組み合わせを使用できないことを意味するものではない。がんを測定し、統計的に分析および予測するために本明細書に開示されている実施形態は、限定的であると考えられるべきではない。ＩｌｌｕｍｉｎａＥＰＩＣアレイ、キャプチャーアレイシーケンス、次世代シーケンス、メチル化特異的ＰＣＲ、エピタイパー、制限酵素ベースの分析、そしてパブリックドメインにあるその他の方法など、がん患者のＤＮＡメチル化を測定するためのさまざまな他の変更が当業者には明らかである。同様に、患者サンプル中のがんの予測のために本発明の主題を使用するために、ここに挙げられているものに加えて、パブリックドメインには多数の統計方法がある。

本発明の主題は、１つ以上の好ましい実施形態を含むその実施形態に関連して説明されてきたが、請求される主題の精神および範囲から逸脱することなく、他の多くの可能な修正および変更を行うことができることを理解されたい。

検出スペックのためのサブセット：
ｃｇ０８８８４５７１，ｃｇ０００１１２２５，ｃｇ２３９４６７０９

図１は、何百人もの血液サンプルと正常組織にまたがる完全にメチル化されていないサイトの候補リストを示す。図Ａは、Ｉｌｌｕｍｉｎａ４５０Ｋのゲノムワイドなメチル化アレイのすべての個体（＜０．ｌ）（ＧＳＥ５０１９２）でメチル化されていない１７組織にわたるＣＧＩＤが、３１２の個体からの血液サンプル（ＧＳＥ６１４９６）のゲノムワイドなＤＮＡメチル化アレイの非メチル化ＣＧＩＤと重複して３３４７７個のＣＧＩＤのリストを生成したことを示している。Ｂは、最も強力な非メチル化ＣＧＩＤの候補リストを示しており、Ａの３３４７７個のＣＧＩＤのリストは、１９歳から１０１歳までの６５６人（女性および男性）の血液サンプル（ＧＳＥ４０２７９）のＤＮＡメチル化アレイの非メチル化ＣＧＩＤと重複していた。結合された部分について、これらの分析により、すべての年齢層の多くの個人の組織と血液サンプルにわたってメチル化されていない信頼度の高い２８７５４個のＣＧＩＤのリストが生成された。これらの２８７５４個の位置は、本発明の主題によって開示される「バイナリーカテゴリー区別（ＢＣＤ）」法を使用して、がんにおいてカテゴリー的にメチル化されているが他の組織ではメチル化されていないサイトの発見に使用された。図２は、ＨＣＣに対する現在の循環ＤＮＡマーカーの組織特異性の欠如を示す図である。図示されたヒートマップは、他の正常な組織におけるこれらのサイトのＨＣＣとメチル化レベルのバイオマーカーとしてＸｕ等（Ｘｕ等、２０１７）に候補としてリストされた１０個のＣＧＩＤを示す。ＨＣＣの特定のバイオマーカーとして提案されているＣＧＩＤのいくつかは、他の組織でもメチル化されており、そして血中ＤＮＡのメチル化レベルがさまざまであることを示す。（青は０メチル化、暗赤色は１００％メチル化）図２Ａは、本発明の主題の実施形態による図２の一部の分解図である。図２Ｂは、本発明の主題の実施形態による図２の一部の分解図である。図２Ｃは、本発明の主題の実施形態による図２の一部の分解図である。図３は、がんＤＮＡに対してＢＣＤ法を使用して発見されたＨＣＣＤＮＡメチル化マーカーの特異性を示す図である。図示されたヒートマップは、ここで説明するＢＣＤ法によってＨＣＣＤＮＡメチル化マーカーとして選択された４つのＣＧＩＤを示す。メチル化レベルは、がん（ＨＣＣ）と正常な組織および血液との間でカテゴリー的に異なり、これにより、血液および他の組織のすべての個体で該サイトがメチル化されず、ＨＣＣで測定可能な程度にメチル化される。図３Ａは、本発明の主題の実施形態による図３の一部の分解図である。図３Ｂは、本発明の主題の実施形態による図３の一部の分解図である。図３Ｃは、本発明の主題の実施形態による図３の一部の分解図である。図４は、大腸がんに対する現在のＤＮＡメチル化マーカーのがん組織起源特異性の欠如、および本発明の主題の実施形態による「検出−スペック」法との比較を示す図である。図Ａは、大腸がんのＣＦＤＮＡメチル化マーカー「Ｅｐｉ−大腸がん」（エピゲノミクス社より販売）に含まれるＳｅｐｔ９遺伝子のＣＧサイトを示しており、マーカーはがんＤＮＡメチル化データのＴＣＧＡコレクションからのメチル化データを利用して他の多くのがんを検出するために使用できるため、大腸がんに対する特異性に欠けている（ＨＫＧ−大腸がん（ＨＫＧ−ｅｐｉＣＲＣ）、青）。ＢＣＤ法（ＨＫＧ−大腸がんオレンジ）（表８）を用いて発見された大腸がんの検出のために本発明の主題で開示されるマーカー（表８）は、他の一般的な固形腫瘍がんに対して試験した場合、大腸がんに非常に特異的である。図Ｂと図Ｃは、ＨＫＧ−大腸がん（ＨＫＧ−ｅｐｉＣＲＣ）（Ｂ）またはＥｐｉ−大腸がん（Ｃ）のいずれかのＤＮＡメチル化マーカーを使用した、さまざまながんの異なる個人からの腫瘍ＤＮＡのＤＮＡメチル化値の散布図である。注目すべきは、ＨＫＧ−ｅｐｉＣＲＣマーカー（Ｂ）対Ｅｐｉ−大腸がんマーカー（Ｃ）の散在する異質なプロファイルを使用した、大腸がんと他のがんの間のＤＮＡメチル化の厳格なカテゴリー的な違いである。図４Ａは、本発明の主題の実施形態による図４の一部の分解図である。図４Ｂは、本発明の主題の実施形態による図４の一部の分解図である。図５は、肝臓がん（ＨＣＣ）の早期発見のためのポリジーンＤＮＡメチル化マーカーの発見を示す図である。図Ａは、ソースと患者数をリストした表を示し、これらの患者のメチル化データは、ＢＣＤ法（表１）および起源特定のがんを決定するためのＣＧＩＤ（表２）を使用する実施形態による、ＨＣＣの検出のための４つの一連のＣＧＩＤの発見に使用された。図５の左下のパネルの図Ｂ（検出）は、１〜１４５（正常７９名およびＨＣＣ６６名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表１）のメチル化スコアの合計を示す。該ポリジーンスコアは、ＨＣＣを有する人と正常な肝組織を有する人をカテゴリー的に区別する。右下のパネルの図Ｃは、８種の異なる腫瘍（表２）のデータを使用して特定の腫瘍の起源を検出する１つのＣＧＩＤ（表２）のメチル化スコアを示す。マーカーは、他の起源のがんとＨＣＣをカテゴリー的に区別する。図６は、ＧＳＥ７６２６９（ｎ＝２２７）からのＤＮＡメチル化データを使用た、ＨＣＣ（スペック）のポリジーンＤＮＡメチル化マーカーの検証の図である。図Ａは、肝臓がん患者２２７名のＤＮＡメチル化データと正常１０名を使用したＨＣＣＤＮＡメチル化マーカーの曲線下の領域を示すＲＯＣプロットである。図６の図Ｂは、ＨＣＣ検出の感度、特異性、および精度を示す。図Ｃは、検証データセットにおけるＨＣＣの検出の予測率を示す。図７は、ＴＣＧＡメチル化データ（ｎ＝４１６６）における、ＨＣＣ対他のがんに対するポリジーンＨＫＧ−ｅｐｉ肝臓がん−検出およびスペックマーカーの精度および特異性の検証の図である。図７の図Ａは、異なるがんを有する患者のＨＫＧ−肝臓検出／スペックマーカーＤＮＡメチル化データの検出率を示す。ＨＣＣのほぼ完全な特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける４１６６人の患者のＤＮＡメチル化データにおける、ＨＣＣのＨＫＧ−肝臓−検出マーカーの特異性と感度のＲＯＣプロットである。図Ｃは、ＨＣＣ対他の起源のがんに対する感度と特異性である。図８は、肺がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図８の図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表３）および起源特定のがん組織を決定するためのＣＧＩＤ（表４）を使用する実施形態に開示される、肺がんの検出のための一連のＣＧＩＤの発見に使用された。図８の左下のパネルの図Ｂ（検出）は、１〜２０名（正常１０名および肺がん１０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表３）のメチル化スコアの合計を示す。該ポリジーンスコアは、肺がんを有する人と正常な組織を有する人をカテゴリー的に区別する。図８の右下のパネルの図Ｃは、８種の異なる腫瘍（ｎ＝８０）のある人からのデータを使用して特定の腫瘍の起源を検出するＣＧＩＤ（表４）のメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと肺がんをカテゴリー的に区別する。図９は、ＴＣＧＡメチル化データ（ｎ＝４１６６）における、肺がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉ肺がん−検出およびスペックマーカーの精度および特異性の検証の図である。図９の図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用したＨＫＧ−ｅｐｉ肺がん検出／スペックマーカーの検出率を示す。肺がんの特異性に注目すべきである。図９の図Ｂは、ＴＣＧＡからの４１６６名の患者のＤＮＡメチル化データにおける、肺がんのＨＫＧ−肺がん−検出マーカーの特異性と感度のＲＯＣプロットを示す。図９の図Ｃは、肺がん対他の起源のがんに対する感度と特異性を示す。図１０は、前立腺がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図１０の図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表５）および起源特定のがん組織を決定するためのＣＧＩＤ（表５）を使用する実施形態に開示される、前立腺がんの検出のための一連のＣＧＩＤの発見に使用された。図１０の左下のパネルの図Ｂ（検出）は、１〜１５（正常５名および前立腺がん１０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表５）のメチル化スコアの合計を示す。該ポリジーンスコアは、前立腺がんを有する人と正常な人をカテゴリー的に区別する。図１０の右下のパネルの図Ｃは、８種の異なる腫瘍（ｎ＝８０）のある人からのデータを使用して起源特定の腫瘍組織を検出するＣＧ（表５）のメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと前立腺がんをカテゴリー的に区別する。図１１は、ＴＣＧＡメチル化データ（ｎ＝４１６６）における、前立腺がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉ前立腺がん−検出およびスペックマーカーの精度および特異性の検証の図である。図１１の図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用したＨＫＧ−前立腺がん検出／スペックマーカーの検出率を示す。前立腺がんの特異性に注目すべきである。図１１の図Ｂは、ＴＣＧＡにある４１６６名の患者からのＤＮＡメチル化データを使用する、前立腺がんのＨＫＧ−前立腺がん−検出マーカーの特異性と感度のＲＯＣプロットである。図１１の図Ｃは、前立腺対他の起源のがんに対する感度と特異性を示す。図１２は、乳がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図１２の図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表６）および起源特定のがんを決定するためのＣＧＩＤ（表７）を使用する実施形態に開示される、乳がんの検出のための一連のＣＧの発見に使用された。図１２の左下のパネルの図Ｂ（検出）は、１〜２７（正常１７名および乳がん１０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表６）のメチル化スコアの合計を示す。該ポリジーンスコアは、乳がんを有する人と正常な乳組織を有する人をカテゴリー的に区別する。図１２の右下のパネルの図Ｃは、８種の異なる腫瘍（ｎ＝８０）のある人からのデータを使用して特定の腫瘍の起源を検出するＣＧＩＤ（表７）のメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと乳がんをカテゴリー的に区別する。図１３は、検証コーホートＧＳＥ６０１８５（ｎ＝２８５）において、ＨＫＧ−ｅｐｉ乳がん−検出ポリジーンＤＮＡメチル化マーカーが非浸潤性および浸潤性乳がんを検出する図である。図１３の図Ａは、２３９名の乳がん患者のＤＮＡメチル化データ、１７名の乳がんではない乳房形成術患者および２９名の隣接組織を使用した乳がんポリジーンＤＮＡメチル化マーカーの曲線下の領域を示すＲＯＣプロットである。すべての乳がんの感度、特異性および精度をＢに示し、ＤＣＩＳ（非浸潤性乳管がん）、浸潤性乳がんおよび混合乳がんのサンプルの予測率を図１３の図Ｃに示す。注目すべきは、乳がんマーカーが非常に早期の乳がん（ＤＣＩＳ）を検出することである。図１４は、ＴＣＧＡメチル化データ（ｎ＝４１６６）における、乳がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉ乳がん−検出およびスペックマーカーの精度および特異性の検証の図である。図１４の図Ａは、異なるがんを有する患者からのＤＮＡメチル化データにおいて、ＨＫＧ−ｅｐｉ乳がん検出／スペックマーカーの検出率を示す。乳がんの特異性に注目すべきである。図１４の図Ｂは、ＴＣＧＡにおける４１６６人患者のＤＮＡメチル化データを使用して乳がんを検出するための、ＨＫＧ−乳がん−検出マーカーの特異性と感度のＲＯＣプロットである。図１４の図Ｃは、乳がん対他の起源のがんに対する感度と特異性を示す。図１５は、大腸がん（ＣＲＣ）のポリジーンＤＮＡメチル化マーカーの発見の図である。図１５の図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表８）および起源特定のがんを決定するためのＣＧＩＤ（表８）を使用する実施形態に開示される、大腸がんの検出のための一連のＣＧＩＤの発見に使用された。図１５の左下のパネルの図Ｂ（検出）は、１〜７５（正常２５名および大腸がん５０名）からリストされた各テスト対象者のこれらのＣＧＩＤのメチル化スコアの合計を示す。該ポリジーンスコアは、がんを有する人と正常な組織を有する人をカテゴリー的に区別する。図１５の右下のパネルの図Ｃは、８種の異なる腫瘍（ｎ＝８０）のある人からのＤＮＡメチル化データを使用して腫瘍の特定の起源を検出するＣＧＩＤのメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと大腸がんをカテゴリー的に区別する。図１６は、ＴＣＧＡＤＮＡメチル化データセット（ｎ＝４１６６）を使用した、大腸がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉＣＲＣ−検出およびスペックマーカーの精度および特異性の検証の図である。図１６の図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用するＨＫＧ−ｅｐｉＣＲＣ検出／スペックマーカーの検出率を示す。大腸がんの特異性に注目すべきである。図１６の図Ｂは、ＴＣＧＡにおける４１６６名の患者からのＤＮＡメチル化データを使用する、大腸がんのＨＫＧ−ｅｐｉ大腸がん−検出マーカーの特異性と感度のＲＯＣプロットである。図１６の図Ｃは、大腸がん対他の起源のがんに対する感度と特異性を示す。図１７は、膵臓がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図１７の図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表９）および起源特定のがんを決定するためのＣＧＩＤ（表１０）を使用する本発明に開示される膵臓がんの検出のための一連のＣＧＩＤの発見に使用された。図１７の左下のパネルの図Ｂ（検出）は、１〜３２（正常１２名および膵臓がん２０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表９）のメチル化スコアの合計を示す。該ポリジーンスコアは、膵臓がんを有する人と正常な組織を有する人をカテゴリー的に区別する。図１７の右下のパネルの図Ｃは、１０種の異なる腫瘍（ｎ＝１００）のある人からのデータを使用して腫瘍の特定の起源を検出するＣＧＩＤ（表１０）のメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと膵臓がんをカテゴリー的に区別する。図１８は、ＴＣＧＡメチル化データ（ｎ＝４８５４）における、膵臓がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉ膵臓がん−検出およびスペックマーカーの精度および特異性の検証の図である。図１８の図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉ膵臓がん検出／スペックマーカーの検出率である。膵臓がんの特異性に注目すべきである。図１８の図Ｂは、ＴＣＧＡにおける４８５４名の患者からのＤＮＡメチル化データを使用する、膵臓がんのＨＫＧ−ｅｐｉ膵臓がん−検出マーカーの特異性と感度のＲＯＣプロットである。図Ｃは、膵臓がん対他の起源のがんに対する感度と特異性を示す。図１９は、脳がん（膠芽腫）のポリジーンＤＮＡメチル化マーカーの発見の図である。図１９の図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表１１）およびがんの特定起源を決定するためのＣＧＩＤ（表１１）を使用する、本発明に開示される、脳がんの検出のための一連のＣＧＩＤの発見に使用された。左下のパネルの図Ｂ（検出／スペック）は、１〜１６（正常６名および脳がん１０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表１１）のメチル化スコアの合計を示す。該ポリジーンスコアは、脳がんを有する人、１１０名の別のがんを有する人と正常な組織を有する人をカテゴリー的に区別する。図２０は、ＴＣＧＡメチル化データ（ｎ＝４８５４）における、脳がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉ脳がん−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉ脳がん検出／スペックマーカーの検出率である。脳がんの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける４８５４名の患者からのＤＮＡメチル化データを使用する、脳がんのＨＫＧ−ｅｐｉ脳がん−検出マーカーの特異性と感度のＲＯＣプロットである。図Ｃは、ＴＣＧＡデータセット（ｎ＝６９５）における脳がんに対する感度と特異性を示す。図２１は、胃（ｇａｓｔｒｉｃ）［胃（ｓｔｏｍａｃｈ）］がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表１２）およびがんの特定起源を決定するためのＣＧＩＤ（表１３）を使用する、本発明に開示される胃がんの検出のための一連のＣＧＩＤの発見に使用された。図２１の左下のパネルの図Ｂ（検出）は、１〜２８（正常１４名および胃がん２０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表１２）のメチル化スコアの合計を示す。該ポリジーンスコアは、胃がんを有する人と正常な組織を有する人をカテゴリー的に区別する。図２１の右下のパネルの図Ｃ（スペック）は、１０種の異なる腫瘍（ｎ＝１００）のある人のポリジーンメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと胃がんをカテゴリー的に区別する。図２２は、ＴＣＧＡメチル化データ（ｎ＝４８１７）における、胃がん対他のがんに対するポリジーンＨＫＧ−胃−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉ胃がん検出／スペックマーカーの検出率である。胃がんの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける４４２０名の患者からのＤＮＡメチル化データを使用する、胃（胃がん）のＨＫＧ−ｅｐｉ胃がん−検出スペック１マーカーの特異性と感度のＲＯＣプロットである。図Ｃは、ＴＣＧＡにおける４８５４名の患者からのＤＮＡメチル化データを使用する、胃がんのＨＫＧ−ｅｐｉ胃がん−スペック１マーカーの特異性と感度のＲＯＣプロットである。注目すべきは、大腸がんおよび食道がんとの有意な交差反応性があり、それが共通の起源であることを証明していることである。図２３は、卵巣がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表１４）および起源特定のがんを決定するためのＣＧＩＤ（表１５）を使用する、本発明に開示される卵巣がんの検出のための一連のＣＧＩＤの発見に使用された。図２３の左下のパネルの図Ｂ（検出）は、１〜１５（正常５名および卵巣がん１０名）からリストされた各テスト対象者のこれらのＣＧＩＤのメチル化スコアの合計を示す。該ポリジーンスコアは、卵巣がんを有する人と正常な組織を有する人をカテゴリー的に区別する。図２３の右下のパネルの図Ｃは、１１種の異なる腫瘍（ｎ＝１１０）のある人からのデータを使用して特定の腫瘍起源を検出するＣＧＩＤのメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと卵巣がんをカテゴリー的に区別する。図２４は、ＴＣＧＡメチル化データ（ｎ＝６５２２）における、卵巣がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉ卵巣がん−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉ卵巣がん検出／スペックマーカーの検出率である。卵巣がんの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける４７２３名の患者からのＤＮＡメチル化データにおける、卵巣がんのＨＫＧ−ｅｐｉ卵巣がん−検出およびスペックマーカーの特異性と感度のＲＯＣプロットである。図Ｃは、卵巣がんに対する感度と特異性を示す。図２５は、子宮頸がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表１６）および起源特定のがんを決定するためのＣＧ（表１７）を使用する、本発明に開示される子宮頸がんの検出のための一連のＣＧＩＤの発見に使用された。図２５の左下のパネルの図Ｂ（検出）は、１〜３０（正常２０名および子宮頸がん１０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表１６）のメチル化スコアの合計を示す。該ポリジーンスコアは、子宮頸がんを有する人と正常な組織を有する人をカテゴリー的に区別する。図２５の右下のパネルの図Ｃは、８種の異なる腫瘍（ｎ＝８０）のある人からのデータを使用して腫瘍の特定起源を検出するＣＧＩＤ（表１７）のメチル化スコアを示す。これらの実施形態では、マーカーは他の起源のがんと子宮頸がんをカテゴリー的に区別するが、大腸がんのいくつかの測定可能な検出に留意されたい。図２６は、ＴＣＧＡメチル化データ（ｎ＝６５２２）における、子宮頸がん対他のがんに対するポリジーンＨＫＧ−子宮頸がん−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用する、ＨＫＧ−子宮頸がん検出／スペックマーカーの検出率を示す。子宮頸がんの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける４４２０名の患者からのＤＮＡメチル化データを使用する、子宮頸がんのＨＫＧ−子宮頸がん−検出スペックマーカーの特異性と感度のＲＯＣプロットである。図Ｃは、子宮頸がんに対する感度と特異性を示す。図２７は、頭頸部扁平上皮がん（ＨＮＳＣ）のポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表１８）および起源特定のがんを決定するためのＣＧ（表１９）を使用する、本発明に開示されるＨＮＳＣの検出のための一連のＣＧＩＤの発見に使用された。図２７の左下のパネルの図Ｂは、１〜１４０（がん１０名、正常１０名および他のがん１２０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表１８）のメチル化スコアの合計を示す。図Ｃは、実施形態においてＨＮＳＣと正常組織サンプルをカテゴリー的に区別するとともに、他の起源からのがんとＨＮＳＣをカテゴリー的に区別するポリジーンスコアを示す。図２８は、ＴＣＧＡメチル化データ（ｎ＝４１６６）における、ＨＮＳＣ対他のがんに対するポリジーンＨＫＧ−ｅｐｉＨＮＳＣ−検出／スペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉＨＮＳＣ検出／スペックマーカーの検出率である。ＨＮＳＣの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける４１６６名の患者からのＤＮＡメチル化データにおけるＨＮＳＣのＨＫＧ−ｅｐｉＨＮＳＣ−検出マーカーの特異性と感度のＲＯＣプロットである。図Ｃは、ＨＮＳＣ対他の起源のがんに対する感度と特異性を示す。図２９は、食道がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表２０）およびがんの特定起源を決定するためのＣＧＩＤ（表２１）を使用する、実施形態に開示される、食道がんの検出のための一連のＣＧＩＤの発見に使用された。図２９の左下のパネルの図Ｂは、１〜２２（正常８名、がん１４名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表２０）のメチル化スコアの合計を示す。図Ｃは、実施形態において食道がんと正常組織をカテゴリー的に区別するとともに、他の起源からのがんと１〜２２０（がん２０名、他のがん１９０名および正常血液１０名）からリストされた食道がんをカテゴリー的に区別するポリジーンスコアを示す。図３０は、ＴＣＧＡメチル化データ（ｎ＝７１０２）における、食道がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉ食道がん−検出／スペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者のＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉ食道がん検出／スペックマーカーの検出率を示す。食道がんの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける４１６６名の患者のＤＮＡメチル化データにおける食道がんのＨＫＧ−ｅｐｉ食道がん−検出マーカーの特異性と感度のＲＯＣプロットである。図Ｃは、食道がん対他の起源のがんに対する感度と特異性を示す。図３１は、膀胱がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表２２）およびがんの特定起源を決定するためのＣＧＩＤ（表２３）を使用する、実施形態に開示される膀胱がんの検出のための一連のＣＧＩＤの発見に使用された。図３１の左下のパネルの図Ｂ（検出）は、１〜１５（正常５名、膀胱がん１０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表２２）のメチル化スコアの合計を示す。図３１の右下のパネルの図Ｃは、１３種の異なる腫瘍（ｎ＝１３０）を有する人からのデータを使用して腫瘍の特定の起源を検出するＣＧＩＤ（表２３）のメチル化スコアを示す。これらの実施形態では、マーカーは、他の起源からのがんと膀胱がんとを区別する。これらのマーカーによる大腸がんの測定可能な検出も注目すべきである。図３２は、ＴＣＧＡ（ｎ＝４７２３）における膀胱がん対他のがんに対するポリジーンＨＫＧ−ｅｐｉＢｌａｄｄｅｒ−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがん（Ａ）および膀胱がん（Ｂ）を有する患者のＤＮＡメチル化データにおいて、ＨＫＧ−ｅｐｉ膀胱がんスペックマーカー（Ａ）および検出マーカー（Ｂ）の検出率を示す。図Ｃは、ＴＣＧＡにおける４４２０名の患者からのＤＮＡメチル化データを使用した、膀胱がんのＨＫＧ−ｅｐｉ膀胱がんスペックマーカーの特異性と感度のＲＯＣプロットである。図Ｄは、膀胱がんのＨＫＧ−ｅｐｉ膀胱がん検出マーカーの特異性と感度のＲＯＣプロットである（ｎ＝４４０）。図３３は、腎臓がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ（ｈｙｐｏ）法を使用する、実施形態で開示された腎臓がんの検出およびがんの特定の起源の決定（表２４）のための一連のＣＧＩＤの発見に使用された。図３３の左下のパネルの図Ｂ（検出／スペック）は、１〜２２６（その他のがん１８０名、健康な血液１０名、正常な腎臓６名、腎がん３０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表２４）のメチル化スコアの合計を示す。これらの実施形態では、該ポリジーンスコアは腎臓がん、別のがんと正常な血液をカテゴリー的に区別する。図３４は、ＴＣＧＡＤＮＡメチル化データ（ｎ＝７１０２）を使用する、腎臓がん対他のがんおよび正常組織に対するポリジーンＨＫＧ−ｅｐｉ腎臓がん−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんからのＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉ腎臓がん検出／スペックマーカーの検出率である。腎臓がんの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける６３６７のがんのＤＮＡメチル化データを使用する、腎臓がんのＨＫＧ−ｅｐｉ腎臓がん−検出スペックマーカーの特異性と感度のＲＯＣプロットである。図Ｃは、腎臓（ｒｅｎａｌ）［腎臓（ｋｉｄｎｅｙ）］がんに対する感度と特異性を示す。さらに注目すべきは、脳、ＨＣＣおよび精巣がんとのクロスオーバーである。図３５は、精巣がんのポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ（ｈｙｐｏ）法を使用する実施形態で開示された精巣がんの検出および起源特定のがんの決定（表２５）のための一連のＣＧＩＤの発見に使用された。図３５の左下のパネルの図Ｂ（検出／スペック）は、１〜１９０（精巣がん１０名、その他のがんおよび血液１８０名）からリストされた各テスト対象者のこれらのＣＧＩＤ（表２５）のメチル化スコアの合計を示す。これらの実施形態では、該ポリジーンスコアは精巣がん、正常な血液と別のがんをカテゴリー的に区別する。図３６は、ＴＣＧＡメチル化データ（ｎ＝７１０２）における、精巣がん対他の正常な組織およびがんに対するポリジーンＨＫＧ−ｅｐｉ精巣がん−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者からのＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉ精巣がん検出／スペックマーカーの検出率を示す。精巣がんの特異性に注目すべきである。図Ｂは、ＴＣＧＡにおける６３６７名の患者のＤＮＡメチル化データを使用する、精巣がんのＨＫＧ−ｅｐｉ精巣がん−検出スペックマーカーの特異性と感度のＲＯＣプロットである。図Ｃは、精巣がんに対する感度と特異性を示す。図３７は、１３種の一般的ながんの汎がんポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表２６）を使用する実施形態で開示された１３種の一般的ながん（表２６）（膀胱がん、脳がん、乳がん、子宮頸がん、大腸がんＣＲＣ、食道がん、肝臓がん、肺がん、卵巣がん、膵臓がん、前立腺がん、胃がん）の検出のための一連のＣＧＩＤの発見に使用された。図Ｂは、１〜１８０（がん１７０名、健康な血液１０名）からリストされた各テスト対象者のこれらのＣＧＩＤのメチル化スコアの合計を示す。これらの実施形態では、該ポリジーンスコアはがんと正常な組織を区別する。図３８は、ＴＣＧＡメチル化データ（ｎ＝７１０２）における、ポリジーンＨＫＧｅｐｉ汎がんマーカーの精度および特異性の検証の図である。図Ａは、ＴＣＧＡデータを使用し、１３人の異なるがん患者のｅｐｉ汎がんポリジーンＤＮＡメチル化マーカーを使用して計算されたメチル化スコアを示す。図Ｂは、ＴＣＧＡにおける４８７８名の患者からのすべてのがんのＤＮＡメチル化データを使用する、ＨＫＧ−汎がん検出およびスペックマーカーの特異性と感度のＲＯＣプロットである。図Ｃは、がんを検出するための汎がんマーカーの全体的な感度と特異性を示す。これらの実施形態では、１つ以上の色、例えば、オレンジ（加重メチル化スコア）および青（サンプルあたり１つのＢＣＤマーカーの検出が陽性がんとしてスコア付けされる）が使用される。図３９は、黒色腫のポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表４５）を使用する実施形態で開示された黒色腫の検出（表２８）のための一連のＣＧＩＤの発見に使用された。図Ｂは、１〜２２０（その他のがんおよび健康な血液）および１０名の黒色腫を有する患者からリストされた各テスト対象者のこれらのＣＧＩＤのメチル化スコアの合計である。これらの実施形態では、該ポリジーンスコアは黒色腫、別のがんそして正常な組織を区別する。図４０は、ＴＣＧＡメチル化データ（ｎ＝７１０２）における、黒色腫対他の正常な組織およびがんに対するポリジーンＨＫＧ−ｅｐｉ黒色腫−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、異なるがんを有する患者からのＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉ黒色腫検出／スペックマーカーの検出率を示す。黒色腫（肝臓がん、脳がんおよび前立腺がんとの重複検出）の特異性に注目すべきである。図Ｂは、ＴＣＧＡにある６３６７名の患者のＤＮＡメチル化データを使用する、黒色腫のＨＫＧ−黒色腫−検出スペックマーカーの特異性と感度のＲＯＣプロットである。図Ｃは、黒色腫に対する感度と特異性を示す。図４１は、血液がん（急性骨髄性白血病（ＡＭＬ））のポリジーンＤＮＡメチル化マーカーの発見の図である。図Ａは、ソースと患者数をリストした表であり、これらの患者のメチル化データは、ＢＣＤ法（表２７）を使用する実施形態で開示された血液がんＡＭＬの検出（表２７）のための一連のＣＧＩＤの発見に使用された。図Ｂは、１〜１０（健康な血液）および１０名のＡＭＬを有する患者からリストされた各テスト対象者のこれらのＣＧＩＤのメチル化スコアの合計である。これらの実施形態では、該ポリジーンスコアはＡＭＬと正常な血液を区別する。図４２は、ＧＳＥ８６４０９（ｎ＝７９）およびＴＣＧＡ（ｎ＝１４０）におけるＡＭＬ対ＧＳＥ４０２７９およびＧＳＥ６１４９６（ｎ＝９６８）における正常な血液に対するポリジーンＨＫＧ−ｅｐｉＡＭＬ−検出およびスペックマーカーの精度および特異性の検証の図である。図Ａは、ＡＭＬを有する患者及び健康な血液を有する者からのＤＮＡメチル化データを使用する、ＨＫＧ−ｅｐｉＡＭＬ検出／スペックマーカーの検出率を示す。図Ｂは、ＧＳＥ８６４０９（ｎ＝７９）、ＴＣＧＡ（ｎ＝１４０）、ＧＳＥ４０２７９およびＧＳＥ６１４９６（ｎ＝９６８）からのＤＮＡメチル化データを使用する、ＡＭＬのＨＫＧ−ＡＭＬ−検出スペックマーカーの特異性と感度のＲＯＣプロットである。図Ｃは、ＡＭＬに対する感度と特異性を示す。図４３は、正常な人に由来する血漿においてＢＣＤ特性〜０のメチル化を示す異なるがんを検出するために選択されたプライマーの検証の図である（各サンプルは正常な患者からの血漿の混合物である）。特定のＣＧをターゲットとする第一のＰＣＲ１反応は、シーケンスターゲットプライマーを使用して実行された。第二のＰＣＲの後、増幅されたフラグメントを精製し、次世代シーケンスを行った。ＤＮＡメチル化は、示された各々のＣＧＩＤ位置で定量化された。図４４は、正常な人に由来する血漿においてＢＣＤ特性〜０のメチル化を示す異なるがんを検出するために選択された、示されたプライマーの検証の図である（各サンプルは正常な患者からの血漿の混合物である）。図４５は、多重増幅およびシーケンスのためのプライマー設計の図である。第一のＰＣＲ反応は対象となる特定の関心領域をターゲットにするが、ＰＣＲ１プライマーは第二のＰＣＲ２プライマーに相補的な配列を持っていることに注意されたい。プライマーの第二セットは、各患者のインデックスと、リバースおよびフォワードシーケンスプライマーを導入する。図４６は、前立腺がんを検出するためのＰＣＲ条件の最適化の図である。右側のパネルには、前立腺がんの３つのマーカーＨＩＦ３Ａ２３２ｂｐ、ＴＰＭ４２１３ｂｐ、およびＣＴＴＮ１９９ｂｐについて、示されているＤＮＡのようなさまざまなプライマー濃度を使用したマルチプレックスＰＣＲ１反応が示されている。図４７は、ＤＮＡメチル化レベルを決定するためのバイオインフォマティクスワークフローの図である。ＰＣＲ２の産物を組み合わせ、定量化および精製し、ＭｉｓｅｑＩｌｌｕｍｉｎａシーケンサーで次世代シーケンスを行う。シーケンスは逆多重化（ｄｅｍｕｌｔｉｐｌｅｘｅｄ）され、ＦＡＳＴＱファイルは患者ごとに生成され、スキームに示されているワークフローで分析される。ＤＮＡメチル化スコアは患者ごとに計算される。

データベース；Ｉｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データ
遺伝子発現オムニバス（ＧｅｎｅｅｘｐｒｅｓｓｉｏｎＯｍｎｉｂｕｓ）（ＧＥＯ）ｈｔｔｐｓ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｇｅｏ／またはがんゲノムアトラス（ＴｈｅＣａｎｃｅｒＧｅｎｏｍｅＡｔｌａｓ）ＴＣＧＡｈｔｔｐｓ：／／ｃａｎｃｅｒｇｅｎｏｍｅ．ｎｉｈ．ｇｏｖ／公開データベースのいずれかに寄託された多数の個人からのヒトゲノム全体の〜４５０，０００ＣＧのメチル化の正規化されたベータ値の公開されているデータベースを使用した。次のデータベースを使用して、多くの正常組織および血液ＤＮＡ：ＧＳＥ６１４９６、ＧＳＥ４０２７９にある強力な非メチル化ＣＧＩＤのリストを取得した。

実施形態６：肺がんを検出するための肺がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態５（検出）で開発された加重肺がんＤＮＡメチル化スコアおよび閾値が、ＧＳＥ６６８３６、ＧＳＥ６３７０４、ＧＳＥ７６２６９からの、およびＴＣＧＡの９１９人の肺がん患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で肺がんを検出することを実証した。この方法を使用して、９６％の肺がんサンプルが肺がんとして検出された（図９Ａ）。次に、発明者らは、肺がんと他の８種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、肺がんと他のがんを区別するための、スペックおよび検出のＤＮＡメチル化スコアを組み合わせた有用性を実証した（図９Ａ）。図９Ｂに示されるＲＯＣ曲線は、肺がんを他の正常な組織および他のがんから検出するための、このメチル化スコアの特異性（０．９６）および感度（０．８４）を明らかにしている（図９Ｃ）。これらのＤＮＡメチル化マーカーと計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態７：前立腺がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ５２９５５（正常な前立腺）からの５人の、そして前立腺がんＤＮＡメチル化データのＴＣＧＡ前立腺がんコレクションからランダムに選択された１０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で前立腺がんを検出する（図１０Ｂ、表５）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、８種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、前立腺がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図１０Ｃ、表５）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態８：前立腺がんを検出するための前立腺がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態７（検出）で開発された加重前立腺がんＤＮＡメチル化スコアおよび閾値が、ＧＳＥ７３５４９、ＧＳＥ２９５５からの、およびＴＣＧＡの４３０人の前立腺がん患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で前立腺がんを検出することを実証した。この方法を使用して、９９％の前立腺がんサンプルが前立腺がんとして検出された（図１１Ａ）。次に、発明者らは、前立腺がんと他の８種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、前立腺がんと他のがんを区別するための、スペックおよび検出のＤＮＡメチル化スコアを組み合わせた有用性を実証した（図１１Ａ）。図１１Ｂに示されるＲＯＣ曲線は、前立腺がんを他の正常な組織および他のがんから検出するための、このメチル化スコアの特異性（０．９９）および感度（０．９８）を明らかにしている（図１１Ｃ）。これらのＤＮＡメチル化マーカーと計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態９：乳がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ６０１８５（正常な乳房）からの１７人の、そして乳がんＤＮＡメチル化データのＴＣＧＡ乳がんコレクションからランダムに選択された１０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で乳がんを検出する（図１２Ｂ、表６）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、８種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、乳がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図１２Ｃ、表７）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態１１：大腸がん（ＣＲＣ）のポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ（３２１４６）（正常）からの２５人の、そして大腸がんＤＮＡメチル化データのＴＣＧＡ大腸がんコレクションからランダムに選択された５０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で大腸がんを検出する（図１５Ｂ、表８）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、８種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、大腸がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図１５Ｃ、表８）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態１３：膵臓がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ５３０５１（正常）からの１２人の、そして膵臓がんＤＮＡメチル化データのＴＣＧＡコレクションからランダムに選択された２０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプ
ル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で膵臓がんを検出する（図１７Ｂ、表９）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、１０種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された１００個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、膵臓がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図１７Ｃ、表１０）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態１５：脳がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ６５８２０（正常）からの１０人の、そして脳がんＤＮＡメチル化データのＴＣＧＡコレクションからランダムに選択された１０個のサンプからルの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で脳がんを検出する（図１９Ｂ、表１１）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、１１種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された１１０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、検出のＣＧＩＤはまた、脳がんと他の腫瘍とを区別することを発見した（図１９Ｂ、表１１）（検出−スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態１６：脳がんを検出するための脳がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態１５（検出）で開発された加重脳がんＤＮＡメチル化スコアおよび閾値が、ＴＣＧＡからの６８９人の脳がん患者、ＧＳＥ５８２９８からの４０人の患者およびＧＳＥ３６２７８からの１３６人の患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で脳がんを検出することを実証した。この方法を使用して、９１％〜９７％の脳がんサンプルが脳がんとして検出された（図２０Ａ）。次に、発明者らは、脳がんと他の９種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、脳がんと他のがんを区別するための、同様のＣＧＩＤの有用性を実証した（図２０Ａ）。図２０Ｂに示されるＲＯＣ曲線は、脳がんを他の正常な組織および他のがんから検出するためのこのメチル化
スコアの特異性（１）および感度（０．９７）を明らかにしている（図２０Ｃ）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態１７：胃がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ９９５５３（正常）からの１８人の、そして胃がんＤＮＡメチル化データのＴＣＧＡコレクションからランダムに選択された１０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で胃がんを検出する（図２１Ｂ、表１２）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、１１種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された１００個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、胃がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図２１Ｃ、表１３）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態１９：卵巣がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ６５８２０（正常）からの５人の、そして卵巣がんＤＮＡメチル化データのＴＣＧＡコレクションからランダムに選択された１０個のサンプからルの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で卵巣がんを検出する（図２３Ｂ、表１４）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、１０種の異なる腫瘍タイプおよび血液を表すＴＣＧＡからランダムに選択された１００個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、卵巣がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図２３Ｃ、表１５）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態２１：子宮頸がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ４６３０６（正常）からの２０人の、そして子宮頸がんＤＮＡメチル化データのＴＣＧＡコレクションからランダムに選択された１０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で子宮頸がんを検出する（図２５Ｂ、表１６）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、８種の異なる腫瘍タイプおよび血液を表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、子宮頸がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図２５Ｃ、表１７）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態２３：頭頸部扁平上皮がん（ＨＮＳＣ）のポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ（５２０６８）（正常）からの１０人の、そしてＨＮＳＣＤＮＡメチル化データのＴＣＧＡがんコレクションからランダムに選択された１０個のサンプルから正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性でＨＮＳＣを検出する（図２７Ｂ、表１８）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、１２種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、ＨＮＳＣと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図２７Ｃ、表１９）（スペック）。

実施形態２４：ＨＮＳＣを検出するための頭頸部扁平上皮がん（ＨＮＳＣ）ポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態２３（検出）で開発された加重ＨＮＳＣＤＮＡメチル化スコアおよび閾値が、ＧＳＥ５２０６８、ＧＳＥ７５５３７およびＧＳＥ７９５５６からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」でＨＮＳＣを検出することを実証した。この方法を使用して、８８％〜９６％のＨＮＳＣサンプルが検出された（図２８Ａ）。次に、発明者らは、ＨＮＳＣと他の１２種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、ＨＮＳＣと他のがんを区別するための、ＤＮＡメチル化検出スコアの有用性を実証した（図２８Ａ）。図２８Ｂに示されるＲＯＣ曲線は、ＨＮＳＣを他の正常な組織および他のがんから区別するためのこのメチル化スコアの特異性（０．８６）および感度（０．８８）を明らかにしている（図２８Ｃ）。マーカーは、他のいくつかのがんも検出する（比較的高感度であるため、これらのがんに対する特異性は限られている）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態２５：食道がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ（５２０６８）（正常）からの１０人の、そして食道がんＤＮＡメチル化データのＴＣＧＡがんコレクションからランダムに選択された１０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で食道がんを検出する（図２９Ｂ、表２０）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、１２種の異なる腫瘍タイプを表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、食道がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図２９Ｃ、表２１）（スペック）。

実施形態２６：食道がんを検出するための食道がんポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態２５（検出）で開発された加重食道がんＤＮＡメチル化スコアおよび閾値が、ＧＳＥ５２０６８、ＧＳＥ７５５３７およびＧＳＥ７９５５６からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コ
ーホート」で食道がんを検出することを実証した。この方法を使用して、８８％〜９６％の食道がんサンプルが検出された（図３０Ａ）。次に、発明者らは、食道がんと他の１２種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、食道がんと他のがんを区別するための、検出ＤＮＡメチル化スコアの有用性を実証した（図３０Ａ）。図３０Ｂに示されるＲＯＣ曲線は、食道がんを他の正常な組織および他のがんから区別するためのこのメチル化スコアの特異性（０．８６）および感度（０．８８）を明らかにしている（図３０Ｃ）。マーカーは、他のいくつかのがんも検出する（比較的高感度であるため、これらのがんに対する特異性は限られている）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人におけるがんの早期発見に使用できる。

実施形態２７：膀胱がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ５２９５５（正常）からの５人の、そして膀胱がんＤＮＡメチル化データのＴＣＧＡがんコレクションからランダムに選択された１０個のサンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤ法を使用して、トレーニングコーホートにおいて高い感度および特異性で膀胱がんを検出する（図３１Ｂ、表２２）（検出）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。次に、発明者らは、１３種の異なる腫瘍タイプおよび正常な血液を表すＴＣＧＡからランダムに選択された８０個のＤＮＡメチル化サンプルから「トレーニングコーホート」を生成した。本発明者らは、このトレーニングコーホートを使用して、膀胱がんと他の腫瘍との間で区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した（図３１Ｃ、表２３）（スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアがＣＧＩＤのために開発された。

実施形態２９：腎臓がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ５２９５５（正常）からの１０人の、そしてＴＣＧＡデータセットにある１３種のがんよりがんごとにランダムに選択された１０個のサンプルからの、腎臓がんのための正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用し、そして正常な組織および血液（ＧＳＥ４０２７９、ＧＳＥ５２９５５）を使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤｈｙｐｏ法を使用して、トレーニングコーホートにおいて高い感度および特異性で腎臓がんを検出し、そして他のがんに対して腎臓がんに特異的
である「検出−スペック」（図３３Ｂ、表２４）（検出−スペック）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。

実施形態３０：腎臓がんを検出するための腎臓がんポリジーンＤＮＡメチル化マーカーの有用性。
発明者らは、実施形態２９（検出−スペック）で開発された加重腎臓がんＤＮＡメチル化スコアおよび閾値が、ＴＣＧＡからの８７１人の腎臓がん患者からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」で腎臓がんを検出し、腎臓がんを他のがんから区別することを実証した。この方法を使用して、９０％の腎臓がんのサンプルが腎臓がんとして検出された（図３４Ａ）。次に、発明者らは、腎臓がんと他の１３種類のがんのＧＳＥとＴＣＧＡからのメチル化データと共に「検証コーホート」を使用して、腎臓がんと他のがんを区別するための、「検出−スペック」ＤＮＡメチル化スコアの有用性を実証した（図３４Ａ）。図３４Ｂに示されるＲＯＣ曲線は、腎臓がんを他の正常な組織および他のがんから検出するためのこのメチル化スコアの特異性（０．８７）および感度（０．９１）を明らかにしている（図３４Ｃ）（ＨＣＣ、脳がん、精巣がんとの高い交差）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、患者からの組織、糞便、唾液、血漿および尿からの異なる生体材料を使用して、リスクのある人や一般的な健康な人における腎臓がんの早期発見に使用できる。

実施形態３１：精巣がんのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＳＥ４６３０６（正常）からの１３人の、そしＴＣＧＡデータセットにある１３種のがんよりがんごとにランダムに選択された１０個のサンプルからの、正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用し、そして正常な組織および血液（ＧＳＥ４０２７９、ＧＳＥ６１４９６）を使用した。本発明者らは最初に、実施形態１で正常な組織および血液サンプル全体で強力にメチル化されていないサイトとして発見された、「トレーニングコーホート」データセット２８７５４ＣＧＩＤを候補リストに挙げた。次に、発明者らは、実施形態２に記載のＢＣＤｈｙｐｏ法を使用して、トレーニングコーホートにおいて高い感度および特異性で精巣がんを検出し、そして他のがんに対して精巣がんに特異的である「検出−スペック」（図３５Ｂ、表２５）（検出−スペック）、バイナリーカテゴリー区別的にメチル化されたＣＧＩＤのポリジーンセットを発見した。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。

実施形態３３：１３種の一般的な固形腫瘍のポリジーン汎がんＤＮＡメチル化マーカーの発見。
本発明者らは、ＴＣＧＡデータセットにある１３種のがん（膀胱がん、脳がん、乳がん、子宮頸がん、大腸がん、食道がん、ＨＮＳＣ、肝臓がん、肺がん、卵巣がん、膵臓がん、前立腺がん、胃がん）よりがんごとにランダムに選択された１０個のサンプルからの、正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用し、そしてＴＣＧＡとＧＥＯからの正常な組織および血液を使用した。次に、発明者らは、表ｘ−ｙにリストされている１０種類のがんを検出するＣＧＩＤの組み合わせリストおよび１０種の一般的ながんのいずれかを高い感度および特異性で検出する候補リストに挙げられたＣＧＩＤに対して罰則付き回帰を実行した（図３７Ｂ、表２６）（検出）。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびがんの閾値がＣＧＩＤのために開発された。

実施形態３７：急性骨髄性白血病（ＡＭＬ）を検出するためのポリジーンＤＮＡメチル化マーカーの発見。
本発明者らは、ＧＥＯデータセット内のランダムに選択された１０個のＡＭＬサンプルと１０個の正常な血液サンプルからの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化データを「トレーニング」コーホートとして使用した。次に、発明者らは、ＡＭＬの検出のためのＣＧＩＤの組み合わせリスト、およびＡＭＬを高い感度および特異性で検出する候補リストに挙げられたＣＧＩＤ対して罰則付き回帰を実行した（図４１、表２７）（検出−スペック）。実施形態２で説明したように、加重ＤＮＡメチル化スコアおよびＡＭＬの閾値がＣＧＩＤのために開発された。

実施形態３８：血液ＤＮＡ中のＡＭＬを検出するための急性骨髄性白血病（ＡＭＬ）ポリジーンＤＮＡメチル化マーカーの有用性。
次に、発明者らは、実施形態３７（「検出−スペック」）で開発された加重ＡＭＬＤＮＡメチル化スコアおよび閾値が、ＧＥＯからの７９人のＡＭＬ患者およびＴＣＧＡからの１４０人の患者、そして正常な血液からの正規化されたＩｌｌｕｍｉｎａ４５０ＫＤＮＡメチル化ベータ値が含まれる「検証コーホート」でＡＭＬを検出することを実証した。この方法を使用して、１００％のＡＭＬサンプルが検出された（図４２Ａ）。図４２Ｂに示されるＲＯＣ曲線は、血液からのＡＭＬを検出するためのこのメチル化スコアの特異性（１）および感度（１）を明らかにしている（図４２Ｃ）。これらのＤＮＡメチル化マーカーとメチル化値からの計算されたメチル化スコアは、血液ＤＮＡを使用して、リスクのある人や一般的な健康な人におけるＡＭＬの早期発見に使用できる。

実施形態３９：前立腺がんを予測するためのバイサルファイト変換、多重増幅および次世代シーケンスおよびメチル化スコアの計算。
血液は、Ｋ３−ＥＤＴＡを含む９ｍｌチューブに収集され、１時間以内に処理された。新鮮な血液サンプルを４℃で１０００ｇで１０分間遠心分離した。細胞層を乱すことなく上澄みをファルコンチューブに注意深く移し、残りの細胞を完全に除去するために再度１０分間遠心分離し、−８０℃で凍結した。血漿サンプルを解凍し、血漿ＤＮＡ用のＱｉａｇｅｎキットやＥＺＤＮＡ直接抽出法など、血漿ＤＮＡ抽出用のいくつかの利用可能な方法と市販のキットでＤＮＡを抽出する。ＡＭＰｕｒｅＸＰ磁気ビーズなどの市販の方法を使用してＤＮＡを精製し、精製したＤＮＡを、例えばＥＺＤＮＡバイサルファイト処理キットを使用して亜硫酸水素ナトリウムで処理する。ターゲット配列のライブラリーは、２段階のＰＣＲ反応によって生成される（図４０）。第一のＰＣＲ反応は、表５および表６の特定のＣＧＩＤをターゲットにする。ＰＣＲ１プライマーは、第二のＰＣＲ２プライマーと相補的な配列を持っていることに注意する（図４５）。本発明者らは、ＨＥＫ２９３細胞からのヒトバイサルファイト変換ゲノムＤＮＡを使用して、標準的なＴａｑポリメラーゼ反応で以下のプライマーを使用したマルチプレックスＰＣＲ反応において、ＨＩＦ３Ａ（２３２塩基対領域）、ＴＰＭ４（２１３塩基対領域）、およびＣＴＴＮ（１９９塩基対領域）から前立腺がんを検出するＣＧＩＤを含むＤＮＡの３つの配列を同時に増幅した：ＣＧＩＤｃｇ０２８７９６６２の場合、フォワードプライマー：

およびリバースプライマー:

増幅した断片をアガロースゲルで分画した。

サンプルをバーコード化するために、次のプライマーを使用した第二のＰＣＲ反応を使
用する：
フォワードプライマー：

バーコードプライマー（リバース）：

（太字の塩基はインデックスである。このインデックスの２００のバリエーションが使用される。プライマーの第二のセットは、各患者のインデックスと、リバースおよびフォワードシーケンスプライマーを導入する。前立腺がんＨＩＦ３Ａ２３２ｂｐ、ＴＰＭ４
２１３ｂｐ、およびＣＴＴＮ１９９ｂｐの３つのマーカーに対するマルチプレックスＰＣＲ１反応は、図４６に示すように、さまざまなプライマー濃度を使用する右側のパネルに表示される。

実施形態４０：バイサルファイト変換、マルチプレックス増幅および次世代シーケンスの方法の有用性、およびがんを予測するためのメチル化スコアの計算。
本発明者らは、実施形態３９が、何百人もの患者からの血漿サンプルを使用して、前立腺がんおよび他のがんを同時にハイスループット（ｈｉｇｈｔｈｒｏｕｇｈｐｕｔ）予測することに使用され得ることを実証する。高度に予測可能なＣＧＩＤのインデックス付き増幅と、がんを示すメチル化スコアを計算するための合理化された方法は、前立腺がんと他のがんの早期発見に使用できる。

およびリバースプライマー:

増幅した断片をアガロースゲルで分画した。

バーコードプライマー（リバース）：

Claims

ゲノムワイドＤＮＡメチル化マップから「バイナリーカテゴリー区別（ＢＣＤ）」法を使用して「バイナリー」ＤＮＡメチル化シグネチャを導出するステップを含む、がんの「バイナリーカテゴリー」ＤＮＡメチル化シグネチャを使用してがんを検出する方法。
前記ゲノムワイドＤＮＡメチル化マップが、がん細胞、正常な組織および血液ＤＮＡの１つ以上である、請求項１に記載の方法。
前記「バイナリーカテゴリー区別（ＢＣＤ）」法が、Ｉｌｌｕｍｉｎａ２７Ｋ、４５０ＫまたはＥＰＩＣアレイ、ゲノムワイドバイサルファイトシーケンス、メチル化ＤＮＡ免疫沈降（ＭｅＤＩＰ）シーケンス、およびオリゴヌクレオチドアレイとのハイブリダイゼーションの１つ以上の使用を含む、請求項１に記載の方法。
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式を使用した「がんメチル化スコア」を導き出すことにより、肝細胞がん（ＨＣＣ）肝臓がんを検出し（検出）、そして他の腫瘍と区別する（スペック）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出するためのサブセット：ｃｇ０２０１２５７６，ｃｇ０３７６８７７７，ｃｇ２４８０４５４４，ｃｇ０５７３９１９０；およびスペックのためのサブセット：ｃｇ１４１２６４９３
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、肺がんを検出し（検出）、そして他の腫瘍と区別する（スペック）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出するためのサブセット：
ｃｇ０４２２３４２４，ｃｇ２３１４１３５５；および
スペックのためのサブセット：
ｃｇ０５９１７７３２，ｃｇ２５４７００７７
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、前立腺がんを検出し（検出）、そして他の腫瘍と区別する（スペック）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出＿スペックのためのサブセット：
ｃｇ１４２８３５６９
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、乳
がんを検出し（検出）、そして他の腫瘍と区別する（スペック）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出するためのサブセット：
ｃｇ１３０３１２５１，ｃｇ０９７３４７９１，ｃｇ０９６９５７３５，ｃｇ０３６３７８７８；および
スペックのためのサブセット：
ｃｇ０３１１３８７８，ｃｇ２０１８０８４３
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、大腸がん（ＣＲＣ）を検出し（検出）、そして他の腫瘍と区別する（スペック）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出−スペックのためのサブセット：
ｃｇ０９８５４６５３，ｃｇ０１５６６２４２
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動
作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、膵臓がんを検出し（検出）、そして他の腫瘍と区別する（スペック）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出するためのサブセット：
ｃｇ２５０２４０７４，ｃｇ１５３８６９６４，ｃｇ１６２３２９７９；および
スペックのためのサブセット：
ｃｇ０１２３７５６５，ｃｇ０８１８２９７５，ｃｇ２０９８３５７７，ｃｇ２５５９１３７７
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、脳がん（膠芽腫）を検出し（検出）、そして他の腫瘍と区別する（スペック）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出とスペックのためのサブセット：
ｃｇ１９９２９３５５
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、胃（ｇａｓｔｒｉｃ）［胃（ｓｔｏｍａｃｈ）］がんを検出し（検出）、そして他の腫瘍と区別する（スペック）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出するためのサブセット：
ｃｇ０５６１１７７９，ｃｇ０９７３４７９１，ｃｇ１５７６０２５７；および
スペックのためのサブセット：
ｃｇ０５１１７７９，ｃｇ１９２３５３３９
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、卵巣がんを検出し（検出）、そして他の腫瘍と区別する（スペック）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出するためのサブセット：
ｃｇ２４３３９１９３，ｃｇ２２６９４ｌ５３，ｃｇ１１２５２３３７，ｃｇ２１２１０９８５；および
スペックのためのサブセット：
ｃｇ０７０６８７６８，ｃｇ１９８４６６０９
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、子宮頸がんを検出し（検出）、そして他の腫瘍と区別する（スペック）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出するためのサブセット：
ｃｇ００７５７１８２，ｃｇ０１６０１７４６；および
スペックのためのサブセット：
ｃｇ０７０６６５９４，ｃｇ０９２６０６４０，ｃｇ１２９６ｌ８４２
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、頭頸部扁平上皮がんを検出し（検出）、そして他の腫瘍と区別する（スペック）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出するためのサブセット：
ｃｇ０７９００９６８，ｃｇ２０３３４２４３，ｃｇ２７４２０５２０；および
スペックのためのサブセット：
ｃｇ１８００６３２８，ｃｇ１９２８７２２０
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、食道がんを検出し（検出）、そして他の腫瘍と区別する（スペック）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出するためのサブセット：
ｃｇ０３２８０６２４，ｃｇ０３７３５８８８，ｃｇ２７４２０５２０，ｃｇ０９７３４７９１；および
スペックのためのサブセット：
ｃｇ０９５５６９５２，ｃｇ１２４７３２８５
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、膀胱がんを検出し（検出）、そして他の腫瘍と区別する（スペック）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出するためのサブセット：
ｃｇ０４２２３４２４，ｃｇ１０７２３９６２，ｃｇ２５０２４０７４；および
スペックのためのサブセット：
ｃｇ１３５４４００６
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、腎臓（ｒｅｎａｌ）［腎臓（ｋｉｄｎｅｙ）］がんを検出し（検出）、そして他の腫瘍と区別する（スペック）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出スペックのためのサブセット：
ｃｇ０８８８４５７１，ｃｇ０００１１２２５，ｃｇ０００１１２２５
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、精巣がんを検出し（検出）、そして他の腫瘍と区別する（スペック）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出とスペックのためのサブセット：
ｃｇ１４５３１０９３，ｃｇ２５１５９９２７
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、１３種の一般的な固形腫瘍（汎がん）を検出する（検出）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出するためのサブセット：
ｃｇ１０７２３９６２，ｃｇ１５７５９０５６，ｃｇ２４４２７５０４，ｃｇ２５０２４０７４
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「がんメチル化スコア」を導き出すことにより、血液がんを検出する（検出）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「ＡＭＬメチル化スコア」を導き出すことにより、急性骨髄性白血病（ＡＭＬ）を検出する（検出）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出−スペックのためのサブセット：
ｃｇ１８６５８３９７，ｃｇ１８７８０４１２，ｃｇ２０４３９２８８，ｃｇ２２８２８０４５，ｃｇ２５３７５３４０
次の表とサブセットから１つ以上のＣＧＩＤのＤＮＡメチル化レベルを測定すること、そして患者由来の唾液、尿、糞便および無細胞血漿ＤＮＡなどの生物学的材料にある腫瘍に由来するＤＮＡの「バイナリーカテゴリー」または線形回帰方程式、および受信者動作特性（ＲＯＣ）アッセイを使用した「黒色腫メチル化スコア」を導き出すことにより、黒色腫を検出する（検出）ための請求項１に記載の方法。
表とサブセットは、次のとおりである。

検出−スペックのためのサブセット：
ｃｇ１５３０７８９１，ｃｇ１８８６６５２９，ｃｇ２７０８４９０３
請求項１に記載の方法に従ってＤＮＡメチル化スコアのＤＮＡメチル化測定値を導き出すために使用される機器および１つ以上の試薬を含む、がんを検出するためのキット。
請求項４に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、肝細胞がん（ＨＣＣ）を検出するためのキット。
請求項５に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、肺がんを検出するためのキット。
請求項６に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、前立腺がんを検出するためのキット。
請求項７に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、乳がんを検出するためのキット。
請求項８に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、大腸がんを検出するためのキット。
請求項９に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、膵臓がんを検出するためのキット。
請求項１０に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、脳がん（膠芽腫）を検出するためのキット。
請求項１１に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、胃（ｇａｓｔｒｉｃ）［胃（ｓｔｏｍａｃｈ）］がんを検出するためのキット。
請求項１２に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、卵巣がんを検出するためのキット。
請求項１３に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、子宮頸がんを検出するためのキット。
請求項１４に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、頭頸部扁平上皮がん（ＨＮＳＣ）を検出するためのキット。
請求項１５に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、食道がんを検出するためのキット。
請求項１６に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、膀胱がんを検出するためのキット。
請求項１７に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、腎臓がんを検出するためのキット。
請求項１８に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、精巣がんを検出するためのキット。
請求項１９に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、一般的な固形腫瘍を検出するためのキット。
請求項２０に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、血液がんを検出するためのキット。
請求項２１に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、急性骨髄性白血病（ＡＭＬ）を検出するためのキット。
請求項２２に記載の方法による、ＤＮＡメチル化シグネチャのＤＮＡメチル化測定値のための機器および１つ以上の試薬を含む、黒色腫を検出するためのキット。
ＤＮＡメチル化の組み合わせを使用することによりがんを予測するためにＤＮＡパイロシーケンスメチル化アッセイを使用するステップをさらに含む、請求項１乃至請求項２２に記載の方法。
がんを検出するためにＩｌｌｕｍｉｎａＭｉＳｅｑなどの次世代シーケンサーで多重増幅標的化バイサルファイトシーケンスを使用するステップをさらに含む、請求項１乃至請求項２２に記載の方法。
がんを予測するためのメチル化スコアを計算するために「バイナリーカテゴリーアッセイ」を使用するステップをさらに含む、請求項１乃至請求項２２に記載の方法。
がんを予測するためのメチル化スコアを計算するために多変量線形回帰方程式を使用するステップをさらに含む、請求項１乃至請求項２２に記載の方法。
ＤＮＡメチル化の組み合わせの測定値を使用することにより、受信者動作特性曲線（Ｒ
ＯＣ）アッセイを使用してがんを非がんおよび起源の組織から区別する「メチル化スコア」閾値を定義するステップをさらに含む、請求項１乃至請求項２２に記載の方法。
唾液、尿、血漿、糞などの体液中の無細胞ＤＮＡの起源の組織または組織バイオプシーを検出するためのＤＮＡメチル化シグネチャおよび「ポリジーンＤＮＡメチル化マーカー」を識別する方法であり、該方法は、特定の組織のゲノムワイドＤＮＡメチル化マップおよび他のすべての正常な組織と血液ＤＮＡのゲノムワイドＤＮＡメチル化マップにおいて、Ｉｌｌｕｍｉｎａ２７Ｋ、４５０ＫまたはＥＰＩＣアレイ、ゲノムワイドバイサルファイトシーケンス、メチル化ＤＮＡ免疫沈降（ＭｅＤＩＰ）シーケンス、またはサンプルから取得したＤＮＡメチル化測定値の統計分析を実行するステップを含むオリゴヌクレオチドアレイとのハイブリダイゼーションなどの「バイナリーカテゴリー区別（ＢＣＤ）」法を使用することを含む。
血漿中の死にゆくニューロンＣＦＤＮＡなどの識別がアルツハイマー病などの病気の早期発見に使用され得る、脳のニューロン、糖尿病の膵臓、虚血の心臓、および心臓病などの病変組織の「ポリジーンＤＮＡメチル化マーカー」をさらに識別するための請求項４８に記載の方法。
前記ＤＮＡメチル化測定値が、１つ以上のサンプルから抽出されたＤＮＡのＩｌｌｕｍｉｎａビーズチップ４５０ＫまたはＥＰＩＣアッセイを行うことによって得られる、請求項４８に記載の方法。
前記ＤＮＡメチル化測定値が、ｉＳｅｑ、ＭｉｎｉＳｅｑ、ＭｉＳｅｑまたはＮｅｘｔＳｅｑシーケンサー、トレントシーケンス、ＤＮＡパイロシーケンス、サンプルから抽出されたＤＮＡの質量分析ベース（Ｅｐｉｔｙｐｅｒ^ＴＭ）およびＰＣＲベースのメチル化アッセイの１つ以上のプラットフォームでＩｌｌｕｍｉｎａ次世代シーケンスを実行することにより得られる、請求項４８に記載の方法。
前記統計分析はピアソン相関を含む、請求項４８に記載の方法。
前記統計分析が受信者動作特性曲線（ＲＯＣ）アッセイを含む、請求項４８に記載の方法。
前記統計分析が階層的クラスタリング分析アッセイを含む、請求項４８に記載の方法。